Вони описують завантажувачу, як завантажити ELF в пам'ять:
readelf-lWlnstatElffiletypeisDYN (Position-Independent Executablefile)Entrypoint0x1c00Thereare9programheaders,startingatoffset64ProgramHeaders:TypeOffsetVirtAddrPhysAddrFileSizMemSizFlgAlignPHDR0x0000400x00000000000000400x00000000000000400x0001f80x0001f8R0x8INTERP0x0002380x00000000000002380x00000000000002380x00001b0x00001bR0x1[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]LOAD0x0000000x00000000000000000x00000000000000000x003f7c0x003f7cRE0x10000LOAD0x00fc480x000000000001fc480x000000000001fc480x0005280x001190RW0x10000DYNAMIC0x00fc580x000000000001fc580x000000000001fc580x0002000x000200RW0x8NOTE0x0002540x00000000000002540x00000000000002540x0000e00x0000e0R0x4GNU_EH_FRAME0x0036100x00000000000036100x00000000000036100x0001b40x0001b4R0x4GNU_STACK0x0000000x00000000000000000x00000000000000000x0000000x000000RW0x10GNU_RELRO0x00fc480x000000000001fc480x000000000001fc480x0003b80x0003b8R0x1SectiontoSegmentmapping:SegmentSections...0001.interp02.interp.note.gnu.build-id.note.ABI-tag.note.package.gnu.hash.dynsym.dynstr.gnu.version.gnu.version_r.rela.dyn.rela.plt.init.plt.text.fini.rodata.eh_frame_hdr.eh_frame03.init_array.fini_array.dynamic.got.data.bss04.dynamic05.note.gnu.build-id.note.ABI-tag.note.package06.eh_frame_hdr0708.init_array.fini_array.dynamic.got
Попередня програма має 9 заголовків програми, тоді як відображення сегментів вказує, в якому заголовку програми (з 00 до 08) знаходиться кожен розділ.
PHDR - Заголовок програми
Містить таблиці заголовків програми та метадані.
INTERP
Вказує шлях завантажувача, який потрібно використовувати для завантаження бінарного файлу в пам'ять.
LOAD
Ці заголовки використовуються для вказівки як завантажити бінарний файл в пам'ять.
Кожен LOAD заголовок вказує на область пам'яті (розмір, дозволи та вирівнювання) і вказує байти ELF бінарного файлу, які потрібно скопіювати туди.
Наприклад, другий має розмір 0x1190, повинен бути розташований за адресою 0x1fc48 з дозволами на читання та запис і буде заповнений 0x528 з офсету 0xfc48 (не заповнює весь зарезервований простір). Ця пам'ять міститиме розділи .init_array .fini_array .dynamic .got .data .bss.
DYNAMIC
Цей заголовок допомагає зв'язувати програми з їхніми бібліотечними залежностями та застосовувати перенесення. Перевірте розділ .dynamic.
NOTE
Це зберігає інформацію про метадані постачальника бінарного файлу.
GNU_EH_FRAME
Визначає місце розташування таблиць розгортання стеку, які використовуються відладчиками та функціями обробки виключень C++.
GNU_STACK
Містить конфігурацію захисту від виконання стеку. Якщо увімкнено, бінарний файл не зможе виконувати код зі стеку.
GNU_RELRO
Вказує конфігурацію RELRO (Relocation Read-Only) бінарного файлу. Цей захист позначить як тільки для читання певні розділи пам'яті (як GOT або таблиці init та fini) після завантаження програми та перед її виконанням.
У попередньому прикладі копіюється 0x3b8 байтів до 0x1fc48 як тільки для читання, що впливає на розділи .init_array .fini_array .dynamic .got .data .bss.
Зверніть увагу, що RELRO може бути частковим або повним, часткова версія не захищає розділ .plt.got, який використовується для лінивої прив'язки і потребує цього простору пам'яті для наявності дозволів на запис, щоб записати адресу бібліотек під час першого пошуку їхнього місця розташування.
TLS
Визначає таблицю записів TLS, яка зберігає інформацію про локальні для потоку змінні.
Заголовки розділів
Заголовки розділів надають більш детальний огляд ELF бінарного файлу.
It also indicates the location, offset, permissions but also the type of data it section has.
Meta Sections
String table: Він містить усі рядки, необхідні для ELF-файлу (але не ті, які фактично використовуються програмою). Наприклад, він містить назви секцій, такі як .text або .data. І якщо .text знаходиться на зсуві 45 у таблиці рядків, він використовуватиме число 45 у полі name.
Щоб знайти, де знаходиться таблиця рядків, ELF містить вказівник на таблицю рядків.
Symbol table: Він містить інформацію про символи, такі як ім'я (зсув у таблиці рядків), адреса, розмір та інші метадані про символ.
Main Sections
.text: Інструкція програми для виконання.
.data: Глобальні змінні з визначеним значенням у програмі.
.bss: Глобальні змінні, які залишилися неініціалізованими (або ініціалізовані нулем). Змінні тут автоматично ініціалізуються нулем, тим самим запобігаючи додаванню непотрібних нулів до бінарного файлу.
.rodata: Константні глобальні змінні (секція тільки для читання).
.tdata і .tbss: Як .data і .bss, коли використовуються локальні для потоку змінні (__thread_local у C++ або __thread у C).
.dynamic: Дивіться нижче.
Symbols
Symbols - це іменоване місце в програмі, яке може бути функцією, глобальним об'єктом даних, локальними для потоку змінними...
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
Кожен запис символу містить:
Ім'я
Атрибути зв'язування (слабкий, локальний або глобальний): Локальний символ може бути доступний лише програмою, тоді як глобальні символи спільні за межами програми. Слабкий об'єкт, наприклад, це функція, яку можна переопределити іншою.
Тип: NOTYPE (тип не вказано), OBJECT (глобальна змінна даних), FUNC (функція), SECTION (секція), FILE (файл вихідного коду для налагоджувачів), TLS (змінна локального потоку), GNU_IFUNC (непряма функція для релокації)
Директорія NEEDED вказує на те, що програма потребує завантажити згадану бібліотеку для продовження. Директорія NEEDED завершується, коли спільна бібліотека повністю функціонує і готова до використання.
Relocations
Завантажувач також повинен перемістити залежності після їх завантаження. Ці переміщення вказані в таблиці переміщень у форматах REL або RELA, а кількість переміщень вказується в динамічних секціях RELSZ або RELASZ.
Якщо програма завантажується в місце, відмінне від бажаної адреси (зазвичай 0x400000) через те, що адреса вже використовується або через ASLR, або з будь-якої іншої причини, статичне перенесення виправляє вказівники, які мали значення, очікуючи, що бінарник буде завантажено за бажаною адресою.
Наприклад, будь-який розділ типу R_AARCH64_RELATIV повинен модифікувати адресу за зміщенням перенесення плюс значення доданка.
Динамічні перенесення та GOT
Перенесення також може посилатися на зовнішній символ (наприклад, функцію з залежності). Як функція malloc з libC. Тоді завантажувач, завантажуючи libC за адресою, перевіряючи, де завантажена функція malloc, запише цю адресу в таблицю GOT (Global Offset Table) (вказану в таблиці перенесення), де повинна бути вказана адреса malloc.
Таблиця зв'язків процедур
Розділ PLT дозволяє виконувати ліниве зв'язування, що означає, що розв'язання місця розташування функції буде виконано перший раз, коли вона буде доступна.
Отже, коли програма викликає malloc, вона фактично викликає відповідне місце malloc в PLT (malloc@plt). Перший раз, коли вона викликається, розв'язується адреса malloc і зберігається, тому наступного разу, коли викликається malloc, використовується ця адреса замість коду PLT.
Ініціалізація програми
Після того, як програма була завантажена, настав час для її виконання. Однак перший код, який виконується, не завжди є функцією main. Це тому, що, наприклад, у C++, якщо глобальна змінна є об'єктом класу, цей об'єкт повинен бути ініціалізованийперед виконанням main, як у:
Зверніть увагу, що ці глобальні змінні розташовані в .data або .bss, але в списках __CTOR_LIST__ та __DTOR_LIST__ об'єкти для ініціалізації та деструкції зберігаються, щоб відстежувати їх.
З C-коду можливо отримати той же результат, використовуючи розширення GNU:
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
З точки зору компілятора, щоб виконати ці дії до та після виконання функції main, можна створити функцію init та функцію fini, які будуть посилатися в динамічному розділі як INIT та FIN. Вони розміщуються в секціях init та fini ELF.
Інший варіант, як згадувалося, - це посилатися на списки __CTOR_LIST__ та __DTOR_LIST__ у записах INIT_ARRAY та FINI_ARRAY в динамічному розділі, а їхня довжина вказується INIT_ARRAYSZ та FINI_ARRAYSZ. Кожен запис є вказівником на функцію, яка буде викликана без аргументів.
Більше того, також можливо мати PREINIT_ARRAY з вказівниками, які будуть виконані перед вказівниками INIT_ARRAY.
Порядок ініціалізації
Програма завантажується в пам'ять, статичні глобальні змінні ініціалізуються в .data та неініціалізовані обнуляються в .bss.
Всі залежності для програми або бібліотек ініціалізуються, і виконується динамічне зв'язування.
Виконуються функції PREINIT_ARRAY.
Виконуються функції INIT_ARRAY.
Якщо є запис INIT, він викликається.
Якщо це бібліотека, dlopen закінчується тут, якщо програма, час викликати реальну точку входу (функцію main).
Локальне зберігання потоків (TLS)
Вони визначаються за допомогою ключового слова __thread_local в C++ або розширення GNU __thread.
Кожен потік буде підтримувати унікальне місце для цієї змінної, тому лише потік може отримати доступ до своєї змінної.
Коли це використовується, секції .tdata та .tbss використовуються в ELF. Вони подібні до .data (ініціалізовані) та .bss (не ініціалізовані), але для TLS.
Кожна змінна матиме запис у заголовку TLS, що вказує на розмір та зсув TLS, який є зсувом, який вона використовуватиме в локальній області даних потоку.
__TLS_MODULE_BASE - це символ, що використовується для посилання на базову адресу локального зберігання потоків і вказує на область пам'яті, що містить усі локальні дані потоку модуля.