The previous program has 9 program headers, then, the segment mapping indicates in which program header (from 00 to 08) each section is located.
PHDR - Program HeaDeR
Містить таблиці заголовків програми та саму метадані.
INTERP
Вказує шлях завантажувача, який потрібно використовувати для завантаження бінарного файлу в пам'ять.
LOAD
Ці заголовки використовуються для вказівки як завантажити бінарний файл в пам'ять.
Кожен LOAD заголовок вказує на область пам'яті (розмір, дозволи та вирівнювання) і вказує байти ELF бінарного файлу, які потрібно скопіювати туди.
For example, the second one has a size of 0x1190, should be located at 0x1fc48 with permissions read and write and will be filled with 0x528 from the offset 0xfc48 (it doesn't fill all the reserved space). This memory will contain the sections .init_array .fini_array .dynamic .got .data .bss.
DYNAMIC
Цей заголовок допомагає зв'язувати програми з їхніми бібліотечними залежностями та застосовувати перенесення. Перевірте секцію .dynamic.
NOTE
Це зберігає інформацію про метадані постачальника бінарного файлу.
GNU_EH_FRAME
Визначає місцезнаходження таблиць розгортання стеку, які використовуються відладчиками та функціями обробки виключень C++.
GNU_STACK
Містить конфігурацію захисту від виконання стеку. Якщо увімкнено, бінарний файл не зможе виконувати код зі стеку.
GNU_RELRO
Вказує конфігурацію RELRO (Relocation Read-Only) бінарного файлу. Цей захист позначить як тільки для читання певні секції пам'яті (як GOT або таблиці init та fini) після завантаження програми та перед її виконанням.
In the previous example it's copying 0x3b8 bytes to 0x1fc48 as read-only affecting the sections .init_array .fini_array .dynamic .got .data .bss.
Note that RELRO can be partial or full, the partial version do not protect the section .plt.got, which is used for lazy binding and needs this memory space to have write permissions to write the address of the libraries the first time their location is searched.
TLS
Визначає таблицю записів TLS, яка зберігає інформацію про локальні для потоку змінні.
Section Headers
Заголовки секцій надають більш детальний огляд ELF бінарного файлу.
It also indicates the location, offset, permissions but also the type of data it section has.
Meta Sections
String table: Він містить усі рядки, необхідні для ELF-файлу (але не ті, які фактично використовуються програмою). Наприклад, він містить назви секцій, такі як .text або .data. І якщо .text знаходиться на зсуві 45 у таблиці рядків, він використовуватиме число 45 у полі name.
Щоб знайти, де знаходиться таблиця рядків, ELF містить вказівник на таблицю рядків.
Symbol table: Він містить інформацію про символи, такі як ім'я (зсув у таблиці рядків), адреса, розмір та інші метадані про символ.
Main Sections
.text: Інструкція програми для виконання.
.data: Глобальні змінні з визначеним значенням у програмі.
.bss: Глобальні змінні, які залишилися неініціалізованими (або ініціалізовані до нуля). Змінні тут автоматично ініціалізуються до нуля, тим самим запобігаючи додаванню непотрібних нулів до бінарного файлу.
.rodata: Константні глобальні змінні (секція тільки для читання).
.tdata і .tbss: Як .data і .bss, коли використовуються локальні для потоку змінні (__thread_local у C++ або __thread у C).
.dynamic: Дивіться нижче.
Symbols
Symbols - це іменоване місце в програмі, яке може бути функцією, глобальним об'єктом даних, локальними для потоку змінними...
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
Кожен запис символу містить:
Ім'я
Атрибути зв'язування (слабкий, локальний або глобальний): Локальний символ може бути доступний лише самою програмою, тоді як глобальний символ спільний за межами програми. Слабкий об'єкт, наприклад, це функція, яку можна переопределити іншою.
Тип: NOTYPE (тип не вказано), OBJECT (глобальна змінна даних), FUNC (функція), SECTION (секція), FILE (файл вихідного коду для налагоджувачів), TLS (змінна локального потоку), GNU_IFUNC (непряма функція для релокації)
The NEEDED directory indicates that the program потребує завантажити згадану бібліотеку для продовження. The NEEDED directory completes once the shared бібліотека повністю функціонує і готова до використання.
Relocations
The loader also must relocate dependencies after having loaded them. These relocations are indicated in the relocation table in formats REL or RELA and the number of relocations is given in the dynamic sections RELSZ or RELASZ.
Якщо програма завантажується в місце, відмінне від бажаної адреси (зазвичай 0x400000), тому що адреса вже використовується або через ASLR, або з будь-якої іншої причини, статичне перенесення виправляє вказівники, які мали значення, очікуючи, що бінарник буде завантажено за бажаною адресою.
Наприклад, будь-який розділ типу R_AARCH64_RELATIV повинен мати змінену адресу за рахунок зміщення перенесення плюс значення доданка.
Динамічні перенесення та GOT
Перенесення також може посилатися на зовнішній символ (наприклад, функцію з залежності). Як функція malloc з libC. Тоді завантажувач, завантажуючи libC за адресою, перевіряючи, де завантажена функція malloc, запише цю адресу в таблицю GOT (Global Offset Table) (вказану в таблиці перенесення), де повинна бути вказана адреса malloc.
Таблиця зв'язків процедур
Розділ PLT дозволяє виконувати ліниве зв'язування, що означає, що розв'язання місця розташування функції буде виконано перший раз, коли до неї звертаються.
Отже, коли програма викликає malloc, вона насправді викликає відповідне місце malloc в PLT (malloc@plt). Перший раз, коли його викликають, він розв'язує адресу malloc і зберігає її, тому наступного разу, коли викликається malloc, використовується ця адреса замість коду PLT.
Ініціалізація програми
Після того, як програма була завантажена, настав час для її виконання. Однак перший код, який виконується, не завжди є функцією main. Це тому, що, наприклад, у C++, якщо глобальна змінна є об'єктом класу, цей об'єкт повинен бути ініціалізованийперед виконанням main, як у:
Зверніть увагу, що ці глобальні змінні розташовані в .data або .bss, але в списках __CTOR_LIST__ та __DTOR_LIST__ об'єкти для ініціалізації та деструкції зберігаються, щоб відстежувати їх.
З C-коду можливо отримати той же результат, використовуючи розширення GNU:
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
З точки зору компілятора, щоб виконати ці дії до та після виконання функції main, можна створити функцію init та функцію fini, які будуть посилатися в динамічному розділі як INIT та FIN. Вони розміщуються в секціях init та fini ELF.
Інший варіант, як згадувалося, - це посилатися на списки __CTOR_LIST__ та __DTOR_LIST__ у записах INIT_ARRAY та FINI_ARRAY в динамічному розділі, а їхня довжина вказується INIT_ARRAYSZ та FINI_ARRAYSZ. Кожен запис є вказівником на функцію, яка буде викликана без аргументів.
Більше того, також можливо мати PREINIT_ARRAY з вказівниками, які будуть виконані перед вказівниками INIT_ARRAY.
Порядок ініціалізації
Програма завантажується в пам'ять, статичні глобальні змінні ініціалізуються в .data та неініціалізовані обнуляються в .bss.
Всі залежності для програми або бібліотек ініціалізуються, і виконується динамічне зв'язування.
Виконуються функції PREINIT_ARRAY.
Виконуються функції INIT_ARRAY.
Якщо є запис INIT, він викликається.
Якщо це бібліотека, dlopen закінчується тут, якщо програма, час викликати реальну точку входу (функцію main).
Локальне зберігання потоків (TLS)
Вони визначаються за допомогою ключового слова __thread_local в C++ або розширення GNU __thread.
Кожен потік буде підтримувати унікальне місце для цієї змінної, тому лише потік може отримати доступ до своєї змінної.
Коли це використовується, секції .tdata та .tbss використовуються в ELF. Вони подібні до .data (ініціалізовані) та .bss (не ініціалізовані), але для TLS.
Кожна змінна матиме запис у заголовку TLS, що вказує на розмір та зсув TLS, який є зсувом, який вона використовуватиме в локальній області даних потоку.
__TLS_MODULE_BASE - це символ, що використовується для посилання на базову адресу локального зберігання потоків і вказує на область пам'яті, що містить усі локальні дані потоку модуля.