ELF Basic Information

Lernen Sie AWS-Hacking von Null auf Held mit htARTE (HackTricks AWS Red Team Expert)!

Programm-Header

Beschreiben dem Loader, wie er das ELF im Speicher laden soll:

readelf -lW lnstat

Elf file type is DYN (Position-Independent Executable file)
Entry point 0x1c00
There are 9 program headers, starting at offset 64

Program Headers:
Type           Offset   VirtAddr           PhysAddr           FileSiz  MemSiz   Flg Align
PHDR           0x000040 0x0000000000000040 0x0000000000000040 0x0001f8 0x0001f8 R   0x8
INTERP         0x000238 0x0000000000000238 0x0000000000000238 0x00001b 0x00001b R   0x1
[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]
LOAD           0x000000 0x0000000000000000 0x0000000000000000 0x003f7c 0x003f7c R E 0x10000
LOAD           0x00fc48 0x000000000001fc48 0x000000000001fc48 0x000528 0x001190 RW  0x10000
DYNAMIC        0x00fc58 0x000000000001fc58 0x000000000001fc58 0x000200 0x000200 RW  0x8
NOTE           0x000254 0x0000000000000254 0x0000000000000254 0x0000e0 0x0000e0 R   0x4
GNU_EH_FRAME   0x003610 0x0000000000003610 0x0000000000003610 0x0001b4 0x0001b4 R   0x4
GNU_STACK      0x000000 0x0000000000000000 0x0000000000000000 0x000000 0x000000 RW  0x10
GNU_RELRO      0x00fc48 0x000000000001fc48 0x000000000001fc48 0x0003b8 0x0003b8 R   0x1

Section to Segment mapping:
Segment Sections...
00
01     .interp
02     .interp .note.gnu.build-id .note.ABI-tag .note.package .gnu.hash .dynsym .dynstr .gnu.version .gnu.version_r .rela.dyn .rela.plt .init .plt .text .fini .rodata .eh_frame_hdr .eh_frame
03     .init_array .fini_array .dynamic .got .data .bss
04     .dynamic
05     .note.gnu.build-id .note.ABI-tag .note.package
06     .eh_frame_hdr
07
08     .init_array .fini_array .dynamic .got

Das vorherige Programm hat 9 Programmheader, dann zeigt die Segmentzuordnung an, in welchem Programmheader (von 00 bis 08) jeder Abschnitt sich befindet.

PHDR - Program HeaDeR

Enthält die Programheader-Tabellen und Metadaten selbst.

INTERP

Gibt den Pfad des Ladeprogramms an, das verwendet wird, um das Binärprogramm in den Speicher zu laden.

LOAD

Diese Header werden verwendet, um anzuzeigen, wie ein Binärprogramm in den Speicher geladen wird. Jeder LOAD-Header gibt einen Bereich des Speichers an (Größe, Berechtigungen und Ausrichtung) und gibt die Bytes des ELF-Binärprogramms an, die dorthin kopiert werden sollen.

Zum Beispiel hat der zweite eine Größe von 0x1190, sollte sich bei 0x1fc48 befinden mit Lese- und Schreibberechtigungen und wird mit 0x528 ab dem Offset 0xfc48 gefüllt (es füllt nicht den gesamten reservierten Speicherplatz). Dieser Speicher wird die Abschnitte .init_array .fini_array .dynamic .got .data .bss enthalten.

DYNAMIC

Dieser Header hilft dabei, Programme mit ihren Bibliotheksabhängigkeiten zu verknüpfen und Relokationen anzuwenden. Überprüfen Sie den Abschnitt .dynamic.

NOTE

Speichert Herstellermetadateninformationen über das Binärprogramm.

GNU_EH_FRAME

Definiert den Speicherort der Stapel-Unwind-Tabellen, die von Debuggern und C++-Ausnahmebehandlungs-Laufzeitfunktionen verwendet werden.

GNU_STACK

Enthält die Konfiguration der Stack-Ausführungsverhinderungsverteidigung. Wenn aktiviert, kann das Binärprogramm keinen Code vom Stapel ausführen.

GNU_RELRO

Gibt die RELRO (Relocation Read-Only)-Konfiguration des Binärprogramms an. Dieser Schutz markiert nach dem Laden des Programms und bevor es ausgeführt wird bestimmte Abschnitte des Speichers als schreibgeschützt (wie die GOT oder die init- und fini-Tabellen).

Im vorherigen Beispiel werden 0x3b8 Bytes nach 0x1fc48 kopiert und als schreibgeschützt markiert, was die Abschnitte .init_array .fini_array .dynamic .got .data .bss betrifft.

Beachten Sie, dass RELRO teilweise oder vollständig sein kann. Die teilweise Version schützt den Abschnitt .plt.got nicht, der für träges Binden verwendet wird und diesen Speicherbereich benötigt, um Schreibberechtigungen zu haben, um die Adresse der Bibliotheken zu schreiben, wenn ihr Standort zum ersten Mal gesucht wird.

TLS

Definiert eine Tabelle von TLS-Einträgen, die Informationen über threadlokale Variablen speichern.

Abschnittsheader

Abschnittsheader geben einen detaillierteren Überblick über das ELF-Binärprogramm.

objdump lnstat -h

lnstat:     file format elf64-littleaarch64

Sections:
Idx Name          Size      VMA               LMA               File off  Algn
0 .interp       0000001b  0000000000000238  0000000000000238  00000238  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
1 .note.gnu.build-id 00000024  0000000000000254  0000000000000254  00000254  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
2 .note.ABI-tag 00000020  0000000000000278  0000000000000278  00000278  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
3 .note.package 0000009c  0000000000000298  0000000000000298  00000298  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
4 .gnu.hash     0000001c  0000000000000338  0000000000000338  00000338  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
5 .dynsym       00000498  0000000000000358  0000000000000358  00000358  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
6 .dynstr       000001fe  00000000000007f0  00000000000007f0  000007f0  2**0
CONTENTS, ALLOC, LOAD, READONLY, DATA
7 .gnu.version  00000062  00000000000009ee  00000000000009ee  000009ee  2**1
CONTENTS, ALLOC, LOAD, READONLY, DATA
8 .gnu.version_r 00000050  0000000000000a50  0000000000000a50  00000a50  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
9 .rela.dyn     00000228  0000000000000aa0  0000000000000aa0  00000aa0  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
10 .rela.plt     000003c0  0000000000000cc8  0000000000000cc8  00000cc8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
11 .init         00000018  0000000000001088  0000000000001088  00001088  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
12 .plt          000002a0  00000000000010a0  00000000000010a0  000010a0  2**4
CONTENTS, ALLOC, LOAD, READONLY, CODE
13 .text         00001c34  0000000000001340  0000000000001340  00001340  2**6
CONTENTS, ALLOC, LOAD, READONLY, CODE
14 .fini         00000014  0000000000002f74  0000000000002f74  00002f74  2**2
CONTENTS, ALLOC, LOAD, READONLY, CODE
15 .rodata       00000686  0000000000002f88  0000000000002f88  00002f88  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
16 .eh_frame_hdr 000001b4  0000000000003610  0000000000003610  00003610  2**2
CONTENTS, ALLOC, LOAD, READONLY, DATA
17 .eh_frame     000007b4  00000000000037c8  00000000000037c8  000037c8  2**3
CONTENTS, ALLOC, LOAD, READONLY, DATA
18 .init_array   00000008  000000000001fc48  000000000001fc48  0000fc48  2**3
CONTENTS, ALLOC, LOAD, DATA
19 .fini_array   00000008  000000000001fc50  000000000001fc50  0000fc50  2**3
CONTENTS, ALLOC, LOAD, DATA
20 .dynamic      00000200  000000000001fc58  000000000001fc58  0000fc58  2**3
CONTENTS, ALLOC, LOAD, DATA
21 .got          000001a8  000000000001fe58  000000000001fe58  0000fe58  2**3
CONTENTS, ALLOC, LOAD, DATA
22 .data         00000170  0000000000020000  0000000000020000  00010000  2**3
CONTENTS, ALLOC, LOAD, DATA
23 .bss          00000c68  0000000000020170  0000000000020170  00010170  2**3
ALLOC
24 .gnu_debugaltlink 00000049  0000000000000000  0000000000000000  00010170  2**0
CONTENTS, READONLY
25 .gnu_debuglink 00000034  0000000000000000  0000000000000000  000101bc  2**2
CONTENTS, READONLY

Meta-Abschnitte

  • Zeichenfolgentabelle: Enthält alle Zeichenfolgen, die von der ELF-Datei benötigt werden (aber nicht die tatsächlich vom Programm verwendeten). Zum Beispiel enthält sie Abschnittsnamen wie .text oder .data. Und wenn .text am Offset 45 in der Zeichenfolgentabelle steht, wird die Nummer 45 im Namen-Feld verwendet.

  • Um herauszufinden, wo sich die Zeichenfolgentabelle befindet, enthält die ELF einen Zeiger auf die Zeichenfolgentabelle.

  • Symboltabelle: Enthält Informationen über die Symbole wie den Namen (Offset in der Zeichenfolgentabelle), Adresse, Größe und weitere Metadaten über das Symbol.

Hauptabschnitte

  • .text: Die Anweisung des Programms, die ausgeführt werden soll.

  • .data: Globale Variablen mit einem definierten Wert im Programm.

  • .bss: Globale Variablen, die nicht initialisiert wurden (oder auf Null initialisiert wurden). Variablen werden hier automatisch auf Null initialisiert, wodurch unnötige Nullen vermieden werden, die dem Binärcode hinzugefügt werden könnten.

  • .rodata: Konstante globale Variablen (schreibgeschützter Abschnitt).

  • .tdata und .tbss: Ähnlich wie .data und .bss, wenn threadlokale Variablen verwendet werden (__thread_local in C++ oder __thread in C).

  • .dynamic: Siehe unten.

Symbole

Symbole sind benannte Speicherorte im Programm, die eine Funktion, ein globales Datenobjekt, threadlokale Variablen usw. sein könnten.

readelf -s lnstat

Symbol table '.dynsym' contains 49 entries:
Num:    Value          Size Type    Bind   Vis      Ndx Name
0: 0000000000000000     0 NOTYPE  LOCAL  DEFAULT  UND
1: 0000000000001088     0 SECTION LOCAL  DEFAULT   12 .init
2: 0000000000020000     0 SECTION LOCAL  DEFAULT   23 .data
3: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strtok@GLIBC_2.17 (2)
4: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND strlen@GLIBC_2.17 (2)
6: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND fputs@GLIBC_2.17 (2)
7: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND exit@GLIBC_2.17 (2)
8: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND perror@GLIBC_2.17 (2)
10: 0000000000000000     0 NOTYPE  WEAK   DEFAULT  UND _ITM_deregisterT[...]
11: 0000000000000000     0 FUNC    WEAK   DEFAULT  UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000     0 FUNC    GLOBAL DEFAULT  UND putc@GLIBC_2.17 (2)
[...]

Jeder Symbol-Eintrag enthält:

  • Name

  • Bindungseigenschaften (schwach, lokal oder global): Ein lokales Symbol kann nur vom Programm selbst zugegriffen werden, während globale Symbole außerhalb des Programms geteilt werden. Ein schwaches Objekt ist beispielsweise eine Funktion, die durch eine andere überschrieben werden kann.

  • Typ: NOTYPE (kein spezifizierter Typ), OBJECT (globale Datenvariable), FUNC (Funktion), SECTION (Abschnitt), FILE (Quellcode-Datei für Debugger), TLS (Thread-lokale Variable), GNU_IFUNC (indirekte Funktion für Relokation)

  • Abschnittsindex, in dem es sich befindet

  • Wert (Adresse im Speicher)

  • Größe

Dynamischer Abschnitt

readelf -d lnstat

Dynamic section at offset 0xfc58 contains 28 entries:
Tag        Type                         Name/Value
0x0000000000000001 (NEEDED)             Shared library: [libc.so.6]
0x0000000000000001 (NEEDED)             Shared library: [ld-linux-aarch64.so.1]
0x000000000000000c (INIT)               0x1088
0x000000000000000d (FINI)               0x2f74
0x0000000000000019 (INIT_ARRAY)         0x1fc48
0x000000000000001b (INIT_ARRAYSZ)       8 (bytes)
0x000000000000001a (FINI_ARRAY)         0x1fc50
0x000000000000001c (FINI_ARRAYSZ)       8 (bytes)
0x000000006ffffef5 (GNU_HASH)           0x338
0x0000000000000005 (STRTAB)             0x7f0
0x0000000000000006 (SYMTAB)             0x358
0x000000000000000a (STRSZ)              510 (bytes)
0x000000000000000b (SYMENT)             24 (bytes)
0x0000000000000015 (DEBUG)              0x0
0x0000000000000003 (PLTGOT)             0x1fe58
0x0000000000000002 (PLTRELSZ)           960 (bytes)
0x0000000000000014 (PLTREL)             RELA
0x0000000000000017 (JMPREL)             0xcc8
0x0000000000000007 (RELA)               0xaa0
0x0000000000000008 (RELASZ)             552 (bytes)
0x0000000000000009 (RELAENT)            24 (bytes)
0x000000000000001e (FLAGS)              BIND_NOW
0x000000006ffffffb (FLAGS_1)            Flags: NOW PIE
0x000000006ffffffe (VERNEED)            0xa50
0x000000006fffffff (VERNEEDNUM)         2
0x000000006ffffff0 (VERSYM)             0x9ee
0x000000006ffffff9 (RELACOUNT)          15
0x0000000000000000 (NULL)               0x0

Das NEEDED-Verzeichnis gibt an, dass das Programm die genannte Bibliothek laden muss, um fortzufahren. Das NEEDED-Verzeichnis ist vollständig, sobald die gemeinsame Bibliothek voll funktionsfähig und einsatzbereit ist.

Umplatzierungen

Der Loader muss auch Abhängigkeiten nach dem Laden umplatzieren. Diese Umplatzierungen sind in der Umplatzierungstabelle in den Formaten REL oder RELA angegeben, und die Anzahl der Umplatzierungen wird in den dynamischen Abschnitten RELSZ oder RELASZ angegeben.

readelf -r lnstat

Relocation section '.rela.dyn' at offset 0xaa0 contains 23 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fc48  000000000403 R_AARCH64_RELATIV                    1d10
00000001fc50  000000000403 R_AARCH64_RELATIV                    1cc0
00000001fff0  000000000403 R_AARCH64_RELATIV                    1340
000000020008  000000000403 R_AARCH64_RELATIV                    20008
000000020010  000000000403 R_AARCH64_RELATIV                    3330
000000020030  000000000403 R_AARCH64_RELATIV                    3338
000000020050  000000000403 R_AARCH64_RELATIV                    3340
000000020070  000000000403 R_AARCH64_RELATIV                    3348
000000020090  000000000403 R_AARCH64_RELATIV                    3350
0000000200b0  000000000403 R_AARCH64_RELATIV                    3358
0000000200d0  000000000403 R_AARCH64_RELATIV                    3360
0000000200f0  000000000403 R_AARCH64_RELATIV                    3370
000000020110  000000000403 R_AARCH64_RELATIV                    3378
000000020130  000000000403 R_AARCH64_RELATIV                    3380
000000020150  000000000403 R_AARCH64_RELATIV                    3388
00000001ffb8  000a00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_deregisterTM[...] + 0
00000001ffc0  000b00000401 R_AARCH64_GLOB_DA 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001ffc8  000f00000401 R_AARCH64_GLOB_DA 0000000000000000 stderr@GLIBC_2.17 + 0
00000001ffd0  001000000401 R_AARCH64_GLOB_DA 0000000000000000 optarg@GLIBC_2.17 + 0
00000001ffd8  001400000401 R_AARCH64_GLOB_DA 0000000000000000 stdout@GLIBC_2.17 + 0
00000001ffe0  001e00000401 R_AARCH64_GLOB_DA 0000000000000000 __gmon_start__ + 0
00000001ffe8  001f00000401 R_AARCH64_GLOB_DA 0000000000000000 __stack_chk_guard@GLIBC_2.17 + 0
00000001fff8  002e00000401 R_AARCH64_GLOB_DA 0000000000000000 _ITM_registerTMCl[...] + 0

Relocation section '.rela.plt' at offset 0xcc8 contains 40 entries:
Offset          Info           Type           Sym. Value    Sym. Name + Addend
00000001fe70  000300000402 R_AARCH64_JUMP_SL 0000000000000000 strtok@GLIBC_2.17 + 0
00000001fe78  000400000402 R_AARCH64_JUMP_SL 0000000000000000 strtoul@GLIBC_2.17 + 0
00000001fe80  000500000402 R_AARCH64_JUMP_SL 0000000000000000 strlen@GLIBC_2.17 + 0
00000001fe88  000600000402 R_AARCH64_JUMP_SL 0000000000000000 fputs@GLIBC_2.17 + 0
00000001fe90  000700000402 R_AARCH64_JUMP_SL 0000000000000000 exit@GLIBC_2.17 + 0
00000001fe98  000800000402 R_AARCH64_JUMP_SL 0000000000000000 __libc_start_main@GLIBC_2.34 + 0
00000001fea0  000900000402 R_AARCH64_JUMP_SL 0000000000000000 perror@GLIBC_2.17 + 0
00000001fea8  000b00000402 R_AARCH64_JUMP_SL 0000000000000000 __cxa_finalize@GLIBC_2.17 + 0
00000001feb0  000c00000402 R_AARCH64_JUMP_SL 0000000000000000 putc@GLIBC_2.17 + 0
00000001feb8  000d00000402 R_AARCH64_JUMP_SL 0000000000000000 opendir@GLIBC_2.17 + 0
00000001fec0  000e00000402 R_AARCH64_JUMP_SL 0000000000000000 fputc@GLIBC_2.17 + 0
00000001fec8  001100000402 R_AARCH64_JUMP_SL 0000000000000000 snprintf@GLIBC_2.17 + 0
00000001fed0  001200000402 R_AARCH64_JUMP_SL 0000000000000000 __snprintf_chk@GLIBC_2.17 + 0
00000001fed8  001300000402 R_AARCH64_JUMP_SL 0000000000000000 malloc@GLIBC_2.17 + 0
00000001fee0  001500000402 R_AARCH64_JUMP_SL 0000000000000000 gettimeofday@GLIBC_2.17 + 0
00000001fee8  001600000402 R_AARCH64_JUMP_SL 0000000000000000 sleep@GLIBC_2.17 + 0
00000001fef0  001700000402 R_AARCH64_JUMP_SL 0000000000000000 __vfprintf_chk@GLIBC_2.17 + 0
00000001fef8  001800000402 R_AARCH64_JUMP_SL 0000000000000000 calloc@GLIBC_2.17 + 0
00000001ff00  001900000402 R_AARCH64_JUMP_SL 0000000000000000 rewind@GLIBC_2.17 + 0
00000001ff08  001a00000402 R_AARCH64_JUMP_SL 0000000000000000 strdup@GLIBC_2.17 + 0
00000001ff10  001b00000402 R_AARCH64_JUMP_SL 0000000000000000 closedir@GLIBC_2.17 + 0
00000001ff18  001c00000402 R_AARCH64_JUMP_SL 0000000000000000 __stack_chk_fail@GLIBC_2.17 + 0
00000001ff20  001d00000402 R_AARCH64_JUMP_SL 0000000000000000 strrchr@GLIBC_2.17 + 0
00000001ff28  001e00000402 R_AARCH64_JUMP_SL 0000000000000000 __gmon_start__ + 0
00000001ff30  002000000402 R_AARCH64_JUMP_SL 0000000000000000 abort@GLIBC_2.17 + 0
00000001ff38  002100000402 R_AARCH64_JUMP_SL 0000000000000000 feof@GLIBC_2.17 + 0
00000001ff40  002200000402 R_AARCH64_JUMP_SL 0000000000000000 getopt_long@GLIBC_2.17 + 0
00000001ff48  002300000402 R_AARCH64_JUMP_SL 0000000000000000 __fprintf_chk@GLIBC_2.17 + 0
00000001ff50  002400000402 R_AARCH64_JUMP_SL 0000000000000000 strcmp@GLIBC_2.17 + 0
00000001ff58  002500000402 R_AARCH64_JUMP_SL 0000000000000000 free@GLIBC_2.17 + 0
00000001ff60  002600000402 R_AARCH64_JUMP_SL 0000000000000000 readdir64@GLIBC_2.17 + 0
00000001ff68  002700000402 R_AARCH64_JUMP_SL 0000000000000000 strndup@GLIBC_2.17 + 0
00000001ff70  002800000402 R_AARCH64_JUMP_SL 0000000000000000 strchr@GLIBC_2.17 + 0
00000001ff78  002900000402 R_AARCH64_JUMP_SL 0000000000000000 fwrite@GLIBC_2.17 + 0
```plaintext
00000001ff80  002a00000402 R_AARCH64_JUMP_SL 0000000000000000 fflush@GLIBC_2.17 + 0
00000001ff88  002b00000402 R_AARCH64_JUMP_SL 0000000000000000 fopen64@GLIBC_2.17 + 0
00000001ff90  002c00000402 R_AARCH64_JUMP_SL 0000000000000000 __isoc99_sscanf@GLIBC_2.17 + 0
00000001ff98  002d00000402 R_AARCH64_JUMP_SL 0000000000000000 strncpy@GLIBC_2.17 + 0
00000001ffa0  002f00000402 R_AARCH64_JUMP_SL 0000000000000000 __assert_fail@GLIBC_2.17 + 0
00000001ffa8  003000000402 R_AARCH64_JUMP_SL 0000000000000000 fgets@GLIBC_2.17 + 0

Statische Umplatzierungen

Wenn das Programm an einem anderen Ort geladen wird als der bevorzugte Adresse (normalerweise 0x400000), weil die Adresse bereits verwendet wird oder aufgrund von ASLR oder aus einem anderen Grund, korrigiert eine statische Umplatzierung Zeiger, die Werte erwarteten, dass das Binärprogramm an der bevorzugten Adresse geladen wird.

Zum Beispiel sollte ein Abschnitt vom Typ R_AARCH64_RELATIV die Adresse am Umplatzierungsbias plus dem Addendwert geändert haben.

Dynamische Umplatzierungen und GOT

Die Umplatzierung könnte auch auf ein externes Symbol verweisen (wie eine Funktion aus einer Abhängigkeit). Wie die Funktion malloc aus libC. Dann, wenn der Loader libC an einer Adresse lädt und überprüft, wo die malloc-Funktion geladen ist, schreibt er diese Adresse in die GOT (Global Offset Table) Tabelle (die in der Umplatzierungstabelle angegeben ist), wo die Adresse von malloc angegeben sein sollte.

Verfahrensverknüpfungstabelle

Der PLT-Abschnitt ermöglicht das Durchführen einer verzögerten Bindung, was bedeutet, dass die Auflösung des Speicherorts einer Funktion beim ersten Zugriff erfolgt.

Wenn ein Programm malloc aufruft, ruft es tatsächlich den entsprechenden Speicherort von malloc in der PLT (malloc@plt) auf. Beim ersten Aufruf wird die Adresse von malloc aufgelöst und gespeichert, sodass beim nächsten Aufruf von malloc diese Adresse anstelle des PLT-Codes verwendet wird.

Programminitialisierung

Nachdem das Programm geladen wurde, ist es an der Zeit, dass es ausgeführt wird. Allerdings wird der erste Code, der ausgeführt wird, nicht immer die Funktion main sein. Dies liegt daran, dass beispielsweise in C++ wenn eine globale Variable ein Objekt einer Klasse ist, dieses Objekt vor dem Ausführen von main initialisiert werden muss, wie in:

#include <stdio.h>
// g++ autoinit.cpp -o autoinit
class AutoInit {
public:
AutoInit() {
printf("Hello AutoInit!\n");
}
~AutoInit() {
printf("Goodbye AutoInit!\n");
}
};

AutoInit autoInit;

int main() {
printf("Main\n");
return 0;
}

Beachten Sie, dass diese globalen Variablen im .data oder .bss Bereich liegen, aber in den Listen __CTOR_LIST__ und __DTOR_LIST__ die Objekte zur Initialisierung und Zerstörung in der Reihenfolge gespeichert sind, um sie zu verfolgen.

Vom C-Code aus ist es möglich, das gleiche Ergebnis unter Verwendung der GNU-Erweiterungen zu erzielen:

__attributte__((constructor)) //Add a constructor to execute before
__attributte__((destructor)) //Add to the destructor list

Von einem Compilerstandpunkt aus ist es möglich, vor und nach der Ausführung der main-Funktion eine init-Funktion und eine fini-Funktion zu erstellen, die im dynamischen Abschnitt als INIT und FIN referenziert werden und in den init- und fini-Abschnitten des ELF platziert sind.

Die andere Option ist, wie bereits erwähnt, die Listen __CTOR_LIST__ und __DTOR_LIST__ in den Einträgen INIT_ARRAY und FINI_ARRAY im dynamischen Abschnitt zu referenzieren, wobei die Länge dieser durch INIT_ARRAYSZ und FINI_ARRAYSZ angegeben wird. Jeder Eintrag ist ein Funktionszeiger, der ohne Argumente aufgerufen wird.

Darüber hinaus ist es auch möglich, ein PREINIT_ARRAY mit Zeigern zu haben, die vor den INIT_ARRAY-Zeigern ausgeführt werden.

Initialisierungsreihenfolge

  1. Das Programm wird in den Speicher geladen, statische globale Variablen werden in .data initialisiert und nicht initialisierte Variablen in .bss auf Null gesetzt.

  2. Alle Abhängigkeiten für das Programm oder Bibliotheken werden initialisiert und das dynamische Verknüpfen wird ausgeführt.

  3. PREINIT_ARRAY-Funktionen werden ausgeführt.

  4. INIT_ARRAY-Funktionen werden ausgeführt.

  5. Wenn ein INIT-Eintrag vorhanden ist, wird er aufgerufen.

  6. Wenn es sich um eine Bibliothek handelt, endet dlopen hier, wenn es sich um ein Programm handelt, ist es Zeit, den echten Einstiegspunkt (die main-Funktion) aufzurufen.

Thread-Lokaler Speicher (TLS)

Sie werden in C++ mit dem Schlüsselwort __thread_local oder der GNU-Erweiterung __thread definiert.

Jeder Thread wird einen eindeutigen Speicherort für diese Variable beibehalten, sodass nur der Thread auf seine Variable zugreifen kann.

Wenn dies verwendet wird, werden die Abschnitte .tdata und .tbss im ELF verwendet. Diese sind wie .data (initialisiert) und .bss (nicht initialisiert), aber für TLS.

Jede Variable hat einen Eintrag im TLS-Header, der die Größe und den TLS-Offset angibt, der der Offset ist, den sie im lokalen Datenspeicher des Threads verwenden wird.

Das __TLS_MODULE_BASE ist ein Symbol, das verwendet wird, um auf die Basisadresse des threadlokalen Speichers zu verweisen und auf den Bereich im Speicher zeigt, der alle threadlokalen Daten eines Moduls enthält.

Last updated