Descrivono al loader come caricare l'ELF in memoria:
readelf-lWlnstatElffiletypeisDYN (Position-Independent Executablefile)Entrypoint0x1c00Thereare9programheaders,startingatoffset64ProgramHeaders:TypeOffsetVirtAddrPhysAddrFileSizMemSizFlgAlignPHDR0x0000400x00000000000000400x00000000000000400x0001f80x0001f8R0x8INTERP0x0002380x00000000000002380x00000000000002380x00001b0x00001bR0x1[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]LOAD0x0000000x00000000000000000x00000000000000000x003f7c0x003f7cRE0x10000LOAD0x00fc480x000000000001fc480x000000000001fc480x0005280x001190RW0x10000DYNAMIC0x00fc580x000000000001fc580x000000000001fc580x0002000x000200RW0x8NOTE0x0002540x00000000000002540x00000000000002540x0000e00x0000e0R0x4GNU_EH_FRAME0x0036100x00000000000036100x00000000000036100x0001b40x0001b4R0x4GNU_STACK0x0000000x00000000000000000x00000000000000000x0000000x000000RW0x10GNU_RELRO0x00fc480x000000000001fc480x000000000001fc480x0003b80x0003b8R0x1SectiontoSegmentmapping:SegmentSections...0001.interp02.interp.note.gnu.build-id.note.ABI-tag.note.package.gnu.hash.dynsym.dynstr.gnu.version.gnu.version_r.rela.dyn.rela.plt.init.plt.text.fini.rodata.eh_frame_hdr.eh_frame03.init_array.fini_array.dynamic.got.data.bss04.dynamic05.note.gnu.build-id.note.ABI-tag.note.package06.eh_frame_hdr0708.init_array.fini_array.dynamic.got
Il programma precedente ha 9 intestazioni di programma, quindi, la mappatura dei segmenti indica in quale intestazione di programma (da 00 a 08) si trova ciascuna sezione.
PHDR - Program HeaDeR
Contiene le tabelle delle intestazioni di programma e i metadati stessi.
INTERP
Indica il percorso del loader da utilizzare per caricare il binario in memoria.
LOAD
Queste intestazioni vengono utilizzate per indicare come caricare un binario in memoria.
Ogni intestazione LOAD indica una regione di memoria (dimensione, permessi e allineamento) e indica i byte del binario ELF da copiare lì.
Ad esempio, la seconda ha una dimensione di 0x1190, dovrebbe trovarsi a 0x1fc48 con permessi di lettura e scrittura e sarà riempita con 0x528 dall'offset 0xfc48 (non riempie tutto lo spazio riservato). Questa memoria conterrà le sezioni .init_array .fini_array .dynamic .got .data .bss.
DYNAMIC
Questa intestazione aiuta a collegare i programmi alle loro dipendenze di libreria e ad applicare le rilocalizzazioni. Controlla la sezione .dynamic.
NOTE
Questo memorizza informazioni sui metadati del fornitore riguardanti il binario.
GNU_EH_FRAME
Definisce la posizione delle tabelle di unwind dello stack, utilizzate dai debugger e dalle funzioni di runtime per la gestione delle eccezioni in C++.
GNU_STACK
Contiene la configurazione della difesa contro l'esecuzione dello stack. Se abilitato, il binario non sarà in grado di eseguire codice dallo stack.
GNU_RELRO
Indica la configurazione RELRO (Relocation Read-Only) del binario. Questa protezione contrassegnerà come di sola lettura alcune sezioni della memoria (come il GOT o le tabelle init e fini) dopo che il programma è stato caricato e prima che inizi a essere eseguito.
Nell'esempio precedente sta copiando 0x3b8 byte a 0x1fc48 come di sola lettura, influenzando le sezioni .init_array .fini_array .dynamic .got .data .bss.
Nota che RELRO può essere parziale o completo, la versione parziale non protegge la sezione .plt.got, che viene utilizzata per il lazy binding e ha bisogno di questo spazio di memoria per avere permessi di scrittura per scrivere l'indirizzo delle librerie la prima volta che viene cercata la loro posizione.
TLS
Definisce una tabella di voci TLS, che memorizza informazioni sulle variabili locali del thread.
Section Headers
Le intestazioni delle sezioni forniscono una visione più dettagliata del binario ELF.
It indica anche la posizione, l'offset, i permessi ma anche il tipo di dati che ha la sua sezione.
Sezioni Meta
String table: Contiene tutte le stringhe necessarie al file ELF (ma non quelle effettivamente utilizzate dal programma). Ad esempio, contiene nomi di sezioni come .text o .data. E se .text si trova all'offset 45 nella string table, utilizzerà il numero 45 nel campo name.
Per trovare dove si trova la string table, l'ELF contiene un puntatore alla string table.
Symbol table: Contiene informazioni sui simboli come il nome (offset nella string table), indirizzo, dimensione e ulteriori metadati sul simbolo.
Sezioni Principali
.text: Le istruzioni del programma da eseguire.
.data: Variabili globali con un valore definito nel programma.
.bss: Variabili globali lasciate non inizializzate (o inizializzate a zero). Le variabili qui sono automaticamente inizializzate a zero, prevenendo quindi l'aggiunta di zeri inutili al binario.
.rodata: Variabili globali costanti (sezione di sola lettura).
.tdata e .tbss: Come .data e .bss quando vengono utilizzate variabili locali al thread (__thread_local in C++ o __thread in C).
.dynamic: Vedi sotto.
Simboli
I simboli sono una posizione nominata nel programma che potrebbe essere una funzione, un oggetto di dati globale, variabili locali al thread...
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
Ogni voce simbolo contiene:
Nome
Attributi di binding (debole, locale o globale): Un simbolo locale può essere accessibile solo dal programma stesso, mentre i simboli globali sono condivisi al di fuori del programma. Un oggetto debole è, ad esempio, una funzione che può essere sovrascritta da un'altra.
Tipo: NOTYPE (nessun tipo specificato), OBJECT (variabile di dati globale), FUNC (funzione), SECTION (sezione), FILE (file di codice sorgente per debugger), TLS (variabile locale al thread), GNU_IFUNC (funzione indiretta per rilocazione)
La directory NEEDED indica che il programma deve caricare la libreria menzionata per poter continuare. La directory NEEDED si completa una volta che la libreria condivisa è completamente operativa e pronta per l'uso.
Relocations
Il loader deve anche rilocare le dipendenze dopo averle caricate. Queste rilocazioni sono indicate nella tabella di rilocazione nei formati REL o RELA e il numero di rilocazioni è fornito nelle sezioni dinamiche RELSZ o RELASZ.
Se il programma è caricato in un luogo diverso dall'indirizzo preferito (di solito 0x400000) perché l'indirizzo è già utilizzato o a causa di ASLR o per qualsiasi altro motivo, una relocazione statica corregge i puntatori che avevano valori che si aspettavano che il binario fosse caricato nell'indirizzo preferito.
Ad esempio, qualsiasi sezione di tipo R_AARCH64_RELATIV dovrebbe avere modificato l'indirizzo al bias di relocazione più il valore additivo.
Dynamic Relocations and GOT
La relocazione potrebbe anche fare riferimento a un simbolo esterno (come una funzione da una dipendenza). Come la funzione malloc da libC. Quindi, il loader quando carica libC in un indirizzo controllando dove è caricata la funzione malloc, scriverà questo indirizzo nella tabella GOT (Global Offset Table) (indicato nella tabella di relocazione) dove dovrebbe essere specificato l'indirizzo di malloc.
Procedure Linkage Table
La sezione PLT consente di eseguire il binding pigro, il che significa che la risoluzione della posizione di una funzione verrà eseguita la prima volta che viene accesso.
Quindi, quando un programma chiama malloc, in realtà chiama la posizione corrispondente di malloc nel PLT (malloc@plt). La prima volta che viene chiamato, risolve l'indirizzo di malloc e lo memorizza, quindi la prossima volta che viene chiamato malloc, quell'indirizzo viene utilizzato invece del codice PLT.
Program Initialization
Dopo che il programma è stato caricato, è tempo che venga eseguito. Tuttavia, il primo codice che viene eseguito non è sempre la funzione main. Questo perché, ad esempio, in C++ se una variabile globale è un oggetto di una classe, questo oggetto deve essere inizializzatoprima che main venga eseguito, come in:
Nota che queste variabili globali si trovano in .data o .bss, ma nelle liste __CTOR_LIST__ e __DTOR_LIST__ gli oggetti da inizializzare e distruggere sono memorizzati per tenerne traccia.
Dal codice C è possibile ottenere lo stesso risultato utilizzando le estensioni GNU:
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
Dal punto di vista di un compilatore, per eseguire queste azioni prima e dopo l'esecuzione della funzione main, è possibile creare una funzione init e una funzione fini che sarebbero referenziate nella sezione dinamica come INIT e FIN. e sono collocate nelle sezioni init e fini dell'ELF.
L'altra opzione, come menzionato, è referenziare le liste __CTOR_LIST__ e __DTOR_LIST__ nelle voci INIT_ARRAY e FINI_ARRAY nella sezione dinamica e la lunghezza di queste è indicata da INIT_ARRAYSZ e FINI_ARRAYSZ. Ogni voce è un puntatore a funzione che verrà chiamato senza argomenti.
Inoltre, è anche possibile avere un PREINIT_ARRAY con puntatori che verranno eseguiti prima dei puntatori INIT_ARRAY.
Ordine di Inizializzazione
Il programma viene caricato in memoria, le variabili globali statiche vengono inizializzate in .data e quelle non inizializzate azzerate in .bss.
Tutte le dipendenze per il programma o le librerie sono inizializzate e il collegamento dinamico viene eseguito.
Le funzioni PREINIT_ARRAY vengono eseguite.
Le funzioni INIT_ARRAY vengono eseguite.
Se c'è una voce INIT, viene chiamata.
Se è una libreria, dlopen termina qui, se è un programma, è il momento di chiamare il vero punto di ingresso (funzione main).
Memoria Locale per Thread (TLS)
Sono definiti utilizzando la parola chiave __thread_local in C++ o l'estensione GNU __thread.
Ogni thread manterrà una posizione unica per questa variabile, quindi solo il thread può accedere alla sua variabile.
Quando questo viene utilizzato, le sezioni .tdata e .tbss vengono utilizzate nell'ELF. Che sono simili a .data (inizializzato) e .bss (non inizializzato) ma per TLS.
Ogni variabile avrà un'entrata nell'intestazione TLS che specifica la dimensione e l'offset TLS, che è l'offset che utilizzerà nell'area di dati locale del thread.
Il __TLS_MODULE_BASE è un simbolo utilizzato per riferirsi all'indirizzo base della memoria locale per thread e punta all'area in memoria che contiene tutti i dati locali per thread di un modulo.