Yükleyiciye ELF'yi belleğe nasıl yükleyeceğini tarif eder:
readelf-lWlnstatElffiletypeisDYN (Position-Independent Executablefile)Entrypoint0x1c00Thereare9programheaders,startingatoffset64ProgramHeaders:TypeOffsetVirtAddrPhysAddrFileSizMemSizFlgAlignPHDR0x0000400x00000000000000400x00000000000000400x0001f80x0001f8R0x8INTERP0x0002380x00000000000002380x00000000000002380x00001b0x00001bR0x1[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]LOAD0x0000000x00000000000000000x00000000000000000x003f7c0x003f7cRE0x10000LOAD0x00fc480x000000000001fc480x000000000001fc480x0005280x001190RW0x10000DYNAMIC0x00fc580x000000000001fc580x000000000001fc580x0002000x000200RW0x8NOTE0x0002540x00000000000002540x00000000000002540x0000e00x0000e0R0x4GNU_EH_FRAME0x0036100x00000000000036100x00000000000036100x0001b40x0001b4R0x4GNU_STACK0x0000000x00000000000000000x00000000000000000x0000000x000000RW0x10GNU_RELRO0x00fc480x000000000001fc480x000000000001fc480x0003b80x0003b8R0x1SectiontoSegmentmapping:SegmentSections...0001.interp02.interp.note.gnu.build-id.note.ABI-tag.note.package.gnu.hash.dynsym.dynstr.gnu.version.gnu.version_r.rela.dyn.rela.plt.init.plt.text.fini.rodata.eh_frame_hdr.eh_frame03.init_array.fini_array.dynamic.got.data.bss04.dynamic05.note.gnu.build-id.note.ABI-tag.note.package06.eh_frame_hdr0708.init_array.fini_array.dynamic.got
The previous program has 9 program headers, then, the segment mapping indicates in which program header (from 00 to 08) each section is located.
PHDR - Program HeaDeR
Contains the program header tables and metadata itself.
INTERP
Indicates the path of the loader to use to load the binary into memory.
LOAD
These headers are used to indicate how to load a binary into memory.
Each LOAD header indicates a region of memory (size, permissions and alignment) and indicates the bytes of the ELF binary to copy in there.
For example, the second one has a size of 0x1190, should be located at 0x1fc48 with permissions read and write and will be filled with 0x528 from the offset 0xfc48 (it doesn't fill all the reserved space). This memory will contain the sections .init_array .fini_array .dynamic .got .data .bss.
DYNAMIC
This header helps to link programs to their library dependencies and apply relocations. Check the .dynamic section.
NOTE
This stores vendor metadata information about the binary.
GNU_EH_FRAME
Defines the location of the stack unwind tables, used by debuggers and C++ exception handling-runtime functions.
GNU_STACK
Contains the configuration of the stack execution prevention defense. If enabled, the binary won't be able to execute code from the stack.
GNU_RELRO
Indicates the RELRO (Relocation Read-Only) configuration of the binary. This protection will mark as read-only certain sections of the memory (like the GOT or the init and fini tables) after the program has loaded and before it begins running.
In the previous example it's copying 0x3b8 bytes to 0x1fc48 as read-only affecting the sections .init_array .fini_array .dynamic .got .data .bss.
Note that RELRO can be partial or full, the partial version do not protect the section .plt.got, which is used for lazy binding and needs this memory space to have write permissions to write the address of the libraries the first time their location is searched.
TLS
Defines a table of TLS entries, which stores info about thread-local variables.
Section Headers
Section headers gives a more detailed view of the ELF binary
It also indicates the location, offset, permissions but also the type of data it section has.
Meta Sections
String table: ELF dosyasının ihtiyaç duyduğu tüm dizeleri içerir (ancak program tarafından gerçekten kullanılanları değil). Örneğin, .text veya .data gibi bölüm adlarını içerir. Ve eğer .text dizeler tablosunda 45. offset'te ise, name alanında 45 numarasını kullanır.
Dize tablosunun nerede olduğunu bulmak için, ELF dize tablosuna bir işaretçi içerir.
Symbol table: Semboller hakkında isim (dize tablosundaki offset), adres, boyut ve sembol hakkında daha fazla meta veriyi içerir.
Main Sections
.text: Çalıştırılacak programın talimatları.
.data: Programda tanımlı bir değere sahip global değişkenler.
.bss: Başlatılmamış (veya sıfıra başlatılmış) global değişkenler. Buradaki değişkenler otomatik olarak sıfıra başlatılır, böylece gereksiz sıfırların ikili dosyaya eklenmesi önlenir.
.rodata: Sabit global değişkenler (salt okunur bölüm).
.tdata ve .tbss: Thread-local değişkenler kullanıldığında .data ve .bss gibi (__thread_local C++'da veya __thread C'de).
.dynamic: Aşağıya bakın.
Symbols
Symbols, programda bir fonksiyon, bir global veri nesnesi, thread-local değişkenler olabilecek adlandırılmış bir yerdir...
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
Her sembol girişi şunları içerir:
İsim
Bağlama özellikleri (zayıf, yerel veya küresel): Yerel bir sembol yalnızca program tarafından erişilebilirken, küresel semboller programın dışındaki paylaşılan sembollerdir. Zayıf bir nesne, örneğin, farklı bir fonksiyonla geçersiz kılınabilen bir fonksiyondur.
Tür: NOTYPE (tip belirtilmemiş), OBJECT (küresel veri değişkeni), FUNC (fonksiyon), SECTION (bölüm), FILE (hata ayıklayıcılar için kaynak kodu dosyası), TLS (iş parçacığına özgü değişken), GNU_IFUNC (yer değiştirme için dolaylı fonksiyon)
GEREKEN dizini, programın devam edebilmesi için belirtilen kütüphaneyi yüklemesi gerektiğini gösterir. GEREKEN dizini, paylaşılan kütüphane tamamen çalışır ve kullanıma hazır olduğunda tamamlanır.
Yeniden Yerleştirmeler
Yükleyici, bağımlılıkları yükledikten sonra yeniden yerleştirmeleri de yapmalıdır. Bu yeniden yerleştirmeler, REL veya RELA formatlarında yeniden yerleştirme tablosunda belirtilir ve yeniden yerleştirmelerin sayısı dinamik bölümlerde RELSZ veya RELASZ ile verilir.
Eğer program tercih edilen adresten (genellikle 0x400000) farklı bir yere yüklenirse, çünkü adres zaten kullanılıyordur ya da ASLR veya başka bir sebepten dolayı, statik bir yeniden yerleştirme işaretçileri düzeltir ki bu işaretçiler, ikili dosyanın tercih edilen adreste yükleneceğini bekleyen değerler içerir.
Örneğin, R_AARCH64_RELATIV türündeki herhangi bir bölüm, yeniden yerleştirme kayması artı ekleme değeri ile adresi değiştirmelidir.
Dinamik Yeniden Yerleştirmeler ve GOT
Yeniden yerleştirme, bir dış sembole (bir bağımlılıktan bir fonksiyon gibi) de referans verebilir. Örneğin, libC'den malloc fonksiyonu. O zaman, yükleyici libC'yi bir adrese yüklerken malloc fonksiyonunun yüklendiği yeri kontrol eder, bu adresi GOT (Küresel Ofset Tablosu) tablosuna (yeniden yerleştirme tablosunda belirtilmiştir) yazar, burada malloc'un adresi belirtilmelidir.
Prosedür Bağlantı Tablosu
PLT bölümü tembel bağlama yapmayı sağlar, bu da bir fonksiyonun yerinin çözümlemesinin ilk kez erişildiğinde gerçekleştirileceği anlamına gelir.
Bu nedenle bir program malloc çağırdığında, aslında PLT'deki malloc'ın karşılık gelen konumunu çağırır (malloc@plt). İlk kez çağrıldığında malloc'ın adresini çözer ve bunu saklar, böylece bir sonraki sefer malloc çağrıldığında, bu adres PLT kodu yerine kullanılır.
Program Başlatma
Program yüklendikten sonra çalıştırma zamanı gelmiştir. Ancak, çalıştırılan ilk kod her zaman main fonksiyonu değildir. Bunun nedeni, örneğin C++'ta eğer bir global değişken bir sınıfın nesnesi ise, bu nesne main çalışmadan öncebaşlatılmalıdır, örneğin:
Not edin ki bu global değişkenler .data veya .bss içinde yer alır, ancak __CTOR_LIST__ ve __DTOR_LIST__ listelerinde başlatılacak ve yok edilecek nesneler saklanır, böylece bunların takibi yapılabilir.
C kodundan aynı sonuca GNU uzantılarını kullanarak ulaşmak mümkündür:
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
Bir derleyici perspektifinden, main fonksiyonu çalıştırılmadan önce ve sonra bu eylemleri gerçekleştirmek için, dinamik bölümde INIT ve FIN olarak referans verilecek bir init fonksiyonu ve bir fini fonksiyonu oluşturmak mümkündür. Bu fonksiyonlar ELF'nin init ve fini bölümlerine yerleştirilir.
Diğer bir seçenek, bahsedildiği gibi, dinamik bölümdeki INIT_ARRAY ve FINI_ARRAY girişlerinde __CTOR_LIST__ ve __DTOR_LIST__ listelerine referans vermektir ve bunların uzunluğu INIT_ARRAYSZ ve FINI_ARRAYSZ ile belirtilir. Her giriş, argüman olmadan çağrılacak bir fonksiyon işaretçisidir.
Ayrıca, INIT_ARRAY işaretçileri önce çalıştırılacak işaretçiler ile bir PREINIT_ARRAY olması da mümkündür.
Başlatma Sırası
Program belleğe yüklenir, statik global değişkenler .data bölümünde başlatılır ve başlatılmamış olanlar .bss bölümünde sıfırlanır.
Program veya kütüphaneler için tüm bağımlılıklarbaşlatılır ve dinamik bağlantı gerçekleştirilir.
PREINIT_ARRAY fonksiyonları çalıştırılır.
INIT_ARRAY fonksiyonları çalıştırılır.
Eğer bir INIT girişi varsa, çağrılır.
Eğer bir kütüphane ise, dlopen burada sona erer; eğer bir program ise, gerçek giriş noktası (main fonksiyonu) çağrılma zamanı gelmiştir.
Thread-Local Storage (TLS)
C++'da __thread_local anahtar kelimesi veya GNU uzantısı __thread kullanılarak tanımlanırlar.
Her bir thread, bu değişken için benzersiz bir konum tutacaktır, böylece yalnızca thread kendi değişkenine erişebilir.
Bu kullanıldığında, ELF'de .tdata ve .tbss bölümleri kullanılır. Bunlar, TLS için .data (başlatılmış) ve .bss (başlatılmamış) gibidir.
Her değişken, boyutu ve thread'in yerel veri alanındaki offset'ini belirten TLS başlığında bir girişe sahip olacaktır.
__TLS_MODULE_BASE, thread yerel depolamanın temel adresine atıfta bulunmak için kullanılan bir semboldür ve bir modülün tüm thread yerel verilerini içeren bellek alanına işaret eder.