लोडर को बताता है कि ELF को मेमोरी में कैसे लोड करना है:
readelf-lWlnstatElffiletypeisDYN (Position-Independent Executablefile)Entrypoint0x1c00Thereare9programheaders,startingatoffset64ProgramHeaders:TypeOffsetVirtAddrPhysAddrFileSizMemSizFlgAlignPHDR0x0000400x00000000000000400x00000000000000400x0001f80x0001f8R0x8INTERP0x0002380x00000000000002380x00000000000002380x00001b0x00001bR0x1[Requesting program interpreter: /lib/ld-linux-aarch64.so.1]LOAD0x0000000x00000000000000000x00000000000000000x003f7c0x003f7cRE0x10000LOAD0x00fc480x000000000001fc480x000000000001fc480x0005280x001190RW0x10000DYNAMIC0x00fc580x000000000001fc580x000000000001fc580x0002000x000200RW0x8NOTE0x0002540x00000000000002540x00000000000002540x0000e00x0000e0R0x4GNU_EH_FRAME0x0036100x00000000000036100x00000000000036100x0001b40x0001b4R0x4GNU_STACK0x0000000x00000000000000000x00000000000000000x0000000x000000RW0x10GNU_RELRO0x00fc480x000000000001fc480x000000000001fc480x0003b80x0003b8R0x1SectiontoSegmentmapping:SegmentSections...0001.interp02.interp.note.gnu.build-id.note.ABI-tag.note.package.gnu.hash.dynsym.dynstr.gnu.version.gnu.version_r.rela.dyn.rela.plt.init.plt.text.fini.rodata.eh_frame_hdr.eh_frame03.init_array.fini_array.dynamic.got.data.bss04.dynamic05.note.gnu.build-id.note.ABI-tag.note.package06.eh_frame_hdr0708.init_array.fini_array.dynamic.got
The previous program has 9 program headers, then, the segment mapping indicates in which program header (from 00 to 08) each section is located.
PHDR - Program HeaDeR
Contains the program header tables and metadata itself.
INTERP
Indicates the path of the loader to use to load the binary into memory.
LOAD
These headers are used to indicate how to load a binary into memory.
Each LOAD header indicates a region of memory (size, permissions and alignment) and indicates the bytes of the ELF binary to copy in there.
For example, the second one has a size of 0x1190, should be located at 0x1fc48 with permissions read and write and will be filled with 0x528 from the offset 0xfc48 (it doesn't fill all the reserved space). This memory will contain the sections .init_array .fini_array .dynamic .got .data .bss.
DYNAMIC
This header helps to link programs to their library dependencies and apply relocations. Check the .dynamic section.
NOTE
This stores vendor metadata information about the binary.
GNU_EH_FRAME
Defines the location of the stack unwind tables, used by debuggers and C++ exception handling-runtime functions.
GNU_STACK
Contains the configuration of the stack execution prevention defense. If enabled, the binary won't be able to execute code from the stack.
GNU_RELRO
Indicates the RELRO (Relocation Read-Only) configuration of the binary. This protection will mark as read-only certain sections of the memory (like the GOT or the init and fini tables) after the program has loaded and before it begins running.
In the previous example it's copying 0x3b8 bytes to 0x1fc48 as read-only affecting the sections .init_array .fini_array .dynamic .got .data .bss.
Note that RELRO can be partial or full, the partial version do not protect the section .plt.got, which is used for lazy binding and needs this memory space to have write permissions to write the address of the libraries the first time their location is searched.
TLS
Defines a table of TLS entries, which stores info about thread-local variables.
Section Headers
Section headers gives a more detailed view of the ELF binary
It also indicates the location, offset, permissions but also the data का प्रकार it section has.
Meta Sections
String table: यह ELF फ़ाइल द्वारा आवश्यक सभी स्ट्रिंग्स को शामिल करता है (लेकिन प्रोग्राम द्वारा वास्तव में उपयोग की जाने वाली नहीं)। उदाहरण के लिए, इसमें सेक्शन नाम जैसे .text या .data शामिल हैं। और यदि .text स्ट्रिंग्स टेबल में ऑफसेट 45 पर है, तो यह name फ़ील्ड में संख्या 45 का उपयोग करेगा।
स्ट्रिंग टेबल का स्थान खोजने के लिए, ELF में स्ट्रिंग टेबल के लिए एक पॉइंटर होता है।
Symbol table: यह प्रतीकों के बारे में जानकारी शामिल करता है जैसे नाम (स्ट्रिंग्स टेबल में ऑफसेट), पता, आकार और प्रतीक के बारे में अधिक मेटाडेटा।
Main Sections
.text: प्रोग्राम को चलाने के लिए निर्देश।
.data: प्रोग्राम में परिभाषित मान के साथ वैश्विक चर।
.bss: वैश्विक चर जो अनियोजित छोड़ दिए गए हैं (या शून्य पर प्रारंभिक)। यहाँ के चर स्वचालित रूप से शून्य पर प्रारंभिक होते हैं, इसलिए बाइनरी में बेकार शून्य जोड़ने से रोका जाता है।
.rodata: स्थायी वैश्विक चर (पढ़ने के लिए केवल अनुभाग)।
.tdata और .tbss: जैसे .data और .bss जब थ्रेड-स्थानीय चर का उपयोग किया जाता है (__thread_local C++ में या __thread C में)।
.dynamic: नीचे देखें।
Symbols
Symbols प्रोग्राम में एक नामित स्थान है जो एक फ़ंक्शन, एक वैश्विक डेटा ऑब्जेक्ट, थ्रेड-स्थानीय चर हो सकता है...
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
Each symbol entry contains:
नाम
बाइंडिंग विशेषताएँ (कमजोर, स्थानीय या वैश्विक): एक स्थानीय प्रतीक केवल कार्यक्रम द्वारा ही पहुँचा जा सकता है जबकि वैश्विक प्रतीक कार्यक्रम के बाहर साझा किए जाते हैं। एक कमजोर वस्तु उदाहरण के लिए एक फ़ंक्शन है जिसे किसी अन्य द्वारा ओवरराइड किया जा सकता है।
प्रकार: NOTYPE (कोई प्रकार निर्दिष्ट नहीं), OBJECT (वैश्विक डेटा वेरिएबल), FUNC (फ़ंक्शन), SECTION (सेक्शन), FILE (डीबगर्स के लिए स्रोत-कोड फ़ाइल), TLS (थ्रेड-स्थानीय वेरिएबल), GNU_IFUNC (स्थानांतरण के लिए अप्रत्यक्ष फ़ंक्शन)
The NEEDED directory indicates that the program को जारी रखने के लिए उल्लेखित पुस्तकालय को लोड करने की आवश्यकता है. The NEEDED directory completes once the shared पुस्तकालय पूरी तरह से कार्यात्मक और उपयोग के लिए तैयार है.
Relocations
The loader also must relocate dependencies after having loaded them. These relocations are indicated in the relocation table in formats REL or RELA and the number of relocations is given in the dynamic sections RELSZ or RELASZ.
यदि कार्यक्रम एक अलग स्थान पर लोड होता है जो पसंदीदा पते (आमतौर पर 0x400000) से भिन्न है क्योंकि पता पहले से ही उपयोग में है या ASLR या किसी अन्य कारण से, एक स्थिर पुनर्स्थापन पॉइंटर्स को सही करता है जिनके मानों ने बाइनरी के पसंदीदा पते पर लोड होने की अपेक्षा की थी।
उदाहरण के लिए, R_AARCH64_RELATIV प्रकार के किसी भी अनुभाग को पुनर्स्थापन पूर्वाग्रह के साथ पते को संशोधित करना चाहिए और जोड़ने वाले मान को जोड़ना चाहिए।
Dynamic Relocations and GOT
पुनर्स्थापन एक बाहरी प्रतीक (जैसे किसी निर्भरता से एक फ़ंक्शन) को भी संदर्भित कर सकता है। जैसे कि libC से malloc फ़ंक्शन। फिर, लोडर जब libC को एक पते पर लोड करता है, तो यह जांचता है कि malloc फ़ंक्शन कहाँ लोड है, यह पता GOT (ग्लोबल ऑफ़सेट टेबल) तालिका में लिखता है (जो पुनर्स्थापन तालिका में निर्दिष्ट है) जहाँ malloc का पता निर्दिष्ट किया जाना चाहिए।
Procedure Linkage Table
PLT अनुभाग आलसी बाइंडिंग करने की अनुमति देता है, जिसका अर्थ है कि किसी फ़ंक्शन के स्थान का समाधान पहली बार जब इसे एक्सेस किया जाता है, तब किया जाएगा।
तो जब एक कार्यक्रम malloc को कॉल करता है, तो यह वास्तव में PLT में malloc के संबंधित स्थान को कॉल करता है (malloc@plt)। पहली बार जब इसे कॉल किया जाता है, तो यह malloc का पता हल करता है और इसे संग्रहीत करता है ताकि अगली बार जब malloc को कॉल किया जाए, तो उस पते का उपयोग PLT कोड के बजाय किया जाए।
Program Initialization
कार्यक्रम के लोड होने के बाद इसे चलाने का समय होता है। हालाँकि, जो पहला कोड चलाया जाता है वह हमेशा main फ़ंक्शन नहीं होता है। इसका कारण यह है कि उदाहरण के लिए C++ में यदि एक वैश्विक चर एक वर्ग का ऑब्जेक्ट है, तो इस ऑब्जेक्ट को main चलने से पहलेआरंभ किया जाना चाहिए, जैसे कि:
ध्यान दें कि ये वैश्विक चर .data या .bss में स्थित हैं, लेकिन सूचियों __CTOR_LIST__ और __DTOR_LIST__ में प्रारंभ और विनाश के लिए वस्तुएं संग्रहीत की जाती हैं ताकि उन्हें ट्रैक किया जा सके।
C कोड से GNU एक्सटेंशन का उपयोग करके समान परिणाम प्राप्त करना संभव है:
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
From a compiler perspective, to execute these actions before and after the main function is executed, it's possible to create a init function and a fini function which would be referenced in the dynamic section as INIT and FIN. and are placed in the init and fini sections of the ELF.
The other option, as mentioned, is to reference the lists __CTOR_LIST__ and __DTOR_LIST__ in the INIT_ARRAY and FINI_ARRAY entries in the dynamic section and the length of these are indicated by INIT_ARRAYSZ and FINI_ARRAYSZ. Each entry is a function pointer that will be called without arguments.
Moreover, it's also possible to have a PREINIT_ARRAY with pointers that will be executed before the INIT_ARRAY pointers.
Initialization Order
प्रोग्राम को मेमोरी में लोड किया जाता है, स्थिर वैश्विक चर .data में प्रारंभिक किया जाता है और अनियोजित वाले .bss में शून्य किए जाते हैं।
प्रोग्राम या पुस्तकालयों के सभी dependencies को initialized किया जाता है और dynamic linking निष्पादित किया जाता है।
PREINIT_ARRAY कार्यों को निष्पादित किया जाता है।
INIT_ARRAY कार्यों को निष्पादित किया जाता है।
यदि एक INIT प्रविष्टि है, तो इसे कॉल किया जाता है।
यदि एक पुस्तकालय है, तो dlopen यहाँ समाप्त होता है, यदि एक प्रोग्राम है, तो real entry point (main function) को कॉल करने का समय है।
Thread-Local Storage (TLS)
वे C++ में कीवर्ड __thread_local या GNU एक्सटेंशन __thread का उपयोग करके परिभाषित होते हैं।
प्रत्येक थ्रेड इस चर के लिए एक अद्वितीय स्थान बनाएगा ताकि केवल थ्रेड अपने चर तक पहुँच सके।
जब इसका उपयोग किया जाता है, तो ELF में .tdata और .tbss अनुभागों का उपयोग किया जाता है। जो कि .data (प्रारंभिक) और .bss (अनियोजित) के समान होते हैं लेकिन TLS के लिए।
प्रत्येक चर का TLS हेडर में एक प्रविष्टि होगी जो आकार और TLS ऑफसेट को निर्दिष्ट करती है, जो कि थ्रेड के स्थानीय डेटा क्षेत्र में उपयोग किया जाने वाला ऑफसेट है।
__TLS_MODULE_BASE एक प्रतीक है जिसका उपयोग थ्रेड स्थानीय भंडारण के आधार पते का संदर्भ देने के लिए किया जाता है और यह मेमोरी के उस क्षेत्र की ओर इशारा करता है जिसमें एक मॉड्यूल के सभी थ्रेड-स्थानीय डेटा होते हैं।