이전 프로그램에는 9개의 프로그램 헤더가 있습니다. 그런 다음 세그먼트 매핑은 각 섹션이 어느 프로그램 헤더(00부터 08까지)에 위치하는지를 나타냅니다.
PHDR - Program HeaDeR
프로그램 헤더 테이블과 메타데이터 자체를 포함합니다.
INTERP
바이너리를 메모리로로드하는 데 사용할 로더의 경로를 나타냅니다.
LOAD
이 헤더는 바이너리를 메모리로로드하는 방법을 나타냅니다.
각 LOAD 헤더는 메모리(크기, 권한 및 정렬)의 영역을 나타내며 ELF 바이너리의 바이트를 복사할 위치를 나타냅니다.
예를 들어, 두 번째 헤더는 크기가 0x1190이며 0x1fc48에 위치하고 읽기 및 쓰기 권한이 있으며 오프셋 0xfc48에서 0x528로 채워질 것입니다(예약된 공간을 모두 채우지는 않음). 이 메모리에는 섹션 .init_array .fini_array .dynamic .got .data .bss가 포함됩니다.
DYNAMIC
이 헤더는 프로그램을 라이브러리 종속성에 연결하고 재배치를 적용하는 데 도움이 됩니다. .dynamic 섹션을 확인하십시오.
NOTE
바이너리에 대한 공급 업체 메타데이터 정보를 저장합니다.
GNU_EH_FRAME
디버거 및 C++ 예외 처리 런타임 함수에서 사용되는 스택 언워인드 테이블의 위치를 정의합니다.
GNU_STACK
스택 실행 방지 방어의 구성을 포함합니다. 활성화되면 바이너리는 스택에서 코드를 실행할 수 없습니다.
GNU_RELRO
바이너리의 RELRO (Relocation Read-Only) 구성을 나타냅니다. 이 보호는 프로그램이 로드된 후 실행되기 전에 메모리의 특정 섹션(예: GOT 또는 init 및 fini 테이블)을 읽기 전용으로 표시합니다.
이전 예에서는 0x3b8 바이트를 0x1fc48에 읽기 전용으로 복사하여 섹션 .init_array .fini_array .dynamic .got .data .bss에 영향을 줍니다.
RELRO는 부분적이거나 완전한 것이 있으며, 부분적인 버전은 .plt.got 섹션을 보호하지 않습니다. 이 섹션은 지연 바인딩에 사용되며 위치가 검색될 때 라이브러리의 주소를 처음으로 쓰기 위해 이 메모리 공간에 쓰기 권한이 있어야 합니다.
문자열 테이블: ELF 파일에서 필요한 모든 문자열을 포함하며 (프로그램에서 실제로 사용되는 것은 아님) .text 또는 .data와 같은 섹션 이름을 포함합니다. 예를 들어, .text가 문자열 테이블의 오프셋 45에 있으면 name 필드에서 숫자 45를 사용합니다.
문자열 테이블의 위치를 찾기 위해 ELF에는 문자열 테이블로의 포인터가 포함되어 있습니다.
심볼 테이블: 심볼에 대한 정보를 포함하며 이름 (문자열 테이블 내의 오프셋), 주소, 크기 및 심볼에 대한 추가 메타데이터가 포함됩니다.
주요 섹션
.text: 프로그램을 실행하는 명령어.
.data: 프로그램에서 정의된 값이 있는 전역 변수.
.bss: 초기화되지 않은 전역 변수 (또는 0으로 초기화). 여기에 있는 변수는 자동으로 0으로 초기화되므로 이진 파일에 불필요한 0이 추가되지 않습니다.
.rodata: 상수 전역 변수 (읽기 전용 섹션).
.tdata 및 .tbss: 스레드 로컬 변수가 사용될 때 (C++의 __thread_local 또는 __thread와 같은) .data 및 .bss와 유사합니다.
.dynamic: 아래 참조.
심볼
심볼은 프로그램의 이름이 지정된 위치로, 함수, 전역 데이터 객체, 스레드 로컬 변수 등이 될 수 있습니다.
readelf -s lnstat
Symbol table '.dynsym' contains 49 entries:
Num: Value Size Type Bind Vis Ndx Name
0: 0000000000000000 0 NOTYPE LOCAL DEFAULT UND
1: 0000000000001088 0 SECTION LOCAL DEFAULT 12 .init
2: 0000000000020000 0 SECTION LOCAL DEFAULT 23 .data
3: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strtok@GLIBC_2.17 (2)
4: 0000000000000000 0 FUNC GLOBAL DEFAULT UND s[...]@GLIBC_2.17 (2)
5: 0000000000000000 0 FUNC GLOBAL DEFAULT UND strlen@GLIBC_2.17 (2)
6: 0000000000000000 0 FUNC GLOBAL DEFAULT UND fputs@GLIBC_2.17 (2)
7: 0000000000000000 0 FUNC GLOBAL DEFAULT UND exit@GLIBC_2.17 (2)
8: 0000000000000000 0 FUNC GLOBAL DEFAULT UND _[...]@GLIBC_2.34 (3)
9: 0000000000000000 0 FUNC GLOBAL DEFAULT UND perror@GLIBC_2.17 (2)
10: 0000000000000000 0 NOTYPE WEAK DEFAULT UND _ITM_deregisterT[...]
11: 0000000000000000 0 FUNC WEAK DEFAULT UND _[...]@GLIBC_2.17 (2)
12: 0000000000000000 0 FUNC GLOBAL DEFAULT UND putc@GLIBC_2.17 (2)
[...]
각 symbol 항목에는 다음이 포함되어 있습니다:
이름
바인딩 속성 (약한, 지역 또는 전역): 지역 심볼은 프로그램 자체에서만 액세스할 수 있으며 전역 심볼은 프로그램 외부에서 공유됩니다. 약한 객체는 다른 함수에 의해 재정의될 수 있는 함수입니다.
유형: NOTYPE (지정된 유형 없음), OBJECT (전역 데이터 변수), FUNC (함수), SECTION (섹션), FILE (디버거용 소스 코드 파일), TLS (스레드 로컬 변수), GNU_IFUNC (재배치를 위한 간접 함수)
프로그램이 선호하는 주소(보통 0x400000)가 아닌 다른 위치에 로드되는 경우(이미 사용 중인 주소이거나 ASLR 또는 다른 이유로), 정적 재배치는 이진 파일이 선호하는 주소에 로드될 것으로 예상되는 값을 가진 포인터를 수정합니다.
예를 들어 R_AARCH64_RELATIV 유형의 섹션은 재배치 편향 플러스 추가 값에서 주소를 수정해야 합니다.
동적 재배치 및 GOT
재배치는 외부 심볼(의존성에서 가져온 함수와 같은)을 참조할 수도 있습니다. 예를 들어 libC의 malloc 함수와 같은 함수. 그럼 로더는 libC를 로드할 때 malloc 함수가 로드된 위치를 확인하고, malloc 함수의 주소를 GOT(Global Offset Table) 테이블(재배치 테이블에서 지정됨)에 기록합니다.
절차 연결 테이블
PLT 섹션을 사용하면 지연 바인딩을 수행할 수 있습니다. 이는 함수의 위치 결정이 해당 함수에 처음 액세스될 때 수행됨을 의미합니다.
따라서 프로그램이 malloc을 호출할 때, 실제로는 PLT의 malloc에 해당하는 위치를 호출합니다(malloc@plt). 처음 호출될 때 malloc의 주소를 해결하고 저장하여 다음에 malloc이 호출될 때 PLT 코드 대신 해당 주소를 사용합니다.
프로그램 초기화
프로그램이 로드된 후 실행될 시간입니다. 그러나 실행되는 첫 번째 코드가 항상 main 함수가 아닙니다. 이는 예를 들어 C++에서 전역 변수가 클래스의 객체인 경우, 이 객체는 main이 실행되기 전에 초기화되어야 하기 때문입니다.
이러한 전역 변수는 .data 또는 .bss에 위치하지만 __CTOR_LIST__ 및 __DTOR_LIST__ 목록에는 초기화 및 소멸할 객체가 순서대로 저장되어 추적됩니다.
C 코드에서는 GNU 확장을 사용하여 동일한 결과를 얻을 수 있습니다 :
__attributte__((constructor)) //Add a constructor to execute before__attributte__((destructor)) //Add to the destructor list
컴파일러 관점에서, main 함수가 실행되기 전과 후에 이러한 동작을 실행하기 위해 init 함수와 fini 함수를 생성하고, 동적 섹션에서 INIT 및 **FIN**으로 참조되며 ELF의 init 및 fini 섹션에 배치할 수 있습니다.
언급된 대로, 다른 옵션은 동적 섹션에서 INIT_ARRAY 및 FINI_ARRAY 항목에 __CTOR_LIST__ 및 **__DTOR_LIST__ 목록을 참조하고, 이들의 길이는 INIT_ARRAYSZ 및 **FINI_ARRAYSZ**로 표시됩니다. 각 항목은 인수 없이 호출되는 함수 포인터입니다.
또한, INIT_ARRAY 포인터보다 이전에 실행될 포인터가 있는 **PREINIT_ARRAY**를 가질 수도 있습니다.
초기화 순서
프로그램이 메모리에 로드되고, 정적 전역 변수가 **.data**에서 초기화되며 초기화되지 않은 변수는 **.bss**에서 0으로 설정됩니다.
프로그램이나 라이브러리의 모든 의존성이 초기화되고 동적 링킹이 실행됩니다.
PREINIT_ARRAY 함수가 실행됩니다.
INIT_ARRAY 함수가 실행됩니다.
INIT 항목이 있는 경우 호출됩니다.
라이브러리의 경우, dlopen이 여기서 끝나며, 프로그램의 경우 실제 진입점(main 함수)을 호출할 시간입니다.
스레드 로컬 스토리지 (TLS)
C++에서는 __thread_local 키워드를 사용하거나 GNU 확장인 **__thread**를 사용하여 정의됩니다.
각 스레드는 이 변수에 대한 고유한 위치를 유지하므로 스레드만 해당 변수에 액세스할 수 있습니다.
이를 사용하면 ELF에서 .tdata 및 .tbss 섹션이 사용됩니다. 이는 TLS용으로 .data(초기화됨) 및 .bss(초기화되지 않음)와 유사합니다.
각 변수는 TLS 헤더에 항목이 있어 크기와 TLS 오프셋을 지정하며, 이는 스레드의 로컬 데이터 영역에서 사용할 오프셋입니다.
__TLS_MODULE_BASE는 모듈의 모든 스레드 로컬 데이터를 포함하는 메모리 영역을 가리키는 기호입니다.