Introduction to ARM64v8
예외 수준 - EL (ARM64v8)
ARMv8 아키텍처에서 실행 수준인 예외 수준 (EL)은 실행 환경의 권한 수준과 기능을 정의합니다. EL0부터 EL3까지 네 가지 예외 수준이 있으며 각각 다른 목적을 제공합니다:
EL0 - 사용자 모드:
이는 가장 낮은 권한 수준으로 일반 응용 프로그램 코드를 실행하는 데 사용됩니다.
EL0에서 실행되는 응용 프로그램은 서로 및 시스템 소프트웨어로부터 격리되어 보안성과 안정성을 향상시킵니다.
EL1 - 운영 체제 커널 모드:
대부분의 운영 체제 커널이이 수준에서 실행됩니다.
EL1은 EL0보다 더 많은 권한을 갖고 시스템 자원에 액세스할 수 있지만 시스템 무결성을 보장하기 위해 일부 제한이 있습니다.
EL2 - 하이퍼바이저 모드:
이 수준은 가상화에 사용됩니다. EL2에서 실행되는 하이퍼바이저는 동일한 물리 하드웨어에서 실행되는 여러 운영 체제 (각각이 고유한 EL1에서)를 관리할 수 있습니다.
EL2는 가상화 환경의 격리 및 제어 기능을 제공합니다.
EL3 - 안전 모니터 모드:
이는 가장 높은 권한 수준으로 안전한 부팅 및 신뢰할 수 있는 실행 환경에 자주 사용됩니다.
EL3은 안전 및 비안전 상태 간의 액세스를 관리하고 제어할 수 있습니다 (안전한 부팅, 신뢰할 수 있는 OS 등).
이러한 수준의 사용은 사용자 응용 프로그램부터 가장 높은 권한을 갖는 시스템 소프트웨어까지 시스템의 다양한 측면을 구조화하고 안전하게 관리하는 방법을 제공합니다. ARMv8의 권한 수준 접근 방식은 다른 시스템 구성 요소를 효과적으로 격리하여 시스템의 보안성과 견고성을 향상시킵니다.
레지스터 (ARM64v8)
ARM64에는 x0
부터 x30
까지 레이블이 지정된 31개의 범용 레지스터가 있습니다. 각각은 64비트 (8바이트) 값을 저장할 수 있습니다. 32비트 값만 필요한 작업에 대해 동일한 레지스터를 사용하여 w0
부터 w30
까지의 이름을 사용하여 32비트 모드에서 액세스할 수 있습니다.
x0
~x7
- 이들은 일반적으로 스크래치 레지스터로 사용되며 서브루틴에 매개변수를 전달하는 데 사용됩니다.
**
x0
**은 또한 함수의 반환 데이터를 운반합니다.
x8
- Linux 커널에서x8
은svc
명령을 위한 시스템 호출 번호로 사용됩니다. macOS에서는 x16이 사용됩니다!x9
~x15
- 더 많은 임시 레지스터로서 종종 로컬 변수에 사용됩니다.x16
및x17
- 함수 내부 호출 레지스터. 즉시 값에 대한 임시 레지스터입니다. 간접 함수 호출 및 PLT (Procedure Linkage Table) 스텁에도 사용됩니다.
**
x16
**은 macOS에서svc
명령을 위한 시스템 호출 번호로 사용됩니다.
x18
- 플랫폼 레지스터. 일반 목적 레지스터로 사용될 수 있지만 일부 플랫폼에서는 이 레지스터가 플랫폼별 용도로 예약되어 있습니다: Windows의 현재 스레드 환경 블록을 가리키는 포인터 또는 리눅스 커널에서 현재 실행 중인 작업 구조체를 가리키는 포인터.x19
~x28
- 이들은 호출자 저장 레지스터입니다. 함수는 호출자를 위해 이러한 레지스터의 값을 보존해야 하므로 스택에 저장되고 호출자로 돌아가기 전에 복구됩니다.x29
- 프레임 포인터는 스택 프레임을 추적하는 데 사용됩니다. 함수가 호출되어 새로운 스택 프레임이 생성될 때x29
레지스터가 스택에 저장되고 새로운 프레임 포인터 주소 (sp
주소)가 이 레지스터에 저장됩니다.
이 레지스터는 일반 목적 레지스터로 사용될 수도 있지만 일반적으로 로컬 변수에 대한 참조로 사용됩니다.
x30
또는lr
- 링크 레지스터.BL
(Branch with Link) 또는BLR
(Register로 링크된 Branch) 명령을 실행할 때pc
값을 이 레지스터에 저장하여 반환 주소를 보유합니다.
다른 레지스터와 마찬가지로 사용할 수 있습니다.
현재 함수가 새로운 함수를 호출하고 따라서
lr
을 덮어쓸 것이라면, 시작 시lr
을 스택에 저장하고, 이것이 에필로그입니다 (stp x29, x30 , [sp, #-48]; mov x29, sp
->fp
와lr
저장, 공간 생성 및 새fp
얻기) 및 끝에 복구합니다. 이것이 프롤로그입니다 (ldp x29, x30, [sp], #48; ret
->fp
와lr
복구 및 반환).
sp
- 스택 포인터, 스택의 맨 위를 추적하는 데 사용됩니다.
sp
값은 항상 적어도 쿼드워드 정렬을 유지해야 하며 그렇지 않으면 정렬 예외가 발생할 수 있습니다.
pc
- 프로그램 카운터, 다음 명령을 가리킵니다. 이 레지스터는 예외 생성, 예외 반환 및 분기를 통해서만 업데이트될 수 있습니다. 이 레지스터를 읽을 수 있는 일반 명령은 브랜치 링크 명령 (BL, BLR)으로만pc
주소를lr
(링크 레지스터)에 저장할 수 있습니다.xzr
- 제로 레지스터. 32비트 레지스터 형태에서 **wzr
**로도 불립니다. 제로 값을 쉽게 얻거나 **subs
**를 사용하여 **xzr
**에 결과 데이터를 저장하지 않고 **subs XZR, Xn, #10
**과 같은 비교를 수행하는 데 사용할 수 있습니다.
Wn
레지스터는 Xn
레지스터의 32비트 버전입니다.
SIMD 및 부동 소수점 레지스터
또한 최적화된 단일 명령 다중 데이터 (SIMD) 작업 및 부동 소수점 산술을 수행하는 데 사용할 수 있는 128비트 길이의 32개 레지스터가 있습니다. 이러한 레지스터는 Vn 레지스터라고 불리지만 64비트, 32비트, 16비트 및 8비트에서도 작동할 수 있으며 Qn
, Dn
, Sn
, Hn
및 **Bn
**으로 불립니다.
시스템 레지스터
수백 개의 시스템 레지스터 또는 특수 목적 레지스터(SPR)는 프로세서 동작을 모니터링하고 제어하는 데 사용됩니다.
이러한 레지스터는 전용 특수 명령어 **mrs
**와 **msr
**을 사용하여만 읽거나 설정할 수 있습니다.
특수 레지스터 **TPIDR_EL0
**와 **TPIDDR_EL0
**은 역공학 시 자주 발견됩니다. EL0
접미사는 레지스터에 액세스할 수 있는 최소 예외를 나타냅니다(이 경우 EL0은 정규 예외(권한) 수준으로 일반 프로그램이 실행됩니다).
이들은 주로 메모리의 스레드 로컬 저장소 영역의 기본 주소를 저장하는 데 사용됩니다. 일반적으로 첫 번째 레지스터는 EL0에서 실행 중인 프로그램에 대해 읽기 및 쓰기가 가능하지만, 두 번째 레지스터는 EL0에서 읽을 수 있고 EL1에서 쓸 수 있습니다(커널과 같이).
mrs x0, TPIDR_EL0 ; TPIDR_EL0을 x0로 읽기
msr TPIDR_EL0, X0 ; x0를 TPIDR_EL0에 쓰기
PSTATE
PSTATE에는 운영 체제에서 볼 수 있는 SPSR_ELx
특수 레지스터로 직렬화된 여러 프로세스 구성 요소가 포함되어 있습니다. 여기에는 트리거된 예외의 권한 수준인 X가 포함됩니다(이를 통해 예외 종료 시 프로세스 상태를 복구할 수 있음).
다음과 같은 접근 가능한 필드가 있습니다:
N
,Z
,C
,V
조건 플래그:**
N
**은 작업이 음수 결과를 생성했음을 의미합니다.**
Z
**는 작업이 0을 생성했음을 의미합니다.**
C
**는 작업이 캐리되었음을 의미합니다.**
V
**는 작업이 부호 오버플로우를 생성했음을 의미합니다:두 양수의 합은 음수 결과를 생성합니다.
두 음수의 합은 양수 결과를 생성합니다.
뺄셈에서 큰 음수가 작은 양수에서 뺄셈되고 결과가 주어진 비트 크기의 범위 내에 표현할 수 없는 경우.
당연히 프로세서는 작업이 부호 있는지 여부를 알 수 없으므로 작업에서 C 및 V를 확인하고 부호 있는지 또는 부호 없는지에 따라 발생한 캐리를 나타냅니다.
모든 명령이 이러한 플래그를 업데이트하지는 않습니다. CMP
또는 **TST
**와 같은 일부 명령은 그렇지만, **ADDS
**와 같이 s 접미사가 있는 다른 명령도 그렇습니다.
현재 레지스터 너비(
nRW
) 플래그: 플래그가 값 0을 보유하면 프로그램은 다시 시작되면 AArch64 실행 상태에서 실행됩니다.현재 예외 수준(
EL
): EL0에서 실행 중인 일반 프로그램은 값 0을 갖습니다.단계별 실행 플래그(
SS
): 디버거가 단계별 실행을 위해SPSR_ELx
내의 SS 플래그를 1로 설정하는 데 사용됩니다. 프로그램은 한 단계를 실행하고 단계별 예외를 발생시킵니다.잘못된 예외 상태 플래그(
IL
): 특권 소프트웨어가 잘못된 예외 수준 전송을 수행할 때 사용되며, 이 플래그는 1로 설정되고 프로세서는 잘못된 상태 예외를 트리거합니다.DAIF
플래그: 이러한 플래그를 사용하면 특권 프로그램이 특정 외부 예외를 선택적으로 마스킹할 수 있습니다.**
A
**가 1이면 비동기 중단이 트리거됩니다. **I
**는 외부 하드웨어 인터럽트 요청에 응답하도록 구성하고 F는 빠른 인터럽트 요청과 관련이 있습니다.스택 포인터 선택 플래그(
SPS
): EL1 및 이상에서 실행 중인 특권 프로그램은 자체 스택 포인터 레지스터와 사용자 모델 스택 포인터 레지스터 사이를 전환할 수 있습니다(예:SP_EL1
및EL0
사이). 이 전환은SPSel
특수 레지스터에 쓰기를 통해 수행됩니다. EL0에서는 이 작업을 수행할 수 없습니다.
호출 규약 (ARM64v8)
ARM64 호출 규약에 따르면 함수에 전달되는 첫 번째 여덟 개의 매개변수는 x0
부터 x7
레지스터에 전달됩니다. 추가 매개변수는 스택에 전달됩니다. 반환 값은 레지스터 **x0
**에 반환되거나 128비트인 경우 **x1
**에도 반환됩니다. **x19
**부터 x30
및 sp
레지스터는 함수 호출 간에 보존되어야 합니다.
어셈블리에서 함수를 읽을 때 함수 프롤로그와 에필로그를 찾으세요. 프롤로그는 일반적으로 프레임 포인터(x29
)를 저장, 새 프레임 포인터 설정 및 스택 공간 할당을 포함합니다. 에필로그는 일반적으로 저장된 프레임 포인터를 복원하고 함수에서 반환하는 것을 포함합니다.
Swift의 호출 규약
Swift에는 자체 호출 규약이 있으며 https://github.com/apple/swift/blob/main/docs/ABI/CallConvSummary.rst#arm64에서 찾을 수 있습니다.
일반 명령어 (ARM64v8)
ARM64 명령어는 일반적으로 opcode dst, src1, src2
형식을 갖습니다. 여기서 **opcode
**는 수행할 작업(예: add
, sub
, mov
등)을 나타내며 **dst
**는 결과가 저장될 대상 레지스터이고 src1
및 **src2
**는 소스 레지스터입니다. 즉시 값은 소스 레지스터 대신 사용할 수도 있습니다.
mov
: 한 레지스터에서 다른 레지스터로 값 이동.예:
mov x0, x1
— 이는x1
의 값을x0
로 이동합니다.ldr
: 메모리에서 값 로드하여 레지스터로 이동.예:
ldr x0, [x1]
— 이는x1
이 가리키는 메모리 위치에서 값을x0
로 로드합니다.오프셋 모드: 원래 포인터에 영향을 주는 오프셋이 표시됩니다. 예를 들어:
ldr x2, [x1, #8]
, 이는 x1 + 8에서 x2로 값을 로드합니다.ldr x2, [x0, x1, lsl #2]
, 이는 x0의 배열에서 x1(인덱스) * 4 위치의 객체를 x2로 로드합니다.선행 인덱스 모드: 이는 원본에 계산을 적용하고 결과를 얻은 후 새 원본을 원본에 저장합니다.
ldr x2, [x1, #8]!
, 이는x1 + 8
을x2
에 로드하고x1 + 8
의 결과를x1
에 저장합니다.str lr, [sp, #-4]!
, 링크 레지스터를 sp에 저장하고 레지스터 sp를 업데이트합니다.후행 인덱스 모드: 이는 이전 모드와 유사하지만 메모리 주소에 액세스한 다음 오프셋을 계산하고 저장합니다.
ldr x0, [x1], #8
,x1
을x0
에 로드하고x1 + 8
로 x1을 업데이트합니다.PC 상대 주소 지정: 이 경우 로드할 주소는 현재 PC 레지스터와 관련하여 계산됩니다.
ldr x1, =_start
, 이는_start
심볼이 시작하는 주소를 현재 PC와 관련하여 x1에 로드합니다.str
: 레지스터의 값을 메모리에 저장합니다.예:
str x0, [x1]
— 이는x0
의 값을x1
이 가리키는 메모리 위치에 저장합니다.ldp
: 레지스터 쌍 로드. 이 명령은 연속된 메모리 위치에서 두 레지스터를 로드합니다. 메모리 주소는 일반적으로 다른 레지스터의 값에 오프셋을 추가하여 형성됩니다.예:
ldp x0, x1, [x2]
— 이는 각각x2
및x2 + 8
위치의 메모리에서x0
및x1
을 로드합니다.stp
: 레지스터 쌍 저장. 이 명령은 두 레지스터를 연속된 메모리 위치에 저장합니다. 메모리 주소는 일반적으로 다른 레지스터의 값에 오프셋을 추가하여 형성됩니다.예:
stp x0, x1, [sp]
— 이는 각각sp
및sp + 8
위치의 메모리에x0
및x1
을 저장합니다.stp x0, x1, [sp, #16]!
— 이는 각각sp+16
및sp + 24
위치의 메모리에x0
및x1
을 저장하고sp
를sp+16
로 업데이트합니다.add
: 두 레지스터의 값을 더하고 결과를 레지스터에 저장합니다.구문: add(s) Xn1, Xn2, Xn3 | #imm, [shift #N | RRX]
Xn1 -> 대상
Xn2 -> 피연산자 1
Xn3 | #imm -> 피연산자 2 (레지스터 또는 즉시값)
[shift #N | RRX] -> 시프트 또는 RRX 호출 수행
예:
add x0, x1, x2
— 이 명령은x1
과x2
의 값을 더하고 결과를x0
에 저장합니다.add x5, x5, #1, lsl #12
— 이는 4096에 해당합니다 (1을 12번 시프트한 값) -> 1 0000 0000 0000 0000adds
이 명령은add
를 수행하고 플래그를 업데이트합니다.sub
: 두 레지스터의 값을 빼고 결과를 레지스터에 저장합니다.add
구문을 확인하세요.예:
sub x0, x1, x2
— 이 명령은x1
에서x2
의 값을 빼고 결과를x0
에 저장합니다.subs
이 명령은 sub와 유사하지만 플래그를 업데이트합니다.mul
: 두 레지스터의 값을 곱하고 결과를 레지스터에 저장합니다.예:
mul x0, x1, x2
— 이 명령은x1
과x2
의 값을 곱하고 결과를x0
에 저장합니다.div
: 한 레지스터의 값을 다른 값으로 나누고 결과를 레지스터에 저장합니다.예:
div x0, x1, x2
— 이 명령은x1
의 값을x2
로 나누고 결과를x0
에 저장합니다.lsl
,lsr
,asr
,ror
,rrx
:논리 왼쪽 시프트: 끝에서 0을 추가하여 다른 비트를 앞쪽으로 이동 (n번 2를 곱함)
논리 오른쪽 시프트: 시작 부분에 1을 추가하여 다른 비트를 뒤로 이동 (부호 없는 경우 n번 2로 나눔)
산술 오른쪽 시프트: **
lsr
**와 유사하지만 최상위 비트가 1인 경우 1을 추가함 (부호 있는 경우 n번 2로 나눔)오른쪽으로 회전: **
lsr
**와 유사하지만 오른쪽에서 제거된 것은 왼쪽에 추가됨확장된 오른쪽 회전: **
ror
**와 유사하지만 캐리 플래그가 "가장 상위 비트"로 사용됨. 따라서 캐리 플래그가 비트 31로 이동되고 제거된 비트가 캐리 플래그로 이동함.bfm
: 비트 필드 이동, 이러한 작업은 값을 복사하고 해당 값을 다른 레지스터에 배치함. **#s
**는 가장 왼쪽 비트 위치를 지정하고 **#r
**은 오른쪽으로 회전하는 양을 지정함.비트 필드 이동:
BFM Xd, Xn, #r
부호 있는 비트 필드 이동:
SBFM Xd, Xn, #r, #s
부호 없는 비트 필드 이동:
UBFM Xd, Xn, #r, #s
비트 필드 추출 및 삽입: 레지스터에서 비트 필드를 복사하고 다른 레지스터로 복사함.
BFI X1, X2, #3, #4
X2에서 3번째 비트부터 4비트를 X1에 삽입함BFXIL X1, X2, #3, #4
X2의 3번째 비트에서 4비트를 추출하여 X1에 복사함SBFIZ X1, X2, #3, #4
X2에서 4비트를 부호 확장하여 X1에 삽입하고 오른쪽 비트를 0으로 만듦SBFX X1, X2, #3, #4
X2에서 3번째 비트부터 4비트를 추출하여 부호 확장하고 결과를 X1에 배치함UBFIZ X1, X2, #3, #4
X2에서 4비트를 0으로 확장하여 X1에 삽입하고 오른쪽 비트를 0으로 만듦UBFX X1, X2, #3, #4
X2에서 3번째 비트부터 4비트를 추출하여 0으로 확장된 결과를 X1에 배치함.X로 확장된 부호: 값을 확장하여 부호를 추가함 (또는 부호 없는 버전에서는 0을 추가함):
SXTB X1, W2
W2에서 X1로 바이트의 부호를 확장함 (W2
는X2
의 절반)SXTH X1, W2
W2에서 X1로 16비트 숫자의 부호를 확장함SXTW X1, W2
W2에서 X1로 바이트의 부호를 확장함UXTB X1, W2
W2에서 X1로 바이트에 0을 추가하여 확장함extr
: 연결된 특정 레지스터 쌍에서 비트를 추출함.예:
EXTR W3, W2, W1, #3
이 명령은 W1+W2를 연결하고 W2의 3번째 비트부터 W1의 3번째 비트까지 가져와 W3에 저장함.cmp
: 두 레지스터를 비교하고 조건 플래그를 설정함. 목적 레지스터를 제로 레지스터로 설정하는subs
의 별칭임.m == n
인지 확인하는 데 유용함.subs
와 동일한 구문을 지원함예:
cmp x0, x1
— 이 명령은x0
와x1
의 값을 비교하고 조건 플래그를 설정함.cmn
: 음수 비교 피연산자. 이 경우adds
의 별칭이며 동일한 구문을 지원함.m == -n
인지 확인하는 데 유용함.ccmp
: 조건부 비교, 이전 비교가 참인 경우에만 수행되는 비교로 특정하게 nzcv 비트를 설정함.cmp x1, x2; ccmp x3, x4, 0, NE; blt _func
-> x1 != x2이고 x3 < x4인 경우 _func으로 이동함이는 이전
cmp
가NE
인 경우에만ccmp
가 실행되므로 비트nzcv
가 0으로 설정됨 (blt
비교를 만족시키지 않음).이는
ccmn
으로도 사용할 수 있음 (cmp
vscmn
과 유사함).tst
: 비교 값 중 어느 값이 1인지 확인함 (결과를 저장하지 않고 ANDS처럼 작동함). 값이 1인 레지스터의 비트를 확인하는 데 유용함.예:
tst X1, #7
X1의 마지막 3비트 중 어느 비트가 1인지 확인함teq
: 결과를 버리고 XOR 연산을 수행함b
: 조건 없는 분기예:
b myFunction
이는 링크 레지스터를 반환 주소로 채우지 않음 (되돌아가야 하는 서브루틴 호출에 적합하지 않음)
bl
: 링크가 포함된 분기, 서브루틴을 호출하는 데 사용됨. **x30
에 반환 주소를 저장함.예:
bl myFunction
— 이 명령은myFunction
함수를 호출하고 반환 주소를x30
에 저장함.이는 링크 레지스터를 반환 주소로 채우지 않음 (되돌아가야 하는 서브루틴 호출에 적합하지 않음)
blr
: 레지스터로 링크가 포함된 분기, 레지스터에 지정된 대상을 호출하는 데 사용됨. 반환 주소를x30
에 저장함. (이는예:
blr x1
— 이 명령은x1
에 포함된 주소의 함수를 호출하고 반환 주소를x30
에 저장함.ret
: 서브루틴에서 반환, 일반적으로 **x30
**에 있는 반환 주소를 사용함.예:
ret
— 이 명령은 현재 서브루틴에서x30
에 있는 반환 주소를 사용하여 반환함.b.<cond>
: 조건부 분기b.eq
: 동일한 경우 분기, 이전cmp
명령을 기반으로 함.예:
b.eq label
— 이전cmp
명령에서 두 값이 동일한 경우label
로 이동함.b.ne
: 같지 않으면 분기. 이 명령은 조건 플래그를 확인하고(이전 비교 명령에 의해 설정됨), 비교된 값이 같지 않으면 레이블이나 주소로 분기합니다.예:
cmp x0, x1
명령 후,b.ne label
— 만약x0
와x1
의 값이 같지 않으면label
로 이동합니다.cbz
: 0일 때 비교하고 분기. 이 명령은 레지스터를 0과 비교하고, 같으면 레이블이나 주소로 분기합니다.예:
cbz x0, label
— 만약x0
의 값이 0이면label
로 이동합니다.cbnz
: 0이 아닐 때 비교하고 분기. 이 명령은 레지스터를 0과 비교하고, 같지 않으면 레이블이나 주소로 분기합니다.예:
cbnz x0, label
— 만약x0
의 값이 0이 아니면label
로 이동합니다.tbnz
: 비트 테스트하고 0이 아닐 때 분기예:
tbnz x0, #8, label
tbz
: 비트 테스트하고 0일 때 분기예:
tbz x0, #8, label
조건 선택 연산: 조건 비트에 따라 동작이 달라지는 연산들입니다.
csel Xd, Xn, Xm, cond
->csel X0, X1, X2, EQ
-> 참이면 X0 = X1, 거짓이면 X0 = X2csinc Xd, Xn, Xm, cond
-> 참이면 Xd = Xn, 거짓이면 Xd = Xm + 1cinc Xd, Xn, cond
-> 참이면 Xd = Xn + 1, 거짓이면 Xd = Xncsinv Xd, Xn, Xm, cond
-> 참이면 Xd = Xn, 거짓이면 Xd = NOT(Xm)cinv Xd, Xn, cond
-> 참이면 Xd = NOT(Xn), 거짓이면 Xd = Xncsneg Xd, Xn, Xm, cond
-> 참이면 Xd = Xn, 거짓이면 Xd = - Xmcneg Xd, Xn, cond
-> 참이면 Xd = - Xn, 거짓이면 Xd = Xncset Xd, Xn, Xm, cond
-> 참이면 Xd = 1, 거짓이면 Xd = 0csetm Xd, Xn, Xm, cond
-> 참이면 Xd = <all 1>, 거짓이면 Xd = 0adrp
: 심볼의 페이지 주소를 계산하고 레지스터에 저장합니다.예:
adrp x0, symbol
— 이 명령은symbol
의 페이지 주소를 계산하고x0
에 저장합니다.ldrsw
: 메모리에서 부호 있는 32비트 값을 로드하고 64비트로 부호 확장합니다.예:
ldrsw x0, [x1]
— 이 명령은x1
이 가리키는 메모리 위치에서 부호 있는 32비트 값을 로드하고 64비트로 부호 확장하여x0
에 저장합니다.stur
: 레지스터 값을 메모리 위치에 저장, 다른 레지스터의 오프셋을 사용합니다.예:
stur x0, [x1, #4]
— 이 명령은x1
에 현재 주소보다 4바이트 더 큰 메모리 주소에 있는 값을x0
에 저장합니다.svc
: 시스템 호출을 수행합니다. "Supervisor Call"의 약자입니다. 프로세서가 이 명령을 실행하면 사용자 모드에서 커널 모드로 전환하고, 커널의 시스템 호출 처리 코드가 있는 메모리의 특정 위치로 이동합니다.예:
함수 프롤로그
링크 레지스터와 프레임 포인터를 스택에 저장:
새 프레임 포인터 설정:
mov x29, sp
(현재 함수에 대한 새 프레임 포인터 설정)로컬 변수를 위한 스택에 공간 할당 (필요한 경우):
sub sp, sp, <size>
(는 필요한 바이트 수)
함수 에필로그
로컬 변수 해제 (할당된 경우):
add sp, sp, <size>
링크 레지스터 및 프레임 포인터 복원:
리턴:
ret
(링크 레지스터의 주소를 사용하여 호출자에게 제어를 반환)
AARCH32 실행 상태
Armv8-A는 32비트 프로그램의 실행을 지원합니다. AArch32는 두 개의 명령어 세트 중 하나에서 실행할 수 있으며 A32
및 **T32
**로 전환하여 **상호 운용
**을 통해 전환할 수 있습니다.
특권을 가진 64비트 프로그램은 32비트 프로그램의 실행을 스케줄링할 수 있습니다. 이는 낮은 특권을 가진 32비트로 예외 수준 전환을 실행함으로써 수행됩니다.
64비트에서 32비트로의 전환은 예외 수준의 낮아짐으로 발생합니다(예: EL1에서 EL0의 프로그램을 트리거하는 64비트 프로그램). 이는 AArch32
프로세스 스레드가 실행 준비가 되었을 때 SPSR_ELx
특수 레지스터의 비트 4를 1로 설정하여 수행되며, SPSR_ELx
의 나머지 부분은 AArch32
프로그램의 CPSR을 저장합니다. 그런 다음 특권 있는 프로세스는 ERET
명령을 호출하여 프로세서가 **AArch32
**로 전환되어 CPSR에 따라 A32 또는 T32로 진입합니다**.**
**상호 운용
**은 CPSR의 J 및 T 비트를 사용하여 발생합니다. J=0
및 T=0
은 **A32
**를 의미하며, J=0
및 T=1
은 T32를 의미합니다. 이는 기본적으로 명령어 세트가 T32임을 나타내기 위해 가장 낮은 비트를 1로 설정하는 것을 의미합니다.
이는 상호 운용 분기 명령어에서 설정되지만, PC가 대상 레지스터로 설정될 때 다른 명령어로 직접 설정할 수도 있습니다. 예시:
또 다른 예시:
레지스터
32비트 레지스터가 16개 있습니다 (r0-r15). r0부터 r14까지는 어떤 작업에도 사용할 수 있지만, 일부는 일반적으로 예약되어 있습니다:
r15
: 프로그램 카운터 (항상). 다음 명령의 주소를 포함합니다. A32에서는 현재 + 8, T32에서는 현재 + 4입니다.r11
: 프레임 포인터r12
: 프로시저 내부 호출 레지스터r13
: 스택 포인터r14
: 링크 레지스터
또한, 레지스터는 **은행 레지스트리
**에 백업됩니다. 이는 레지스터 값을 저장하여 예외 처리 및 특권 작업에서 빠른 컨텍스트 전환을 수행할 수 있도록 하여 매번 레지스터를 수동으로 저장하고 복원할 필요가 없게 합니다.
이는 예외가 발생한 프로세서 모드의 CPSR
에서 프로세서 상태를 SPSR
로 저장함으로써 수행됩니다. 예외가 반환되면 **CPSR
**이 **SPSR
**에서 복원됩니다.
CPSR - 현재 프로그램 상태 레지스터
AArch32에서 CPSR은 AArch64의 **PSTATE
**와 유사하게 작동하며, 예외가 발생하여 나중에 실행을 복원할 때 **SPSR_ELx
**에도 저장됩니다:
필드는 몇 가지 그룹으로 나뉩니다:
Application Program Status Register (APSR): 산술 플래그 및 EL0에서 접근 가능
실행 상태 레지스터: 프로세스 동작 (운영 체제에 의해 관리됨).
Application Program Status Register (APSR)
N
,Z
,C
,V
플래그 (AArch64와 동일)Q
플래그: 전문화된 포화 산술 명령 실행 중 정수 포화가 발생할 때 1로 설정됩니다. 한 번 **1
**로 설정되면 수동으로 0으로 설정될 때까지 유지됩니다. 또한, 그 값을 암시적으로 확인하는 명령이 없으므로 수동으로 읽어야 합니다.GE
(이상 또는 같음) 플래그: SIMD (단일 명령, 다중 데이터) 작업에서 사용됩니다. "병렬 덧셈" 및 "병렬 뺄셈"과 같은 이러한 작업은 한 번에 여러 데이터 포인트를 처리할 수 있습니다.
예를 들어, UADD8
명령은 병렬로 바이트 네 쌍을 (두 32비트 피연산자에서) 더하고 결과를 32비트 레지스터에 저장합니다. 그런 다음 이러한 결과를 기반으로 **APSR
**의 GE
플래그를 설정합니다. 각 GE 플래그는 해당 바이트 쌍에 대한 덧셈이 오버플로우되었는지를 나타냅니다.
SEL
명령은 이러한 GE 플래그를 사용하여 조건부 작업을 수행합니다.
실행 상태 레지스터
J
및T
비트: **J
**는 0이어야 하며 **T
**가 0이면 A32 명령 세트가 사용되고, 1이면 T32가 사용됩니다.IT 블록 상태 레지스터 (
ITSTATE
): 10-15 및 25-26 비트입니다.IT
접두어 그룹 내의 명령에 대한 조건을 저장합니다.E
비트: 엔디안을 나타냅니다.모드 및 예외 마스크 비트 (0-4): 현재 실행 상태를 결정합니다. 5번째 비트는 프로그램이 32비트(1) 또는 64비트(0)로 실행되는지를 나타냅니다. 다른 4개는 현재 사용 중인 예외 모드를 나타냅니다 (예외가 발생하고 처리 중일 때). 숫자 세트는 이 처리 중에 다른 예외가 트리거될 경우 현재 우선 순위를 나타냅니다.
AIF
: 비트A
,I
,F
를 사용하여 특정 예외를 비활성화할 수 있습니다. **A
**가 1이면 비동기 중단이 트리거됩니다. **I
**는 외부 하드웨어 인터럽트 요청 (IRQ)에 응답하도록 구성하고 F는 빠른 인터럽트 요청 (FIR)과 관련이 있습니다.
macOS
BSD 시스템 호출
syscalls.master를 확인하세요. BSD 시스템 호출은 x16 > 0일 것입니다.
Mach Traps
syscall_sw.c에서 mach_trap_table
을 확인하고 mach_traps.h에서 프로토 타입을 확인하세요. Mach traps의 최대 수는 MACH_TRAP_TABLE_COUNT
= 128입니다. Mach traps는 x16 < 0이므로 이전 목록의 숫자를 음수로 호출해야 합니다: **_kernelrpc_mach_vm_allocate_trap
**은 **-10
**입니다.
또한 이러한 (및 BSD) 시스템 호출을 어떻게 호출할지 알아보려면 **libsystem_kernel.dylib
**를 디스어셈블러에서 확인할 수 있습니다:
가끔은 **libsystem_kernel.dylib
**에서 디컴파일된 코드를 확인하는 것이 소스 코드를 확인하는 것보다 쉬울 수 있습니다. 왜냐하면 여러 시스템 호출 (BSD 및 Mach)의 코드는 스크립트를 통해 생성되기 때문에 (소스 코드의 주석을 확인하십시오) dylib에서 호출되는 내용을 찾을 수 있습니다.
machdep 호출
XNU는 또 다른 유형의 호출인 machine dependent를 지원합니다. 이러한 호출의 수는 아키텍처에 따라 다르며 호출 또는 번호가 일정하게 유지되는 것은 보장되지 않습니다.
comm 페이지
이는 모든 사용자 프로세스의 주소 공간에 매핑된 커널 소유 메모리 페이지입니다. 사용자 모드에서 커널 공간으로의 전환을 시스템 호출을 사용하는 것보다 빠르게 만들기 위해 사용됩니다. 이러한 전환은 매우 비효율적일 수 있습니다.
예를 들어, gettimeofdate
호출은 timeval
의 값을 comm 페이지에서 직접 읽습니다.
objc_msgSend
Objective-C 또는 Swift 프로그램에서이 함수를 자주 찾을 수 있습니다. 이 함수를 사용하면 Objective-C 객체의 메서드를 호출할 수 있습니다.
매개변수 (자세한 정보는 문서에서 확인):
x0: self -> 인스턴스에 대한 포인터
x1: op -> 메서드의 셀렉터
x2... -> 호출된 메서드의 나머지 인수
따라서이 함수로의 분기 전에 중단점을 설정하면 lldb에서 쉽게 호출되는 내용을 찾을 수 있습니다 (이 예에서 객체는 NSConcreteTask
의 객체를 호출하여 명령을 실행합니다).
환경 변수 NSObjCMessageLoggingEnabled=1
을 설정하면 /tmp/msgSends-pid
와 같은 파일에이 함수가 호출될 때 로깅할 수 있습니다.
셸 코드
컴파일하려면:
바이트를 추출하려면:
새로운 macOS를 위한:
Last updated