macOS Universal binaries & Mach-O Format
Last updated
Last updated
Naučite i vežbajte hakovanje AWS-a:HackTricks Training AWS Red Team Expert (ARTE) Naučite i vežbajte hakovanje GCP-a: HackTricks Training GCP Red Team Expert (GRTE)
Mac OS binarni fajlovi obično su kompajlirani kao univerzalni binarni fajlovi. Univerzalni binarni fajl može podržavati više arhitektura u istom fajlu.
Ovi binarni fajlovi prate Mach-O strukturu koja se uglavnom sastoji od:
Zaglavlje
Učitane komande
Podaci
Pretražite fajl sa: mdfind fat.h | grep -i mach-o | grep -E "fat.h$"
Zaglavlje ima magične bajtove praćene brojem arhitektura koje fajl sadrži (nfat_arch
) i svaka arhitektura će imati fat_arch
strukturu.
Proverite sa:
ili korišćenjem alata Mach-O View:
Kao što možda mislite, obično univerzalni binarni fajl kompajliran za 2 arhitekture udvostručuje veličinu onog kompajliranog samo za 1 arhitekturu.
Zaglavlje sadrži osnovne informacije o fajlu, kao što su magični bajtovi za identifikaciju kao Mach-O fajl i informacije o ciljnoj arhitekturi. Možete ga pronaći u: mdfind loader.h | grep -i mach-o | grep -E "loader.h$"
Postoje različite vrste fajlova, možete ih pronaći definisane u izvornom kodu na primer ovde. Najvažnije su:
MH_OBJECT
: Objektni fajl sa premeštanjem (međufazi kompilacije, još uvek nisu izvršni fajlovi).
MH_EXECUTE
: Izvršni fajlovi.
MH_FVMLIB
: Fiksna VM biblioteka.
MH_CORE
: Dump fajlovi koda.
MH_PRELOAD
: Prethodno učitani izvršni fajl (više nije podržan u XNU).
MH_DYLIB
: Dinamičke biblioteke.
MH_DYLINKER
: Dinamički linker.
MH_BUNDLE
: "Fajlovi dodataka". Generisani korišćenjem -bundle u gcc i eksplicitno učitani pomoću NSBundle
ili dlopen
.
MH_DYSM
: Pratni .dSym
fajl (fajl sa simbolima za debagovanje).
MH_KEXT_BUNDLE
: Kernel ekstenzije.
Ili koristeći Mach-O View:
Izvorni kod takođe definiše nekoliko zastava korisnih za učitavanje biblioteka:
MH_NOUNDEFS
: Bez nedefinisanih referenci (potpuno povezano)
MH_DYLDLINK
: Dyld povezivanje
MH_PREBOUND
: Dinamičke reference unapred povezane.
MH_SPLIT_SEGS
: Datoteka deli r/o i r/w segmente.
MH_WEAK_DEFINES
: Binarni ima slabo definisane simbole
MH_BINDS_TO_WEAK
: Binarni koristi slabe simbole
MH_ALLOW_STACK_EXECUTION
: Čini stek izvršivim
MH_NO_REEXPORTED_DYLIBS
: Biblioteka bez LC_REEXPORT komandi
MH_PIE
: Izvršivi nezavisni od položaja
MH_HAS_TLV_DESCRIPTORS
: Postoji odeljak sa lokalnim promenljivama niti
MH_NO_HEAP_EXECUTION
: Bez izvršavanja za stranice heap/podataka
MH_HAS_OBJC
: Binarni ima oBject-C odeljke
MH_SIM_SUPPORT
: Podrška za simulator
MH_DYLIB_IN_CACHE
: Korišćeno na dylibs/frameworks u deljenom kešu biblioteka.
Raspored datoteke u memoriji je ovde naveden, detalji o lokaciji tabele simbola, kontekst glavne niti pri pokretanju izvršavanja, i potrebne deljene biblioteke. Instrukcije su pružene dinamičkom učitavaču (dyld) o procesu učitavanja binarnog koda u memoriju.
Koristi se struktura load_command, definisana u pomenutom loader.h
:
Postoje oko 50 različitih tipova komandi za učitavanje koje sistem obrađuje na različite načine. Najčešće korištene su: LC_SEGMENT_64
, LC_LOAD_DYLINKER
, LC_MAIN
, LC_LOAD_DYLIB
i LC_CODE_SIGNATURE
.
Ovaj tip Load Command-a definiše kako učitati __TEXT (izvršni kod) i __DATA (podatke za proces) segmente prema ofsetima naznačenim u Data sekciji prilikom izvršavanja binarnog fajla.
Ove komande definišu segmente koji su mapirani u virtuelni memorijski prostor procesa prilikom izvršavanja.
Postoje različite vrste segmenata, kao što je __TEXT segment, koji sadrži izvršni kod programa, i __DATA segment, koji sadrži podatke korišćene od strane procesa. Ovi segmenti se nalaze u data sekciji Mach-O fajla.
Svaki segment može biti dodatno podeljen u više sekcija. Struktura load komande sadrži informacije o ovim sekcijama unutar odgovarajućeg segmenta.
U zaglavlju prvo nalazite zaglavlje segmenta:
Primer zaglavlja segmenta:
Ovo zaglavlje definiše broj sekcija čiji zaglavlji slede nakon njega:
Primer naslova odeljka:
Ako dodate pomeraj odeljka (0x37DC) + pomeraj gde arhiva počinje, u ovom slučaju 0x18000
--> 0x37DC + 0x18000 = 0x1B7DC
Takođe je moguće dobiti informacije o zaglavljima sa komandne linije pomoću:
Uobičajeni segmenti učitani ovom komandom:
__PAGEZERO
: Nalaže jezgru da mapira adresu nula tako da se ne može čitati, pisati ili izvršavati. Maxprot i minprot promenljive u strukturi postavljene su na nulu da bi se naznačilo da nema prava za čitanje-pisanje-izvršavanje na ovoj stranici.
Ova alokacija je važna za smanjenje ranjivosti nul pokazivača. To je zato što XNU sprovodi tvrdu stranicu nula koja osigurava da je prva stranica memorije nedostupna (osim na i386). Binarni fajl može ispuniti ove zahteve kreiranjem male __PAGEZERO (koristeći -pagezero_size
) da pokrije prvih 4k i imajući ostatak memorije od 32 bita dostupan i u korisničkom i u režimu jezgre.
__TEXT
: Sadrži izvršni kod sa dozvolama za čitanje i izvršavanje (bez mogućnosti pisanja). Uobičajeni delovi ovog segmenta:
__text
: Kompajlirani binarni kod
__const
: Konstantni podaci (samo za čitanje)
__[c/u/os_log]string
: Konstante niski C, Unicode ili os logova
__stubs
i __stubs_helper
: Uključeni tokom procesa učitavanja dinamičkih biblioteka
__unwind_info
: Podaci o odmotavanju steka.
Imajte na umu da je sav ovaj sadržaj potpisan ali označen i kao izvršan (stvarajući više opcija za eksploataciju delova koji ne moraju nužno imati ovu privilegiju, poput delova posvećenih niskama).
__DATA
: Sadrži podatke koji su čitljivi i pisivi (bez mogućnosti izvršavanja).
__got:
Globalna tabela offseta
__nl_symbol_ptr
: Pokazivač simbola koji nije lenj (vezivanje pri učitavanju)
__la_symbol_ptr
: Lenj (vezivanje pri upotrebi) pokazivač simbola
__const
: Trebalo bi da budu podaci samo za čitanje (ali nisu)
__cfstring
: CoreFoundation niske
__data
: Globalne promenljive (koje su inicijalizovane)
__bss
: Statičke promenljive (koje nisu inicijalizovane)
__objc_*
(__objc_classlist, __objc_protolist, itd): Informacije koje koristi Objective-C runtime
__DATA_CONST
: __DATA.__const nije garantovano konstantan (dozvole za pisanje), niti su to ostali pokazivači i GOT. Ovaj odeljak čini __const
, neki inicijalizatori i GOT tabela (jednom kada se reši) samo za čitanje koristeći mprotect
.
__LINKEDIT
: Sadrži informacije za linkera (dyld) kao što su, simbol, niska i unosi tabele premeštanja. To je generički kontejner za sadržaje koji nisu ni u __TEXT
ni u __DATA
i njen sadržaj je opisan u drugim komandama učitavanja.
Informacije dyld-a: Rebase, Opcije vezivanja koje nisu lenje/lenje/slabo i informacije o izvozu
Početak funkcija: Tabela početnih adresa funkcija
Podaci u kodu: Podaci u ostrvima u __text
Tabela simbola: Simboli u binarnom fajlu
Indirektna tabela simbola: Pokazivači/stub simboli
Tabela niski
Potpis koda
__OBJC
: Sadrži informacije koje koristi Objective-C runtime. Iako se ove informacije mogu naći i u segmentu __DATA, unutar različitih odeljaka u __objc_* sekcijama.
__RESTRICT
: Segment bez sadržaja sa jednim odeljkom nazvanim __restrict
(takođe prazan) koji osigurava da prilikom pokretanja binarnog fajla, ignorisaće DYLD okružne promenljive.
Kako je bilo moguće videti u kodu, segmenti takođe podržavaju zastave (iako se ne koriste mnogo):
SG_HIGHVM
: Samo jezgro (ne koristi se)
SG_FVMLIB
: Ne koristi se
SG_NORELOC
: Segment nema premeštanje
SG_PROTECTED_VERSION_1
: Enkripcija. Korišćeno na primer od strane Finder-a za enkripciju teksta u __TEXT
segmentu.
LC_UNIXTHREAD/LC_MAIN
LC_MAIN
sadrži ulaznu tačku u entryoff atributu. Prilikom učitavanja, dyld jednostavno dodaje ovu vrednost na (u memoriji) bazu binarnog fajla, zatim skoči na ovu instrukciju da započne izvršavanje koda binarnog fajla.
LC_UNIXTHREAD
sadrži vrednosti koje registri moraju imati prilikom pokretanja glavne niti. Ovo je već zastarelo ali dyld
i dalje koristi. Moguće je videti vrednosti registara postavljene ovim sa:
LC_CODE_SIGNATURE
Sadrži informacije o potpisu koda Mach-O fajla. Sadrži samo offset koji ukazuje na blok potpisa. Obično se nalazi na samom kraju fajla. Međutim, možete pronaći neke informacije o ovoj sekciji u ovom blog postu i ovom gistu.
LC_ENCRYPTION_INFO[_64]
Podrška za enkripciju binarnih fajlova. Međutim, naravno, ako napadač uspe da kompromituje proces, moći će da izvuče memoriju nešifrovanu.
LC_LOAD_DYLINKER
Sadrži putanju do izvršne datoteke dinamičkog linkera koja mapira deljene biblioteke u adresni prostor procesa. Vrednost je uvek postavljena na /usr/lib/dyld
. Važno je napomenuti da se u macOS-u mapiranje dylib-a dešava u korisničkom režimu, a ne u režimu jezgra.
LC_IDENT
Zastarelo, ali kada je konfigurisano da generiše dump-ove prilikom panike, kreiran je Mach-O core dump i verzija jezgra je postavljena u LC_IDENT
komandi.
LC_UUID
Slučajni UUID. Koristan je direktno, ali XNU ga kešira sa ostalim informacijama o procesu. Može se koristiti u izveštajima o padovima.
LC_DYLD_ENVIRONMENT
Omogućava da se naznače okružne promenljive dyld-u pre nego što se proces izvrši. Ovo može biti veoma opasno jer može omogućiti izvršavanje proizvoljnog koda unutar procesa, pa se ova komanda učitavanja koristi samo u dyld-u izgrađenom sa #define SUPPORT_LC_DYLD_ENVIRONMENT
i dodatno ograničava obradu samo na promenljive oblika DYLD_..._PATH
koje specificiraju putanje učitavanja.
LC_LOAD_DYLIB
Ova komanda učitavanja opisuje zavisnost dinamičke biblioteke koja nalaže loaderu (dyld) da učita i poveže navedenu biblioteku. Postoji LC_LOAD_DYLIB
komanda učitavanja za svaku biblioteku koju Mach-O binarni fajl zahteva.
Ova komanda učitavanja je struktura tipa dylib_command
(koja sadrži strukturu dylib, opisuje stvarnu zavisnu dinamičku biblioteku):
Ove informacije takođe možete dobiti putem komandne linije sa:
Neke potencijalno zlonamerne biblioteke su:
DiskArbitration: Praćenje USB drajvova
AVFoundation: Snimanje zvuka i videa
CoreWLAN: Skeniranje WiFi mreža.
Mach-O binarni fajl može sadržati jedan ili više konstruktora, koji će biti izvršeni pre adrese navedene u LC_MAIN. Ofseti bilo kog konstruktora se čuvaju u sekciji __mod_init_func segmenta __DATA_CONST.
U osnovi fajla leži područje podataka, koje se sastoji od nekoliko segmenata definisanih u regionu komandi učitavanja. Različite sekcije podataka mogu biti smeštene unutar svakog segmenta, pri čemu svaka sekcija sadrži kod ili podatke specifične za tip.
Podaci su zapravo deo koji sadrži sve informacije koje se učitavaju pomoću komandi učitavanja LC_SEGMENTS_64
To uključuje:
Tabela funkcija: Koja sadrži informacije o funkcijama programa.
Tabela simbola: Koja sadrži informacije o eksternim funkcijama koje koristi binarni fajl
Takođe može sadržati interne funkcije, imena promenljivih i još mnogo toga.
Za proveru možete koristiti alat Mach-O View:
Ili putem komandne linije:
U segmentu __TEXT
(r-x):
__objc_classname
: Imena klasa (stringovi)
__objc_methname
: Imena metoda (stringovi)
__objc_methtype
: Tipovi metoda (stringovi)
U segmentu __DATA
(rw-):
__objc_classlist
: Pokazivači na sve Objektno-C klase
__objc_nlclslist
: Pokazivači na Non-Lazy Objektno-C klase
__objc_catlist
: Pokazivač na kategorije
__objc_nlcatlist
: Pokazivač na Non-Lazy kategorije
__objc_protolist
: Lista protokola
__objc_const
: Konstantni podaci
__objc_imageinfo
, __objc_selrefs
, objc__protorefs
...
_swift_typeref
, _swift3_capture
, _swift3_assocty
, _swift3_types, _swift3_proto
, _swift3_fieldmd
, _swift3_builtin
, _swift3_reflstr