XXE - XEE - XML External Entity
Conceitos Básicos de XML
XML é uma linguagem de marcação projetada para armazenamento e transporte de dados, apresentando uma estrutura flexível que permite o uso de tags com nomes descritivos. Difere do HTML por não estar limitado a um conjunto de tags predefinidas. A importância do XML diminuiu com o aumento do JSON, apesar de seu papel inicial na tecnologia AJAX.
Representação de Dados por Meio de Entidades: As entidades em XML permitem a representação de dados, incluindo caracteres especiais como
<
e>
, que correspondem a<
e>
para evitar conflitos com o sistema de tags do XML.Definição de Elementos XML: XML permite a definição de tipos de elementos, delineando como os elementos devem ser estruturados e que conteúdo podem conter, variando de qualquer tipo de conteúdo a elementos filhos específicos.
Definição de Tipo de Documento (DTD): As DTDs são cruciais no XML para definir a estrutura do documento e os tipos de dados que pode conter. Podem ser internas, externas ou uma combinação, orientando como os documentos são formatados e validados.
Entidades Personalizadas e Externas: XML suporta a criação de entidades personalizadas dentro de uma DTD para representação flexível de dados. Entidades externas, definidas com uma URL, levantam preocupações de segurança, especialmente no contexto de ataques de Entidade Externa XML (XXE), que exploram a forma como os analisadores XML lidam com fontes de dados externas:
<!DOCTYPE foo [ <!ENTITY myentity "value" > ]>
Detecção de XXE com Entidades de Parâmetro: Para detectar vulnerabilidades de XXE, especialmente quando métodos convencionais falham devido a medidas de segurança do analisador, podem ser utilizadas entidades de parâmetro XML. Essas entidades permitem técnicas de detecção fora de banda, como acionar pesquisas DNS ou solicitações HTTP para um domínio controlado, para confirmar a vulnerabilidade.
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "file:///etc/passwd" > ]>
<!DOCTYPE foo [ <!ENTITY ext SYSTEM "http://attacker.com" > ]>
Principais ataques
Novo teste de Entidade
Neste ataque, vou testar se uma simples declaração de nova ENTIDADE está funcionando
Ler arquivo
Vamos tentar ler o arquivo /etc/passwd
de diferentes maneiras. Para o Windows, você poderia tentar ler: C:\windows\system32\drivers\etc\hosts
Neste primeiro caso, observe que o sistema "**file:///**etc/passwd" também funcionará.
Este segundo caso deve ser útil para extrair um arquivo se o servidor web estiver usando PHP (Não é o caso dos laboratórios do Portswiggers)
Neste terceiro caso, observe que estamos declarando o Element stockCheck
como ANY.
Listagem de diretórios
Em aplicações baseadas em Java, pode ser possível listar o conteúdo de um diretório via XXE com um payload como (apenas solicitando o diretório em vez do arquivo):
SSRF
Um XXE poderia ser usado para abusar de um SSRF dentro de um ambiente de nuvem
SSRF Cego
Usando a técnica anteriormente comentada você pode fazer o servidor acessar um servidor que você controla para mostrar que ele é vulnerável. Mas, se isso não estiver funcionando, talvez seja porque entidades XML não são permitidas, nesse caso você poderia tentar usar entidades de parâmetros XML:
"Cego" SSRF - Exfiltrar dados fora de banda
Nesta ocasião, vamos fazer o servidor carregar um novo DTD com um payload malicioso que enviará o conteúdo de um arquivo via solicitação HTTP (para arquivos de várias linhas, você pode tentar exfiltrá-lo via _ftp://_ usando este servidor básico, por exemplo xxe-ftp-server.rb). Esta explicação é baseada no laboratório da Portswigger aqui.
No DTD malicioso fornecido, uma série de etapas são realizadas para exfiltrar dados:
Exemplo de DTD Malicioso:
A estrutura é a seguinte:
Os passos executados por esta DTD incluem:
Definição de Entidades de Parâmetro:
Uma entidade de parâmetro XML,
%file
, é criada, lendo o conteúdo do arquivo/etc/hostname
.Outra entidade de parâmetro XML,
%eval
, é definida. Ela declara dinamicamente uma nova entidade de parâmetro XML,%exfiltrate
. A entidade%exfiltrate
é configurada para fazer uma solicitação HTTP para o servidor do atacante, passando o conteúdo da entidade%file
na string de consulta da URL.
Execução de Entidades:
A entidade
%eval
é utilizada, levando à execução da declaração dinâmica da entidade%exfiltrate
.A entidade
%exfiltrate
é então usada, desencadeando uma solicitação HTTP para a URL especificada com o conteúdo do arquivo.
O atacante hospeda esta DTD maliciosa em um servidor sob seu controle, tipicamente em uma URL como http://web-attacker.com/malicious.dtd
.
Carga Útil XXE: Para explorar uma aplicação vulnerável, o atacante envia uma carga útil XXE:
Este payload define uma entidade de parâmetro XML %xxe
e a incorpora dentro do DTD. Quando processado por um analisador XML, este payload busca o DTD externo no servidor do atacante. O analisador então interpreta o DTD inline, executando as etapas descritas no DTD malicioso e levando à exfiltração do arquivo /etc/hostname
para o servidor do atacante.
Baseado em Erro (DTD Externo)
Neste caso, faremos o servidor carregar um DTD malicioso que mostrará o conteúdo de um arquivo dentro de uma mensagem de erro (isso é válido apenas se você puder ver mensagens de erro). Exemplo daqui.
Uma mensagem de erro de análise XML, revelando o conteúdo do arquivo /etc/passwd
, pode ser acionada usando uma Definição de Tipo de Documento (DTD) externa maliciosa. Isso é realizado através dos seguintes passos:
Uma entidade de parâmetro XML chamada
file
é definida, que contém o conteúdo do arquivo/etc/passwd
.Uma entidade de parâmetro XML chamada
eval
é definida, incorporando uma declaração dinâmica para outra entidade de parâmetro XML chamadaerror
. Esta entidadeerror
, quando avaliada, tenta carregar um arquivo inexistente, incorporando o conteúdo da entidadefile
como seu nome.A entidade
eval
é invocada, levando à declaração dinâmica da entidadeerror
.A invocação da entidade
error
resulta em uma tentativa de carregar um arquivo inexistente, produzindo uma mensagem de erro que inclui o conteúdo do arquivo/etc/passwd
como parte do nome do arquivo.
O DTD externo malicioso pode ser invocado com o seguinte XML:
Ao ser executado, a resposta do servidor web deve incluir uma mensagem de erro exibindo o conteúdo do arquivo /etc/passwd
.
Por favor, observe que o DTD externo nos permite incluir uma entidade dentro da segunda (eval
), mas isso é proibido no DTD interno. Portanto, você não pode forçar um erro sem usar um DTD externo (geralmente).
Baseado em Erro (sistema DTD)
E quanto às vulnerabilidades cegas de XXE quando as interações out-of-band são bloqueadas (conexões externas não estão disponíveis)?.
Uma brecha na especificação da linguagem XML pode expor dados sensíveis por meio de mensagens de erro quando o DTD de um documento mescla declarações internas e externas. Esse problema permite a redefinição interna de entidades declaradas externamente, facilitando a execução de ataques de XXE baseados em erro. Tais ataques exploram a redefinição de uma entidade de parâmetro XML, originalmente declarada em um DTD externo, de dentro de um DTD interno. Quando as conexões out-of-band são bloqueadas pelo servidor, os atacantes devem depender de arquivos DTD locais para realizar o ataque, com o objetivo de induzir um erro de análise para revelar informações sensíveis.
Considere um cenário em que o sistema de arquivos do servidor contém um arquivo DTD em /usr/local/app/schema.dtd
, definindo uma entidade chamada custom_entity
. Um atacante pode induzir um erro de análise XML revelando o conteúdo do arquivo /etc/passwd
enviando um DTD híbrido da seguinte forma:
Os passos delineados são executados por esta DTD:
A definição de uma entidade de parâmetro XML chamada
local_dtd
inclui o arquivo DTD externo localizado no sistema de arquivos do servidor.Uma redefinição ocorre para a entidade de parâmetro XML
custom_entity
, originalmente definida no DTD externo, para encapsular um exploit XXE baseado em erro. Esta redefinição é projetada para provocar um erro de análise, expondo o conteúdo do arquivo/etc/passwd
.Ao empregar a entidade
local_dtd
, o DTD externo é acionado, abrangendo a entidadecustom_entity
recém-definida. Esta sequência de ações precipita a emissão da mensagem de erro visada pelo exploit.
Exemplo do mundo real: Sistemas que utilizam o ambiente de desktop GNOME frequentemente possuem um DTD em /usr/share/yelp/dtd/docbookx.dtd
contendo uma entidade chamada ISOamso
.
Como essa técnica usa um DTD interno, você precisa encontrar um válido primeiro. Você pode fazer isso instalando o mesmo SO / Software que o servidor está usando e procurando alguns DTDs padrão, ou obtendo uma lista de DTDs padrão dentro dos sistemas e verificando se algum deles existe:
Para mais informações, consulte https://portswigger.net/web-security/xxe/blind
Encontrando DTDs dentro do sistema
No seguinte repositório incrível do github, você pode encontrar caminhos de DTDs que podem estar presentes no sistema:
Além disso, se você tiver a imagem Docker do sistema da vítima, você pode usar a ferramenta do mesmo repositório para escanear a imagem e encontrar o caminho dos DTDs presentes no sistema. Leia o Readme do github para aprender como.
XXE via Analisadores de XML do Office Open XML
Para uma explicação mais aprofundada deste ataque, verifique a segunda seção deste post incrível neste post incrível da Detectify.
A capacidade de fazer upload de documentos do Microsoft Office é oferecida por muitas aplicações web, que então procedem a extrair certos detalhes desses documentos. Por exemplo, uma aplicação web pode permitir que os usuários importem dados fazendo upload de uma planilha no formato XLSX. Para que o analisador extraia os dados da planilha, ele inevitavelmente precisará analisar pelo menos um arquivo XML.
Para testar essa vulnerabilidade, é necessário criar um arquivo do Microsoft Office contendo um payload XXE. O primeiro passo é criar um diretório vazio para o qual o documento pode ser descompactado.
Depois que o documento for descompactado, o arquivo XML localizado em ./unzipped/word/document.xml
deve ser aberto e editado em um editor de texto preferido (como o vim). O XML deve ser modificado para incluir o payload XXE desejado, frequentemente começando com uma solicitação HTTP.
As linhas XML modificadas devem ser inseridas entre os dois objetos XML raiz. É importante substituir o URL por um URL monitorável para as solicitações.
Por fim, o arquivo pode ser compactado para criar o arquivo malicioso poc.docx. A partir do diretório "unzipped" previamente criado, o seguinte comando deve ser executado:
Agora, o arquivo criado pode ser enviado para a aplicação web potencialmente vulnerável, e pode-se esperar que uma solicitação apareça nos logs do Burp Collaborator.
Protocolo Jar
O protocolo jar é acessível exclusivamente dentro de aplicações Java. Ele é projetado para permitir o acesso a arquivos dentro de um arquivo PKZIP (por exemplo, .zip
, .jar
, etc.), atendendo a arquivos locais e remotos.
Ser capaz de acessar arquivos dentro de arquivos PKZIP é super útil para abusar do XXE via arquivos DTD do sistema. Confira esta seção para aprender como abusar dos arquivos DTD do sistema.
O processo por trás de acessar um arquivo dentro de um arquivo PKZIP via o protocolo jar envolve várias etapas:
Uma solicitação HTTP é feita para baixar o arquivo zip de uma localização especificada, como
https://download.website.com/archive.zip
.A resposta HTTP contendo o arquivo é armazenada temporariamente no sistema, geralmente em uma localização como
/tmp/...
.O arquivo é então extraído para acessar seu conteúdo.
O arquivo específico dentro do arquivo,
file.zip
, é lido.Após a operação, quaisquer arquivos temporários criados durante esse processo são excluídos.
Uma técnica interessante para interromper esse processo na segunda etapa envolve manter a conexão do servidor aberta indefinidamente ao servir o arquivo de arquivo. Ferramentas disponíveis neste repositório podem ser utilizadas para esse fim, incluindo um servidor Python (slow_http_server.py
) e um servidor Java (slowserver.jar
).
Escrever arquivos em um diretório temporário pode ajudar a escalar outra vulnerabilidade que envolve uma travessia de caminho (como inclusão de arquivo local, injeção de modelo, XSLT RCE, desserialização, etc).
XSS
DoS
Ataque de Bilhões de Risadas
Ataque Yaml
Ataque de Explosão Quadrática
Obtenção de NTML
Em hosts Windows, é possível obter o hash NTML do usuário do servidor web configurando um manipulador responder.py:
e ao enviar a seguinte solicitação
Superfícies XXE Ocultas
XInclude
Ao integrar dados do cliente em documentos XML do lado do servidor, como aqueles em solicitações SOAP do backend, o controle direto sobre a estrutura XML é frequentemente limitado, dificultando os ataques XXE tradicionais devido a restrições na modificação do elemento DOCTYPE
. No entanto, um ataque XInclude
fornece uma solução ao permitir a inserção de entidades externas dentro de qualquer elemento de dados do documento XML. Este método é eficaz mesmo quando apenas uma parte dos dados dentro de um documento XML gerado pelo servidor pode ser controlada.
Para executar um ataque XInclude
, o namespace XInclude
deve ser declarado, e o caminho do arquivo para a entidade externa pretendida deve ser especificado. Abaixo está um exemplo sucinto de como tal ataque pode ser formulado:
Verifique https://portswigger.net/web-security/xxe para mais informações!
SVG - Upload de Arquivo
Arquivos enviados por usuários para determinadas aplicações, que são então processados no servidor, podem explorar vulnerabilidades na forma como os formatos de arquivo XML ou que contenham XML são tratados. Formatos de arquivo comuns como documentos de escritório (DOCX) e imagens (SVG) são baseados em XML.
Quando os usuários enviam imagens, essas imagens são processadas ou validadas no servidor. Mesmo para aplicações que esperam formatos como PNG ou JPEG, a biblioteca de processamento de imagens do servidor também pode suportar imagens SVG. O SVG, sendo um formato baseado em XML, pode ser explorado por atacantes para enviar imagens SVG maliciosas, expondo assim o servidor a vulnerabilidades de XXE (Entidade Externa XML).
Um exemplo desse tipo de exploit é mostrado abaixo, onde uma imagem SVG maliciosa tenta ler arquivos do sistema:
Outro método envolve tentar executar comandos através do invólucro "expect" do PHP:
Em ambos os casos, o formato SVG é usado para lançar ataques que exploram as capacidades de processamento XML do software do servidor, destacando a necessidade de validação de entrada robusta e medidas de segurança.
Verifique https://portswigger.net/web-security/xxe para mais informações!
Observe que a primeira linha do arquivo lido ou do resultado da execução aparecerá DENTRO da imagem criada. Portanto, você precisa ser capaz de acessar a imagem que o SVG criou.
PDF - Upload de Arquivo
Leia o seguinte post para aprender como explorar um XXE fazendo upload de um arquivo PDF:
pagePDF Upload - XXE and CORS bypassContent-Type: De x-www-urlencoded para XML
Se uma solicitação POST aceita os dados em formato XML, você pode tentar explorar um XXE nessa solicitação. Por exemplo, se uma solicitação normal contém o seguinte:
Então você pode ser capaz de enviar a seguinte solicitação, com o mesmo resultado:
Content-Type: De JSON para XEE
Para alterar a solicitação, você pode usar uma Extensão do Burp chamada "Content Type Converter". Aqui você pode encontrar este exemplo:
Outro exemplo pode ser encontrado aqui.
Bypasses de WAF e Proteções
Base64
Isso só funciona se o servidor XML aceitar o protocolo data://
.
UTF-7
Você pode usar a ["Receita de Codificação" do CyberChef aqui ](https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4)to](https://gchq.github.io/CyberChef/#recipe=Encode_text%28'UTF-7 %2865000%29'%29&input=PCFET0NUWVBFIGZvbyBbPCFFTlRJVFkgZXhhbXBsZSBTWVNURU0gIi9ldGMvcGFzc3dkIj4gXT4KPHN0b2NrQ2hlY2s%2BPHByb2R1Y3RJZD4mZXhhbXBsZTs8L3Byb2R1Y3RJZD48c3RvcmVJZD4xPC9zdG9yZUlkPjwvc3RvY2tDaGVjaz4%29to) transformar para UTF-7.
Bypass de Protocolo de Arquivo
Se a web estiver usando PHP, em vez de usar file:/
, você pode usar invólucros php php://filter/convert.base64-encode/resource=
para acessar arquivos internos.
Se a web estiver usando Java, você pode verificar o protocolo jar.
Entidades HTML
Truque de https://github.com/Ambrotd/XXE-Notes Você pode criar uma entidade dentro de uma entidade codificando-a com entidades html e então chamá-la para carregar um dtd. Observe que as Entidades HTML usadas precisam ser numéricas (como [neste exemplo](https://gchq.github.io/CyberChef/#recipe=To_HTML_Entity%28true,'Numeric entities'%29&input=PCFFTlRJVFkgJSBkdGQgU1lTVEVNICJodHRwOi8vMTcyLjE3LjAuMTo3ODc4L2J5cGFzczIuZHRkIiA%2B)\).
Exemplo de DTD:
Invólucros PHP
Base64
Extrair index.php
Extrair recurso externo
Execução remota de código
Se o módulo "expect" do PHP estiver carregado
SOAP - XEE
XLIFF - XXE
Este exemplo é inspirado em https://pwn.vg/articles/2021-06/local-file-read-via-error-based-xxe
XLIFF (XML Localization Interchange File Format) é utilizado para padronizar a troca de dados em processos de localização. É um formato baseado em XML usado principalmente para transferir dados localizáveis entre ferramentas durante a localização e como um formato de troca comum para ferramentas de TAC (Tradução Assistida por Computador).
Análise de Solicitação Cega
Uma solicitação é feita ao servidor com o seguinte conteúdo:
No entanto, este pedido desencadeia um erro interno do servidor, mencionando especificamente um problema com as declarações de marcação:
Apesar do erro, um hit é registrado no Burp Collaborator, indicando algum nível de interação com a entidade externa.
Exfiltração de Dados Out of Band Para exfiltrar dados, é enviada uma solicitação modificada:
Este método revela que o User Agent indica o uso do Java 1.8. Uma limitação observada com esta versão do Java é a incapacidade de recuperar arquivos contendo um caractere de nova linha, como /etc/passwd, usando a técnica Out of Band.
Exfiltração de Dados Baseada em Erros Para superar esta limitação, é empregada uma abordagem baseada em erros. O arquivo DTD é estruturado da seguinte forma para acionar um erro que inclui dados de um arquivo alvo:
O servidor responde com um erro, refletindo de forma importante o arquivo inexistente, indicando que o servidor está tentando acessar o arquivo especificado:
Para incluir o conteúdo do arquivo na mensagem de erro, o arquivo DTD é ajustado:
Esta modificação leva à exfiltração bem-sucedida do conteúdo do arquivo, conforme refletido na saída de erro enviada via HTTP. Isso indica um ataque bem-sucedido de XXE (XML External Entity), aproveitando técnicas Out of Band e Error-Based para extrair informações sensíveis.
RSS - XEE
XML válido com formato RSS para explorar uma vulnerabilidade de XXE.
Ping de retorno
Solicitação HTTP simples para o servidor do atacante
Ler arquivo
Ler código fonte
Usando filtro base64 do PHP
Java XMLDecoder XEE para RCE
XMLDecoder é uma classe Java que cria objetos com base em uma mensagem XML. Se um usuário malicioso conseguir fazer com que um aplicativo use dados arbitrários em uma chamada ao método readObject, ele instantaneamente obterá execução de código no servidor.
Usando Runtime().exec()
ProcessBuilder
O ProcessBuilder
é uma classe em Java que é usada para processos de criação e execução de programas externos a partir de um programa Java.
Ferramentas
Referências
Extrair informações via HTTP usando DTD externo próprio: https://ysx.me.uk/from-rss-to-xxe-feed-parsing-on-hootsuite/\
Last updated