Unicode Injection

Aprende hacking en AWS desde cero hasta experto con htARTE (HackTricks AWS Red Team Expert)!

Otras formas de apoyar a HackTricks:

Introducción

Dependiendo de cómo se comporte el back-end/front-end al recibir caracteres unicode extraños, un atacante podría ser capaz de burlar protecciones e inyectar caracteres arbitrarios que podrían ser utilizados para explotar vulnerabilidades de inyección como XSS o SQLi.

Normalización Unicode

La normalización Unicode ocurre cuando los caracteres unicode se normalizan a caracteres ascii.

Un escenario común de este tipo de vulnerabilidad ocurre cuando el sistema está modificando de alguna manera la entrada del usuario después de haberla verificado. Por ejemplo, en algunos lenguajes una simple llamada para convertir la entrada en mayúsculas o minúsculas podría normalizar la entrada dada y el unicode se transformará en ASCII generando nuevos caracteres. Para más información, consulta:

pageUnicode Normalization

\u a %

Los caracteres Unicode suelen representarse con el prefijo \u. Por ejemplo, el carácter es \u3c4b(compruébalo aquí). Si un back-end transforma el prefijo \u en %, la cadena resultante será %3c4b, que decodificado en URL es: <4b. Y, como puedes ver, se inyecta un carácter <. Puedes utilizar esta técnica para inyectar cualquier tipo de carácter si el back-end es vulnerable. Consulta https://unicode-explorer.com/ para encontrar los caracteres que necesitas.

Esta vulnerabilidad en realidad proviene de una vulnerabilidad que un investigador encontró, para una explicación más detallada consulta https://www.youtube.com/watch?v=aUsAHb0E7Cg

Inyección de Emoji

A veces los back-ends se comportan de manera extraña cuando reciben emojis. Eso es lo que sucedió en este informe donde el investigador logró lograr un XSS con un payload como: 💋img src=x onerror=alert(document.domain)//💛

En este caso, el error fue que el servidor después de eliminar los caracteres maliciosos convirtió la cadena UTF-8 de Windows-1252 a UTF-8 (básicamente la codificación de entrada y la conversión de codificación no coincidían). Entonces esto no da un < adecuado, sino uno unicode extraño: ``Así que tomaron esta salida y la convirtieron nuevamente ahora de UTF-8 a ASCII. Esto normalizó el a <, así es como el exploit podría funcionar en ese sistema. Esto es lo que sucedió:

<?php

$str = isset($_GET["str"]) ? htmlspecialchars($_GET["str"]) : "";

$str = iconv("Windows-1252", "UTF-8", $str);
$str = iconv("UTF-8", "ASCII//TRANSLIT", $str);

echo "String: " . $str;

Listas de emojis:

Aprende hacking en AWS de cero a héroe con htARTE (HackTricks AWS Red Team Expert)!

Otras formas de apoyar a HackTricks:

Última actualización