Cryptographic/Compression Algorithms
Last updated
Last updated
Aprende y practica Hacking en AWS:HackTricks Training AWS Red Team Expert (ARTE) Aprende y practica Hacking en GCP: HackTricks Training GCP Red Team Expert (GRTE)
Si te encuentras con un código que utiliza desplazamientos a la derecha e izquierda, XOR y varias operaciones aritméticas, es altamente probable que sea la implementación de un algoritmo criptográfico. Aquí se mostrarán algunas formas de identificar el algoritmo utilizado sin necesidad de revertir cada paso.
CryptDeriveKey
Si se utiliza esta función, puedes encontrar qué algoritmo se está utilizando verificando el valor del segundo parámetro:
Consulta aquí la tabla de algoritmos posibles y sus valores asignados: https://docs.microsoft.com/en-us/windows/win32/seccrypto/alg-id
RtlCompressBuffer/RtlDecompressBuffer
Comprime y descomprime un búfer de datos dado.
CryptAcquireContext
Según la documentación: La función CryptAcquireContext se utiliza para adquirir un identificador a un contenedor de claves particular dentro de un proveedor de servicios criptográficos (CSP) específico. Este identificador devuelto se utiliza en llamadas a funciones de CryptoAPI que utilizan el CSP seleccionado.
CryptCreateHash
Inicia el proceso de hash de un flujo de datos. Si se utiliza esta función, puedes encontrar qué algoritmo se está utilizando verificando el valor del segundo parámetro:
Consulta aquí la tabla de algoritmos posibles y sus valores asignados: https://docs.microsoft.com/en-us/windows/win32/seccrypto/alg-id
A veces es muy fácil identificar un algoritmo gracias al hecho de que necesita utilizar un valor especial y único.
Si buscas la primera constante en Google, esto es lo que obtienes:
Por lo tanto, puedes asumir que la función descompilada es un calculador sha256. Puedes buscar cualquiera de las otras constantes y obtendrás (probablemente) el mismo resultado.
Si el código no tiene ninguna constante significativa, puede estar cargando información de la sección .data. Puedes acceder a esos datos, agrupar el primer dword y buscarlo en Google como hemos hecho en la sección anterior:
En este caso, si buscas 0xA56363C6 puedes encontrar que está relacionado con las tablas del algoritmo AES.
Está compuesto por 3 partes principales:
Etapa de Inicialización/: Crea una tabla de valores de 0x00 a 0xFF (256 bytes en total, 0x100). Esta tabla comúnmente se llama Caja de Sustitución (o SBox).
Etapa de Mezcla: Recorrerá la tabla creada anteriormente (bucle de 0x100 iteraciones, nuevamente) modificando cada valor con bytes semi-aleatorios. Para crear estos bytes semi-aleatorios, se utiliza la clave RC4. Las claves RC4 pueden tener entre 1 y 256 bytes de longitud, sin embargo, generalmente se recomienda que sea superior a 5 bytes. Comúnmente, las claves RC4 tienen una longitud de 16 bytes.
Etapa XOR: Finalmente, el texto plano o cifrado se XORea con los valores creados anteriormente. La función para cifrar y descifrar es la misma. Para esto, se realizará un bucle a través de los 256 bytes creados tantas veces como sea necesario. Esto suele reconocerse en un código descompilado con un %256 (módulo 256).
Para identificar un RC4 en un código de desensamblado/descompilado, puedes buscar 2 bucles de tamaño 0x100 (con el uso de una clave) y luego un XOR de los datos de entrada con los 256 valores creados anteriormente en los 2 bucles probablemente usando un %256 (módulo 256)
Uso de cajas de sustitución y tablas de búsqueda
Es posible distinguir AES gracias al uso de valores específicos de tablas de búsqueda (constantes). Ten en cuenta que la constante puede estar almacenada en el binario o creada dinámicamente.
La clave de cifrado debe ser divisible por 16 (generalmente 32B) y generalmente se utiliza un IV de 16B.
Es raro encontrar malware que lo utilice, pero hay ejemplos (Ursnif)
Es fácil determinar si un algoritmo es Serpent o no basándose en su longitud (función extremadamente larga)
En la siguiente imagen, observa cómo se utiliza la constante 0x9E3779B9 (nota que esta constante también se utiliza en otros algoritmos criptográficos como TEA -Tiny Encryption Algorithm). También observa el tamaño del bucle (132) y el número de operaciones XOR en las instrucciones de desensamblado y en el ejemplo de código:
Como se mencionó anteriormente, este código puede visualizarse dentro de cualquier descompilador como una función muy larga ya que no hay saltos dentro de ella. El código descompilado puede verse así:
Por lo tanto, es posible identificar este algoritmo verificando el número mágico y los XORs iniciales, viendo una función muy larga y comparando algunas instrucciones de la función larga con una implementación (como el desplazamiento a la izquierda por 7 y la rotación a la izquierda por 22).
Más complejo que los algoritmos simétricos
¡No hay constantes! (las implementaciones personalizadas son difíciles de determinar)
KANAL (un analizador criptográfico) no muestra pistas sobre RSA ya que se basa en constantes.
En la línea 11 (izquierda) hay un +7) >> 3
que es lo mismo que en la línea 35 (derecha): +7) / 8
La línea 12 (izquierda) está verificando si modulus_len < 0x040
y en la línea 36 (derecha) está verificando si inputLen+11 > modulusLen
3 funciones: Iniciar, Actualizar, Finalizar
Funciones de inicialización similares
Iniciar
Puedes identificar ambos verificando las constantes. Ten en cuenta que sha_init tiene 1 constante que MD5 no tiene:
Transformación MD5
Observa el uso de más constantes
Más pequeño y eficiente ya que su función es encontrar cambios accidentales en los datos
Utiliza tablas de búsqueda (por lo que puedes identificar constantes)
Verifica las constantes de la tabla de búsqueda:
Un algoritmo de hash CRC se ve así:
Constantes no reconocibles
Puedes intentar escribir el algoritmo en Python y buscar cosas similares en línea
El gráfico es bastante grande:
Verifica 3 comparaciones para reconocerlo: