Cryptographic/Compression Algorithms

Algoritmos Criptográficos/Compresión

Ayuda a HackTricks

Identificación de Algoritmos

Si te encuentras con un código que utiliza desplazamientos a la derecha e izquierda, XOR y varias operaciones aritméticas, es altamente probable que sea la implementación de un algoritmo criptográfico. Aquí se mostrarán algunas formas de identificar el algoritmo utilizado sin necesidad de revertir cada paso.

Funciones de API

CryptDeriveKey

Si se utiliza esta función, puedes encontrar qué algoritmo se está utilizando verificando el valor del segundo parámetro:

Consulta aquí la tabla de algoritmos posibles y sus valores asignados: https://docs.microsoft.com/en-us/windows/win32/seccrypto/alg-id

RtlCompressBuffer/RtlDecompressBuffer

Comprime y descomprime un búfer de datos dado.

CryptAcquireContext

Según la documentación: La función CryptAcquireContext se utiliza para adquirir un identificador a un contenedor de claves particular dentro de un proveedor de servicios criptográficos (CSP) específico. Este identificador devuelto se utiliza en llamadas a funciones de CryptoAPI que utilizan el CSP seleccionado.

CryptCreateHash

Inicia el proceso de hash de un flujo de datos. Si se utiliza esta función, puedes encontrar qué algoritmo se está utilizando verificando el valor del segundo parámetro:

Consulta aquí la tabla de algoritmos posibles y sus valores asignados: https://docs.microsoft.com/en-us/windows/win32/seccrypto/alg-id

Constantes de Código

A veces es muy fácil identificar un algoritmo gracias al hecho de que necesita utilizar un valor especial y único.

Si buscas la primera constante en Google, esto es lo que obtienes:

Por lo tanto, puedes asumir que la función descompilada es un calculador sha256. Puedes buscar cualquiera de las otras constantes y obtendrás (probablemente) el mismo resultado.

Información de Datos

Si el código no tiene ninguna constante significativa, puede estar cargando información de la sección .data. Puedes acceder a esos datos, agrupar el primer dword y buscarlo en Google como hemos hecho en la sección anterior:

En este caso, si buscas 0xA56363C6 puedes encontrar que está relacionado con las tablas del algoritmo AES.

RC4 (Cifrado Simétrico)

Características

Está compuesto por 3 partes principales:

  • Etapa de Inicialización/: Crea una tabla de valores de 0x00 a 0xFF (256 bytes en total, 0x100). Esta tabla comúnmente se llama Caja de Sustitución (o SBox).

  • Etapa de Mezcla: Recorrerá la tabla creada anteriormente (bucle de 0x100 iteraciones, nuevamente) modificando cada valor con bytes semi-aleatorios. Para crear estos bytes semi-aleatorios, se utiliza la clave RC4. Las claves RC4 pueden tener entre 1 y 256 bytes de longitud, sin embargo, generalmente se recomienda que sea superior a 5 bytes. Comúnmente, las claves RC4 tienen una longitud de 16 bytes.

  • Etapa XOR: Finalmente, el texto plano o cifrado se XORea con los valores creados anteriormente. La función para cifrar y descifrar es la misma. Para esto, se realizará un bucle a través de los 256 bytes creados tantas veces como sea necesario. Esto suele reconocerse en un código descompilado con un %256 (módulo 256).

Para identificar un RC4 en un código de desensamblado/descompilado, puedes buscar 2 bucles de tamaño 0x100 (con el uso de una clave) y luego un XOR de los datos de entrada con los 256 valores creados anteriormente en los 2 bucles probablemente usando un %256 (módulo 256)

Etapa de Inicialización/Caja de Sustitución: (Observa el número 256 utilizado como contador y cómo se escribe un 0 en cada lugar de los 256 caracteres)

Etapa de Mezcla:

Etapa XOR:

AES (Cifrado Simétrico)

Características

  • Uso de cajas de sustitución y tablas de búsqueda

  • Es posible distinguir AES gracias al uso de valores específicos de tablas de búsqueda (constantes). Ten en cuenta que la constante puede estar almacenada en el binario o creada dinámicamente.

  • La clave de cifrado debe ser divisible por 16 (generalmente 32B) y generalmente se utiliza un IV de 16B.

Constantes de SBox

Serpent (Cifrado Simétrico)

Características

  • Es raro encontrar malware que lo utilice, pero hay ejemplos (Ursnif)

  • Es fácil determinar si un algoritmo es Serpent o no basándose en su longitud (función extremadamente larga)

Identificación

En la siguiente imagen, observa cómo se utiliza la constante 0x9E3779B9 (nota que esta constante también se utiliza en otros algoritmos criptográficos como TEA -Tiny Encryption Algorithm). También observa el tamaño del bucle (132) y el número de operaciones XOR en las instrucciones de desensamblado y en el ejemplo de código:

Como se mencionó anteriormente, este código puede visualizarse dentro de cualquier descompilador como una función muy larga ya que no hay saltos dentro de ella. El código descompilado puede verse así:

Por lo tanto, es posible identificar este algoritmo verificando el número mágico y los XORs iniciales, viendo una función muy larga y comparando algunas instrucciones de la función larga con una implementación (como el desplazamiento a la izquierda por 7 y la rotación a la izquierda por 22).

RSA (Cifrado Asimétrico)

Características

  • Más complejo que los algoritmos simétricos

  • ¡No hay constantes! (las implementaciones personalizadas son difíciles de determinar)

  • KANAL (un analizador criptográfico) no muestra pistas sobre RSA ya que se basa en constantes.

Identificación por comparaciones

  • En la línea 11 (izquierda) hay un +7) >> 3 que es lo mismo que en la línea 35 (derecha): +7) / 8

  • La línea 12 (izquierda) está verificando si modulus_len < 0x040 y en la línea 36 (derecha) está verificando si inputLen+11 > modulusLen

MD5 & SHA (hash)

Características

  • 3 funciones: Iniciar, Actualizar, Finalizar

  • Funciones de inicialización similares

Identificar

Iniciar

Puedes identificar ambos verificando las constantes. Ten en cuenta que sha_init tiene 1 constante que MD5 no tiene:

Transformación MD5

Observa el uso de más constantes

CRC (hash)

  • Más pequeño y eficiente ya que su función es encontrar cambios accidentales en los datos

  • Utiliza tablas de búsqueda (por lo que puedes identificar constantes)

Identificar

Verifica las constantes de la tabla de búsqueda:

Un algoritmo de hash CRC se ve así:

APLib (Compresión)

Características

  • Constantes no reconocibles

  • Puedes intentar escribir el algoritmo en Python y buscar cosas similares en línea

Identificar

El gráfico es bastante grande:

Verifica 3 comparaciones para reconocerlo:

Last updated