Эксперт перезагрузил Linux 292 612 раз, чтобы найти баг ядра

Эксперт перезагрузил Linux 292 612 раз, чтобы найти баг ядра

Эксперт перезагрузил Linux 292 612 раз, чтобы найти баг ядра

Ричард Джонс, один из разработчиков Red Hat, нашёл баг в системе Linux и сделал это очень интересным способом. Специалист заметил, что ОС виснет на этапе загрузки один из тысячи раз. Чтобы доказать свои выводы, Джонс загрузил компьютер 292 612 раз.

По словам эксперта, баг затрагивает ядро Linux версии 6.4. После того как Джонс перезагрузил устройство 292 612 раз, ещё тысяча перезагрузок понадобилась на подтверждение проблемы. Все манипуляции заняли у разработчика 21 час.

Эксперт показал, что брешь реже встречается на железе Intel, чем на AMD. Впервые Джонс заподозрил наличие бага, когда ряд софтовых тестов с протоколом nbdkit «рандомно зависали» при работе с инструментом libguestsfs (для доступа к образам дисков виртуальной машины и их модификации).

Несмотря на общую фазу тестирования в 21 час и 292 612 перезагрузок, Джонс отметил, что к этому он шёл несколько дней. Исследователь метался между Linux v6.0 и v6.4-rc6, чтобы выявить виновника бага. Последним оказалась регрессия функции printk.

Определить причину помог тот факт, что ошибка всегда возникала на одном и том же раннем этапе загрузки ОС (при запуске последней версии qemu). По ссылке можно увидеть, что самый простой способ воспроизвести баг — запустить команду guestfish в цикле со множеством параллельных копий.

Джонс, например, запускал guestfish в цикле 10 тыс. раз. Разработчик утверждает, что проблема зависания при загрузке возникает реже в системах Intel, чем в AMD. Ожидается, что на баг обратят внимание и поправят его.