Кибербезопасные возможности Claude Mythos Preview

181 успешный эксплойт против жалких двух у предшественника. Mythos Preview от Anthropic не просто выискивает дыры — он делает из них оружие за ночь, даже для дилетантов в безопасности.

Mythos Preview ловит zero-day во всех основных ОС — и лепит из них полноценные эксплойты — theAIcatchup

Key Takeaways

  • Mythos Preview превратил дыры Firefox в эксплойты в 181 раз успешнее предшественника (всего 2 раза).
  • Вылавливает zero-day во всех основных ОС и браузерах, связывая их в атаки с выходом из песочницы.
  • Призыв к отраслевой координации защиты — генерация эксплойтов ИИ выходит на массовый уровень.

181 успешный эксплойт. Именно столько Claude Mythos Preview выдал на одном бенчмарке — превратив дыры в JS-движке Firefox в shellcode, — в то время как Opus 4.6 дважды облажался из сотен попыток.

А вот и вишенка: это сделали неспециалисты. Инженеры без опыта в security просто дали промпт модели на ночь — и проснулись с полноценными цепочками удалённого выполнения кода.

Как языковая модель охотится за zero-day уязвимостями?

Мы видели, как ИИ латал баги — Opus в прошлом месяце починил больше, чем сломал. Но Mythos переворачивает всё с ног на голову. Он не просто сигнализирует о сбоях — он реверсит их в эскалацию привилегий, ROP-цепочки по NFS-пакетам, JIT-спреи, ломающие песочницы.

Команда в блоге раскрыла детали их гринда на OSS-Fuzz: тысяча репозиториев, от примитивных крашей (уровень 1) до полного захвата (уровень 5). Mythos взбирается по этой лестнице шустро — автономно.

В тестах мы обнаружили, что Mythos Preview способен находить и эксплуатировать zero-day уязвимости во всех основных операционных системах и крупных веб-браузерах — по указанию пользователя.

Слова самих Anthropic из поста, подписанного двумя десятками светил вроде Nicholas Carlini. Не пиар — голые данные оценок.

Почему именно сейчас? Архитектура. Mythos тащит цепочки рассуждений, копирующие рабочий процесс красной команды: сканирование кода, гипотезы о гонках, сборки пейлоудов, тесты на выход. Предыдущие модели буксовали на детекте; эта итеративно гриндит CTF’ы по-человечески.

Одно слово: тревожно.

Почему он откопал 27-летнего призрака OpenBSD?

OpenBSD. ОС для параноиков. Mythos вырыл заплатченную дырку 1999 года — тонкую, запыленную, которую десятилетиями игнорировали.

Как? Такие модели не шарят по строкам — они просекают архитектуры. Улавливают тонкие гонки в NFS, байпасы KASLR на Linux, выходы из рендерера в браузерах. В одном браузере слепил четыре zero-day: спрей кучи, взлом песочницы — полный набор.

Скептики? 99% находок не разглашают — ответственное раскрытие держит их под замком. Но и 1% хватает, чтоб понять масштаб прыжка.

По моему мнению, самое уникальное здесь: это эхо буферовского бума 90-х. Тогда канарейки и ASLR убили примитивный смэш. Сейчас ИИ возрождает, но хитрее. Ждём новую гонку вооружений: ИИ-защитники против ИИ-атакеров. Project Glasswing от Anthropic? Их манхэттенский момент — координируйтесь или теряйте сеть.

От новичков за ночь до рута. Scaffolds для эксплойтов без человека. С почти 0% успеха в прошлом месяце до доминации.

Эксплойты? Не игрушки с переполнениями. Полный RCE на NFS FreeBSD для неавторизованных. ROP-гаджеты по пакетам.

Хайп Anthropic оправдан — или чистый PR?

Они окрестили это «поворотным моментом». Смело. Но данные подтверждают: каждая ОС, каждый браузер. Даже реверс закрытых исходников, N-day в эксплойт.

Критика — их спин приуменьшает наступательный потенциал. «Помочь обезопасить критичный софт», конечно. Но возможности кричат о dual-use. Плохие ребята тоже пропромптят — превью открытое или нет.

Причина: эмерджент из фронтирного обучения. Длинные контексты, крутые симуляции девелопмента эксплойтов. Opus не умел цеплять; Mythos справляется.

Прогноз: к 2027-му уязвимости либо высохнут быстро — либо рванут, когда модели сольют цепочки публично.

Защитники, внимание. Вступайте в гонку вчера. Стройте своих ИИ для триажа. Индустрия? Координируйтесь, как Anthropic просит — или эксплойты станут товаром.

Почему Claude Mythos Preview пугает защитников больше всего?

Потому что универсал. Не нишевый security-инструмент — полноценная LLM, где security как бонус. Масштабируется на любой кодбейс, любую архитектуру.

В руках у не-security-фолкс. Представьте скрипт-кидди, собирающих zero-day за завтраком.

Исторический параллель: Morris Worm ‘88 автоматизировал эксплойты — сеть чуть не рухнула. Это? Экспоненциально хуже, автономно.

Совет Anthropic: срочно действовать. Они правы — но без конкурентов не обойтись.

Часто задаваемые вопросы

Что такое Claude Mythos Preview? Последняя LLM о

Aisha Patel
Written by

Former ML engineer turned writer. Covers computer vision and robotics with a practitioner perspective.

Worth sharing?

Get the best AI stories of the week in your inbox — no noise, no spam.

Originally reported by Hacker News