Перейти к содержанию

Посты

Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и…

20 декабря 2025 г. в 19:51Max Knyazev is typing…Зеркало Telegram
Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и становятся исполнителями. Вот и история, которая еще пару лет назад выглядела бы как сюжет фильма, в сентябре 2025 года внезапно стала реальностью (да, я очень своевременный человек в декабре рассказывать вам про то, что было в сентябре) ❤️

Anthropic официально задокументировала первую в истории крупномасштабную кибершпионскую кампанию, где основную работу выполнял не человек, а автономный ИИ-агент (на Хабре тоже переводом делюсь). Еще раз: ИИ не помогал атаке — ОН САМ АТАКОВАЛ

Речь идет о кампании, которую в Anthropic связывают с государственными структурами Китая. Для атаки использовалась Claude Code. И использовалась она не в режиме «подскажи», а в режиме «делай сам» 🫡

Классическая схема «человек → ИИ → человек» была выкинута. Вместо нее появился автономный агент, которому дали цель и минимальный контроль

Теперь давайте разберемся, как именно это работало ⤵️

Чтобы обойти защитные механизмы модели, злоумышленники применили аккуратный, почти элегантный джейлбрейк. Задачи разбивались на десятки и сотни маленьких шагов, каждый из которых выглядел безобидно. Где-то «проанализировать архитектуру», где-то «оценить конфигурацию», где-то «подсказать оптимизацию»

В сумме из этого складывался полноценный kill chain, но сама модель никогда не видела всю картину целиком 🧠

Claude Code выдавал себя за специалиста по кибербезопасности, работал в контексте якобы легитимного аудита и делал ровно то, чему его учили. Ничего криминального, по идее. Ну это по идее, а вот по факту...

Целями стали около 30 организаций по всему миру: технологические компании, банки, химическая промышленность, государственные структуры. Да, не все атаки закончились успешным доступом к данным. Да, часть была остановлена. Но это вообще не главное 🧐

Главное — факт. Мы впервые увидели атаку, где ИИ выступает не ассистентом человека, а самостоятельным оператором

Если обсуждать роль людей в этой истории, то становится как-то совсем неловко. По оценке Anthropic, участие человека сводилось к 4–6 решениям на серию атак. Выбор цели. Разрешение двигаться дальше. Переход между фазами. Стратегические «ок» и «стоп» 🤝

Все остальное делала модель (такое вот делегирование целой атаки)

После обнаружения аномальной активности в середине сентября Anthropic отработала максимально жестко и быстро. Вредоносные аккаунты и доступы были заблокированы. Пострадавшие организации и соответствующие органы уведомлены. Для анализа и защиты использовались, иронично, те же ИИ-инструменты, включая Claude 😊

Самый неприятный вывод на мой взгляд, это тот факт, что автономные ИИ-агенты становятся новой категорией угроз. Мы больше не можем рассматривать ИИ только как вспомогательный инструмент атакующего. И да, из-за этого мы приходим к тому моменту, когда ИИ-агенты должны в том числе использоваться для защиты. Это необходимость. Скорость, масштаб и сложность таких атак без автоматизированного анализа и реагирования человек самостоятельно не вытянет

Мы вошли в эпоху, где вопрос звучит уже не «будет ли ИИ использоваться в атаках», а «кто быстрее и лучше научится использовать ИИ для защиты»

Такие пироги 🍰

#информационная_безопасность
Открыть исходный пост в Telegram

Граф связей

Как эта работа связана с другими

Для этой работы пока не настроено явных связей. Можно открыть общий граф или таймлайн всех работ.

Наведите курсор на линию, чтобы увидеть пояснение связи между работами.

Колёсико мыши меняет масштаб, а сам граф можно перетаскивать как карту.

Пост
100%

Обсуждение

Комментарии

Комментарии доступны только подтверждённым email-подписчикам

Подключиться к обсуждению

Введите ту же почту, которую вы уже использовали для подписки на сайт

Пока нет ни одного комментария