Посты
Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и…
20 декабря 2025 г. в 19:51•Max Knyazev is typing…Зеркало Telegram
Медленно но верно мы переходим в ту эпоху, когда нейронки перестают быть инструментами и становятся исполнителями. Вот и история, которая еще пару лет назад выглядела бы как сюжет фильма, в сентябре 2025 года внезапно стала реальностью (да, я очень своевременный человек в декабре рассказывать вам про то, что было в сентябре) ❤️
Anthropic официально задокументировала первую в истории крупномасштабную кибершпионскую кампанию, где основную работу выполнял не человек, а автономный ИИ-агент (на Хабре тоже переводом делюсь). Еще раз: ИИ не помогал атаке — ОН САМ АТАКОВАЛ
Речь идет о кампании, которую в Anthropic связывают с государственными структурами Китая. Для атаки использовалась Claude Code. И использовалась она не в режиме «подскажи», а в режиме «делай сам»🫡
Классическая схема «человек → ИИ → человек» была выкинута. Вместо нее появился автономный агент, которому дали цель и минимальный контроль
Теперь давайте разберемся, как именно это работало⤵️
Чтобы обойти защитные механизмы модели, злоумышленники применили аккуратный, почти элегантный джейлбрейк. Задачи разбивались на десятки и сотни маленьких шагов, каждый из которых выглядел безобидно. Где-то «проанализировать архитектуру», где-то «оценить конфигурацию», где-то «подсказать оптимизацию»
В сумме из этого складывался полноценный kill chain, но сама модель никогда не видела всю картину целиком🧠
Claude Code выдавал себя за специалиста по кибербезопасности, работал в контексте якобы легитимного аудита и делал ровно то, чему его учили. Ничего криминального, по идее. Ну это по идее, а вот по факту...
Целями стали около 30 организаций по всему миру: технологические компании, банки, химическая промышленность, государственные структуры. Да, не все атаки закончились успешным доступом к данным. Да, часть была остановлена. Но это вообще не главное🧐
Главное — факт. Мы впервые увидели атаку, где ИИ выступает не ассистентом человека, а самостоятельным оператором
Если обсуждать роль людей в этой истории, то становится как-то совсем неловко. По оценке Anthropic, участие человека сводилось к 4–6 решениям на серию атак. Выбор цели. Разрешение двигаться дальше. Переход между фазами. Стратегические «ок» и «стоп»🤝
Все остальное делала модель (такое вот делегирование целой атаки)
После обнаружения аномальной активности в середине сентября Anthropic отработала максимально жестко и быстро. Вредоносные аккаунты и доступы были заблокированы. Пострадавшие организации и соответствующие органы уведомлены. Для анализа и защиты использовались, иронично, те же ИИ-инструменты, включая Claude😊
Самый неприятный вывод на мой взгляд, это тот факт, что автономные ИИ-агенты становятся новой категорией угроз. Мы больше не можем рассматривать ИИ только как вспомогательный инструмент атакующего. И да, из-за этого мы приходим к тому моменту, когда ИИ-агенты должны в том числе использоваться для защиты. Это необходимость. Скорость, масштаб и сложность таких атак без автоматизированного анализа и реагирования человек самостоятельно не вытянет
Мы вошли в эпоху, где вопрос звучит уже не «будет ли ИИ использоваться в атаках», а «кто быстрее и лучше научится использовать ИИ для защиты»
Такие пироги🍰
#информационная_безопасность
Открыть исходный пост в TelegramAnthropic официально задокументировала первую в истории крупномасштабную кибершпионскую кампанию, где основную работу выполнял не человек, а автономный ИИ-агент (на Хабре тоже переводом делюсь). Еще раз: ИИ не помогал атаке — ОН САМ АТАКОВАЛ
Речь идет о кампании, которую в Anthropic связывают с государственными структурами Китая. Для атаки использовалась Claude Code. И использовалась она не в режиме «подскажи», а в режиме «делай сам»
Классическая схема «человек → ИИ → человек» была выкинута. Вместо нее появился автономный агент, которому дали цель и минимальный контроль
Теперь давайте разберемся, как именно это работало
Чтобы обойти защитные механизмы модели, злоумышленники применили аккуратный, почти элегантный джейлбрейк. Задачи разбивались на десятки и сотни маленьких шагов, каждый из которых выглядел безобидно. Где-то «проанализировать архитектуру», где-то «оценить конфигурацию», где-то «подсказать оптимизацию»
В сумме из этого складывался полноценный kill chain, но сама модель никогда не видела всю картину целиком
Claude Code выдавал себя за специалиста по кибербезопасности, работал в контексте якобы легитимного аудита и делал ровно то, чему его учили. Ничего криминального, по идее. Ну это по идее, а вот по факту...
Целями стали около 30 организаций по всему миру: технологические компании, банки, химическая промышленность, государственные структуры. Да, не все атаки закончились успешным доступом к данным. Да, часть была остановлена. Но это вообще не главное
Главное — факт. Мы впервые увидели атаку, где ИИ выступает не ассистентом человека, а самостоятельным оператором
Если обсуждать роль людей в этой истории, то становится как-то совсем неловко. По оценке Anthropic, участие человека сводилось к 4–6 решениям на серию атак. Выбор цели. Разрешение двигаться дальше. Переход между фазами. Стратегические «ок» и «стоп»
Все остальное делала модель (такое вот делегирование целой атаки)
После обнаружения аномальной активности в середине сентября Anthropic отработала максимально жестко и быстро. Вредоносные аккаунты и доступы были заблокированы. Пострадавшие организации и соответствующие органы уведомлены. Для анализа и защиты использовались, иронично, те же ИИ-инструменты, включая Claude
Самый неприятный вывод на мой взгляд, это тот факт, что автономные ИИ-агенты становятся новой категорией угроз. Мы больше не можем рассматривать ИИ только как вспомогательный инструмент атакующего. И да, из-за этого мы приходим к тому моменту, когда ИИ-агенты должны в том числе использоваться для защиты. Это необходимость. Скорость, масштаб и сложность таких атак без автоматизированного анализа и реагирования человек самостоятельно не вытянет
Мы вошли в эпоху, где вопрос звучит уже не «будет ли ИИ использоваться в атаках», а «кто быстрее и лучше научится использовать ИИ для защиты»
Такие пироги
#информационная_безопасность