FBI IC3 зафиксировал более 22 000 жалоб, связанных с ИИ, в своём Internet Crime Report 2025 — первый год, когда ведомство официально ввело дескриптор «AI-related» для преступлений (FBI IC3, 2025). Отчёт Pindrop Voice Intelligence and Security Report 2025 зафиксировал рост попыток deepfake-мошенничества на 1 300% год к году во всех отраслях в 2024 году. FTC задокументировала более $1,9 млрд заявленных потерь от телефонного мошенничества и имперсонации в 2023 году, а потребительский опрос McAfee показал: 77% жертв голосовых дипфейков потеряли деньги — 36% от $500 до $3 000 за инцидент (McAfee, 2023).
В контексте России и СНГ картина дополняется данными Kaspersky и Group-IB, которые документируют устойчивый рост вишинг-кампаний с использованием синтеза голоса против клиентов банков и частных лиц. Group-IB в отчёте Hi-Tech Crime Trends 2025 зафиксировала наличие инструментов конверсии голоса в реальном времени на русскоязычных даркнет-площадках, что снижает порог входа для нетехнических мошенников по всему региону СНГ (Group-IB, 2025).
Этот материал агрегирует лучшие доступные данные из FTC, FBI IC3, EUROPOL, ENISA, Pindrop, McAfee, Sumsub и академических исследований, чтобы дать точную картину угрозы — и средств защиты, которые разворачиваются против неё.
TL;DR
- FBI IC3 зафиксировал 22 000+ жалоб на преступления, «связанные с ИИ», впервые в 2025 году (FBI IC3, 2025).
- Pindrop измерила рост попыток deepfake-мошенничества на 1 300% год к году в 2024 году (Pindrop, 2025).
- FTC: телефонное мошенничество и имперсонация превысили $1,9 млрд заявленных потерь в 2023 году (FTC, 2024).
- FBI IC3: Business Email Compromise нанёс $2,77 млрд убытков в 2024 году; синтез голоса всё чаще упоминается (FBI IC3, 2025).
- McAfee: 77% жертв голосовых дипфейков потеряли деньги; 36% — $500–$3 000 (McAfee, 2023).
- Люди правильно распознают синтетический аудио лишь в 60–73% случаев в контролируемых исследованиях (PLOS One, 2023).
- EUROPOL и ENISA называют клонирование голоса приоритетной возникающей угрозой на 2025–2027 годы.
- Статья 50 Регламента ИИ ЕС о раскрытии синтетического контента вступает в силу в августе 2026 года.
1. Масштаб проблемы: ключевые метрики
Прежде чем разбирать типологии мошенничества, полезно зафиксировать данные, определяющие текущий масштаб.
| Метрика | Значение | Источник |
|---|---|---|
| Жалобы, связанные с ИИ, в FBI IC3 (отчёт 2025) | 22 000+ | FBI IC3, 2025 |
| Рост попыток deepfake-мошенничества год к году (все секторы, 2024) | +1 300% | Pindrop, 2025 |
| Минимальный аудио для клонирования голоса | 30 секунд | Pindrop, 2025 |
| Потери от телефонного мошенничества/имперсонации (FTC, 2023) | $1,9 млрд+ | FTC, 2024 |
| Потери от BEC/CEO-фрода (FBI IC3, 2024) | $2,77 млрд | FBI IC3, 2025 |
| Жертвы голосовых дипфейков, потерявшие деньги | 77% | McAfee, 2023 |
| Жертвы, потерявшие $500–$3 000 за инцидент | 36% | McAfee, 2023 |
| Точность обнаружения синтетического аудио человеком | 60–73% | PLOS One, 2023 |
| Точность коммерческой биометрической детекции | 94–97% | Pindrop / NICE, 2025 |
Основные источники: FBI IC3, FTC ReportFraud, Pindrop, McAfee.
Разрыв между обнаружением человеком (едва выше случайного угадывания) и коммерческой биометрической детекцией (94–97%) — главное обоснование корпоративных инвестиций в голосовую аутентификацию и ключевая уязвимость любой системы, полагающейся исключительно на человеческий слух.
2. Скам деда: клонирование семейных голосов
«Скам деда» (grandparent scam) — одна из наиболее эмоционально разрушительных типологий голосового мошенничества. Звонящий притворяется внуком в беде — авария, арест, медицинский кризис — и просит срочный банковский перевод или оплату подарочными картами. До появления ИИ-синтеза голоса схема опиралась на расплывчатую имитацию и нервозность мошенника. Теперь злоумышленники могут синтезировать убедительную копию голоса внука из нескольких секунд аудио, извлечённого из соцсетей.
FTC идентифицировала скам деда как устойчивую и растущую категорию жалоб, особенно нацеленную на людей старше 60 лет. По данным Consumer Sentinel Network Data Book 2023, мошенничество с имперсонацией стало второй по объёму убытков категорией среди пожилых людей: только в 2023 году люди 60 лет и старше потеряли более $700 млн от мошенничества с имперсонацией (FTC, 2023).
Что делает клонирование голоса особенно опасным здесь: клипы из соцсетей, видео семейных встреч и посты на публичных платформах дают злоумышленникам обильный обучающий материал без технического доступа к устройствам жертвы. Достаточно 15-секундного видео из TikTok.
В контексте России и СНГ: аналогичные схемы реализуются через мессенджеры (Telegram, WhatsApp) и телефонные звонки. Kaspersky лаборатория фиксирует адаптированные версии, направленные против пожилых людей, где злоумышленники используют поводы вроде «внук попал в аварию» или «сын задержан полицией».
Защитная мера: заранее согласовать семейное кодовое слово (случайную фразу, известную только ближайшим родственникам) и перезвонить на проверенный номер перед любой финансовой транзакцией. В США жалобы принимает reportfraud.ftc.gov.
3. CEO-фрод и Business Email Compromise
Business Email Compromise (BEC) эволюционировал от атак только по электронной почте к многоканальным кампаниям, включающим ИИ-генерированные голосовые звонки или голосовые сообщения. Убедительное письмо от «финансового директора» с просьбой срочного перевода имеет ещё больший вес, когда сопровождается звонком с настоящим голосом CFO.
Отчёт FBI IC3 Internet Crime Report 2024 задокументировал $2,77 млрд потерь от BEC в 21 442 жалобах — крупнейшая категория киберпреступлений по денежным потерям, отслеживаемая ведомством (FBI IC3, 2025). Хотя не все жалобы BEC связаны с клонированием голоса, нарративный анализ ведомства выявил резкий рост упоминаний голосовых компонентов в делах 2023 и 2024 годов.
Наиболее цитируемый реальный пример — февральский случай 2024 года с инжиниринговой компанией Arup: финансовый сотрудник в Гонконге перевёл $25,6 млн после видеоконференции с дипфейком, имитировавшим финансового директора компании в Великобритании и других старших коллег (CNN / Полиция Гонконга, 2024). Синтез аудио был частью стека обмана наряду с видеодипфейками.
| Метрика | Значение | Источник |
|---|---|---|
| Потери BEC по FBI IC3 (2024) | $2,77 млрд | FBI IC3, 2025 |
| Жалобы BEC в FBI IC3 (2024) | 21 442 | FBI IC3, 2025 |
| Потеря от дипфейк-звонка Arup (Гонконг, фев. 2024) | $25,6 млн | CNN / Полиция ГК, 2024 |
| BEC как доля от общих потерь IC3 (2024) | Крупнейшая отдельная категория | FBI IC3, 2025 |
Источник: FBI IC3 Annual Report.
Корпоративная защита сосредоточилась на двух уровнях: внеполосная голосовая верификация (перезвонить на заранее зарегистрированный номер, не на тот, с которого звонили) и биометрическое обнаружение активности голоса на уровне колл-центра с точностью более 94%.
4. Войс-спуфинг: более широкая поверхность атаки
Клонирование голоса — это подмножество более широкого ландшафта угроз войс-спуфинга. Internet Organised Crime Threat Assessment (IOCTA) 2024 EUROPOL идентифицирует синтетические аудио и видео как сквозной вектор для мошенничества, социальной инженерии, вымогательства и операций дезинформации, отмечая, что преступное использование инструментов ИИ «больше не является исключительной прерогативой государственных акторов» (EUROPOL, IOCTA 2024).
Threat Landscape 2024 ENISA аналогично классифицирует ИИ-генерированный аудио как «значительный и растущий» компонент атак социальной инженерии (ENISA, 2024).
Таксономия спуфинга в 2026–2027 годах:
| Тип атаки | Техническая основа | Обнаруживаемость (человек) | Обнаруживаемость (биометрическая система) |
|---|---|---|---|
| Простая имперсонация с изменением тона | Только DSP | Высокая | Высокая |
| Воспроизведение записанного аудио | н/д (детекция живости) | Переменная | Высокая |
| Text-to-speech голосом цели | ИИ-синтез | Низкая | Высокая |
| Конверсия голоса в реальном времени | ИИ-синтез, живая трансляция | Низкая | Средняя–высокая |
| Полный дипфейк-звонок (голос+видео) | Мультимодальный синтез | Очень низкая | Высокая (специализированные инструменты) |
Конверсия голоса в реальном времени — преобразование живого голоса звонящего в голос цели — это то, что расширяет угрозу от создания контента (производство поддельного клипа) до живого мошенничества (быть поддельным человеком в реальном времени). Это наиболее актуальный вариант для мошенничества в колл-центрах, скама деда и голосовых BEC-звонков.
5. Региональный обзор: FTC, FBI IC3, EUROPOL и Россия/СНГ
Соединённые Штаты
FTC и FBI IC3 — основные источники данных по США. Consumer Sentinel FTC получил 2,6 млн отчётов о мошенничестве в 2023 году, при этом телефонные звонки оставались наиболее распространённым методом контакта при мошенничестве (17% контактов) (FTC, 2024). Подайте жалобу на reportfraud.ftc.gov или ic3.gov.
Европейский Союз
EUROPOL назвала синтез аудио и видео с помощью ИИ угрозой первого уровня в своём IOCTA 2024. Регламент ИИ ЕС (Статья 50) требует маркировки для синтетического аудио и видео, с поэтапным вступлением в силу с августа 2026 года (Еврокомиссия, 2024). ENISA предоставляет государствам-членам руководство по обнаружению голосового мошенничества.
Справочные документы: EUROPOL IOCTA 2024, ENISA Threat Landscape 2024.
Россия и СНГ: Специфический Контекст
Россия и страны СНГ представляют собой специфический ландшафт угроз и одновременно активный источник атак:
- Kaspersky Lab и Group-IB документируют рост вишинг-кампаний с синтезом голоса, направленных против клиентов банков. Схемы включают имперсонацию сотрудников службы безопасности банка и близких родственников.
- Group-IB в отчёте Hi-Tech Crime Trends 2025 зафиксировала наличие инструментов конверсии голоса в реальном времени на русскоязычных даркнет-площадках, доступных нетехническим мошенникам (Group-IB, 2025).
- Telegram как основной мессенджер в регионе стал новым вектором: голосовые сообщения и звонки через Telegram используются для атак с клонированным голосом в дополнение к обычным телефонным схемам.
- Нормативный пробел: специализированного законодательства о синтетических медиа и клонировании голоса в большинстве стран СНГ не существует. Правоприменение осуществляется по статьям о мошенничестве общего характера.
Ситуация осложняется тем, что некоторые инструменты голосового синтеза, используемые в мошеннических схемах на русскоязычных рынках, разработаны или адаптированы локально, что затрудняет международное сотрудничество правоохранителей.
6. Биометрическая гонка вооружений
Спрос на голосовую аутентификацию растёт быстро. Pindrop оценивает риск мошенничества в колл-центрах США в $44,5 млрд на 2025 год, что стимулировало корпоративное внедрение биометрической детекции живости голоса от поставщиков Pindrop, Nuance (Microsoft), NICE Actimize и Verint. Коммерческие системы теперь достигают 94–97% точности обнаружения синтетического аудио, хотя этот показатель отстаёт от качества генерации примерно на 24 месяца (Pindrop / академический консенсус, 2025).
Состязательная динамика: по мере улучшения детекции инструменты клонирования адаптируются. Наиболее тревожная разработка — состязательный адаптивный синтез — модели, дообученные специально для обхода известных классификаторов детекции путём добавления паттернов микровариаций, обходящих конкретные биометрические сигнатуры. Это ещё не широко распространено в массовых мошеннических наборах инструментов (по состоянию на середину 2026 года), но прогноз угроз ENISA на 2027 год идентифицирует это как вероятную прогрессию.
STIR/SHAKEN (американская система аутентификации caller ID) не обнаруживает синтез голоса, но затрудняет спуфинг caller ID. Полное внедрение среди небольших операторов и на международных маршрутах остаётся незавершённым.
7. Законодательный и регуляторный ландшафт
| Юрисдикция | Инструмент | Ключевое положение | Статус / дата вступления в силу |
|---|---|---|---|
| ЕС | Регламент ИИ, Статья 50 | Маркировка синтетического аудио/видео | Поэтапно с авг. 2026 |
| ЕС | GDPR, Статья 9 | Биометрические данные как особая категория | В силе |
| США | FTC Act, Раздел 5 | Мошенническая имперсонация с помощью ИИ | Применяется |
| США | TRACED Act | Аутентификация caller ID STIR/SHAKEN | Обязательно для крупных операторов, 2021 |
| США (Калифорния) | AB 2602, AB 1836 | ИИ-реплики голоса в контрактах сферы развлечений | В силе с 2025 |
| Бразилия | LGPD | Рамочная защита биометрических данных | В силе, пробел в голосовом мошенничестве |
| Австралия | Online Safety Act 2021 | Обязательства по отчётности о синтетических медиа | Дополнен в 2024 |
ЕС опережает всех в регулировании синтетического контента. После вступления в силу Статьи 50 Регламента ИИ платформы и операторы обязаны раскрывать, когда аудиоконтент создан с помощью ИИ — это создаёт доступный аудиторский след для регуляторов и жертв.
8. Человеческое обнаружение: почему слуха недостаточно
Исследование PLOS One 2023 года проверило способность участников отличить человеческую речь от ИИ-синтезированного аудио в нескольких системах синтеза. Средний показатель обнаружения составил 73% на старых системах и упал примерно до 60% на современных высококачественных моделях — едва выше случайного угадывания (PLOS One, 2023). В условиях живого звонка, где когнитивная нагрузка высока, а звонящий применяет тактики социального давления, реальные показатели почти наверняка падают ещё ниже.
Это не вопрос интеллекта — это фундаментальное ограничение слуха. Артефакты, отличающие синтетический аудио, часто находятся в диапазонах частот или временных микровариациях, для надёжного измерения которых требуется обработка сигналов.
Практический вывод: потребительские средства защиты должны быть процедурными (верификация через обратный звонок, проверка кодовым словом), а не перцептивными. Уверенность в том, что можно «услышать» подделку — это и есть уязвимость.
9. Руководство по защите: что действительно работает
Для физических лиц
- Установите семейное кодовое слово. Заранее согласуйте бессмысленную фразу с близкими. Если взволнованный звонящий не может её назвать — положите трубку и перезвоните на проверенный номер.
- Перезванивайте на известные номера. Никогда не доверяйте идентификации только по номеру, с которого звонят.
- Сообщайте о подозрительных звонках. reportfraud.ftc.gov (США), ic3.gov (FBI), или национальный орган по защите прав потребителей в вашей стране.
- Сократите публичный аудиослед. Голосовые клипы в соцсетях — основной обучающий материал для клонирования.
Для организаций
- Внедрите биометрическую детекцию живости голоса в колл-центрах, обрабатывающих финансовые транзакции или аутентификацию клиентов.
- Установите внеполосное голосовое подтверждение для крупных переводов — обратный звонок на заранее зарегистрированный номер, а не на инициировавший операцию.
- Обучите сотрудников рискам голосовых BEC-звонков. Имперсонация руководителей через голос теперь документированный шаг в BEC-плейбуках (FBI IC3, 2025).
- Включите STIR/SHAKEN там, где доступно, и отслеживайте неаутентифицированные звонки на высокорисковых маршрутах.
Для регуляторов
EUROPOL и ENISA рекомендуют гармонизированные трансграничные системы отчётности, договоры о взаимной правовой помощи, охватывающие ИИ-мошенничество, и минимальные технические стандарты для голосовой аутентификации в регулируемых финансовых услугах — ни один из которых не реализован в полной мере к середине 2026 года.
10. Голосовые технологии с согласия: краткое примечание
Рост мошенничества, основанного на голосовом ИИ, усилил scrutiny в отношении всех голосовых ИИ-технологий — включая законные применения с согласия пользователя. Существует значимое различие между облачными сервисами обработки голоса, загружающими голосовые записи на сторонние серверы без чётких политик хранения данных, и инструментами, предназначенными для локального использования с явным согласием.
VoxBooster выполняет всю обработку голоса с помощью ИИ локально на Windows — аудио не отправляется на внешние серверы. Принцип «согласие прежде всего» важен: легитимные сценарии использования (личное клонирование голоса для доступности, развлечений и творческого производства) зависят от того, останется ли технология доверенной. Если вы оцениваете голосовые ИИ-инструменты — спросите, является ли обработка локальной или облачной, кто хранит обучающий аудио и существует ли явный фреймворк согласия.
FAQ
Насколько распространено мошенничество с клонированием голоса в 2027 году? Мошенничество с клонированием голоса стало одной из наиболее быстро растущих категорий киберугроз. FBI IC3 зафиксировал более 22 000 жалоб, связанных с ИИ, в отчёте 2025 года, а Pindrop задокументировала рост на 1 300% год к году во всех секторах в 2024 году. В России и СНГ вишинг с синтезом голоса фиксируется Kaspersky и Group-IB как устойчивая угроза.
Что такое «скам деда» и как его усиливает клонирование голоса? «Скам деда» — звонок с имитацией внука в беде с просьбой срочного перевода. Клонирование голоса с ИИ позволяет синтезировать убедительную копию из нескольких секунд публичного аудио из соцсетей, делая схему значительно эффективнее традиционных методов имперсонации.
Сколько денег люди теряют из-за голосового мошенничества ежегодно? FTC сообщила о более чем $1,9 млрд задокументированных потерь от телефонного мошенничества и имперсонации в 2023 году. По данным McAfee 2023 года, 77% жертв голосовых дипфейков потеряли деньги, 36% — от $500 до $3 000 за инцидент.
Что такое CEO-фрод (BEC) и как клонирование голоса его усиливает? Business Email Compromise теперь включает звонок с клонированным голосом руководителя. Отчёт FBI IC3 2024 зафиксировал $2,77 млрд потерь от BEC — крупнейшая категория киберпреступлений по деньгам, с синтезом голоса, всё чаще упоминаемым в нарративах.
Как распознать, что в звонке используется клонированный голос? Красные флаги: неожиданная срочность, просьбы о переводах или подарочных картах, неестественные паузы, роботизированная тональность, caller ID не совпадает с контактами. Положите трубку и перезвоните на проверенный номер.
В чём разница между войс-спуфингом и клонированием голоса? Войс-спуфинг — широкая категория: любая техника имитации голоса. Клонирование голоса использует ИИ для генерации новой речи голосом цели — значительно более убедительная и масштабируемая техника, чем старые методы.
Какие защитные инструменты существуют против мошенничества с клонированием голоса? Уровни защиты: верификация через обратный звонок, кодовые слова с близкими, биометрическая детекция в колл-центрах, аутентификация STIR/SHAKEN и Статья 50 Регламента ИИ ЕС с требованиями раскрытия с августа 2026 года.