Статистика мошенничества с клонированием голоса 2027

FBI IC3 зафиксировал более 22 000 жалоб, связанных с ИИ, в своём Internet Crime Report 2025 — первый год, когда ведомство официально ввело дескриптор «AI-related» для преступлений (FBI IC3, 2025). Отчёт Pindrop Voice Intelligence and Security Report 2025 зафиксировал рост попыток deepfake-мошенничества на 1 300% год к году во всех отраслях в 2024 году. FTC задокументировала более $1,9 млрд заявленных потерь от телефонного мошенничества и имперсонации в 2023 году, а потребительский опрос McAfee показал: 77% жертв голосовых дипфейков потеряли деньги — 36% от $500 до $3 000 за инцидент (McAfee, 2023).

В контексте России и СНГ картина дополняется данными Kaspersky и Group-IB, которые документируют устойчивый рост вишинг-кампаний с использованием синтеза голоса против клиентов банков и частных лиц. Group-IB в отчёте Hi-Tech Crime Trends 2025 зафиксировала наличие инструментов конверсии голоса в реальном времени на русскоязычных даркнет-площадках, что снижает порог входа для нетехнических мошенников по всему региону СНГ (Group-IB, 2025).

Этот материал агрегирует лучшие доступные данные из FTC, FBI IC3, EUROPOL, ENISA, Pindrop, McAfee, Sumsub и академических исследований, чтобы дать точную картину угрозы — и средств защиты, которые разворачиваются против неё.

TL;DR

FBI IC3 зафиксировал 22 000+ жалоб на преступления, «связанные с ИИ», впервые в 2025 году (FBI IC3, 2025).
Pindrop измерила рост попыток deepfake-мошенничества на 1 300% год к году в 2024 году (Pindrop, 2025).
FTC: телефонное мошенничество и имперсонация превысили $1,9 млрд заявленных потерь в 2023 году (FTC, 2024).
FBI IC3: Business Email Compromise нанёс $2,77 млрд убытков в 2024 году; синтез голоса всё чаще упоминается (FBI IC3, 2025).
McAfee: 77% жертв голосовых дипфейков потеряли деньги; 36% — $500–$3 000 (McAfee, 2023).
Люди правильно распознают синтетический аудио лишь в 60–73% случаев в контролируемых исследованиях (PLOS One, 2023).
EUROPOL и ENISA называют клонирование голоса приоритетной возникающей угрозой на 2025–2027 годы.
Статья 50 Регламента ИИ ЕС о раскрытии синтетического контента вступает в силу в августе 2026 года.

1. Масштаб проблемы: ключевые метрики

Прежде чем разбирать типологии мошенничества, полезно зафиксировать данные, определяющие текущий масштаб.

Метрика	Значение	Источник
Жалобы, связанные с ИИ, в FBI IC3 (отчёт 2025)	22 000+	FBI IC3, 2025
Рост попыток deepfake-мошенничества год к году (все секторы, 2024)	+1 300%	Pindrop, 2025
Минимальный аудио для клонирования голоса	30 секунд	Pindrop, 2025
Потери от телефонного мошенничества/имперсонации (FTC, 2023)	$1,9 млрд+	FTC, 2024
Потери от BEC/CEO-фрода (FBI IC3, 2024)	$2,77 млрд	FBI IC3, 2025
Жертвы голосовых дипфейков, потерявшие деньги	77%	McAfee, 2023
Жертвы, потерявшие $500–$3 000 за инцидент	36%	McAfee, 2023
Точность обнаружения синтетического аудио человеком	60–73%	PLOS One, 2023
Точность коммерческой биометрической детекции	94–97%	Pindrop / NICE, 2025

Основные источники: FBI IC3, FTC ReportFraud, Pindrop, McAfee.

Разрыв между обнаружением человеком (едва выше случайного угадывания) и коммерческой биометрической детекцией (94–97%) — главное обоснование корпоративных инвестиций в голосовую аутентификацию и ключевая уязвимость любой системы, полагающейся исключительно на человеческий слух.

2. Скам деда: клонирование семейных голосов

«Скам деда» (grandparent scam) — одна из наиболее эмоционально разрушительных типологий голосового мошенничества. Звонящий притворяется внуком в беде — авария, арест, медицинский кризис — и просит срочный банковский перевод или оплату подарочными картами. До появления ИИ-синтеза голоса схема опиралась на расплывчатую имитацию и нервозность мошенника. Теперь злоумышленники могут синтезировать убедительную копию голоса внука из нескольких секунд аудио, извлечённого из соцсетей.

FTC идентифицировала скам деда как устойчивую и растущую категорию жалоб, особенно нацеленную на людей старше 60 лет. По данным Consumer Sentinel Network Data Book 2023, мошенничество с имперсонацией стало второй по объёму убытков категорией среди пожилых людей: только в 2023 году люди 60 лет и старше потеряли более $700 млн от мошенничества с имперсонацией (FTC, 2023).

Что делает клонирование голоса особенно опасным здесь: клипы из соцсетей, видео семейных встреч и посты на публичных платформах дают злоумышленникам обильный обучающий материал без технического доступа к устройствам жертвы. Достаточно 15-секундного видео из TikTok.

В контексте России и СНГ: аналогичные схемы реализуются через мессенджеры (Telegram, WhatsApp) и телефонные звонки. Kaspersky лаборатория фиксирует адаптированные версии, направленные против пожилых людей, где злоумышленники используют поводы вроде «внук попал в аварию» или «сын задержан полицией».

Защитная мера: заранее согласовать семейное кодовое слово (случайную фразу, известную только ближайшим родственникам) и перезвонить на проверенный номер перед любой финансовой транзакцией. В США жалобы принимает reportfraud.ftc.gov.

3. CEO-фрод и Business Email Compromise

Business Email Compromise (BEC) эволюционировал от атак только по электронной почте к многоканальным кампаниям, включающим ИИ-генерированные голосовые звонки или голосовые сообщения. Убедительное письмо от «финансового директора» с просьбой срочного перевода имеет ещё больший вес, когда сопровождается звонком с настоящим голосом CFO.

Отчёт FBI IC3 Internet Crime Report 2024 задокументировал $2,77 млрд потерь от BEC в 21 442 жалобах — крупнейшая категория киберпреступлений по денежным потерям, отслеживаемая ведомством (FBI IC3, 2025). Хотя не все жалобы BEC связаны с клонированием голоса, нарративный анализ ведомства выявил резкий рост упоминаний голосовых компонентов в делах 2023 и 2024 годов.

Наиболее цитируемый реальный пример — февральский случай 2024 года с инжиниринговой компанией Arup: финансовый сотрудник в Гонконге перевёл $25,6 млн после видеоконференции с дипфейком, имитировавшим финансового директора компании в Великобритании и других старших коллег (CNN / Полиция Гонконга, 2024). Синтез аудио был частью стека обмана наряду с видеодипфейками.

Метрика	Значение	Источник
Потери BEC по FBI IC3 (2024)	$2,77 млрд	FBI IC3, 2025
Жалобы BEC в FBI IC3 (2024)	21 442	FBI IC3, 2025
Потеря от дипфейк-звонка Arup (Гонконг, фев. 2024)	$25,6 млн	CNN / Полиция ГК, 2024
BEC как доля от общих потерь IC3 (2024)	Крупнейшая отдельная категория	FBI IC3, 2025

Источник: FBI IC3 Annual Report.

Корпоративная защита сосредоточилась на двух уровнях: внеполосная голосовая верификация (перезвонить на заранее зарегистрированный номер, не на тот, с которого звонили) и биометрическое обнаружение активности голоса на уровне колл-центра с точностью более 94%.

4. Войс-спуфинг: более широкая поверхность атаки

Клонирование голоса — это подмножество более широкого ландшафта угроз войс-спуфинга. Internet Organised Crime Threat Assessment (IOCTA) 2024 EUROPOL идентифицирует синтетические аудио и видео как сквозной вектор для мошенничества, социальной инженерии, вымогательства и операций дезинформации, отмечая, что преступное использование инструментов ИИ «больше не является исключительной прерогативой государственных акторов» (EUROPOL, IOCTA 2024).

Threat Landscape 2024 ENISA аналогично классифицирует ИИ-генерированный аудио как «значительный и растущий» компонент атак социальной инженерии (ENISA, 2024).

Таксономия спуфинга в 2026–2027 годах:

Тип атаки	Техническая основа	Обнаруживаемость (человек)	Обнаруживаемость (биометрическая система)
Простая имперсонация с изменением тона	Только DSP	Высокая	Высокая
Воспроизведение записанного аудио	н/д (детекция живости)	Переменная	Высокая
Text-to-speech голосом цели	ИИ-синтез	Низкая	Высокая
Конверсия голоса в реальном времени	ИИ-синтез, живая трансляция	Низкая	Средняя–высокая
Полный дипфейк-звонок (голос+видео)	Мультимодальный синтез	Очень низкая	Высокая (специализированные инструменты)

Конверсия голоса в реальном времени — преобразование живого голоса звонящего в голос цели — это то, что расширяет угрозу от создания контента (производство поддельного клипа) до живого мошенничества (быть поддельным человеком в реальном времени). Это наиболее актуальный вариант для мошенничества в колл-центрах, скама деда и голосовых BEC-звонков.

5. Региональный обзор: FTC, FBI IC3, EUROPOL и Россия/СНГ

Соединённые Штаты

FTC и FBI IC3 — основные источники данных по США. Consumer Sentinel FTC получил 2,6 млн отчётов о мошенничестве в 2023 году, при этом телефонные звонки оставались наиболее распространённым методом контакта при мошенничестве (17% контактов) (FTC, 2024). Подайте жалобу на reportfraud.ftc.gov или ic3.gov.

Европейский Союз

EUROPOL назвала синтез аудио и видео с помощью ИИ угрозой первого уровня в своём IOCTA 2024. Регламент ИИ ЕС (Статья 50) требует маркировки для синтетического аудио и видео, с поэтапным вступлением в силу с августа 2026 года (Еврокомиссия, 2024). ENISA предоставляет государствам-членам руководство по обнаружению голосового мошенничества.

Справочные документы: EUROPOL IOCTA 2024, ENISA Threat Landscape 2024.

Россия и СНГ: Специфический Контекст

Россия и страны СНГ представляют собой специфический ландшафт угроз и одновременно активный источник атак:

Kaspersky Lab и Group-IB документируют рост вишинг-кампаний с синтезом голоса, направленных против клиентов банков. Схемы включают имперсонацию сотрудников службы безопасности банка и близких родственников.
Group-IB в отчёте Hi-Tech Crime Trends 2025 зафиксировала наличие инструментов конверсии голоса в реальном времени на русскоязычных даркнет-площадках, доступных нетехническим мошенникам (Group-IB, 2025).
Telegram как основной мессенджер в регионе стал новым вектором: голосовые сообщения и звонки через Telegram используются для атак с клонированным голосом в дополнение к обычным телефонным схемам.
Нормативный пробел: специализированного законодательства о синтетических медиа и клонировании голоса в большинстве стран СНГ не существует. Правоприменение осуществляется по статьям о мошенничестве общего характера.

Ситуация осложняется тем, что некоторые инструменты голосового синтеза, используемые в мошеннических схемах на русскоязычных рынках, разработаны или адаптированы локально, что затрудняет международное сотрудничество правоохранителей.

6. Биометрическая гонка вооружений

Спрос на голосовую аутентификацию растёт быстро. Pindrop оценивает риск мошенничества в колл-центрах США в $44,5 млрд на 2025 год, что стимулировало корпоративное внедрение биометрической детекции живости голоса от поставщиков Pindrop, Nuance (Microsoft), NICE Actimize и Verint. Коммерческие системы теперь достигают 94–97% точности обнаружения синтетического аудио, хотя этот показатель отстаёт от качества генерации примерно на 24 месяца (Pindrop / академический консенсус, 2025).

Состязательная динамика: по мере улучшения детекции инструменты клонирования адаптируются. Наиболее тревожная разработка — состязательный адаптивный синтез — модели, дообученные специально для обхода известных классификаторов детекции путём добавления паттернов микровариаций, обходящих конкретные биометрические сигнатуры. Это ещё не широко распространено в массовых мошеннических наборах инструментов (по состоянию на середину 2026 года), но прогноз угроз ENISA на 2027 год идентифицирует это как вероятную прогрессию.

STIR/SHAKEN (американская система аутентификации caller ID) не обнаруживает синтез голоса, но затрудняет спуфинг caller ID. Полное внедрение среди небольших операторов и на международных маршрутах остаётся незавершённым.

7. Законодательный и регуляторный ландшафт

Юрисдикция	Инструмент	Ключевое положение	Статус / дата вступления в силу
ЕС	Регламент ИИ, Статья 50	Маркировка синтетического аудио/видео	Поэтапно с авг. 2026
ЕС	GDPR, Статья 9	Биометрические данные как особая категория	В силе
США	FTC Act, Раздел 5	Мошенническая имперсонация с помощью ИИ	Применяется
США	TRACED Act	Аутентификация caller ID STIR/SHAKEN	Обязательно для крупных операторов, 2021
США (Калифорния)	AB 2602, AB 1836	ИИ-реплики голоса в контрактах сферы развлечений	В силе с 2025
Бразилия	LGPD	Рамочная защита биометрических данных	В силе, пробел в голосовом мошенничестве
Австралия	Online Safety Act 2021	Обязательства по отчётности о синтетических медиа	Дополнен в 2024

ЕС опережает всех в регулировании синтетического контента. После вступления в силу Статьи 50 Регламента ИИ платформы и операторы обязаны раскрывать, когда аудиоконтент создан с помощью ИИ — это создаёт доступный аудиторский след для регуляторов и жертв.

8. Человеческое обнаружение: почему слуха недостаточно

Исследование PLOS One 2023 года проверило способность участников отличить человеческую речь от ИИ-синтезированного аудио в нескольких системах синтеза. Средний показатель обнаружения составил 73% на старых системах и упал примерно до 60% на современных высококачественных моделях — едва выше случайного угадывания (PLOS One, 2023). В условиях живого звонка, где когнитивная нагрузка высока, а звонящий применяет тактики социального давления, реальные показатели почти наверняка падают ещё ниже.

Это не вопрос интеллекта — это фундаментальное ограничение слуха. Артефакты, отличающие синтетический аудио, часто находятся в диапазонах частот или временных микровариациях, для надёжного измерения которых требуется обработка сигналов.

Практический вывод: потребительские средства защиты должны быть процедурными (верификация через обратный звонок, проверка кодовым словом), а не перцептивными. Уверенность в том, что можно «услышать» подделку — это и есть уязвимость.

9. Руководство по защите: что действительно работает

Для физических лиц

Установите семейное кодовое слово. Заранее согласуйте бессмысленную фразу с близкими. Если взволнованный звонящий не может её назвать — положите трубку и перезвоните на проверенный номер.
Перезванивайте на известные номера. Никогда не доверяйте идентификации только по номеру, с которого звонят.
Сообщайте о подозрительных звонках. reportfraud.ftc.gov (США), ic3.gov (FBI), или национальный орган по защите прав потребителей в вашей стране.
Сократите публичный аудиослед. Голосовые клипы в соцсетях — основной обучающий материал для клонирования.

Для организаций

Внедрите биометрическую детекцию живости голоса в колл-центрах, обрабатывающих финансовые транзакции или аутентификацию клиентов.
Установите внеполосное голосовое подтверждение для крупных переводов — обратный звонок на заранее зарегистрированный номер, а не на инициировавший операцию.
Обучите сотрудников рискам голосовых BEC-звонков. Имперсонация руководителей через голос теперь документированный шаг в BEC-плейбуках (FBI IC3, 2025).
Включите STIR/SHAKEN там, где доступно, и отслеживайте неаутентифицированные звонки на высокорисковых маршрутах.

Для регуляторов

EUROPOL и ENISA рекомендуют гармонизированные трансграничные системы отчётности, договоры о взаимной правовой помощи, охватывающие ИИ-мошенничество, и минимальные технические стандарты для голосовой аутентификации в регулируемых финансовых услугах — ни один из которых не реализован в полной мере к середине 2026 года.

10. Голосовые технологии с согласия: краткое примечание

Рост мошенничества, основанного на голосовом ИИ, усилил scrutiny в отношении всех голосовых ИИ-технологий — включая законные применения с согласия пользователя. Существует значимое различие между облачными сервисами обработки голоса, загружающими голосовые записи на сторонние серверы без чётких политик хранения данных, и инструментами, предназначенными для локального использования с явным согласием.

VoxBooster выполняет всю обработку голоса с помощью ИИ локально на Windows — аудио не отправляется на внешние серверы. Принцип «согласие прежде всего» важен: легитимные сценарии использования (личное клонирование голоса для доступности, развлечений и творческого производства) зависят от того, останется ли технология доверенной. Если вы оцениваете голосовые ИИ-инструменты — спросите, является ли обработка локальной или облачной, кто хранит обучающий аудио и существует ли явный фреймворк согласия.

FAQ

Насколько распространено мошенничество с клонированием голоса в 2027 году? Мошенничество с клонированием голоса стало одной из наиболее быстро растущих категорий киберугроз. FBI IC3 зафиксировал более 22 000 жалоб, связанных с ИИ, в отчёте 2025 года, а Pindrop задокументировала рост на 1 300% год к году во всех секторах в 2024 году. В России и СНГ вишинг с синтезом голоса фиксируется Kaspersky и Group-IB как устойчивая угроза.

Что такое «скам деда» и как его усиливает клонирование голоса? «Скам деда» — звонок с имитацией внука в беде с просьбой срочного перевода. Клонирование голоса с ИИ позволяет синтезировать убедительную копию из нескольких секунд публичного аудио из соцсетей, делая схему значительно эффективнее традиционных методов имперсонации.

Сколько денег люди теряют из-за голосового мошенничества ежегодно? FTC сообщила о более чем $1,9 млрд задокументированных потерь от телефонного мошенничества и имперсонации в 2023 году. По данным McAfee 2023 года, 77% жертв голосовых дипфейков потеряли деньги, 36% — от $500 до $3 000 за инцидент.

Что такое CEO-фрод (BEC) и как клонирование голоса его усиливает? Business Email Compromise теперь включает звонок с клонированным голосом руководителя. Отчёт FBI IC3 2024 зафиксировал $2,77 млрд потерь от BEC — крупнейшая категория киберпреступлений по деньгам, с синтезом голоса, всё чаще упоминаемым в нарративах.

Как распознать, что в звонке используется клонированный голос? Красные флаги: неожиданная срочность, просьбы о переводах или подарочных картах, неестественные паузы, роботизированная тональность, caller ID не совпадает с контактами. Положите трубку и перезвоните на проверенный номер.

В чём разница между войс-спуфингом и клонированием голоса? Войс-спуфинг — широкая категория: любая техника имитации голоса. Клонирование голоса использует ИИ для генерации новой речи голосом цели — значительно более убедительная и масштабируемая техника, чем старые методы.

Какие защитные инструменты существуют против мошенничества с клонированием голоса? Уровни защиты: верификация через обратный звонок, кодовые слова с близкими, биометрическая детекция в колл-центрах, аутентификация STIR/SHAKEN и Статья 50 Регламента ИИ ЕС с требованиями раскрытия с августа 2026 года.