Аппаратно-программный комплекс VoiceCompare предназначен для решения задач голосовой идентификации и аутентификации по фонограммам произвольного содержания.
Область применения
— Контроль доступа к информации
— Контроль доступа к компьютерным терминалам
— Голосовой доступ к системам цифровой связи
— Голосовой доступ к конфиденциальным, например, банковским данным по телефону
— Системы электронной торговли (вход в систему по голосовому паролю по телефону).
— Службы безопасности предприятий.
— Центры обработки вызовов (Контакт центры).
При использовании в Центрах Обработки Вызовов (ЦОВ) назначение системы:
повышение качества обслуживания клиентов за счет идентификации абонента не только
по АОНу, но и по голосу после начала разговора.
Система позволяет во время разговора автоматически получать дополнительную инфор-
мацию о постоянных клиентах ЦОВ, производить анализ и разбор спорных ситуаций, пре-
секать нежелательные звонки, производить идентификацию личности неизвестного або-
нента и т. д.
Описание.
VoiceCompare использует произвольные аудиозаписи для создания эталонных образцов речи — «дикторских» карточек. Каждая такая карточка содержит в себе голосовые параметры определенного человека — «акустическую модель», а также одну или несколько записей — образцов голоса и другие необходимые индивидуальные биометрические данные. Для идентификации личности производится проверка совпадения предъявляемой аудиозаписи и образцов голоса из «дикторских» карточек.
Характеристики голоса сравниваются по ряду акустических параметров и на основе количества совпадений с записанными «акустическими моделями» в базе данных система отмечает совпадение исследуемого голоса с голосом конкретного человека, либо создаёт новую «акустическую модель», если новый голос не обнаружен в базе.
Алгоритм работы подсистемы идентификации состоит из нескольких этапов:
— детектирование речи в канале
— нормирование речевого сигнала и удаление пауз в потоке речи
— определение гендерного признака (пол) говорящего
— разделение в потоке речи удаленного и ближнего абонента
— создание параметрического образа выбранного речевого фрагмента (создание эталона) и формирование базы эталонов
— проведение сравнения образа испытуемого речевого фрагмента с эталоном и нахождение ближайшего претендента
— принятие решения о соответствии испытуемого речевого фрагмента эталону или группе эталонов
Для идентификации могут использоваться любые аудиозаписи, в том числе полученные на аналоговых телефонных линиях низкого качества, цифровых абонентских и VoIP-линиях. VoiceCompare работает в сопряжении с системой записи, которая используется в качестве источника аудиозаписей. Также источником звуковых записей могут быть аудиофайлы в стандартных форматах (в том числе, расположенные на сетевых ресурсах).
Работа системы не зависит от какого-либо национального языка. Не имеет значения, что именно и на каком языке говорит человек. Это свойство делает систему применимой для интернациональных переговоров.
В системе реализованы все необходимые компоненты для подготовки и проведения голосовой идентификации большого количества дикторов единовременно.
Особенности
Распределенная архитектура — сервер идентификации, АРМ оператора системы могут быть размещены на различных компьютерах. Связь между серверами VoiceCompare Server и VoiceCompare Client оператора производится по протоколу TCP/IP (через локальную сеть или Интернет).
Положение распознаваемого фрагмента записи может быть настроено пользователем. Это позволяет исключить из обработки нежелательные фрагменты (например, музыкальные вставки в начале или конце записи).
В Системе поддерживается многоуровневое разграничение прав доступа.
Состав системы.
Система поставляется в виде аппаратной платформы (система записи СЗ4-1 с ПО «Омега») и программного обеспечения VoiceCompare, реализующего функциональность идентификации диктора по голосу. Также VoiceCompare может адаптироваться под любую систему записи и базу фонограмм, выбранную Заказчиком.
Характеристики системы VoiceCompare:
| Параметр | Значение |
| Общая емкость СУБД | До 100 000. записей |
| Требования к аудиозаписям: | |
| Тип аудиофайлов | Wav |
| Формат аудиофайлов | 16 bit PCM |
| Частота дискретизации сигнала | Не менее 8 кГц |
| Длительность записи | Не менее 10 с |
| Длительность аудиозаписи для корректного получения индивидуальных особенностей голоса диктора, используемых при построении «дикторской» карточки | Не менее 10 с |
| Отношение сигнал/шум | Не менее 10 дБ |
| Надежность идентификации: | |
| При сравнении пары речевых сигналов, передаваемых по одному и тому же каналу связи, и длительности входного сигнала не менее 10 с в % | Не менее 95 |
| При сравнении пары речевых сигналов, передаваемых по разным каналам связи, и длительности входного сигнала не менее 10 с в % | Не менее 93 |
Требования к аппаратной платформе:
- Сервер:
— Количество обрабатываемых каналов — до 16: двухядерный процессор 2.8 ГГц, 2 ГБ оперативной памяти, видеокарта 32 МБ, HDD-250 Гбайт и выше.
— Количество обрабатываемых каналов — до 30: четыреххядерный процессор 2.8 ГГц, 2 Гбайта оперативной памяти. видеокарта 32 МБ, HDD-250 Гбайт и выше. Сеть -100 мбит/c
2. Клиент:
— Pentium IV, 2 ГГц, 1 Гбайт оперативной памяти, видеокарта 32 МБ, HDD-100 Гбайт и выше.
3. Операционная система:
Windows XP professional/Windows Vista/Windows 7 professional (ultimate), Windows 2003 (2007) Server
Требуемое дополнительное ПО: SQL Server 2005, .Net Framework 3.5(поставляются вместе с программой).
Основные экранные формы показаны ниже:
Главное окно VoiceCompare Server
Главное окно VoiceCompare Server с окном настроек
Программа зарегистрирована в Национальном центре интеллектуальной собственности
Программа награждена совместно с Объединенным институтом проблем информатики НАН РБ (ОИПИ) дипломом выставки ПТС 2010.
О применении речевых технологий в вопросах биометрии читайте в журнале «Технологии безопасности» № 4 2010 г., стр. 18 – 19.
Руководитель разработки: Никифоров С.Н.
Моб. тел. (029) 661-49-63






































































