|  
Главная | Карта сайта | Контакты | |
 
| Продукты | Решения | Новости | Технологии | Компания | Демонстрации

  ПРОДУКТЫ

 

 


НОВОСТИ

11 Марта, 2006

ГритТек лаборатория анонсировала технологию текстонезависимой идентификации голоса.


Текстонезависимая индентификация дикторов предназначена для автоматической идентификации записи речевого сигнала неизвестного голоса путем сравнения c картотекой “дикторских карточек”. 

Под “дикторской карточкой” понимается структура данных, содержащая полную информацию о данном дикторе (Ф.М.О., дата рождения, пол и т.д.) и его индивидуальные особенности голоса, включая образцы звуковых файлов с его голосом.

Система эффективно может быть использована:
  • Для автоматической идентификации неизвестного голоса по фонограммам телефонных переговоров;
  • В системах с повышенным уровнем безопасности, например, компьютерный доступ к информации, доступ к которой ограничен заданным кругом лиц.
Разработанный алгоритм идентификации основан на попарном сравнении спектральных характеристик голоса неизвестного диктора с спектральными характеристиками записи голоса дикторской карточки, хранимой в системе.

Вычисление спектральных характеристик выполняется с учетом динамического определения уровня канальных искажений и внешних помех. Это позволяет компенсировать канальные искажения и воздействия внешних помех при сравнении спектральных характеристик, вносимых в исходный речевой сигнал. Чувствительность идентификации определяется уровнем установки порогов вероятности ошибок 1-го (FRR) и 2-го (FAR) рода.

Достоинства
  • Операции с низким уровнем SNR;
  • Быстрая адаптация к канальным искажениям и внешним шумам;
  • Надежность идентификации дикторов не менее 91% при сравнении пары речевых сигналов передаваемых по одному и тому же каналу связи и длительности входного сигнала - не менее 15 сек.;
  • Надежность идентификации дикторов не менее 85 % при сравнении пары речевых сигналов передаваемых по разным каналам связи и длительности входного сигнала - не менее 15 сек.;
  • Длительность речевого сигнала для корректного получения индивидуальных особенностей голоса диктора - не менее 60 сек.
    Автоматическая идентификация и обучение, не требующая специальных навыков оператора;
  • Простота встраивания в целевое приложение.

Требования к сигналу
  • Формат сигнала: 16-bits linear;
  • Частота оцифровки: 8 kГц;
  • Отношение сигнал-шум (SNR), не менее 10 db;
  • Полоса частот сигнала: 300-3500 Гц или лучше.

О компании GritTec
ГритТек лаборатория специализируется на исследованиях и разработках уникальных алгоритмовв области цифровой обработки сигнала (DSP) и аудио-речевых технологий. Основные исследования ГритТек лаборатории сфокусированы в области: технологий шумоподавления и восстановления речевых сигналов, технологий биометрии голоса, анализа и синтеза речевых сигналов.
Url: http://www.grittec.ru