Система экспресс-исследований фонограмм речи "Трал Лаб"

Система Трал Лаб предназначена для использования в фоноскопических лабораториях с целью решения следующих задач:
- Ускорение экспертного идентификационного исследования при проведении многообъектных фоноскопических экспертиз за счет отсева заведомо «чужих» дикторов и ранжирования оставшихся по степени близости биометрических признаков устной речи
- Оперативное установление по представленным фонограммам степени близости голосов лиц по биометрическим признакам.
Работа системы заключается в автоматическом выделении из представленных на исследования фонограмм идентификационно значимых признаков голоса и речи и последующем их сравнении.
Результатом работы системы является список фонограмм, содержащих с указанной вероятностью речь интересующих дикторов.
Функциональные возможности
- ведение локальной фонотеки
- автоматическая оценка качества фонограмм
- автоматическое разделение монофонических фонограмм, содержащих диалог, на отдельные фонограммы, содержащие речь дикторов, участвовавших в диалоге
- автоматическое извлечение биометрических идентификационно-значимых признаков голоса и речи диктора
- проведение автоматического поиска по голосу тремя методами с принятием обобщенного решения
- формирование отчетов о результатах исследования
Технические характеристики
Время выделения биометрических признаков по образцу речи продолжительностью не более 96 сек (при использовании компьютера на базе Pentium IV/3ГГц, 1 ядро)
предварительная обработка и оценка качества фонограммы |
не более 20 сек. |
спектрально-форматный метод |
не более 7 сек. |
метод статистик основного тона |
не более 32 сек. |
метод смеси гауссовых распределений |
не более 23 сек. |
Время сравнения одной пары карточек (при использовании компьютера с процессором Pentium IV/3ГГц, 1 ядро)
всеми методами с принятием обобщённого решения не более 0,033 сек.
Остальные характеристики
Максимальное количество эталонных карточек в одной фонотеке: |
до 10 тысяч |
Максимальное количество эталонных карточек в одной фонотеке: |
до 10 тысяч |
Максимальный объем голосовой модели при продолжительности речевого сигнала 96 сек. |
1 МБ. |
Показатели надежности сравнения с использованием обобщенного решения для сигналов, имеющих отношение сигнал/шум не менее 20 дБ |
95% при сравнении пары речевых сигналов длительностью не менее 96 сек. каждый; 88% при сравнении пары речевых сигналов длительностью 16 сек. и 96 сек; 82% при сравнении пары речевых сигналов длительностью 16 сек. каждый; не менее 90% при сравнении пары речевых сигналов длительностью 16 сек. и 96 сек., передаваемых по одному и тому же каналу связи. |