Системный ИТ-Интегратор • Поставщик отраслевых и бизнес решений с 1991 года
В корзине 0 товаров: 0 руб.
В Вашей корзине пока нет товаров
English version
8 (495) 77 55 123

Услуги

Не является полным распознаванием речи, а находит только заданные пользователем ключевые слова. Каждое найденное вхождение ключевого слова выделяется в речевом сигнале метками его начала и конца.


Технология поиска ключевых слов позволяет найти, определить положение ключевых слов и их сочетаний в большом объеме или в потоке речевой информации.


Методы поиска ключевых слов.

Существует несколько методов решения данной задачи:
  • Метод на основе систем распознавания слитной речи с большим словарем (LVCSR). Преимущество: точность распознавания выше, чем у фонемного подхода. Недостатки: требуются большие вычислительные затраты.
  • Метод на основе фонемного распознавателя. Преимущество: высокая скорость обработки (распознавать 40-50 фонем быстрее, чем несколько тысяч слов). Недостатки: низкая точность распознавания.

Нами выбран подход распознавания ключевых слов на основе LVCSR.


Способы реализации:

  • Программная реализация: поиск выполняется программным обеспечением с использованием любого заданного количества вычислительных ядер ЭВМ.
  • Аппаратная реализация: поиск выполняется программным обеспечением с использованием вычислительной мощности графических ускорителей nVidia.

Скорость обработки:

  • программная реализация на 1 ядре CPU обрабатывает до 8 минут речи в течение 1 минуты реального времени;
  • аппаратная реализация на 1 GPU GTX-580 обрабатывает до 50 минут речи в течение 1 минуты реального времени.


Технические характеристики

  • Реализована возможность обработки звуковых файлов, содержащих речь на русском языке;
  • Находится в стадии тестирования возможность обработки звуковых файлов, содержащих речь на английском и французском языках;
  • Находится в стадии разработки возможность обработки звуковых файлов, содержащих речь на следующих языках: арабский, испанский, китайский, немецкий, японский;
  • Реализована возможность работы со словарем до 2 000 ключевых слов;
  • Реализована возможность регулировки "порога" для каждого ключевого слова;

Поиск ключевых слов выполняется в звуковых файлах со следующими характеристиками: формат - WAV, частота дискретизации - 8кГц, разрядность - 16 бит, кодирование - ИКМ (PCM, без сжатия), А-закон, m-закон, режим записи - моно, Стерео.


Применение технологии поиска ключевых слов позволяет:

  • выделить из общего объема информации данные, содержащие какую-либо важную информацию;
  • снизить риск пропуска важного сообщения из-за перегруженности операторов;
  • автоматически обработать большое количество речевой информации, что экономит время вашего оператора.


Консультации

Мы поможем установить настройки поиска ключевых слов для повышения эффективности обработки ваших данных.
Мы поможем интегрировать технологию в Ваше приложение или комплекс.



Позвоните нам по телефону в Москве:


ИТ-интеграция, AV-компания,видеоконференции, речевые технологии, дистанционное обучение.+ 7 (495) 77-55-123


или заполните Форму в конце страницы
и мы обязательно Вам перезвоним!



Текст сообщения*
Защита от автоматических сообщений
Загрузить изображение
 

Для уточнения стоимости продукта, заполните поля и отправьте запрос.

Защита от автоматического заполнения
Введите символы с картинки*
* - Поля, обязательные для заполнения