Технология распознавания речи

Набор алгоритмов обработки аудиосигналов и анализа текста, обученных на большом количестве размеченных вручную данных.
ТЕхнология распознавания речи
Правильно переводить голос в текст для того, что бы впоследствии текст переводить в синтезированный голос (вы пишите текст, а в результате воспроизводится голос);
Обучить модели для правильного расставления пауз, правильных смысловых интонаций, тона и громкости в зависимости от смысла предложения.
главные задачи
82%
точность на зашумлённых данных из телефонии
Возможности
Работает в облаке и в периметре заказчика.
Возможна параллельная обработка нескольких голосовых потоков.
Высокая скорость распознавания (15 сек. аудио за 0,5-1 сек.).
ТЕхнология распознавания речи
Полностью кастомизируется под предметную область заказчика.
6 real-time factor скорость обработки данных в облаке, что на 40-80% выше скорости конкурирующих сервисов.
Различные модули пост обработки (фильтр мата, перевод цифр, расстановка пунктуации, определение пауз).
Точные таймстампы начала каждого распознанного слова.
Применение архитектуры BERT (обеспечивает синтаксическую связность).