Технология распознавания речи — это распознавание человеческой речи компьютерами с последующим выполнением программы или функции, инициируемой голосом. Задача, с которой так легко справляется человеческий мозг, — интерпретация речи среди всех акцентов, высоты тона, артикуляции, вокализации и произношения — для компьютера становится проблемой.
Более того, естественный процесс генерации голоса у людей — это нелинейный процесс, который не только находится под сознательным контролем, но и может изменяться в зависимости от таких разнообразных факторов, как пол, воспитание или эмоциональное состояние. Этот рисунок дополнительно искажается из-за шума и эха в окружающей среде.
Еще одна проблема заключается в том, что речь редко бывает сдержанной; это всегда непрерывный поток слов с трудно различимыми паузами между ними. Наличие омонимов также может усугублять ситуацию. Это дает пищу для размышлений новаторам и ученым для разработки новых средств улучшения преобладающих технологий и их превращения в современное состояние.
С Уважением, МониторБанк