«Распознавание речи»- что же это такое и зачем нужно? Человек получает информацию(раздражители) из внешнего мира с помощью пяти органов чувств:
- зрение;
- слух;
- обоняние (нос);
- осязание (кожа);
- вкус (язык).
«Речь» - мы воспринимает с помощью слуха. Речь – это источник информации, одним из первых ставших доступным человеческим существам (первым были жесты). Таким способом передачи информации пользуется не только человек. У животных это – лай, мяуканье, скрипы, кваканье и т.д. На определённом этапе развития у человека появилась необходимость в механизмах, а позже и электронике, которая ими управляла. Проще говоря, появилась необходимость в помощнике, который быстро работает, не спит, не ест, не ошибается и всегда слушается человека. С момента возникновения первых ЭВМ встал вопрос – как передать машине данные и команды от человека? Не углубляясь в историю скажем, что вылилось все в достаточно широкий набор периферийных устройств (ПУ) ввода\вывода(ВВ) информации (под информацией я также понимаю и управляющие команды). Наиболее распространённые из них это – «мышь», клавиатура, монитор, flash-магнитные- оптические накопители и т.д. С помощью этих устройств мы можем передавать процессору для обработки данные и команды управляющие процессом. В похожем качестве, не заменяющем но удобно дополняющем, выступает речевой человеко-машинный интерфейс (РЧМИ). Все описанные выше интерфейсы имеют один существенный недостаток, они требуют как минимум тактильного контакта. РЧМИ – является наиболее естественным и удобным для человека, не требует для дистанционного взаимодействия ПУ радиоустройств, не требует от оператора определённого уровня навыков использования ПУ ВВ ЭВМ, не требует непосредственного тактильного контакта с оператором. Из описанных свойств, проистекают и новые возможности использования нового интерфейса:
- управление ЭВМ людьми с ограниченными возможностями;
- более удобный способ управления ЭВМ людьми с нормальными способностями;
- автоматическая расшифровка устной речи в текст;
- аутентификация диктора;
- определение по параметрам речи – характеристик диктора.