Модули распознавания голоса: порядок работы и приложения

Попробуйте наш инструмент устранения неполадок





Развитие технологий привело к развитию интеллектуальной техники интерфейса человек-машина, которая упрощает управление компьютерами, машинами или роботами с помощью голосовых команд человека без использования каких-либо систем ввода, таких как клавиатура или мышь. Этот человеко-машинный интерфейс (HMI) может быть реализован с помощью распознавание голоса модули. В этой статье мы обсудим модули распознавания голоса, а также порядок их работы и приложения.

Голосовой модуль

Голосовой модуль



Модуль распознавания голоса

Распознавание голоса - это метод, обеспечивающий естественное и удобное человеко-машинный интерфейс с помощью модуля распознавания голоса. Он извлекает и анализирует голосовые особенности человека, передаваемые на машину или компьютер через микрофон. Техника распознавания голоса подразделяется на множество типов на основе различных критериев, таких как объем пользователей, количество слов, используемых для распознавания, естественность речи. Если уровень распознавания голоса больше 95%, то практически используется только распознавание голоса.


Принцип работы модуля распознавания голоса

HM2007 - однокристальный CMOS модуль распознавания голоса. Это встроенная аналоговая интерфейсная крупномасштабная интегральная схема с анализом голоса, распознаванием речи и процессами управления системой распознавания речи. HM2007 может работать в двух режимах: ручном режиме и режиме управления CPU.



HM2007

Схема контактов HM2007

В ручном режиме работы модуль распознавания голоса HM2007 используется для построения простой системы распознавания путем подключения таких компонентов, как клавиатура, SRAM с памятью 8 Кбайт и другие компоненты. Если питание включено, HM2007 запускает процесс инициализации и, если вывод WAIT равен L, HM2007 проверяет внешнюю память: 8 Кбайт SRAM - исправна она или нет. Но если WAIT - H, то процесс проверки памяти будет пропущен HM2007. После этого процесса инициализации HM2007 переходит в режим распознавания. В режиме распознавания, если вывод WAIT - H, то HM2007 готов принять голос и начинает процесс распознавания. Если вывод WAIT - L, то HM2007 не принимает голос, который необходимо распознать. Затем обучение новых шаблонов путем очистки обученных шаблонов - это две операции, выполняемые с помощью функциональных клавиш: TRN и CLR. Все шаблоны в HM2007 можно очистить, введя цифровую клавишу 99 и нажав CLR.

В режиме управления CPU в этом режиме предусмотрены несколько функций, таких как RECOG, TRAIN, RESULT, UPLOAD, DOWNLOAD, RESET модуля распознавания голоса HM2007. Подобно ручному режиму работы, в этом режиме также операции включения, распознавания, обучения, получения результатов, загрузки, скачивания и сброса выполняются на основе различных критериев.

Приложения модуля распознавания голоса

Роботизированный автомобиль с голосовым управлением

Проектный комплект роботизированного транспортного средства с голосовым управлением

Проектный комплект роботизированного транспортного средства с голосовым управлением

Роботизированное транспортное средство с голосовым управлением и системой распознавания речи на большом расстоянии предназначено для управления с помощью человеко-машинного интерфейса и голосовых команд для удаленных операций с роботизированным транспортным средством. An 8051 микроконтроллер используется вместе с модулем распознавания голоса или модулем распознавания речи для достижения желаемой операции. Направление движения роботизированного транспортного средства можно контролировать с помощью голосовых команд или кнопок. Голосовые команды отправляются RF от передающей стороны к принимающей. Таким образом, роботизированное транспортное средство движется вперед, назад, влево или вправо на основе команд, полученных приемником.


Блок-схема передатчика роботизированного автомобиля с голосовым управлением

Блок-схема передатчика роботизированного автомобиля с голосовым управлением

Это движение роботизированный автомобиль в определенном направлении можно управлять с помощью двух двигателей, которые связаны с микроконтроллером серии 8051. Радиопередатчик преобразует команды нажатием переключателя или голосовые команды, которые преобразуются в закодированные цифровые данные для обеспечения приемлемого расстояния (до 200 метров) от роботизированного транспортного средства. Закодированные данные, полученные в схеме приемника, декодируются для отправки на другой микроконтроллер для управления двигателями постоянного тока с использованием IC драйвера двигателя для управления направлением и движением двигателей с использованием декодированных данных голосовых команд.

Блок-схема приемника роботизированного транспортного средства с голосовым управлением

Блок-схема приемника роботизированного транспортного средства с голосовым управлением

Этот управляемый голосом роботизированный автомобиль с проектами распознавания речи на большом расстоянии может быть интегрирован с DTMF технология что облегчает управление роботизированным транспортным средством с помощью мобильного телефона. Эта технология DTMF обеспечивает связь на очень большом расстоянии по сравнению с технологией RF - таким образом, роботизированными транспортными средствами можно управлять дистанционно с очень большого расстояния.

Цепь записи и воспроизведения голоса

APR 9301 IC

APR 9301 IC

APR 9301 IC

Микросхема APR 9301 состоит из 28 контактов и энергонезависимой флэш-памяти. Он обеспечивает запись 100 000 циклов и хранение в памяти около 100 лет. Для нормальной работы интегральной схемы APR 9301 требуется только низкое напряжение 5 В и ток 25 мА.

Работа схемы записи и воспроизведения голоса

APR 9301 IC выполняет запись и воспроизведение голоса операции. Операция записи может выполняться путем приема голосовых сигналов с помощью конденсаторного микрофона хорошего качества (любого типа), подключенного к 17 и 18 контактам интегральной схемы. Если замкнуть переключатель S1, то можно запустить режим записи для удобной записи голосового сообщения в течение 20-30 секунд. В качестве индикации записи светодиод, подключенный к контакту 25 микросхемы APR 9301, будет мигать, пока контакт 27 L заземлен.

Цепь записи и воспроизведения голоса

Цепь записи и воспроизведения голоса

После завершения 20 циклов с последней памятью процесс записи автоматически завершается изменением значения резистора R1, подключенного к контактам 6 и 7 микросхемы APR 9301. Максимальное время записи в 20 секунд, 24 секунды и 30 секунд можно получить, изменив значения резистора R1 на 52 кОм, 67 кОм и 89 кОм соответственно.

Входной блок автоматически отключается в режиме воспроизведения. Если переключатель S2 замкнут, то сообщение будет поступать из динамика с начала записанных сообщений. Если функции записи или воспроизведения завершены, APR 9301 IC перейдет в режим ожидания.

Эту схему можно накапливать на общей плате. Тщательно припаяйте основание микросхемы APR 9301, чтобы не произошло короткого замыкания между выводами интегральной схемы. После сборки на печатной плате проверьте схему, затем подключите микросхему к базе микросхемы. Перед тем, как подать питание на схему, внимательно проверьте штырьковые соединения. Для подачи питания на схему используется 5-вольтный стабилизатор на базе микросхемы Power. Для получения чистого звука используется динамик хорошего качества с сопротивлением 2 дюйма и сопротивлением 8 Ом. Запись может быть произведена нажатием переключателя S1. Звуковые сигналы (речь или музыка) улавливаются микрофоном и передаются на ИС, где голосовые сигналы сохраняются в ячейках памяти. Если мы замкнем переключатель S2, то начнется воспроизведение, и мы сможем услышать записанное сообщение через динамик.

Модуль распознавания голоса может использоваться во многих приложениях, например, для управления системами самолета с помощью голосовых команд пилотов, для управления моторизованным колесным автомобилем с помощью голосового мультипроцессора и так далее. Если вам интересно узнать о электротехнические и электронные проекты на основе модуля распознавания голоса, вы можете связаться с нами, разместив свои комментарии в разделе комментариев ниже.

Фото: