Показать полную графическую версию : Управление компьютера при помощи речи - Голосовое управление
Какие есть программы для голосового управления компьютером?
Dragon Dictate,
Dragon NaturallySpeaking
Где достать голосовое управление набора текста
:)
Есть ли такая программка которая реагирует на голосовые команды (например я говорю в микрофон "Мой компьютер", открывается "Мой компьютер).
Если есть киньте ссылку.
Зарание спасибо.
Есть Dragon Dictate и Комбат. Сам пробовал раннии версии. но геморойно настраивать хотя можно, добился выполнения команд вверх и вних ввод в Total Commander. На соседней кафедре настроили и на печать голосом отправляют файлы. Успехов. Имхо, лучше ручками
login_of_me
25-06-2005, 12:32
Voice Studio попробуй.
Все эти программы надо долго и нудно настраивать, да и стоят они дофига. А с русским языком вообще беда - слишком большой процент ошибок.
ARXANGELi
27-04-2008, 23:27
Недавно узнал о том, что существуют такие программы, при помощи которых можно управлять компьютером, естественно предварительно обучив компьютер понимать Ваш голос. Я хотел бы узнать побольше информации о таких программах, ваши отзывы о них, насколько они действенны, и , если возможно, ссылки.
Voice Studio http://forums.referat.ru/?board=hardware&action=display&num=1081889983
TalkItTypeIt и другие http://bestmsoft.narod.ru/Voice-Recognition/02.1311.1.1.html
Realize Voice http://tviker.jino-net.ru/modules/news/article.php?storyid=113
ARXANGELi
28-04-2008, 18:32
А свои коментарии не приложишь к ссылкам? Какие программы лучше, отношение к программам на эту тему?
Я сильно не пользовался, но по английски понимают неплохо.
Меня даже очень удивляет, что некоторую английскую речь, которую я не могу схватить из-за быстроты произношения Voice Studio схватывает и правильно отображает.
А по русски надо возиться с настройкой того же Dragon, хотя на отдельные команды натаскать имх вполне можно.
Для работы нужен самый дешевый электретный микрофон и минимум постороннего шума.
Пробуйте, там в ссылке есть и комментарий. Пользуйтесь поиском по И-нету.
ARXANGELi
28-04-2008, 23:05
Есть ещё кто-либо, кто пытался рабоатть с такого рода программами?
KomissaRex
07-07-2008, 08:23
Когда-то пробовал возиться с Горыныч Проф 3.0 - помоему, единственнй системой распознавания речи, ориентированной на русский язык. Ссылку дать не могу - программа платная, к тому же довольно прилично весит.... Если кто-то надумает покупать диск ( :) :) :) ), советую приобретать не Light версию (у Light'a слишком мизерный запас слов)!
Заинтересовал меня сабж, и мне хотелось бы узнать: какая на сегодня существует самая совершенная программа для реализации этого?
Oleg_SK, на каком языке? На русском вы вряд ли найдете что-либо удобное в использовании. А на английском - в Vista встроено разпознавание речи. Есть http://www.nuance.com/naturallyspeaking/products/preferred.asp
Vadikan
на каком языке? На русском вы вряд ли найдете что-либо удобное в использовании. »
Понятно... Очень жаль! Кстати, а какая разница, на каком языке будет управляться комп? Программу же, по идее, все равно нужно обучать (или для современных программ это не требуется?)...
Alexander_Grig
20-09-2008, 23:48
Кстати, а какая разница, на каком языке будет управляться комп? »
Поскольку немного занимался этим вопросом, то попытаюсь "на пальцах" объяснить. Получается следующая картина.
Каждый язык имеет свой характерный (свойственный только ему) состав звуков. Есть языки, в которых преобладают шипящие звуки, есть такие, в которых преобладают звонкие, "горловые" и "мелодичные" (пример такого языка - китайский и некоторые другие азиатские), есть, где преобладают носовые звуки и т.д. (открыл ради интереса свою магистерскую работу по системам распознавания за 2003 год, насчитал там порядка 12 различных типов только звуков, не говоря уже о делении звуков на отдельные части вплоть до фонем - минимальных единиц-"аналогов" букв).
Система распознавания речи должна принимать входящий звуковой сигнал, разбивать на части (сегментировать его), анализировать сегменты, высчитывая определенные параметры, зависящие от принципов, на которых конкретная система распознавания построена (но в основном это расчет спектральных составляющих, вычисление кепстра, определение формант, основного тона т.д.). Далее по определенным параметрам начинается сравнение принятого куска сигнала с имеющимися образцами (если система рассчитана на распознавание голоса нескольких человек) или образом (если система рассчитана на распознавание голоса одного человека). Если это система позволяет не просто управлять компьютером, а еще и надиктовывать текст/воспроизводить текст голосом, то далее применяется определение номера фонемы ("аналога буквы"). Поскольку человек не робот, и может говорить, меняя темп речи, то необходима подсистема, которая бы отслеживала бы и это (а то может получиться "поввтооор" вместо "повтор"). Необходим словарь, с которым бы в самом конце производилось сравнение правильности написания слов (а то будет вам "ИСЧО" вместо "еще" :) ).
Ключевым блоком в данной системе является блок определения параметров, и даже не сколько он, сколько кодовая книга ("база") типовых параметров, с которыми производится сравнение и вынесение конечного результата. Для создания такой «базы» необходимо знать, по каким параметрам для каждого конкретного языка можно производить опознавание звуков.
Как вы сами понимаете, для разных языков тот же спектр одного и того же звука, например, "ё", "р" и т.д. будет отличаться из-за особенностей произношения представителей различных национальностей (ну разве что уж некоторые совсем распространенные звуки будут приблизительно одинаковыми, например, чаще всего это будут гласные "а", "о" и некоторые другие).
Т.е. основная проблема в создании базы (т.к для каждого языка она своя) и разработки алгоритма обработки входного звукового сигнала для последующего сравнения с этой базой.
Поскольку на западе с 60-х годов прошлого века в исследования вбухали многие тысячи $ (занимались как военные, так и частные организации), то и результат у них есть. У нас как-то с этим все обстоит немного похуже, по крайней мере публикаций в научных журналах на эту тему не очень много.
Программу же, по идее, все равно нужно обучать (или для современных программ это не требуется?) »
Все зависит от того, какой алгоритм заложил в систему ее создатель.
Современные системы распознавания речи, нормально работающие с русским/украинскими языками мне не встречались ("Горыныч" - не исключение). Системы обратного преобразования, т.е. "тест/речь" относительно нормальные встречал - "Говорилка" и "Розмовлялька" соответственно (но и они не совершенны).
Если бы не сменил тему диссертации из-за смены руководителя, то может что-то к сегодняшнему дню и написал бы свою прогу :)
Что касается висты, то я ее систему распознавания не видел в действии. Если бы можно было с ее помощью надиктовывать текст в транслит, то не составило бы большого труда написать программу для преобразования текста из транслита в нормальный русский текст (или воспользоваться имеющимися). Кстати, на одесском Текнете в прошлом году демонстрировали одну майкрософтовскую систему, которая осуществляла прием писем и воспроизведение их голосом, так вот, поскольку русский язык не поддерживался, то присланное письмо там как раз и преобразовали в транслит, после чего скормили этот текст системе (например, "пчела мая"->"pchela maya"). Система произнесла данный текст с характерным акцентом, но при этом можно было понять смысл.
Alexander_Grig, супер, спасибо! :)
Хорошая программа VoiceNet2000. Поищите в гугле. Совершенно независит от языка пользователя. Имеет англоязычный интерфейс, но вроде где-то есть русификаторы. Из меню выбирается действие (запуск программ, имитация нажатия клавиши, действие и т.п.) и надиктовывается соответсвующее слово. Затем это слово надо повторить несколько раз для уверенного распознавания.
Вообще-то все проги распознавания речи весьма чувствительны к аппаратной части. Желательно иметь хороший микрофон и располагать его всегда на одном и том-же расстоянии от себя. Так-же значительно снижает достоверность распознавания фон от плохой звуковой карты или неэкранированного микрофонного шнура. В микшере лучше поотключать все входа, за исключением микрофонного. Вероятность распознавания может достигать 90% и выше.
Есть еще похожая программа с русским интерфейсом - Typle. Она так-же не зависит от языка и использует надиктованные юзером шаблоны.
pavel111
13-09-2010, 22:47
на многих же телефонах стоят "распозновалки" к примеру на моем hp ipaq voice messenger стоит встроенный voice commander.
нормально справляется с десятками команд на русском языке. почему бы по аналогии и для пк не сделать?
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.