Acapela group что это за программа
Итак, общую настройку голоса сделали. Теперь он звучит более менее приемлемо. В дальнейшем, при прослушивании текстов, Вы будете проводить более тонкую настройку и качество произношения все время будет расти.
Кроме общей настройки звучания голоса, Алена может обучаться правильному произношению отдельных слов.
Научить ее можно с помощью специального встроенного менеджера лексикона – Lexicon Manager.
Для этого в Менеджер необходимо записать правильное произношение. Записывать каждое слово нет необходимости. Благодаря активным пользователям существуют словари для Алены. Но может оказаться, что необходимого слова в словаре нет, и Алена будет читать его некорректно, тогда можно исправить произношение отдельного слова. В данном случае лексикон и словарь – это одно и тоже. В движке Алена словарь назвали лексиконом, что бы показать отличие способа настройки правильного произношения от способов применяемых в ранее выпущенных голосах.
При загрузке голоса одним файлом, словарь у Вас уже есть. Если Вы загружали 2 файла, то словарь (Alena22.dic) можно скачать отдельно отсюда.
Предлагаю для удобства зразу скопировать этот файл в папку с установленным голосом: С:\ Progrm Files\ Acapela Group
Запускаем менеджер лексикона – “Пуск” – “программы” – “Acapela Group” – “Infovox Desktop 2.2” в меню выбираем “Lexicon Manager”
Переходим на вкладку Lexicon-Voice-Association нажимаем Add lexicon.
В открывшемся окне проводника ищем файл Alena22k.dic который скопировали в папку с программой С:\ Progrm Files\ Acapela Group
Или с того места где находится файл. Почему я предлагаю поместить файл словаря в папку с программой? Пока существует программа- пока и будет с ней вместе и файл словаря прием там же где и программа. А то можно файл оставить отдельно в другом месте, и через некоторое время забыть что это за файл и случайно удалить. А из папки программы, случайно обычно ничего не удаляется, так как туда случайно, не попадают.
Итак. Подключили словарь:
Для работы со словарем (лексиконом) необходимо включить редактор словаря и вызвать словарь:
Вверху нажимаем нажимаем File, выбираем Open Lexicon
И также в проводнике выбираем файл словаря.
Открывается файл словаря и мы видим в нем 22177 слов.
Если Алена произносит неправильно некоторые слова, то подправить их произношение можно здесь.
Для этого в первое окно Word записываем слово, например слово произношение
При этом во втором окне Suggestion сразу появляется его транскрипция произношения. Послушать произношение можно нажав треугольник справа от окна. Для изменения произношения, нужно транскрипцию скопировать в окно редактора, нажав кнопку Copy to Pronunciation, теперь в следующей строке редактора тоже появилась транскрипция, здесь ее можно изменить. Как видите, транскрипция написана не только буквами но и символами. Ведь произношение одной и той же буквы может быть различным, что бы отобразить произношение всех звуков, одних букв недостаточно. Для того что бы наглядно представить себе произношение определенных групп букв и символов существует специальная таблица произношения. Вызвать ее можно нажав кнопку Show Phonetik Table. Таблица появляется рядом с окном редактора, что значительно облегчает работу с ней и самим редактором.
В таблице в левом столбце указаны символы. А в правом их произношение. Причем в произносимом слове эти буквы или символы выделены большими. Единица рядом с буквой обозначает знак ударения, а апостроф смягчает звук. Можно взять любое слово и поупражняться, изменяя в третьей строке транскрипцию, что бы понять как изменение символов влияет на произношение. Бывает, что бы добиться правильно произношения одной буквы или слога, необходимо изменить произношение соседних букв. Доложен сказать, что сразу это непросто, но результат радует. Благодаря такой организации словаря, Алена может произносить слова почти идеально. Если в результате исправления произношение стало нормальным, добавляем новое звучание в словарь, нажав кнопку Add Word to Lexicon. И сразу желательно сохранить весь измененный словарь, для этого вверху нажимаем File и выбираем Save Lexicon.
Теперь Алена будет читать это слово правильно. Правда есть одни момент. Произношение слова записано один раз, с одним ударением, и произносится будет одинаково во всех предложениях, иногда не совсем корректно. Например слово головы в словосочетаниях ” не сносить головы” и “горячие головы” будет поизносится одинаково. Для одного из них это будет неправильно. Что же, не будем забывать, что Алена это все таки программа, а не человек. И над дальнейшим ее совершенствованием постоянно работают светлые головы.
Метки
Acapela Group – коммерческое предприятие, специализирующееся в области речевых технологий и известное своими синтезаторами речи по тексту.
Переходов: 13 | Записи
Access
Переходов: 2 | Записи
Accessibility ToolKit
Accessibility ToolKit (ATK) – это инструментарий разработки от GNOME, который позволяет программистам использовать общие функции специальных возможностей GNOME, такие как высококонтрастные темы оформления для слабовидящих и изменение поведения клавиатуры (например, залипание клавиш) для людей с нарушениями мелкой моторики, чтобы сделать приложения GNOME доступными.
Переходов: 0 | Записи
Accessible-Coconut
Переходов: 8 | Записи
Acrobat / Reader
Переходов: 27 | Записи
ALT Linux
Переходов: 4 | Записи
Android
Переходов: 204 | Записи
API
Переходов: 47 | Записи
Arch Linux
Переходов: 24 | Записи
AT-SPI
AT-SPI2 – сокращ. от англ. Assistive Technology Service Provider Interface второе поколение. Это фреймворк, разрабатываемый в рамках проекта GNOME и обеспечивающий доступность графических приложений на системах Linux. Он определяет протокол D-Bus для предоставления и доступа к информации, необходимой вспомогательным технологиям. Данный фреймворк также называют AT-SPI2, чтобы подчеркнуть, что это второе поколение, ориентированное на работу через систему межпроцессного взаимодействия D-Bus, а не устаревший стандарт написания распределённых приложений ORBIT / CORBA. AT-SPI также может использоваться для автоматизированного тестирования пользовательских интерфейсов с помощью таких инструментов, как Linux Desktop Testing Project и Dogtail. AT-SPI в настоящее время поддерживается GTK+ 2, Java/Swing, пакетом Mozilla и StarOffice/OpenOffice.org. Разработчики, такие как Trolltech, разрабатывают поддержку AT-SPI, используя доступную библиотеку инструментария Trolltech. Рабочая группа Open Accessibility (A11y) активно изучает и тестирует использование AT-SPI для принятия в качестве стандарта Linux, а также содействует гармонизации усилий и согласованию инструментария независимым от платформы образом.
Переходов: 28 | Записи
Audacity
Свободный звуковой редактор, предоставляющей возможности для редактирования звуковых файлов (Ogg Vorbis, FLAC, MP3 и WAV), записи и оцифровки звука, изменения параметров звукового файла, наложения треков и применения эффектов (например, подавление шума, изменение темпа и тона). Код Audacity распространяется под лицензией GPL.
Коммерческие синтезаторы речи
Наверняка многие из нас использовали функцию TTS на компьютере или смартфоне. Однако при чтении голосом текста из файла большинство оставались недовольны качеством произношения и забывали про эту функцию. Отчасти причиной этому было низкое качество бесплатных голосовых движков.
При использовании коммерческих голосовых синтезаторов мы имеем абсолютно другую картину: они удобны в настройке, а произношение практически не режет слух. Рассмотрим наиболее интересные программы синтезирования речи с русскими голосами.
Alyona от Acapela Group
На рынке TTS-движков продукты от Acapela Group заслуженно стоят на первом месте. Голос Alyona, значительно превосходящий по параметрам предыдущий продукт Nikolai, звучит достаточно мягко и имеет приятный тембр, с образцом которого можно познакомиться на сайте.
С голосом, который стоит $35 необходимо приобрести TTS-движок NextUp Talker, стоимость которого $99,95. Программные продукты от Acapela работают и на основных мобильных ОС.
ScanSoft RealSpeak
Популярную в прошлом TTS от ScanSoft RealSpeak с русскоязычным голосом Katerina , очень естественно и правильно воспроизводивший текст сменили синтезаторы речи под новым брендом Loquendo. Голоса работают с синтезатором Dragon NaturallySpeaking 13 стоимостью $99,99.
Ivona
И еще один заслуживающий внимания коммерческий TTS – Ivona , доступный и для Android-девайсов на Google PlayMarket. Среди аналогичных программ этот синтезатор речи выделяется естественным звуком голоса, обеспечивающим его легкое восприятие. Ivona Reader с русским голосом Tatyana сейчас можно приобрести по акционной цене €49.
Вместо послесловия
Хотя коммерческие синтезаторы речи звучат на порядок выше бесплатных продуктов, но стоят они достаточно дорого. Нужно ли тратить деньги на покупку этого софта – решать вам.
При подготовке материала использовались источники:
https://govoritkniga.ucoz.ru/index/nastrojka_proiznoshenija_alena/0-19
http://www.tiflocomp.ru/index.php?mod=tags&sec=423&backpage=1