Что такое синтез речи

Что такое синтез речи

Речевые синтезаторы, установленные на компьютеры или мобильные устройства, уже не кажутся такими необычными программами, как раньше. Благодаря современным технологиям обычный настольный ПК может воспроизводить человеческий голос.

Каким образом работают синтезаторы речи? Где они применяются? Какой самый лучший речевой синтезатор? Ответы на эти и другие вопросы изложены в данной статье.

Общее понятие

Синтезаторы речи являются специальными программами, состоящими из некоторого количества модулей, которые предоставляют возможность перевести набранные тексты в озвученные человеческим голосом предложения. Не стоит думать, что вся база слов и фраз записана реальными людьми в профессиональных студиях. Выполнить подобную задачу физически невозможно. Библиотеку с таким большим количеством фраз нельзя установить ни на один современный компьютер, не говоря уже о мобильных телефонах. Для этого разработчики создали технологию Text-to-Speech.

Сфера применения

Синтезаторы речи используются при изучении иностранных языков, прослушивании текстов на страницах книг, создании вокальных партий, выдаче поисковых запросов в форме озвученных фраз и т. п.

Какие разновидности программ существуют? В зависимости от сферы применения утилиты можно разделить на 2 вида: обычные, преобразующие набранный текст в речь, и специальные вокальные модули, используемые в музыкальных приложениях.

Для лучшего понимания рекомендуется рассмотреть оба класса, однако стоит акцентировать внимание на программах в их непосредственном значении.

Преимущества и недостатки

На данный момент компьютер синтезирует человеческую речь только приблизительно. В простейших программах можно наблюдать проблемы со звуком и правильной постановкой ударений в различных словах. Синтезаторы речи, установленные на мобильные устройства, расходуют много энергии. Нередко можно отметить несанкционированную загрузку дополнительных модулей.

К преимуществам следует отнести удобство восприятия. Многим пользователям гораздо проще усваивать звуковую информацию, нежели какую-либо другую.

Лучшие речевые синтезаторы с русскими голосами

Программа RHVoice была создана Ольгой Яковлевой. Стандартный вариант приложения включает 3 голоса. Настройки очень просты. Программу можно использовать и как самостоятельное приложение, совместимое с SAPI5, и как дополнительный экранный модуль.

Речевой синтезатор Acapela отличается от аналогов идеальным озвучиванием текста. Приложение поддерживает более 30 языков мира. В бесплатной версии доступен лишь 1 женский голос.

Программа Vocalizer часто применяется в call-центрах. Пользователь может настроить постановку ударения, громкость и скорость чтения. При необходимости загружаются дополнительные словари. В приложении есть 1 женский голос. Речевой движок автоматически встраивается в программы для чтения книг в электронном формате.

Утилита eSpeak поддерживает свыше 50 языков. Недостатком программы можно считать сохранение звуковых файлов лишь в формате WAV, который требует много места на жестком диске.

Приложение Festival является мощнейшей утилитой синтеза речи, поддерживающей даже финский язык и хинди.

Установка программы

Как использовать приложения такого типа? Для начала нужно установить программу. В компьютерных ОС применяется стандартный инсталлятор, в котором пользователю остается выбрать лишь поддерживаемый утилитой языковой модуль. Установщик для мобильных устройств можно скачать с официального сайта, Google Play, а также App Store. Инсталляция приложения происходит в автоматическом режиме.

Первый запуск программы

На данном этапе пользователю достаточно установить язык по умолчанию. Иногда требуется отметить качество звучания. Стандартный вариант подразумевает частоту дискретизации 4410 Гц, глубину 16 бит и битрейт 128 кбит/с. В мобильных ОС показатели могут быть ниже. В качестве основы используется определенный голос.

Фильтры и эквалайзеры помогают достичь необходимого звучания. Пользователю доступны три варианта перевода текста. Он может набрать на клавиатуре предложения, включить озвучивание уже имеющегося файла или установить в браузере расширение, которое преобразует содержимое на веб-страницах в речь. Достаточно отметить необходимый вариант действий, тембр голоса и язык, на котором будет произноситься текст. Для включения процесса воспроизведения требуется кликнуть по кнопке «Старт».

Работа со сложными программами

В музыкальных приложениях настройки гораздо сложнее. В речевом модуле программы FL Studio пользователь может выбрать несколько видов голосов, а также указать тональность и скорость воспроизведения. Постановка ударений перед слогами осуществляется с помощью символа «_». С помощью подобного речевого синтезатора можно создать лишь роботизированный голос.

Программа Vocaloid относится к приложениям профессионального типа. Помимо обычных параметров, пользователь может выбирать артикуляцию и глиссандо. В утилите есть база с вокалом профессионалов. При желании можно подгонять под ноты целые предложения. Одна только библиотека с вокалом занимает более 4 Гб в сжатом виде.

"Синтезатор речи Google": что это за программа

В мае 2014 года компания предоставила пользователям возможность опробовать новый бесплатный продукт. Что такое "Синтезатор речи Google" на «Андроиде»? Это программа, озвучивающая текст на экране мобильного устройства или планшета. Теперь нет необходимости устанавливать сторонние утилиты, которые требуют наличия лицензии. "Синтезатор речи Google" используется при чтении электронных книг, прослушивании правильного произношения слов, запуске приложения TalkBack.

Новая версия программы "Синтезатор речи Google 3.1" получила функцию поддержки английского, итальянского, испанского, корейского, немецкого, нидерландского, польского, португальского, русского и французского языков. Где найти голосовые пакеты? Они загружаются из самого приложения.

Преимущества и недостатки продукта от Google

Особенностями русскоговорящего женского голоса является четкое, громкое звучание и плавная интонация. Скорость воспроизведения можно регулировать в настройках программы. Пользователи, использующие TalkBack и русскую языковую локализацию ОС Android, должны проявлять осторожность при переключении на речевой синтезатор, если ранее в приложении по умолчанию был установлен другой голос. Могут возникнуть проблемы, связанные с сохранением контроля над мобильным устройством на слух. Практически все голоса, кроме русского, неспособны обрабатывать предложения на кириллице.

Среди минусов можно отметить задержку реакции на чтение текстов, состоящих из фраз на разных языках. Русский голос отличается металлическими нотками тембра. Можно услышать дребезжащий звук на низких частотах. К преимуществам можно отнести стабильность работы приложения и приемлемое качество чтения англоязычных слов.

"Синтезатор речи Google": как пользоваться программой

Для того чтобы утилита заработала как надо, требуется обновить ее до последней версии. Чтобы активировать процесс озвучивания текста, нужно открыть настройки. В разделе «язык и ввод» необходимо поставить флажок на пункте «синтез речи». Тут же следует отметить строку «система по умолчанию». Не стоит забывать о том, что голосовые пакеты в самой программе также нуждаются в обновлении.

Читайте также:  Devil may cry 4 special edition костюмы

Проблемы при работе с утилитой

При необходимости пользователь может отключить приложение. В самых простых утилитах кнопка остановки находится в самой программе. Деактивация расширения, установленного в браузере, производится путем отключения дополнения или полного удаления плагина. При работе с программой на мобильном телефоне также могут возникнуть проблемы. Дело в том, что синтезатор речи автоматически включает загрузку ненужных пользователю языковых модулей.

Данный процесс занимает много времени и существенно расходует трафик. Как отключить "Синтезатор речи Google" на мобильном устройстве и избавиться от этой проблемы? Для начала нужно открыть настройки приложения. Потом необходимо выбрать раздел «язык и голосовой ввод». Далее нужно отметить последнюю строку.

Выбрав голосовой поиск, следует кликнуть по крестику у пункта «распознавание речи офлайн». Затем рекомендуется удалить кэш приложений. Далее требуется перезагрузить мобильный телефон. Чтобы полностью отключить утилиту, необходимо открыть в настройках раздел «приложения», выбрать в списке синтезатор речи и кликнуть по кнопке «остановить».

Удаление программы

Бывает так, что пользователь вообще не использует "Синтезатор речи Google". Можно ли удалить утилиту с мобильного устройства? Для этого нужно открыть Google Play. Затем следует выбрать в перечне установленных программ синтезатор речи и кликнуть по кнопке «удалить».

Итоги

Обычным пользователям и людям с ограниченными возможностями подойдут приложения с простым интерфейсом. Это может быть как RHVoice, так и "Синтезатор речи Google". Русский голос озвучит отображаемый на экране текст. Большего рядовому пользователю не требуется.

Музыкантам рекомендуется отдавать предпочтение профессиональной программе Vocaloid. В приложении есть дополнительные голосовые библиотеки и множество различных опций. Программа позволит получить естественное звучание голоса. Ведь музыкантам так важно, чтобы компьютерный синтез не ощущался на слух.

Синтез речи может потребоваться во всех случаях, когда получателем информации является человек. Но вот о самом качестве синтезатора речи прежде всего судят по его сходству с человеческим голосом, а также способностью быть понятым. Что непосредственно позволяет пользоваться людям с ослабленным зрением или же просто чтением слушать письменные работы на домашнем компьютере. Самую наипростейшую синтезированную речь можно создавать путем объединения частей записанной речи, которые затем будут храниться в базе данных. И как ни странно, с таким способом синтезирования мы сталкиваемся уже повсеместно, даже не обращая порой на это внимания.

  • Синтез речи по тексту или коду сообщения может быть использован в информационно-справочных системах, для помощи слепым и немым, для управления человеком со стороны автомата.
  • При объявлениях об отправлении поездов и тому подобное.
  • Для выдачи информации о технологических процессах: в военной и авиакосмической технике, в робототехнике, в акустическом диалоге человека с компьютером.
  • Как звуковой эффект нередко используется в создании электронной музыки.

Способы синтеза речи

Все способы синтеза речи можно подразделить на группы: [2]

  • параметрический синтез;
  • конкатенативный, или компиляционный (компилятивный) синтез;
  • синтез по правилам;
  • предметно-ориентированный синтез.

Параметрический синтез

Параметрический синтез речи является конечной операцией в вокодерных системах, где речевой сигнал представляется набором небольшого числа непрерывно изменяющихся параметров. Параметрический синтез целесообразно применять в тех случаях, когда набор сообщений ограничен и изменяется не слишком часто. Достоинством такого способа является возможность записать речь для любого языка и любого диктора. Качество параметрического синтеза может быть очень высоким (в зависимости от степени сжатия информации в параметрическом представлении). Однако параметрический синтез не может применяться для произвольных, заранее не заданных сообщений.

Компиляционный синтез

Компиляционный синтез сводится к составлению сообщения из предварительно записанного словаря исходных элементов синтеза. Размер элементов синтеза не меньше слова. Очевидно, что содержание синтезируемых сообщений фиксируется объёмом словаря. Как правило, число единиц словаря не превышает нескольких сотен слов. Основная проблема в компилятивном синтезе — объёмы памяти для хранения словаря. В этой связи используются разнообразные методы сжатия/кодирования речевого сигнала. Компилятивный синтез имеет широкое практическое применение. За рубежом разнообразные устройства (от военных самолётов до бытовых устройств) оснащаются системами речевого ответа. В нашей стране системы речевого ответа до недавнего времени использовались в основном в области военной техники, сейчас они находят всё большее применение в повседневной жизни, например, в справочных службах операторов сотовой связи при получении информации о состоянии счета абонента.

Полный синтез речи по правилам

Полный синтез речи по правилам (или синтез по печатному тексту) обеспечивает управление всеми параметрами речевого сигнала и, таким образом, может генерировать речь по заранее неизвестному тексту. В этом случае параметры, полученные при анализе речевого сигнала, сохраняются в памяти так же, как и правила соединения звуков в слова и фразы. Синтез реализуется путём моделирования речевого тракта, применения аналоговой или цифровой техники. Причём в процессе синтезирования значения параметров и правила соединения фонем вводят последовательно через определённый временной интервал, например 5—10 мс. Метод синтеза речи по печатному тексту (синтез по правилам) базируется на запрограммированном знании акустических и лингвистических ограничений и не использует непосредственно элементов человеческой речи. В системах, основанных на этом способе синтеза, выделяется два подхода. Первый подход направлен на построение модели речепроизводящей системы человека, он известен под названием артикуляторного синтеза. Второй подход — формантный синтез по правилам. Разборчивость и натуральность таких синтезаторов может быть доведена до величин, сравнимых с характеристиками естественной речи.

Синтез речи по правилам с использованием предварительно запомненных отрезков естественного языка — это разновидность синтеза речи по правилам, которая получила распространение в связи с появлением возможностей манипулирования речевым сигналом в оцифрованной форме. В зависимости от размера исходных элементов синтеза выделяются следующие виды синтеза:

  • микросегментный (микроволновый);
  • аллофонический;
  • дифонный;
  • полуслоговой;
  • слоговой;
  • синтез из единиц произвольного размера.

Обычно в качестве таких элементов используются полуслоги — сегменты, содержащие половину согласного и половину примыкающего к нему гласного. При этом можно синтезировать речь по заранее не заданному тексту, но трудно управлять интонационными характеристиками. Качество такого синтеза не соответствует качеству естественной речи, поскольку на границах сшивки дифонов часто возникают искажения. Компиляция речи из заранее записанных словоформ также не решает проблемы высококачественного синтеза произвольных сообщений, поскольку акустические и просодические (длительность и интонация) характеристики слов изменяются в зависимости от типа фразы и места слова во фразе. Это положение не меняется даже при использовании больших объёмов памяти для хранения словоформ.

Читайте также:  E100 0001 canon 4410

Предметно-ориентированный синтез

Предметно-ориентированный синтез компилирует слова записанные заранее, а также фразы для создания полных речевых сообщений. Он используется в приложениях, где многообразие текстов системы будет ограничено определенной темой/областью, например объявления об отправлении поездов и прогнозы погоды. Эта технология проста в использовании и достаточно долго применялась в коммерческих целях: ее так же применяли при изготовлении электронных приборов, таких как говорящие часы и калькуляторы. Естественность звучания этих систем потенциально может быть высокой благодаря тому, что многообразие видов предложений ограничено и близко с соответствием интонацией исходных записей. А так как эти системы ограничены выбором слов и фраз в базе данных, они в дальнейшем не могут иметь широкое распространение в сферах деятельности человека, лишь потому, что способны синтезировать комбинации слов и фраз, на которые они были запрограммированы.

История

В конце XVIII века датский учёный Христиан Кратценштейн, действительный член Российской Академии Наук, создал модель речевого тракта человека, способную произносить пять долгих гласных звуков (а, э, и, о, у). Модель представляла собой систему акустических резонаторов различной формы, издававших гласные звуки при помощи вибрирующих язычков, возбуждаемых воздушным потоком. В 1778 австрийский учёный Вольфганг фон Кампелен дополнил модель Кратценштейна моделями языка и губ и представил акустическо-механическую говорящую машину, способную воспроизводить определённые звуки и их комбинации. Шипящие и свистящие выдувались с помощью специального меха с ручным управлением. В 1837 учёный Чарльз Уитстоун (Charles Wheatstone) представил улучшенный вариант машины, способный воспроизводить гласные и большинство согласных звуков. А в 1846 году Джезеф Фабер (Joseph Faber) продемонстрировал свой говорящий орга́н Euphonia, в котором была реализована попытка синтезирования не только речи, но и пения.

В конце XIX века знаменитый учёный Александр Белл создал собственную «говорящую» механическую модель, очень схожую по конструкции с машиной Уитстоуна. С наступлением XX века началась эра электрических машин, и учёные получили возможность использовать генераторы звуковых волн и на их базе строить алгоритмические модели.

В 1930-х годах работник Bell Labs Хомер Дадли (Homer Dudley), работая над проблемой поиска путей для снижения пропускной способности необходимой в телефонии, чтобы увеличить её передающую способность, разрабатывает VOCODER (сокращенно от англ. voice — голос, англ. coder — кодировщик) — управляемый с помощью клавиатуры электронный анализатор и синтезатор речи. Идея Дадли заключалась в том, чтобы проанализировать голосовой сигнал, разобрать его на части и пересинтезировать в менее требовательный к пропускной способности линии. Усовершенствованный вариант вокодера Дадли, VODER, был представлен на Нью-Йоркской Всемирной выставке 1939 года [3] .

Первые синтезаторы речи звучали довольно неестественно, и часто едва можно было разобрать производимые ими фразы. Однако качество синтезированной речи постоянно улучшалось, и речь, генерируемую современными системами синтеза речи, порой не отличить от реальной человеческой речи. Но несмотря на успехи электронных синтезаторов речи, исследования в области создания механических синтезаторов речи по-прежнему ведутся, например, для использования в роботах-гуманоидах. [4]

Первые системы синтеза речи на базе вычислительной техники стали появляться в конце 1950-х годов, а первый синтезатор «текст-в-речь» был создан в 1968 году.

Настоящее и будущее

Пока что рано говорить о каком-то перспективном будущем на ближайшие десятилетия для синтеза речи по правилам, так как звучание все еще напоминает больше всего речь роботов, а местами это еще и трудно понимаемая речь. Что мы точно можем безошибочно определять, так это то что говорит ли синтезатор речи мужским или женским голосом, а тонкости присущие человеческому голосу мы порой все еще не различаем. Поэтому технология разработки, частично отвернулась от фактического построения синтеза речевых сигналов, но все также продолжает использовать простейшую сегментацию записи голоса.

Программное обеспечение с поддержкой синтеза речи

Список примеров в этой статье не основывается на авторитетных источниках непосредственно о предмете статьи.
  • TTS-компонента Microsoft Agent в Windows.
  • Операционная система Andro >[5] ).
  • ESpeak (использует формантный синтез).
  • Gnuspeech — система артикулятивного синтеза.

См. также

Примечания

  1. В таком определении преобразование звукового давления в электрическое напряжение и наоборот в микрофоне и телефоне, а также запись и воспроизведение, например, с магнитных носителей не являются синтезом. Дискретизация и квантование речевого сигнала при импульсно-кодовой модуляции также не относятся к синтезу речи, но генерация речевого сигнала в вокодерных системах может считаться синтезом.
  2. Сорокин В. Н. Синтез речи. — М.: Наука, 1992, с. 392.
  3. На страничке Dennis Klatt’s History of Speech Synthesis, посвящённой истории развития синтезаторов речи, представлены звуковые файлы с записями различных синтезаторов речи. Есть файл с записью звучания вокодера Хомера Дадли.
  4. Например, японские учёные из лаборатории Таканиси (Takanishi Laboratory) университета Васеда (Waseda University) работают над созданием антропоморфической модели говорящего робота. Последняя их разработка (2005) — модель Waseda Talker No.5 — имеет весь набор речевых инструментов: лёгкие, гортань, мягкое нёбо, язык, зубы, губы и пр. В общей сложности все эти органы имеют 18 степеней свободы. На их страничке Anthropomorphic Talking Robot Waseda-Talker Series можно ознакомиться с более подробной информацией, в том числе фотографиями и видеозаписями.
  5. pVoice — Perl Voice (англ.)

Литература

  1. Б. М. Лобанов, Л. И. Цирульник «Компьютерный синтез и клонирование речи», Минск «Белорусская Наука», 2008, 316 стр.

Ссылки

  • Русскоязычное чтение новостей синтезом
  • Русскоязычный голос для системы Festival
  • Синтез речи в каталоге ссылок Open Directory Project (dmoz).
  • Технология от Центра Речевых Технологий
  • Подробно об установке Алены — самого качественного голоса
  • Software Called Capable of Copying Any Human Voice, NY Times, July 31, 2001 — Статья «Нью-Йорк Таймс» о начале продажи телефонным гигантом AT&T компьютерной программы способной, по заявлению, к модификации и клонированию любого человеческого голоса
Читайте также:  Представительство microsoft в россии контакты
Синтез речи
Проприетарное ПО BrowseAloud · CereProc · DECtalk · IVONA · Microsoft Agent · Microsoft Speech API · Microsoft text-to-speech voices · Readspeaker · Talk It! · Voice browser · Vocalo > · Cantor · Voiceroid
Свободное ПО eSpeak · Gnuspeech · Festival Speech Synthesis System · FreeTTS
Машина Echo 2 · Pattern playback · Phasor · RIAS · Texas Instruments LPC Speech Chips · TuVox
Приложения AOLbyPhone · DialogOS · Dr. Sbaitso · MBROLA · Microsoft Narrator · Microsoft Speech Server · PlainTalk · Voice font
Протоколы Speech Synthesis Markup Language
Разработчики/
Исследователи
Catherine Browman · Franklin Seaney Cooper · Гуннар Фант · Haskins Laboratories · Вольфганг фон Кемпелен · Ignatius Mattingly · Philip Rubin · VoiceWeb · VoiceXML · Yamaha
Процесс Articulatory synthesis · Concatenative synthesis · Currah · Inverse filter · PSOLA · Phase vocoder · SABLE · Self-voicing

Wikimedia Foundation . 2010 .

Смотреть что такое "Синтез речи" в других словарях:

Синтез речи — процесс преобразования текста в речь. На практике используются два метода синтеза речи: метод, основанный на построении слов путем комбинирования фонем и аллофон; метод, основанный на представлении звонких согласных источниками периодических и… … Финансовый словарь

синтез речи — — [Л.Г.Суменко. Англо русский словарь по информационным технологиям. М.: ГП ЦНИИС, 2003.] Тематики информационные технологии в целом EN voice synthesis … Справочник технического переводчика

синтез речи — kalbos sintezė statusas T sritis automatika atitikmenys: angl. speech synthesis vok. Sprachsynthese, f rus. синтез речи, m pranc. synthèse de parole, f … Automatikos terminų žodynas

СИНТЕЗ РЕЧИ — искусств. восстановление сигналов путём преобразования принимаемой закодированной информации в звуковую, имитирующую человеч. речь, либо генерация акустич. сигналов, имитирующих человеч. речь. С. р. используется в системах многоканальной связи,… … Большой энциклопедический политехнический словарь

СИНТЕЗ — (греч. syn вместе, tithemi помещаю) метод мышления, состоящий в восхождения от простого к сложному, от частей к целому, от причин к явлениям, от начала к последствиям, противоположен анализу. Словарь иностранных слов, вошедших в состав русского… … Словарь иностранных слов русского языка

РЕЧИ РАССТРОЙСТВА — (англ. speech disorders) распад уже сложившейся речи (у взрослых) или нарушение нормального развития речи у детей, вызванные различными заболеваниями. Р. р. возникают в силу действия разных причин: при нарушении нормального восприятия звуковой… … Большая психологическая энциклопедия

синтез голоса — Технология звукового вывода с помощью ЭВМ текста в форме синтезируемой речи, которую пользователи могут опознать и понять. [Е.С.Алексеев, А.А.Мячев. Англо русский толковый словарь по системотехнике ЭВМ. Москва 1993] Тематики информационные… … Справочник технического переводчика

синтез по дифонам — Метод синтеза основан на использовании сегментов речи, которые соответствуют двум последовательным звукам и охватывают интервал времени от середины звучания первого звука до середины звучания второго звука (МСЭ Т P.10/ G.100). [http://www.iks… … Справочник технического переводчика

Распознавание речи — Распознавание речи процесс преобразования речевого сигнала в цифровую информацию (напр., текстовые данные). Обратной задачей является синтез речи. Содержание 1 История 2 Виды систем 3 … Википедия

Различия речи москвичей и петербуржцев — Редкий случай: «московский» бордюр плавно переходит в «петербургский» поребрик Различия речи москвичей и петербуржцев это совокупность исторически сложившихся определённых систематически наблюдаемых ор … Википедия

С точки зрения пользователя синтезатор – это новое средство для осуществления голосового вывода информации из персонального компьютера, дополняющее, а в отдельных случаях и замещающее визуальный вывод на дисплей. Пользователь персонального компьютера, применяющий синтезатор, сможет ослабить зрительное напряжение, получая часть информации голосом. Он может также получать информацию, находясь в движении на некотором удалении от компьютера, а при использовании дополнительного телефонного интерфейса – передавать или получать речевую информацию по телефону. Синтезатор речи – уникальное средство передачи информации для незрячих и отличная возможность создания компьютерных систем обучения устной речи.

Под синтезом речи (СР) понимается чтение вслух компьютером произвольной текстовой информации, а не проигрывание заранее записанных звуковых файлов. Фактически благодаря синтезатору речи по тексту открывается ещё один канал передачи данных от компьютера к человеку, аналогичный тому, который мы имеем благодаря дисплею. С точки зрения пользователя наиболее удобное (разумное) использование СР – это включение синтеза речи (в перспективе многоязычного, с возможностью перевода) в состав операционной системы. Точно также, как обычно пользуются командой Print (Печатать) , для вызова СР могла бы применяться команда Talk (Говорить) . С использованием СР компьютеры смогут озвучивать навигацию по меню, читать (дублировать голосом) экранные сообщения, каталоги файлов, передавать речевые сообщения по телефону и т. д. Эти функции особенно важны для лиц, имеющих проблемы со зрением. Для всех остальных они создадут новое измерение удобства пользования компьютером и значительно снизят нагрузку на нервную систему и зрение.

Синтезатор речи может использоваться не только пользователями персональных компьютеров. Он полезен также в автоматизированных системах для создания голосового интерфейса управления, в бытовой технике для озвучивания аппаратурой команд и выполняемых действий, в карманных компьютерах и электронных словарях, органайзерах и мобильных телефонах для проговаривания появляющихся на экране сообщений, в портативных сканерах для озвучивания в реальном времени сканируемой информации.

Принцип работы синтезатора речи основан на создании речевого сигнала, соответствующего введённому тексту, из большого числа (свыше 2000) мельчайших звуковых единиц, которые содержатся в голосовой базе. Для создания голосовой базы необходимые звуковые единицы вырезаются из образцов естественной речи конкретного диктора. Таким образом, синтезированная речь сохраняет персональные особенности голоса, акцента и интонации. Изменяя используемую голосовую базу, можно генерировать сообщения различными голосами. Образно говоря, благодаря такому подходу реализуется компьютерное клонирование персонального голоса и речи.

Ссылка на основную публикацию
Что такое видеопамять компьютера
Всё о Интернете, сетях, компьютерах, Windows, iOS и Android Видеопамять компьютера и объём памяти видеокарты VRAM Если открыть форум какой-нибудь...
Что значит else в паскале
Следует быть внимательными при использовании вложенных операторов if. Предпочтительнее пользоваться схемой else-if (т.е. вкладывать во внешнюю ветку else), а не...
Что значит в магазинах айфон как новый
Нас часто спрашивают, как определить состояние iPhone. Особенно актуально это при покупке смартфона на вторичном рынке, где чуть ли не...
Что такое вулкан рт на ноутбуке
Vulkan Run Time Libraries — кроссплатформенный API для работы с 2D и 3D графикой и повышения производительности графического процессора. Разработана...
Adblock detector