Устройство анализа речи

Номер патента: U 8194

Опубликовано: 30.04.2012

Авторы: Давыдов Андрей Геннадьевич, Зельманский Олег Борисович

Скачать PDF файл.

Текст

Смотреть все

(51) МПК НАЦИОНАЛЬНЫЙ ЦЕНТР ИНТЕЛЛЕКТУАЛЬНОЙ СОБСТВЕННОСТИ(71) Заявитель Учреждение образования Белорусский государственный университет информатики и радиоэлектроники(72) Авторы Зельманский Олег Борисович Давыдов Андрей Геннадьевич(73) Патентообладатель Учреждение образования Белорусский государственный университет информатики и радиоэлектроники(57) 1. Устройство анализа речи, содержащее блок поступления голосового сигнала, блок частотного преобразования, отличающееся тем, что в него введены блоки сегментации и классификации речи, соединенные последовательно. 2. Устройство по п. 1, отличающееся тем, что блок сегментации речи состоит из блока вычисления линейных спектральных частот, блока расчета расстояния между фреймами, блока формирования порогового значения, блока расстановки границ, блока формирования фонетических единиц, соединенных последовательно, при этом вход блока вычисления линейных спектральных частот является входом блока сегментации речи и соединен с входом блока формирования фонетических единиц, выход которого является выходом блока сегментации речи, второй выход блока расчета расстояния между фреймами соединен со вторым входом блока расстановки границ. 3. Устройство по п. 1, отличающееся тем, что блок классификации речи состоит из блока вычисления мел-частотных кепстральных коэффициентов, вход которого является входом блока классификации речи, блока вычисления степени соответствия между фонетическими единицами, соединенных последовательно, базы эталонов мел-частотных кепстральных коэффициентов фонетических единиц, соединенной со вторым входом блока вычисления степени соответствия между фонетическими единицами, выход которого является выходом блока классификации речи. Полезная модель относится к устройствам анализа речи и может быть использована для сегментации речевого сигнала на фонетические единицы и последующей их классификации. Известно устройство сегментации речи 1, содержащее блок выделения информативных параметров и блок распознавания, соединенные последовательно. Блок выделения информативных параметров состоит из секции выделения спектральных компонентов,секции выделения частоты основного тона и секции вычисления производной по времени интенсивности основного тона, включенных параллельно. Недостатком такого устройства является низкая точность сегментации гласных звуков, следующих один за другим. Наиболее близкими к предлагаемой полезной модели являются анализатор речи, обнаруживающий частоту основного тона, способ анализа речи и программа анализа речи 2. Известное устройство содержит блок поступления голосового сигнала, предназначенный для получения голосового сигнала от проверяемого, блок частотного преобразования,предназначенный для преобразования упомянутого голосового сигнала в частотный спектр, автокорреляционный блок, предназначенный для вычисления автокорреляционного колебания при сдвиге упомянутого частотного спектра на частотной оси, и блок обнаружения основного тона, предназначенный для вычисления частоты на основе локального интервала между одними гребнями и впадинами упомянутого автокорреляционного колебания. Недостатком данного устройства является отсутствие возможности сегментации речи на фонетические единицы и классификации этих фонетических единиц. Задачей предлагаемого технического решения является создание устройства, выполняющего сегментацию речевого сигнала на квазистационарные участки, соответствующие голосовым и шумовым фонемам, и их классификацию. Вышеуказанная задача решается тем, что в устройство анализа речи, содержащее блок поступления голосового сигнала, блок частотного преобразования, введены блоки сегментации и классификации речи, соединенные последовательно. При этом блок сегментации речи состоит из блока вычисления линейных спектральных частот, блока расчета расстояния между фреймами, блока формирования порогового значения, блока расстановки границ, блока формирования фонетических единиц, соединенных последовательно, при этом вход блока вычисления линейных спектральных частот является входом блока сегментации речи и соединен с входом блока формирования фонетических единиц, выход которого является выходом блока сегментации речи, второй выход блока расчета расстояния между фреймами соединен со вторым входом блока расстановки границ. В свою очередь, блок классификации речи состоит из блока вычисления мел-частотных кепстральных коэффициентов, вход которого является входом блока классификации речи, блока вычисления степени соответствия между фонетическими единицами, соединенных последовательно,базы эталонов мел-частотных кепстральных коэффициентов фонетических единиц, соединенной со вторым входом блока вычисления степени соответствия между фонетическими единицами, выход которого является выходом блока классификации речи. На фигуре изображена структурная схема устройства анализа речи. В соответствии с фиг. 1 устройство анализа речи содержит блок поступления голосового сигнала 1, блок частотного преобразования 2, блок сегментации речи 3 и блок классификации речи 4, соединенные последовательно. Блок сегментации речи 3 содержит 2 81942012.04.30 блок вычисления линейных спектральных частот 5, блок расчета расстояния между фреймами 6, блок формирования порогового значения 7, блок расстановки границ 8, блок формирования фонетических единиц 9, соединенные последовательно. Выход блока частотного преобразования 2 подключен к входу блока вычисления линейных спектральных частот 5, соединенному с входом блока формирования фонетических единиц 9. Второй выход блока расчета расстояния между фреймами 6 соединен со вторым входом блока расстановки границ 8. Блок классификации речи 4 содержит блок вычисления мелчастотных кепстральных коэффициентов 10, выход которого подключен к первому входу блока вычисления степени соответствия между фонетическими единицами 12, базу эталонов мел-частотных кепстральных коэффициентов фонетических единиц 11, выход которой подключен ко второму входу блока вычисления степени соответствия между фонетическими единицами 12. Вход блока вычисления мел-частотных кепстральных коэффициентов 10 подключен к выходу блока формирования фонетических единиц 9. Работа устройства происходит следующим образом. Блок частотного преобразования 2 преобразует фреймы (окна) голосового сигнала, полученные в блоке поступления голосового сигнала 1, в частотный спектр, на основе которого в блоке вычисления линейных спектральных частот 5 рассчитывается вектор линейных спектральных корней каждого фрейма. Блок расчета расстояния между фреймами 6 вычисляет расстояние между векторами линейных спектральных корней соседних фреймов. В качестве расстояния используется метрика Минковского четвертого порядка. Полученное значение расстояния сравнивается с пороговым значением в блоке расстановки границ 8, и в случае, если оно превышает пороговое, принимается решение о постановке границы фонетической единицы. В блоке формирования порогового значения 7 на основе получаемых от блока расчета расстояния между фреймами 6 значений расстояний между последовательными фреймами, а также коэффициента отношения величины порогового значения расстояния к среднему значению расстояния между фреймами формируется пороговое значение расстояния,которое поступает в блок расстановки границ 8. На первый вход блока формирования фонетических единиц 9 от блока расстановки границ 8 поступает информация о местоположении границ фонетических единиц, на его второй вход поступает частотный спектр сигнала, на выходе формируются частотные спектры сегментированных фонетических единиц, которые последовательно передаются на обработку в блок вычисления мелчастотных кепстральных коэффициентов 10. Вычисленный вектор мел-частотных кепстральных коэффициентов сегментированной фонетической единицы подается на первый вход блока вычисления степени соответствия между фонетическими единицами 12, на второй вход которого из базы эталонов мел-частотных кепстральных коэффициентов фонетических единиц 11 поступают эталонные вектора мел-частотных кепстральных коэффициентов классифицированных фонетических единиц. С помощью метода динамического программирования блок вычисления степени соответствия между фонетическими единицами 12 определяет, к какому из классов эталонных фонетических единиц наиболее близка анализируемая фонетическая единица, и принимает решение о ее принадлежности данному классу. Применение предлагаемого технического решения позволяет сегментировать речевые сигналы на участки квазистационарных колебаний, соответствующие голосовым и шумовым фонемам, и классифицировать их. Национальный центр интеллектуальной собственности. 220034, г. Минск, ул. Козлова, 20. 3

МПК / Метки

МПК: G10L 15/00

Метки: устройство, речи, анализа

Код ссылки

<a href="https://by.patents.su/3-u8194-ustrojjstvo-analiza-rechi.html" rel="bookmark" title="База патентов Беларуси">Устройство анализа речи</a>

Похожие патенты

Устройство сегментации речи

Номер патента: U 4668

Опубликовано: 30.10.2008

Авторы: Шамгин Юрий Васильевич, Воробьев Василий Иванович, Лобанов Борис Мефодьевич, Лыньков Леонид Михайлович, Давыдов Геннадий Владимирович, Давыдов Андрей Геннадьевич

МПК: G10L 15/00

Метки: речи, устройство, сегментации

Текст:

...выход которого подключен к третьему входу блока сопоставления характеристических векторов,а первый и второй входы соединены с первым выходом модуля синтеза речи по тексту и выходом модуля ввода речи соответственно. На фигуре представлено схемотехническое изображение устройства сегментации речи. Устройство сегментации речи содержит модуль речевой базы 1, модуль ввода текста 2, модуль ввода речи 3, модуль синтезатора речи по тексту 4,...

Устройство автоматического распознавания диктора по речи

Номер патента: U 6754

Опубликовано: 30.10.2010

Авторы: Аль-Хатми Мохаммед Омар, Зельманский Олег Борисович

МПК: G10L 15/00

Метки: устройство, речи, распознавания, автоматического, диктора

Текст:

...Фурье, вычислителя спектра мощности сигнала в сегменте, блока определения формантного вектора текущего сегмента и формирователя параметрических описаний входного речевого сигнала, соединенных последовательно, коммутатор, блок сравнения параметрических описаний эталона и входного речевого сигнала, блок принятия решения о распознаваемом дикторе и запоминающее устройство. Недостатком такого устройства является то, что оно все еще не обеспечивает...

Устройство для определения разборчивости речи

Номер патента: 15314

Опубликовано: 28.02.2012

Авторы: Железняк Владимир Кириллович, Раханов Константин Яковлевич

МПК: G10L 15/00, H04R 29/00

Метки: определения, речи, устройство, разборчивости

Текст:

...ОСШ, причем вторые входы согласованного фильтра речевого сигнала, -полосного фильтра, блока снижения порога ЛЧМ, блока частотновременной обработки ЛЧМ-сигнала, измерителя уровней сигнала и шума, вычислителя ОСШ и вычислителя уровня разборчивости речи соединены с соответствующими выходами блока управления и синхронизации. Предложенное устройство поясняется структурной схемой, на которой 1 - генератор испытательного ЛЧМ-сигнала 2 -...

Устройство синтеза речеподобных сигналов для защиты речевой информации от утечки по вибрационным и акустическим каналам

Номер патента: U 8193

Опубликовано: 30.04.2012

Авторы: Лыньков Леонид Михайлович, Давыдов Геннадий Владимирович, Давыдов Андрей Геннадьевич, Зельманский Олег Борисович

МПК: H04K 3/00, G10L 19/14

Метки: акустическим, каналам, устройство, защиты, утечки, информации, вибрационным, речеподобных, сигналов, речевой, синтеза

Текст:

...блоки детектирования речи, верификации диктора по голосу, сегментирования речи, классификации речи и база аллофонов дикторов, соединенные последовательно, причем выход базы аллофонов дикторов подключен к входу генератора речеподобных сигналов, второй выход блока верификации диктора по голосу подключен ко второму входу базы аллофонов дикторов. За счет введения блока детектирования речи устройство анализирует окружающую акустическую обстановку...

Устройство для анализа родовой деятельности

Номер патента: 6122

Опубликовано: 30.06.2004

Авторы: Скубилин Михаил Демьянович, Письменов Александр Владимирович, Стефаненко Виталий Кузьмич

МПК: G06F 15/42, G06F 19/00, A61B 5/04...

Метки: деятельности, родовой, устройство, анализа

Текст:

...пациента. Технический результат достигается тем, что в устройство, содержащее генератор тактовых импульсов, источник опорных напряжений, датчик сократительной функции гладкомышечного органа - матки, первый и второй пороговые элементы, соединенные входами ввода опорных напряжений с выходами источника опорных напряжений, а информационными входами - с выходом датчика, первый, второй и третий формирователи импульсов, первый и второй элементы...

Предыдущий патент: Устройство синтеза речеподобных сигналов для защиты речевой информации от утечки по вибрационным и акустическим каналам

Следующий патент: Устройство бесконтактного измерения параметров вибрации и акустических колебаний

Случайный патент: Установка гранулирования карбамида

Устройство анализа речи

Текст

МПК / Метки

Код ссылки

О сайте

Архивы

Контакты