Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.


Для правообладателей

Обратная связь

Email: Нажмите что бы посмотреть 

Яндекс.Метрика

Презентация на тему Основные классы естественно-языковых систем. Системы распознавания речи

Содержание

Лекция № 2. Основные классы естественно-языковых систем.Системы распознавания речи
Новые информационные технологииХарламов Александр Александрович © 2012 МГЛУИн. яз. им. М. Тореза Лекция № 2. Основные классы естественно-языковых систем.Системы распознавания речи Основные классы естественно-языковых систем  Средства распознавания речи  распознают голосовую (речевую) 6Структура коммуникационной системы для организации речевого поведения 7Структура коммуникационной системы для организации речевого поведения 8Информационно-кодовая модель коммуникации Шеннона и Уивера 10Адресант передает, а адресат принимает одно из группы событий 11Правило БайесаПусть 12Правило БайесаВ случае двух классов    и 13Правило Байеса 14Правило Байеса 15Информационно-кодовая модель коммуникации Шеннона и Уивера,модифицированная для коммуникационного акта Якобсоном 3Автоматическое распознавание речиОбщая блок-схема ориентированной на задачу системы распознавания-синтеза речи 20Речевая волна во временной и частотной областях уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь корневых Системы распознавания речи  1. Системы покомандного распознавания 2. Системы распознавания ключевых Системы покомандного распознавания   Средства голосового ввода, управления и сбора данных лексикон (словарь корневых основ)акустико-фонетический уровеньСистемы покомандного распознавания  31 381) Формирование вектора признаков 39Покомандное распознавание речиИмеется три основных подхода к покомандному распознаванию речи1. Подход, основанный 44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов 47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:1) Измерение первичных признаков речевого 47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:3) Классификация, во время которой 45Подход, основанный на распознавании образовДостоинства подхода:1. Простота. Он легко интерпретируется 2. Имеется 46Подход, основанный на распознавании образовНедостатки:1. Чувствительность к объему обучающейвыборки2. Подверженность качества распознаваниявлиянию 41Акустико-фонетический подходФонетические гипотезы, полученные при распознавании строки слов «all about» 41Акустико-фонетический подходДиаграмма классификации стандартных фонемамериканского английского в широкие звуковые классы 42Акустико-фонетический подходБинарное дерево классификации речевых звуков 42Акустико-фонетический подходАкустико-фонетический классификатор гласных 40Сравнение подходов, основанного на распознавании образов и на основе акустико-фонетического анализа 51Подход, основанный на искусственных нейронных сетяхМногослойный персептрон для классификациигласных, основанной на формантных измерениях Искусственные нейронные сетиТрехслойный персептрон- сравнивает с порогом- вычисляет сумму 52Подход, основанный на искусственных нейронных сетяхНейронная сеть с задержками 381) Формирование вектора признаков 60Оцифровка речевого сигнала 53Первичная обработка Наиболее характерные подходы:1. Спектральный анализ2. Антропоморфная модель 57Спектральный анализ Типичный вид речевой волны и ее спектра в моделианализа на основе гребенки фильтров 54Спектральный анализ На основе гребенки фильтров 54Спектральный анализ На основе гребенки фильтров 21Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a letter» 21СегментацияСегментация и разметка для последовательности «did-you» 75Принятие решения Динамическое программирование Байесовское правилоСкрытые Марковские модели 75Принятие решения Ключевым вопросом в распознавании речи является вопрос сравнения входного образа 75Принятие решения Сравниваемые образы не могут быть нормализованы по длительности, поскольку различные 76Динамическое программирование 83Адресант передает, а адресат принимает одно из группы событий 11Правило БайесаЭти вероятности можно оценить методами математической статистики на множестве прецедентов. 11Системы покомандного распознавания Системы распознавания слитной речи   Системы типа «Речь-текст»  предназначены для 39Распознавание слитной речиИмеется два подхода к распознаванию слитнойречи:1. Подход, основанный на распознавании образов2. Структурный подход 44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основе подхода, основанного на распознавании образов уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь корневых 90Подход, основанный на распознавании образовМодель фонемы 94Подход, основанный на распознавании образовСоставление эталонных сигналов слов из фонем в соответствие с моделью произношения 97Подход, основанный на распознавании образовМодель предложения с произвольным порядком следования моделей слов 44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов 48Структурный подход«Снизу-вверх» подход интеграции знаний дляРаспознавания слитной речи 49Структурный подход«Сверху-вниз» подход к интеграции знанийдля распознавания слитной речи 50Структурный подход Подход, основанный на концепции класснойдоски для интеграции знаний 50Структурный подход Взаимодействие между источниками знанийразных уровней 50Структурный подход Частичные гипотезу на разных уровнях 52Модель языка на основе многослойного персептрона Структурный подход(синтаксический уровень) 11Системы распознавания слитной речи 4Сравнение эффективности распознаваниячеловеком и искусственными системами 4Сравнение эффективности распознаваниячеловеком и искусственными системами(продолжение) 4Сравнение эффективности распознаваниячеловеком и искусственными системамив условиях шума 4Диалог человека и машины Существует два типа таких системСистемы первого типа ведут 3Общая блок-схема ориентированной на задачу системы речевого диалогаДиалог человека и машины 4Диалог человека и машины Классификация систем устного диалогапо направлению потока информации 4Диалог человека и машины Классификация систем устного диалогапо структуре информации
Слайды презентации

Слайд 2 Лекция № 2. Основные классы естественно-языковых систем.
Системы распознавания

Лекция № 2. Основные классы естественно-языковых систем.Системы распознавания речи

речи


Слайд 3 Основные классы естественно-языковых систем Средства распознавания речи распознают голосовую

Основные классы естественно-языковых систем Средства распознавания речи распознают голосовую (речевую) информацию

(речевую) информацию и преобразуют ее в последовательность символов
13


Слайд 4
6
Структура коммуникационной системы для организации речевого поведения

6Структура коммуникационной системы для организации речевого поведения

Слайд 5

7
Структура коммуникационной системы для организации речевого поведения

7Структура коммуникационной системы для организации речевого поведения

Слайд 6
8
Информационно-кодовая модель коммуникации Шеннона и Уивера

8Информационно-кодовая модель коммуникации Шеннона и Уивера

Слайд 7
10
Адресант передает, а адресат принимает одно из группы

10Адресант передает, а адресат принимает одно из группы событий

событий

(классов, к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная):
1) все события попарно несовместны: ;
2) их объединение образует пространство элементарных исходов Ω:




Правило Байеса


Слайд 8
11
Правило Байеса




Пусть

11Правило БайесаПусть       - полная группа

- полная группа

событий и – некоторое событие. Тогда по формуле Байеса исчисляется вероятность реализации гипотезы при условии, что событие А произошло. Здесь А – конкретное наблюдение (измерение).
- априорная вероятность гипотезы
- апостериорная вероятность
известны функции распределения вектора признаков для каждого класса














Слайд 9
12
Правило Байеса

В случае двух классов

12Правило БайесаВ случае двух классов  и  , если

и , если

то
классифицируется в , иначе в .





















Слайд 10
13
Правило Байеса













13Правило Байеса

Слайд 11
14
Правило Байеса












14Правило Байеса

Слайд 12
15
Информационно-кодовая модель коммуникации Шеннона и Уивера,
модифицированная для коммуникационного

15Информационно-кодовая модель коммуникации Шеннона и Уивера,модифицированная для коммуникационного акта Якобсоном

акта Якобсоном


Слайд 13
3
Автоматическое распознавание речи
Общая блок-схема ориентированной
на задачу системы

3Автоматическое распознавание речиОбщая блок-схема ориентированной на задачу системы распознавания-синтеза речи

распознавания-синтеза речи


Слайд 14
20
Речевая волна во временной
и частотной областях

20Речевая волна во временной и частотной областях

Слайд 15 уровень семантических представлений (словарь попарной сочетаемости слов)
синтаксический уровень

уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь

(словарь синтаксем)
лексикон (словарь корневых основ)
морфологический уровень (словарь окончаний)
акустико-фонетический уровень


Процесс

восприятия речи человеком
Структура речевой информации

31


Слайд 16 Системы распознавания речи 1. Системы покомандного распознавания 2. Системы распознавания

Системы распознавания речи 1. Системы покомандного распознавания 2. Системы распознавания ключевых

ключевых слов в потоке слитной речи 3. Системы распознавания связной

речи 4. Системы распознавания слитной речи

54




Слайд 17 Системы покомандного распознавания Средства голосового ввода, управления и

Системы покомандного распознавания  Средства голосового ввода, управления и сбора данных

сбора данных предназначены для ввода голосовых команд, управляющих работой

некоторой системы (например бытовой техникой)

14


Слайд 18 лексикон (словарь корневых основ)
акустико-фонетический уровень


Системы покомандного распознавания
31

лексикон (словарь корневых основ)акустико-фонетический уровеньСистемы покомандного распознавания 31

Слайд 19
38
1) Формирование вектора признаков

381) Формирование вектора признаков


2) Сегментация
3) Сравнение входного и эталонных образов
4) Принятие решения




Покомандное распознавание речи
Базовый алгоритм покомандного распознавания


Слайд 20
39
Покомандное распознавание речи
Имеется три основных подхода к покомандному

39Покомандное распознавание речиИмеется три основных подхода к покомандному распознаванию речи1. Подход,


распознаванию речи
1. Подход, основанный на распознавании образов
2. Акустико-фонетический (структурный)

подход
3. Подход, основанный на использовании
искусственных нейронных сетей

Слайд 21
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов

основе
подхода, основанного на распознавании образов


Слайд 22
47
Подход, основанный на
распознавании образов
Алгоритм включает четыре
основных шага:
1)

47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:1) Измерение первичных признаков

Измерение первичных признаков речевого сигнала.
Вычисляются спектральные признаки, либо

с помощью
гребенки фильтров, либо с помощью линейного
предсказывающего кодирования, либо с помощью
Дискретного преобразования Фурье
2) Формирование эталонов (обучение). Эталоны
формируются с помощью некоторых усредняющих
процедур. Это может быть модель, характеризующая
статистику признаков эталона.


Слайд 23
47
Подход, основанный на
распознавании образов
Алгоритм включает четыре
основных шага:
3)

47Подход, основанный на распознавании образовАлгоритм включает четыреосновных шага:3) Классификация, во время

Классификация, во время которой входной
образ сравнивается с эталонами. Сравнение

образов,
которые есть последовательность векторов признаков,
осуществляется с использованием как локального
расстояния между двумя синхронными векторами,
так и глобальной выравнивающей во времени
процедуры (чаще всего, это процедура динамического
программирования), которая компенсирует
различные скорости произнесения входного и
эталонного образов
4) Принятие решения

Слайд 24
45
Подход, основанный на
распознавании образов
Достоинства подхода:
1. Простота. Он

45Подход, основанный на распознавании образовДостоинства подхода:1. Простота. Он легко интерпретируется 2.

легко интерпретируется
2. Имеется хорошо развитый математический аппарат для

всех процедур подхода
3. Устойчивость и инвариантность к различным словарям, пользователям, выбору признаков, использования алгоритмов сравнения образов и принятия решения, а также групп дикторов, используемого оборудования, канала
4. Не зависит от выбора речевой единицы: от фонемы до фразы. Дает хорошие результаты в широком круге задач

Слайд 25
46
Подход, основанный на
распознавании образов
Недостатки:
1. Чувствительность к объему

46Подход, основанный на распознавании образовНедостатки:1. Чувствительность к объему обучающейвыборки2. Подверженность качества

обучающей
выборки
2. Подверженность качества распознавания
влиянию шума
3. Неиспользование лингвистической
информации
4. Большая вычислительная

емкость

Слайд 26
41
Акустико-фонетический подход
Фонетические гипотезы, полученные
при распознавании строки слов

41Акустико-фонетический подходФонетические гипотезы, полученные при распознавании строки слов «all about»

«all about»


Слайд 27
41
Акустико-фонетический подход
Диаграмма классификации стандартных фонем
американского английского в широкие

41Акустико-фонетический подходДиаграмма классификации стандартных фонемамериканского английского в широкие звуковые классы

звуковые классы


Слайд 28
42
Акустико-фонетический подход
Бинарное дерево классификации речевых звуков

42Акустико-фонетический подходБинарное дерево классификации речевых звуков

Слайд 29
42
Акустико-фонетический подход
Акустико-фонетический классификатор гласных

42Акустико-фонетический подходАкустико-фонетический классификатор гласных

Слайд 30
40
Сравнение подходов, основанного на распознавании образов и на

40Сравнение подходов, основанного на распознавании образов и на основе акустико-фонетического анализа

основе акустико-фонетического анализа


Слайд 31
51
Подход, основанный на искусственных нейронных сетях
Многослойный персептрон для

51Подход, основанный на искусственных нейронных сетяхМногослойный персептрон для классификациигласных, основанной на формантных измерениях

классификации
гласных, основанной на формантных измерениях


Слайд 32 Искусственные нейронные сети
Трехслойный персептрон

- сравнивает с порогом

- вычисляет

Искусственные нейронные сетиТрехслойный персептрон- сравнивает с порогом- вычисляет сумму

сумму


Слайд 33
52
Подход, основанный на искусственных нейронных сетях
Нейронная сеть с

52Подход, основанный на искусственных нейронных сетяхНейронная сеть с задержками

задержками


Слайд 34
38
1) Формирование вектора признаков

381) Формирование вектора признаков


2) Сегментация
3) Сравнение входного и эталонных образов
4) Принятие решения




Покомандное распознавание речи
Базовый алгоритм покомандного распознавания


Слайд 35
60
Оцифровка речевого сигнала


60Оцифровка речевого сигнала

Слайд 36
53
Первичная обработка
Наиболее характерные подходы:
1. Спектральный анализ
2. Антропоморфная

53Первичная обработка Наиболее характерные подходы:1. Спектральный анализ2. Антропоморфная модель

модель


Слайд 37
57
Спектральный анализ
Типичный вид речевой волны и ее

57Спектральный анализ Типичный вид речевой волны и ее спектра в моделианализа на основе гребенки фильтров

спектра в модели
анализа на основе гребенки фильтров


Слайд 38
54
Спектральный анализ
На основе гребенки фильтров

54Спектральный анализ На основе гребенки фильтров

Слайд 39
54
Спектральный анализ
На основе гребенки фильтров

54Спектральный анализ На основе гребенки фильтров

Слайд 40
21
Представление речи в виде
формантных траекторий
Для последовательности

21Представление речи в виде формантных траекторий Для последовательности «Why do I owe you a letter»

«Why do I owe you a letter»


Слайд 41
21
Сегментация
Сегментация и разметка для последовательности «did-you»

21СегментацияСегментация и разметка для последовательности «did-you»

Слайд 42
75
Принятие решения

Динамическое программирование
Байесовское правило
Скрытые Марковские модели

















75Принятие решения Динамическое программирование Байесовское правилоСкрытые Марковские модели

Слайд 43
75
Принятие решения

Ключевым вопросом в распознавании речи является

75Принятие решения Ключевым вопросом в распознавании речи является вопрос сравнения входного

вопрос сравнения входного образа с эталонными образами с целью

выяснения степени их подобия
Обычно входной и эталонный образы имеют разную длину



















Слайд 44
75
Принятие решения

Сравниваемые образы не могут быть нормализованы

75Принятие решения Сравниваемые образы не могут быть нормализованы по длительности, поскольку

по длительности, поскольку различные типы звуков имеет различные возможности

по удлинению произнесения
Необходимо найти способ сравнения спектральных векторов такой, чтобы можно было вычислять глобальную меру совпадения образов



















Слайд 45
76
Динамическое программирование


















76Динамическое программирование

Слайд 46
83
Адресант передает, а адресат принимает одно из группы

83Адресант передает, а адресат принимает одно из группы событий

событий

(классов, к которым относятся передаваемые и получаемые сообщения). Группа событий обладает следующими свойствами (она - полная):
1) все события попарно несовместны: ;
2) их объединение образует пространство элементарных исходов Ω:




Правило Байеса


Слайд 47
11
Правило Байеса




Эти вероятности можно оценить методами математической статистики

11Правило БайесаЭти вероятности можно оценить методами математической статистики на множестве прецедентов.

на множестве прецедентов.

, где - число прецедентов из ,
- общее число прецедентов. - гистограмма распределения вектора признаков для прецедентов из класса .
























Слайд 48
11
Системы покомандного распознавания

















11Системы покомандного распознавания

Слайд 49 Системы распознавания слитной речи Системы типа «Речь-текст» предназначены

Системы распознавания слитной речи  Системы типа «Речь-текст» предназначены для распознавания

для распознавания слитной речи (например для диктовки деловой корреспонденции)
14


Слайд 50
39
Распознавание слитной речи
Имеется два подхода к распознаванию слитной
речи:
1.

39Распознавание слитной речиИмеется два подхода к распознаванию слитнойречи:1. Подход, основанный на распознавании образов2. Структурный подход

Подход, основанный на распознавании образов
2. Структурный подход


Слайд 51
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основе подхода, основанного на распознавании образов

основе подхода,
основанного на распознавании образов


Слайд 52 уровень семантических представлений (словарь попарной сочетаемости слов)
синтаксический уровень

уровень семантических представлений (словарь попарной сочетаемости слов)синтаксический уровень (словарь синтаксем)лексикон (словарь

(словарь синтаксем)
лексикон (словарь корневых основ)
морфологический уровень (словарь окончаний)
акустико-фонетический уровень


Системы

распознавания слитной речи

31


Слайд 53
90
Подход, основанный на
распознавании образов
Модель фонемы





























90Подход, основанный на распознавании образовМодель фонемы

Слайд 54
94
Подход, основанный на
распознавании образов
Составление эталонных сигналов слов

94Подход, основанный на распознавании образовСоставление эталонных сигналов слов из фонем в соответствие с моделью произношения

из фонем
в соответствие с моделью произношения






























Слайд 55
97
Подход, основанный на
распознавании образов
Модель предложения с произвольным

97Подход, основанный на распознавании образовМодель предложения с произвольным порядком следования моделей

порядком следования
моделей слов и моделей фонем в предложении
































Слайд 56
44
Подход, основанный на
распознавании образов
Блок-схема распознавателя речи на

44Подход, основанный на распознавании образовБлок-схема распознавателя речи на основеподхода, основанного на распознавании образов

основе
подхода, основанного на распознавании образов


Слайд 57
48
Структурный подход
«Снизу-вверх» подход интеграции знаний для
Распознавания слитной речи

48Структурный подход«Снизу-вверх» подход интеграции знаний дляРаспознавания слитной речи

Слайд 58
49
Структурный подход
«Сверху-вниз» подход к интеграции знаний
для распознавания слитной

49Структурный подход«Сверху-вниз» подход к интеграции знанийдля распознавания слитной речи

речи


Слайд 59
50
Структурный подход
Подход, основанный на концепции классной
доски для

50Структурный подход Подход, основанный на концепции класснойдоски для интеграции знаний

интеграции знаний


Слайд 60
50
Структурный подход
Взаимодействие между источниками знаний
разных уровней

50Структурный подход Взаимодействие между источниками знанийразных уровней

Слайд 61
50
Структурный подход
Частичные гипотезу на разных уровнях

50Структурный подход Частичные гипотезу на разных уровнях

Слайд 62
52
Модель языка на основе многослойного персептрона
Структурный подход
(синтаксический

52Модель языка на основе многослойного персептрона Структурный подход(синтаксический уровень)

уровень)


Слайд 63
11
Системы распознавания слитной речи

















11Системы распознавания слитной речи

Слайд 64
4
Сравнение эффективности распознавания
человеком и искусственными системами





























4Сравнение эффективности распознаваниячеловеком и искусственными системами

Слайд 65
4
Сравнение эффективности распознавания
человеком и искусственными системами
(продолжение)




























4Сравнение эффективности распознаваниячеловеком и искусственными системами(продолжение)

Слайд 66
4
Сравнение эффективности распознавания
человеком и искусственными системами
в условиях шума

4Сравнение эффективности распознаваниячеловеком и искусственными системамив условиях шума































Слайд 67
4
Диалог человека и машины



























Существует два типа таких

4Диалог человека и машины Существует два типа таких системСистемы первого типа

систем
Системы первого типа ведут человека, следуя четкому порядку заполнения

определенных форм. Примером такой системы может стать заказ билетов. В каждом из состояний система настраивается на распознавание заранее приготовленных атрибутов, допуская варианты возврата к предыдущему шагу или выходу из системы
В системах второго типа человеку отводится роль собеседника, который может сам проявлять интерес к разным аспектам информации, задавая любые вопросы.



Слайд 68
3
Общая блок-схема ориентированной
на задачу системы речевого диалога
Диалог

3Общая блок-схема ориентированной на задачу системы речевого диалогаДиалог человека и машины

человека и машины


Слайд 69
4
Диалог человека и машины
Классификация систем устного диалога
по

4Диалог человека и машины Классификация систем устного диалогапо направлению потока информации

направлению потока информации





























  • Имя файла: osnovnye-klassy-estestvenno-yazykovyh-sistem-sistemy-raspoznavaniya-rechi.pptx
  • Количество просмотров: 123
  • Количество скачиваний: 0