Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год






Скачать 26.46 Kb.
НазваниеАнализа естественноязыковых текстов доц. М. И. Гринчук 1 год
Дата публикации14.02.2015
Размер26.46 Kb.
ТипЛитература
l.120-bal.ru > Математика > Литература

АЛГОРИТМЫ АНАЛИЗА ЕСТЕСТВЕННОЯЗЫКОВЫХ ТЕКСТОВ


доц. М. И. Гринчук

1 год

Языки и грамматики. Основные модели языков.

Грамматики с конечным числом состояний. Приведение грамматики к стандартному (однозначному) виду. Объединение, пересечение и дополнение языков с конечным числом состояний. Зависимость числа слов от их длины.

Грамматики зависимостей. Оценка и точная формула для числа деревьев зависимостей. Полиномиальный алгоритм анализа для соответствующих языков. Модификация этого алгоритма при введении различного правдоподобия связей. Алгоритм поиска коэффициентов правдоподобия. Модификация алгоритма для различения омонимов.

Грамматики непосредственных составляющих (контекстно-свободные). Приведение их к стандартному (двухэлементному) виду. Алгоритм Кока. Модификация этого алгоритма при введении различного правдоподобия правил. Алгоритм Эрли. Оценки используемых памяти и времени в общем случае, для линейных грамматик, для однозначных грамматик.

Вероятностная модель языка с независимым выбором букв. Нижняя оценка средней длины кода. Код Хафмана. Блочный код; его асимптотическая оптимальность при росте длины блока.

Марковская модель языка. Нижняя оценка средней длины кода. Асимптотическая оптимальность блочного кода.

Кодирование с внутренней адресацией. Его асимптотическая оптимальность для модели с независимым выбором букв.

Кодирование алфавитно упорядоченных словарей. Возможность сэкономить асимптотически бит для любого словаря из N слов.

Алгоритм минимизации графового представления словарей.

Хеширование. Оценка среднего числа обращений к памяти при записи и при поиске. Сочетание хеширования со сжатием.

Методы поиска и исправления орфографических ошибок. Метод n-грамм. Алгоритм вычисления "расстояния" между словоформами. Применение различных методов кодирования словарей для поиска кандидатов на исправление.

Распознавание речи. Математическая модель произнесения звуков и слов в виде функции от марковской цепи. Алгоритм выделения элементарных акустических единиц; его конечность. Алгоритмы распознавания фонем. Идентификация параметров этих алгоритмов по обучающей информации. Построение марковской модели слова по марковским моделям звуков. Алгоритм распознавания слов; учет сочетаемости слов.

Литература


1. Большаков И.А., Емелин Е.В. Алгоритм минимизации графового представления словарей.// Изв. АН, сер. Технич. киберн., 1987, № 4.

2. Большаков И.А., Смирнов А.В. Методы сжатия текстовой информации.// Итоги науки и техники. Теор. вер. Мат. стат. Теор. киберн. Т. 28, 1988.

3. Большаков И.А. Проблема автоматической коррекции текстов на флективных языках.// Итоги науки и техники. Теор. вер. Мат. стат. Теор. киберн. Т. 28, 1988.

4. Вакуловская Г.В., Кулагина О.С. Об одном способе анализа текста.// Проблемы кибернетики, 1964, вып. 12.

5. Дискретная математика и математические вопросы кибернетики. (под ред. С.В. Яблонского, О.Б. Лупанова.) Т. 1. М., Наука, 1974.

6. Кнут Д. Искусство программирования для ЭВМ. Т. 1-3. М., Мир, 1976, 1977, 1978.

7. Кулагина О.С. Об использовании машины при составлении алгоритма анализа текста.// Проблемы кибернетики, 1962, вып. 7.

8. Лупанов О.Б. Об одном подходе к синтезу управляющих систем – принципе локального кодирования.// Проблемы кибернетики, 1965, вып. 14.

9. Слуцкер Г.С. Получение всех допустимых вариантов синтаксического анализа текста при помощи машины.// Проблемы кибернетики, 1963, вып. 10.

10. Хомский Н. Три модели описания языка.// Киб. сборник, старая серия, 1961, вып. 2.

11. Хомский Н., Миллер Дж. Языки с конечным числом состояний.// Киб. сборник, старая серия, 1962, вып. 4.

12. Хомский Н., Миллер Дж. Введение в формальный анализ естественных языков.// Киб. сборник, новая серия, 1965, вып. 1.

13. Хомский Н., Миллер Дж. Конечные модели использования языка.// Киб. сборник, новая серия, 1967, вып. 4.

14. Цейтин Г.С. Алгоритм для упрощенного синтаксического анализа.// Проблемы кибернетики, 1971, вып. 24.

15. Эрли Дж. Эффективный алгоритм анализа контекстно-свободного языка.// сб. "Языки и автоматы", 1975.

Добавить документ в свой блог или на сайт

Похожие:

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconВысшая школа современных социальных наук “ Утверждаю” Директор академик Г. В. Осипов “
«Менеджмент» М.: Мгу, 2013. Отв ред к социол н., доц. Федулова А. В. Авторский коллектив: к социол н., доц. Федулова А. В., к э н....

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconПрограмма государственного междисциплинарного экзамена по специальности...
«Оборудование и технология сварочного производства» / Составители: доц. Банов М. Д., проф. Козулин М. Г., проф. Короткова Г. М.,...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconНаталья Георгиевна Харланова 2012 год Типичные проблемы текстов, предлагаемых для анализа на егэ
Не секрет, что самое трудное в написании сочинения по исходному тексту – аргументация своей точки зрения по поставленной автором...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconРабочая программа дисциплины «Текст в интернет-коммуникациях»
Познакомиться с различными типами профессиональных коммуникативных текстов (далее – pr-текстов), используемыми в сети Интернет, понять...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconОтделение региональных исследований и международных отношений
Нем ст пр. Сперанская С. С. фр. Перевод доц. Именитова И. П. 1исп. Перевод ст пр. Курындина Т. Г 2англ. Перевод доц. Моргун Н. Л

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconЛитература текст
Цель практических занятий – в процессе разных видов анализа художественных текстов проявить замысел писателя и его воплощение, понять...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconУмеренность и аккуратность
В статье на основе анализа различных текстов и результатов анкетирования студентов рассматриваются изменения в восприятии выражения...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconУрок литературы в 10 классе
Тип урока – урок-семинар. Модель урока – исследование на основе филологического анализа художественных текстов. Основные формы работы...

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconСтилистические и жанровые особенности текстов популярной психологии
Целью данной статьи является характеристика стилистической принадлежности и жанровых особенностей этих текстов

Анализа естественноязыковых текстов доц. М. И. Гринчук 1 год iconУроки алгебры. 10 класс. Виртуальная шкла Кирилла и Мефодия. 2009 год
Алгебра и начала анализа. Итоговая аттестация выпускников. 11 класс. Издание 2-е. 2006 год

Вы можете разместить ссылку на наш сайт:


Литература


При копировании материала укажите ссылку ©ucheba 2000-2015
контакты
l.120-bal.ru
..На главную