Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы






НазваниеЛекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы
страница5/14
Дата публикации25.01.2015
Размер1.61 Mb.
ТипЛекция
l.120-bal.ru > Информатика > Лекция
1   2   3   4   5   6   7   8   9   ...   14

Рисунок : Предметная область

Один и тот же объект с различными свойствами может принадлежать нескольким различным типам. Предложение естественного языка есть утверждение о том, что некоторые объекты обладают определенным свойством или что между конкретными объектами существуют определенные взаимоотношения.

В первом случае предложение становится фактом (предложению соответствует истинное значение), если объекты в абстрактном состоянии принадлежат типам, определенным фразами, обозначающими свойства объектов. Во втором случае предложение становится фактом, если объекты, определяемые связанными друг с другом в предложении именами, образуют кортеж соответствующего отношения. Если указанные условия не выполняются, предложению соответствует значение «ложь», и предложение фактом не является.

Абстрактное состояние является моделью описания состояния на естественном языке, если имеется интерпретация IE A, такая, что всем предложениям этого описания соответствует значение «истина», а всем предложениям, не принадлежащим описанию, — значение «ложь».

Пример описания предметной области приведен ниже.

Описание на естественном языке. «Отдел N 50 есть отдел с названием отдела ОЭВМ и номером отдела N 50. Проект Ш-Р1 — проект, имеющий шифр Ш-Р1. Проект Ш-Р2 — проект, имеющий шифр Ш-Р2. Ресурс Р-АВ — ресурс, имеющий шифр Р-АВ. Отдел N 50 разрабатывает проект Ш-Р1. Проект Ш-Р1 потребляет ресурс Р-АВ до конечной даты 1.06.84».

Абстрактные состояния 〈E, T, R〉, представляющие состояние рассматриваемой предметной области, а также соответствие элементов описания предметной области обозначениям объектов, типов и отношений, приведены ниже:

E = {l1 , l2 , . . . , l1 0}, где

• l1 = «отдел № 50»;

• l2 = «№ 50»;

• l3 = «ОЭВМ»;

• l4 = «проект Ш-Р1»;

• l5 = «Ш-Р1»;

• l6 = «проект Ш-Р2»;

• l7 = «Ш-Р2»;

• l8 = «ресурс Р-АВ»;

• l9 = «Р-АВ»;

• l1 0= «1.06.84».

T = 〈T1 , T2 , . . . , T8 〉

• T1 = «быть отделом»;

• T2 = «быть номером отдела»;

• T3 = «быть названием отдела»;

• T4 = «быть проектом»;

• T5 = «быть шифром проекта»;

• T6 = «быть ресурсом»;

• T7 = «быть шифром ресурса»;

• T8 = «быть датой»;

T1 = {l1 }, T2 = {l2 }, T3 = {l3 }, T4 = {l4 , l6 }, T5 = {l5 , l7 }, T6 = {l8 }, T7 = {l9 }, T8 = {l1 0}.

R = 〈R1 , R2 , . . . , R6 〉

• R1 = «отдел имеет номер отдела»;

• R2 = «отдел имеет название»;

• R3 = «отдел разрабатывает проект»;

• R4 = «проект потребляет ресурс до конечной даты»;

• R5 = «проект имеет шифр проекта»;

• R6 = «ресурс имеет шифр ресурса»;

R1 = {〈l1 , l2 〉}, R2 = {〈l1 , l3 〉}.

Основные принципы описания состояния предметной области на некотором формальном языке следующие:

информационное содержание раскрывается посредством описания состояния предметной области на естественном языке, позволяющем соотносить элементы описания реальным объектам;

формальное установление факта эквивалентности описаний состояния на различных языках требует их абстрактной интерпретации в терминах некоторой эталонной модели;

извлечение информации требует обязательного перехода от формального описания к описанию на естественном языке.

В автоматизированных системах сведения об окружающем нас мире представляются посредством определенного набора понятий. В качестве таких понятий выступают единицы информации и информационные отношения. Рассмотрим их на примере экономических данных.

Лекция 8

Единицы информации

Информационные отношения
Информационные единицы бывают элементарными и составными. Рассмотрим их на примере накладной. В качестве элементарных единиц информации выступают реквизиты — логически неделимые элементы, соотносимые с определенным свойством отображаемого объекта или процесса. Форма реквизита определяет полное его наименование, тип, описание множества допустимых значений и другие характеристики. Рис. 7.

Существует ряд типов реквизитов в зависимости от значений, которые они могут принимать.

Наиболее распространенными являются числовой и текстовый реквизиты.

Числовые реквизиты характеризуют количественные свойства экономических явлений, полученные в результате подсчета натуральных единиц, измерения, взвешивания, вычисления и т. п. Значениями таких реквизитов являются числа. Примерами служат числовые реквизиты.





Рисунок : Пример накладной

Текстовые реквизиты отражают качественные свойства экономических явлений, дают характеристику тем обстоятельствам, при которых протекало то или иное экономическое явление или процесс и были получены те или иные числовые значения. Текстовые реквизиты называют так же реквизитами-признаками, их использование позволяет однозначно трактовать тот или иной хозяйственный процесс, не допуская смыслового искажения или смещения различных процессов или явлений. В качестве текстовых реквизитов в примере выступают СКЛАД, НАИМЕНОВАНИЕ ПОЛУЧАТЕЛЯ, АДРЕС ПОЛУЧАТЕЛЯ. Над числовыми реквизитами, как правило, в процессе обработки выполняются арифметические операции, а над текстовыми — логические. Кроме текстового и числового типов, часто применяется также логический тип, который определяет, какое из двух значений имеет величина — истину или ложь.

Каждый из наблюдаемых объектов или процессов характеризует ряд присущих ему свойств. Изолированно взятый реквизит, характеризующий одно из свойств, не может служить полной информацией о наблюдаемом объекте или процессе. Для воспроизведения некоторого сообщения об объекте, определенной информации о процессе требуется некоторая взаимосвязанная совокупность реквизитов.

Единицу информации, состоящую из совокупности других единиц, связанных между собой, называют составной единицей информации (СЕИ). Единицу информации, входящую в СЕИ, называют составляющей единицей информации. Для C = (R1 , R2 , . . . , Rm )составляющими являются реквизиты R1 , R2 , . . . , Rm . Составной единицей является, например, ДАТА: ДАТА = (ЧИСЛО, МЕСЯЦ, ГОД).

Хотя во многих случаях она рассматривается как один реквизит. Следует отметить, что существуют и другие реквизиты, кроме даты, которые могут быть составными. К таким реквизитам относятся множественные реквизиты, отражающие тот факт, что отображенное свойство объекта может, иметь несколько значений при представлении объекта, процесса или явления. В качестве множественного реквизита может выступать реквизит ЗНАНИЕ ИНОСТРАННЫХ ЯЗЫКОВ в кадровой анкете.

Отдельная личность может владеть несколькими иностранными языками.

Структуру приказа-накладной можно представить составными единицами информации следующим образом: C = (C1 , C2 ); C1 = (C11 , C12 , C13 ); C11 = (R1 , R2 , R3 , R4 ); C12 = (R5 , R6 , R7 ); C13 =(C131 , R10 , R11 , R12 ); C131 = (R8 , R9 ); C2 = (R13 , R14 , Q1 , C21 , Q4 ); C21 = (Q3 , Q4 ).

В составных единицах информации выделяют промежуточные единицы — группы. Группа, состоящая только из реквизитов, называется простой, а группы, имеющие в своем составе другие группы, называются составными. Различают повторяющиеся и неповторяющиеся группы. Повторяющиеся группы допускают, как и множественные реквизиты, определенное количество реализаций:

простые группы C11 , C12 , C131 , C21 ;

составные группы C, C1 , C13 , C2 ;

повторяющиеся группы C2 ;

неповторяющиеся — остальные (кроме C2 ).

Из возможных структурных образований — групп, особого внимания заслуживает группа, называемая показателем. Показатель — это составная единица информации, состоящая из одного реквизита числового типа, именуемого основанием показателя и отражающего тот или иной факт в количественной оценке, и ряда характеризующих его и связанных с ним реквизитов-признаков текстового типа (времени, места действия, действующих лиц, предметов, продуктов труда и т. д.).

Общий вид показателя можно представить следующим образом P (1 : N) (P1 , . . . , Pn , Q), где P1 , . . . , Pn - реквизиты-признаки; Q — реквизит-основание показателя.

Одной из причин выделения показателей в особую разновидность составных единиц информации является то, что показатель, по существу, служит минимальной по составу информационной совокупностью, достаточной для образования самостоятельного документа. Этот документ может существовать изолированно.

Показатели представляются, с одной стороны, простейшими СЕИ, способными к документированию, а с другой — сложными образованиями информации, охватывающими описание многообразных качественных свойств и количественной характеристики объекта и состоящими в результате этого из целого ряда реквизитов. Например, в приказе-накладной показателем является ЦЕНА ИЗДЕЛИЯ:Pcs (1 : N )(R13 , R14 , Q1 ). Составную единицу информации любой сложности можно свести в конечном итоге к определенной совокупности различных показателей. Например, приказ-накладную можно представить в виде четырех показателей: цена изделия (Pcs ), количество отпущенных со склада изделий (Pco ), количество изделий, предназначенных на отпуск (Pci ), сумма стоимости отпущенных со склада изделий (Pac ):

Pcs (1 : N )(R13 , R14 , Q1 ); Pci (1 : N )(P2 , P3 , P4 , P5 , P6 , P7 , P10 , P11 , P13 , P14 , Q2 ); Pco (1 : N )(P2 , P3 , P4 , P5 , P6 , P7 ,

Pac (1 : N )(P2 , P3 , P4 , P5 , P6 , P7 , P10 , P11 , P13 , P14 , Q4 ).

Особый интерес представляют показатели со значением основания, равным 1. Такие показатели внешне выступают с составом, включающим одни признаки. При основании, равном 1, количество информации будет больше в том показателе, который содержит большее число признаков, поскольку он дает более разностороннюю характеристику данному экономическому хозяйственному процессу или явлению.

Можно ввести условие, что форма показателя с минимальным составом, включающая одно основание и один признак, содержит единичное количество информации. Это позволяет ввести логарифмическую меру и выразить количество информации, содержащейся в показателе в следующем виде: ∑ I(P ) = log2 (1 + Q) log2 (1 + n q), где n — число реквизитов-признаков в показателе q=1.

В литературе часто показатели подразделяются по единице измерения основания на абсолютные и относительные. К абсолютным отнесены показатели, основания которых получают прямым счетом, измерением, взвешиванием, алгебраическим суммированием других абсолютных показателей, различные средние абсолютные показатели. В число относительных входят показатели, значения оснований которых получены отношением двух других показателей (удельный вес, отношение двух частей и т. д.)
Информационные отношения
Между различными объектами, свойствами объектов и объектами существуют всевозможные объективные отношения, определяемые предметной областью (пространственные, временные, функциональные и т. п.). При информационном отображений объектов и присущих им свойств эти отношения переносятся на отношения между составными единицами информации, с помощью которых представляются объекты и их свойства.

Для установления связи между составными единицами информации используется понятие «групповое отношение». Групповым отношением называется бинарное отношение Sk ⊂ Gi × Gj , заданное на двух множествах групп Gi и Gj . Групповое отношение позволяет устанавливать связи между группами и тем самым выражать отношения между объектами. Групповые отношения различаются прежде всего тем, как связаны между собой конкретные представители множеств групп Gi и Gj в групповом отношении. Часто основные виды групповых отношений называют отношениями 1 : 1,1 : n, n : 1 и n : m, а указанные пары чисел- коэффициентом группового отношения.

В отношении с коэффициентами группового отношения вида 1 : 1, 1 : n и n : m группа qi называется родительской, a qj - подчиненной. В отношении n : 1, наоборот, qj — родительская, a qi - подчиненная.

Иерархическим называется групповое отношение, в котором каждая подчиненная группа может быть связана только с одной родительской. Отношения вида 1 : 1, 1 : n, n : 1 являются иерархическими.

Неиерархическое отношение, напротив, позволяет соотносить каждую подчиненную группу с произвольным числом родительских групп. Иногда групповые отношения вида 1 : 1, 1 : n, n : 1 называют функциональными. Действительно, в первом и третьем случаях Sk — функция, а во втором — функцией является отношение Sk .



Рисунок : Групповое отношение

Реализацией группового отношения Sk называют группу qi ∈ Gi вместе с совокупностью Iqj = {qj , . . . , qj }, таких, что 〈qi , qj 〉 ∈ Sk , для любых qj ∈ Iqj .Говорят, что qi — владелец реализации группового отношения, a qj ∈ Iqj — члены реализации.

Графически группы и групповые отношения удобно изображать в виде диаграмм, используя следующие соглашения. На диаграммах группы изображаются прямоугольником, над левым верхним углом которого помещается имя группы. Внутри прямоугольника могут быть показаны имена реквизитов. Групповые отношения обозначаются стрелками, проведенными от родительского к подчиненному типу группы с возможным указанием коэффициента группового отношения (1 : 1, 1 : n, n : 1 и n : m) и имени группового отношения.

Если диаграмму трактовать как ориентированный граф и группы в диаграмме отождествлять с вершиной графа, а отношения — с дугой графа, то путем в диаграмме называется такая последовательность групповых отношений (дуг), что конец каждой предыдущей дуги совпадает с началом следующей. Рис. 9.





Рисунок : Диаграмма группы


Лекция 9

Формальные языки и грамматики

Языки и цепочки символов. Способы задания языков

Грамматики и распознаватели
Цепочкой символов (или строкой) называют произвольную упорядоченную конечную последовательность символов, записанных один за другим. Понятие символа (или буквы) является базовым в теории формальных языков и не нуждается в определении.Далее цепочки символов будем обозначать греческими буквами: a, b, g.

Цепочка символов — это последовательность, в которую могут входить любые допустимые символы. Строка, которую вы сейчас читаете, является примером цепочки, допустимые символы в которой — строчные и заглавные русские буквы, знаки препинания и символ пробела. Но цепочка — это необязательно некоторая осмысленная последовательность символов. Последовательность “аввв..аагрьь ,..лл” — тоже пример цепочки символов.

Цепочка символов — это упорядоченная последовательность символов. Это значит, что для цепочки символов имеют значение три фактора: состав входящих в цепочку символов, их количество, а также порядок символов в цепочке. Поэтому цепочки “а” и “аа”, а также “аб” и “ба” — это различные цепочки символов. Цепочки символов a и b равны (совпадают), a = b, если они имеют один и тот же состав символов, одно и то же их количество и одинаковый порядок следования символов в цепочке. Количество символов в цепочке называют длиной цепочки. Длина цепочки символов a обозначается как |a|. Очевидно, что если a = b, то и |a| = |b|. Основной операцией над цепочками символов является операция конкатенации (объединения или сложения) цепочек. Конкатенация (сложение, объединение) двух цепочек символов — это дописывание второй цепочки в конец первой. Конкатенация цепочек a и b обозначается как ab. Выполнить конкатенацию цепочек просто: например, если a = аб, а b = вг, то ab = абвг.
ВНИМАНИЕ
Так как в цепочке важен порядок символов, то очевидно, что для операции конкатенации двух цепочек символов важно, в каком порядке записаны цепочки. Иными словами, конкатенация цепочек символов не обладает свойством коммутативности, то есть в общем случае $ a и b такие, что ab № ba (например, для a = аб и b = вг: ab = абвг, а ba = вгаб и ab № ba).

Также очевидно, что конкатенация обладает свойством ассоциативности, то есть (ab)g = a(bg). Любую цепочку символов языка можно представить как конкатенацию составляющих ее частей — разбить цепочку на несколько подцепочек. Такое разбиение можно выполнить несколькими способами произвольным образом. Например, цепочку g = абвг можно представить в виде конкатенации цепочек a = аб и b = вг (g = ab), а можно — в виде конкатенации цепочек u = а и w = бвг (g = uw). Чем длиннее исходная цепочка, тем больше вариантов разбиения ее на составляющие подцепочки.

Если некоторую цепочку символов разбить на составляющие ее подцепочки, а затем заменить одну из подцепочек на любую произвольную цепочку символов, то в результате получится новая цепочка символов. Такое действие называется заменой, или подстановкой, цепочки. Например, возьмем все ту же цепочку g = абвг, разобьем ее на три подцепочки: a = а, w = б и b = вг (g = awb), и выполним подстановку цепочки u = аба вместо подцепочки w. Получим новую цепочку g’ = аабавг (g’ = aub). Любая подстановка выполняется с помощью разбиения исходной цепочки на подцепочки и операции конкатенации.

Можно выделить еще две операции над цепочками: Обращение цепочки — это запись символов цепочки в обратном порядке. Обращение цепочки a обозначается как aR. Если a = “абвг”, то aR = “гвба”. Для операции обращения справедливо следующее равенство " a,b: (ab)R = bRaR. Итерация (повторение) цепочки n раз, где nОN, n > 0 — это конкатенация цепочки самой с собой n раз. Итерация цепочки a n раз обозначается как an. Для операции повторения справедливы следующие равенства " a: a1 = a, a2 = aa, a3 = aaa, … и т. д. Итерация цепочки символов определена и для n = 0 — в этом случае результатом итерации будет пустая цепочка символов. Пустая цепочка символов — это цепочка, не содержащая ни одного символа. Пустую цепочку здесь везде будем обозначать греческой буквой l (в литературе ее иногда обозначают латинской буквой e или греческой e). Для пустой цепочки справедливы следующие равенства:


1. |1| = 0

2. "a: la = al = a

3. lR = l

4. "n і 0: ln = 1

5. "a: a0 = 1
1   2   3   4   5   6   7   8   9   ...   14

Похожие:

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconПлан ответа: Понятие экономической информационной системы. Информационные...
Вопрос: Жизненный цикл информационной системы (раскрыть основные этапы жизненного цикла информационной системы)

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconКонспект лекций по курсу сд. Ф корпоративные информационные системы
Лекция № Понятие о сетях. Корпоративные информационные системы. Структура и назначение кис. Характеристика. Требования к организации...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы icon2. Место дисциплины в структуре ооп бакалавриата
Целью освоения дисциплины «Архитектура информационных систем» является формирование у студентов комплексного представления об архитектуре...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconИуст-одесса -2013
Целью конференции является обмен опытом научно-практических исследований в: усовершенствовании информационно-ресурсного обеспечения...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconРабочая программа дисциплины сд. Ф. 03 Администрирование в информационных...
Целью дисциплины является изучение основ администрирования операционных систем, приложений, сетевых и информационных сервисов, баз...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconЛекция №4 Тема: Назначение и основные функции операционной системы
Даже пользователь взаимодействует со своими программами через интерфейс. Любые их команды, прежде чем попасть в прикладные программы,...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconРабочая программа дисциплины «Организационно-правовые способы обеспечения...
Целями освоения дисциплины (модуля) «Организационно-правовые способы обеспечения информационной безопасности» является приобретение...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconРабочая программа по дисциплине Программно-аппаратные средства обеспечения...
Ознакомление студентов с задачами и особенностями построения программно-аппаратных средств защиты информации от несанкционированного...

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconПредметная область информационной системы и ее анализ
Структурный (функциональный) подход к анализу предметной области информационной системы

Лекция 1 Место и назначение лингвистического обеспечения в информационных системах. Понятие информационной системы iconУчебный курс или дисциплина для автоматизированной системы обучения; и т п
Концептуальные основы, назначение и классификация автоматизированных информационных систем (аис)

Вы можете разместить ссылку на наш сайт:


Литература


При копировании материала укажите ссылку ©ucheba 2000-2015
контакты
l.120-bal.ru
..На главную