Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва


Скачать 2.46 Mb.
Название Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва
страница 8/19
Тип Реферат
rykovodstvo.ru > Руководство эксплуатация > Реферат
1   ...   4   5   6   7   8   9   10   11   ...   19




Глава 3


МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ДЛЯ ОПИСАНИЯ СТРУКТУРИРОВАННЫХ ЗНАЧЕНИЙ ПРЕДЛОЖЕНИЙ

И СВЯЗНЫХ ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ
3.1. Постановка задачи

В параграфе 2.1. была обоснована актуальность разработки широко применимых формальных языков для построения семантических представлений (СП) ЕЯ-текстов, выразительные возможности которых позволяют отображать многие особенности поверхностной структуры предложений и связных ЕЯ-текстов. В качестве первого шага на пути разработки определения такого класса формальных языков в главе 2 был определен класс формальных объектов, называемых концептуальными базисами.

В данной главе ставится задача разработки математической модели для описания структурированных значений предложений и связных естественно-языковых текстов.

По своей форме модель должна являться описанием такого соответствия между произвольным концептуальным базисом B и некоторым множеством формул Forms(B), чтобы класс формальных языков {Forms(B), где B – к.б.} был удобен для построения СП фраз и связных ЕЯ-текстов, отражающих многие особенности поверхностной структуры текстов.

С целью выработки критериев для построения такой модели был проведен системный анализ структурных особенностей (а) текстов на русском, английском, немецком и французском языках, (б) ряда искусственных языков, используемых для построения семантических представлений текстов лингвистическими процессорами, (в) выражений искусственных языков представления знаний в прикладных интеллектуальных системах (в частности, терминологических языков представления знаний).

Проведенный анализ показал, что есть несколько важных аспектов формализации семантики ЕЯ, которые до недавнего времени недооценивались или игнорировались большей частью исследователей. В частности, это относится к формальному исследованию смысловых структур (а) повествовательных текстов, включающих описания множеств; б) дискурсов со ссылками на смысл предложений и более крупных частей текста; (в) фраз, где логические связки “и”, “или” используются нетрадиционной способами и соединяют не фрагменты, выражающие высказывания, а описания объектов, множеств, понятий; (г) фраз с придаточными определительными и причастными оборотами; (д) фраз со словами "понятие", "термин".

Кроме того, несколько наиболее популярных подходов к математическому изучению семантики ЕЯ не принимают или недостаточно принимают во внимание роль знаний о мире в понимании ЕЯ и, следовательно, не изучают проблем формального описания фрагментов знаний (определения понятий и т. д.). Например, это относится к весьма популярной теории представления дискурсов (Kamp 1981; Kamp, Reyle 1993, 1996; van Eijck, Kamp 1996).

Надо добавить, что тексты имеют авторов, могут быть опубликованы тем или другим источниками, могут вводиться с того или другого терминалов и т. д. Информация об этих внешних связях текстов может быть важна для их смысловой интерпретации. Поэтому целесообразно рассматривать текст как некий структурированный объект, обладающий поверхностной структурой T, множеством значений S (в большинстве случаев S состоит из одного значения), соответствующим T, и некоторыми значениями V1 ,..., VN, обозначающими автора (авторов) T, дату написания (или коррекции) T, указывающими новую информацию в Т и т. д. Но наиболее популярные подходы к математическому исследованию ЕЯ не предусматривают формальных средств для представления текстов как структурированных объектов подобного рода.

На основании проведенного системного исследования поставим задачу построения такой модели, чтобы ее формальные средства позволяли нам следующее:

(Свойство 1): Строить обозначения структурированных значений (СЗ) как фраз, выражающих высказывания, так и повествовательных текстов; такие обозначения обычно называют семантическими представлениями (СП) ЕЯ-выражений.

(Свойство 2): Строить и различать формальными средствами обозначения СЗ повествовательных текстов, СЗ целей (выраженных неопределенными формами глаголов с зависимыми словами, таких как "окончить с отличием МГУ, подготовить и защитить кандидатскую диссертацию по биохимии") и СЗ вопросов.

(Свойство 3): Строить и различать обозначения единиц, соответствующих (а) объектам, ситуациям, процессам в реальном мире и (б) понятиям, квалифицирующим (характеризующим) эти объекты, ситуации, процессы.

(Свойство 4): Строить и различать обозначения: (3.1) объектов и множеств объектов; (3.2) понятий и множеств понятий; (3.3) СП текстов и множеств СП текстов.

(Свойство 5): Различать формальным образом понятия, квалифицирующие объекты, и понятия, квалифицирующие множества объектов тех же видов.

(Свойство 6): Строить составные обозначения понятий, т. е. строить формулы, отражающие поверхностно-семантическаю структуру ЕЯ-выражений, подобных выражению “человек, окончивший МГУ имени М.В. Ломоносова и являющийся биологом или химиком”.

(Свойство 7): Строить объяснения более общих понятий с помощью менее общих; в частности, строить цепочки вида (a=Des(b)), где a обозначает некоторое понятие, которое необходимо объяснить, а Des(b) обозначает описание некоторой конкретизации известного понятия b.

(Свойство 8): Строить обозначения упорядоченных n-местных наборов различных сущностей, где n > 1 .

(Свойство 9): Строить (9.1) формальные аналоги составных обозначений множеств ("эта группа, состоящая из 12 туристов, являющихся химиками или биологами" и т.п.), (9.2) обозначения множеств упорядоченных наборов сущностей, (9.3) обозначения множеств, состоящих из множеств, и т.д.

(Свойство 10): Описывать теоретико-множественные отношения и операции над множествами.

(Свойство 11): Строить обозначения СЗ фраз, содержащих, в частности:

(11.1) слова “произвольный”, “некоторый”, “все”, “каждый”, и т. д.;

(11.2) выражения, полученные применением связок “и”, “или” к обозначениям (11.2а) предметов, событий; (11.2б) понятий; (11.2в) множеств;

(11.3) выражения , где связка “не” стоит непосредственно перед обозначением предмета, события и т. д.; (11.4) косвенную речь;(11.5) причастные обороты и придаточные определительные предложения;

(11.6) слова "понятие", "термин".

(Свойство 12): Строить обозначения СЗ дискурсов со ссылками на упомянутые объекты.

(Свойство 13): Указывать явно в СП дискурсов причинно-следственные и временные отношения между описываемыми ситуациями (событиями).

(Свойство 14): Описывать СЗ дискурсов со ссылками на смысл фраз и более крупных фрагментов рассматриваемых текстов.

(Свойство 15): Выражать суждения о тождественности двух сущностей.

(Свойство 16): Строить формальные аналоги формул логики предикатов первого порядка с кванторами существования и/или всеобщности.

(Свойство 17): Рассматривать нетрадиционные функции (и другие нетрадиционные отношения) с аргументами и/или значениями, являющимися: (17.1) множествами предметов, ситуаций (событий); (17.2) множествами понятий; (17.3) множествами СП текстов.

(Свойство 18): Cтроить концептуальные представления текстов как информационные объекты, отражающие не только смысл, но и значения внешних характеристик текста: авторов, дату, области применения результатов и т. д.

Эта постановка задачи отражена в публикациях (Фомичев 1981а, 1981б, 1983, 1988; 2002б, в; Fomitchov 1984; Fomichov 1992, 1996a, б, 2002b).

3.2. Краткая характеристика предлагаемого решения

поставленной задачи
3.2.1. Краткая характеристика новых правил построения формул

В данной главе произвольному концептуальному базису (к.б.) B будут поставлены в соответствие три множества формул Ls = Ls(B), Ts = Ts(B), Ys = Ys(B) (l-формулы, t-формулы, y-формулы). Объединение этих множеств будет обозначено через Forms(B). Множество Ls(B) будет названо стандартным концептуальным языком (СК-языком) в базисе B. Концептуальный базис B оказывается возможным определить таким образом, что цепочки языка Ls = Ls(B) будет удобно использовать для описания структурированных значений (другими словами, смысловых структур) ЕЯ-текстов, представления знаний о мире и представления целей интеллектуальных систем. Другими словами, цепочки из языка Ls = Ls(B) окажется удобным использовать для построения семантических представлений (СП) текстов на естественном языке. Формулы из первого класса, т.е. l-формулы, будут называться также К-цепочками.

Каждая формула из множества Тs(B) представима в виде d & t, где dLs(B), t тип из Трs(B). Формулы из множества Ys(B) являются выражениями вида a1 & …& an & d, где a1, …,an, d Ls(B), n имеет разные значения для разных d, и цепочка d строится из a1, …,an как из элементарных информационных единиц (некоторые из них могут быть немного преобразованы) однократным применением некоторого правила построения.

В данной работе предлагается оригинальная схема подхода к определению трех класов выводимых формул; эта схема заключается в следующем. Будут сформулированы некоторые высказывания P[0],...,P[10]; они будут интерпретироваться как правила построения семантических представлений (СП) ЕЯ-текстов из элементов первичного информационного универсума X(B), переменных из V(B) и нескольких специальных символов при условии, что B является концептуальным базисом для рассматриваемой области.

Каждое из этих правил фактически задает некоторую операцию на множестве всевозможных наборов, компоненты которых являются СП простых или составных выражений естественного языка (ЕЯ). Всего 10 операций достаточно для построения формул, отображающих смысл (или структурированные значения) сколь угодно сложных ЕЯ-текстов. Поэтому можно сказать, что система этих правил задает некоторую полную систему квазилингвистических концептуальных операций.

Классы формул Ls, Ts, Ys для произвольного к.б. B определяются совместной индукцией правилами P[0] , P[1], , P[10] . Для любого к.б. B правило P[0] задает начальный запас формул.

Определение 1. Обозначим через P[0] высказывание Если d X(B)V(B), t Tp(S(B)), tp = tp(B), tp(d) = t, то d L(B), и цепочка вида d & t входит в T0(B)”.

Пусть B — произвольный к.б., L(B) и T0(B) — наименьшие множества, задаваемые утверждением P[0], Lnr0(B) = L(B) (обозначение “Lnr” расшифровывается как “L нумерованное”). Тогда, очевидно, Lnr0(B) = X(B) V(B), T0(B) = { b | b = d & t, d X(B)V(B), t Tp(S(B)), t = tp(d)}.

Таким образом, в соответствии с правилом P[0] информация о типах элементов первичного информационного универсума X(B) и переменных из V(B) отображается в структуре формул из множества T0(B). 

Пример 1. Пусть S1 с.с., построенная в примере из параграфа 2.8, B1 = (S1, Ct1, Ql1) к.б., определенный в параграфе 2.8, B=B1. Тогда легко увидеть, что выполняются следующие соотношения:

чел, П.Сомов, НПО_”Радуга”, Друзья Lnr0(B),

Персонал, Поставщики  Lnr0(B); чел &интс * дин.физ.об  T0(B),

П.Сомов & интс * дин.физ.об  T0(B);

НПО_”Радуга” & орг *простр.об*интс  T0(B);

Друзья & {(интс*дин.физ.об, {интс*дин.физ.об})}  T0(B),

Персонал & {(орг, {интс*дин.физ.об})} })} T0(B) ,

Поставщики & {( орг, {орг})} T0(B).

Правило P[1] предназначено для присоединения информационных единиц, соответствующих словам “некоторый”, “каждый” , “какой-нибудь”, “все”, “несколько”, “большинство” (такие информационные единицы в данной работе называются интенсиональными кванторами) к простым или составным обозначениям понятий. Поэтому правило P[1] позволяет строить формальные аналоги выражений: "некоторый человек", "все люди", "большинство людей", "некоторый человек ростом 175 см", "все тридцатилетние люди", “все города Европы”. Примерами l-формул (К-цепочек) для P[1], как последнего примененного правила, являются цепочки

нек чел, все чел (Возраст, 30/год), все город * (Регион, Европа) .

Правило P[2] предназначено для построения цепочек вида f(a1, …,an), где f обозначение функции, n  1, a1, …,anl-формулы, построенные с применением каких-то правил из списка P[0] , P[1], , P[10]. Например, после применения правила на последнем шаге вывода можно получить цепочки

Города(Европа), Колич-элем(Города(Европа)).

Правило P[3] позволяет строить цепочки вида (a1a2), где a1, a2 ­ l-формулы, полученные при помощи любых правил из P[0], …, P[10], и a1, a2 обозначают сущности, являющиеся однородными в некотором смысле. Примеры К-цепочек для P[3] как последнего примененного правила:

(y1 нек город * (Название, ‘Саратов’)),

(Директор(АО_”Салют”)П.Сомов) .

Правило P[4] позволяет строить К-цепочки вида r(a1, …,an), где rn-арное отношение, n  1, a1, …,an  К-цепочки, полученные при помощи некоторых правил из P[0], , P[10] . Примеры К-цепочек для P[4] : Принадлеж(Намюр, Города(Бельгия)), Подмнож(Города(Бельгия), Города(Европа)).

Правило P[5] предназначено для построения К-цепочек вида d : v, где d  К-цепочка, не включающая v, v  переменная, и выполнены некоторые условия. При помощи правила P[5] можно помечать переменными в семантических представлениях текстов на естественном языке: а) описания различных сущностей, встречающихся в тексте (физических объектов, событий, понятий и др.), б) семантические представления предложений или более крупных фрагментов текста, на которые имеется ссылка в любой части текста. Примерами К-цепочек для правила P[5], примененного на последнем шаге вывода, являются выражения

все чел : Z1, Меньше(Возраст(П.Сомов), 30/ год) : Р1.

Это правило дает возможность строить семантические представления текстов таким образом, чтобы они отражали референтную (ссылочную) структуру текстов. Демонстрирующие это утверждение примеры приведены ниже.

Правило P[6] позволяет строить К-цепочки вида d, где d  К-цепочка, удовлетворяющая ряду условий. Примеры К-цепочек для P[6] :

биолог, Принадлеж(Бонн, Города(Бельгия)). Здесь  обозначает связку "не".

При помощи правила P[7] можно строить К-цепочки вида (a1an) или (a1an), где n >1, a1 , ,an  К-цепочки, обозначающие однородные в некотором смысле сущности. В частности, a1,, an могут быть семантическими представлениями высказываний, описаниями физических объектов, описаниями множеств, состоящих из объектов одной природы, описаниями понятий. Следующие цепочки являются примерами К-цепочек (или l-формул) для P[7] :

(Финляндия  Норвегия  Швеция),

(Принадлеж((Намюр  Гент), Города(Бельгия))  Принадлеж(Бонн,

Города( (Финляндия  Норвегия  Швеция)))).

Назначение правила P[8] состоит в том, что оно позволяет строить, в частности, К-цепочки вида c (r1, b1), , (rn, bn) , где с  информационная единица из первичного универсума Х, обозначающая понятие, для i = 1, …, n ri  название функции с одним аргументом или бинарного отношения, bi обозначает возможное значение ri для объектов, характеризующихся понятием с. Например, если выбрать соответствующим образом первичные информационные единицы, то после применения на последнем шаге вывода правила P[8] можно получить К-цепочки

город  (Страна, Россия), поворот  (Направление, левоe).

Правило P[9] дает возможность строить, в частности, К-цепочки вида v(des)D и v(des)D, где   квантор всеобщности,   квантор существования, des обозначает понятие ("человек", "город", "целое число" и др.) или составное понятие ("целое число, большее 200" и др.). D можно интерпретировать как семантическое представление высказывания с переменной v о любой сущности, характеризуемой понятием des. Примеры К-цепочек для P[9] как правила, примененного на заключительном шаге построения формулы:

x1(нат.число) х2(нат.число) Меньше(х1, х2),

у(страна  (Регион, Европа))Больше(Колич(Города(у)), 50).

Правило P[10] позволяет строить, в частности, К-цепочки вида <a1,,an>, где n > 1, a1,,an  К-цепочки. Цепочки, получаемые с использованием правила P[10] на последнем шаге вывода, интерпретируются как обозначения n-местных упорядоченных наборов. Компонентами такого набора могут быть не только обозначения чисел, объектов, но и семантические представления выражений, множеств, понятий и др. Используя правила P[10] и P[4] на последних шагах вывода, можно построить цепочку

Учиться1(<�Агент1, нек чел  (Имя, ‘Игорь’)>,<�Учеб.заведение, ГУ-ВШЭ>,<�Начал. момент, 2004>),

где Агент1, Учеб.заведение, Начал. момент – обозначения тематических ролей, т.е. обозначения отношений между значением глагола “учиться” и значениями зависящих от него в предложениях групп слов.

1   ...   4   5   6   7   8   9   10   11   ...   19

Похожие:

Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Рабочая программа по курсу «Математические представления» для обучающихся с рас (

Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon 1. 1 Арифметические основы ЭВМ
Составлены в соответствии с фгос спо по специальности 230115 (09. 02. 03) «Программирование в компьютерных системах» и рабочей программой...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Курс: «Технологии обработки информации». Лабораторная работа № Разработка...
Рассмотрим пример, который будет использоваться для иллюстрации шагов, необходимых для разработки агентного приложения с помощью...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Программа «Основы программирования на java»
Изучая основы программирования на языке Java, ребята учатся создавать реально действующие кроссплатформенные программы, которые могут...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методические рекомендации для специалистов
«правил игры» и активностью на рынке профессионального обучения множества агентов, преследующих свои интересы и создающих ложные...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Рабочая программа дисциплины «Основы Православия»
Данный курс является интегрированным, включает в себя основы программ «Катехизис» и «Догматическое богословие», и представляет раскрытие...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Институт развития образования республики башкортостан развитие интеллектуальных
Развитие интеллектуальных и творческих способностей учащихся образовательных учреждений: Сборник авторских программ. – Уфа: Издательство...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Учебно-методический комплекс дисциплины сд. 8 Математические основы...
«050703. 00 — Дошкольная педагогика и психология с дополнительной специальностью «Педагогика и психология»
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon 1 курс Дисциплина «Основы предпринимательской деятельности»
Самарина В. П. Основы предпринимательства : учеб пособие/ В. П. Самарина. Москва: кнорус, 2015. 1 o=эл опт диск (cd-rom), 222 с
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методичческое пособие по организации и проведению интеллектуальных...
Методическое пособие предназначено для специалистов учреждений дополнительного образования и молодежной политики, которые занимаются...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon К Приказу №396 от 15. 12. 2017 г
Порядок проведения операций по специальным залоговым банковским счетам, специальным банковским счетам платежных агентов (субагентов),...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Физико-математические науки. (Ббк 22)
Геометрия в таблицах : 7-11 классы : справочное пособие / авт сост.: Л. И. Звавич, А. Р. Рязановский. 20-е изд., стер. Москва : Дрофа,...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методические указания предназначены для реализации государственных...
Учебным планом по дисциплине «Основы Экологического права» предусмотрено 12 часов практического обучения
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Мэдис методика экспресс-диагностики интеллектуальных способностей. 1
Методика экспресс-диагностики интеллектуальных способно-стей(мэдис) предназначена для быстрого ориентировочного обследования уровня...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Архитектурно-строительный университет
Учебное пособие охватывает программу курса "Основы компьютерных технологий", читаемого студентам нгасу очной формы обучения специальности...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Реализация содержания программы в образовательных областях
Цели: расширить представления о праздниках, школе; познакомить с творчеством А. С. Пушкина; воспитывать уважение к профессиям школьных...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск