Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва


Скачать 2.46 Mb.
Название Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва
страница 3/19
Тип Реферат
rykovodstvo.ru > Руководство эксплуатация > Реферат
1   2   3   4   5   6   7   8   9   ...   19

Глава 1


ПРОБЛЕМА ПРЕДСТАВЛЕНИЯ СОДЕРЖАНИЯ ПОСЛАНИЙ КОМПЬЮТЕРНЫХ ИНТЕЛЛЕКТУАЛЬНЫХ АГЕНТОВ И ФОРМАЛИЗАЦИЯ СЕМАНТИКИ ЕСТЕСТВЕННОГО ЯЗЫКА
1.1. Проблема разработки языков общения компьютерных интеллектуальных агентов
Прогресс исследований в области искусственного интеллекта (ИИ) и компьютерных сетей привел к появлению теории многоагентных систем (МАС). Многоагентные системы являются одним из наиболее быстро развивавшихся в 1990-е годы и первой половине 2000-х годов направлений информатики.

Главная причина постоянно растущего интереса к этому направлению заключается в следующем. В настоящее время можно прогнозировать бурное развитие в ближайшие годы электронной коммерции (electronic commerce, E-commerce), базирующейся на широчайших возможностях сети Интернет (Thome и Schihzer 1998); МАС рассматриваются как ключевая технология для конструирования систем электронной коммерции (Guilfoyle, Jeffcoate, Stark 1997; Wooldridge 1998).

В частности, одной из перспективных областей использования МАС является индустрия туристического сервиса. Задача проектирования компьютерных интеллектуальных агентов (КИА) для этой индустрии является весьма естественной, поскольку различные КИА многих поставщиков услуг (заказ авиабилетов и железнодорожных билетов, резервирование комнат в гостиницах, взятие напрокат автомобилей, организация культурной программы и т.д.) должны динамически обнаруживать друг друга и эффективно взаимодействовать для решения стоящих перед ними задач.

Многочисленные КИА (сконструированные разными научно-исследовательскими центрами, использующие различную аппаратуру и программное обеспечение) смогут эффективно взаимодействовать в процессе решения своих задач только в том случае, когда эти КИА будут располагать общим языком для обмена информацией и руководствоваться едиными правилами общения. Поэтому в 1990-е годы было разработано несколько языков общения компьютерных интеллектуальных агентов; два из них являются наиболее широко применимыми.

Во-первых, это язык KQML, разработанный в США в рамках проекта разделения знаний, осуществлявшегося национальным агентством ДАРПА (DARPA). Исследования по разработке этого языка отражены, в частности, в публикациях (Finin и др. 1993; Labrou 1996; Finin, Labrou, Mayfield 1997; Labrou, Finin 1997, 1998). Значительную роль в этих исследованиях сыграли специалисты Стэнфордского университета.

Второй язык разработан в рамках международного Фонда интеллектуальных физических агентов (the Foundation for Intelligent Physical Agents, или FIPA), штаб-квартира которого находится в Женеве. Одним из важных результатов исследований, организованных этим фондом, стала разработка в 1997 - 2000 годах стандарта для представления посланий (messages) КИА, получившего название Языка общения агентов (FIPA Agent Communication Language = FIPA ACL) (FIPA 1998a). Теоретической основой для создания этого языка послужили принципы разработки языка KQML и языка KIF, или Knowledge Interchange Format (Genesereth, Fikes и др., 1992; Genesereth, 1999). Для использования в сочетании с языком FIPA ACL разработан язык представления содержания посланий компьютерных интеллектуальных агентов FIPA SL Content Language (FIPA SL CL 2002).

Проблема создания адекватных логико-информационных основ электронной коммерции предъявляет высокие требования к языку представления содержания посланий КИА. Этот язык должен позволять отображать содержание коммерческих переговоров. Однако язык FIPA SL Content Language обладает многими ограничениями в этом отношении. В связи с этим возникает проблема разработки математического описания такого класса языков, который был бы удобен для отображения содержания произвольных посланий КИА.

В нашей стране в последнее десятилетие проблематике многоагентных систем уделялось значительное внимание многими учеными. В частности, различные аспекты теории МАС и вопросы применения этой теории исследовались в работах В.И. Городецкого (Городецкий 1998), В.В. Емельянова (Emelyanov 2001), Э.С. Клышинского (Клышинский 1999), Г.С. Плесневича и В.Б. Тарасова (Тарасов 1998; Plesniewicz, Tarassov 2001), Д.А. Поспелова (Поспелов 1998), Г.В. Рыбиной и В.Ю. Берзина (Рыбина, Берзин 2002).

Однако следует отметить, что проблематика разработки формальных языков с широкими выразительными возможностями для представления содержания посланий КИА не получила в трудах ученых нашей страны такого же внимания, как и в серии зарубежных проектов, выполненных в рамках международного Фонда интеллектуальных физических агентов.
1.2. Значение формальных методов представления содержания естественно-языковых текстов для разработки лингвистических процессоров
Во Введении к данной книге было показано, что проблема разработки языков представления содержания посланий компьютерных интеллектуальных агентов тесно взаимосвязана с проблематикой компьютерной лингвистики. В связи с этим проанализируем значение методов построения семантических представлений естественно-языковых текстов (ЕЯ-текстов) для конструирования лингвистических процессоров (ЛП).

Накопленный опыт исследований по созданию ЛП показал, что огромное влияние на проектирование анализаторов ЕЯ-текстов оказывают используемые методы формального отображения содержания (или смысла) текстов, а также методы формального представления промежуточных результатов смыслового анализа текстов. Особую актуальность в 1990-е – 2000-е годы приобрела проблема формального представления содержания связных текстов (или дискурсов).

Во-первых, основной объем информации в текстовых базах данных (БД) и сети Интернет представлен дискурсами. Во-вторых, сформулированная Э.В. Поповым современная концепция разработки систем общения с БД на ограниченном естественном языке (ОЕЯ) предполагает, что на вход системы поступают не только предложения, но и дискурсы (Попов 2002). В-третьих, можно согласиться с высказанной Э.В. Поповым гипотезой о том, что повышению эффективности общения на ОЕЯ с большими БД будет способствовать реализация таких систем общения, когда активную роль в диалоге будет играть не только конечный пользователь, но и компьютер, располагающий моделью базы знаний, причем инициатива будет на протяжении диалога неоднократно переходить от одного участника общения к другому. Последовательность выражений на ОЕЯ (с указанием авторов выражений), сформированных участниками общения, образует дискурс.

Можно выделить несколько наиболее важных аспектов проблемы формального представления содержания (или смысла) ЕЯ-текстов в компьютерных системах.

Идея использования в системах машинного перевода искусственного языка-посредника для представления смысла ЕЯ-текстов была высказана еше в 1960-м году А.К. Жолковским, Н.Н. Леонтьевой и Ю.С. Мартемьяновым. В 1960-е – 1970-е годы эта идея получила значительное развитие в работах А.К. Жолковского и И.А. Мельчука по лингвистической модели “Смысл – Текст” (Жолковский, Мельчук 1969; Мельчук 1974). В 1970-е годы усилению внимания к идее семантического языка-посредника способствовала теория смысловой зависимости в ЕЯ Р. Шенка, нашедшая применение в нескольких экспериментальных системах компьютерной обработки ЕЯ (Schank 1972; Schank и др. 1975).

Использование языка-посредника для представления содержания (смысла) ЕЯ-текстов позволяет перейти от неформализованного объекта, каким является ЕЯ-текст, к формальной структуре, что открывает возможности обработки этой структуры различными процедурами – “семантическими экспертами” в рамках базы знаний, представленных записями на формальном языке (языке представления знаний). На протяжении 1980-х – 2000-х годов в проектировании ЛП наиболее часто использовались языки-посредники, предоставляемые теорией семантических сетей, теорией фреймов, теорией концептуальных графов и эпизодической логикой. В нашей стране использовался также язык-посредник, разработанный в рамках компьютерной семантики русского языка, расширенные семантические сети, неоднородные семантические сети (см. параграф 6.10), СК-языки (Fomichov, Chuykov 2000; Fomichov, Kochanov 2001; Fomichov, Lustig 2001; Люстиг, Фомичев 2002; Fomichov, Akhromov 2003; Fomichova, Fomichov 2004).

В середине 1990-х годов возникла новая проблема, усилившая внимание исследователей к проблеме разработки языка-посредника для отображения содержания ЕЯ-текстов. С целью устранения языкового барьера между пользователями сети Интернет из разных стран мира в монографии (Uchida, Zhu, Della Senta 1999) был предложен новый язык-посредник, использующий слова английского языка для обозначения информационных единиц и несколько специальных символов. Этот язык, названный универсальным сетевым языком (UNL, the Universal Networking Language), базируется на идее отображения содержания фраз с помощью бинарных отношений. С конца 1990-х годов ООН финансировался комплексный проект, направленный на разработку системы ЛП, преобразующих фразы на различных естественных языках в выражения языка UNL, а также преобразующих выражения языка UNL в предложения на различных естественных языках. Координатором проекта являлся Институт передовых исследований ООН Токийского университета. В проекте разрабатывались ЛП для шести официальных языков ООН и многих других языков. В течение нескольких последних лет исследования в этом направлении координируются Фондом универсального сетевого цифрового языка (Uchida, Zhu, Della Senta 1999; Uchida, Zhu 2001; Zhu, Uchida 2002; UNL 2005, 2006).

Проблема разработки формальных языков-посредников для отображения содержания (или смысла) ЕЯ-текстов (другими словами, языков семантических представлений, или семантических языков) исследуется специалистами разных стран в течение более трех десятилетий. В нашей стране ряд аспектов этой проблемы в различные периоды изучались Ю.Д. Апресяном, И.М. Богуславским, В.М. Брябриным, Б.Ю. Городецким, А.К. Жолковским, А.П. Ершовым, Ю.И. Клыковым, О.С. Кулагиной, Е.С. Кузиным, Л.Т. Кузиным, И.П. Кузнецовым, Д.Г. Лахути, Н.Н. Леонтьевой, Л.И. Литвинцевой, Ю.Я. Любарским, М.Г. Мальковским, А.Г. Мацкевичем, И.А. Мельчуком, Л.И. Микуличем, А.С. Нариньяни, Г.С. Осиповым, Г.С. Плесневичем, Э.В. Поповым, Д.А. Поспеловым, В.Ш. Рубашкиным, В.А. Тузовым, З.М. Шаляпиной, Г.С. Цейтиным, Л.Л. Цинманом и другими учеными.

За рубежом наибольший вклад в разработку методов математического описания содержания (смысла) ЕЯ-текстов внесли Р. Монтегю (грамматики Монтегю), Дж. Барвайз и Р. Купер (теория обобщенных кванторов, ситуационная теория), М. Кресвелл (теория структурированных значений предложений), Й. Гронендейк и М. Стокхоф (динамические грамматики Монтегю, динамическая предикатная логика), Дж. Сова (теория концептуальных графов), Л. К. Шуберт и Ч.Х. Хуан (эпизодическая логика), Г. Камп и У. Рейль (теория представления дискурсов)

Несмотря на усилия, предпринимавшиеся в течение многих лет учеными разных стран, до последнего времени многие существенные аспекты проблемы формального описания содержания ЕЯ-текстов оставались мало изученными. Одна из основных причин этой ситуации заключается в том, что внимание уделялось, главным образом, формализации смысловой структуры отдельных фраз, а не дискурсов. Кроме того, недостаточно изученной является проблема формального описания смысловой структуры отдельных фраз, обозначающих высказывания и включающих описания множеств и/или придаточные цели и/или слова “понятие”, “термин”, а также структуры фраз, выражающих команды и вопросы.

Наконец, сегодня ясно, что понимание ЕЯ-текста осуществляется в контексте системы знаний о мире и о целях интеллектуальных систем. Однако выразительные возможности большинства известных подходов к математическому описанию смысловой структуры ЕЯ-текстов (а именно, грамматик Монтегю, теории обобщенных кванторов, ситуационной теории, теории структурированных значений предложений, динамических грамматик Монтегю, динамической предикатной логики) недостаточны для построения теорий компьютерного понимания ЕЯ в контексте системы знаний о мире и о целях интеллектуальных систем. Например, исследования по дескриптивным логикам, выросшие из работ по терминологическим языкам представления знаний (ЯПЗ), показали полезность включения в состав ЯПЗ составных обозначений понятий. Однако перечисленные непосредственно выше подходы не предоставляют такой возможности.

Проблема автоматизации формирования баз знаний ИС посредством извлечения информации из ЕЯ-текстов с помощью ЛП, проблема разработки семантического языка-посредника для устранения языкового барьера между пользователями сети Интернет и ряд других актульных научно-технических проблем требуют создания эффективных средств формального представления содержания произвольных ЕЯ-текстов, относящихся к деловой прозе (термин А.П. Ершова, ставший широко популярным в компьютерной лингвистике), т.е. ЕЯ-текстов, относящихся к юриспруденции, бизнесу, медицине, технике и т.д.

Между тем, перечисленные наиболее популярные подходы к формальному представлению содержания ЕЯ-текстов имеют ограниченную сферу применения. В частности, эти подходы не предоставляют адекватных формальных средств для представления содержания произвольных предложений с описаниями множеств или составными обозначениями понятий, дискурсов со ссылками на смысл фраз и более крупных частей текстов, с обозначениями сложных целей, с косвенной речью.

Так, язык-посредник UNL ориентирован на представление содержания отдельных предложений, а не дискурсов. Кроме того, в языке UNL нет формальных средств описания множеств, средств формального различения описаний объектов и описаний понятий, квалифицирующих эти объекты, средств представления ссылок на смысл фраз и более крупных фрагментов дискурсов.

В связи с этим актуальна проблема разработки более мощных математических методов описания смысловой структуры реальных предложений и связных текстов, относящихся к юриспруденции, бизнесу, медицине, технике, экономике и т.д.

1.3. Подходы к формализации семантики естественного языка, разработанные в конце 1960-х – первой половине 1980-х годов
Основные результаты в теории лингвистических процессоров были получены с конца 1960-х годов. В 1970-е годы было достигнуто значительное продвижение вперед в отношении принципов "понимания" компьютерной системой естественного языка (ЕЯ). В большой степени этому способствовали работы Т.Винограда (Winograd 1971), У.Вудса и Р.Каплана (Woods, Kaplan 1971), Й. Уилкса (Wilks 1973), Р. Шенка и его коллег Ч. Ригера, Н. Голдмана, Ч. Ризбека (Schank и др. 1975). Проекты, реализованные этими исследователями, показали, в частности, что (а) понимание ЕЯ-выражения осуществляется в рамках базы знаний (БЗ) о мире и (б) целесообразно использовать специальные формальные выражения для отображения смысла ЕЯ-выражений, причем выбор подхода к построению этих формальных выражений значительно влияет на процесс разработки ЛП.

Наиболее популярными подходами к построению таких формальных структур для отображения смысла ЕЯ-текстов в 1970-е годы являлись теория семантических сетей (ТСС), импульс к появлению которой был дан работами Куиллиана (Quillian 1968) и Р.Саймонса (Simmons 1973), а также теория смысловой зависимости в естественном языке (ТСЗЕЯ) Р. Шенка (Schank 1972; Schank и др. 1975). Как известно, семантические сети являются ориентированными графами со специальными метками вершин и ребер. Метки вершин обозначают понятия, реальные предметы, ситуации (в частности, события), числа, значения цветов и т.д., а метки ребер соответствуют смысловым отношениям между элементами текста и/или между понятиями. ТСЗЕЯ предложила способы построения диаграмм определенных видов для отображения смысла фраз и коротких связных текстов. Оба этих подхода не были математическими, но ТСС использовала математическое понятие ориентированного графа для иллюстрации способов представления содержания простых фраз и текстов в виде размеченного графа.

В нашей стране в 1970-е и 1980-е годы в процессе развития теории семантических сетей И.П. Кузнецовым (Кузнецов 1976, 1978, 1986) возникла теория расширенных семантических сетей (см. параграф 6.10 данной книги).

Успехи 1970-х годов по реализации экспериментальных проектов понимания компьютером отдельных фраз на ЕЯ и текстов, состоящих из нескольких простых фраз, позволили выдвинуть в 1980-е годы перед исследователями следующие новые задачи: (а) переход от обработки простых фраз к обработке связных текстов (дискурсов), включающих пропуски слов в отдельных фразах (явление эллипсиса), ссылки на ранее упомянутые объекты ("для этого предприятия" и т.п.) и ссылки на смысл предыдущих фраз и более крупных частей текста ("об этом", "этот метод" и т.п.); (б) эффективный учет прагматики общения, т.е. интерпретация очередного ЕЯ-выражения в контексте всего диалога; (в) создание формальных, предметно-независимых методов проектирования ЛП с целью получения возможности широкого тиражирования эффективных проектных решений.

Вопрос о необходимости эффективных формальных методов для проектирования ЛП возник совершенно естественно. Дело в том, что опыт реализации в 1970-х годах экспериментальных проектов ЛП показал, что ЛП, обеспечивающие информационные потребности реального пользователя в той или иной предметной области, будут являться сложными программными комплексами. При разработке сложных технических систем в различных предметных областях широко используются математические методы. Например, для конструирования самолетов разработана и используется аэродинамика, а для проектирования кораблей и подводных лодок применяется гидромеханика.

Достаточно полное представление о том, какие формальные инструменты для изучения семантики ЕЯ были доступны к середине 1980-х годов разработчикам ЛП за рубежом, дают учебник (Thayse и др. 1988) по логическим методам в научном направлении Искусственный Интеллект (ИИ), учебник (Partee, ter Meulen. и Wall, 1990) по математической лингвистике и учебники (Grishman 1986; Gazdar, Mellish 1989) по компьютерной лингвистике. Анализ этих источников и целого ряда других публикаций показывает, что в этот период запас формальных методов для изучения семантики ЕЯ был довольно бедным в отношении математического описания смысловой структуры реальных связных текстов (или дискурсов) на ЕЯ и соответствия между текстами и их семантическими представлениями (СП) с учетом базы знаний о мире.

Общепринято считать, что история современных подходов к формализации семантики ЕЯ начинается с фундаментальных работ американского логика Р. Монтегю (Montague 1970, 1974a, 1974b). Подход к формализации семантики ЕЯ, изложенный в этих работах, впоследствии был назван Грамматикой Монтегю. Рядом исследователей были предложены различные расширения Грамматики Монтегю; в частности, такие расширения рассматриваются в работах (Partee 1976; Thomason 1980). В 1980-х годах было предпринято несколько попыток использовать подход Монтегю в проектировании ЛП. Однако теория формализации семантики ЕЯ, получившая название Грамматики Монтегю, (а) не является универсальной, (б) недостаточно удобна для практики с точки зрения вычислительной эффективности, (в) изложена ее автором в трудно воспринимаемой форме, что тормозило прямое использование этой теории на практике. Поэтому подход Монтегю был переработан и дополнен (иногда существенно) с целью использования его в проектировании ЛП. Так, Клиффорд (Clifford 1983, 1988) разработал определение формального языка QE-III для представления содержания вопросов к историческим базам данных. Это было сделано на основе расширения Грамматики Монтегю.

Фреймоподобный семантический язык FRAIL (Hirst 1988) отходит довольно далеко от Грамматики Монтегю. Язык FRAIL использовался в семантическом интерпретаторе ABSITY для представления результатов обработки ЕЯ-текстов с целью включения этих результатов в базу знаний. Джоуси (Jowsey 1987) предложил упрощенную версию Грамматики Монтегю для построения СП текстов в прикладной интеллектуальной системе, выполняющей рассуждения общего вида. Сембок и Райсберген (Sembok, van Rijsbergen 1990) применили язык Джоуси, близкий к языку логики первого порядка, в экспериментальной информационно-поисковой системе.

Обобщенные грамматики фразовых структур (Gazdar, Klein, Pullum, Sag 1985) также могут рассматриваться как расширения Грамматики Монтегю, поскольку в этих грамматиках язык интенсиональной логики Монтегю используется для построения СП предложений.

Другими основными подходами к формальному изучению семантики ЕЯ в первой половине 1980-х годов были теория обобщенных кванторов (Barwise, Cooper 1981; Gaerdenfors 1987; Peres 1991), ситуационная семантика (Barwise, Perry 1983; Fenstad, Halvorsen и др. 1987; Cooper 1991), теория представления дискурсов (Kamp, 1981; Kamp, Reyle 1990). Все эти подходы имеют общую отправную точку – пионерские работы Р. Монтегю - и ряд взаимосвязей.

Анализ показывает, что глубокая связь с традициями математической логики является главной причиной очень большого разрыва между возможностями этих подходов и требованиями, предъявляемыми практикой проектирования ЛП. В частности, можно выделить следующие ограничения этих подходов к формальному изучению ЕЯ:

  1. Неадекватность с точки зрения описания структурированных значений дискурсов на ЕЯ. В частности, отсутствие выразительных возможностей для описания семантической структуры дискурсов, содержащих ссылки на смысл фраз и более крупных частей текста (такие ссылки могут задаваться, например, словами и выражениями “поэтому”, “об этом”, “данный метод”, “’это распоряжение”, “поставленный вопрос”).

  2. Идущая от логики внутренняя ориентация на рассмотрение выражений, представляющих высказывания. Между тем, еще существуют выражения, обозначающие вопросы, команды, цели, действия, пожелания, советы, обещания, назначения вещей, поэтому необходим формальный аппарат для описания смысловой структуры таких выражений. В этой связи следует отметить, что за рубежом первые шаги в этом направлении были сделаны теорией структурированных значений предложений (Cresswell 1985; Chierchia 1989), а в нашей стране первые шаги такого рода были сделаны в публикациях автора (Фомичев 1981 а, б, 1983).

  3. Игнорирование или недостаточно глубокое рассмотрение многих важных особенностей структуры выражений, обозначающих высказывания. В частности, можно отметить отсутствие адекватных формальных методов описания: (а) множеств, операций над множествами и отношений на множествах; (б) назначений вещей; (в) семантической структуры фраз, содержащих причастные обороты и придаточные определительные предложения; (г) стрктуры фраз, в которых логические связки “и“, “или“ соединяют не обозначения высказываний, а обозначения различных объектов, понятий, множеств или назначений вещей (“считывание или запись данных”, “прием и отправка груза” и т.п.); (д) структуры предложений со словами “понятие”, “термин”.

  4. Структура данных, позволяющих поставить в соответствие выражению на ЕЯ одно или несколько возможных семантических представлений (СП), либо не моделировалась, либо моделировалась нереалистично с точки зрения разработки ЛП, способных анализировать тексты, относящися к науке, технике, экономике, медицине или юриспруденции.

  5. Хорошо известно, что понимание ЕЯ-текста человеком может существенно зависеть от знаний этого человека (другими словами, реципиента текста) о реальности. Между тем, основные подходы к формализации семантики ЕЯ, популярные в 1980-е годы, не обладали выразительной силой, необходимой для эффективного описания знаний о реальности, для построения моделей концептуальной памяти и т.д.

  6. Как следствие, за рубежом не разрабатывались модели соответствия “Текст – Система знаний – Семантическое представление (или представления) текста”.

  7. В 1980-е годы ряд исследователей отмечали необходимость и важность моделирования процессов использования ЕЯ в общении, т.е. с учетом целей интеллектуальных систем, реализуемых в процессе общения, и их знаний о мире в целом и о другом участнике диалога (Попов 1982; Fomitchov, 1983, 1984; Narin’yani, 1984; Фомичев, 1988б; Fomichov, 1992). Однако наиболее популярные в 1980-е годы формализмы, использовавшиеся для изучения семантики ЕЯ, не предоставляли такой существенной возможности.

Представляется, что перечисленные ограничения являются наиболее важными с точки зрения проектирования семантико-синтаксических анализаторов дискурсов, относящихся к науке, технике, экономике, медицине, а также для разработки ЕЯ-интерфейсов больших баз данных и знаний.
1.4. Роль формальных систем семантических представлений с большими выразительными возможностями в проектировании лингвистических процессоров
Совокупность задач, поставленных перед теорией ЛП в начале 1980-х годов, оказалась чрезвычайно трудной. Как следствие, развитие теории ЛП в 1980-е годы сильно замедлилось. Несмотря на реализацию значительного количества проектов конструирования ЛП в разных странах мира, существенного продвижения вперед не удавалось достичь.

Главная причина этого замедления заключалась в следующем. В ЕЯ причудливым образом взаимодействуют многочисленные механизмы кодирования и декодирования информации. Поэтому часто для того, чтобы "понять" даже довольно простые для человека фразы или дискурсы, компьютер должен привлекать знания о закономерностях различных уровней языка (морфологическом, синтаксическом, семантическом), а также знания о мире и о конкретной ситуации диалога. Например, для того чтобы узнать, какие из нескольких ранее упомянутых объектов обозначаются местоимением "их", может потребоваться проведение умозаключений здравого смысла и логических рассуждений. Аналогичная ситуация имеет место и для задачи восстановления смысловой структуры фраз с пропусками слов (эллиптичных фраз) в контексте всего дискурса или всего диалога.

Поэтому, пытаясь формализовать понимание компьютером даже довольно простых текстов, исследователи быстро убеждались в том, что для решения их частных задач необходимо предварительно иметь теоретические решения, относящиеся к произвольным текстам группы естественных языков (например, русского, английского, немецкого, французского). В итоге в 1980-е годы в англоязычных публикациях даже возникла метафора "theory bottleneck" ("узкое горлышко теории"), отражающая значительные трудности создания адекватной теории понимания компьютером ЕЯ.

Наконец, несколькими группами исследователей из разных стран (в том числе и автором данной работы) была предложена идея, позволяющая найти выход из охарактеризованной тупиковой ситуации. Суть этой идеи заключается в следующем. Необходимо разработать такие формальные языки для представления знаний о мире и построения семантических представлений (СП) ЕЯ-текстов, чтобы можно было конструировать СП в виде выражений, отражающих многое структурные особенности самих текстов. Другими словами, нужны формальные языки (или формальные системы, поскольку множество их правильно построенных выражений образует язык) для описания структурированных значений (или смыслов) ЕЯ-текстов, обладающие выразительными возможностями, близкими к возможностям ЕЯ. Тогда можно будет выполнять смысловой анализ текста в два этапа:

ЕЯ-текст Т Недоопределенное СП текста Т Целевое СП текста Т .

Эту схему следует понимать следующим образом. Сначала должно быть построено промежуточное, предварительное СП текста, называемое недоопределенным семантическим представлением (НСП) рассматриваемого текста. Это выражение в большинстве случаев будет отображать смысл входного текста Т лишь частично, неполно. Например, в НСП текста Т может отсутствовать указание на конкретный объект, соответствующий конкретному вхождению в текст Т местоимения "ей" или не выбрано конкретное значение слова "станция", входящего в Т.

Однако НСП текста Т является формальным выражением, в отличие от исходного ЕЯ-текста Т. Поэтому на втором этапе обработки Т для снятия той или иной недоопределенности можно будет вызвать одну из многочисленных специализированных процедур-"экспертов" по конкретным вопросам. Такие процедуры можно будет проектировать с применением формальных средств представления информации, покольку базы знаний ЛП состоят из выражений формальных языков представления знаний, а исходное НСП - вход процедуры и преобразованное НСП (в частности, совпадающее с целевым СП) являются формальными выражениями. Впервые эта идея была высказана в работах (Фомичев 1981а, 1981б; Fomitchov 1983, 1984).

С конца 1980-х годов по настоящее время идея опоры при проектировании ЛП на формальные системы семантических представлений с широкими выразительными возможностями является центральной для развития теории понимания компьютером ЕЯ. Росту популярности этой идеи способствовало появление серии публикаций по эпизодической логике (ЭЛ) (Schubert, Hwang 1989, 2000; Hwang, Schubert 1993a-1995), реализация на основе ЭЛ проекта TRAINS, направленного на формализацию проблемно-ориентированного диалога на естественном (английском) языке (Allen, Schubert и др. 1995), осуществление проекта машинного перевода Core Language Engine (CLE) в Кембриджском отделении (Великобритания) Стенфордского исследовательского института (Alshawi и van Eijck 1989; Alshawi 1990, 1992), а также осуществление в 1980-х - 1990-х годах проекта SnepS в США (Shapiro 1996).

Отправной точкой исследований для авторов перечисленных выше работ был язык логики предикатов первого порядка. Характер предпринимавшихся усилий по расширению выразительных возможностей этого языка (точнее, класса логики предикатов первого порядка) можно проиллюстрировать следующими двумя примерами.

Пример 1. В ЕЯ-текстах встречается большое количество таких обозначений различных объектов, которые являются сочетаниями «Прилагательное + Существительное» (для русского языка) или «Артикль + Прилагательное + Существительное» (для английского, немецкого и французского языков). ЭЛ позволяет рассматривать формальные аналоги значений таких словосочетаний. Например, сочетанию «маленький дом» может соответствовать фрагмент семантического представления (СП) текста, являющийся выражением y : [ y ((атрибут, маленький)дом)] (Hwang и Shubert, 1993a).

В ЕЯ-текстах часто встречаются и однородные члены предложения, например, «комнату или маленький дом». ЭЛ дает возможность строить и формальные аналоги выражений такого вида. В частности, в СП текста сочетанию «комнату или маленький дом» может соответствовать формальное выражение

y : [[y комната] [y (( атрибут маленький) дом)] (Hwang, Shubert 1993a).

В логике предикатов первого порядка нет средств построения формальных аналогов словосочетаний вида «Прилагательное + Существительное» или «Существительное1 + ‘или’ + Прилагательное + Существительное2». Поэтому различные части СП текста могут отражать различные компоненты смысла словосочетаний подобного рода.

Пример 2. В проекте «Базовый Языковой Механизм» (Core Language Engine, или CLE) формулы, используемые для построения недоопределенных семантических представлений (НСП) предложений, называются квазилогическими формами (КЛФ). В частности, выражению «the three firms» (три фирмы) будет соответствовать КЛФ (см. Alshawi 1990) q_term(), S, [subset, S, q_term(, X,[firm, X])]).

Таким образом, язык КЛФ позволяет строить формальные аналоги некоторых естественно-языковых обозначений множеств (Alshawi 1990).

Сегодня наиболее популярным за рубежом подходом к формализации семантически-ориентированных компьютерных методов анализа дискурсов является эпизодическая логика (ЭЛ). Ее создатели, Л.К. Шуберт и Ч.Х. Хуан, в указанных выше работах предложили логику семантических представлений с широкими выразительными возможностями. Создание ЭЛ представляло собою значительный вклад в формальную теорию построения и понимания ЕЯ-дискурсов и, как следствие, в формальную теорию использования ЕЯ.

В то же время анализ показывает, что выразительная сила класса формул, рассматриваемых в ЭЛ, недостаточна с точки зрения представления основных принципов использования ЕЯ интеллектуальными системами. В первую очередь, выразительные возможности ЭЛ являются существенно ограниченными с точки зрения представления структурированных значений (СЗ) сложных целей, команд, дискурсов с описаниями множеств, дискурсов со ссылками на смысл фраз и более крупных частей текста. Кроме того, ЭЛ не предоставляет средств для рассмотрения составных обозначений понятий в качестве термов и для описания операций над понятиями. Те же ограничения (и ряд других) относятся к языкам проекта Core Language Engine и SnepS.

Логика предикатов первого порядка послужила в 1980-х годах отправной точкой для создания не только ЭЛ, но и нескольких других направлений, относящихся к области логического программирования. Одним из наиболее интересных направлений, развивающимcя более 15 лет, является атрибутная логика (АЛ), или логика со значениями свойств (Johnson 1988; Carpenter 1992; Carpenter, Penn 2001). Для АЛ характерен переход от рассмотрения однородного множества логических формул, описывающих факты, ситуации, к группировке формул, характеризующих одну сущность (человека, фирму и т.д.). Перечисленные выше ограничения ЭЛ относятся и к атрибутной логике.

Проблема формализации семантики ЕЯ-текстов в течение многих лет привлекает внимание исследователей и в нашей стране. Наиболее часто это внимание было обусловлено задачей выявления и формализации таких явлений семантического уровня ЕЯ, которые можно было бы эффективно использовать для представления знаний в прикладных интеллектуальных системах. В этой связи можно отметить цикл работ Д.А. Поспелова, Ю.И. Клыкова и ряда других авторов, в которых выделяются бинарные смысловые отношения между элементами предложения для решения задач ситуационного управления (Поспелов 1975, 1981, 1986; Клыков и Горьков, 1980), Г.С. Плесневича по теории логического вывода на ассоциативных сетях и понятийно-ориентированным языкам (Плесневич 1997 - 2003), Г.С. Осипова по использованию неоднородных семантических сетей в интеллектуальных системах приобретения знаний (Осипов 1990, 1997), В.Н. Вагина по проблеме обобщения знаний, представленных семантическими сетями (Вагин 1988).

Другую часть исследователей интересовала разработка формальных средств отображения содержания (смысла) текстов, анализируемых ЛП. В работе Н.Н. Леонтьевой (Леонтьева 1981), по-видимому, впервые в нашей стране был высказан тезис о том, что для формализации диалога, осуществляемого в ограниченных предметных областях с помощью довольно простых текстов, нужен семантический язык с выразительными возможностями, близкими к возможностям ЕЯ.

Отдельные аспекты формализации семантики ЕЯ нашли отражение в работах В.М. Брябрина, Б.Ю. Городецкого, А.К. Жолковского, А.П. Ершова, О.С. Кулагиной, Е.С. Кузина, Л.Т. Кузина, И.П. Кузнецова, Д.Г. Лахути, Н.Н. Леонтьевой, Л.И. Литвинцевой, Ю.Я. Любарского, М.Г. Мальковского, А.Г. Мацкевича, И.А. Мельчука, Л.И. Микулича, А.С. Нариньяни, Г.С. Осипова, Э.В. Попова, Д.А. Поспелова, В.Ш. Рубашкина, В.А. Тузова, З.М. Шаляпиной, Г.С. Цейтина, Л.Л. Цинмана и ряда других ученых.

Однако ни в какой из публикаций отечественных авторов, во-первых, не предлагается формального аппарата, удобного для отображения поверхностной смысловой структуры произвольных ЕЯ-текстов, относящихся к деловой прозе. Во-вторых, не предлагается лингвистической теории, которую можно было бы положить в основу построения математической модели, удобной для представления смысловой структуры ЕЯ-текстов деловой прозы. Таким образом, вопрос о формальных языках, удобных как для построения семантических представлений произвольных ЕЯ-текстов, относящихся к деловой прозе, так и для моделирования ЕЯ-диалога интеллектуальных систем, является чрезвычайно актуальным и остается в доступной литературе открытым (исключение составляют публикации автора данной работы).

Прогресс в решении этого вопроса означал бы существенный шаг вперед в решении фундаментальной проблемы разработки модели русского языка, сформулированной А.П. Ершовым еще в 1986 году следующим образом: “Мы хотим как можно глубже познать природу языка, и в частности русского. Одним из выражений этого познания должна стать модель русского языка. Это формальная система, которая должна быть адекватной и равнообъемной живому организму языка, но в то же время она должна быть анатомически отпрепарированной, разъятой, доступной для наблюдения, изучения и изменения” (Ершов 1986, с. 12).

1   2   3   4   5   6   7   8   9   ...   19

Похожие:

Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Рабочая программа по курсу «Математические представления» для обучающихся с рас (

Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon 1. 1 Арифметические основы ЭВМ
Составлены в соответствии с фгос спо по специальности 230115 (09. 02. 03) «Программирование в компьютерных системах» и рабочей программой...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Курс: «Технологии обработки информации». Лабораторная работа № Разработка...
Рассмотрим пример, который будет использоваться для иллюстрации шагов, необходимых для разработки агентного приложения с помощью...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Программа «Основы программирования на java»
Изучая основы программирования на языке Java, ребята учатся создавать реально действующие кроссплатформенные программы, которые могут...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методические рекомендации для специалистов
«правил игры» и активностью на рынке профессионального обучения множества агентов, преследующих свои интересы и создающих ложные...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Рабочая программа дисциплины «Основы Православия»
Данный курс является интегрированным, включает в себя основы программ «Катехизис» и «Догматическое богословие», и представляет раскрытие...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Институт развития образования республики башкортостан развитие интеллектуальных
Развитие интеллектуальных и творческих способностей учащихся образовательных учреждений: Сборник авторских программ. – Уфа: Издательство...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Учебно-методический комплекс дисциплины сд. 8 Математические основы...
«050703. 00 — Дошкольная педагогика и психология с дополнительной специальностью «Педагогика и психология»
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon 1 курс Дисциплина «Основы предпринимательской деятельности»
Самарина В. П. Основы предпринимательства : учеб пособие/ В. П. Самарина. Москва: кнорус, 2015. 1 o=эл опт диск (cd-rom), 222 с
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методичческое пособие по организации и проведению интеллектуальных...
Методическое пособие предназначено для специалистов учреждений дополнительного образования и молодежной политики, которые занимаются...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon К Приказу №396 от 15. 12. 2017 г
Порядок проведения операций по специальным залоговым банковским счетам, специальным банковским счетам платежных агентов (субагентов),...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Физико-математические науки. (Ббк 22)
Геометрия в таблицах : 7-11 классы : справочное пособие / авт сост.: Л. И. Звавич, А. Р. Рязановский. 20-е изд., стер. Москва : Дрофа,...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Методические указания предназначены для реализации государственных...
Учебным планом по дисциплине «Основы Экологического права» предусмотрено 12 часов практического обучения
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Мэдис методика экспресс-диагностики интеллектуальных способностей. 1
Методика экспресс-диагностики интеллектуальных способно-стей(мэдис) предназначена для быстрого ориентировочного обследования уровня...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Архитектурно-строительный университет
Учебное пособие охватывает программу курса "Основы компьютерных технологий", читаемого студентам нгасу очной формы обучения специальности...
Математические основы представления содержания посланий компьютерных интеллектуальных агентов москва icon Реализация содержания программы в образовательных областях
Цели: расширить представления о праздниках, школе; познакомить с творчеством А. С. Пушкина; воспитывать уважение к профессиям школьных...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск