КОНСПЕКТ ЛЕКЦИЙ
Тема 1. Объект и методы прикладной лингвистики
Понимание термина «прикладная лингвистика». Круг задач прикладной лингвистики. Методы прикладной лингвистики.
Прикладна́я лингви́стика (прикладное языкознание) - наряду с теоретической лингвистикой является частью науки, занимающейся языком. Специализируется на решении практических задач, связанных с изучением языка, а также на практическом использовании лингвистической теории в других областях. Основные направления прикладной лингвистики, связанные с изучением языка: лексикография - теория и практика составления словарей; лингводидактика - наука о разработках методик обучения иностранному языку; терминоведение - наука об упорядочении и стандартизации научно-технической терминологии; переводоведение - теория перевода. Основные направления прикладной лингвистики (англ. applied linguistics), связанные с практическими приложениями. Компьютерная Лингвистика (англ. computational linguistics): машинный перевод; автоматическое распознавание символов (англ. OCR); автоматическое распознавание речи (англ. ASR); автоматическое извлечение данных (англ. Data Mining); автоматическое реферирование текстов; построение систем управления знаниями; создание электронных словарей, тезаурусов, онтологий. Корпусная лингвистика, создание и использование электронных корпусов текстов. Лингвистическая экспертиза (например, в судебной практике) – это наука об упорядочении и стандартизации научно-технической терминологии. Методы прикладной лингвистики. Можно выделить общее, характерное для методов прикладной лингвистики при сравнении методических инструментариев описательной, теоретической и прикладной лингвистики. Перед описательной лингвистикой стоит задача описания фактов языка. На первом плане находится метод классификации, т.е. выявления той сетки параметров, которая позволяет охватить все существенные свойства языковых структур. Теоретическая лингвистика формирует само представление о том, какие свойства языка являются существенными, а какие – нет. Создаваемые в теоретической лингвистике концептуальные модели языка не только описывают наблюдаемые факты, но и претендуют на их объяснение. При этом как описательная, так и теоретическая лингвистика исходят из познавательной установки, известной как «God"s Truth» («Божественная Истина»). Иными словами, классификации языковых фактов и концептуальные модели теоретической лингвистики пытаются дать описание того, как действительно устроен язык. Прикладная лингвистика также использует и метод классификации, и метод моделирования. Однако поскольку задачи прикладной лингвистики сосредоточены в области оптимизации функций языка, а оптимизация определяется конкретной задачей, то в прикладной лингвистике широкое распространение имеет познавательная установка, («инженерный подход»). Эта установка выдвигает решение конкретной задачи, в частном случае – удовлетворение требований «заказчика», преследующего свои собственные цели. Прикладные модели оказывают значительное влияние на лингвистическую теорию, способствуя обновлению концептуального аппарата современного языкознания. Важнейшим общим свойством методов прикладной лингвистики является ориентация на создание такой модели данной проблемной области, которая отображает только те ее свойства, которые необходимы для решения конкретной практической задачи. Прикладное описание обязано удовлетворять данной конкретной задаче. Оно может обладать описательной адекватностью и объяснительной силой. Прикладные модели ориентированы на конкретные подъязыки, а не весь язык в целом; они часто требуют большей степени формализации; используют знания о языке выборочно; не делают различий между собственно лингвистическими и экстралингвистическими аспектами семантики языковых выражений; огрубляют моделируемый объект; не налагают никаких существенных ограничений на инструмент моделирования. Термин «квантитативная лингвистика» характеризует междисциплинарное направление в прикладных исследованиях, в котором в качестве основного инструмента изучения языка и речи используются количественные или статистические методы анализа. Иногда квантитативная (или количественная) лингвистика противопоставляется комбинаторной лингвистике. В комбинаторной лингвистике доминирующую роль занимает «неколичественный» математический аппарат - теория множеств, математическая логика, теория алгоритмов и т.д. С теоретической точки зрения, использование статистических методов в языкознании позволяет дополнить структурную модель языка вероятностным компонентом, т.е. создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону использования количественных методов следует считать приложением статистики в языкознании. Иными словами, задача построения структурно-вероятностной модели функционирования языка относится к теоретическим проблемам лингвистики и входит в компетенцию теории языка. В прикладной же области квантитативная лингвистика представлена прежде всего фрагментами этой модели, используемыми для лингвистического мониторинга функционирования языка, дешифровки кодированного текста, авторизации/атрибуции текста и т.п.
2. Оптимизация когнитивной функции языка
Компьютерная лингвистика. Компьютерная лингвистика как прикладная лингвистическая дисциплина. Когнитивный инструментарий компьютерной лингвистики.
Компью́терная лингви́стика (также: математи́ческая или вычисли́тельная лингви́стика, англ. computational linguistics) - научное направление в области математического и компьютерного моделирования интеллектуальных процессов у человека и животных при создании систем искусственного интеллекта, которое ставит своей целью использование математических моделей для описания естественных языков. Компьютерная лингвистика частично пересекается с обработкой естественных языков, где рассматривается не абстрактные модели, а на прикладные методы описания и обработки языка для компьютерных систем. Полем деятельности компьютерных лингвистов является разработка алгоритмов и прикладных программ для обработки языковой информации. Компьютерная лингвистика, направление в прикладной лингвистике, ориентированное на использование компьютерных инструментов - программ, компьютерных технологий организации и обработки данных - для моделирования функционирования языка в тех или иных условиях, ситуациях, проблемных сферах и т.д., а также вся сфера применения компьютерных моделей языка в лингвистике и смежных дисциплинах. Собственно, только в последнем случае и идет речь о прикладной лингвистике в строгом смысле, поскольку компьютерное моделирование языка может рассматриваться и как сфера приложения информатики и теории программирования к решению задач науки о языке. На практике, однако, к компьютерной лингвистике относят практически все, что связано с использованием компьютеров в языкознании. Как особое научное направление компьютерная лингвистика оформилась в 1960-е годы. Русский термин «компьютерная лингвистика» является калькой с английского computational linguistics. Поскольку прилагательное computational по-русски может переводиться и как «вычислительный», в литературе встречается также термин «вычислительная лингвистика», однако в отечественной науке он приобретает более узкое значение, приближающееся к понятию «квантитативной лингвистики». Когнитивный инструментарий компьютерной лингвистики. Компьютерная лингвистика как особая прикладная дисциплина выделяется по использованию компьютерных средств обработки языковых данных. Существуют общие принципы компьютерного моделирования мышления, которые, так или иначе, реализуются в любой компьютерной модели. В их основе лежит теория знаний, первоначально разрабатывавшаяся в области искусственного интеллекта, а в дальнейшем ставшая одним из разделов когнитивной науки. Важнейшими понятийными категориями компьютерная лингвистика являются такие структуры знаний, как «фреймы» (понятийные, или, как принято говорить, концептуальные структуры для декларативного представления знаний о типизированной тематически единой ситуации), «сценарии» (концептуальные структуры для процедурного представления знаний о стереотипной ситуации или стереотипном поведении), «планы» (структуры знаний, фиксирующие представления о возможных действиях, ведущих к достижению определенной цели). Тесно связано с категорией фрейма понятие «сцена». Категория сцены преимущественно используется в литературе по компьютерной лингвистике как обозначение концептуальной структуры для декларативного представления актуализованных в речевом акте и выделенных языковыми средствами (лексемами, синтаксическими конструкциями, грамматическими категориями и пр.) ситуаций и их частей. Определенным образом организованный набор структур знаний формирует «модель мира» когнитивной системы и ее компьютерной модели. В системах искусственного интеллекта модель мира образует особый блок, в который в зависимости от выбранной архитектуры могут входить общие знания о мире (в виде простых пропозиций типа «зимой холодно» или в виде правил продукций «если на улице идет дождь, то надо надеть плащ или взять зонтик»), некоторые специфические факты («Самая высокая вершина в мире – Эверест»), а также ценности и их иерархии, иногда выделяемые в особый «аксиологический блок». Большинство элементов понятий инструментария компьютерной лингвистики омонимично: они одновременно обозначают некоторые реальные сущности когнитивной системы человека и способы представления этих сущностей, используемые при их теоретическом описании и моделировании. Элементы понятийного аппарата компьютерной лингвистики имеют онтологический и инструментальный аспекты. В инструментальном аспекте знание может быть воплощено в совокупности дескрипций (описаний), в наборе данных, с одной стороны, и в алгоритме, инструкции, которую выполняет компьютерная или какая-либо другая модель когнитивной системы, с другой.
3. Некоторые направления компьютерной лингвистики
Моделирование общения. Моделирование структуры сюжета.
Компьютерная лингвистика имеет несколько направлений. Вот некоторые из них: моделирование общения, моделирование структуры сюжета и гипертекстовые технологии представления текста. Рассмотрим подробнее моделирование общения. Это направление КЛ включает в себя обеспечение общения человека с ЭВМ на естественном языке или ограниченном естественном языке и изучение процесса общения как такового. Для создания успешной компьютерной модели общения исследователям необходимо найти ответы на следующие вопросы: 1). Что обеспечивает естественность общения? 2). При каких условиях беседа становится связной? 3). В каких случаях общение оказывается успешным, а в каких случаях неудачным и что нужно для того, чтобы избежать подобного рода неудач? 4). Какие стратегии общения используют участники коммуникативного взаимодействия для достижения своих коммуникативных целей? Моделирование общения позволяет более глубоко исследовать общение на естественном языке, подтвердить или опровергнуть многие положения теории диалога, разработанные в лингвистике, дискурс-анализе, теории коммуникации, психологии и социологии общения. Это направление компьютерной лингвистики, которое имеет целью представить в формальном виде общение человека с персональным компьютером. Во всех системах обработки естественного языка обязательным должен быть такой компонент, который обеспечивает диалог человека желательно на естественном языке, и это направление по созданию модели общения развивается в рамках одного из направлений искусственного интеллекта – Human-Computer Interaction (HCI). В первую очередь, в рамках этого направления развивается моделирование диалоговых системы. И особый интерес вызывает моделирование системы кооперативных диалогов. Кроме того, ведется исследование по моделированию дискурса и дискурсивных стратегий. В настоящее время существует 3 основных модели диалога: 1) диалоговые грамматики; 2) методы, основанные на планах; 3) методы на базе теории совместного действия. Диалог грамматики исходит из предположения, что в диалоге имеется ряд стандартных реакций, например, по вопрос – ответ и др. Диалоговая грамматика – обычно порождающая грамматика, где терминалами являются сами типы реакций, а не терминалы описывают разные стадии диалога. Например, открытие/ начало / реакция и закрытие/ конец. Однако это упрощенные варианты, которые используют в простых интерфейсах. Модели на планах исходят из предположения о том, что каждое высказывание - это реализация речевых актов. Причем в обществе люди имеют определенные цели и планируют коммуникацию для достижения этих целей. Основная трудность реализации этого подхода в том, что очень сложно в теории определить сами базовые понятия плана, цели, намерения. Модели в теории совместных действий рассматривается как процесс, реализуемый всеми его участниками, каждый из которых несет ответ за его продолжение, т.к. от него ожидается реакция. Участник общения должен понять своих партнеров, чему способствует уточнение, вопрос, объяснение и утверждения. Первой из систем компьютерного моделирования диалога была программа Джосефа Вейценбаума «Элиза» в 1966 году. Он создавалась как учебный образец программы – имитатора речевого поведения. Моделирование структуры сюжета. К интересным формальным лингвистическим моделям относят такие, которые разрабатываются в рамках направления моделирования структуры сюжета. Изучение структуры сюжета относится к проблематике компьютерного литературоведения и к проблематике моделирования знаний по аналогии со сценариями действий. Имеющиеся компьютерные программы моделирования сюжета основываются на трех базовых формализмах его описания: 1) «морфология» сюжета; 2) синтаксис сюжета; 3) когнитивная сторона сюжета. Морфология сюжета. Идеи о морфологическом устройстве структуры сюжет были выдвинуты в работе В.Л. Тропа о русской волшебной сказки. Он отметил, что при обилии персонажей и событий в сказке, количество функций персонажей ограничено, например, существуют следующие функции: отлучение от дома, обман хорошего человека плохим и т.д. его идеи легли в основу компьютерной программы «Tail», модель порождения сюжета сказки. Синтаксис сюжета. В этом направлении были разработаны сюжетные грамматики (story grammars). Появились в середине 70-х на базе порождающей грамматики Хомского. В качестве базовых единиц сюжетные грамматики выделяют понятия события, эпизода и установок. Когнитивный подход. Когнитивная лингвистика - направление в языкознании, которое исследует проблемы соотношения языка и сознания, роль языка в концептуализации и категоризации мира, в познавательных процессах и обобщении человеческого опыта, связь отдельных когнитивных способностей человека с языком и формы их взаимодействия. Вообще, когнитивизм есть совокупность наук, объединяющая исследования общих принципов, управляющих мыслительными процессами. Таким образом, язык представляется как средство доступа к мыслительным процессам. Именно в языке фиксируется опыт человечества, его мышление; язык - познавательный механизм, система знаков, специфически кодифицирующая и трансформирующая информацию. Объектом когнитивной лингвистики является язык как механизм познания. Наиболее перспективный, был представлен в начале 80-х учеником Роберта Шенка В. Ленерт. В рамках работ по созданию компьютерного генератора сюжетов был предложен оригинальный формализм. Сущность подхода заключается в том, что сюжет описывается как последовательная смена когнитивного и эмоционального состояния персонажа, т.е. в самом центре моделирования содержатся характеристики сюжета. Она предлагает до 60 сюжетных единиц для построения модели сюжета. Это направление активно развито в рамках когнитивной лингвистике и используется при моделировании сценариев.
|