Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии»




Скачать 2.26 Mb.
Название Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии»
страница 14/28
Тип Образовательная программа
rykovodstvo.ru > Руководство ремонт > Образовательная программа
1   ...   10   11   12   13   14   15   16   17   ...   28

4.4.Анализ ошибок в контекстах-кандидатах


Среди примеров с оценками 1 и 2 были выделены следующие группы ошибок (ключи выделены угловыми скобками, ошибки отмечены звёздочкой):

  1. Ошибки в форме примера

    1. Грамматически некорректные фразы

*
enamel → <�составление> эмали


acrobatics → *<�оценить> акробатика

  1. Незаконченные фразы

county → деревенский <�исправительный>

  1. Фразы в несловарной форме

* tsunamis → *<�породило> цунами

monstrously → *чудовищно <�огромная>

header files → *заголовочных файлов

  1. Фразы, содержащие иностранные слова, транслитерацию

resiliency → *<�улучшать> resiliency

unformatted → *unformatted <�емкость>

* shvatyvanija → начало> схватывания

  1. Фразы, содержащие слово с опечаткой

caribbean → *караибское <�содружество>

burgundy → *бардовая <�подошва>

  1. Ошибки в значении

    1. Неинформативные фразы

*его <�любовь> → *his

*очень <�глупый> → *really

*nonpregnant → *небеременная <�женщина>

  1. Фразы с несвязанными словами

*pickled → *маринованная <�красота>

* neurotic → *<�спасение> невротиков

*синхроничная <�жизнь> → *synchronistic

  1. Труднопонятные фразы со специфическим значением

*sagittal → *сагиттальная <�реконструкция>

*threshold
→ *пороговое <�табло>


  1. Машинный / пословный перевод

* squirrels → <�соевый> белок

* stitches → <�символьные> строчки

*harvest → жмешь <�контрол>

*Berners- → Бернерс-<�ли>

hi → *привет <�видеокамеры>

  1. Оскорбительные контексты для нейтральных слов

naked → голая <�девушка>

militarists → <�японские> милитаристы

Hitlerite → гитлеровская <�Германия>

a Shaheed → <�стать> шахидом

  1. Фразы, не являющиеся переводными эквивалентами

rolling → <�спасение> утопающих

Первую группу ошибок можно объяснить двумя взаимосвязанными причинами. Во-первых, контексты извлекаются из интернет-корпуса, который содержит «некачественные» тексты, полученные в результате машинного перевода, случайно и намеренно искажённые тексты. С другой стороны, на извлекаемые контексты не накладывается никаких ограничений, кроме связности поддерева. Таким образом, учитывая возможные ошибки парсера, находятся грамматически некорректные фразы. С качеством корпуса связаны и некорректные переводы контекстов (ошибки в значении), и пословные переводы: soya squirrels, saving rolling.

При обучении ранжирующих классификаторов из обучающего набора удалялись примеры с оценкой 3, поскольку они не представляют качественного материала для обучения, а скорее зашумляют его.

4.5.Общий алгоритм ранжирования параллельных контекстов


Исходя из проведённого анализа ошибок, а также из изложенных выше принципов отбора иллюстраций и устойчивых сочетаний в словарях классического типа, мы предлагаем следующий алгоритм ранжирования переводных контекстов. Для каждого контекста вычисляются значения признаков, которые позволяют отделить релевантные фразы от некорректных (подробное описание этих признаков приведено ниже). В результате получаем матрицу размера , где N – количество переводных контекстов, а M – количество признаков. Эти данные подаются на вход ранжирующему классификатору, который приписывает каждому контексту некоторое значение (от 0 до 1 или от 1 до 5). Затем контексты ранжируются внутри группы, найденной для ключа (пары «английское слово – русский перевод»). В словаре для каждого ключа отображается только лучший пример из группы.
1   ...   10   11   12   13   14   15   16   17   ...   28

Похожие:

Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Образовательная программа: «Прикладная и экспериментальная лингвистика»...
Кластеризация языковых выражений в корпусе текстов на основе стохастического ранжирования
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа дисциплины Теоретическая и прикладная лексикография для...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и бакалавров направления подготовки 035800....
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Образовательная программа "Прикладная лингвистика"
Современные тенденции изменения датской произносительной нормы на примере гласного «шва»
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Учебно-методический комплекс дисциплина: квантитативная лингвистика...
Программа дисциплины «квантитативная лингвистика и новые информационные технологии» 4
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Паспорт программы дисциплины Область применения программы рабочая...
Лингвистика профиль (45. 03. 02. 02 Перевод и переводоведение) в соответствии с фгос впо по направлению подготовки 45. 03. 02 лингвистика...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа дисциплины «Литература стран изучаемого языка» для направления...
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов, обучающихся по направлению...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа научно-исследовательской практики (2 курс) Направление...

Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа практики (производственной) по направлению 031100. 62 «Лингвистика»
Программа практики (производственной), для студентов, обучающихся по направлению 031100. 62 «Лингвистика». М.: Ноу впо мгта, 2012....
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon В. П. Захаров Корпусная лингвистика
Оно включает также программу учебной дисциплины «Корпусная лингвистика», которая изучается студентами отделения структурной и прикладной...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа практики учебно-производственная практика направление подготовки 035700 «Лингвистика»
Профиль подготовки «Теория и методика преподавания иностранных языков и культур» и «Перевод и переводоведение»
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Дипломной практики «Методы и средства проектирования прикладных интеллектуальных систем»
Фгос во с учетом рекомендаций и Прооп во по направлению 02. 04. 02 «Фундамен­та­льная информатика и инфор­ма­ционные технологии»....
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Направление подготовки 45. 04. 02 «Лингвистика» Образовательная программа...
Языковая картина мира как предмет изучения лингвокультурологии. Методы и процедуры лингвистического анализа 7
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon «лингвистике» на 2016/2017 год в магистратуру по направлению «лингвистика»
Программа предназначена для подготовки абитуриентов к вступительному экзамену по лингвистике в магистратуру факультета иностранных...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Рабочая программа учебной дисциплины (рпуд) инженерные web-технологии...
Рабочая программа составлена в соответствии с требованиями федерального государственного образовательного стандарта высшего образования,...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Программа дисциплины
Программа предназначена для преподавателей, ведущих данную дисциплину, учебных ассистентов и студентов направлений 231300. 62 «Прикладная...
Образовательная программа: «Прикладная и экспериментальная лингвистика» Профиль: «Компьютерная лингвистика и интеллектуальные технологии» icon Основная образовательная программа высшего профессионального образования...
Основная образовательная программа (описание структуры, целей и задач образовательной программы)

Руководство, инструкция по применению






При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск