Скачать 0.74 Mb.
|
Тема 16. Машинный перевод. Основная сложность перевода компьютером состоит в том, что естественные языки плохо поддаются формализации. Отсюда и невысокое качество получаемого с помощью систем МП текста, содержание и форма которого служит неизменным объектом шуток. Однако идея машинного перевода уходит корнями далеко в прошлое. Впервые мысль о возможности машинного перевода высказал Чарльз Бэббидж, разработавший в 1836-1848 гг. проект цифровой аналитической машины. Идея Ч. Бэббиджа состояла в том, что память объемом 1000 50-разрядных десятичных чисел (по 50 зубчатых колес в каждом регистре) можно использовать для хранения словарей. Ч. Бэббидж привел эту идею в качестве обоснования для запроса у английского правительства средств, необходимых для физического воплощения аналитической машины, которую ему так и не удалось построить. А через 100 лет, в 1947 году, У. Уивер (директор отделения естественных наук Рокфеллеровского фонда) написал письмо Норберту Винеру. В этом письме он предлагал использовать технику дешифрования для перевода текстов. Этот год считается годом рождения машинного перевода. В этом же году был разработан алгоритм осуществления пословного перевода, а в 1948 году Р. Риченс предложил правило разбиения слова на основу и окончание. В последующие два десятилетия системы машинного перевода бурно развивались. В январе 1954 года на машине IBM – 701 была продемонстрирована первая система машинного перевода IBM Mark II. Но в 1967 году специально созданная Комиссия Национальной Академии Наук США признала машинный перевод нерентабельным, что существенно затормозило исследования в этой области. Новый подъем машинный перевод переживает в 70-е годы, а в 80-е становится экономически выгодным за счет сравнительной дешевизны машинного времени. Однако в СССР исследования в области машинного перевода продолжались. После демонстрации системы IBM Mark II группа ученых ВИНИТИ начала разработку системы машинного перевода для машины БЭСМ. Первый образец перевода с английского на русский язык был получен к концу 1955 года. Другое направление работ возникло в Отделении прикладной математики Математического института АН СССР (ныне ИПМ им. М. В. Келдыша РАН) по инициативе А. А. Ляпунова. Первые программы машинного перевода, разработанные этим коллективом, были реализованы на машине "Стрела". Благодаря работе над созданием систем МП оформилось такое направление, как прикладная лингвистика. В 70-е годы над созданием систем МП трудилась группа разработчиков ВИНИТИ РАН под руководством проф. Г.Г. Белоногова. Первая их система МП была разработана в 1993 году, а в 1996 году после ряда доработок была зарегистрирована в РОСАПО под названием Retrans. Эта система использовалась министерствами обороны, путей сообщения, науки и технологии. Параллельные исследования велись в лаборатории Инженерной Лингвистики ЛГПИ им. А. И. Герцена (ныне Педагогический Университет). Именно они и легли в основу наиболее популярной сейчас системы МП “PROMT”. Последние версии этого программного продукта используют наукоемкие технологии и построены на основе технологии расширенных сетей переходов и формализма нейронных сетей. 17. Компьютерное обучение языкам. Информатизация образования и связанные с этим изменения в обучении языкам. Понятие компьютерного обучения языкам. Классификация электронных средств обучения. Дистанционное обучение. Сетевые ресурсы в обучении языкам. Любое обучение - целенаправленный процесс воздействия на объект обучения (ученика), т.е. управление, поэтому к обучению применима не только методология управления, но и его методы и теория. Итак, обучение языку как процесс управления. Для компьютерной реализации этого принципа необходимо формализовать понятия цели обучения, состояния ученика, модель памяти ученика, алгоритм обучения и т.д. Алгоритм обучения сводится к максимизации уровня знаний лексики ученика на данном этапе обучения до тех пор, пока этот уровень не превысит заданный порог (0,95). Говоря строго, при этом должна решаться вариационная задача максимизации уровня знаний на основе имеющейся модели памяти ученика. Таким образом, система обучения, построенная на указанных принципах, на каждом шаге максимизирует знания, адаптируется к специфике памяти каждого конкретного ученика, что и обеспечивает ему максимальную скорость обучения лексике иностранного языка, т. е. минимальное время для достижения заданного порога требуемой обученности. Этот подход реализован в автоматизированной системе обучения лексике иностранного языка АСОЛИЯ. Скорость обучения здесь максимальна - в среднем 1 минута на слово (для сравнения: лозановская методика "полного погружения" дает возможность обучаться лексике со скоростью 3 минуты на слово). Этот эффект получен за счет адаптации системы к индивидуальным свойствам памяти конкретного ученика. Таким образом, использование методов теории управления для обучения лексике иностранного языка позволяет гарантировать максимальную скорость обучения каждому ученику, выход на заданный уровень знания лексики и учет профессиональных интересов абонента, т.е. обучение языку в его предметной области. 18. Информационно-поисковые системы. С помощью специальных алгоритмов поисковые роботы собирают и индексируют информацию (заносят ее в базу данных, где она структурируется и располагается в определенном порядке). Когда пользователь вводит запрос в строку поиска, автоматически формируется обращение к базе данных. После этого система выдает в виде нумерованного списка наиболее релевантные (соответствующие запросу) документы. Сортировка документов (ранжирование) и присвоение им позиции в поисковой выдаче осуществляется на основе их значимости. Поиско́вая систе́ма - это программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс (фронт-энд) системы. Программной частью поисковой системы является поисковая машина (поисковый движок) – комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы. Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet. Улучшение поиска - это одна из приоритетных задач современного интернета (см. про основные проблемы в работе поисковых систем в статье Глубокая паутина). По данным компании Net Applications, в ноябре 2011 года использование поисковых систем распределялось следующим образом: Google - 83,87 %; Yahoo! - 6,20 %; Baidu - 4,22 %; Bing - 3,69 %; Yandex - 1,7 %; Ask - 0,57 %; AOL - 0,36 %. Основная литература
Дополнительная литература
Программное обеспечение пакет программ Microsoft Office и специализированное программное обеспечение Sound Forge, Cool Edit, Adobe PhotoShop, Adobe Premier. Базы данных, информационно-справочные и поисковые системы http://linguistlist.org http://www.dialog-21.ru/dialog2008 http://rusling.narod.ru http://uisrussia.msu.ru/linguist/index.jsp http://speech-soft.ru/ |
Учебно-методический комплекс дисциплина: квантитативная лингвистика... Программа дисциплины «квантитативная лингвистика и новые информационные технологии» 4 |
Учебно-методический комплекс дисциплины «информационные технологии управления» Учебно-методический комплекс составлен в соответствии с требованиями государственного стандарта высшего профессионального образования... |
||
Учебно-методический комплекс дисциплины «информационные технологии... Учебно-методический комплекс составлен в соответствии с требованиями государственного образовательного стандарта высшего профессионального... |
Учебно-методический комплекс дисциплины «Информационные технологии... Учебно-методический комплекс составлен в соответствии с требованиями федерального государственного образовательного стандарта высшего... |
||
Учебно-методический комплекс дисциплины «Информационные технологии... Учебно-методический комплекс составлен в соответствии с требованиями федерального государственного образовательного стандарта высшего... |
Учебно-методический комплекс дисциплины «Информационные технологии... Учебно-методический комплекс составлен в соответствии с требованиями федерального государственного образовательного стандарта высшего... |
||
Учебно-методический комплекс по дисциплине сд. 08 Информационные... Учебно-методический комплекс по дисциплине «Информационные технологии в профессиональной деятельности» составлен в соответствии с... |
Учебно-методический комплекс дисциплины «информационные технологии рынка ценных бумаг» Учебно-методический комплекс составлен в соответствии с требованиями Государственного образовательного стандарта высшего профессионального... |
||
Учебно-методический комплекс дисциплины «информационные системы в экономике» Учебно-методический комплекс составлен в соответствии с требованиями государственного образовательного стандарта высшего профессионального... |
Учебно-методический комплекс составлен на основании требований государственного... Учебно-методический комплекс дисциплины обсуждена на заседании кафедры Информационные системы управления «29» июня 2011 г |
||
Учебно-методический комплекс дисциплины «Информационные технологии» Контрольный экземпляр находится на кафедре бизнес-информатики и экономико-математических методов |
«информационные технологии в профессиональной деятельности: учебно-методический комплекс» Государственное автономное профессиональное образовательное учреждение чистопольский сельскохозяйственный техникум |
||
Учебно-методический комплекс специальные технологии для специальности:... О 26 Специальные технологии: учебно-методический комплекс / Л. К. Обухова. – Елабуга: Изд-во егпу, 2009. – 51 с |
Учебно-методический комплекс дисциплины «компьютерные технологии в науке и технике» Учебно-методический комплекс составлен на основании требований федерального государственного образовательного стандарта высшего профессионального... |
||
Учебно-методический комплекс дисциплины «Компьютерные технологии» Учебно-методический комплекс составлен в соответствии с требованиями федерального государственного стандарта высшего профессионального... |
Учебно-методический комплекс дисциплины опд. Ф. 7 Информационные... ... |
Поиск |