Тезаурусы в задачах информационного поиска


Скачать 6.4 Mb.
Название Тезаурусы в задачах информационного поиска
страница 5/45
Тип Задача
rykovodstvo.ru > Руководство эксплуатация > Задача
1   2   3   4   5   6   7   8   9   ...   45

1.1.2. Критерии ввода многословных дескрипторов


Поскольку в текстах предметной области может встречаться достаточно много частотных словосочетаний, то обычно стандарты на тезаурусы вводят правила включения терминологических словосочетаний в тезаурусы

Так, ГОСТ 7.25 указывает, что допускается включать словосочетания в словник тезауруса, если в качестве опорного слова они содержат существительное, и если выполнено одно из следующих условий:

  • значение словосочетания не выводится из значений его компонентов, например,

  • ЧЕРНЫЙ ЯЩИК, АБСОЛЮТНО ЧЕРНОЕ ТЕЛО, ЦАРСКАЯ ВОДКА;

  • хотя бы один из компонентов словосочетания не употребляется в составе других сочетаний или употребляется всегда в другом смысле, например, ТОРГОВЛЯ НА ВЫНОС, ЛЕГКАЯ ПРОМЫШЛЕННОСТЬ;

  • для данного словосочетания в словнике тезауруса существуют полные синонимы, например, НАТРИЯ ХЛОРИД = ПОВАРЕННАЯ СОЛЬ;

  • данное словосочетание является устойчивым словосочетанием с именем собственным:. ТАБЛИЦА МЕНДЕЛЕЕВА, ЗАКОН БОЙЛЯ-МАРИОТТА;

  • отдельные слова словосочетания имеют слишком широкое значение, например, слово машины в словосочетаниях: СТРОИТЕЛЬНЫЕ МАШИНЫ, ЭЛЕКТРИЧЕСКИЕ МАШИНЫ;

  • для данного словосочетания в словнике тезауруса существует общепринятая аббревиатура, например,:

ПОВЕРХНОСТНО-АКТИВНЫЕ ВЕЩЕСТВА - ПАВ,

УНИВЕРСАЛЬНАЯ ДЕСЯТИЧНАЯ КЛАССИФИКАЦИЯ - УДК,

ИНФОРМАЦИОННО-ПОИСКОВЫЙ ТЕЗАУРУС - ИПТ,

ЭЛЕКТРОННО-ВЫЧИСЛИТЕЛЬНАЯ МАШИНА - ЭВМ;

  • разбиение словосочетаний на отдельные компоненты приводит к потере важных для поиска семантических связей. Так, разбиение языкового выражения ЯЗЫК ПРОГРАММИРОВАНИЯ не позволяет установить связи с такими языковыми выражениями как «АЛГОЛ», «КОБОЛ», «ФОРТРАН».

Словосочетания, которые не удовлетворяют перечисленным условиям, разбивают на компоненты.

Американский стандарт Z39.19 помимо вышеперечисленных случаев приводит также критерий общепринятости термина профессиональным сообществом, например, data processing – обработка данных.

Кроме того, этот стандарт указывает, что введение многословного дескриптора позволяет избегать ложных корреляций, например, разбиение термина Library science (наука о библиотеках = библиотековедение), может привести к нахождению документов о научных библиотеках (science library).

В работе (Шемакин, 1974) на примере терминов научно-технического тезауруса (Шемакин, 1972) приводятся следующие принципы ввода многословных дескрипторов:

  • значение одного из терминов изменилось бы в результате комбинации. Например, термин ПОСАДОЧНЫЕ ПЛОЩАДКИ нельзя представить комбинацией терминов ПОСАДКА и ПЛОЩАДКА, поскольку это привело бы к несвойственному в данном случае использованию термина ПОСАДКА;

  • термин-словосочетание обозначает некоторую физическую целостность или специфическое вещество (например, ЦИФРОВЫЕ ВЫЧИСЛИТЕЛЬНЫЕ МАШИНЫ, ПЕРЕКИСЬ ВОДОРОДА);

  • термин-словосочетание имеет один или несколько синонимов на уровне словосочетания, или синонимия существует только на уровне словосочетания, а не на уровне отдельных слов, образующих словосочетания (ПОЛУПРОВОДНИКОВЫЕ ТРИОДЫ – ТРАНЗИСТОРЫ);

  • термин-словосочетание употребляется только в единственном или множественном числе (например, АВТОМАТИЧЕСКИЙ ПЕРЕВОД, АНГЛИЙСКИЙ ЯЗЫК, СТРОИТЕЛЬНЫЕ МАТЕРИАЛЫ);

  • для термина словосочетания существует общепринятая аббревиатура, составленная из первых букв компонентов словосочетания (ЭЛЕКТРОННЫЕ-ЦИФРОВЫЕ ВЫЧИСЛИТЕЛЬНЫЕ МАШИНЫ – ЭЦВМ);

  • для некоторых элементов термина-словосочетания мала вероятность использования вне данного словосочетания (например, ОБЗОР ВЕЕРНЫМ ЛУЧОМ, ЭТАЖЕРОЧНЫЕ МИКРОМОДУЛИ);

  • один из элементов термина-словосочетания снимает омонимию другого: АВТОМАТЫ: АВТОМАТЫ ДОЗИРОВАНИЯ, АВТОМАТЫ КУРСА;

  • словосочетания являются единственным способом уменьшения информационного шума, то есть выдачи документов, не соответствующих запросу. Например, если разложить термины-словосочетания ПРЕОБРАЗОВАТЕЛИ ПОСЛЕДОВАТЕЛЬНОГО КОДА В ПАРАЛЛЕЛЬНЫЙ и ПРЕОБРАЗОВАТЕЛИ ПАРАЛЛЕЛЬНОГО КОДА В ПОСЛЕДОВАТЕЛЬНЫЙ на составляющие их терминологические элементы, то без указателей роли и связи между этими терминоэлементами их невозможно различить.
1   2   3   4   5   6   7   8   9   ...   45

Похожие:

Тезаурусы в задачах информационного поиска icon Тезаурусы в задачах информационного поиска
Правила индексирования документов дескрипторами информационно-поискового тезауруса 39
Тезаурусы в задачах информационного поиска icon Тезисы представленные на
Внимание! Для поиска своей фамилии или ключевого слова в тексте нажмите Ctrl+F и введите искомое слово в окно поиска!!
Тезаурусы в задачах информационного поиска icon Инструкция по заполнению документов на регистрацию информационного ресурса
Настоящая инструкция определяет порядок заполнения и представления документов для регистрации информационного ресурса в Реестре государственных...
Тезаурусы в задачах информационного поиска icon Лекция №11
В этом разделе будет приведен обзор одних из первых систем поиска информации, насчитывающих к настоящему моменту времени многолетнюю...
Тезаурусы в задачах информационного поиска icon Конспект лекций по дисциплине «Информационные системы и технологии в науке и образовании»
Введение. Содержание дисциплины и порядок ее изучения. Фактографический поиск. Математические модели фактографического поиска. Информационная...
Тезаурусы в задачах информационного поиска icon Инструкция по сверке Планов финансово-хозяйственной деятельности
В параметрах поиска в строке Наименование учреждения вводим инн, либо название учреждения. Нажать кнопку Найти. Внизу экрана загрузится...
Тезаурусы в задачах информационного поиска icon Алгоритмы поиска. Линейный поиск. Двоичный поиск
Также, линейный поиск часто используется в виде линейных алгоритмов поиска максимума/минимума
Тезаурусы в задачах информационного поиска icon Рабочая инструкция по настройке представлений в hp sm
Удалены не используемые номера рисунков. Добавлено описание создания представления из Поиска и описание требований для удаления Представления....
Тезаурусы в задачах информационного поиска icon Задачах на 2014 год Итоги работы Отдела социальной защиты населения г. Рошаль
Отдела социальной защиты населения г. Рошаль Министерства социальной защиты населения Московской области и подведомственных учреждений...
Тезаурусы в задачах информационного поиска icon Общая характеристика информационного ресурса
Целью оказания услуг является формирование и сопровождение картографического информационного ресурса «Шельфовые проекты» (далее ир...
Тезаурусы в задачах информационного поиска icon Отчёт о результатах деятельности отдела загс администрации Лужского...
Во исполнение поручения главы администрации Лужского муниципального района Малащенко Олега Михайловича предоставляем отчет о результатах...
Тезаурусы в задачах информационного поиска icon Инструкция по поиску и спасанию в зоне авиационно-космического поиска...
Организация поисково-спасательного обеспечения полетов в Южной зоне авиационно-космического поиска и спасания (акпс)
Тезаурусы в задачах информационного поиска icon Универсальный телевизионный пульт дистанционного управления
«умного» поиска и сохранения канала, что избавляет вас от необходимости поиска и сохранения каналов вручную. Своевременная замена...
Тезаурусы в задачах информационного поиска icon Инструкция по работе с программным комплексом единого информационного ресурса
При входе в программный комплекс единого информационного ресурса (далее – пк еир) пользователю необходимо пройти авторизацию в меню,...
Тезаурусы в задачах информационного поиска icon Регламент информационного взаимодействия
Настоящий Регламент информационного взаимодействия (далее Регламент) разработан в целях реализации требований следующих документов:...
Тезаурусы в задачах информационного поиска icon Приказ от 3 июня 2014 г. N 148 об утверждении требований к подготовке...
Федеральных авиационных правил поиска и спасания в Российской Федерации, утвержденных постановлением Правительства Российской Федерации...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск