Описательные метаданные
Большинство методов поиска информации не ищут реальные объекты в коллекциях, обычно они работают с описательными метаданными об этих объектах. Метаданные об объекте могут представлять собой каталожную запись, запись в индексе или реферат. Описательные метаданные обычно хранятся отдельно от описываемых объектов, но иногда они являются их частью.
Описательные метаданные обычно текстовые; однако можно использовать метаданные в иных форматах, например, изображения, звукозаписи, карты и компьютерные программы. Единый каталог может объединять записи обо всех видах материалов, носителей и форматов. Это позволяет пользователям электронной библиотеки находить материалы на любых носителях в ходе поиска по текстовым записям.
Описательные метаданные обычно создаются профессионалами. Библиотечные каталоги и научные индексы аккумулируют усилия подготовленных сотрудников, но можно найти более быстрый способ генерации метаданных, либо с использованием автоматического индексирования, либо с использованием компьютерных возможностей.
То, что пользователь видит как одно слово, может быть представлено в компьютере как комбинация файлов и структурных данных в разных форматах. Связи между этими компонентами и пользовательским восприятием объекта иногда называют "моделью объекта".
С точки зрения пользователя, журнальная статья, хранящаяся на веб-сервере, может быть представлена как связный текст с графикой; однако храниться она может как несколько текстовых файлов, несколько графических файлов и, возможно, некоторых программ. Одно изображение может сохраняться в разных видах: как высококачественный архивный образ, как изображение для повседневного использования среднего разрешения и еще раз как маленькая "иконка", которая дает общее представление об изображении, но утрачивает детали. Этот образ может обозначаться единым библиотечным идентификатором - но для компьютера это группа определенных файлов. Могут существовать множество версий одного и того же объекта. А электронные библиотеки часто имеют "приватные" версии тех материалов, которые готовятся для публичного доступа. После того, как они будут выставлены, могут потребоваться новые версии для исправления ошибок, или материалы могут быть реорганизованы или перенесены на другие компьютеры, или в результате технического прогресса появятся дополнительные форматы.
Структурные метаданные
Для представления различных компонентов и связей между ними используются структурные метаданные. Типы данных - это структурные метаданные, используемые для описания различных возможных объектов в электронной библиотеке.
Выбор структурных метаданных для конкретной категории материалов создает модель объекта.
Различные категории объектов требуют различных моделей объектов - например, текст в разметке SGML, объекты веб, компьютерные программы, оцифрованный звук. Для каждой категории правила и соглашения описывают способы организации такой информации в набор цифровых объектов.
Для каждой категории правила описывают представление материала в библиотеке, группировку компонентов как группы цифровых объектов, внутреннюю структуру каждого компонента, ассоциированные метаданные, соглашения по наименованиям цифровых объектов. Такие категории различаются по структурному типу.
Структурные типы могут различаться по жанрам (genres). В поисковых задачах метаописание по жанрам является вполне обычным. (Например, некоторые жанры популярной музыки - джаз, блюз, реп, рок.) Жанры - это естественный и полезный способ описания материалов для поиска и других библиотечных целей, но для управления распределенными электронными библиотеками требуется другая категоризация.
Хотя художественный фильм, документальная лента и учебное видео явно представляют различные жанры, их цифровые эквиваленты могут кодироваться и обрабатываться абсолютно одинаково; они имеют один и тот же структурный тип. И наоборот, два текста могут быть одного жанра, но если один представлен в разметке SGML, а другой - в формате PDF, то они имеют различные структурные типы и модели объектов. Например, карта, афиша, техническая диаграмма представляют различное содержание, но с точки зрения хранения и обработки в компьютере они представляют собой одну структуру. В настоящее время можно полагать, что даже сложные коллекции электронной библиотеки могут быть представлены небольшим числом структурных типов. Менее десяти структурных типов оказалось достаточно для адекватного описания всех категорий материалов, которые конвертировались в Библиотеке Конгресса. Среди них оцифрованные изображения, наборы изображений страниц, наборы изображений страниц со связанным SGML текстом, оцифрованные звукозаписи, оцифрованные видеозаписи.
Набор элементов метаданных нужен для тех, кто публикует электронные материалы с описанием своих результатов и для тех, кому структурные дополнительные элементы позволяют добиться большей точности в метаданных. Например, если поле "предмет" (subject) заполнялось с использованием Девеевского десятичного классификатора, было бы полезно отразить этот факт в метаданных. Для дальнейшего повышения эффективности метаданных при обработке информации, предлагается присваивать некоторым элементам некоторые "значения" (values). Это может быть определенный набор, список типов, которым могут руководствоваться составители индексов.
Языки разметки являются одним из таких методов структурирования текстов. К примеру, на HTML-странице тэг является структурным метаданным, который указывает на расположение изображения.
Одно из потенциальных применений языков разметки, вроде SGML или XML, в том, что структурные тэги могут использоваться программами автоматического индексирования для построения записей, для поиска информации. В тексте документа фраза "Marie Celeste" может быть именем человека, названием книги, песни, корабля, издательства, пьесы или вообще не являться именем. При наличии структурной разметки фраза может быть идентифицирована и помечена. Таким образом, информация, содержащаяся в разметке, может быть использована для различения различных категорий информации, таких как автор, название или дата.
Присоединение метаданных к содержанию
Описательные метаданные должны быть присоединены к материалу, который они описывают. В прошлом метаданные обычно хранились отдельно, как внешний каталог или индекс. В этом способе много достоинств, но требуются связи между метаданными и описываемыми объектами. Некоторые электронные библиотеки двигаются в ином направлении, сохраняя метаданные и данные вместе (либо встраивая метаданные с объект или в виде двух отдельных связанных объектов). Этот подход удобен для распределенных систем и для долговременного архивирования, поскольку гарантируется, что компьютерные программы будут иметь доступ к данным и метаданным в одно и тоже время.
Механизм ассоциирования метаданных с веб-страницами был предметом серьезного обсуждения. Для HTML-страниц простейший подход состоит в использовании специального HTML-тэга , который появился из описания элементов Dublin Core для HTML. Выбор тэгов - это системообразующее решение. В рамках проекта Dublin Core специально не определяется, каким именно образом метаданные связываются с материалом.
Предложенная технология предлагает в качестве базового стандарта для взаимодействия с сетью Интернет использовать формат метаданных Dublin Core, для изучения которого потребуется определенные усилия со стороны библиотек, но в остальном же, эта технология и разработанное программное обеспечение вписывается в рамки традиционной библиотечной работы.
|