Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет


Скачать 1.63 Mb.
Название Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет
страница 2/24
Тип Учебно-методическое пособие
rykovodstvo.ru > Руководство эксплуатация > Учебно-методическое пособие
1   2   3   4   5   6   7   8   9   ...   24

Часть 1. Полнотекстовые базы данных


В конце 20-го века информация становится одним из главных ресурсов человечества. Одно из определений 21-го века - век информации. Поэтому создание, сохранение, эффективное использование, развитие информационных ресурсов является одной из основных задач общества и государства.

Благодаря бурному развитию средств передачи данных, компьютерной техники, программного обеспечения, Интернет уже сегодня существуют множество баз данных (БД), в том числе полнотекстовых, на CD-ROM' ах и в Интернет, в сети находятся также огромное число страниц книг, газет, журналов, и их количество растет. Но уже сейчас имеются проблемы рационального использования информации - нет унифицированного доступа к ней, разнообразны способы ее хранения и распространения.

Виртуальная среда, обеспечивающая быстрый и надежный доступ к ресурсам, позволила первыми оценить преимущества Интернет компании, специализирующейся на производстве и продаже различного рода баз данных. Созданием подобных баз с начала 80-х годов занималось множество зарубежных корпораций, главным продуктом которых была информация. Существовали фактографические базы данных, содержащие фактические сведения (прежде всего статистику), библиографическую информацию (сведения о документах) и полнотекстовые (полные тексты книг и статей из газет, журналов и сборников). Среди наиболее известных производителей и поставщиков баз данных в "доинтернетовский" период выделялись LEXIS/NEXIS, Dialog, Silver Platter, EBSCO Information Services, STN Internetional, H.W.Wilson, UMI (ныне ProQuest). Информационные продукты доставлялись пользователям на магнитных лентах, посредством модемной связи, а со второй половины 80-х годов - на CD-ROM.

Из всего перечня представленных в сети информационных продуктов наибольший интерес представляют полнотекстовые базы данных - текстовые базы первичных данных, содержащие полные тексты документов (ГОСТ 7.73—96). В них содержатся тексты книг, статей из журналов, газет и сборников, сообщения информационных агентств, аналитические отчеты различных учреждений и другие документы. Документом, в свою очередь, является единица хранения информации в полнотекстовой базе данных, представляющая собой логически завершенную часть данных о событиях и фактах имеющих информационный характер, литературно-публицистические произведения или логически завершенные части таких произведений, статьи, обзоры и проч. Документ имеет однородную структуру и является текстовым файлом.

Число и отраслевой спектр полнотекстовых электронных собраний постоянно расширяется. Если в 60-е годы их создание начиналось с правовой и экономической областей, в 80-90-е года были освоены естественные, точные и наиболее динамично развивающиеся гуманитарные дисциплины, то в настоящее время очередь дошла до коллекций редких и старопечатных книг, полных собраний сочинений античных и средневековых авторов, поэтических антологий и подобных этому материалов.

Какие печатные издания переводятся в электронную форму? С одной стороны, это редкие и старые издания, региональные издания. С другой стороны, это книги наибольшего читательского спроса - энциклопедии, словари, учебная литература, художественная литература. В Интернет и в базы данных оперативно вводятся документы государственных органов - законы, постановления, инструкции и т.д. Научных и технических изданий в Интернет немного, но в Интернет и на CD-ROM'ах есть доступ к коллекциям научно-технических и медицинских журналов.

Полнотекстовые тематические ресурсы на своих страницах размещают многие институты, организации, а также частные лица, по различным отраслям - экономике, политике, сельскому хозяйству, медицине, педагогике, психологии, философии, религии, лингвистике, литературоведению, культурологии, истории, мифологии и т.д.

Разнообразны ресурсы по культуре - сказки, мифы, художественные альбомы, выставки.

Возможности электронных ресурсов позволяют по-новому представить религиозную литературу - есть возможность поиска по любому слову из Библии или Корана.

Среди учебных ресурсов - один из самых популярных сегодня - база данных рефератов, курсовых, дипломов. Эта база данных существует и на CD-ROM'ах, и ежедневно пополняется через Интернет более чем на 100 адресах.

Для традиционных библиотек получение доступа к полнотекстовым базам в значительной степени меняет подходы к информационной работе в целом, так как позволяет пользователям обходиться без обращения к печатным оригиналам изданий, и, следовательно, избавляет потенциальных клиентов от необходимости физического посещения библиотек.

Каждую секунду в сети появляются новые материалы, какая-то их часть по разным причинам удаляется с серверов, другая - меняет адресацию. Это постоянное обновление с одновременным ростом объема информационного массива делает крайне сложным учет всех или, по крайней мере, большинства документов, существующих в Интернет. По оценкам, средний срок нахождения информации по конкретному адресу - полгода. На сегодняшний день насчитывается около 1 900 000 серверов в Интернет.

Таким образом, сведения, представляющие огромную ценность часто остаются невостребованными пользователями по единственной причине трудностей их разыскания. Ситуация в данном случае очень напоминает известную задачу поиска иголки в стоге сена. Важность проблемы информационного поиска в Интернет породила целую отрасль, задача которой заключается именно в том, чтобы помочь пользователю в его навигации в киберпространстве.

Средства поиска информации

Инструментов для поиска информации в Интернете, построенных на разных принципах и преследующих разные цели, существует немало.

Реализация поисковых систем всегда подразумевает следующие компоненты:

  • перемещение по сети (паук или кроулер), и сбор информации;

  • база данных (индекс), содержащая информацию, собираемую пауками;

  • поисковый механизм (интерфейс) для взаимодействия с базой данных;

  • упорядочивание (ранжирование) результатов поиска.

По принципу организации и использования поисковые системы Интернет подразделяются на:

  • поисковые машины (автоматические индексы);

  • каталоги (справочники, директории);

  • метапоисковые Web-узлы (которые посылают запросы сразу на несколько поисковых серверов).

Каждый из этих инструментов имеет определенные преимущества, а основная разница между ними заключается в участии или неучастии человека.

И поисковые машины, и каталоги могут быть общими или специализированными. Специализация в свою очередь может быть региональная или тематическая.

Каталоги ресурсов – глобальные, локальные, специализированные.

Каталоги являются справочниками, содержащими списки адресов Интернет, сгруппированные по определенным признакам. Как правило, они объединяются по тематике (наука, искусство, новости и т. д.), где каждая тема разветвляется на несколько подуровней, то есть имеют иерархическую структуру, перемещаясь по которой, можно найти нужный объект. Для пользователя получение информации о ресурсе из известного каталога всегда является некоторой гарантией достоверности.

Но, так как каталоги создаются вручную, они охватывают намного меньше ресурсов, чем поисковые машины.
Поисковые машины, или автоматические индексы – глобальные, локальные, специализированные.

Все поисковые машины, предназначенные для сети Интернет, имеют более или менее схожие принципы работы. Компактные копии документов, известных серверам поисковых систем, хранятся на локальном диске. Задача поисковых машин - вести поиск по ключевым словам из полных текстов web-документов, то есть проводить детальное максимальное разыскание информации в электронной вселенной.

В отличие от справочников, все они функционируют полностью в автоматизированном режиме, имеют одинаковый принцип деятельности и состоят из двух основных блоков. Первый блок представляет собой программу-робот, задача которого путешествовать с сервера на сервер, находить там новые или изменившиеся документы и передавать их на свой базовый компьютер.

Чаще всего роботы просматривают серверы самостоятельно, находя новые внешние ссылки, в уже обследованных документах, действуя, таким образом, по известной методике "снежного кома". Выявленные документы обрабатываются вторым блоком поисковых машин. При этом учитывается все содержание страниц, зачастую даже не только полный текст, но и наличие иллюстраций, аудио- и видео- файлов, Java-приложений.

Индексации подвергаются все слова в документе, что как раз и дает возможность использовать поисковые системы для детального поиска по самой узкой тематике. Выдача результатов осуществляется с помощью специальной подсистемы, которая производит интеллектуальное ранжирование результатов, опираясь в своих расчетах на местоположение термина, частоту его повторения в тексте, процентное соотношение данного термина с остальным текстом на данной странице. По этим параметрам среди внушительного числа поисковых систем выделяются несколько наиболее признанных, позволяющих выявлять информацию с высокой степенью полноты и надежности.

Из популярных средств русскоязычного поиска можно назвать серверы Яndex, Апорт и Rambler, индексирующие десятки тысяч серверов и десятки миллионов документов. Из зарубежных серверов популярны Altavista, Excite, Hotbot, Lycos, WebCrawler, OpenText.

Яndex - Поисковая машина последнего поколения, являющаяся к настоящему времени самой объемной: количество обследованных серверов превышает 239 434, а число учтенных оригинальных документов 30 879 447. Помимо серверов доменов "ru" и "su", Яndex индексирует содержание зарубежных русскоязычных web-узлов, а также серверов СНГ. Яndex безусловно располагает самой мощной и сложной системой составления запросов: пользователю предлагается несколько вариантов поиска, в которых легко запутаться. Более чем какие-либо другие системы, Яndex приспособлен для задания запросов на естественном русском языке. В этом случае запрос формируется путем простого ввода терминов или целой фразы в поисковую строку. Поисковый механизм сам производит расширения (падежи, числа, склонения), исключает "стоп-слова", анализирует расстояние терминов друг от друга и пр. В списке результатов ссылки снабжаются сведениями о том, есть ли в документе совпадение фразы или же все введенные термины.

Рамблер - единственный в российском Интернет портал, объединивший поисковую систему, рейтинг-классификатор, а также ряд бесплатных сервисов и информационных проектов. Ресурсы портала регистрируют ежесуточно более 3,5 млн. посещений, а ежемесячная аудитория Рамблера составляет 60-70% всех пользователей Рунета. Только поисковая система содержит информацию о более чем 12 миллионах документов, расположенных на серверах России и стран СНГ. Рамблер обрабатывает ежесуточно не менее 500 тысяч поисковых запросов (в среднем - 5 запросов в секунду), сканируя 48 тысяч web-серверов и используя несколько одновременно работающих программ-роботов. Все проекты Интернет-холдинга реализованы на базе собственных технологических разработок.

На сегодняшний день Апорт (http://www.aport.ru/) является одним из ведущих отечественных поисковых систем. Обновленная версия представляет собой медиа-портал нового поколения, сочетающий в себе девять информационно-развлекательных тематических разделов, каталог отобранных интересных ресурсов Интернет и ряд полезных сервисов, в числе которых поисковая машина Апорт, форумы, подписки и многое другое.

Создатели выработали четкую политику отражения материалов: учитываются российские или содержательно относящиеся к России ресурсы, а также сайты стран ближнего зарубежья, включая Прибалтику. К сервисным функциям системы относится возможность сортировки ссылок в рубриках по дате поступления в алфавите названий, по популярности, местоположению, доступности, а также по лиге, к которой относятся сайты.

Существуют "любительская", "профессиональная", "высшая" и "элитная" лиги, хотя во многом они представляют субъективный взгляд создателей каталога. Специальная функция "Тропы" позволяет получить нечто вроде обзора серверов конкретной тематики.

Другие поисковые системы и каталоги можно найти с помощью уже известных каталогов в разделах "Интернет - поисковые системы (каталоги)". Помимо универсальных поисковых серверов в Интернет уже существует множество тематических указателей ресурсов. Их также можно найти в соответствующих разделах. Например: "Деловой Интернет" (http://www.delovoy.spb.ru). Проект создавался как бизнес-центр, аккумулирующий в себе информацию о ресурсах Интернет по экономике, финансам, менеджменту, маркетингу. Проект рассчитан на всех, кто в той или иной мере интересуется вопросами экономики, менеджмента, маркетинга, ведет поиск партнеров по бизнесу. В рамках проекта действует каталог ссылок. Развивается и пополняется раздел, содержащий аналитическую информацию, статьи по экономике, менеджменту, маркетингу. Действует ежемесячная новостная рассылка (~600 подписчиков).

Полнотекстовые базы данных обеспечивают для клиентов высокий уровень сервиса. Поисковый механизм позволяет осуществлять многоаспектный поиск с возможностью сочетания данных из разных полей. Разыскание может осуществляться по отдельным словам, словосочетаниям и точным фразам. Результаты поиска выдаются в виде списка библиографических записей с указанием всех необходимых элементов. Существует возможность формирования из общего перечня списка релевантных документов.
1   2   3   4   5   6   7   8   9   ...   24

Похожие:

Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Российской Федерации Национальный фонд подготовки кадров Барнаульский...
Автоматизация работы библиотеки образовательного учреждения Сост.: Д. П. Тевс, В. А. Климентьева, В. А. Петров, Т. Н. Злобина, Г....
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Развитие региональной системы профессиональной подготовки туристских...
Гоу впо «Красноярский государственный педагогический университет им. В. П. Астафьева»
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Ханты-мансийского автономного округа югры «сургутский государственный...
Программа предназначена для лиц, сдающих вступительное испытание по образовательной программе высшего образования по направлению...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Министерство образования и науки российской федерации владивостокский...
Фонд оценочных средств для проведения промежуточной аттестации обучающихся по направлению подготовки
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Фгбоу впо «пермский государственный гуманитарно-педагогический университет»...
Разработано учебно-методическим управлением и отделом мониторинга и контроля качества подготовки специалиста фгбоу впо «Пермский...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Российской федерации федеральное государственное бюджетное образовательное...
«Саратовский национальный исследовательский государственный университет имени Н. Г. Чернышевского»
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Федеральный фонд обязательного медицинского страхования
И. И. Джанелидзе", гбоу впо "Северо-Западный государственный медицинский университет им. И. И. Мечникова" и гбоу впо "Санкт-Петербургский...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Донецкой Народной Республики Донецкий национальный медицинский университет...
Основная профессиональная образовательная программа подготовки кадров высшей квалификации
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Методическое пособие Рекомендовано Методическим Советом по аспирантуре...
Министерства здравоохранения Российской Федерации в качестве методических рекомендаций для обучающихся по программам подготовки научно-педагогических...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Российской федерации
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Пермский государственный...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Анализ эффективности реализации государственного плана подготовки...
Методология оценки эффективности учебной программы подготовки управленческих кадров 9
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Российской Федерации Российский государственный профессионально-педагогический...
Российскому государственному профессионально-педагогическому университету 25 лет. Трижды за свою историю университет получал новое...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Инструкция методическая (временная) Порядок выполнения выпускной...
«Российский государственный университет нефти и газа (национальный исследовательский университет) имени И. М. Губкина»
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Методические рекомендации сургут, 2015 ббк 74. 50р30 удк 376(07)...
Богатая О. Ф., старший научный сотрудник научно-исследовательской лаборатории инновационных образовательных технологий гоу впо хмао-югры...
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Фгбоу впо «пермский государственный гуманитарно-педагогический университет»
Гбоу впо «пермский государственный гуманитарно-педагогический университет» ( пггпу)
Российской Федерации Национальный фонд подготовки кадров Барнаульский государственный педагогический университет icon Российской Федерации Федеральное агентство по образованию
Государственное образовательное учреждение высшего профессионального образования «Государственный Национальный исследовательский...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск