Министерство образования и науки РФ
Федеральное государственное бюджетное образовательное учреждение высшего образования
Уфимский государственный авиационный технический университет
Лабораторный практикум
по учебной дисциплине
распределенная обработка экономической информации
Уфа 2017
Составители: ______________ Р.Р. Еникеев
Рассмотрено на заседании кафедры
Автоматизированных систем управления
« 23 » января 2016 г. (протокол № 5 )
Заведующий кафедрой
___________ д.т.н., профессор В.В.Антонов
Рассмотрено на заседании научно-методического Совета по направлению 09.03.03 «Прикладная информатика»
« 17» января 2017г. (протокол № 12 )
Председатель научно-методического Совета
____________ д.т.н., профессор В.В.Антонов
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное
учреждение высшего образования
Уфимский государственный авиационный технический университет
ОБРАБОТКА РАСПРЕДЕЛЕННОЙ
ИНФОРМАЦИИ
НА ОСНОВЕ XML И DB2.
СОЗДАНИЕ И ВЕДЕНИЕ XML-ДАННЫХ
Лабораторный практикум
по дисциплине «Распределенная обработка
экономической информации»
Уфа 2017
Министерство образования и науки Российской Федерации
Федеральное государственное бюджетное образовательное
учреждение высшего образования
Уфимский государственный авиационный технический университет
Кафедра автоматизированных систем управления
ОБРАБОТКА РАСПРЕДЕЛЕННОЙ
ИНФОРМАЦИИ
НА ОСНОВЕ XML И DB2.
СОЗДАНИЕ И ВЕДЕНИЕ XML-ДАННЫХ
Лабораторный практикум
по дисциплине «Распределенная обработка
экономической информации»
Уфа 2017
Составители:
Р. Р. Еникеев, Г. В. Старцев, Г. Р. Шакирова, А. М. Шамсиева
УДК 681.3.06 (07)
ББК 32.973-018.2 (я7)
Обработка распределенной информации на основе XML и DB2. Создание и ведение XML-данных: лабораторный практикум по дисциплине "Распределенная обработка экономической информации" для направления 09.03.03 – Прикладная информатика/ Уфимск. гос. авиац. техн. ун-т; Сост.: Р. Р. Еникеев, Г. В. Старцев, Г. Р. Шакирова, А. М. Шамсиева. – Уфа, 2017. – 47 с.
Рассматриваются основные принципы применения технологии PureXML для создания, ведения и поиска XML-данных в СУБД IBM DB2 – от создания, хранения, ведения и индексирования XML-данных до программирования XML-ориентированных запросов для получения иерархий данных и атомарных значений.
Пособие предназначено для студентов направления 09.03.03 «Прикладная информатика» с целью закрепления навыков, полученных при изучении курса «Распределенная обработка экономической информации».
Ил. 32. Библиогр.: 8 назв.
Рецензенты: канд. техн. наук, доц. А. Н. Набатов,
канд. техн. наук, доц. Н. И. Федорова
© Уфимский государственный
авиационный технический университет, 2017
СОДЕРЖАНИЕ
Введение
|
2
|
Вводные замечания
|
4
|
Лабораторная работа 1
XML-документы. создание, валидация и загрузка в DB2
|
1. Цель работы
|
6
|
2. Задачи
|
8
|
3. Теоретическая часть
|
8
|
4. Описание программного комплекса
|
12
|
5. Методика выполнения работы
|
12
|
6. Задание на лабораторную работу
|
35
|
7. Контрольные вопросы
|
35
|
8. Содержание и оформление отчета
|
35
|
Лабораторная работа 2.
XML-данные в DB2. модификация, удаление, индексация
|
1. Цель работы
|
35
|
2. Задачи
|
36
|
3. Теоретическая часть
|
36
|
4. Методика выполнения работы
|
39
|
5. Задание на лабораторную работу
|
46
|
6. Контрольные вопросы
|
46
|
7. Содержание и оформление отчета
|
46
|
Список литературы
|
47
|
ВВЕДЕНИЕ
В настоящее время распределенная обработка данных является важной задачей для успешного функционирования автоматизированных информационных систем предприятий. Количество собираемых, обрабатываемых и анализируемых данных постоянно возрастает вместе с требованием к усовершенствованию технологий хранения и управления данными. Все эти данные представляют собой информационный ресурс, который имеет ключевое значение для получения конкурентного преимущества предприятия. Успешное и оптимальное управление данными требует все более активного использования современных технологий работы с данными.
Одной из таких технологий является XML. Расширенный язык разметки (eXtensible Markup Language, XML) широко распространен как платформо-независимый формат представления данных. Применяется для обмена информацией между различными слабосвязанными системами. XML все больше используется в приложениях уровня предприятия для моделирования частично структурированных и неструктурированных данных. Внешним представлением сообщений на реляционном языке является набор двухмерных таблиц. Внешним представлением сообщений на языке XML является набор реальных документов (и электронных, и бумажных), визуализация которых происходит при помощи универсального браузера.
В настоящее время XML становится обязательным элементом структур хранения данных. XML-документ является информационным объектом и экземпляром одного из классов, содержащихся в XML-ориентированной базы данных (БД). XML-ориентированные БД используют в качестве модели данных XML-модель данных. XML-ориентированные БД обеспечивают существенно более высокую скорость выполнения транзакций, в том числе через интернет, что обусловлено меньшими затратами на преобразование данных и эффективным способом управления памятью. Также XML-ориентированные БД характеризуются высокой скоростью разработки приложений, что обусловлено унификацией данных, методами их обработки и способом их представления.
Существуют методы хранения XML-данных: реляционные БД; прирожденные (native) XML-БД.
Прирожденная XML БД основана на использовании внутреннего представления XML в отличие от XML-надстроек над существующими реляционными БД, в которых реализована XML-надстройка в соответствии со стандартом доступа SQL-2003.
DB2 — семейство систем управления реляционными базами данных, выпускаемых корпорацией IBM. IBM DB2 является мощной СУБД, которая имеет эффективную и надежную платформу, для построения приложений. Современные версии DB2 обеспечивают расширенную поддержку использования данных в формате XML, в том числе операции с отдельными элементами документов XML. Поддержка XML в DB2 предлагает эффективные и универсальные возможности для управления вашими данными XML (XML-данные хранятся и запрашиваются в их собственном иерархическом формате).
ВВОДНЫЕ ЗАМЕЧАНИЯ
В курсе лабораторных работ в качестве сквозного примера рассматривается база данных «Labs». Она представлена единственной таблицей «Student_progress» (успеваемость студентов) с четырьмя столбцами. Структура таблицы и типы данных ее столбцов приведены в таблице 1:
Таблица 1
Student_progress
ID
|
STUDENT
|
SUBJECT
|
RESULT
|
int
|
xml
|
xml
|
xml
|
В каждый из XML-столбцов загружается свой XML-документ. Для хранения документов следует предварительно создать следующую структуру директорий: общая папка Labs → в ней – три вложенных директории: STUDENTS (для XML-файлов о студентах), SUBJECTS (для XML-файлов о дисциплинах), RESULTS (для XML-файлов об успеваемости). Нотация предполагает представление XML-элементов в виде прямоугольников с закругленными углами.
Концептуальные схемы XML-документов представлены на рис. В1.
Рисунок В1 – Концептуальные схемы XML-документов
(для методики выполнения работы)
В рамках лабораторных работ студенты должны ориентироваться на XML-документы, описывающие порядок закупки компьютерного оборудования. Для этого должны быть введены две XML-структуры, схемы которых представлены на рис. В2. Первая структура представлена элементом Equipment (оборудование), описывающим такие реквизиты оборудования, как идентификатор (eqID), название (eqName), параметры (Parameter) и производителя (Production). Последние два реквизита имеют сложную структуру и представлены дочерними элементами Name и Value (название и значение параметра оборудования) и Name и Status (название и статус изготовителя).
Вторая XML-структура показывает итерации покупки оборудования из первой структуры. Каждая итерация задается элементом Item внутри корневого элемента Purchase (покупка) и характеризуется идентификатором (элемент ID), датой (элемент Date), количеством (элемент Quantity), ценой за единицу (элемент Price per Unit), покупателем (элемент Client с дочерними элементами Name и Contacts).
Рисунок В2 – Концептуальные схемы XML-документов
(для задания на лабораторные работы)
Для выполнения заданий рекомендуется создать структуру вложенных директорий по аналогии с такой структурой в методике выполнения заданий. Аналогичным образом база данных должна быть представлена таблицей Sales с идентифицирующим полем ID и двумя XML-полями Equipment и Purchase.
Лабораторная работа № 1, 2
XML-ДОКУМЕНТЫ.
СОЗДАНИЕ, ВАЛИДАЦИЯ И ЗАГРУЗКА В DB2
1. Цель работы
Целью работы является изучение принципов создания XML-документов, их загрузки и использования в СУБД IBM DB2.
2. Задачи
Задачами лабораторной работы являются овладение навыками создания XML-документов с использованием стандартных текстовых и специфических XML-редакторов и разработки XML-ориентированных баз данных в СУБД DB2.
3. Теоретическая часть
XML – аббревиатура от «Extensible Markup Language» (расширяемый язык разметки). XML основан на хорошо известной разметке XML, однако не является заменой ей. Вообще говоря, XML и HTML создавались с разными целями: XML используется для описания данных, а HTML – для их визуализации.
Важно помнить, что XML сам по себе ничего не делает: это не язык программирования, а язык разметки, предназначенный для структурирования, хранения и передачи информации.
Расширяемость XML означает возможность введения своих собственных тегов, в отличие от HTML, где автор может использовать только те теги, которые определены в стандарте HTML (например,
или
|