Берлинский сравнительный тест для СУБД с языком запросов SPARQL
(справочные материалы)
Российский офис Консорциума W3C при поддержке Центра семантических технологий НИУ ВШЭ, 2012.
Базы данных RDF и технологии конвертации реляционных данных в RDF имеют относительно недолгую историю развития. При своей огромной гибкости в представлении моделей предметных областей эти СУБД имеют меньшую производительность по сравнению СУБД на реляционных структурах.
Для выявления лидеров был разработан Берлинский тест, Berlin SPARQL Benchmark (BSBM), который представляет собой тест сравнения производительности СУБД с языком запросов SPARQL. К таким системам относятся нативные RDF-хранилища, графовые хранилища, системы, отображающие реляционные данные в RDF, и любые другие SPARQL оболочки над другими видами источников данных.
Тестовый пакет построен вокруг сценариев электронной коммерции (e-commerce use case), когда различными производителями предлагается определенный перечень продуктов, а потребители дают различные отзывы об этих продуктах [1].
В апреле 2013 года были проведены очередные тесты RDF СУБД по версии BSBM V3.1, которые показали возрастающий потенциал и возможности таких СУБД [2].
Тесты рассчитаны на проведения либо на отдельном сервере, либо на серверном кластере. В тесте BSBM представлены три сценария, а именно, Explore Use Case, Explore and Update Use Case и Business Intelligence Use Case (Таблица ).
Таблица . Наборы данных BSBM для отдельной машины и кластера при различных сценариях тестирования
|
Отдельный сервер
|
Серверный кластер
|
Сценарии тестирования
|
Explore
|
BI
|
Explore & BI
|
Наборы данных, миллионы триплетов
|
100, 200, 1000
|
10, 100, 1000
|
10000, 50000, 150000
|
Описание структуры набора данных
Логическая схема данных теста BSBM состоит из восьми сущностей (классов), представленных на Рис. .
Рис. . Структура классов объектов BSBM
Класс Product, описывает продукты с наборами различных свойств и характеристик.
Название колонки
|
Тип колонки
|
Описание колонки
|
rdfs:label
|
literal: String
|
Визуальное имя
|
rdfs:comment
|
literal: String
|
Комментарий
|
rdf:type
|
resource: ProductType
|
ссылка на тип продукта
|
bsbm:producer
|
resource: Producer
|
ссылка на производителя продукта
|
bsbm:productPropertyTextual{1-6}
|
literal: String
|
от 1 до 6 текстовых свойств, некоторые являются опциональными
|
bsbm:productPropertyNumeric{1-6}
|
literal: Number
|
от 1 до 6 числовых свойств, некоторые являются опциональными
|
bsbm:productFeature
|
Resource: ProductFeature
|
ссылка на описание особенностей (свойств) продукта
|
dc:publisher
|
Resource:Producer
|
ссылка на производителя продукта
|
dc:date
|
literal: xsd:date
|
дата
|
Класс ProductType, описывает типы продуктов, которые образуют нерегулярную иерархию (3-5 уровней глубины).
Название колонки
|
Тип колонки
|
Описание колонки
|
rdfs:label
|
literal: String
|
Визуальное имя
|
rdfs:comment
|
literal: String
|
Комментарий
|
rdfs:subClassOf
|
resource: ProductType
|
Ссылка на вышестоящий по иерархии тип продукта
|
dc:publisher
|
Resource: StandardizationInstitution
|
ссылка на орган стандартизации
|
dc:date
|
literal: xsd:date
|
дата
|
Класс ProductFeature описывает набор возможных свойств, зависящий от вида продукта. Каждый продукт определенного типа имеет свой набор свойств продукта.
Название колонки
|
Тип колонки
|
Описание колонки
|
rdfs:label
|
literal: String
|
Визуальное имя
|
rdfs:comment
|
literal: String
|
Комментарий
|
dc:publisher
|
Resource: StandardizationInstitution
|
ссылка на орган стандартизации
|
dc:date
|
literal: xsd:date
|
дата
|
Класс Producer описывает производителя продукта.
Название колонки
|
Тип колонки
|
Описание колонки
|
rdfs:label
|
literal: String
|
Визуальное имя
|
rdfs:comment
|
literal: String
|
Комментарий
|
foaf:homepage
|
URL
|
Ссылка на сайт производителя
|
bsbm:country
|
ISO3166 country URI
|
Уникальный идентификатор страны производителя
|
dc:publisher
|
Resource: Producer
|
ссылка на производителя (самого себя)
|
dc:date
|
literal: xsd:date
|
дата
|
Класс Vendor описывает поставщика продукта.
Название колонки
|
Тип колонки
|
Описание колонки
|
rdfs:label
|
literal: String
|
Визуальное имя
|
rdfs:comment
|
literal: String
|
Комментарий
|
foaf:homepage
|
URL
|
Ссылка на сайт поставщика
|
bsbm:country
|
ISO3166 country URI
|
Уникальный идентификатор страны поставщика
|
dc:publisher
|
Resource:Vendor
|
ссылка на поставщика (самого себя)
|
dc:date
|
literal: xsd:date
|
дата
|
Класс Offer описывает предложение продукта, поставляемого поставщиком на рынок.
Название колонки
|
Тип колонки
|
Описание колонки
|
bsbm:product
|
resource: Product
|
Ссылка на продукт
|
bsbm:vendor
|
resource: Vendor
|
Ссылка на поставщика
|
bsbm:price
|
literal: price
|
Цена и валюта
|
bsbm:validFrom
|
literal: Date
|
Предложение актуально с этой даты
|
bsbm: validTo
|
literal: Date
|
Предложение актуально до этой даты
|
bsbm:deliveryDays
|
Literal: business days
|
Срок поставки в днях
|
bsbm:offerWebpage
|
URL of vendor's HTML page containing the offer
|
Ссылка на веб-страницу с предложением поставщика
|
dc:publisher
|
Resource:Vendor
|
ссылка на поставщика
|
dc:date
|
literal: xsd:date
|
дата
|
Класс Person описывает персону (ревьюера), которая составляет отзыв о продукте (оценку продукта).
Название колонки
|
Тип колонки
|
Описание колонки
|
foaf:name
|
literal: String
|
Имя персоны
|
foaf:mbox_sha1sum
|
literal: email address
|
e-mail персоны
|
bsbm:country
|
ISO3166 country URI
|
Уникальный идентификатор страны персоны
|
dc:publisher
|
Resource: RatingSite
|
ссылка на сайт, на котором происходит оценка
|
dc:date
|
literal: xsd:date
|
дата
|
Класс Review описывает отзыв, данный ревьюером продукту.
Название колонки
|
Тип колонки
|
Описание колонки
|
bsbm:reviewFor
|
resource: Product
|
Ссылка на рецензируемый продукт
|
rev:reviewer
|
resource: foaf:Person
|
Ссылка на персоны, которая оценили продукт
|
bsbm:reviewDate
|
literal: Date datatype
|
Дата выставления оценки
|
dc:title
|
literal: String
|
Заголовок оценки
|
rev:text
|
literal: String
|
Текст оценки
|
bsbm:rating1
|
literal: Number
|
Значение рейтинговой оценки, от 1 до 10. Опциональное свойство
|
bsbm:rating2
|
literal: Number
|
Значение рейтинговой оценки, от 1 до 10. Опциональное свойство
|
bsbm:rating3
|
literal: Number
|
Значение рейтинговой оценки, от 1 до 10. Опциональное свойство
|
bsbm:rating4
|
literal: Number
|
Значение рейтинговой оценки, от 1 до 10. Опциональное свойство
|
dc:publisher
|
Resource: RatingSite
|
ссылка на сайт, на котором происходит оценка
|
dc:date
|
literal: xsd:date
|
дата
|
|