Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд


Скачать 29.42 Kb.
Название Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд
Тип Документы
rykovodstvo.ru > Руководство эксплуатация > Документы
В.Н. МИНАЕВ

Научный руководитель - Н.П. ВАСИЛЬЕВ, к.т.н., доцент

Национальный исследовательский ядерный университет «МИФИ»
ПРОБЛЕМЫ ПРИМЕНЕНИЯ ТЕХНОЛОГИИ CUDA ДЛЯ УЛУЧШЕНИЯ ВРЕМЕНИ ВЫПОЛНЕНИЯ ТРУДОЕМКИХ ИТОГОВЫХ SQL-ЗАПРОСОВ В РЕЛЯЦИОННЫХ СУБД
В данной статье приведено описание итогового SQL-запроса, проблем с его производительностью в реляционных СУБД типа OLAP. Рассмотрены проблемы применения технологии CUDA для повышении его производительности.
Итоговый запрос – это запрос, в котором требуется узнать одно или несколько значений, которые подытоживают информацию, содержащуюся в базе данных[1]. Он используется в реляционных базах данных интеллектуальных ресурсов предприятия – OLAP, которые характеризуются большими размерами таблиц миллионы или миллиарды строк. В нем используются агрегирующие функции: SUM(), AVG(), MIN(), MAX(), COUNT(), COUNT(*) [1], которым для получения результата нужна обработка всего массива данных при помощи простых алгебраических действий и сравнений.

В реляционных СУБД типа OLAP всегда происходит 100%-ная выборка данных из таблицы в одном запросе, вследствие чего выполнение может затягиваться на несколько часов и значительно загружать аппаратные средства выполнения системы. Производители реляционных СУБД вкладывают огромные средства в оптимизацию своих продуктов [1], но технологии параллельной обработки данных используются мало. Чаще всего используются SIMD системы, которые делят выполнение запроса между ядрами центрального процессора (далее CPU). Но у CPU небольшое число ядер, количество используемых арифметико-логических устройств (далее ALU) в ядрах мало, так как большую часть их площади занимает кэш-память. В связи с этим при запуске итогового запроса на большом количестве записей (более миллиона) количество ядер не достаточно для его быстрого выполнения.

Концепция технологии параллельных вычислений от NVIDIA (далее CUDA) отводит графическому процессору (далее GPU) роль массово-параллельного сопроцессора, который обладает сотнями и тысячами вычислительных ядер и может выполнять простые алгебраические действия и сравнения данных в разы быстрее чем CPU [2]. В соответствии с этим его можно использовать для ускорения производительности операций с участием функций агрегирования.

Применение CUDA для уменьшения времени выполнения трудоемкого итогового SQL-запроса несет в себе ряд проблем:

  • сложность проектирования, какую память GPU использовать из-за наличия иерархии памяти [3];

  • сложность определения момента, когда надо задействовать GPU, так как при малых объемах данных GPU проигрывает в быстродействии CPU из-за большой латентности (400 – 800 тактов) [2] глобальной памяти, через которую осуществляется взаимодействие между CPU и GPU;

  • отсутствие прикладного API для организации взаимодействия СУБД + CPU + GPU;

  • необходимость доработки имеющихся алгоритмов по обработке данных для повышения производительности и организации взаимодействия СУБД + CPU + GPU;

  • отсутствие классификации методов параллельной обработки данных СУБД на GPU;

  • малый объем памяти GPU видеокарт по сравнению с оперативной памятью сервера;

На сегодняшний день существуют работы, в которых рассматривали повышение быстродействия операций СУБД, решающие часть перечисленных проблем с итоговыми запросами [3]. Но все они реализованы на базе виртуальных машин или прямого размещения базы данных в памяти GPU - это ведет к сильному изменению структур существующих СУБД или создает сильную зависимость от размера памяти графического ускорителя. Поэтому необходимо провести исследование применяемости CUDA, как сопроцессора, на который данные передаются без использования выше приведенных способов, и создать классификацию методов и средств параллельной обработки данных трудоемких итоговых SQL-запросов.
Список литературы


  1. Джеймс Р. Грофф, Пол Н. Вайнберг, Эндрю Дж. Оппель SQL: Полное руководство 3-е изд.: Пер. С англ. - М.: ООО “И.Д. Вильямс”, 2015 – 960 с.

  2. А.В. Боресков, А.А. Харламов, Н.Д. Марковский и др. Предисл.: В.А. Садовничий. Параллельные вычисления на GPU. Архитектура и программная модель CUDA: Учеб. Руководство. - М.: Издательство Московского университета, 2012 – 336 с.

  3. Peter Bakkum and Kevin Skadron. Accelerating SQL Database Operations on a GPU with CUDA: Department of Computer Science University of Virginia, 2010 – 10 с.

Похожие:

Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Структура программы на pl/sql
Он представляет собой расширение языка sql и предназначен для работы с субд oracle
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Можливості sql-запитів у Microsoft Access
Формирование и выполнение запросов в реальном времени (инструментарий Visual Basic For Applications)
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Руководство по репликации для субд ms sql server содержание
Данный документ является подробным справочным пособием, описывающим репликацию в системе Terrasoft crm x25 под ms sql server
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon М. Е. Жуковский, Р. В. Усков о применении графических процессоров...
В работе рассмотрены основы применения технологии nVidia© cuda для распараллеливания вычислений с использованием графических процессоров....
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Методические рекомендации по использованию sql-ориентированных заданий,...
В большинстве существующих субд имеются встроенные интерфейсы, в которых пользователь явным образом не использует операции структурированного...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Руководство по установке MedWork
Субд использует Microsoft sql server 2008 и более новые версии. Программа установки адаптирована к ms sql server 2014 Express (с...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon План лекции Язык sql в субд. Структура команды sql. Типы данных. Выражения
База данных (БД) – это информационная модель объекта – именованная совокупность данных, отображающая состояние объектов, их свойства...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Руководство по установке MedWork Общие сведения 2
Субд использует Microsoft sql server 2008 и более новые версии. Программа установки адаптирована к ms sql server 2014 Express (с...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Методические указания по выполнению лабораторной работы «Технология...
Технология cuda разработана компанией Nvidia. Фактически cuda позволяет включать в текст Си программы специальные функции. Эти функции...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Инструкция по установке Microsoft sql server 2005 Express Edition
Важно! Мы настоятельно рекомендуем использовать английские версии ms sql server 2005 Express Edition и Microsoft sql server Management...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Для выполнения обновления программы самсон-виста необходимо: Необходимо...
Необходимо скачать обновления базы данных в формате sql (*. sql) и обновление программы (*. exe)
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Руководство по повышению производительности служб Analysis Services...
Сводка: в этом техническом документе приводится описание того, как разработчики приложений могут применять методы повышения производительности...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Пояснительная записка XXI век век высоких технологий. Это стало девизом...
Это стало девизом нашего времени. В современном мире знания о технологии различных процессов, культура выполнения технологических...
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Берлинский сравнительный тест для субд с языком запросов sparql (справочные материалы)
Российский офис Консорциума W3C при поддержке Центра семантических технологий ниу вшэ, 2012
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Лабораторная работа №1
Изучение пользовательского интерфейса базы данных (БД) Oracle Database 11g Express Edition и конструирование sql-запросов
Проблемы применения технологии cuda для улучшения времени выполнения трудоемких итоговых sql-запросов в реляционных субд icon Литература: Дейт К. Введение в системы баз данных, 8-е издание. Вильямс, 2006
Субд; 3 оптимального доступа к данным с использованием субд. 4 нереляционная форма хранения данных. 5 Современные технологии доступа...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск