Скачать 1.89 Mb.
|
ИННОВАЦИОННАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА федеральное агентство по образованию ГОУ ВПО «Уральский государственный технический университет – УПИ имени первого президента России Б.Н. Ельцина» А.Я. Купряжкин, К.А. Некрасов, Поташников С.И. Системы и технологии управления параллельными вычислениями Курс лекций Научный редактор – доктор ф.-м. н., проф. Купряжкин А.Я. Екатеринбург 2008 УДК 669 (017.3) Купряжкин А.Я., Некрасов К.А., Поташников С.И. К92 Физическое и математическое моделирование: курс лекций / А.Я. Купряжкин, К.А. Некрасов, С.И. Поташников. Екатеринбург: УГТУ-УПИ, 2008. 197 с. В курсе лекций изложены основные методики высокоскоростного параллельного моделирования на графических процессорах, методы компьютерного моделирования процессов массопереноса в реакторных материалах, включающие методы численного решения дифференциальных уравнений, молекулярной динамики для моделирования свойств реакторных материалов. Продемонстрированы возможности указанных методов для расчета коэффициентов диффузии, дефектообразования, структурного разупорядочения и межчастичных взаимодействий в реакторных материалах и их структурных аналогах. Курс предназначен для подготовки магистров по специальности 140305 «Ядерные реакторы и энергетичеcкие установки» (направление 140300 «Ядерная физика и технологии»). Научный редактор – доктор ф.-м. н., проф. Купряжкин А.Я.
Оглавление ВВЕДЕНИЕ 8 1. Архитектура и принципы работы обычных ЭВМ с центральным процессором (CPU) 10 1.1. Структура традиционной ЭВМ 10 1.2. Организация работы ЭВМ 14 1.3. Иерархия памяти компьютера 14 1.4. Выполнение команд 25 1.5. Требования к коммуникационным линиям 25 1.6. Устройства ввода-вывода 26 2. Методы повышения производительности традиционных ЭВМ 28 2.1. Распараллеливание расчетов 28 2.2. Конвейерная обработка данных и команд 29 2.3. Высокопроизводительные процессоры 31 2.3.1. Суперскалярные процессоры 31 2.3.2. Процессоры RISC с сокращенным набором команд 32 2.3.3. Процессоры со сверхдлинным командным словом 35 2.3.4. Векторные процессоры 37 2.3.5. Процессоры для параллельных компьютеров 38 2.3.6. Процессоры с многопоточной архитектурой 38 2.3.7. Технология Hyper-Threading 40 2.4. Требования к памяти высокопроизводительных ЭВМ 41 2.5. Коммуникационная сеть высокопроизводительных ЭВМ 41 2.5.1. Статические и динамические топологии и маршрутизация коммуникационных систем 41 2.5.2. Многокаскадные сети и методы коммутации 42 2.6. Классификация архитектур параллельных компьютеров 43 3. Типы архитектур высокопроизводительных вычислительных систем 46 3.1. SIMD архитектура (с разделяемой и распределенной памятью) 46 3.2. MIMD архитектура с разделяемой и распределенной памятью 47 3.3. Комбинированные системы 50 3.4. Мультипроцессорные и мультикомпьютерные системы 52 3.5. Кластеры ПЭВМ и рабочих станций 52 3.6. Особенности параллельного программирования 57 4. Потоковые параллельные вычисления для физического моделирования 63 4.1. Общие принципы распараллеливания расчётов 63 4.2. Обмен данными между процессором и памятью 65 4.3. Графические процессоры как вычислительные системы для поточно-параллельных расчётов 66 4.3.1. Вычислительные возможности центральных процессоров общего назначения и графических процессоров 66 4.3.2. Графический конвейер 69 4.3.3. История программируемости графических процессоров 70 4.3.4. Требования к алгоритмам для GPU, поддерживающих шейдерную модель 3.0 73 4.3.5. Возможности GPU в рамках шейдерной модели 3.0 и взаимодействие GPU с памятью 77 4.3.6. Проблема одинарной точности 79 4.4. Средства программирования графических процессоров 79 4.4.1. Общая структура программы для физического моделирования на графическом процессоре 79 4.4.2. Необходимое программное обеспечение 81 4.5. Области использования графических процессоров 82 5. Применение графических процессоров на примерах сложения матриц и решения дифференциальных уравнений 83 5.1. Распараллеливание независимых вычислений 83 5.2. Используемый графический процессор 85 5.3. Представление данных для графического процессора 85 5.4. Программирование вычислительного ядра 88 5.5. Взаимодействие центрального и графического процессоров 92 5.5.1. Функции центрального процессора 92 5.5.2. Пример программы 93 6. Молекулярная динамика на графическом процессоре 101 6.1. Принципы моделирования ионных кристаллов методом молекулярной динамики 101 6.2. Программирование графического процессора для расчёта действующих на ионы результирующих сил 104 6.2.1. Исходные данные 104 6.2.2. Представление исходных данных для GPU 105 6.2.3. Алгоритм расчёта результирующих сил с использованием графического процессора 106 6.2.4. Шейдер для расчёта результирующей силы 108 6.3. Исполнение шейдера из программы МД-моделирования на C# 111 6.3.1. Этапы алгоритма моделирования, исполняемые на CPU 111 6.3.2. Процедуры на C#, обеспечивающие работу с графическим процессором 113 6.4. Постановка граничных условий и стабилизация макросостояния молекулярно-динамической системы 120 6.4.1. Компенсация импульса и момента импульса 120 6.4.2. Стабилизация температуры 122 7. Высокоскоростное моделирование систем с дальнодействием 126 7.1. Актуальность моделирования 126 7.2. высокоскоростные алгоритмы моделирования систем с дальнодействующими силами 127 7.3. Методика высокоскоростного молекулярно-динамического моделирования диоксида урана 138 7.4. Экспериментальные результаты и их обсуждение 140 7.5. Анализ зависимостей среднего квадрата смещений ионов кислорода от времени 141 8. Восстановление потенциалов межчастичных взаимодействий по температурной зависимости периода решетки методами высокоскоростного МДМ на графических процессорах 147 8.1. Задача восстановления потенциалов межчастичных взаимодействий в кристаллах 147 8.2. Исходные данные и метод восстановления потенциалов 147 8.3. Модель и детали реализации 150 9. Базовые особенности программирования графических процессоров шейдерной модели 4.0 162 9.1. Предпосылки появления новой шейдерной модели 162 9.2. Архитектура GPU шейдерной модели 4.0. Преимущества этой модели 163 9.2.1. Иерархия вычислительных блоков и памяти в шейдерной модели 4.0 164 9.2.2. Конвейерная обработка данных на GPU SM4 166 9.2.3. Логическая структура вычислений на GPU SM4 167 9.2.4. Преимущества GPU шейдерной модели 4.0 167 9.3. Средства высокоуровневого программирования GPU шейдерной модели 4.0 168 9.3.1. Совместимость с шейдерной моделью 3.0 168 9.3.2. Специальные средства программирования GPU SM4. CUDA 169 9.3.3. Средства для написания и компиляции программ на CUDA 170 9.3.4. Структура программы на CUDA 171 9.4. Перемножение матриц на CUDA 171 9.4.1. Алгоритм перемножения матриц 171 9.4.2. Процедура перемножения матриц на GPU SM4 174 9.4.3. Вызов процедуры перемножения матриц из программы на C 179 9.5. Молекулярная динамика на CUDA 180 9.5.1. Алгоритм с использованием разделяемой памяти 180 9.5.2. Расчёт сил на GPU с использованием 3-го закона Ньютона 180 Библиографический список 185 Приложение 1 Операторы и функции языка HLSL, использованные в курсе лекций 190 П.1.2. Типы данных 190 П.1.2. Встроенные функции 190 П.1.3. Другие операторы и выражения 190 П.1.4. Системные переменные 191 Приложение 2 Процедуры CUDA, исполняемые на CPU 192 |
Российской Федерации Федеральное агентство по образованию Московский... Учебно-методическое объединение по образованию в области автоматизированного машиностроения (умо ам) |
Науки Российской Федерации Федеральное Агентство по Образованию Государственное... Федеральное Агентство по Образованию Государственное Общеобразовательное Учреждение Высшего Профиля |
||
Федеральное агентство по образованию государственное образовательное учреждение Рабочая программа составлена на основании Государственного образовательного стандарта высшего профессионального образования по направлению... |
Федеральное агентство по образованию Государственного образовательного учреждения высшего профессионального образования |
||
Федеральное агентство по образованию Филиал государственного образовательного учреждения высшего профессионального образования |
Российской Федерации Федеральное агентство по образованию федеральное... Т. М. Халина, М. И. Стальная, С. Ю. Еремочкин электрооборудование малых урбанических форм. – Учебное пособие для студентов специальности... |
||
Российской Федерации Федеральное агентство по образованию Рабочая программа составлена на основании Государственного образовательного стандарта высшего профессионального образования по специальности... |
Российской Федерации Федеральное агентство по образованию Федеральные органы управления образованием, образовательные учреждения, программы и проекты 3 |
||
Федеральное агентство по образованию Изучение влияния педагогических условий на степень сформированности мотивации у школьников предпрофильных классов |
Российской Федерации Федеральное агентство по образованию Санкт-петербургский государственный университет информационных технологий, механики и оптики |
||
Российской Федерации Федеральное агентство по образованию Фгу «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций» |
Российской Федерации Федеральное агентство по образованию Общее количество студентов, с которыми работает кафедра финского языка |
||
Российской Федерации Федеральное агентство по образованию Фгу «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций» |
Федеральное агентство по образованию сахалинский государственный университет Рассмотрена и рекомендована к утверждению Методической комиссией факультета математики, физики и информатики |
||
Федеральное агентство по образованию утверждаю Государственное образовательное учреждение высшего профессионального образования "Санкт-Петербургский государственный архитектурно-строительный... |
Федеральное агентство по образованию ... |
Поиск |