Что такое findslide.org?

FindSlide.org - это сайт презентаций, докладов, шаблонов в формате PowerPoint.

Обратная связь

Презентация на тему Введение в параллельное программирование

Содержание

2. Содержание лекцииФормальный подход к определению параллельной программыМеры
3. Последовательное и параллельноеЗадача: a = b*c+d*e;Последовательная программа:Load
4. Представление алгоритма A, вычисляющего функцию FПредставление алгоритма
5. Реализация алгоритма A, представленного в форме S–
6. Последовательное и параллельное: резюмеЕсли множество реализаций алгоритма
7. Меры качества параллельной реализацииУскорение параллельной реализации относительно
8. Предел ускорения: Закон АмдалаЕсли P – это
9. Закон Амдала: диаграммаИзображение из Википедии
10. Иерархия параллельных вычислительных системМикропроцессорыSMP-узлы: объединения микропроцессоров над
11. От алгоритма к программе: взаимодействующие процессыПрограмма часто
12. Модель программирования в общей памяти
13. Модель программирования в разделенной памяти: обмен сообщениями
14. Пример параллельной программы в модели общей памяти:
15. Параллельное программирование в модели разделенной памяти: Message Passing Interface
16. Первый пример: идентификация процессов#include #include #include int
17. Взаимодействия точка-точка: MPI_Send, MPI_Recv if(size!=2){ std::cerr
18. MPI_SendrecvintBuff = 1234;std::cerr
19. Групповые взаимодействия: MPI_Bcast, MPI_Barrier int intBuff = rank; std::cerr
20. MPI_Reduce, MPI_Allreduce int intBuff = 0; std::cerr
21. Асинхронные взаимодействия точка-точка: MPI_Isend, MPI_Iresv int intBuff =
22. Другие функцииСбор распределенных векторов: MPI_Gather, MPI_AllgatherРаспределение вектора: MPI_Scatterи т.д.
23. “The standard includes:” (Section 1.7 of
24. Пример решения уравнения Пуассона явным методомДвумерное уравнение:d2u/dx2+d2u/dy2-a*u=fДискретизация:(u(i+1)j-2uij+u(i-1)j)/h2+ (ui(j+1)-2uij+ui(j-1))/h2-a*uij = fijИтеративный метод:un+1ij = 0.25(un(i+1)j+un(i-1)j+uni(j+1)+uni(j-1)-h2fij)
25. Декомпозиция задачиКак организовать коммуникации на разрезе?
26. Организация коммуникаций с помощью дополнительных слоевСоздается 2
27. О кластере НКС-30T nks-30t.sscc.ru32 двойных блейд-серверов HP
28. Работа на кластере НКС-30T1 Вход с помощью
29. Схема устройства кластераГоловной узелВысокоскоростная сеть«Медленная» сеть для управления и устройства общей файловой системыInternetВычислительные узлыМашина пользователя
30. Устройство скрипта запуска задачи run.sh#!/bin/bash #PBS -V
31. Скачать презентацию
32. Похожие презентации

Содержание лекцииФормальный подход к определению параллельной программыМеры качества параллельных программПредел ускорения вычислений при распараллеливанииРеализация параллельных программ в модели общей памяти и в модели распределенной памятиПрограммирование в распределенной памяти: MPIПример задачи: численное решение уравнения ПуассонаРабота на вычислительных

Главная
Информатика
Введение в параллельное программирование

Введение в параллельное программирование Максим ГородничевЛетняя школа отдела МО ВВС ИВМиМГ СО РАНhttp://ssd.sscc.ru

Содержание лекцииФормальный подход к определению параллельной программыМеры качества параллельных программПредел ускорения вычислений

Последовательное и параллельноеЗадача: a = b*c+d*e;Последовательная программа:Load r1,bLoad r2, cMul r1, r1,

Представление алгоритма A, вычисляющего функцию FПредставление алгоритма A – это набор S

Реализация алгоритма A, представленного в форме S– это выполнение операций в некотором

Последовательное и параллельное: резюмеЕсли множество реализаций алгоритма A, представленного в форме S

Меры качества параллельной реализацииУскорение параллельной реализации относительно последовательной:S = Ts/Tp, где Ts

Предел ускорения: Закон АмдалаЕсли P – это доля вычислений, которые могут быть

Закон Амдала: диаграммаИзображение из Википедии

Иерархия параллельных вычислительных системМикропроцессорыSMP-узлы: объединения микропроцессоров над общим полем памятиМультикомпьютеры: SMP-узлы, связанные

От алгоритма к программе: взаимодействующие процессыПрограмма часто задается как множество взаимодействующих процессов.

Модель программирования в разделенной памяти: обмен сообщениями

Пример параллельной программы в модели общей памяти: OpenMP #include int main(){#pragma omp

Параллельное программирование в модели разделенной памяти: Message Passing Interface

Первый пример: идентификация процессов#include #include #include int main(int argc, char** argv){ int rank,

$Взаимодействия точка-точка: MPI_Send, MPI_Recv if(size!=2){ std::cerr$ MPI_SendrecvintBuff = 1234;std::cerr

Групповые взаимодействия: MPI_Bcast, MPI_Barrier int intBuff = rank; std::cerr

MPI_Reduce, MPI_Allreduce int intBuff = 0; std::cerr

Асинхронные взаимодействия точка-точка: MPI_Isend, MPI_Iresv int intBuff = rank; MPI_Request rq; MPI_Isend(&intBuff, 1, MPI_INT, !rank,

Другие функцииСбор распределенных векторов: MPI_Gather, MPI_AllgatherРаспределение вектора: MPI_Scatterи т.д.

“The standard includes:” (Section 1.7 of MPI 2.1 Standard) Point-to-point

Пример решения уравнения Пуассона явным методомДвумерное уравнение:d2u/dx2+d2u/dy2-a*u=fДискретизация:(u(i+1)j-2uij+u(i-1)j)/h2+ (ui(j+1)-2uij+ui(j-1))/h2-a*uij = fijИтеративный метод:un+1ij = 0.25(un(i+1)j+un(i-1)j+uni(j+1)+uni(j-1)-h2fij)

Декомпозиция задачиКак организовать коммуникации на разрезе?

Организация коммуникаций с помощью дополнительных слоевСоздается 2 массива в каждом процессе: для

О кластере НКС-30T nks-30t.sscc.ru32 двойных блейд-серверов HP BL2x220c, в каждом узле два

Работа на кластере НКС-30T1 Вход с помощью программы putty.exe:1.1Имя сервера: nks-30t.sscc.ru1.2 Логин:1.3

Схема устройства кластераГоловной узелВысокоскоростная сеть«Медленная» сеть для управления и устройства общей файловой системыInternetВычислительные узлыМашина пользователя

Устройство скрипта запуска задачи run.sh#!/bin/bash #PBS -V #PBS -r n #PBS -l

Где найти информацию?MPI: http://www.mpi-forum.org/

Слайды презентации

Слайд 2 Содержание лекции
Формальный подход к определению параллельной программы
Меры качества

Содержание лекцииФормальный подход к определению параллельной программыМеры качества параллельных программПредел ускорения

параллельных программ
Предел ускорения вычислений при распараллеливании
Реализация параллельных программ в

модели общей памяти и в модели распределенной памяти
Программирование в распределенной памяти: MPI
Пример задачи: численное решение уравнения Пуассона
Работа на вычислительных системах Сибирского суперкомпьютерного центра

По ходу лекции: комментарии об ошибках, характерных для параллельного программирования (дедлоки, несогласованный доступ к данным)

Слайд 3 Последовательное и параллельное
Задача: a = bc+de;

Последовательная
программа:
Load r1,b
Load

Последовательное и параллельноеЗадача: a = b*c+d*e;Последовательная программа:Load r1,bLoad r2, cMul r1,

r2, c
Mul r1, r1, r2
Load r2, d
Load r3, d
Mul

r2, r2, r3
Sum r1, r1, r2
Store a, r1

Алгоритм задает необходимый частичный порядок (потоковое управление):

Слайд 4 Представление алгоритма A, вычисляющего функцию F
Представление алгоритма A

Представление алгоритма A, вычисляющего функцию FПредставление алгоритма A – это набор

– это набор
S = (X, F, C, M),

где
X – конечное множество переменных
F – конечное множество операций
С – управление (множество ограничений на порядок операций) = потоковое управление + прямое управление
М – функция, задающая отображение множеств X и F в физические устройства параллельной вычислительной машины

Слайд 5 Реализация алгоритма A, представленного в форме S

– это

Реализация алгоритма A, представленного в форме S– это выполнение операций в

выполнение операций в некотором порядке, не противоречащим управлению C
Представление

корректно, если любая реализация вычисляет функцию F, т.е. С содержит потоковое управление.

Слайд 6 Последовательное и параллельное: резюме
Если множество реализаций алгоритма A,

Последовательное и параллельное: резюмеЕсли множество реализаций алгоритма A, представленного в форме

представленного в форме S содержит более одной реализации, то

представление S называется параллельным.
Если это множество одноэлементно, то представление S назвается последовательным.

Слайд 7 Меры качества параллельной реализации
Ускорение параллельной реализации относительно последовательной:
S

Меры качества параллельной реализацииУскорение параллельной реализации относительно последовательной:S = Ts/Tp, где

= Ts/Tp, где Ts – время выполнения последовательной программы,

Tp – параллельной
Эффективность использования N процессоров относительно одного
E = Ts/(N*TN), где TN – время выполнения параллельной программы на N процессорах

Слайд 8 Предел ускорения: Закон Амдала
Если P – это доля

Предел ускорения: Закон АмдалаЕсли P – это доля вычислений, которые могут

вычислений, которые могут быть выполнены параллельно, а 1-P –

доля последовательной части, то максимальное ускорение, которое можно получить на N процессорах равно
1
((1-P)+(P/N))

Слайд 9 Закон Амдала: диаграмма
Изображение из Википедии

Слайд 10 Иерархия параллельных вычислительных систем
Микропроцессоры
SMP-узлы: объединения микропроцессоров над общим

полем памяти
Мультикомпьютеры: SMP-узлы, связанные выделенной сетью передачи данных
Grid: объединение

произвольных ресурсов

Слайд 11 От алгоритма к программе: взаимодействующие процессы
Программа часто задается

От алгоритма к программе: взаимодействующие процессыПрограмма часто задается как множество взаимодействующих

как множество взаимодействующих процессов. Системы программирования отличаются средствами задания

взаимодействия.

Слайд 12 Модель программирования в общей памяти

Слайд 13 Модель программирования в разделенной памяти: обмен сообщениями

Слайд 14 Пример параллельной программы в модели общей памяти: OpenMP

Пример параллельной программы в модели общей памяти: OpenMP #include int main(){#pragma

#include

int main()
{

#pragma omp parallel shared(a, b, c) private(i)
{
#pragma

omp for
for (i = 0; i < N; i++)
a[i] = b[i] + c[i];
}
<…>
}

Слайд 15 Параллельное программирование в модели разделенной памяти: Message Passing

Interface

Слайд 16 Первый пример: идентификация процессов
#include
#include
#include

int main(int

Первый пример: идентификация процессов#include #include #include int main(int argc, char** argv){ int

argc, char** argv)
{
int rank, size;
char hostname[50];
MPI_Init(&argc, &argv);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);
MPI_Comm_size(MPI_COMM_WORLD, &size);
gethostname(hostname,

50);
std::cerr << "Rank = " << rank << ", hostname = "
<< hostname << ", size = " << size << "\n";
MPI_Finalize();
return 0;
}
Пример команды запуска программы: mpirun –np 4 first_example.exe
Запускается 4 копии программы – 4 процесса, каждый получает свой идентификатор rank: 0, 1, 2, 3

Слайд 17 Взаимодействия точка-точка: MPI_Send, MPI_Recv
if(size!=2){
std::cerr

$Взаимодействия точка-точка: MPI_Send, MPI_Recv if(size!=2){ std::cerr$

processes required\n";
MPI_Finalize();
return 1;
}
int intBuff =

1234;
MPI_Status st;
if(rank==0){
MPI_Send(&rank, 1, MPI_INT, 1, 0, MPI_COMM_WORLD);
std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n";
MPI_Recv(&intBuff, 1, MPI_INT, 1, 0, MPI_COMM_WORLD, &st);
std::cerr << "Rank " << rank << ": received from Rank 1 intBuff = " << intBuff << "\n";
}
else
if(rank==1) {
std::cerr << "Rank " << rank << ": initial value of intBuff = " << intBuff << "\n";
MPI_Recv(&intBuff, 1, MPI_INT, 0, 0, MPI_COMM_WORLD, &st);
std::cerr << "Rank " << rank << ": received from Rank 0 intBuff = " << intBuff << "\n";
MPI_Send(&rank, 1, MPI_INT, 0, 0, MPI_COMM_WORLD);
}

Слайд 18 MPI_Sendrecv
intBuff = 1234;

std::cerr

intBuff << "\n";

MPI_Sendrecv(&rank, 1, MPI_INT, !rank, 0,
&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &st);
std::cerr << "Rank " << rank << ": received from Rank "
<< (!rank) << " intBuff = " << intBuff << "\n";

Слайд 19 Групповые взаимодействия: MPI_Bcast, MPI_Barrier
int intBuff = rank;
std::cerr

"Rank = "

" << intBuff << "\n";

MPI_Bcast(&intBuff, 1, MPI_INT, 0, MPI_COMM_WORLD);

std::cerr << "Rank = " << rank << ", after Bcast intBuff = " << intBuff << "\n";

//example of another scenario

MPI_Barrier(MPI_COMM_WORLD);
if(rank==0)
std::cerr << "---- Another scenario ----\n";
MPI_Barrier(MPI_COMM_WORLD);

intBuff = rank;
std::cerr << "Rank = " << rank << ", again intBuff = rank = " << intBuff << "\n";
if(rank==0)
MPI_Bcast(&rank, 1, MPI_INT, 0, MPI_COMM_WORLD);
else
MPI_Bcast(&intBuff, 1, MPI_INT, 0, MPI_COMM_WORLD);
std::cerr << "Rank = " << rank << ", after second Bcast intBuff = " << intBuff << "\n";

Слайд 20 MPI_Reduce, MPI_Allreduce
int intBuff = 0;
std::cerr

"

<< intBuff << "\n";
MPI_Reduce(&rank, &intBuff, 1, MPI_INT,
MPI_SUM, 0, MPI_COMM_WORLD);
std::cerr << "Rank = " << rank
<< ", after Reduce intBuff = " << intBuff << "\n";

intBuff = 0;

MPI_Allreduce(&rank, &intBuff, 1,
MPI_INT, MPI_SUM, MPI_COMM_WORLD);
std::cerr << "Rank = " << rank
<< ", after Allreduce intBuff = " << intBuff << "\n";

Слайд 21 Асинхронные взаимодействия точка-точка: MPI_Isend, MPI_Iresv
int intBuff = rank;
MPI_Request

Асинхронные взаимодействия точка-точка: MPI_Isend, MPI_Iresv int intBuff = rank; MPI_Request rq; MPI_Isend(&intBuff, 1, MPI_INT,

rq;
MPI_Isend(&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &rq);

for(int i =

0; i<100; i++)
std::cout << "working\n";

int flag = 0;
MPI_Status st;
MPI_Wait(&rq, &st);
//we can write to intBuff again: receiving into intBuff now.
//we can use rq again.

MPI_Irecv(&intBuff, 1, MPI_INT, !rank, 0, MPI_COMM_WORLD, &rq);

for(int i = 0; i<100; i++)
std::cout << "working again\n";

MPI_Wait(&rq, &st);

//now intBuff contains a message received from a peer
std::cerr << "Rank " << rank << ": intBuff = " << intBuff << "\n";

Слайд 22 Другие функции
Сбор распределенных векторов: MPI_Gather, MPI_Allgather
Распределение вектора: MPI_Scatter
и

т.д.

Слайд 23 “The standard includes:” (Section 1.7 of MPI 2.1

“The standard includes:” (Section 1.7 of MPI 2.1 Standard) Point-to-point communication

Standard)
Point-to-point communication
Datatypes
Collective operations
Process groups
Communication

contexts
Process topologies
Environmental Management and inquiry
The info object
Process creation and management
One-sided communication
External interfaces
Parallel file I/O
Language Bindings for Fortran, C and C++
Profiling interface

Слайд 24 Пример решения уравнения Пуассона явным методом
Двумерное уравнение:
d2u/dx2+d2u/dy2-au=f
Дискретизация:
(u(i+1)j-2uij+u(i-1)j)/h2+ (ui(j+1)-2uij+ui(j-1))/h2-auij

= fij
Итеративный метод:
un+1ij = 0.25(un(i+1)j+un(i-1)j+uni(j+1)+uni(j-1)-h2fij)

Слайд 25 Декомпозиция задачи
Как организовать коммуникации на разрезе?

Слайд 26 Организация коммуникаций с помощью дополнительных слоев
Создается 2 массива

Организация коммуникаций с помощью дополнительных слоевСоздается 2 массива в каждом процессе:

в каждом процессе: для значений предыдущей итерации и новой.
Когда

значения на границах посчитаны на предыдущей итерации, производится обмен, при этом значения от соседа помещаются в дополнительный слой того же массива.
Вычисляются значения на новой итерации с использованием массива предыдущей итерации.

Слайд 27 О кластере НКС-30T nks-30t.sscc.ru
32 двойных блейд-серверов HP BL2x220c, в

О кластере НКС-30T nks-30t.sscc.ru32 двойных блейд-серверов HP BL2x220c, в каждом узле

каждом узле два 4-х ядерных процессора Intel Xeon Е5450

(Intel(R) Xeon(R) CPU E5450 @ 3.00GHz)
= 512 ядер
Пиковая производительнось: ~6 ТФлопс.
Операционная система: RedHat Linux (RHEL 5u2)
Очередь заданий / система пакетной обработки: PBS Pro 10.0
Компиляторы: Intel C/C++ и Fortran 11.0.081 Professional Edition,
включают в себя Intel MKL, Intel IPP ...
Intel MPI 3.2.0.011 и Intel TraceAnalyzer&Collector 7.2.0.011

Слайд 28 Работа на кластере НКС-30T
1 Вход с помощью программы

Работа на кластере НКС-30T1 Вход с помощью программы putty.exe:1.1Имя сервера: nks-30t.sscc.ru1.2

putty.exe:
1.1Имя сервера: nks-30t.sscc.ru
1.2 Логин:
1.3 Пароль:
2. Панельный файловый менеджер: mc
3.

Создать в домашней директории папку для своей работы
4. Скопировать себе примеры (содержимое папки ~/examples)
5. Запустить пример: qsub run.sh
6. Смотреть очередь: qstat
7. Удалить задачу из очереди: qdel
8. Компиляция программы mpiexample.cpp:
mpiicpc –o mpiexample.exe mpiexample.cpp
9. Компиляция программы mpiexample.c:
mpiicc –o mpiexample.exe mpiexample.c

Слайд 29 Схема устройства кластера
Головной узел
Высокоскоростная сеть
«Медленная» сеть для управления

и устройства общей файловой системы
Internet
Вычислительные узлы
Машина пользователя

Слайд 30 Устройство скрипта запуска задачи run.sh
#!/bin/bash
#PBS -V

Устройство скрипта запуска задачи run.sh#!/bin/bash #PBS -V #PBS -r n #PBS

#PBS -r n
#PBS -l nodes=:ppn=

на узле>,cput=00:10:00,walltime=15:00
#PBS -k oe
#PBS -N name_of_the_job
#PBS -j oe
date
cd $PBS_O_WORKDIR
pwd
mpirun -r ssh -genv I_MPI_DEVICE rdma -genv I_MPI_RDMA_TRANSLATION_CACHE disable -n <количество процессов MPI> <путь к исполняемому файлу>
date

- Предыдущая Развитие зародыша и плода

Следующая - Влажность воздуха

Microsoft SQL Server 2008 R2 137

Антивирусные программы 107

Объектке бағытталған бағдарламалау түсінігі 197

Массивтер 114

Применение эффектов 83

Виды надписей. Шрифты надписей 120

Презентация по теме Моделирование как метод познания 129

Системы счисления 99

Обзор программ контентной фильтрации 112

Проектирование базы данных и работа с ними 100

Графические редакторы 106

Комплексы упражнений при работе за ПК 125

Представление информации 110

Сетевые социальные сервисы в деятельности учителя 111

Мышиная история 120

Системы счисления. КВН 98

Информационная система автоматизации обработки информации о реабилитации больных на санаторном этапе 132

Организация процессов обработки данных в базе данных 97

Интернет 83

WEB application security 99

Задачи на количество информации 146

SQL Запросы в базах данных 77

ИКТ на уроках начальной школы 164

Заманауи қолданбалы бағдарламалық қамтамаларға шолу 272

Что такое findslide.org?

Обратная связь

Презентация на тему Введение в параллельное программирование

Содержание

Слайд 2 Содержание лекцииФормальный подход к определению параллельной программыМеры качества

параллельных программПредел ускорения вычислений при распараллеливанииРеализация параллельных программ в

Слайд 3 Последовательное и параллельноеЗадача: a = b*c+d*e;Последовательная программа:Load r1,bLoad

r2, cMul r1, r1, r2Load r2, dLoad r3, dMul

Слайд 4 Представление алгоритма A, вычисляющего функцию FПредставление алгоритма A

– это набор S = (X, F, C, M),

Слайд 5 Реализация алгоритма A, представленного в форме S– это

выполнение операций в некотором порядке, не противоречащим управлению CПредставление

Слайд 6 Последовательное и параллельное: резюмеЕсли множество реализаций алгоритма A,

представленного в форме S содержит более одной реализации, то

Слайд 7 Меры качества параллельной реализацииУскорение параллельной реализации относительно последовательной:S

= Ts/Tp, где Ts – время выполнения последовательной программы,

Слайд 8 Предел ускорения: Закон АмдалаЕсли P – это доля

вычислений, которые могут быть выполнены параллельно, а 1-P –

Слайд 9 Закон Амдала: диаграммаИзображение из Википедии

Слайд 10 Иерархия параллельных вычислительных системМикропроцессорыSMP-узлы: объединения микропроцессоров над общим

полем памятиМультикомпьютеры: SMP-узлы, связанные выделенной сетью передачи данныхGrid: объединение

Слайд 11 От алгоритма к программе: взаимодействующие процессыПрограмма часто задается

как множество взаимодействующих процессов. Системы программирования отличаются средствами задания

Слайд 12 Модель программирования в общей памяти

Слайд 13 Модель программирования в разделенной памяти: обмен сообщениями

Слайд 14 Пример параллельной программы в модели общей памяти: OpenMP

#include int main(){#pragma omp parallel shared(a, b, c) private(i){#pragma

Слайд 15 Параллельное программирование в модели разделенной памяти: Message Passing

Interface

Слайд 16 Первый пример: идентификация процессов#include #include #include int main(int

argc, char** argv){ int rank, size; char hostname[50]; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); MPI_Comm_size(MPI_COMM_WORLD, &size); gethostname(hostname,

Слайд 17 Взаимодействия точка-точка: MPI_Send, MPI_Recv if(size!=2){ std::cerr

processes required\n"; MPI_Finalize(); return 1; } int intBuff =

Слайд 18 MPI_SendrecvintBuff = 1234;std::cerr

Слайд 19 Групповые взаимодействия: MPI_Bcast, MPI_Barrier int intBuff = rank; std::cerr