Post on 18-Mar-2016
description
transcript
Ordonnancement d’applications intensives Ordonnancement d’applications intensives embarquées sur GPUsembarquées sur GPUs
ADDA CHAHRAZED
addachahrazed@gmail.com
Encadreur: Mr A.E.BENYAMINA
Co-Encadreur: Mr L.Loukil et Mr P.BOULET1
2
Plan
1. Introduction
2. Travaux connexes
3. Conclusion
3
INTRODUCTION
4
1. Introduction
CPU GPU
GPGPU (Architecture Hétérogène)
GILR
PRPI
Algorithme d’ordonnancement ?
Algorithme d’ordonnancement ?
Problématique:
5
1. Introduction
Mes Présentations: : 5 exposés
Voir le lien: AASGaspard
6
Travaux connexes
7
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012
système hétérogène tels que (GPU+ FAPGA+CPU)
Satisfaction de deux critères (Max tps de performance, Min consommation d’énergie)
)
Ordonnancement basée(liste de priorité de taches)
8
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012
Ordonnancement fonction basée sur le temps d’exécution et consommation d’énergie sous forme un mode de programmation linéaire
9
[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012
Calcul intensif sur GPUs
Satisfaction de critère (minimiser le temps d’exécution)
Ordonnancement basée(priorité de dépendance)
Ordonnancement fonction basée sur DCounter.
10
[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. 2012
Calcul intensif sur GPUs
Satisfaction de critère (minimiser le temps d’exécution)
Ordonnancement basée(priorité de dépendance) et LDF (Latest Deadline First ))
11
[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. 2013
système hétérogène tels que (GPUs+CPUs)
Satisfaction de deux critères (minimiser le temps de réponse
))
Traitement d’un seul image (détection de coins et contour)
Traitement de plusieurs images(détection de coins et contour)
Ordonnancement basée sur (CUDA et OpenGl)
Ordonnancement basée sur (StarUP)
12
Calcul intensif sur GPUs
Satisfaction de critère (Max tps de performance, Min consommation d’énergie))
Ordonnancement basée(Algorithmes évolutionnaires))
[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010
13
[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. 2012
Calcul intensif sur GPUs
Satisfaction de critère (Max tps de performance)
Ordonnancement basée(Algorithmes génétique)
14
2. Travaux connexesArticles plateforme
sAlgorithme d’ordonnancement
Critère d’optimisation
Langage de programmation
Remarque
[Qiang et al 2012]
CPUs-GPUs-FPGAs
Programmation linéaire
Maximiser efficacité énergétique du système , Max tps performance
C++
[Tzeng et al 2012 ]
GPUs Statique(résolution de dépendance)
minimiser le temps d’exécution
-
[Membarth et al 2012]
GPUs Dynamique (en fonction des priorités et LDF (Latest Deadline First ))
minimiser le temps de réponse
CUDA, opencl
[Mahmoudi et al 2013]
CPUs-GPUs 1.Ordonnandement par CUDA 2.Odonancement effectué par StarUP+ les algorithmes de traitement d’image
minimiser le temps de réponse
1.CUDA+OpenGL2.StarUP
Traitement1.Pour une seul image2. Pour plusieurs images
15
2. Travaux connexesArticles plateforme
sAlgorithme d’ordonnancement
Critère d’optimisation
Langage de programmation
Remarque
[Qiang et al 2011]
CPUs-GPUs- StatiqueAlgorithmes évolutionnaires
Max tps Performance, Min consomD’énergie
OpenCL
[Thomas et al 2012]
CPUs-GPUs- StatiqueAlgorithmes génétiques
Max tps Performance
OpenMP
16
Conclusion
17
3. ConclusionProposition: Partie1:
GPGPU (Architecture Hétérogène)
GILR
Algorithme d’ordonnancement
Statique évolutionnaires
(PSO et dijkstra )
Algorithme d’ordonnancement
Statique
Travail de Mr Aroui
(Branch & Bound)
PRPI
GP GPU
Commence par un graphe à un
seul niveau
18
[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy EfficientScientific Computing. School of Electronic Information Engineering, Tianjin University,300072 Tianjin, China 2 Department of Computing, Imperial College London, SW7 2AZ London, UK. 2012
Référence bibliographique
[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012
[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. Hardware/Software Co-Design, Department of Computer Science, University of Erlangen-Nuremberg, Germany. Siemens Healthcare Sector, H IM AX, Forchheim, Germany. 2012
19
Référence bibliographique
[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. Center for Applied Scientific Computing, Lawrence Livermore National Laboratory, Livermore, CA 94551 USA. 2012
[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. Université de Mons, Faculté Polytechnique. Service d’informatique 20, Place du Parc 7000 Mons, Belgique.2013
[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010