Ordonnancement d’applications intensives embarquées sur GPUs

transcript

Ordonnancement d’applications intensives Ordonnancement d’applications intensives embarquées sur GPUsembarquées sur GPUs

ADDA CHAHRAZED

addachahrazed@gmail.com

Encadreur: Mr A.E.BENYAMINA

Co-Encadreur: Mr L.Loukil et Mr P.BOULET1

1. Introduction

2. Travaux connexes

3. Conclusion

INTRODUCTION

1. Introduction

CPU GPU

GPGPU (Architecture Hétérogène)

Algorithme d’ordonnancement ?

Problématique:

1. Introduction

Mes Présentations: : 5 exposés

Voir le lien: AASGaspard

Travaux connexes

[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012

système hétérogène tels que (GPU+ FAPGA+CPU)

Satisfaction de deux critères (Max tps de performance, Min consommation d’énergie)

Ordonnancement basée(liste de priorité de taches)

[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy Efficient Scientific Computing. 2012

Ordonnancement fonction basée sur le temps d’exécution et consommation d’énergie sous forme un mode de programmation linéaire

[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012

Calcul intensif sur GPUs

Satisfaction de critère (minimiser le temps d’exécution)

Ordonnancement basée(priorité de dépendance)

Ordonnancement fonction basée sur DCounter.

[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. 2012

Satisfaction de critère (minimiser le temps d’exécution)

Ordonnancement basée(priorité de dépendance) et LDF (Latest Deadline First ))

[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. 2013

système hétérogène tels que (GPUs+CPUs)

Satisfaction de deux critères (minimiser le temps de réponse

Traitement d’un seul image (détection de coins et contour)

Traitement de plusieurs images(détection de coins et contour)

Ordonnancement basée sur (CUDA et OpenGl)

Ordonnancement basée sur (StarUP)

Satisfaction de critère (Max tps de performance, Min consommation d’énergie))

Ordonnancement basée(Algorithmes évolutionnaires))

[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010

[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. 2012

Satisfaction de critère (Max tps de performance)

Ordonnancement basée(Algorithmes génétique)

2. Travaux connexesArticles plateforme

sAlgorithme d’ordonnancement

Critère d’optimisation

Langage de programmation

Remarque

[Qiang et al 2012]

CPUs-GPUs-FPGAs

Programmation linéaire

Maximiser efficacité énergétique du système , Max tps performance

[Tzeng et al 2012 ]

GPUs Statique(résolution de dépendance)

minimiser le temps d’exécution

[Membarth et al 2012]

GPUs Dynamique (en fonction des priorités et LDF (Latest Deadline First ))

minimiser le temps de réponse

CUDA, opencl

[Mahmoudi et al 2013]

CPUs-GPUs 1.Ordonnandement par CUDA 2.Odonancement effectué par StarUP+ les algorithmes de traitement d’image

minimiser le temps de réponse

1.CUDA+OpenGL2.StarUP

Traitement1.Pour une seul image2. Pour plusieurs images

2. Travaux connexesArticles plateforme

sAlgorithme d’ordonnancement

Critère d’optimisation

Langage de programmation

Remarque

[Qiang et al 2011]

CPUs-GPUs- StatiqueAlgorithmes évolutionnaires

Max tps Performance, Min consomD’énergie

OpenCL

[Thomas et al 2012]

CPUs-GPUs- StatiqueAlgorithmes génétiques

Max tps Performance

OpenMP

Conclusion

3. ConclusionProposition: Partie1:

GPGPU (Architecture Hétérogène)

Algorithme d’ordonnancement

Statique évolutionnaires

(PSO et dijkstra )

Algorithme d’ordonnancement

Statique

Travail de Mr Aroui

(Branch & Bound)

GP GPU

Commence par un graphe à un

seul niveau

[1] Qiang Liu and Wayne Luk2. Heterogeneous Systems for Energy EfficientScientific Computing. School of Electronic Information Engineering, Tianjin University,300072 Tianjin, China 2 Department of Computing, Imperial College London, SW7 2AZ London, UK. 2012

Référence bibliographique

[2] Stanley Tzeng , Brandon Lloyd , John D. Owens. A GPU Task-Parallel Model with Dependency Resolution. 2012

[3] Richard Membarth, Jan-Hugo Lupp, Frank Hannig, Jürgen Teich, Mario Körner, and Wieland Eckert. Dynamic Task-Scheduling and Resource Management for GPU Accelerators in Medical Imaging. Hardware/Software Co-Design, Department of Computer Science, University of Erlangen-Nuremberg, Germany. Siemens Healthcare Sector, H IM AX, Forchheim, Germany. 2012

Référence bibliographique

[6] Thomas R. W. Scogland, Barry Rountree,Wu-chun Feng,Bronis R. de Supinski†. Heterogeneous Task Scheduling for Accelerated OpenMP. Center for Applied Scientific Computing, Lawrence Livermore National Laboratory, Livermore, CA 94551 USA. 2012

[4] Sidi Ahmed Mahmoudi, Sébastien Fréemal, Michel Bagein, Pierre Manneback. Calcul intensif sur GPU: exemples en traitement d’images, en bioinformatique et en télécommunication. Université de Mons, Faculté Polytechnique. Service d’informatique 20, Place du Parc 7000 Mons, Belgique.2013

[5] N. Melab & T-V. Luong . Optimisation Parallèle Coopérative sur GPU . Equipe-Projet DOLPHIN. 2010

Ordonnancement d’applications intensives embarquées sur GPUs

Documents