An INFN opportunity for new HPC challenges A.Ferraro, D.Salomoni,
C.Vistoli, D.Cesini
INFN-CNAF
1
2
H2020 Pillars
LEIT facts:
Focused on new opportunities for industrial leadership in ICT, Key
Enabling Technologies
(nanotechnology, materials, etc.) and space
Emphasis on areas of R&D and innovation where mastering new
technological
opportunities
The involvement of industrial participants, and of SMEs in
particular, is crucial in
maximising the expected impact of the actions.
The funded projects will be outcome oriented, developing key
technology building
blocks, bringing solutions closer to the market, and paving the way
for industrial and
commercial implementation
LEIT-ICT topics:
Advanced computing:
Future internet
Robotics, Micro- and nano-electronic technologies, Photonics, ICT
for
manufacturing and Factory of the Future
LEIT (Leadership in enabling and industrial technologies)
R &
37M€ 17M€ 3M€
One or both the following themes: Integration of HW&SW
components into fully
working prototypes of low-power micro- servers. Specific emphasis
is given on low- power, low-cost, high-density, secure, reliable,
scalable small form-factor datacentres ("datacentre-in-a-box")
[5-8M€]
New programming approaches to exploit the full potential of the
next generations of computing systems based on heterogeneous
parallel architectures (beyond performance, optimisation should
include energy efficiency). Proposals requesting a small
contribution are expected. [2-4M€]
One or both the following themes: Establish reference architectures
and
platforms for customised low-power heterogeneous computing systems
delivering high performance functionality. [2-4M€]
Bring together all actors along the value chain to customise and
use advanced low power computing systems in cyber- physical
systems. Clustered in large scale projects driven by networks of
European centres of excellence to achieve critical mass and to
better exploit EU-added value. [5-8M€]
Support actions for cross-sectorial platform-building, for
clustering of related research projects, for structuring the
European academic and industrial research communities, for
dissemination of programme achievements and impact analysis [2-4M
€]
Expected impact:
Strengthening the technology competences of European suppliers and
the academic community. Reduction of energy consumption of servers
by 2 orders of magnitude as compared to state of the art in 2013.
Double the productivity in efficiently programming and maintaining
advanced computing systems powering cyber-physical
systems as compared to state of the art in programming embedded
systems in 2013. Increase the adoption of form-factor data-centres
and heterogeneous highly parallel computing systems. Higher
involvement of SMEs, both on the supply and the demand-side.
Increased adoption of concurrency in applications across all
sectors; higher degree of parallelism in applications
LEIT -> ICT -> Advanced Computing -> ICT-4 (Customised and
low power computing)
4
5
Deadline 21/4/2015
Deadline: 2015 !!!
Time to: improve 32bit low-power computing competencies ready for
the 64bit low-power era (2014/2015) create INFN low-power HPC
consciousness include other INFN interested groups make agreements
with SMEs attend European events (Open days, etc.) acquire results
of already completed projects/initiatives define a well defined
proposal
Call scheduling
6
Il Servizio Fondi Esterni evidenzia che tra le call di H2020 con
potenziale rilevanza per la partecipazione dell'INFN c’è anche
LEIT-ICT-4-2015
7
ICT4- 2015
9
10
11
SoC Texas Instruments (ARM), AMD (ARM), Intel (X86) 12
SoC 1. ARMv7/v8 based: Nvidia Tegra, Qualcomm Snapdragon, Samsung
Exynos,
Freescale imx6, TI OMAP/Keystone II, Mediatek, Allwinner 2. Intel
Atom based (Avoton, Broadwell, etc..) 3. HSA based (AMD
Kaveri)
Interfacce I/O 1. PCIe, MIPI, M-PCIe 2. Infiniband , RapidIO , 1/10
Gbit 3. NVLINK?
Tra progetti di ricerca e soluzioni commerciali il mondo HPC low
power è variegato e complesso
Acceleratori 1. GPU (ARM, Imagination Tech., PowerVR,nvidia,
Qualcom, etc..) 2. DSP 3. FPGA 13
BOARD SOC GFLOPS
(CPU+G PU)
FREESCALE (Embedded SoC) SABRE Board
Freescale i.MX6Q
ARM A9(4)
Samsung Exynos 5420
ARM A15(4) A7(4)
INTRINSIC (Mobile SoC) DragonBoard
“HPC Cluster” at CNAF
Criticità già emerse nei SoC ARM
ETH SABREBOARD Indirizzamento 32 bit per processo ECC quasi sempre
assente Supporto Linux limitato Supporto OpenCL limitato/assente
su
Linux CUDA assente RAM GPU limitata 8 core solo teorici (bigLittle)
Assenza di interfacce I/O standard per i
server (eth, PCIe) nei SoC ARM mobile presenti nei SoC
embedded
Affidabilità 24x7 da verificare Power management Cooling
Molte librerie solo per x86 binari non disponibili o immaturi
Bachi HW
Possibili miglioramenti con ARMv8 64bit, M-PCIe/NVLINK, NVIDIA K1,
etc 16
COSA: COmputing on SoC Architectures
17
Obiettivi: 1) Acquisizione esperienza HPC su architetture SoC
Attività focalizzata sull’uso della GPU nel SoC (finora focus su
CPU ARM) Testing dei nuovi SoC su evaluation board - technology
tracking Testing dei cluster esistenti basati su SoC
collaborazione con partner commerciali e progetti europei Creazione
di un cluster con development board per SoC
Porting di applicazioni di interesse per l’INFN Paradigmi di
programmazione (MPI, OPENMP, CUDA, OpenCl, OpenACC)
2) Creazione proposal e consorzio per LEIT-ICT4 (Customised and low
power computing)
realizzazione di un server “HPC” portatile con partner commerciali
(datacenter in a box)
COSA - Testing SoC Cluster
COSA - Proposal LEIT-ICT4
Applicazioni non parallele job degli esperimenti LHC esperienza
consolidata nel porting di queste applicazioni su processori ARM
(cfr. Boccali
at CCR workshop a Genova) Applicazioni parallele su sistemi ibridi
“small HPC”
ad esempio quelle in fase di studio per i trigger degli esperimenti
LHC che utilizzano sia CPU che GPU (cfr. Silvia Amerio al ws di
Trieste: HLT for HL-LHC, Technology and architecture for next
decade TDAQ)
Debugging e test di applicazioni high-end su architetture ibride ad
es. applicazioni Parma e Ferrara con OpenCL e OpenACC
Applicazioni basso parallelismo che necessitano di una sistema
portatile e a basso consumo
attività che si svolgono fuori dal laboratorio e spesso in
condizioni disagiate ad esempio il post processing delle tomografie
assiali computerizzate di reperti
archeologici e museali del gruppo infn-bologna/unibo (Brancaccio et
al.) Simulazioni di reti neurali - Roma1 (Vicini)
COSA potrebbe partire dall’esperienza di COKA sulle applicazioni
INFN
SoC Architecture Knights Architecture
Mobile or embedded SoC based board “MontBlanc like”
+
+
BACKUP
HPC trends (1)
HPC trends (2)
Implementazione di cluster HPC low-power/low-cost per applicazioni
scientifiche Nodi GPGPU mobile/embedded
cores CPU e cores GPU/DSP nello stesso SOC technologia IP europea
(a differenza delle attuali installazioni HPC)
Small is good(“data centre in a box”). Nicchia tutta da esplorare.
Non sovrapposto a progetti exascale (PRACE/MontBlanc)
Collaborazione con SME interessate
Italiane: SECO, E4, EUROTECH, etc. Europee: ARM(?), Imagination
Technologies (?), etc.
Application Porting per selected use cases di interesse INFN e/o
altre comunità scientifiche
misurazioni sul campo, strumentazione remota (tutti quelli che al
momento girano con server 1U al seguito)
Valutazione performance/watt e nuove metriche di billing: cpu
consumption vs cpu time
DESCRIZIONE
17
Permette acquisizione di know-how su tecnologie all’avanguardia e
con inevitabili potenzialità di crescita anche in campo
scientifico:
già dal 2014/2015 prime CPU low-power a 64bit
Abbiamo già esperienze sparse nell’INFN da capitalizzare CMS,
R&D del CNAF, COKA, SUMA e forse altre fuori dai gruppi
ICT
Use cases INFN probabilmente già implementabili: CMS su ARM (vd.
presentazione Boccali al CCR WS di Genova)
“Il porting di uno stack software complesso come quello di CMS su
ARM è stato in gran parte effettuato”
https://agenda.infn.it/getFile.py/access?
contribId=5&sessionId=3&resId=1&materialId=slides&confId=6179
Tomografia computerizzata e software parallelo di ricostruzione
(R.Brancaccio et al.)
Attualmente il cluster HPC è ingombrante. Manca una soluzione HPC
“portatile”
https://agenda.cnaf.infn.it/conferenceDisplay.py?confId=590
MOTIVAZIONI
19
Sabre Board