Location: INFN-CNAF, dalle ore 14 alle ore 16
Siti presenti:
- UNI-PR: Roberto Alfieri. Roberto De Pietri (assente giustificato)
- UNI-PG: Alessandro Costantini (fus) (remoto)
- UNI-NA: Vania Boccia (fus), Giovanni Barone
- CNR-BO: Stefano Ottani, (Mauro Nanni, Cristian Degli Esposti, Alessandro Venturini sono assenti giustificati)
- CNAF: (Davide Salomoni assente giustificato)
- SISSA: Stefano Cozzini
- INFN-PI: Alberto Ciampa, Enrico Mazzoni
- COMETA: ?? (Giuseppe Andronico assente)
- IGI: Paolo Veronesi (res. operation), Daniele Cesini (res. fus), Valerio Venturi (res. mw), Marco Bencivenni (portale)
Roberto illustra la pagina wiki che ha predisposto per la riunione:
http://www.fis.unipr.it/dokuwiki/doku.php?id=grid:mpi-multicore:start
Le possibili attivita' sono suddivise in una parte infrastrutturale, che
coinvolge prevalentemente i siti, e una parte applicativa che coinvolge
gli utenti. Roberto si sofferma principalmente sulla parte
infrastrutturale tra cui:
la sperimentazione di iWarp per le comunicazioni a bassa latenza,
l'accesso via SRM ai dati dei job in esecuzione, l'ottimizzazione delle
risorse fra job seriali e job paralleli, le nuove features a supporto di
multicore e wholenodes delle distribuzione EMI.
Riguardo la convivinza tra job seriali e paralleli emergono
sostanzialmente due approcci:
quello praticato da Napoli (unica coda in cui il job manager determina
il tipo i job e applica policy opportune)
e quello praticato da Pisa (code separate, con role=parallel nel Proxy
Voms per gli utenti MPI ).
Paolo Veronesi conferma che attualmente e' rilasciato per IGI il CE
Cream EMI e che entro breve tempo verra' rilasciato anche il profilo per
i WN di EMI.
I siti interessati installeranno un cluster di test con la distribuzione
EMI e la configurazione che verra' concordata all'interno del presente WG.
Si conferma l'uso della VO GRIDIT per i test.
I dettagli saranno inseriti nella pagina twiki.
Stefano Cozzini illustra la sua esperienza con le nuove funzionalita' di
CREAM per i multicore. Di particolare interesse l'utilizzo di una
soluzione mista HTC/HPC basata su JOB SMP che ottimizzano l'uso dei
multicore di un singolo nodo (whole node), distribuiti sui nodi della
Grid, con applicazioni tipo quantum espresso. I job sono precompilati
(relocated package).
Ha poi inviato i seguenti paper su un paio di esperienze fatte
sull'approccio parallelo alla grid:
In conclusione si decide di chiedere conferma di partecipazione ai test
ai siti sopra elencati, e di inviare una descrizione sui dettagli HW.
Si e' parlato di un questionario ma per l'attivita' di questo gruppo
puo' bastare una lista delle caratteristiche HW interessanti per questi
test, come la seguente:
- WN: numero di nodi, numero di core per nodo
- Interconnessione tra i WN: tecnologia utilizzata (GbE, Infiniband , altro)
- Home share/non shared: se shared il tipo di FS
- Il tipo di Batch system
- Altre informazioni utili, altre sperimentazioni proposte
Si prega di comunicare queste informazioni a questa mailing list entro
una settimana, 10 giorni max per avere un'idea del layout di test su cui
si puo' lavorare.
Rimane da affrontare quanto segnalato da Davide in contesto WLCG:
"Date un'occhiata anche ai piani d'uso del multicore/whole nodes (non
MPI) che stiamo discutendo in ambito WLCG nel Workload Managment TEG:
https://twiki.cern.ch/twiki/bin/view/LCG/WMTEGMulticore (work in progress)".
In tempo reale Marco ha creato una Sezione Wiki:
https://wiki.italiangrid.it/twiki/bin/view/Main/MpiGroup e ha creato la
Mailing list: mpi-multicore
lists.italiangrid.it.
E' importante che questa sia una iniziativa collaborativa fra varie
componenti (utenti, site manager, esperti), fermamente orientata agli
obiettivi che possiamo sintetizzare con:
- "studio dei nodi multicore per ottimizzare il loro uso in un contesto di Grid per job HPC"
- "applicazioni complesse"
- "test di igi-portal" per rendere l'accesso alla grid piu' semplice agli utenti.
E' auspicabile che questi obiettivi siano raggiunti nel giro di pochi mesi.
La prossima riunione del gruppo e' stata fissata per il 24 febbraio
prossimo alle ore 14.
-- RobertoAlfieri - 2012-02-21