Ionel Mugurel Ciobica wrote:
On 2-11-2009, at 16h 18'33", Adrian Sevcenco wrote about "Re: [rlug] comparare
diverse computere"
Din nefericire comunicatia intre procesoarele aflate pe aceeasi placa
de baza este mult mai inceata decit comunicarea dintre procesoarele
...errrr.. nu inteleg ... exista astfel de hardware sau ai vrut sa spui
altceva si a iesit pe dos? eu dupa mintea mea ma gindesc ca nu are cum
sa ai comunicare mai rapida in exterior decit pe FSB/QPI. (mai ales ca
nu latimea de banda conteaza ci pe primul loc latenta).
Pe orice hardware cu distributed memory este la fel. Mai bine rulez 8
joburi pe 8 procesoare cite un procesor pe computer, decit 8 joburi pe 8
procesoare cite un job pe node. Nu stiu de ce.
Imi pare rau ... dar asta e stupid! poate sunt prea nou in HPC (nu am
decit citiva ani ca admin GRID si HPC) dar nu am auzit de asha ceva ..
si nu vreau sa ofensez pe nimeni dar asta e o timpenie! (poate cineva se
simte ofensat si imi demonstreaza ca sunt eu timpit .. si e excelent ca
mai invat ceva cu totul nou)
Cred ca mpi nu poate deosebi procesoarele si le pune pe toate sa
comunice la fel, prin ethernet...
La acest punct deja trebuie sa spui ce tip de aplicatie e : de calcul
paralel sau de calcul distribuit. Avind in vedere aceata fraza te-as
indruma catre documentatie de MAUI/Torque (daca folosesti aceasta
combinatie de resource manager/job scheduler) daca nu ce folosesti?
(intre optiuni s-ar regasi Condor, LSF, SGE (Sun Grid Engine))
In schimb daca folosesti ceva cu MPI(sau MPICH) e clar o chestie
paralela... caz in care ar fi interesant de vazut si analizat traficul
in retea.
Devine prea detaliat, eu sint chimist de meserie, nu am studiat
computere la viata mea.
Da, aplicatia foloseste mpi si folosesc torque ca job scheduler.
hmmm ... ajungem la fraza de mai sus (unde ziceam eu de timpenie :) )
MPI-ul se integreaza direct cu torqueul si cind trimiti un job pe masina
foloseste automat toate core-urile de acolo (sa te uiti cu un ps sau top)
Daca lanasezi 8 joburi pe acelasi node de 8 coreuri o sa ai 8x1 procese.
daca lansezi 8 joburi pe 8 noduri diferite o sa ai 8x8 procese ;)
De aia e mai bine asha ;) :D
Cum am mai zis daca ma uit la procesoare, de multe ori stau si
asteapta. Am instalat sinfo. Dar am si ganglia. Sint PC-clustere cu
gigabit ethernet si unele au si interconect. Cele cu interconect
folosesc placi de retea diferite pentru cominicarea aia. Nu vad nici o
diferenta de performanta.
Folosesti cumva rocks? Ce interconect au? e configurat sa fie folosit de
MPI? esti __sigur__ ca mpi-ul foloseste interconectul ala? Daca
folosesti rocks iti recomand cu caldura lista lor de mail.
Adrian
_______________________________________________
RLUG mailing list
[email protected]
http://lists.lug.ro/mailman/listinfo/rlug