Ca repond carrement. Merci beaucoup :)

2015-11-10 16:38 GMT+08:00 Thibaut Barrère <thibaut.barr...@gmail.com>:

> Je sais pas si le sens en japonais est aussi precis, mais en chinois,
>> c'est "dent" sans plus de precision (il est employe dans "se brosser les
>> dents" par exemple). Du coup, j'avais interprete ca en mode "macher les
>> donnees". J'etais pas si loin.
>>
>
> Oui c'est l'idée!
>
>
>> Sympa la pres' sinon.
>>
>
> Merci :-)
>
>
>> Mais je me demande (question utile cette fois): Le code est clairement
>> super modulaire et c'est tres appreciable (c'est le point que tu mets en
>> avant) mais ruby en soit est pas super rapide pour ce genre d'operations.
>> Qu'est-ce que ca donne sur des gros volumes de donnees? As-tu des
>> comparaisons avec d'autres solutions? Est-ce que tu es capable de donner un
>> ratio "temps d'execution" par rapport aux "gains de productivite" et/ou
>> "maintenabilite du code"?
>>
>
> La cible est plutôt les datasets de taille moyenne (donc quelques
> centaines de Mo à quelques Go par "nuit", voire plus selon le type de
> traitement) que des gros volumes. Cela dit on peut optimiser de plusieurs
> façons, notamment en détectant les boucles critiques et en déléguant le
> traitement de certaines choses aux outils pertinents sur ces boucles (ex:
> utiliser le bulk load de votre database destination, utiliser freebcp pour
> exporter des gros volumes de données de SQLServer, appeler des outils comme
> "embulk" à certaines phases du traitement etc), tout en gardant le contrôle
> du work-flow global avec Ruby ce qui apporte beaucoup de souplesse.
>
> On peut également paralléliser le traitement (que ça soit avec un dév
> custom, lancer N processes, ou encore avec le prototype Kiba Pro d'engine
> multi-threadé qui permet de lancer le même job en mode multi-cores,
> efficace même sur MRI lorsqu'on a des tâches qui sont "IO bound"), si c'est
> pertinent.
>
> J'ai remarqué par ailleurs qu'il est fréquent de surestimer le volume à
> traiter dans nos données (j'avais mentionné ça à Rulu en 2012 dans un
> autre talk <https://youtu.be/LW863DOXqZQ?t=16m2s>), donc on a parfois de
> bonnes surprises quant au débit obtenu :-)
>
> Pour les cas où le débit brut est absolument essentiel (centaines de Go
> par jour, To etc), il est préférable d'utiliser d'autres solutions (et je
> travaille aussi avec d'autres outils que Ruby pour ça, creusant
> actuellement le big data etc etc).
>
> En conclusion, on peut travailler sur des volumes de données de taille
> raisonnable (notamment dans mon cas, je travaille souvent avec des startups
> SaaS en B2B, où le ratio "valeur de la data / coût du traitement" est plus
> important qu'en B2C, et ou les sources de données sont souvent du http où
> ruby n'est plus le bottleneck), tout en gardant un fort niveau de qualité.
>
> J'espère que ça répond correctement à ta question!
>
> Thibaut
> --
> http://thibautbarrere.com/
>
>
>
>
>>
>> 2015-11-10 14:34 GMT+08:00 Thibaut Barrère <thibaut.barr...@gmail.com>:
>>
>>> Hello Florian,
>>>
>>> J'ai une question inutile.
>>>> Etant donne que le HanZi veut dire "dent", est-ce le nom que tu voulais
>>>> donner a ta gem? Si oui, pourquoi?
>>>>
>>>
>>> C'est bien le nom que je voulais donner (enfin plutôt "croc" dont j'ai
>>> vu souvent que c'était la signification plus précise).
>>>
>>> Quand je travaille sur des données, j'ai souvent l'impression qu'il faut
>>> un peu "tailler dedans", creuser, etc; voilà un peu le lien même s'il n'est
>>> pas primordial, le nom est court et facile à retenir et ça m'allait bien
>>> également :-)
>>>
>>> -- Thibaut
>>>
>>> --
>>> --
>>> Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance"
>>> de Google Groups.
>>> Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse
>>> railsfrance@googlegroups.com
>>> Pour résilier votre abonnement envoyez un e-mail à l'adresse
>>> railsfrance-unsubscr...@googlegroups.com
>>> ---
>>> Vous recevez ce message, car vous êtes abonné au groupe Google Groupes
>>> "Railsfrance".
>>> Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le
>>> concernant, envoyez un e-mail à l'adresse
>>> railsfrance+unsubscr...@googlegroups.com.
>>> Pour obtenir davantage d'options, consultez la page
>>> https://groups.google.com/d/optout.
>>>
>>
>> --
>> --
>> Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance"
>> de Google Groups.
>> Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse
>> railsfrance@googlegroups.com
>> Pour résilier votre abonnement envoyez un e-mail à l'adresse
>> railsfrance-unsubscr...@googlegroups.com
>> ---
>> Vous recevez ce message, car vous êtes abonné au groupe Google Groupes
>> "Railsfrance".
>> Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le
>> concernant, envoyez un e-mail à l'adresse
>> railsfrance+unsubscr...@googlegroups.com.
>> Pour obtenir davantage d'options, consultez la page
>> https://groups.google.com/d/optout.
>>
>
> --
> --
> Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance" de
> Google Groups.
> Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse
> railsfrance@googlegroups.com
> Pour résilier votre abonnement envoyez un e-mail à l'adresse
> railsfrance-unsubscr...@googlegroups.com
> ---
> Vous recevez ce message, car vous êtes abonné au groupe Google Groupes
> "Railsfrance".
> Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le
> concernant, envoyez un e-mail à l'adresse
> railsfrance+unsubscr...@googlegroups.com.
> Pour obtenir davantage d'options, consultez la page
> https://groups.google.com/d/optout.
>

-- 
-- 
Vous avez reçu ce message, car vous êtes abonné au groupe "Railsfrance" de 
Google Groups.
Pour transmettre des messages à ce groupe, envoyez un e-mail à l'adresse 
railsfrance@googlegroups.com
Pour résilier votre abonnement envoyez un e-mail à l'adresse 
railsfrance-unsubscr...@googlegroups.com
--- 
Vous recevez ce message, car vous êtes abonné au groupe Google Groupes 
Railsfrance.
Pour vous désabonner de ce groupe et ne plus recevoir d'e-mails le concernant, 
envoyez un e-mail à l'adresse railsfrance+unsubscr...@googlegroups.com.
Pour plus d'options, visitez le site https://groups.google.com/d/optout .

Répondre à