Te estoy entendiendo entonces que salvo el streaming, hacen mas o menos lo mismo con las salvedades de que Spark tiene mucho m�s soporte a d�a de hoy?
Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para Windows 10 De: Carlos Ortega<mailto:[email protected]> Enviado: s�bado, 1 de julio de 2017 23:28 Para: Jes�s Para Fern�ndez<mailto:[email protected]> CC: [email protected]<mailto:[email protected]> Asunto: Re: [R-es] OFFTOPIC: SPARK Y H2O Hola Jes�s, Te comento varios detalles, aunque son muchos los matices... * Desde el punto de vista de algoritmos, H2O tiene ventajas sobre Spark tanto de performance como de variedad. H2O incorpora ya un algoritmo propio de deeplearning y recientemente ya es compatible con Keras, Tensorflow, Mxnet ademas de con xgboost. Spark no ha entrado en este mundo todav�a. * Estos son los algoritmos que recoge Spark: https://spark.apache.org/docs/latest/mllib-guide.html * Y estos los de H2O: http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms * No me olvidar�a de dar una vuelta por esta comparativa de H2O, Spark, Python, R para diferentes tama�os de conjuntos, capacidad de predicci�n, velocidad, etc: https://github.com/szilard/benchm-ml * Desde el punto de vista de implementaci�n en "producci�n". Spark est� mucho m�s extendido, se utiliza como soluci�n para procesamiento en streaming mientras que h2o no est� planteado para esto, aunque puedes crear un modelo y como objeto ponerlo en producci�n independiente de arrancar H2O. * Spark forma parte de las distribuciones enterprise por defecto y hay mucho apoyo de las grandes empresas que junto con una gran comunidad hace m�s f�cil encontrar respuesta a dudas, problemas. H2O est� consolid�ndose cada vez m�s pero es una compa��a de 70 empleados y est� centrada puramente en el MachineLearning Aunque van creciendo muy r�pido y los acuerdos recientes con Nvidia har�n que veamos ya H2O sobre GPUs. Saludos, Carlos Ortega www.qualiytexcellence.es<http://www.qualiytexcellence.es> El 1 de julio de 2017, 11:06, Jes�s Para Fern�ndez <[email protected]<mailto:[email protected]>> escribi�: Buenas erreros!! Una cuesti�n de las que tengo ciertas dudas es saber en que se diferencian Spark y H2o, si son competencia, si valen para lo mismo o no.... Seg�n lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas con R o con Python, puedes usar ese lenguaje. H2O es una herramienta que nos permite hacer datamining para grandes datasets, balanceando entre los nodos/clusters del sistema, y conectado con R o Python puedes hacerlo usando el lenguaje de estos. Entonces, para que me vale Spark si tengo ya H2O? Es que no veo claro para que vale cada herramienta. Gracias Jes�s [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list [email protected]<mailto:[email protected]> https://stat.ethz.ch/mailman/listinfo/r-help-es -- Saludos, Carlos Ortega www.qualityexcellence.es<http://www.qualityexcellence.es> [[alternative HTML version deleted]]
_______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
