Te estoy entendiendo entonces que salvo el streaming, hacen mas o menos lo 
mismo con las salvedades de que Spark tiene mucho m�s soporte a d�a de hoy?



Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para 
Windows 10

De: Carlos Ortega<mailto:[email protected]>
Enviado: s�bado, 1 de julio de 2017 23:28
Para: Jes�s Para Fern�ndez<mailto:[email protected]>
CC: [email protected]<mailto:[email protected]>
Asunto: Re: [R-es] OFFTOPIC: SPARK Y H2O

Hola Jes�s,

Te comento varios detalles, aunque son muchos los matices...

  *   Desde el punto de vista de algoritmos, H2O tiene ventajas sobre Spark 
tanto de performance como de variedad. H2O incorpora ya un algoritmo propio de 
deeplearning y recientemente ya es compatible con Keras, Tensorflow, Mxnet 
ademas de con xgboost. Spark no ha entrado en este mundo todav�a.

     *   Estos son los algoritmos que recoge Spark: 
https://spark.apache.org/docs/latest/mllib-guide.html
     *   Y estos los de H2O: 
http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms
     *   No me olvidar�a de dar una vuelta por esta comparativa de H2O, Spark, 
Python, R para diferentes tama�os de conjuntos, capacidad de predicci�n, 
velocidad, etc: https://github.com/szilard/benchm-ml

  *   Desde el punto de vista de implementaci�n en "producci�n". Spark est� 
mucho m�s extendido, se utiliza como soluci�n para procesamiento en streaming 
mientras que h2o no est� planteado para esto, aunque puedes crear un modelo y 
como objeto ponerlo en producci�n independiente de arrancar H2O.

  *   Spark forma parte de las distribuciones enterprise por defecto y hay 
mucho apoyo de las grandes empresas que junto con una gran comunidad hace m�s 
f�cil encontrar respuesta a dudas, problemas. H2O est� consolid�ndose cada vez 
m�s pero es una compa��a de 70 empleados y est� centrada puramente en el 
MachineLearning Aunque van creciendo muy r�pido y los acuerdos recientes con 
Nvidia har�n que veamos ya H2O sobre GPUs.

Saludos,
Carlos Ortega
www.qualiytexcellence.es<http://www.qualiytexcellence.es>

El 1 de julio de 2017, 11:06, Jes�s Para Fern�ndez 
<[email protected]<mailto:[email protected]>> escribi�:
Buenas erreros!!


Una cuesti�n de las que tengo ciertas dudas es saber en que se diferencian 
Spark y H2o, si son competencia, si  valen para lo mismo o no....


Seg�n lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la 
libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas 
con R o con Python, puedes usar ese lenguaje.


H2O es una herramienta que nos permite hacer datamining para grandes datasets, 
balanceando entre los nodos/clusters del sistema, y  conectado con R o Python 
puedes hacerlo usando el lenguaje de estos.

Entonces, para que me vale Spark si tengo ya H2O?


Es que no veo claro para que vale cada herramienta.


Gracias

Jes�s

        [[alternative HTML version deleted]]


_______________________________________________
R-help-es mailing list
[email protected]<mailto:[email protected]>
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>


        [[alternative HTML version deleted]]

_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es

Responder a