Re: [R-es] OFFTOPIC: SPARK Y H2O

2017-07-02 Por tema Carlos Ortega
El streaming, la diferencia entre algoritmos y el soporte...

El 2 de julio de 2017, 10:36, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Te estoy entendiendo entonces que salvo el streaming, hacen mas o menos lo
> mismo con las salvedades de que Spark tiene mucho más soporte a día de hoy?
>
>
>
>
>
>
>
> Enviado desde Correo <https://go.microsoft.com/fwlink/?LinkId=550986>
> para Windows 10
>
>
>
> *De: *Carlos Ortega 
> *Enviado: *sábado, 1 de julio de 2017 23:28
> *Para: *Jesús Para Fernández 
> *CC: *r-help-es@r-project.org
> *Asunto: *Re: [R-es] OFFTOPIC: SPARK Y H2O
>
>
>
> Hola Jesús,
>
>
>
> Te comento varios detalles, aunque son muchos los matices...
>
>- Desde el punto de vista de algoritmos, H2O tiene ventajas sobre
>Spark tanto de performance como de variedad. H2O incorpora ya un algoritmo
>propio de deeplearning y recientemente ya es compatible con Keras,
>Tensorflow, Mxnet ademas de con xgboost. Spark no ha entrado en este mundo
>todavía.
>
>
>- Estos son los algoritmos que recoge Spark:
>   https://spark.apache.org/docs/latest/mllib-guide.html
>   <https://spark.apache.org/docs/latest/mllib-guide.html>
>   - Y estos los de H2O: http://docs.h2o.ai/h2o/
>   latest-stable/index.html#algorithms
>   <http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms>
>   - No me olvidaría de dar una vuelta por esta comparativa de H2O,
>   Spark, Python, R para diferentes tamaños de conjuntos, capacidad de
>   predicción, velocidad, etc: https://github.com/szilard/benchm-ml
>
>
>- Desde el punto de vista de implementación en "producción". Spark
>está mucho más extendido, se utiliza como solución para procesamiento en
>streaming mientras que h2o no está planteado para esto, aunque puedes crear
>un modelo y como objeto ponerlo en producción independiente de arrancar
>H2O.
>
>
>- Spark forma parte de las distribuciones enterprise por defecto y hay
>mucho apoyo de las grandes empresas que junto con una gran comunidad hace
>más fácil encontrar respuesta a dudas, problemas. H2O está consolidándose
>cada vez más pero es una compañía de 70 empleados y está centrada puramente
>en el MachineLearning Aunque van creciendo muy rápido y los acuerdos
>recientes con Nvidia harán que veamos ya H2O sobre GPUs.
>
>
>
> Saludos,
>
> Carlos Ortega
>
> www.qualiytexcellence.es
>
>
>
> El 1 de julio de 2017, 11:06, Jesús Para Fernández <
> j.para.fernan...@hotmail.com> escribió:
>
> Buenas erreros!!
>
>
> Una cuestión de las que tengo ciertas dudas es saber en que se diferencian
> Spark y H2o, si son competencia, si  valen para lo mismo o no
>
>
> Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con
> la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo
> conectas con R o con Python, puedes usar ese lenguaje.
>
>
> H2O es una herramienta que nos permite hacer datamining para grandes
> datasets, balanceando entre los nodos/clusters del sistema, y  conectado
> con R o Python puedes hacerlo usando el lenguaje de estos.
>
> Entonces, para que me vale Spark si tengo ya H2O?
>
>
> Es que no veo claro para que vale cada herramienta.
>
>
> Gracias
>
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
>
>
> --
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] OFFTOPIC: SPARK Y H2O

2017-07-02 Por tema Jesús Para Fernández
Te estoy entendiendo entonces que salvo el streaming, hacen mas o menos lo 
mismo con las salvedades de que Spark tiene mucho m�s soporte a d�a de hoy?



Enviado desde Correo<https://go.microsoft.com/fwlink/?LinkId=550986> para 
Windows 10

De: Carlos Ortega<mailto:c...@qualityexcellence.es>
Enviado: s�bado, 1 de julio de 2017 23:28
Para: Jes�s Para Fern�ndez<mailto:j.para.fernan...@hotmail.com>
CC: r-help-es@r-project.org<mailto:r-help-es@r-project.org>
Asunto: Re: [R-es] OFFTOPIC: SPARK Y H2O

Hola Jes�s,

Te comento varios detalles, aunque son muchos los matices...

  *   Desde el punto de vista de algoritmos, H2O tiene ventajas sobre Spark 
tanto de performance como de variedad. H2O incorpora ya un algoritmo propio de 
deeplearning y recientemente ya es compatible con Keras, Tensorflow, Mxnet 
ademas de con xgboost. Spark no ha entrado en este mundo todav�a.

 *   Estos son los algoritmos que recoge Spark: 
https://spark.apache.org/docs/latest/mllib-guide.html
 *   Y estos los de H2O: 
http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms
 *   No me olvidar�a de dar una vuelta por esta comparativa de H2O, Spark, 
Python, R para diferentes tama�os de conjuntos, capacidad de predicci�n, 
velocidad, etc: https://github.com/szilard/benchm-ml

  *   Desde el punto de vista de implementaci�n en "producci�n". Spark est� 
mucho m�s extendido, se utiliza como soluci�n para procesamiento en streaming 
mientras que h2o no est� planteado para esto, aunque puedes crear un modelo y 
como objeto ponerlo en producci�n independiente de arrancar H2O.

  *   Spark forma parte de las distribuciones enterprise por defecto y hay 
mucho apoyo de las grandes empresas que junto con una gran comunidad hace m�s 
f�cil encontrar respuesta a dudas, problemas. H2O est� consolid�ndose cada vez 
m�s pero es una compa��a de 70 empleados y est� centrada puramente en el 
MachineLearning Aunque van creciendo muy r�pido y los acuerdos recientes con 
Nvidia har�n que veamos ya H2O sobre GPUs.

Saludos,
Carlos Ortega
www.qualiytexcellence.es<http://www.qualiytexcellence.es>

El 1 de julio de 2017, 11:06, Jes�s Para Fern�ndez 
mailto:j.para.fernan...@hotmail.com>> escribi�:
Buenas erreros!!


Una cuesti�n de las que tengo ciertas dudas es saber en que se diferencian 
Spark y H2o, si son competencia, si  valen para lo mismo o no


Seg�n lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con la 
libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo conectas 
con R o con Python, puedes usar ese lenguaje.


H2O es una herramienta que nos permite hacer datamining para grandes datasets, 
balanceando entre los nodos/clusters del sistema, y  conectado con R o Python 
puedes hacerlo usando el lenguaje de estos.

Entonces, para que me vale Spark si tengo ya H2O?


Es que no veo claro para que vale cada herramienta.


Gracias

Jes�s

[[alternative HTML version deleted]]


___
R-help-es mailing list
R-help-es@r-project.org<mailto:R-help-es@r-project.org>
https://stat.ethz.ch/mailman/listinfo/r-help-es



--
Saludos,
Carlos Ortega
www.qualityexcellence.es<http://www.qualityexcellence.es>


[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] OFFTOPIC: SPARK Y H2O

2017-07-01 Por tema Carlos Ortega
Hola Jesús,

Te comento varios detalles, aunque son muchos los matices...

   - Desde el punto de vista de algoritmos, H2O tiene ventajas sobre Spark
   tanto de performance como de variedad. H2O incorpora ya un algoritmo propio
   de deeplearning y recientemente ya es compatible con Keras, Tensorflow,
   Mxnet ademas de con xgboost. Spark no ha entrado en este mundo todavía.
  - Estos son los algoritmos que recoge Spark:
  https://spark.apache.org/docs/latest/mllib-guide.html
  - Y estos los de H2O:
  http://docs.h2o.ai/h2o/latest-stable/index.html#algorithms
  - No me olvidaría de dar una vuelta por esta comparativa de H2O,
  Spark, Python, R para diferentes tamaños de conjuntos, capacidad de
  predicción, velocidad, etc: https://github.com/szilard/benchm-ml


   - Desde el punto de vista de implementación en "producción". Spark está
   mucho más extendido, se utiliza como solución para procesamiento en
   streaming mientras que h2o no está planteado para esto, aunque puedes crear
   un modelo y como objeto ponerlo en producción independiente de arrancar
   H2O.


   - Spark forma parte de las distribuciones enterprise por defecto y hay
   mucho apoyo de las grandes empresas que junto con una gran comunidad hace
   más fácil encontrar respuesta a dudas, problemas. H2O está consolidándose
   cada vez más pero es una compañía de 70 empleados y está centrada puramente
   en el MachineLearning Aunque van creciendo muy rápido y los acuerdos
   recientes con Nvidia harán que veamos ya H2O sobre GPUs.


Saludos,
Carlos Ortega
www.qualiytexcellence.es

El 1 de julio de 2017, 11:06, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas erreros!!
>
>
> Una cuestión de las que tengo ciertas dudas es saber en que se diferencian
> Spark y H2o, si son competencia, si  valen para lo mismo o no
>
>
> Según lo poco que se, Spark es una manera de agilizar el Map-Reduce, y con
> la libreria MLlib, puedes hacer datamining de grandes datasheets, y si lo
> conectas con R o con Python, puedes usar ese lenguaje.
>
>
> H2O es una herramienta que nos permite hacer datamining para grandes
> datasets, balanceando entre los nodos/clusters del sistema, y  conectado
> con R o Python puedes hacerlo usando el lenguaje de estos.
>
> Entonces, para que me vale Spark si tengo ya H2O?
>
>
> Es que no veo claro para que vale cada herramienta.
>
>
> Gracias
>
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es