Re: [R-es] grafico de barras (barchart) con barras de error y achurado (hatching) en lugar de escala de grises

2018-09-22 Thread Carlos Ortega
Sí, aquí:

https://stackoverflow.com/questions/10383623/adding-error-bars-to-a-barchart-with-multiple-groups

Saludos,
Carlos Ortega
www.qualityexcellence.es

El sáb., 22 sept. 2018 a las 17:52, Eric ()
escribió:

> Gracias Carlos !!!  ... alguna idea con la libreria lattice ? es solo que
> tengo que hacer 3 graficos diferentes y el aspecto de los mismos quedara
> diferente con lattice y ggplot. Voy a ver si me resulta todo en ggplot.
>
> Saludos y gracias de nuevo,
>
> Eric.
>
>
>
> On 22/09/18 12:08, Carlos Ortega wrote:
>
> Hola,
>
> ggplot tiene un *geom *justamente para esto...
>
> https://stackoverflow.com/questions/32984974/add-error-bars-to-a-barplot
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El sáb., 22 sept. 2018 a las 16:53, Eric ()
> escribió:
>
>> Que tal comunidad, hace dias que estoy en un problema que no puedo
>> resolver. Resulta que debo confeccionar un grafico de barras (columnas)
>> que debe incluir barras de error. La unica forma en que me resulto es
>> con barchart() de la libreria Hmisc, y haciendo un truco un poco
>> complicado para mi nivel de usuario autodidacta. Ahora que ya lo tengo
>> (despues de semanas de busqueda) resulta que me piden que en lugar de
>> usar escala de grises para diferenciar las columnas, use un achurado
>> (esas lineas que van dentro de la barra, con distintos patrones para
>> poder diferenciarlas). Con barplot() resulta bastante simple usando los
>> argumentos angle y density, pero no hay caso con barchart(), simplemente
>> no encuentro en la internet como hacerlo y tampoco se me ocurre, por mas
>> que reviso la ayuda de la funcion y de otros parametros de trellis no se
>> ilumina mi entendimiento. Asi es que paso por aqui a ver si alguien
>> tiene alguna idea de como hacerlo, dejo mi codigo y algunos datos para
>> que prueben. Muchas gracias !!
>>
>>
>>  barchart(ave*100 ~ con | sol, groups=name, data=pag
>>, between=list(x=0), layout=c(1,3)
>>, ylab=list("Fatty acids relative area (%)",
>> cex=1.1)
>>, scales=list(y=list(cex=1.1), x=list(cex=1.1))
>>, xlab=list("Solvent concentration (mM)",
>> cex=1.1)
>>, auto.key=list(space="right", points =
>> FALSE, rectangles = TRUE)
>>, cex=1.2
>>  , panel=function(x, y, ..., subscripts){
>>  panel.barchart(x, y, subscripts=subscripts,
>> ...)
>>  lld <- 100*pag$ll[subscripts]
>>  uld <- 100*pag$ul[subscripts]
>> panel.segments(as.numeric(x)+pag$dis[subscripts],lld,
>> as.numeric(x)+pag$dis[subscripts],uld,
>>   col="black")
>>
>>  }
>>)
>>
>>
>> Olvide de decir que no lo hago con barplot() porque con esa funcion no
>> me resultan las barras de error.
>>
>> Muchas gracias !!
>>
>> Eric.
>>
>>
>> pd. disculpen que no use tilde, pero no tengo :'(
>>
>>
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>

-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] grafico de barras (barchart) con barras de error y achurado (hatching) en lugar de escala de grises

2018-09-22 Thread Carlos Ortega
Hola,

ggplot tiene un *geom *justamente para esto...

https://stackoverflow.com/questions/32984974/add-error-bars-to-a-barplot

Saludos,
Carlos Ortega
www.qualityexcellence.es


El sáb., 22 sept. 2018 a las 16:53, Eric ()
escribió:

> Que tal comunidad, hace dias que estoy en un problema que no puedo
> resolver. Resulta que debo confeccionar un grafico de barras (columnas)
> que debe incluir barras de error. La unica forma en que me resulto es
> con barchart() de la libreria Hmisc, y haciendo un truco un poco
> complicado para mi nivel de usuario autodidacta. Ahora que ya lo tengo
> (despues de semanas de busqueda) resulta que me piden que en lugar de
> usar escala de grises para diferenciar las columnas, use un achurado
> (esas lineas que van dentro de la barra, con distintos patrones para
> poder diferenciarlas). Con barplot() resulta bastante simple usando los
> argumentos angle y density, pero no hay caso con barchart(), simplemente
> no encuentro en la internet como hacerlo y tampoco se me ocurre, por mas
> que reviso la ayuda de la funcion y de otros parametros de trellis no se
> ilumina mi entendimiento. Asi es que paso por aqui a ver si alguien
> tiene alguna idea de como hacerlo, dejo mi codigo y algunos datos para
> que prueben. Muchas gracias !!
>
>
>  barchart(ave*100 ~ con | sol, groups=name, data=pag
>, between=list(x=0), layout=c(1,3)
>, ylab=list("Fatty acids relative area (%)",
> cex=1.1)
>, scales=list(y=list(cex=1.1), x=list(cex=1.1))
>, xlab=list("Solvent concentration (mM)",
> cex=1.1)
>, auto.key=list(space="right", points =
> FALSE, rectangles = TRUE)
>, cex=1.2
>  , panel=function(x, y, ..., subscripts){
>  panel.barchart(x, y, subscripts=subscripts,
> ...)
>  lld <- 100*pag$ll[subscripts]
>  uld <- 100*pag$ul[subscripts]
> panel.segments(as.numeric(x)+pag$dis[subscripts],lld,
> as.numeric(x)+pag$dis[subscripts],uld,
>   col="black")
>
>  }
>)
>
>
> Olvide de decir que no lo hago con barplot() porque con esa funcion no
> me resultan las barras de error.
>
> Muchas gracias !!
>
> Eric.
>
>
> pd. disculpen que no use tilde, pero no tengo :'(
>
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Descarga html

2018-09-21 Thread Carlos Ortega
Hola,

Como todavía no se ha comentado la alternativa y es perfectamente válida,
la referencio.
Puedes automatizar todo este acceso a la Web, auténticándote, navegando en
las diferentes páginas y extrayendo la información que desees desde R.

Hay un par de opciones bastante estables para hacerlo con sus dos
respectivos paquetes:


   - RSelenium: Es uno de los paquetes desarrollados por rOpenSci.org. Mira
   el ejemplo que aparece aquí
   https://cloud.r-project.org/web/packages/RSelenium/index.html
  - Si buscas encontrarás múltiples entradas con ejemplos de cómo
  usarlo.
  - rvest: Es la opción desarrollada por Hadley Wickham (RStudio).
   https://cran.r-project.org/web/packages/rvest/index.html

Saludos,
Carlos Ortega
www.qualityexcellence.es



El lun., 17 sept. 2018 a las 17:47, Sergio Castro (<
castro.rodriguez.ser...@gmail.com>) escribió:

> Buenas tardes,
>
> Estoy intentando automatizar unas tareas en la web y ando un poco perdido.
> Quiero descargar con un Script de R el html de varias páginas de una web.
> Previamente me tengo que identificar (usuario y password) en la web para
> poder acceder a las páginas que me interesan. ¿Tienen alguna idea de por
> donde empezar a mirar? Estoy viendo RSelenium pero si se les ocurre alguna
> forma sencilla, se lo agradecería.
>
> Muchas gracias de antemano.
>
> Un saludo.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Crear columna en data frame agregando otra y fusionando

2018-09-12 Thread Carlos Ortega
Hola Miriam,

df <- data.table(df)
df[,.(Nueva=mean(Word.count, na.rm = TRUE)) , by=c("Product.id")]

df_out <- as.data.frame(df)

Cuando creas "Nueva" en la sentencia anterior, aparece en el dataframe
agregada y diferente cada grupo "Product.id". Es una de las ventajas de
"data.table".
En tu ejemplo, primero agregas y luego la adjuntas al dataframe.

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 12 de septiembre de 2018, 13:54, Miriam Alzate  escribió:

> No es lo que busco..La idea es crear una variable nueva, por ejemplo
> "Nueva", que sea la media de "Wordcount" agregada por "Product.Id". Pero
> quiero que esta variable se añada a mi base de datos fusionandose
> directamente por "Product.Id".
>
> Al hacerlo me da este error:
>
> Reviews.211216$Adjetives.Product<- aggregate(adj.x ~ Product.Id,
> data=Reviews.211216, + FUN=mean) Error in `$<-.data.frame`(`*tmp*`,
> Adjetives.Product, value = list(Product.Id = c("P104006", : replacement
> has 143 rows, data has 65505 No me deja crear así directamente la variable.
>
>
> El 12/09/2018 a las 13:45, Jesús Para Fernández escribió:
> > No se si te he entendido muy bien, pero con data.table puedes hacer
> > algo como esto:
> >
> > df <- data.table(df)
> > df[,.(word.count=mean(variableimportante)),by=word.count]
> >
> > UN saludo
> > Jesús
> > 
> > *De:* R-help-es  en nombre de Miriam
> > Alzate 
> > *Enviado:* miércoles, 12 de septiembre de 2018 13:38
> > *Para:* r-help-es
> > *Asunto:* [R-es] Crear columna en data frame agregando otra y fusionando
> > Buenas,
> >
> > Necesito crear una variable que viene de agregar otra por la media. El
> > dataframe tiene 65000 obsrvaciones.Tengo estas variables
> >
> > Product.Id (145 diferentes)
> >
> > Word.Count
> >
> > Review.number
> >
> > Necesito agregar la variable Word.Count por Product.Id. Al agregarlo,
> > tengo un data.frame de 2 variables y 145 observaciones pero en vez de
> > tener que fusionar después por Product.Id los dos dataframe me gustaría
> > saber si hay una forma más directa de hacerlo todo en la misma formula y
> > que agregue Word.count por Product.Id y luego directamente fusione.
> >
> > Un saludo
> >
> > Miriam
> >
> > _______
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problemas para instalar Librería (RODBC)

2018-09-07 Thread Carlos Ortega
Hola,

R ya está en la versión 3.5.1 y tú tienes la 3.3.1.
Las versiones antiguas de los paquetes están:

   - Linux:
   https://cran.r-project.org/src/contrib/Archive/RODBC/
   - Windows:
   h
   ttps://cloud.r-project.org/bin/windows/contrib/3.3/RODBC_1.3-15.zip


Saludos,
Carlos Ortega
www.qualityexcellence.es


2018-09-07 18:14 GMT+02:00 juan manuel dias :

> Hola,
>
> Puede ser que la RODBC no corra en la versión 3.3.1? Abajo copio el error.
>
> Sabe alguien que puede estar pasando?
>
> *Warning in install.packages :*
> *  package ‘RODBC’ is not available (for R version 3.3.1)*
> *Warning in install.packages :*
> *  unable to access index for repository
> https://cran.rstudio.com/bin/windows/contrib/3.3
> <https://cran.rstudio.com/bin/windows/contrib/3.3>:*
> *  cannot open URL
> 'https://cran.rstudio.com/bin/windows/contrib/3.3/PACKAGES
> <https://cran.rstudio.com/bin/windows/contrib/3.3/PACKAGES>'*
>
> Muchas gracias!
>
> Saludos, Juan.
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Lectura Archivo JSON

2018-09-04 Thread Carlos Ortega
Hola,

Sí, el problema es este:

> head(listing$currentPrice.amount)
[[1]]
[1] 9.7

[[2]]
[1] 9.7

[[3]]
[1] 10.49

[[4]]
[1] 10.9

[[5]]
[1] 12.1

que "currentPrice.amount" es una lista.
Simplemente con esto lo arreglas:

> my_listing <- unlist(listing$currentPrice.amount)
> head(my_listing)
[1]  9.70  9.70 10.49 10.90 12.10 12.10
> mean(my_listing)
[1] 63.77911

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 4 de septiembre de 2018, 2:00, Diego Iglesias 
escribió:

> Hola comunidad eRrera,
>
> Acudo a ustedes después de pelearme un rato y salir perdedor con la
> lectura de un archivo json. Por el momento he conseguido leerlo y
> transformar la parte que me interesa a data frame, sin embargo no consigo
> poder manipular los datos para calcular por ejemplo la media de una de las
> variables.
>
> El código que estoy ejecutando es:
>
> library(jsonlite)
> json_data <- fromJSON(file.choose())
> listing <- as.data.frame(do.call(("cbind"), flatten(json_data$listing)))
> mean(listing$currentPrice.amount)
>
> y me devuelve el error:
>
> [1] NA
> Warning message:
> In mean.default(listing$currentPrice.amount) :
>   argument is not numeric or logical: returning NA
>
> Adjunto el archivo json por si es de utilidad. Gracias de antemano por si
> alguien me puede ayudar para transformar el archivo json en un data frame
> con características normales.
>
> Saludos,
>
> Diego Iglesias
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] R_tempDir

2018-08-30 Thread Carlos Ortega
Hola,

Prueba a localizar el directorio donde está R instalado y da permisos
completos a toda la carpeta y subcarpetas.
También pasa esto en linux y se soluciona de la misma manera.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 30 de agosto de 2018, 22:59, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimados
>
> Probé la idea sobre permisos, en windows 10, desde el centro de seguridad
> de windows defender, utilizando la opción para permitir a una aplicación a
> través de acceso controlado a carpetas, para todas las archivos ejecutables
> de R, Rgui, etc., falló con todos.
>
> No falla (error fatal: cannot create R_tempDir) cuándo ejecuto desde
> administrador.
>
> En pocas palabras no solucioné el problema.
>
> Javier Rubén Marcuzzi
>
> El jue., 30 ago. 2018 a las 13:57, Javier Marcuzzi (<
> javier.ruben.marcu...@gmail.com>) escribió:
>
> > Gracias Eric, podría ser un problema de permiso por el antivirus nuevo
> > desde el sistema, me pasó escribiendo un texto de Word, entre productos
> de
> > Microsoft se bloquearon, aunque no vi mensaje alguno. Investigare su
> > sugerencia.
> > Javier
> >
> > El jue., 30 de ago. de 2018 12:11 PM, Eric 
> > escribió:
> >
> >> Hola Javier, Windows tiene el problema de que aunque reinstales mantiene
> >> el REGISTRO de que tuviste instalada la aplicacion, lo que a veces
> >> impide eliminar configuraciones y esas cosas, asi es que no se gana nada
> >> reinstalando. Pero no soy experto de windows, quiza algun otro usurio
> >> aca sea mas experto con eso y te pueda orientar con la solucion, ya que
> >> yo a lo mas te puedo decir que reinstalar no sirve mucho.
> >>
> >> En linux, ese mensaje podría significar que hay un problema con los
> >> permisos del lugar donde se quiere crear el directorio R_tempDir, asi es
> >> que verifica los permisos, por ahi debe haber alguna pista (windows
> >> tambien tiene permisos para cada directorio y los puedes cambiar),
> >>
> >> Suerte !!
> >>
> >> Eric.
> >>
> >>
> >>
> >>
> >> On 30/08/18 09:28, Javier Marcuzzi wrote:
> >> > Estimados
> >> >
> >> > Tengo un error en windows 10, el mensaje dice : Error fatal: cannot
> >> create
> >> > R_tempDir
> >> >
> >> > No tengo ni idea que pasó, esta semana no utilicé a R, hace dos
> semanas
> >> > seguro que sí, en el medio aparece el error, desinstalé y reinstalé
> >> > rstudio, de la misma forma R-Open de Microsoft 3.5.1, eliminé R
> client y
> >> > visual studio fue actualizado ayer. Intenté iniciar RServer desde
> visual
> >> > studio y no responde.
> >> >
> >> > Otro cambio que yo sepa no hay.
> >> >
> >> > ¿Alguna sugerencia?, justo hoy que tengo una reunión en un colegio de
> >> > profesionales y quería mostrar algo, bueno, no importa, en una hora se
> >> me
> >> > complica arreglar el problema.
> >> >
> >> > Javier Marcuzzi
> >> >
> >> >   [[alternative HTML version deleted]]
> >> >
> >> > ___
> >> > R-help-es mailing list
> >> > R-help-es@r-project.org
> >> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >> >
> >>
> >>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Cambiar la escala del eje x

2018-08-30 Thread Carlos Ortega
Hola,

Esto creo que te puede ayudar:

https://stackoverflow.com/questions/8054373/use-hours-on-the-x-axis-when-plotting-with-zoo-in-r

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 30 de agosto de 2018, 14:22, José Trujillo Carmona 
escribió:

> Estimados amigos
>
> Estoy dibujando las funciones acf y pacf de una variable de una serie
> "zoo":
>
> > ls.str(pat="T0.5")
> T0.5 : 'zoo' series from 2017-11-08 23:00:00 to 2017-11-15 06:59:00
>   Data: num [1:9120, 1:3] 55 49.8 51 50.1 36.5 ...
>   Index:  POSIXct[1:9120], format: "2017-11-08 23:00:00" "2017-11-08
> 23:01:00" "2017-11-08 23:02:00" "2017-11-08 23:03:00" "2017-11-08 23:04:00"
> "2017-11-08 23:05:00" ...
>
> En concreto la variable Difer:
>
> > T0.5$Difer[1:2]
> 2017-11-08 23:00:00 2017-11-08 23:01:00
>0.100.72
>
> Pero el problema que tengo es que me pone la escala del eje en segundos.
>
> > index(T0.5$Difer[1:2])
> [1] "2017-11-08 23:00:00 CET" "2017-11-08 23:01:00 CET"
>
> Es decir, 24 horas son 86400 unidades del eje.
>
> Preferiría que la escala del eje x del acf y del pacf fuesen o bien los
> retardos entre observaciones (1, 2, 3, ...) o en todo caso en minutos,
> horas, ...
>
> ¿Cómo se cambia la escala del eje? No los extremos del mismo (opción xlim)
> sino la escala.
>
> Muchas gracias de antemano.
>
> Saludos.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Media

2018-08-28 Thread Carlos Ortega
Salvo un par de casos, hemos reproducido perfectamente lo que ya aparece en
Stackoverflow

https://stackoverflow.com/questions/21982987/mean-per-group-in-a-data-frame

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 28 de agosto de 2018, 10:25, Patricio Suárez Gil 
escribió:

> Hola,
>
> ya se han dado muchas respuestas válidas, pero una de las más básicas
> sería con la función by():
>
> by(talla$long, talla$Año, mean, na.rm = T)
>
> añado el argumento na.rm = T por si hubiera datos perdidos.
>
> Un saludo,
>
>
> Patricio Suárez Gil
> Instituto de Investigación Sanitaria del Principado de Asturias (ISPA)
> Oviedo
>
>
>
>
>
>
>
>
>
>
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Media

2018-08-28 Thread Carlos Ortega
Ya puestos, hay otras formas:

1. función aggregate():
aggregate( Lon ~ Año, data = talla, mean)

2. sqldf
library(sqldf)
sqldf("select avg(Lon) as med_lon from tall group by Año")

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 28 de agosto de 2018, 2:27, Eric  escribió:

> Con la libreria data.table:
>
> as.data.table(tus.datos)
>
> tus.datos[, mean(Long), by=Año]
>
> Suerte !!!
>
> eric.
>
>
>
>
>
> On 27/08/18 19:23, Carlos Ortega wrote:
>
>> Hola,
>>
>> Puedes hacerlo de muchas formas, pero por seguir lo que más se utiliza
>> últimamente de "dplyr"...
>>
>> library(dplyr)
>> my_res <- talla %>%
>>       group_by(Año) %>%
>>   summarise( val_avg = mean(Long), n = n())
>> my_res
>>
>>
>> Saludos,
>> Carlos Ortega
>> www.qualiytexcellence.es
>>
>>
>> El 27 de agosto de 2018, 23:19, MAURICIO MARDONES <
>> mauricio.mardo...@ifop.cl
>>
>>> escribió:
>>> Estimada lista
>>>
>>> la pregunta es muy básica, pero necesito saber la Long media para cada
>>> año.
>>> Estoy pillando en el bucle.
>>>
>>> head(talla)
>>>>
>>>  X Long  Año
>>> 1 1   56 2016
>>> 2 2   58 2016
>>> 3 3   58 2016
>>> 4 4   58 2016
>>> 5 5   58 2016
>>> 6 6   58 2016
>>>
>>>> tail(talla)
>>>>
>>>  X Long  Año
>>> 2567630 2567630   86 2000
>>> 2567631 2567631   88 2000
>>> 2567632 2567632   88 2000
>>> 2567633 2567633   88 2000
>>> 2567634 2567634   89 2000
>>> 2567635 2567635   95 2000
>>>
>>> agradecería!
>>>
>>> Saludos
>>>
>>> --
>>>
>>> *Mauricio Mardones Inostroza*
>>>
>>> Investigador Departamento Evaluación de Recursos
>>> Instituto de Fomento Pesquero - IFOP
>>> Valparaíso - Chile
>>> +56-32-2151442
>>>
>>> www.ifop.cl
>>>
>>> --
>>> C*ertificación ISO 9001/2008*: Sistema de Datos
>>> Biológico-Pesqueros (Arica,
>>> Iquique, Coquimbo, Valparaíso, San Antonio, Talcahuano y Calbuco,
>>> pesquerías industriales y artesanales)
>>>
>>>  [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Media

2018-08-27 Thread Carlos Ortega
Hola,

Puedes hacerlo de muchas formas, pero por seguir lo que más se utiliza
últimamente de "dplyr"...

library(dplyr)
my_res <- talla %>%
 group_by(Año) %>%
 summarise( val_avg = mean(Long), n = n())
my_res


Saludos,
Carlos Ortega
www.qualiytexcellence.es


El 27 de agosto de 2018, 23:19, MAURICIO MARDONES  escribió:

> Estimada lista
>
> la pregunta es muy básica, pero necesito saber la Long media para cada año.
> Estoy pillando en el bucle.
>
> > head(talla)
> X Long  Año
> 1 1   56 2016
> 2 2   58 2016
> 3 3   58 2016
> 4 4   58 2016
> 5 5   58 2016
> 6 6   58 2016
> > tail(talla)
> X Long  Año
> 2567630 2567630   86 2000
> 2567631 2567631   88 2000
> 2567632 2567632   88 2000
> 2567633 2567633   88 2000
> 2567634 2567634   89 2000
> 2567635 2567635   95 2000
>
> agradecería!
>
> Saludos
>
> --
>
> *Mauricio Mardones Inostroza*
>
> Investigador Departamento Evaluación de Recursos
> Instituto de Fomento Pesquero - IFOP
> Valparaíso - Chile
> +56-32-2151442
>
> www.ifop.cl
>
> --
> C*ertificación ISO 9001/2008*: Sistema de Datos
> Biológico-Pesqueros (Arica,
> Iquique, Coquimbo, Valparaíso, San Antonio, Talcahuano y Calbuco,
> pesquerías industriales y artesanales)
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Crear un panel en R

2018-08-17 Thread Carlos Ortega
Hola,

Mira esto:

https://cloud.r-project.org/web/packages/BMisc/index.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 17 de agosto de 2018, 1:10,  escribió:

> Hola,
> Tengo que crear un panel de 9 fechas diferentes para hacer un análisis
> longitudinal para un conjunto de productos. Las variables son las mismas
> para cada fecha. ¿Me recomendáis algún enlace o fuente para saber cómo
> hacerlo? ¿Hay alguna función o paquete destinado a ello?
>
> Muchas gracias
> Miriam
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Contar DNI por Jurisdicción.

2018-08-06 Thread Carlos Ortega
O directamente un sencillo table:

resultado = table(tu_df$JURISDICCION, tu_df$DNI)

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 6 de agosto de 2018, 23:29, eric  escribió:

> Hola, una forma con la libreria data.table:
>
> library(data.table)
>
> as.data.table(el_data.frame)
>
> el_data.frame[, length(DNI), by=JURISDICCION]
>
>JURISDICCION V1
> 1:   As  3
> 2: Ríos  3
>
>
> Suerte !
>
> Eric.
>
>
>
>
>
> On 08/06/2018 04:45 PM, juan manuel dias wrote:
>
> Hola,
>
> Tengo el siguiente DATA FRAME
>
> DNI   JURISDICCION  DISPOSITIVO   NOMBRE  APELLIDO
> 1Bs As
> 2Bs As
> 3Bs As4Entre Ríos 
> <https://maps.google.com/?q=4Entre+R%C3%ADos=gmail=g>
> 5Entre Ríos
> 6Entre Ríos
>
> Quiero contar DNI por Jurisdicción, quedando una tabla que sea:
>
> DNI   JURISDICCION
> 3Bs As
> 3Entre Ríos
>
> Tanto DNI como Jurisdicción son factores.
>
> Muchas gracias.
>
> Saludos, Juan.
>
>   [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing 
> listR-help-es@r-project.orghttps://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> --
> Nota: Las tildes se han omitido para asegurar compatibilidad con algunos 
> lectores de correo.
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda ggplot

2018-07-27 Thread Carlos Ortega
Hola,

Aquí dan detalles de cómo hacerlo.

https://stackoverflow.com/questions/4332274/how-can-a-line-be-overlaid-on-a-bar-plot-using-ggplot2

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 27 de julio de 2018, 13:13, Jaume Tormo  escribió:

> Yo hice una vea un gráfico parecido, sin ggplot, el gráfico está aquí:
> https://acercad.wordpress.com/2009/05/05/acerca-de-otra-grafica-en-r/
>
> Jaume.
>
> El lunes, 23 de julio de 2018, Dayana Muñoz 
> escribió:
>
>> Estimad@s,
>>
>> Junto con saludar, quería saber si alguien me podría ayudar con este
>> gráfico, tengo un análisis de datos del año 2016 de 3 variables con dos
>> dimensiones (muestra objetivo y muestra lograda), y quería agregar la
>> comparación con el año 2015, me gustaría agregar un gráfico de linea y
>> puntos para el año 2015, pero no he podido lograrlo , la idea es generar un
>> gráfico de esta forma.  Adjunto mi scrip y mis bases.
>>
>> Agradeceré su colaboración.
>>
>>
>>
>>
>>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Legendas en una gráfica de ggplot2

2018-07-18 Thread Carlos Ortega
Hola,

Nos prodigamos poco en la lista en recomendar el uso de "addins", que
permiten ayudar en múltiples cosas con un par de clicks.
Con este puedes mejorar tu gráfico "ggplot" en gran medida (leyendas
incluidas):

https://github.com/calligross/ggthemeassist

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 18 de julio de 2018, 20:29, Sebastián Rangel 
escribió:

> ¡Gracias!  Espectacular. Me ha servido mucho.
>
> El mié., 18 de jul. de 2018 1:15 PM, Víctor Granda García <
> victorgrandagar...@gmail.com> escribió:
>
> > Hola Sebastián.
> >
> > Entiendo que tratas de que aparezca una leyenda con el tipo de curva
> > (l,o,u,i). Si quieres aprovechar las ventajas de ggplot (como las
> leyendas
> > automáticas) normalmente tienes que asignar linetype a una variable, y
> para
> > eso tienes que modificar un poco tus datos. Los has creado en formato
> > "wide" (ancho), donde tienes la columna t y una columna para cada curva.
> > Pero para lo que quieres hacer en ggplot, necesitas un formato "long"
> > (largo), donde tienes una columna con el tipo de curva (l,o,u,i) otra
> > columna con los valores para cada curva y la columna t, solo que repetida
> > para cada curva.
> >
> > Con este código puedes cambiar los datos y hacer la gráfica como quieres:
> >
> > library(ggplot2)
> >
> > t=seq (-4, 4, by=0.01)
> >
> >  Con b=-2
> >
> > l=exp(t+2)/(1+(exp(t+2)))
> >
> > ##con b igual a -1
> >
> > o=exp(t+1)/(1+(exp(t+1)))
> >
> > ### Con b igual a 0.7
> >
> > i=exp(t-0.7)/(1+(exp(t-0.7)))
> >
> > ### Con b igual a 2
> >
> > u=exp(t-2)/(1+(exp(t-2)))
> >
> > unir los datos
> > b=c(0.3,2,-1,-2)
> >
> > datos <- data.frame(
> >   t = t,
> >   l = l,
> >   o = o,
> >   i = i,
> >   u = u
> > )
> >
> > # ahora usamos gather, del paquete tidyr, porque nos permite pasar del
> > formato
> > # "wide" a "long"
> > library(tidyr)
> > # install.packages('tidyr')
> > datos_long <- gather(datos, Curva, Valor, 2:5)
> > datos_long
> >
> > ###Graficos
> >
> > ggplot(datos_long, aes(x = t, y = Valor, linetype = Curva)) +
> >   geom_line(color="gray48", size=1.2)+
> >   labs(x = expression(paste(theta)), y="Probabilidad")+
> >   theme(axis.text=element_text(size=14, face="bold"),
> > axis.title=element_text(size=14))
> >
> >
> > Como ves, datos_long ahora si que permite que asignes linetype a una
> > variable (Curva) y automáticamente te dibuja diferentes tipos de linea
> para
> > cada curva y te coloca una leyenda.
> >
> > Espero que te sirva, un saludo!!
> >
> > On Wed, 18 Jul 2018 at 19:50 Sebastián Rangel 
> > wrote:
> >
> >> Buenas tardes, estoy haciendo una gráfica de múltiples lineas pero no he
> >> podido generar las legendas. Alguno de ustedes me podría colaborar.
> >>
> >> library(ggplot2)
> >>
> >>  Con b=-2
> >> t=seq (-4, 4, by=0.01)
> >> l=exp(t+2)/(1+(exp(t+2)))
> >>
> >> ##con b igual a -1
> >>
> >> t=seq (-4, 4, by=0.01)
> >> o=exp(t+1)/(1+(exp(t+1)))
> >>
> >> ### Con b igual a 0.7
> >>
> >> t=seq (-4, 4, by=0.01)
> >> i=exp(t-0.7)/(1+(exp(t-0.7)))
> >>
> >> ### Con b igual a 2
> >>
> >> t=seq (-4, 4, by=0.01)
> >> u=exp(t-2)/(1+(exp(t-2)))
> >>
> >> unir los datos
> >> b=c(0.3,2,-1,-2)
> >> datos=cbind(l,o,i,u)
> >> datos=data.frame(datos)
> >>
> >> ###Graficos
> >>
> >> ggplot(  )+
> >>   geom_line(aes(y = i, x=t), color="gray48", size=1.2,
> linetype="dashed")
> >> +
> >>   geom_line(aes(y = u, x=t), color = "gray48",
> >> size=1.2,linetype="twodash")+
> >>   geom_line(aes(y = o,x=t),  color = "gray48",
> >> size=1.2,linetype="longdash") +
> >>   geom_line(aes(y = l,x=t),  color="gray48", size=1.2,linetype="solid")+
> >>  labs(x = expression(paste(theta)), y="Probabilidad")+
> >> theme(axis.text=element_text(size=14, face="bold"),
> >>   axis.title=element_text(size=14))
> >>
> >> Saludos,
> >>
> >> Sebastián Rangel Quiñonez
> >>
> >> [[alternative HTML version deleted]]
> >>
> >> ___
> >> R-help-es mailing list
> >> R-help-es@r-project.org
> >> https://stat.ethz.ch/mailman/listinfo/r-help-es
> >>
> > --
> > *Víctor Granda García*
> > Data Technician
> >
> >
> > v.gra...@creaf.uab.cat
> > Tel. +34 93 581 33 53
> >
> >
> > Campus UAB. Edifici C. 08193 Bellaterra (Barcelona) | *www.creaf.cat*
> > <http://www.creaf.uab.es/cat/index.htm>
> >
> > Abans d'imprimir aquest missatge electrònic penseu en el medi ambient.
> >
> >
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Guarar modelo y visualizarlo

2018-07-12 Thread Carlos Ortega
Hablar con el usuario y ver qué prefiere.. porque a lo mejor quiere recibir
un correo con las variables y el gráfico mejor que andar con el Shiny para
arriba y para abajo...

El 12 de julio de 2018, 17:02, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Desde tu experiencia, que harías?
>
> Gracias de antemano
>
> Obtener Outlook para Android <https://aka.ms/ghei36>
>
> ------
> *From:* Carlos Ortega 
> *Sent:* Thursday, July 12, 2018 3:20:50 PM
> *To:* Jesús Para Fernández
> *Cc:* r-help-es@r-project.org
> *Subject:* Re: [R-es] Guarar modelo y visualizarlo
>
> Hola,
>
> Pues depende...Hay pros y cons en cada caso.
>
> 1. Si lo guardas, tendrás que asegurarte de que están efectivamente
> guardados y si hay fallos a lo mejor tienes que tener un proceso adicional
> de comprobación. Como ventaja es que lo podrás enviar, consultar desde el
> mismo momento que lo generas.
> 2. Si utilizas un Shiny, concentras todo el esfuerzo en un único punto...
> que esté disponible el Shiny y que cuando haya algún problema aparezca el
> mensaje de error adecuado para el usuario.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El 12 de julio de 2018, 13:56, Jesús Para Fernández <
> j.para.fernan...@hotmail.com> escribió:
>
>> Buenas,
>>
>> tengo que crear unos modelos a las 12 de la noche, para ser visualizados
>> al dia siguiente. ¿Cual es la mejor manera? Genearr los graficos de
>> importancia de las variables de RandomForest y vvisualizarlos guardando
>> dichos graficos y metiendolos en una web o hacer algo con shiny server que
>> permita generar el grafico en tiempo real, tras haber guardado el modelo?
>>
>> Gracias
>> Jesús
>>
>> [[alternative HTML version deleted]]
>>
>>
>> _______
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Imposible instalar FactoMineR (KUbuntu 18.04)

2018-07-12 Thread Carlos Ortega
No es la versión de la librería con la que tienes tú el problema... pero
puede ayudar...

https://stackoverflow.com/questions/47608240/lavaan-dont-work-with-libgfortran-so-4-should-i-file-a-bugreport

Saludos,
Carlos Ortega
www.qualityexcellence.es

2018-07-12 16:02 GMT+02:00 Juan Abasolo :

> Buena tardes.
> La descripción es el asunto del mail y la salida que me da la siguiente:
>
> ```
> * installing *source* package ‘FactoMineR’ ...
> ** package ‘FactoMineR’ successfully unpacked and MD5 sums checked
> ** R
> ** data
> ** inst
> ** preparing package for lazy loading
> Error in dyn.load(file, DLLpath = DLLpath, ...) :
>   unable to load shared object
> '/home/juan/R/x86_64-pc-linux-gnu-library/3.4/leaps/libs/leaps.so':
>   libgfortran.so.3: cannot open shared object file: No such file or
> directory
> ERROR: lazy loading failed for package ‘FactoMineR’
> * removing ‘/home/juan/R/x86_64-pc-linux-gnu-library/3.4/FactoMineR’
> Warning in install.packages :
>   installation of package ‘FactoMineR’ had non-zero exit status
> ```
>
> Normalmente cuando me da error al instalar lo suelo solucionar reinstalando
> paquetes en R o alguna vez alguna librería desde repositorios. Pero con
> esta, no encuentro la solución. No estoy seguro si el problema es el
> `libgfortran.so.3` ese, pero, así fuese bueno el "diagnostico", no soy
> capaz de resolverlo ni de entender por dónde encarar.
>
> Agradezco, como de costumbre, alguien que me ilumine.
>
> Juan
>
>
> --
> Juan Abasolo
>
> Hizkuntzaren eta Literaturaren Didaktika Saila
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea
> UPV/EHU
>
> Sarriena auzoa z/g
> 48940 Leioa
> Bizkaia
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Guarar modelo y visualizarlo

2018-07-12 Thread Carlos Ortega
Hola,

Pues depende...Hay pros y cons en cada caso.

1. Si lo guardas, tendrás que asegurarte de que están efectivamente
guardados y si hay fallos a lo mejor tienes que tener un proceso adicional
de comprobación. Como ventaja es que lo podrás enviar, consultar desde el
mismo momento que lo generas.
2. Si utilizas un Shiny, concentras todo el esfuerzo en un único punto...
que esté disponible el Shiny y que cuando haya algún problema aparezca el
mensaje de error adecuado para el usuario.

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 12 de julio de 2018, 13:56, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas,
>
> tengo que crear unos modelos a las 12 de la noche, para ser visualizados
> al dia siguiente. ¿Cual es la mejor manera? Genearr los graficos de
> importancia de las variables de RandomForest y vvisualizarlos guardando
> dichos graficos y metiendolos en una web o hacer algo con shiny server que
> permita generar el grafico en tiempo real, tras haber guardado el modelo?
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Problemas con la funcion "apply"

2018-07-12 Thread Carlos Ortega
Hola,

Efectivamente la función "apply" te ayudaría mucho en este caso, y no hace
falta que pases por crear la función y evaluarla como haces.
Sería algo así.

quantvector=c(0.001,0.005,0.95,0.999)
res_ults <- apply(tu_dataframe, 1, qbeta, p=quantvector, shape1 =
tu_dataframe$shape1, shape2 = tu_dataframe$shape2)

El "1" de apply está indicando el MARGIN sobre el que ha de actuar de tu
dataframe, en este caso las filas.
Entiendo que tu dataframe tienbe una columna que es el "shape1" y otra el
"shape2".


Saludos,
Carlos Ortega
www.qualityexcellence.es




El 12 de julio de 2018, 11:44, javier bueno enciso  escribió:

> Buenos dias!
>
>
> Os escribo para ver si me podeis ayudar con un asunto en el que me he
> quedado un poco encallado.
>
>
> Lo que tengo que hacer es sacar los percentiles (0.001, 0.005, 0.95 y
> 0.999) de varias distribuciones beta, concretamente 418. Cada distribucion
> esta definida por los parametros "shape1" y "shape2". Por lo tanto tengo
> una base de datos de 418 filas y en cada una de ellas los parametros que me
> definen la distribucion beta, shape1 y shape2.
>
>
> Tengo el siguiente codigo:
>
>
> distrname="beta"
> shape1= 0.2 #ejemplo
> shape2= 0.3 #ejemplo
> quantvector=c(0.001,0.005,0.95,0.999)
> (paste("qvector=q",distrname,"(quantvector, shape1, shape2)",sep=""))
> eval(parse(text= paste("qvector=q",distrname,"(quantvector, shape1,
> shape2)",sep="") ))
> qvector
>
> Donde tengo problemas es en aplicar el anterior codigo para cada una de
> las filas de mi base de datos, especificando que shape1 es "mydata$shape1"
> y shape2 es "mydata$shape2". He pensado que quizas podria hacer una funcion
> con el anterior codigo y hacer un loop posterior para que me la aplique
> para cada una de mis filas.
>
> Sin embargo estoy convencido de que tiene que haber una manera mas directa
> utilizando la funcion "apply" de R o alguna de sus "hermanas", que
> funcionaria mejor.
>
> Me podriais ayudar? cualquier pista me seria de gran utilidad.
>
> Muchas gracias!!
>
> Javi
>
> P.D. si necesitais cualquier otra info o un ejemplo de los datos, no
> dudeis en pedirmelo.
>
>
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Completar un for, que falla al faltarle algún dato.

2018-07-07 Thread Carlos Ortega
Hola,

Aparece un problema porque en en el primer subset (sdf) hay algunos valores
de K que no existen.
Una forma de "protegerse" es esta, incluyendo un "NA" cuando eso ocurre...



for (j in J){
  print(j)
  sdf <- subset(df.raw1, df.raw1$Ques==j)
  for(k in K){
print(k)
x <- sdf[which(sdf$Info==k), "Answ"]


* if(length(x) == 0) {   df.ok[k, j ] <- "NA"} else { df.ok[k,j] <-
as.character(x) }*
  }
}

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 8 de julio de 2018, 0:25, Juan Abasolo  escribió:

> Buenas noches;
> Además del proyecto que comenté antes y con el que sigo discutiendo,
> también me estoy peleando con otro... con el que también tropiezo.
>
> Necesito reordenar los datos presentados en dos columnas a filas y
> columnas.
>
> Los datos ideales serían algo así:
>
> Ques <- c(rep("Q1",3),rep("Q2",3),rep("Q3",3))
> Info <- rep(c("aca", "ahi", "alla"),3)
> Answ <- c("casa", "bulo", "hogar", "mama", "mami", "vieja", "perro", "can",
> "rope")
>
> df.raw <- data.frame(ID, Ques, Info, Answ)
>
>
> Pero, como no son ideales, se parecen a esto:
>
> df.raw1 <- df.raw[-2,]
>
> # Necesito un dataframe con una estructura así:
>
> df.ok <- data.frame(matrix(ncol = length(levels(df.raw$Ques)), nrow =
> length(levels(df.raw$Info
>
> names(df.ok) <- levels(df.raw$Ques)
> rownames(df.ok) <- levels(df.raw$Info)
>
> # que incluya los datos de 'Answ' en donde correspondería
>
> J <- levels(df.raw$Ques)
> K <- levels(df.raw$Info)
>
> # El ideal me queda resuelto con esto:
>
> for (j in J){
> sdf <- subset(df.raw, df.raw$Ques==j)
> for(k in K){
> x <- sdf[which(sdf$Info==k), "Answ"]
> df.ok[k,j] <- as.character(x)
> }
> }
>
> Pero si en la segunda linea sustituyo df.raw por df.raw1
>
> for (j in J){
> sdf <- subset(df.raw1, df.raw1$Ques==j)
> for(k in K){
> x <- sdf[which(sdf$Info==k), "Answ"]
> df.ok[k,j] <- as.character(x)
> }
> }
>
> , ahí me da error.
>
> ¿Hay alguna forma de que asigne "" o NA o algo a quitar luego? O packete
> que haga el trabajo u orden para salvar lo que venía haciendo yo?
>
> Presupongo que será otra de esas respuestas evidentes, y disculpen lo largo
> de la exposición.
>
> Desde ya, muchas gracias
>
> --
> Juan Abasolo
>
> Hizkuntzaren eta Literaturaren Didaktika Saila
> Bilboko Hezkuntza Fakultatea
> Euskal Herriko Unibertsitatea
> UPV/EHU
>
> Sarriena auzoa z/g
> 48940 Leioa
> Bizkaia
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Grupo Usuarios de R de Madrid - Reunión miércoles 27-junio....

2018-06-28 Thread Carlos Ortega
Buenas a todos,

Ayer mantuvimos la reunión del Grupo de Usuarios de R de Madrid (la 53).
Aquí podéis encontrar el link al video de la presentación.

http://madrid.r-es.org/53-miercoles-27-de-junio-2018/

​Gracias,
Carlos Ortega
www.qualityexcellence.es​

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Transformar muchas variables factor en variables binarias de acuerdo a niveles

2018-06-25 Thread Carlos Ortega
Hola,

Aunque llego un poco tarde

   - El nuevo paquete de Max Kuhn, "recipes" tiene un transformador justo
   para esto, simplemente tienes que indicar las columnas en las que aplicar.
  - Viñeta:
  https://cloud.r-project.org/web/packages/recipes/vignettes/Dummies.html
   - Y acaba de salir otro paquete para esto justamente (fastDummies):
   - Viñeta:
  
https://cloud.r-project.org/web/packages/fastDummies/vignettes/making-dummy-variables.html


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 25 de junio de 2018, 19:36, Marcelino de la Cruz Rot <
marcelino.delac...@urjc.es> escribió:

> # Hola
> # Si te he entendido bien, lo que quieres hacer es lo mismo que hace R
> # cuando genera la model.matrix de un modelo lineal,
> # así que suponiendo que tienes esta data.frame:
>
>
> df  <-data.frame(a = c(1,2,3), b = c(1,1,2), c =
> c("Rose","Pink","Red"), d = c("a","b","c"), e=c("red","blue", "green"))
>
> df
>
> # y sabiendo el nombre de las variables de tipo factor
> # que quieres "binarizar", podrías hacer simplemente
>
> variables<-c("c", "d", "e")
>
> df2<-NULL
> for(i in variables){
> mm<- model.matrix(lm((1:dim(df)[1])~get(i)-1, data=df))
> dimnames(mm)[[2]] <- levels(df[,i])
>  df2<-cbind(df2,mm)}
>
>  df2
>
> # Saludos
> # Marcelino
>
>
>
> El 25/06/2018 a las 18:37, Jesús Para Fernández escribió:
>
>> Por cierto data.table tiene implementadas las funciones de reshape2 melt
>> y dcast pero mucho m�s r�pidasen ejecuci�n
>>
>> Obtener Outlook para Android<https://aka.ms/ghei36>
>>
>> 
>> From: R-help-es  on behalf of V�ctor
>> Granda Garc�a 
>> Sent: Monday, June 25, 2018 4:23:52 PM
>> To: Fernando Reche Lorite
>> Cc: r-help-es
>> Subject: Re: [R-es] Transformar muchas variables factor en variables
>> binarias de acuerdo a niveles
>>
>> En esta respuesta: https://stackoverflow.com/a/35663834/2301674
>>
>> tienes como hacerlo (mucho m�s sencillo que en la que enlazas t�) con
>> reshape2 o si prefieres la versi�n "tidy" con dplyr y tidyr (la que yo
>> recomiendo, pero solo porque me gusta m�s).
>>
>> Espero que te sirva
>>
>> On Mon, 25 Jun 2018 at 16:08 Fernando Reche Lorite via R-help-es <
>> r-help-es@r-project.org> wrote:
>>
>> Puedes probar con la funci�n dummy del paquete dummies.
>>>
>>> Un saludo
>>> Fernando Reche Lorite
>>> Departamento de Matem�ticas
>>> Universidad de Almer�a
>>>
>>> El 25 de junio de 2018, 15:55, Carlos J. Gil Bellosta <
>>> c...@datanalytics.com>
>>> escribi�:
>>>
>>> �No te vale model.matrix?
>>>>
>>>> El lun., 25 jun. 2018 a las 15:49, Juan Abasolo (>>> >)
>>>> escribi�:
>>>>
>>>> Buenas, compa�eros.
>>>>>
>>>>> Tengo una base de datos con bastantes variables todas medidas como
>>>>>
>>>> factor,
>>>>
>>>>> quiero que todos los factores pasen a ser variables binarias en funci�n
>>>>>
>>>> de
>>>>
>>>>> sus valores.
>>>>>
>>>>> En este ejemplo de Stackoverflow muestran como hacerlo con una
>>>>>
>>>> variable:
>>>
>>>> https://stackoverflow.com/questions/33990760/converting-
>>>>>
>>>> factors-to-binary-in-r
>>>>
>>>>> df  <-data.frame(a = c(1,2,3), b = c(1,1,2), c =
>>>>> c("Rose","Pink","Red"), d = c(2,3,4))
>>>>>
>>>>> cbind(df[1:2], sapply(levels(df$c), function(x) as.integer(x == df$c)),
>>>>> df[4])
>>>>>
>>>>> o as�
>>>>>
>>>>> library(data.table)
>>>>> setDT(df)[, c(levels(df$c), "c") :=
>>>>>  c(lapply(levels(c), function(x) as.integer(x == c)), .(NULL))]
>>>>>
>>>>>
>>>>> Pero no me resuelve el tener que hacerlo algunos cientos de veces, que
>>>>>
>>>> es
>>>
>>>> lo que querr�a evitar. S� que es evidente c�mo se tiene que hacer, pero
>>>>>
>>>> soy
>>>>
>>>>> ciego a esa evidencia :-(
>>>>>
>>>>> Muchas gracias por la ayuda
>>>>>
>>>

Re: [R-es] loop con matriz que cambia de nombre

2018-06-24 Thread Carlos Ortega
Hola,

En cada iteración de tu bucle, puedes:

   - Cambiar la matriz a data.frame.
   - Nombrar las columnas incluyendo si quieres el número de la iteración
   del bucle (tu "i").
  - Esto lo puedes hacer utiizando la función "paste()".
  - No sé si los nombres de las variables, en cada iteración han de
  seguir algún patrón.


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 22 de junio de 2018, 19:53, Manuel Mendoza 
escribió:

>
> Funciona, me crea una matriz en cada iteración, con un nombre que incluye
> el nº de la iteración. Me surge ahora el problema de que, dentro del mismo
> bucle la quiero convertir en df y ponerle nombre a las columnas, y como el
> nombre de la matriz es distinto cada vez, no sé cómo hacerlo. Supongo que
> se hará todo al crearla, pero no sé cómo.
>
> Un problema adicional es que las variables (columnas) también han de
> llevar la "i" incluida en el nombre, porque al final se fusionan todas las
> dfs y no se puede repetir el nombre de las variables.
>
> Gracias una vez más.
>
>
>
>
> Quoting Jesús Para Fernández :
>
> Con assing y un paste0
>>
>> Mete dentro del bucle esto
>>
>> for(i in 1:7){
>> assign(paste0('matriz',i),matrix(0,ncol=5,nrow=3))
>>
>> }
>>
>> Con eso generarias 7 matrices de 5x3, llamadas matriz1, matriz2,...
>>
>> Obtener Outlook para Android<https://aka.ms/ghei36>
>>
>> 
>> From: R-help-es  on behalf of Manuel
>> Mendoza 
>> Sent: Friday, June 22, 2018 10:15:55 AM
>> To: r-help-es@r-project.org
>> Subject: [R-es] loop con matriz que cambia de nombre
>>
>>
>> Buenos días. Quiero hacer un for (j), anidado en otro for (i). En el
>> 2º for, en cada iteración ha de crear una matriz vacía: mat <-
>> matrix(nrow=nrow(data),ncol=19) pero llamándola de forma distinta cada
>> vez. El nombre ha de ser: paste("D",i,colnames(Data[j]),sep=""). Llevo
>> un rato haciendo pruebas pero no me sale. A ver si alguien pudiera
>> ayudarme,
>> gracias,
>> Manuel
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>>
>> .
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>> _______
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Comparar variables fecha formato POSIXct

2018-06-17 Thread Carlos Ortega
Hola,

¿Puedes enviar una porción de tu dataframe por si al simularlo no lo
reproduzco correctamente ?
En cualquier caso, yo probaría a hacer un "merge()" pero de "data.table".

Saludos,
Carlos Ortega
www.qualityecellence.es

El 17 de junio de 2018, 1:43, Javier Gómez Gonzalez 
escribió:

> Tengo dos dataframe que corresponden a los valores horarios de los
> contaminantes y el otro a los valores horarios de las variables
> meteorológicas para el mismo periodo de tiempo. La variable temporal date
> en ambos dataframe tiene el formato dmy_hms.
>
> Los dataframe tienen diferente número de filas. dataframe contaminantes
> contiene 175247 filas y el dataframe meteorología 175321.
>
> Quiero saber cuáles son  los valores de la variable date que son distintos
> en ambos dataframe.
>
> He usado la función anti_join de dplyr dándome el siguiente error
>
> anti_join(meteorologia$date,contaminantes$date)
>
> Error in UseMethod("anti_join") :
>
>   no applicable method for 'anti_join' applied to an object of class
> "c('POSIXct', 'POSIXt')"
>
>
>
> También he empleado el paquete sqldf pero me da el siguiente error
>
> sqldf('SELECT * FROM meteorologia EXCEPT SELECT * FROM contaminantes')
>
> Error in result_create(conn@ptr, statement) :
>
>   SELECTs to the left and right of EXCEPT do not have the same number of
> result columns
>
> Gracias
>
> [[alternative HTML version deleted]]
>
> ___________
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Boxplot.stats

2018-06-13 Thread Carlos Ortega
Hola,

Es lo que te comentaba en la segunda parte de mi respuesta.

   - Puedes crearte una función para ver los puntos que se van un 1.5*IQR
   (por arriba y por abajo) y aplicar esta función a cada columna.
   - O puedes utilizar un paquete (outliers) que hace este trabajo (
   https://datascienceplus.com/outlier-detection-and-treatment-with-r/).


Saludos,
Carlos.

El 13 de junio de 2018, 16:03, Dayana Muñoz 
escribió:

> Gracias por las respuestas, pero mi pregunta no era como obtener los
> outliers, sino como puedo encontrar los outliers directamente en mi
> base,dado que si tuviese una base de datos de 2000 datos sería tedioso
> buscar uno a uno los valores atípicos encontrados.
>
> Gracias de todos modos por sus respuestas 
>
> ----------
> *De:* Carlos Ortega 
> *Enviado:* martes, 12 de junio de 2018 19:01
> *Para:* Dayana Muñoz
> *Cc:* r-help-es@r-project.org
> *Asunto:* Re: [R-es] Boxplot.stats
>
> Hola,
>
> Mira el ejemplo de la ayuda:
>
> #--
> > rb <- boxplot(decrease ~ treatment, data = OrchardSprays, col = "bisque")
> > title("Comparing boxplot()s and non-robust mean +/- SD")
> > rb
> $stats
>  [,1] [,2] [,3] [,4] [,5]  [,6] [,7]  [,8]
> [1,]  2.0  4.0  9.0 20.0   39  20.0 60.0  69.0
> [2,]  2.5  5.0 14.0 24.5   45  50.5 65.5  74.0
> [3,]  4.0  7.5 16.5 32.0   53  70.0 72.0  81.0
> [4,]  5.0  9.0 24.0 45.0   78  88.5 78.5 106.5
> [5,]  5.0 14.0 29.0 57.0  114 114.0 92.0 130.0
>
> $n
> [1] 8 8 8 8 8 8 8 8
>
> $conf
>  [,1] [,2] [,3] [,4] [,5] [,6] [,7]
> [,8]
> [1,] 2.603464 5.265543 10.91386 20.54841 34.56573 48.77265 64.73801
> 62.84503
> [2,] 5.396536 9.734457 22.08614 43.45159 71.43427 91.22735 79.26199
> 99.15497
>
>
>
>
>
> *$out [1] 12 84 24 $group [1] 1 3 7*
>
> $names
> [1] "A" "B" "C" "D" "E" "F" "G" "H"
>
> #--
>
> Y luego en la ayuda lo que dice:
>
> out
>
> the values of any data points which lie beyond the extremes of the
> whiskers.
> group
>
> a vector of the same length as out whose elements indicate to which group
> the outlier belongs.
>
> Entonces la forma de encontrar usando esta alternativa que propones es
> primero generar los diferentes grupos (que los marca la variable
> "treatment" ) y en el primer grupo el valor 12 es un outlier, en el grupo 3
> el 84 es otro outlier y en el grupo "7" el valor 24 es otro outlier.
>
> De todas formas, tienes formas más fáciles de encontrar estos outliers
> utilizando la función "IQR()" y aplicándola a cada uno de los grupos, esto
> es lo que hace la función boxplot.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> El 12 de junio de 2018, 18:19, Dayana Muñoz 
> escribió:
>
> Junto con saludar,
>
> Quería saber si los que han usado boxplot.stats, saben como ubicar los
> resultados que arroja como "out" (outliers) directamente en la base de
> datos, ya que, muestra los resultados en valor de cada dato atípico.
>
> Por ejemplo, estoy usando una base de datos con 300 datos y 10 columnas,
> en este caso estoy buscando los datos atípicos de la columna del precio de
> x producto, me arroja los out, pero no el número de fila, sino que el valor:
>
> $out
>  [1] 2039333000 8990717000 1965476000 2014958000 3609685000 4679092000
>  [7] 3276474000 1561967000 3898798000 4290957000 2140644000 178459
> [13] 2266295000 2540774000 1656117000 3762612000
>
> Quiero ver una forma que me identifique estos valores en la base de datos.
>
> Agradeceré sus orientaciones, saludos!
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Boxplot.stats

2018-06-12 Thread Carlos Ortega
Hola,

Mira el ejemplo de la ayuda:

#--
> rb <- boxplot(decrease ~ treatment, data = OrchardSprays, col = "bisque")
> title("Comparing boxplot()s and non-robust mean +/- SD")
> rb
$stats
 [,1] [,2] [,3] [,4] [,5]  [,6] [,7]  [,8]
[1,]  2.0  4.0  9.0 20.0   39  20.0 60.0  69.0
[2,]  2.5  5.0 14.0 24.5   45  50.5 65.5  74.0
[3,]  4.0  7.5 16.5 32.0   53  70.0 72.0  81.0
[4,]  5.0  9.0 24.0 45.0   78  88.5 78.5 106.5
[5,]  5.0 14.0 29.0 57.0  114 114.0 92.0 130.0

$n
[1] 8 8 8 8 8 8 8 8

$conf
 [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,] 2.603464 5.265543 10.91386 20.54841 34.56573 48.77265 64.73801 62.84503
[2,] 5.396536 9.734457 22.08614 43.45159 71.43427 91.22735 79.26199 99.15497





*$out[1] 12 84 24$group[1] 1 3 7*

$names
[1] "A" "B" "C" "D" "E" "F" "G" "H"

#--

Y luego en la ayuda lo que dice:

out

the values of any data points which lie beyond the extremes of the whiskers.
group

a vector of the same length as out whose elements indicate to which group
the outlier belongs.

Entonces la forma de encontrar usando esta alternativa que propones es
primero generar los diferentes grupos (que los marca la variable
"treatment" ) y en el primer grupo el valor 12 es un outlier, en el grupo 3
el 84 es otro outlier y en el grupo "7" el valor 24 es otro outlier.

De todas formas, tienes formas más fáciles de encontrar estos outliers
utilizando la función "IQR()" y aplicándola a cada uno de los grupos, esto
es lo que hace la función boxplot.

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 12 de junio de 2018, 18:19, Dayana Muñoz 
escribió:

> Junto con saludar,
>
> Quería saber si los que han usado boxplot.stats, saben como ubicar los
> resultados que arroja como "out" (outliers) directamente en la base de
> datos, ya que, muestra los resultados en valor de cada dato atípico.
>
> Por ejemplo, estoy usando una base de datos con 300 datos y 10 columnas,
> en este caso estoy buscando los datos atípicos de la columna del precio de
> x producto, me arroja los out, pero no el número de fila, sino que el valor:
>
> $out
>  [1] 2039333000 8990717000 1965476000 2014958000 3609685000 4679092000
>  [7] 3276474000 1561967000 3898798000 4290957000 2140644000 178459
> [13] 2266295000 2540774000 1656117000 3762612000
>
> Quiero ver una forma que me identifique estos valores en la base de datos.
>
> Agradeceré sus orientaciones, saludos!
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Plotear cilindros en un mapa

2018-06-12 Thread Carlos Ortega
Hola,

Cilndros no, pero puedes utilizar algo equivalente mientras encuentras una
solución utilizando el paquete "leaflet.minicharts".


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 12 de junio de 2018, 16:02, javier bueno enciso  escribió:

> Buenas tardes errer@s!
>
>
> Estoy atascado con un asunto de R y os escribo para ver si me podeis echar
> una mano. Necesito plotear en un mapa varios cilindros en 3d con un radio
> determinado, de manera que para cada "futuro cilindro" tengo un valor de
> longitud, otro de latitud y el radio. La altura de los cilindros debe ser
> constante para todos.
>
>
> Es la primera vez que uso R para trabajar con mapas y no tengo mucha idea.
> He visto el paquete rgl, la funcion cylinder3d. Con esta funcion
> posiblemente pueda dibujar un cilindro para cada "row" de mis datos, aunque
> estoy teniendo problemas tambien con eso. Podriais decirme tambien si hay
> alguna manera de georreferenciar esos cilindros?
>
>
> Cualquier ayuda seria de gran utilidad.
>
>
> Muchas gracias!
>
>
> Javi
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Fusionar por variable de texto

2018-06-07 Thread Carlos Ortega
Un ejemplo por favor
Y vemos lo que pasa. :-).

Gracias,
Carlos.

El 7 de junio de 2018, 21:34, Miriam Alzate 
escribió:

> Buenas tardes,
>
> Necesito fusionar dos dataframes por una variable de texto pero al hacerlo
> veo que no lo hace bien. ¿Hay alguna forma de que sí lo haga?
>
>
> Gracias
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] RELACIONAR TEMPERATURA CON POSICIONES

2018-06-05 Thread Carlos Ortega
Hola,

Para poder juntar las dos tablas tiene que existir un campo común.
Si es así, mira la función "merge()" que tiene múltiples ejemplos de cómo
se juntan tablas.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 5 de junio de 2018, 18:38, susan montero salgado 
escribió:

> Como puedo hacer is tengo dos tablas, una de temperatura y otra de
> posiciones, y por cada posiciones deseo tener una temperatura, que opción
> debo usar, les agradezco bastante.
>
> --
> Susan Geraldine Montero Salgado
> CEL(RPC): 989387552
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Prediccion de series temporales con keras

2018-06-02 Thread Carlos Ortega
Hola,

Mira este ejemplo detallado:

https://tensorflow.rstudio.com/blog/time-series-forecasting-with-recurrent-neural-networks.html

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 2 de junio de 2018, 7:29, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas
>
> Alguien sabe como se hacen las predicciones de las series temporslea
> usando keras?
>
> Baaado en esto:
> https://tensorflow.rstudio.com/blog/time-series-
> forecasting-with-recurrent-neural-networks.html
>
> He intentado hacer un predict_generator(test_data) pero siempre me
> devuelve el error de que el array no coincid con las dimensiones
>
> Gracias!!
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] CONVERSIÓN HORAS Y VECTORIZAR

2018-05-31 Thread Carlos Ortega
Hola,

Sí, de esta forma:

library(lubridate)
tu_dataframe$mi_hora <- hms(tu_vector_con_las_cadenas_de_las_horas)

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 31 de mayo de 2018, 16:57, David Contreras 
escribió:

> Buen día,
>
> Agradezco su colaboración con lo siguiente:
>
> Tengo la variable a que contiene horas en excel, al importarla a R sube en
> formato deciilmal. POr ejemplo la hora en excel aparece "10:45:00 a. m." al
> importarla a R queda "0.4479167". He usado el paquete chron y he logrado
> convertirla y verla como requiero. Sin embargo al querer pasarla a un
> vector y unirla en mi dataframe que contiene el resto de la información
> pierde las propiedades y la hora vuelve a quedar en formato decimal.
>
> Entrando más en detalle:
>
> hora: Objeto que Contiene la hora
> a: LIsta generada para convertir hora decimal a formato hora
>
> a<-lapply(dataframe[,'hora'],function(x)times(x))
>
> Como unirla al dataframe sin que pierda las propiedades??
>
> Gracias.
>
>
>
>
>
> *David Contreras*
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] predicciones sobre el OOB de randomForest

2018-05-31 Thread Carlos Ortega
Y prefieres "randomForest" a "ranger"...??...


El 31 de mayo de 2018, 13:03, Manuel Mendoza 
escribió:

> Gracias Carlos. No uso caret, pero lo miraré.
>
>
>
> Quoting Carlos Ortega :
>
> Hola,
>>
>> Creo que si utilizas "caret" y en la función "trainControl()" defines
>> "oob"
>> como criterio de randomización, puedes luego recuperar del objeto del
>> modelo, las predicciones individuales...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>>
>> 2018-05-31 12:56 GMT+02:00 Manuel Mendoza :
>>
>>
>>> Muy buenas, ¿sabe alguien cómo obtener las predicciones sobre el out of
>>> bag que hace randomForest?
>>>
>>> Manuel
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>>
>>> .
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] predicciones sobre el OOB de randomForest

2018-05-31 Thread Carlos Ortega
Hola,

Creo que si utilizas "caret" y en la función "trainControl()" defines "oob"
como criterio de randomización, puedes luego recuperar del objeto del
modelo, las predicciones individuales...

Saludos,
Carlos Ortega
www.qualityexcellence.es



2018-05-31 12:56 GMT+02:00 Manuel Mendoza :

>
> Muy buenas, ¿sabe alguien cómo obtener las predicciones sobre el out of
> bag que hace randomForest?
>
> Manuel
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> .
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tabla dinamica R

2018-05-24 Thread Carlos Ortega
Hola,

Si crees que con un equivalente a las "PivotTables" de Excel lo
solucionarías...
Puedes usar esto:

https://cloud.r-project.org/web/packages/pivottabler/index.html


pivottabler: Create Pivot Tables in R

Create regular pivot tables with just a few lines of R. More complex pivot
tables can also be created, e.g. pivot tables with irregular layouts,
multiple calculations and/or derived calculations based on multiple data
frames. Pivot tables are constructed using R only and can be written to a
range of output formats (plain text, 'HTML', 'Latex' and 'Excel'),
including with styling/formatting.
Saludos,
Carlos Ortega
www.qualityexcellence.es


El 24 de mayo de 2018, 19:59, Santiago Repetto <santiagopnss...@gmail.com>
escribió:

> Hola!
>
> Solicito ayuda con un data frame relativamente grande ¿? del cual necesito
> generar una tabla dinámica a la manera excel.
> Si me pueden referenciar algún comando, paquete, pagina web y/o cualquier
> ayuda que me puedan dar será muy bienvenida.
>
> Lo que tengo que hacer es pasar de algo así:
>
> NombreMunicipio NombreProvincia Categoria idMedicamento CodMedicamento
> CodMedicamentoOL UnidadesEnvSec
> CAPITAL CORDOBA CENTRO DE ATENCION PRIMARIA DE LA SALUD 117 72 CLCA072 1
> CAPITAL CORDOBA CENTRO DE ATENCION PRIMARIA DE LA SALUD 117 72 CNVC070 144
> RIO CUARTO CORDOBA CENTRO DE ATENCION PRIMARIA DE LA SALUD 117 72 CMJA085
> 28
> CAPITAL CORDOBA CENTRO DE ATENCION PRIMARIA DE LA SALUD 811 250 CNPA250 50
> RIO CUARTO CORDOBA CENTRO DE ATENCION PRIMARIA DE LA SALUD 811 250 CLCA072
> 1
> RIO CUARTO CORDOBA HOSPITAL PUBLICO 811 250 CNPA250 50
> BERAZATEGUI BUENOS AIRES CENTRO DE ATENCION PRIMARIA DE LA SALUD 262 301
> CIHA301 1
> BERAZATEGUI BUENOS AIRES CENTRO DE ATENCION PRIMARIA DE LA SALUD 262 301
> CNPA251 25
> TIGRE BUENOS AIRES CENTRO DE ATENCION PRIMARIA DE LA SALUD 262 301 CNQA071
> 35
> TIGRE BUENOS AIRES CENTRO DE ATENCION PRIMARIA DE LA SALUD 815 628 CO6A628
> 1
> TIGRE BUENOS AIRES CENTRO DE ATENCION PRIMARIA DE LA SALUD 815 628 CNPA070
> 144
>
>
> pasar, seleccionando algunos campos (rótulos de fila, rótulos de columna y
> valores del excel), a algo así:
>
>
> NombreProvincia NombreMunicipio 117 262 811 815
> BUENOS AIRES BERAZATEGUI 26
>   TIGRE 35 145
> Total BUENOS AIRES 61   145
> CORDOBA CAPITAL 145 50
>   RIO CUARTO 28 51
> Total CORDOBA   173   101
>
> Muchas gracias desde ya y perdón por las molestias.
>
> Saludos y buen fin de semana!
>
> Santiago
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-23 Thread Carlos Ortega
Mira estos ejemplos:

> library(stringr)
> dataset <- c("corn", "cornmeal", "corn on the cob", "meal")
> my_data <- c('corn', 'corn on')
>
> # for mere occurences of the pattern:
> str_count(dataset, "corn on")
[1] 0 0 1 0
> # [1] 1 1 1 0
>
> # for occurences of the word alone:
> str_count(dataset, "\\bcorn\\b")
[1] 1 0 1 0
> # [1] 1 0 1 0
>
> # summing it up
> sum(str_count(dataset, "corn"))
[1] 3
>
> str_count(dataset, my_data)
[1] 1 0 1 0
>

Que son una adaptación de lo que se cuenta aquí:

https://stackoverflow.com/questions/7782113/count-word-occurrences-in-r

Si no es exactamente, entonces ya haría falta que pusieras varios ejemplos
de lo que esperas por contemplar todas las variantes que existen con tus
datos y que quieres detectar.

Gracias,
Carlos.

El 23 de mayo de 2018, 8:42, JCMld <jc...@carmonarocha.com> escribió:

> Hola,
>
> Se me ocurre lo siguiente, no sé si es lo que buscas.
>
> Supongamos que tienes la lista de palabras a cotejar en p y en t el las
> variables de texto donde quieres saber en cada una cuántas palabras de p
> aparecen. Si hacemos:
>
>
> p<-c("perro","gato","pez")
> t<-c("un perro","un perro y un gato y otro perro","un gato y un pez","un
> perro-gato y un pez")
>
> unlist(lapply(t,function(s) sum(unlist(lapply(p,function(x)
> length(grep(x,s)))
>
> obtenemos
> [1] 1 2 2 3
>
> Es decir, en t[1] aparece 1 de las palabras (perro), en t[2] aparecen 2
> (perro y gato), en t[3] 2 (gato y pez) y en t[4] las 3.
> Si los textos los tienes en una variable de un data.frame entonces deberás
> sustituirlo por tu la columna del data frame, algo del estilo df$texto, en
> el código.
>
> Saludos,
> Juan Carmona.
>
>
> -Mensaje original-
> De: R-help-es [mailto:r-help-es-boun...@r-project.org] En nombre de
> miriam.alz...@unavarra.es
> Enviado el: miércoles, 23 de mayo de 2018 2:29
> Para: Carlos Ortega
> CC: r-help-es
> Asunto: Re: [R-es] Pasar palabras de una lista a una variable del dataframe
>
> Muchas gracias Carlos,
>
> Me da error al hacerlo. Mi variable donde quiero que localice las palabras
> de la lista tiene más de una palabra, no se si puede ser por eso.
>
> Gracias
> El Mar, 22 de Mayo de 2018, 20:15, Carlos Ortega escribió:
> > Hola,
> >
> > Aquí tienes un ejemplo (reproducible)...
> >
> > #---
> >> # Generar nombres de mujer
> >> library(randNames)
> >> val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female')
> >> head(val_tmp)
> > # A tibble: 6 x 25
> >   gender email dob registered   phone  cell  nat   name.title
> > name.first name.last location.street  location.city location.state
> > 
> > 
> > 1 female angeles.… 1958-0… 2004-05-06 … 932-2… 683-… ESms
> >  angelesvega  3550 calle del … lugo  cataluña
> > 2 female esther.s… 1947-0… 2004-04-16 … 982-5… 674-… ESmrs
> > esther santos9690 calle de l… toledoislas baleares
> > 3 female eva.parr… 1967-0… 2013-04-02 … 902-3… 644-… ESmiss   eva
> >   parra 2484 calle de t… la palma  melilla
> > 4 female sandra.p… 1957-0… 2005-03-28 … 919-8… 642-… ESms
> >  sandra prieto9084 calle de á… parla castilla y le…
> > 5 female veronica… 1952-0… 2004-03-20 … 959-4… 609-… ESmrs
> > veronica   moreno9672 calle del … elche la rioja
> > 6 female alejandr… 1973-0… 2005-03-28 … 907-9… 680-… ESmiss
> >  alejandra  saez  1507 calle de p… san sebastián castilla la m…
> > # ... with 12 more variables: location.postcode , login.username
> > , login.password , login.salt , login.md5 ,
> > #   login.sha1 , login.sha256 , id.name , id.value ,
> > picture.large , picture.medium ,
> > #   picture.thumbnail 
> >> val_end <- val_tmp$name.first
> >>
> >> # Como ejemplo elijo los 10 primeros de esos nombres.
> >> my_lista <- val_end[1:10]
> >> my_lista
> >  [1] "angeles"   "esther""eva"   "sandra""veronica"
> > "alejandra" "irene" "lidia" "vanesa""mercedes"
> >>
> >> # Hago efectiva la comparación.
> >> library(stringr)
> >> res_coincide <- str_match_all(val_end, my_lista)
> >> res_end <- table(unlist(res_coincide))
> >> res_end
> >
> > alejandra   a

Re: [R-es] Pasar palabras de una lista a una variable del dataframe

2018-05-22 Thread Carlos Ortega
Hola,

Aquí tienes un ejemplo (reproducible)...

#---
> # Generar nombres de mujer
> library(randNames)
> val_tmp <- rand_names(1000, nationality = 'ES', gender = 'female')
> head(val_tmp)
# A tibble: 6 x 25
  gender email dob registered   phone  cell  nat   name.title
name.first name.last location.street  location.city location.state


1 female angeles.… 1958-0… 2004-05-06 … 932-2… 683-… ESms
 angelesvega  3550 calle del … lugo  cataluña
2 female esther.s… 1947-0… 2004-04-16 … 982-5… 674-… ESmrs
esther santos9690 calle de l… toledoislas baleares
3 female eva.parr… 1967-0… 2013-04-02 … 902-3… 644-… ESmiss   eva
  parra 2484 calle de t… la palma  melilla
4 female sandra.p… 1957-0… 2005-03-28 … 919-8… 642-… ESms
 sandra prieto9084 calle de á… parla castilla y le…
5 female veronica… 1952-0… 2004-03-20 … 959-4… 609-… ESmrs
veronica   moreno9672 calle del … elche la rioja
6 female alejandr… 1973-0… 2005-03-28 … 907-9… 680-… ESmiss
 alejandra  saez  1507 calle de p… san sebastián castilla la m…
# ... with 12 more variables: location.postcode , login.username
, login.password , login.salt , login.md5 ,
#   login.sha1 , login.sha256 , id.name , id.value ,
picture.large , picture.medium ,
#   picture.thumbnail 
> val_end <- val_tmp$name.first
>
> # Como ejemplo elijo los 10 primeros de esos nombres.
> my_lista <- val_end[1:10]
> my_lista
 [1] "angeles"   "esther""eva"   "sandra""veronica"
"alejandra" "irene" "lidia" "vanesa""mercedes"
>
> # Hago efectiva la comparación.
> library(stringr)
> res_coincide <- str_match_all(val_end, my_lista)
> res_end <- table(unlist(res_coincide))
> res_end

alejandra   angelesesther   eva irene lidia  mercedes
sandravanesa  veronica
2 3 3 1 2 1 1
   3 2 1
>
#---


Gracias,
Carlos.

El 22 de mayo de 2018, 18:45, Miriam Alzate <miriam.alz...@unavarra.es>
escribió:

> Buenas tardes,
>
> Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
> aparecen en cada observación de mi variable "texto". La variable "texto" es
> de tipo caracter. ¿Cómo lo haríais?
>
> Muchas gracias.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Próximo Jueves 10-mayo - Reunión Grupo Usuarios de R de Madrid....

2018-05-10 Thread Carlos Ortega
Buenas a todos,

Ya está disponible el material de la reunión que hemos celebrado hoy.

http://madrid.r-es.org/52-jueves-10-de-mayo-2018/

Gracias a todos los que pudieron venir!.
Carlos Ortega
www.qualityexcellence.es

El 6 de mayo de 2018, 22:51, Carlos Ortega <c...@qualityexcellence.es>
escribió:

> Buenas a todos,
>
> El próximo jueves 10-mayo esperamos celebrar la siguiente reunión del
> "Grupo de R de Madrid".
>
> Para los que queráis asistir:
>
> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-
> Madrid/events/250522560/
>
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Próximo Jueves 10-mayo - Reunión Grupo Usuarios de R de Madrid....

2018-05-06 Thread Carlos Ortega
Buenas a todos,

El próximo jueves 10-mayo esperamos celebrar la siguiente reunión del
"Grupo de R de Madrid".

Para los que queráis asistir:

https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madrid/events/250522560/


Gracias,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Interpretación NA's

2018-04-19 Thread Carlos Ortega
Pues que la pequeña variación en las ventas no pueden explicarse con un
precio constante.
Hay otra variable que las explica o simplemente por un efecto aleatorio.

De esta forma lo que sí que le puedes decir a negocio, es que si quieres
entender la elasticidad de tus ventas, tienes que hacer algo diferente a
tener los precios constantes: incluir una promoción, cambiar el precio,
para ver la sensibilidad del precio a estos cambios... en resumen hacer un
experimento.

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 19 de abril de 2018, 17:42, Javier Nieto <mac_j...@hotmail.com> escribió:

> Hola
>
>
> Tal vez la pregunta que tengo tenga una respuesta muy fácil, sin embargo
> lo entiendo.
>
>
> Tengo una data frame que se ve así:
>
> R> df
>semana  precios ventas preciosCan
> 1   11724 3.512441  2  33.53
> 2   11726 3.512441  1  33.53
> 3   11727 3.512441  2  33.53
> 4   11728 3.512441  1  33.53
> 5   11729 3.512441  4  33.53
> 6   11730 3.512441  3  33.53
> 7   11731 3.512441  2  33.53
> 8   11732 3.512441  3  33.53
> 9   11734 3.512441  2  33.53
> 10  11735 3.512441  6  33.53
> 11  11736 3.512441  2  33.53
> 12  11738 3.512441  3  33.53
> 13  11739 3.512441  2  33.53
> 14  11741 3.512441  2  33.53
> 15  11743 3.512441  1  33.53
> 16  11744 3.512441  2  33.53
> 17  11746 3.512441  1  33.53
> 18  11747 3.512441  2  33.53
> 19  11748 3.512441  3  33.53
> 20  11749 3.512441  1  33.53
> 21  11750 3.512441  3  33.53
> 22  11751 3.512441  1  33.53
> 23  11801 3.512441  1  33.53
> R> lm(ventas ~ precios, df)
>
> Call:
> lm(formula = ventas ~ precios, data = df)
>
> Coefficients:
> (Intercept)  precios
>   2.174   NA
>
>
>
> ¿Qué significa que aparezca NA en la regresión y el intercepto con ese
> valor(2.174)?
>
>
> La pregunta surge a razón de que otros subconjuntos de datos se comportan
> bien con una regresión lineal.
>
> Entiendo que por el comportamiento de los datos salen esos resultados, sin
> embargo no logro realizar un interpretación correcta y mucho menos qué
> hacer o cómo proceder con este subconjunto de datos o como explicarlo a
> gente de negocio.
>
>
> Por favor ¿alguien me podría ayudar con esto?
>
>
>
>
>
>
> Muchas gracias.
>
>
> Saludos
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar variables de data frame a una sola variable

2018-04-18 Thread Carlos Ortega
Hola,

Mira la forma de hacerlo aquí:

https://stackoverflow.com/questions/7398998/re-arrange-multiple-columns-in-a-data-set-into-one-column-using-r

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 18 de abril de 2018, 15:34, Diego Iglesias <diego.ib...@gmail.com>
escribió:

> Hola erreros!
>
> Acudo de nuevo a ustedes porque ando enredado con algo que debe ser simple
> pero que no consigo. Lo que ando buscando hacer es pasar todas las
> variables de un dataframe a solo una variable (columna) con la info
> apilada. Lo que tengo es un dataframe así (con 200 variables y 30,000
> filas):
>
> Var1 Var2 Var3
> 1 5 9
> 2 6 10
> 3 7 11
> 4 8 12
> y lo que necesito es convertirlo a:
>
> Var1
> 1
> 2
> 3
> 4
> 5
> 6
> 7
> 8
> 9
> 10
> 11
> 12
> Me queda la duda también de cómo se podría hacer a la inversa.
> Gracias de antemano por su ayuda!
>
> Diego Iglesias
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Averiguar qué variables tiene el máximo valor

2018-04-14 Thread Carlos Ortega
Hola,
Solo te falta incluir ese vector de índices en el vector de nombres.
Aquí tienes un ejemplo:

> head(airquality)
  Ozone Solar.R Wind Temp Month Day
141 190  7.4   67 5   1
236 118  8.0   72 5   2
312 149 12.6   74 5   3
418 313 11.5   62 5   4
5NA  NA 14.3   56 5   5
628  NA 14.9   66 5   6
> val_ind <- apply(airquality, 1, which.max)
> col_val <- names(airquality)[val_ind]
> col_val
  [1] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Temp""Temp""Solar.R"
"Solar.R" "Temp""Solar.R" "Temp""Solar.R" "Solar.R"
 [14] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Temp"
"Temp""Solar.R" "Temp""Solar.R" "Solar.R" "Solar.R"
 [27] "Temp""Temp""Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
 [40] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Temp""Solar.R" "Solar.R" "Solar.R"
 [53] "Temp""Solar.R" "Solar.R" "Solar.R" "Solar.R" "Temp""Solar.R"
"Temp""Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
 [66] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Solar.R" "Temp""Solar.R" "Solar.R"
 [79] "Solar.R" "Solar.R" "Solar.R" "Temp""Solar.R" "Solar.R" "Solar.R"
"Solar.R" "Temp""Temp""Solar.R" "Solar.R" "Solar.R"
 [92] "Solar.R" "Solar.R" "Temp""Temp""Temp""Temp""Temp"
"Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
[105] "Solar.R" "Solar.R" "Temp""Temp""Temp""Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Temp""Solar.R" "Solar.R" "Solar.R"
[118] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R"
[131] "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Solar.R" "Temp"
"Solar.R" "Solar.R" "Solar.R" "Temp""Solar.R" "Solar.R"
[144] "Solar.R" "Temp""Solar.R" "Temp""Temp""Solar.R" "Solar.R"
"Solar.R" "Solar.R" "Solar.R"

Gracias,
Carlos Ortega
www.qualityexcellence.es



El 14 de abril de 2018, 23:23, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Hola de nuevo. Mi problema es parecido al anterior.
>
> Tengo una df con n filas con un valor para cada una de las 5 variables (v1
> a v5), y necesito construir un vector con la variable para la que cada fila
> tiene el valor máximo. El vector tendrá n elementos del tipo
> v3,v2,v2,v5,
>
> vec<- apply(df,1,which.max) me funciona, pero nuevamente me da la posición
> de las variables en vez de sus nombres. Quizás haya otra opción.
>
> Gracias nuevamente,
> Manuel
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Miércoles 11 - Abril - Reunión Grupo Usuarios de R de Madrid...

2018-04-10 Thread Carlos Ortega
Disculpad el error...
La reunión es el miércoles de la semana que viene. *Miércoles 18 de abril.*

Gracias y siento la confusión...
Carlos.

El 8 de abril de 2018, 17:34, Carlos Ortega <c...@qualityexcellence.es>
escribió:

> Buenas a todos,
>
> Para los que puedan y quieran asistir.
>
> El próximo miércoles 11-abril celebraremos la siguiente reunión del "Grupo
> de R de Madrid", será la reunión* 51* cumplimos un año más.
>
> Los detalles de la reunión los podéis encontrar aquí:
>
> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-
> Madrid/events/249270146/
>
> Gracias!
> Carlos Ortega
> www.qualityexcellence.es
>
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Miércoles 11 - Abril - Reunión Grupo Usuarios de R de Madrid...

2018-04-08 Thread Carlos Ortega
Buenas a todos,

Para los que puedan y quieran asistir.

El próximo miércoles 11-abril celebraremos la siguiente reunión del "Grupo
de R de Madrid", será la reunión* 51* cumplimos un año más.

Los detalles de la reunión los podéis encontrar aquí:

https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madrid/events/249270146/

Gracias!
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] r python interfaz

2018-04-05 Thread Carlos Ortega
Ufff... Siento disentir y mucho...

"R son sus paquetes".

Mirad la presentación que hizo Dirk Eddelbeutel (autor de Rcpp y Presidente
de la Fundación de R) hace unos días en el Meetup de Chicago.
http://dirk.eddelbuettel.com/papers/chirug_mar2018_extending.pdf

Habla justamente de esto, de cómo se puede extender "R" para poder
entenderse con otros lenguajes y comienza con lo que el propio John
Chambers en su libro reciente del 2016 (Extending R) definió como los
principales principios de "R".

*Three Principles (Section 1.1) *
*Object: Everything that exists in R is an object. *
*Function:  Everything that happens in R is a function call. *

*Interface: Interfaces to other software are part of R.*

Y en cuanto a RStudio, no sé que sería de nosotros sin su IDE (gratuito)
envidia de otros lenguajes. Y sí su ecosistema (porque Hadley Wickham ahora
es empleado) tidyverse sigue extendiéndose y creciendo incluso con otras
contribuciones fuera de RStudio y sigue creciendo porque son cada vez más
los usuarios de R que lo usan frente al R-Base u otras alternativas
(data.table por ejemplo). Y sin contar con que realmente es la única
alternativa (para mí) viable para introducir R en una empresa (y usar R en
Producción) con su stack (RStudio_Server, Connect y Shiny_Server). O usar
su cloud para hacer pruebas...
(disclaimer: no soy empleado de RStudio... pero me gustaría... :-) ).

Y bueno, recordar que el uso de un paquete u otro es un tema de elección...

R sigue funcionando como los de esta foto... pero hay algunas empresas como
"RStudio" que están ordenando el aparente caos.
https://twitter.com/seathebass/status/872499220850278400


Y en particular con respeto a la integración de R-Python, creo que sin el
avance que ha supuesto "reticulate" (y  que esté integrado de forma tan
transparente en RStudio, y mantenido por ellos), sin ese avance R se
quedaría muy atrás en todo lo que está suponiendo DeepLearning. La
integración con Keras es fantástica y la integración con Python nos va a
ofrecer ventajas para usar los dos lenguajes de forma conjunta.


Gracias,
Carlos Ortega
www.qualityexcellence.es



>
> El 5 de abril de 2018, 10:36, Jesús Para Fernández <
> j.para.fernan...@hotmail.com> escribió:
>
>> Totalmente de acuerdo. Creo q rstudio hace un gran trabajo pero se esta
>> cargando la comunidad de R...
>>
>>
>>
>> Obtener Outlook para Android<https://aka.ms/ghei36>
>>
>> 
>> From: R-help-es <r-help-es-boun...@r-project.org> on behalf of Freddy
>> Omar López Quintero <freddy.lopez.quint...@gmail.com>
>> Sent: Thursday, April 5, 2018 2:41:52 AM
>> To: Javier Marcuzzi
>> Cc: r-help-es
>> Subject: Re: [R-es] r python interfaz
>>
>> La herramienta seguramente es buena; pero a mí particularmente no deja de
>> sorprenderme el cisma que desde RStudio se está provocando en el sentido
>> que ya casi ni usamos R sino R + X, donde X es cualquiera cosa que
>> produzca
>> RStudio, aún cuando esto duplique/ignore/arrebate/pase por alto/opaque el
>> trabajo de mucha gente antes (incluyendo, sospecho yo, el mismo R base).
>> Así es la evolución de las cosas, me contesto.
>>
>> 2018-04-04 19:40 GMT-03:00 Javier Marcuzzi <javier.ruben.marcuzzi@gmail.c
>> om>
>> :
>>
>> > Estimados
>> >
>> > Recuerdo que hace unos años en esta lista con uno de los Carlos se había
>> > creado un hilo sobre R y python, hoy leo una noticia, por lo menos para
>> mí,
>> > que podría entrar en esa situación entre lo mejor de dos alternativas.
>> >
>> > Lógicamente, es nuevo para mí, no puedo opinar nada más que compartir la
>> > información, probar, usar, y cada uno puede utilizar o rechazar la
>> > herramienta.
>> >
>> > Miren http://blog.rstudio.com/2018/03/26/reticulate-r-interface-to
>> -python/
>> >
>> > Javier Rubén Marcuzzi
>> >
>> > [[alternative HTML version deleted]]
>> >
>> > ___
>> > R-help-es mailing list
>> > R-help-es@r-project.org
>> > https://stat.ethz.ch/mailman/listinfo/r-help-es
>> >
>>
>>
>>
>> --
>> «...homines autem hominum causa esse generatos...»
>>
>> Cicero
>>
>>     [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>> [[alternative HTML version deleted]]
>>
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Meetup conjunto "Machine Learning Spain" + "Grupo Usuarios de R de Madrid"....

2018-04-02 Thread Carlos Ortega
Buenas a todos,

Nos acaban de compartir los dos videos de la reunión conjunta con el grupo
e "Machine Learning Spain".
Podéis encontrar las presentaciones aquí:

http://madrid.r-es.org/50-miercoles-14-de-marzo-2018/

Gracias,
Carlos.


El 15 de marzo de 2018, 19:56, Carlos Ortega <c...@qualityexcellence.es>
escribió:

> Buenas a todos,
>
> Ayer realizamos un Meetup conjunto con el grupo de "Machine Learning
> Spain".
> Parte del material ya está subido a nuestro portal.
>
> http://madrid.r-es.org/50-miercoles-14-de-marzo-2018/
>
> Estamos a la espera de que nos compartan los videos. Por si queréis ir
> viendo la parte de Santiago, mi parte es la misma que la que presenté en la
> reunión del Grupo hace unas semanas.
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Pasar argunmentos string a una formula

2018-03-29 Thread Carlos Ortega
Hola,

Pero...

En vez de pasar el string, puedes pasar solamente el valor...

n_tree <- c(200, 300, 400)

for(i in n_tree) {

randomForest(Species ~ ., data=iris, maxnodes=4, ntree=i))

}

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 29 de marzo de 2018, 10:52, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas
>
> Tengo en un string guardado lo siguiente:
>
> > parametros
> [1] "ntree=10"  "ntree=30"  "ntree=50"  "ntree=100" "ntree=200"
>
>
> Con un bucle for quiero ir metiendolo en el modelo, pero no se muy bien
> como hacerlo, ya que con deparse no me funciona, con get tampoco (obvio, no
> es un objeto), y no se muy bien como hacerlo de manera dinamica
>
> for(i in seq_along(parametros)){
> modelo <- randomForest(Class~.,datos,parametros[i])
> }
>
>
> Es importante que me coja la cadena entera y no solo cambiar el numero de
> arboles, pe"ntree=10", ya que si cambio a un svm, ... quiero tb meter los
> parametros por cadena, desde una funcion.
>
> Gracias!!
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Condición if

2018-03-27 Thread Carlos Ortega
En tu función, has incluido la condición de "si", te falta un argumento
adicional para "entonces"...

Puedes hacerlo así:
CUADRO_FINAL$VA_con_reemplazo <- ifelse(CUADRO_FINAL$VA < 0,
CUADRO_FINAL$Remuneraciones_Brutas, CUADRO_FINAL$VA)

o así:

library(dplyr)

Cuadro_final_otro <- CUADRO_FINAL %>%
mutate( VA_con_reemplazo = ifelse( VA < 0,
Remuneraciones_Brutas, VA) )

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 27 de marzo de 2018, 21:20, Dayana Muñoz <dayanaa...@hotmail.com>
escribió:

> Estimad@s,
>
>
> Junto con saludar agradeceré me puedan ayudar con lo siguiente
>
>
> Estoy trabajando con 3 bases de datos, las que uní y dejé en un data frame
> todo lo que necesitaba y los cálculos asociados, pero me falta hacer una
> cosa. Quiero hacer una condición, primero que nada mi data queda de la
> siguiente forma:
>
>
> CUADRO_FINAL=data.frame(Datos3,VBP,CI,VA,VentasInformadas,
> Remuneraciones_Brutas)
>
>
> Con mi resumen ya obtenido me doy cuenta que quiero incorporar una columna
> adicional, que se llame "VA_con_reemplazo", esta columna me debe indicar
> que cuando mi columna de VA sea < 0 , el valor de ese dato sea reemplazado
> por el dato de mi columna ya creada "Remuneraciones_Brutas".
>
>
> He estado intentando de la siguiente forma... pero no me corre
>
>
> recodificar<-function(x){
>   ifelse(x<0,"Remuneraciones_Brutas")
> }
>
> CUADRO$VA_con_reemplazo<-recodificar("Remuneraciones_Brutas")
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Thread Carlos Ortega
Hola,

Repasa muy bien dos cosas:

   - El nombre de tu variable.
   - en tu primer correo la variable se llama "DIVISION" todo en mayúsculas.
  - Y en lo que has hecho con "ifelse()" pones "División".
  - Para "R" los dos nombres son diferentes.
  - Y cuidado con los acentos...si es posible no los pongas.
   - Si todo lo anterior era consistente (los nombres estaban bien, eran
   iguales en los dos casos).
  - Prueba a ver la clases de la variable.
  - Haz "class(BD$nombre_variable)"
 - Puede que tu variable sea de clase "character" y no puedas
 entonces aplicar una condición (ifelse) pensando que es un número...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 23 de marzo de 2018, 15:37, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimada Dayana Muñoz
>
> Leí muy rápido para dar una respuesta acertada y completa, pero en el
> primer if hay un problema, no use tantos ifelse, y el 59 no tiene donde ir,
> porque busca los menores y luego los iguales o mayores a 60.
>
> Javier Rubén Marcuzzi
>
> El 23 de marzo de 2018, 11:12, Dayana Muñoz <dayanaa...@hotmail.com>
> escribió:
>
> > He tratado de usar lo siguiente:
> >
> > a<- ifelse(BD$División>=50 &  BD$División<59,"D",
> >  ifelse (BD$División>=60  &  BD$División<=69,"G",
> >  ifelse (BD$División>=70  &
> > BD$División<=79,"L",
> >  ifelse (BD$División>=80  &
> > BD$División<=89,"M",
> >  ifelse (BD$División>=90
> > &  BD$División<=99,"N","Z")
> >
> >
> >
> > Pero me arroja puros NA como resultado.
> >
> >
> >
> >
> >
> > --
> > *De:* Javier Marcuzzi <javier.ruben.marcu...@gmail.com>
> > *Enviado:* viernes, 23 de marzo de 2018 11:04:16
> > *Para:* Dayana Muñoz
> > *Cc:* r-help-es@r-project.org
> > *Asunto:* Re: [R-es] Ayuda con R-Studio condiciones
> >
> > Estimada Dayana Muñoz
> >
> > Separemos el problema en dos, la primer parte es la condición, para esto
> > puede utilizar la forma que le resulte más apropiada, la segunda parte es
> > utilizar por ejemplo cbind al data.frame original, en otras palabras a
> los
> > datos les pega el resultado de la condición en una nueva columna.
> >
> > Javier Rubén Marcuzzi
> >
> > El 23 de marzo de 2018, 10:54, Dayana Muñoz <dayanaa...@hotmail.com>
> > escribió:
> >
> > Estimados,
> >
> >
> > Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> > que tengo: Tengo una base de datos llamada "BD", la cuál posee 300
> columnas
> > y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> > dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva
> columna
> > (adicional), llamada "SECCION" que me clasifique con letras los valores
> > numéricos que tengo en la columna "DIVISION":
> >
> >
> > ID  TAMAÑO x
> > DIVISION  GRUPOCLASE
> >
> > 338576
> >
> >
> >
> > Grande
> >
> > 2
> >
> > 82
> >
> > 821
> >
> > 8219
> >
> > 338421
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 58
> >
> > 581
> >
> > 5813
> >
> > 352821
> >
> >
> >
> > Mediana
> >
> > 2
> >
> > 96
> >
> > 960
> >
> > 9603
> >
> > 340936
> >
> >
> >
> > Grande
> >
> > 1
> >
> > 68
> >
> > 681
> >
> > 6810
> >
> > 340937
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 77
> >
> > 773
> >
> > 7730
> >
> > 340938
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 71
> >
> > 712
> >
> > 7120
> >
> > 353517
> >
> >
> >
> > Grande
> >
> > 1
> >
> > 73
> >
> > 731
> >
> > 7310
> >
> > 340940
> >
> >
> >
> > Grande
> >
> > 3
> >
> > 71
> >
> > 711
> >
> > 7110
> >
> > 340941
> >
> >
> >
> > Grande
>

Re: [R-es] Ayuda con R-Studio condiciones

2018-03-23 Thread Carlos Ortega
Hola,

Mira la función "ifelse()" que te ayudará con esto...

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 23 de marzo de 2018, 14:54, Dayana Muñoz <dayanaa...@hotmail.com>
escribió:

> Estimados,
>
>
> Junto con saludar, agradeceré si alguien me pueda ayudar con un problema
> que tengo: Tengo una base de datos llamada "BD", la cuál posee 300 columnas
> y 2800 filas, tengo una columna llamada "DIVISION" que se compone de dos
> dígitos. Lo que quiero hacer, pero no sé como es: Generar una nueva columna
> (adicional), llamada "SECCION" que me clasifique con letras los valores
> numéricos que tengo en la columna "DIVISION":
>
>
> ID  TAMAÑO x
> DIVISION  GRUPOCLASE
>
> 338576
>
>
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
>
> 338421
>
>
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
>
> 352821
>
>
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
>
> 340936
>
>
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
>
> 340937
>
>
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
>
> 340938
>
>
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
>
> 353517
>
>
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
>
> 340940
>
>
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
>
> 340941
>
>
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
>
> 340942
>
>
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
>
>
> Por ejemplo:
>
>
> Quiero que me clasifique en la nueva columna llamada SECCION, todas las
> divisiones de 50 a 59 con la letra D, de 60 a 69 con la letra G, las de 70
> a 79 con la letra L, las de 80 a 89 con la letra M, las de 90 a 99 con la
> letra N, de tal forma de conseguir esto:
>
>
>
> ID  TAMAÑO  X   DIVISIONGRUPO   CLASE   SECCION
> 338576
>
> Grande
>
> 2
>
> 82
>
> 821
>
> 8219
> M
> 338421
>
> Grande
>
> 3
>
> 58
>
> 581
>
> 5813
> D
> 352821
>
> Mediana
>
> 2
>
> 96
>
> 960
>
> 9603
> N
> 340936
>
> Grande
>
> 1
>
> 68
>
> 681
>
> 6810
> G
> 340937
>
> Grande
>
> 3
>
> 77
>
> 773
>
> 7730
> L
> 340938
>
> Grande
>
> 3
>
> 71
>
> 712
>
> 7120
> L
> 353517
>
> Grande
>
> 1
>
> 73
>
> 731
>
> 7310
> L
> 340940
>
> Grande
>
> 3
>
> 71
>
> 711
>
> 7110
> L
> 340941
>
> Grande
>
> 3
>
> 69
>
> 691
>
> 6910
> G
> 340942
>
> Grande
>
> 3
>
> 73
>
> 731
>
> 7310
> L
>
>
> Agradeceré mucho si alguien me pueda orientar en como conseguir esta nueva
> columna
>
> Saludos!
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] Meetup conjunto "Machine Learning Spain" + "Grupo Usuarios de R de Madrid"....

2018-03-15 Thread Carlos Ortega
Buenas a todos,

Ayer realizamos un Meetup conjunto con el grupo de "Machine Learning Spain".
Parte del material ya está subido a nuestro portal.

http://madrid.r-es.org/50-miercoles-14-de-marzo-2018/

Estamos a la espera de que nos compartan los videos. Por si queréis ir
viendo la parte de Santiago, mi parte es la misma que la que presenté en la
reunión del Grupo hace unas semanas.

Gracias,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Imputar NA a SQL Server

2018-03-09 Thread Carlos Ortega
Respuesta á lá SQL...

https://www.red-gate.com/simple-talk/sql/t-sql-programming/filling-in-missing-values-using-the-t-sql-window-frame/

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 9 de marzo de 2018, 21:59, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Eso pensé yo pero leyendo la documentación no debe ser algo trivial...
>
> Obtener Outlook para Android<https://aka.ms/ghei36>
>
> 
> From: Javier Marcuzzi <javier.ruben.marcu...@gmail.com>
> Sent: Friday, March 9, 2018 12:44:25 PM
> To: Jesús Para Fernández
> Cc: Lista R
> Subject: Re: [R-es] Imputar NA a SQL Server
>
> Estimado Jesús Para Fernández
>
> Pueden ser las comillas, "NULL" vs NULL, se me ocurre realizar una
> exportación de datos a csv, solo para verificar si aparece escrito NA o
> queda el espacio vacío, por alguna causa ¿no estará como texto? Tendría que
> intentar duplicar su problema en mi computadora, me resulta extraño, es
> algo muy básico que debe estar más que aceitado. O probar str(los_datos) o
> summary(los_datos), deberían aparecer NA's
>
> Javier Rubén Marcuzzi
>
> El 9 de marzo de 2018, 4:52, Jesús Para Fernández <
> j.para.fernan...@hotmail.com<mailto:j.para.fernan...@hotmail.com>>
> escribió:
> No , lo mete como string...
>
> Obtener Outlook para Android<https://nam02.safelinks.protection.outlook.
> com/?url=https%3A%2F%2Faka.ms%2Fghei36=02%7C01%7C%
> 7C5f99b06a9f93426c804608d585b31c8e%7C84df9e7fe9f640afb435
> %7C1%7C0%7C636561926668096204=rhrKlDhGHQOuD1CvalsvhskkCQ3Nll
> YrjOSCr%2FNVzvs%3D=0>
>
> 
> From: Javier Marcuzzi <javier.ruben.marcu...@gmail.com javier.ruben.marcu...@gmail.com>>
> Sent: Friday, March 9, 2018 3:47:46 AM
> To: Jesús Para Fernández
> Cc: Lista R
> Subject: Re: [R-es] Imputar NA a SQL Server
>
> Estimado Jesús Para Fernández
>
> Pruebe lo siguiente:
>
> str_replace_all(values, "'NA'", "NULL")
>
>
>
> El 8 de marzo de 2018, 17:38, Jesús Para Fernández <
> j.para.fernan...@hotmail.com<mailto:j.para.fernan...@hotmail.com>>
> escribió:
> Buenas,
>
> Quiero meter NULL en algunos valores al hacer un insert en una base ded
> datos SQL Server, pero no me reconoce NA, por lo que no se como meterlos...
>
> ¿Alguno sabe como podria hacerse? La opción de no meter el valor no es
> válida porque tengo que meter varias columans y los NA se pueden dar en
> cualqueira de ellas...
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org<mailto:R-help-es@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es<https://
> nam03.safelinks.protection.outlook.com/?url=https%3A%2F%
> 2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es=02%7C01%7C%
> 7C67eb1287deac480218d208d585682488%7C84df9e7fe9f640afb435
> %7C1%7C0%7C636561604691129230=%2FFAVzCEw%
> 2BGSSjiUfAsXlIyAY0cdMpn%2B1j47TP94PJDA%3D=0>
>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Contar categorías después de ciertos valores

2018-03-09 Thread Carlos Ortega
Hola,

Esta es una forma...

#-

x <- c(3, "A", "B", 5, "A", 4, 5, "A", "A", 3)
x_n <- as.numeric(x)

cat_val <- unique(x[is.na(x_n)])
num_val <- x_n[!is.na(x_n)]

df <- data.frame(
  x_n = x_n,
  y = 1:length(x_n),
  x = x,
  x_l = is.na(df$x_n)
 )

num_df <- data.frame( nume = 0, letra = 0)
cont <- 0
for(i in 1:nrow(df)) {
  if (df[i, 4] == FALSE & df[i + 1, 4] != FALSE & i < nrow(df)) {
num <- df[i, 1]
  }
  if (df[i, 4] != FALSE) {
cont <- cont + 1
num_df[cont, 1]  <-  num
num_df[cont, 2] <- as.vector(df[i, 3])
  }
  if (df[i, 4] == FALSE & df[i + 1, 4] == FALSE & i < nrow(df)) {
cont <- cont + 1
num <- df[i, 1]
num_df[cont, 1] <-  num
num_df[cont, 2] <- 0
  }

}


library(dplyr)
library(tidyr)

res_df <- num_df %>%
  group_by(nume, letra) %>%
  summarize( res = n()) %>%
  spread( letra, res)

res_df[is.na(res_df)] <- 0
res_df

#-


Que produce este resultado:

> res_df
# A tibble: 3 x 4
# Groups:   nume [3]
   nume   `0` A B
 
13.0.1.1.
24.1.0.0.
35.0.3.0.

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 9 de marzo de 2018, 16:02, <guillermo.vi...@uv.es> escribió:

> Hola,
>
> Estoy intentando averiguar cómo contar el número de categorías situadas
> después de ciertos valores. Por ejemplo, en el siguiente vector:
>
> x <- c(3, "A", "B", 5, "A", 4, 5, "A", "A", 3)
>
> el resultado que quisiera obtener es:
>
> Valor -> Resultado
> 3 -> 1 A y 1 B
> 4 -> 0 A y 0 B
> 5 -> 3 A y 0 B
>
> ¿Alguien tiene alguna sugerencia?.
>
> Muchas gracias de antemano.
>
> Guillermo
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Grupo de Usuarios de R de Madrid]: Mañana 8-marzo. Reunión.

2018-03-09 Thread Carlos Ortega
En la siguiente te esperamos...!

El 9 de marzo de 2018, 21:20, José Luis Cañadas <canadasre...@gmail.com>
escribió:

> Gracias Carlos. Una pena no haber podido ir.
>
>
> El vie., 9 mar. 2018 21:16, Carlos Ortega <c...@qualityexcellence.es>
> escribió:
>
>> Disculpad, la dirección correcta es esta:
>>
>> http://madrid.r-es.org/49-jueves-8-de-marzo-2018/
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> El 9 de marzo de 2018, 20:04, Carlos Ortega <c...@qualityexcellence.es>
>> escribió:
>>
>> > Buenas a todos,
>> >
>> > ¡Gracias a los que pudieron venir!.
>> >
>> > Ya están disponibles los videos de la sesión de ayer aquí:
>> >
>> > http://madrid.r-es.org/49-jueves-8-de-marzo-2017/
>> >
>> > Gracias,
>> > Carlos Ortega
>> > www.qualityexcellence.es
>> >
>> >
>> >
>> > El 7 de marzo de 2018, 11:10, José Luis Cañadas <canadasre...@gmail.com
>> >
>> > escribió:
>> >
>> >> Lamentablemente no puedo ir. Luego veo las charlas cuando las colguéis.
>> >>
>> >>
>> >>
>> >> El mié., 7 mar. 2018 a las 9:41, Carlos Ortega (<
>> c...@qualityexcellence.es>)
>> >> escribió:
>> >>
>> >>> Buenas a todos,
>> >>>
>> >>> Mañana celebramos la reunión mensual del "Grupo de Usuarios de R de
>> >>> Madrid". Para todos aquellos que quieran y puedan asistir.
>> >>>
>> >>> Para más detalles aquí:
>> >>>
>> >>> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madri
>> >>> d/events/248021127/
>> >>>
>> >>> Gracias,
>> >>> Carlos Ortega
>> >>> www.qualityexcellence.es
>> >>>
>> >>> [[alternative HTML version deleted]]
>> >>>
>> >>> ___
>> >>> R-help-es mailing list
>> >>> R-help-es@r-project.org
>> >>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>> >>>
>> >>
>> >
>> >
>> > --
>> > Saludos,
>> > Carlos Ortega
>> > www.qualityexcellence.es
>> >
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> [[alternative HTML version deleted]]
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Grupo de Usuarios de R de Madrid]: Mañana 8-marzo. Reunión.

2018-03-09 Thread Carlos Ortega
Disculpad, la dirección correcta es esta:

http://madrid.r-es.org/49-jueves-8-de-marzo-2018/

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 9 de marzo de 2018, 20:04, Carlos Ortega <c...@qualityexcellence.es>
escribió:

> Buenas a todos,
>
> ¡Gracias a los que pudieron venir!.
>
> Ya están disponibles los videos de la sesión de ayer aquí:
>
> http://madrid.r-es.org/49-jueves-8-de-marzo-2017/
>
> Gracias,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
> El 7 de marzo de 2018, 11:10, José Luis Cañadas <canadasre...@gmail.com>
> escribió:
>
>> Lamentablemente no puedo ir. Luego veo las charlas cuando las colguéis.
>>
>>
>>
>> El mié., 7 mar. 2018 a las 9:41, Carlos Ortega (<c...@qualityexcellence.es>)
>> escribió:
>>
>>> Buenas a todos,
>>>
>>> Mañana celebramos la reunión mensual del "Grupo de Usuarios de R de
>>> Madrid". Para todos aquellos que quieran y puedan asistir.
>>>
>>> Para más detalles aquí:
>>>
>>> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madri
>>> d/events/248021127/
>>>
>>> Gracias,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Grupo de Usuarios de R de Madrid]: Mañana 8-marzo. Reunión.

2018-03-09 Thread Carlos Ortega
Buenas a todos,

¡Gracias a los que pudieron venir!.

Ya están disponibles los videos de la sesión de ayer aquí:

http://madrid.r-es.org/49-jueves-8-de-marzo-2017/

Gracias,
Carlos Ortega
www.qualityexcellence.es



El 7 de marzo de 2018, 11:10, José Luis Cañadas <canadasre...@gmail.com>
escribió:

> Lamentablemente no puedo ir. Luego veo las charlas cuando las colguéis.
>
>
>
> El mié., 7 mar. 2018 a las 9:41, Carlos Ortega (<c...@qualityexcellence.es>)
> escribió:
>
>> Buenas a todos,
>>
>> Mañana celebramos la reunión mensual del "Grupo de Usuarios de R de
>> Madrid". Para todos aquellos que quieran y puedan asistir.
>>
>> Para más detalles aquí:
>>
>> https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-
>> Madrid/events/248021127/
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> [[alternative HTML version deleted]]
>>
>> ___________
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] ver los resutados cuando son muy extensos y normalmente se cortan

2018-03-08 Thread Carlos Ortega
Mejor que volcarlos a la consola... utiliza este paquete para visualizar
las relaciones..

https://cloud.r-project.org/web/packages/corrr/index.html

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 8 de marzo de 2018, 10:22, Yesica Pallavicini Fernandez <
yesipa...@gmail.com> escribió:

> Gracias Carlos y Xavy
>
> Efectivamente, cuando la salida del resultado es muy grande y por defecto
> se cortan y no los puedes ver, se puede usar el comando
> options(max.print=9)
>
>
> Saludos
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] exportar resultados a CSV

2018-03-08 Thread Carlos Ortega
Hola,


   - Puedes exportar cualquier variable a csv con la función "write()" que
   tiene múltiples parámetros para determinar el formato de salida, separador,
   etc.
   - Y sobre la primera pregunta, si R no te muestra todos los resultados
   es porque hay un límite de resultados que se pueden mostrar por pantalla.
   Esto lo puedes cambiar con "options()". Creo que por defecto son 1500
   líneas, pero es con esta función como puedes cambiar a lo que necesites.
  - Entiendo que no es que te esté generando un error o que R se quede
  colgado. Puede ocurrir si la matriz de la que quieres obtener las
  correlaciones es demasiado grande. Por tu siguiente pregunta en el foro
  parece que este no es el caso.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 8 de marzo de 2018, 8:32, Yesica Pallavicini Fernandez <
yesipa...@gmail.com> escribió:

> Hola,
> tengo dos dudas
> 1) he corrido una matriz de correlación con demasiadas variables y R no me
> muestra todos los resultados porque ha llegado a su máxima capacidad. ¿cómo
> puedo ver tdos los resultados?
>
> 2) Quisiera exportar los resultados a un CVS para poder verlos mejor ¿Se
> puede hacer?
>
> Gracias
> Yésica
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Reglas de asociación en un cluster Hadoop

2018-03-07 Thread Carlos Ortega
Sí, a través de "sparklyr" y delegando el trabajo a las MLlib..
Aquí tienes una referencia que pone un ejemplo:

https://longhowlam.wordpress.com/2017/11/23/association-rules-using-fpgrowth-in-spark-mllib-through-sparklyr/

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 7 de marzo de 2018, 13:45, Oscar Benitez <oscar.benitez1...@gmail.com>
escribió:

> Hola,
>
> Quizás no es el ámbito más apropiado, pero vale la pena intentar.
>
> ¿Existe alguna implementación en R del modelo de reglas de asociación que
> pueda realizar el cálculo en paralelo sobre un cluster Hadoop?
>
> He visto los paquetes que 'paralelizan' R, pero no mencionan nada acerca de
> modelos de reglas de asociación.
>
> Saludos
>
> --
> Oscar Benitez
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Más filtrado de variables

2018-03-07 Thread Carlos Ortega
Ah, sorry, no había entendido lo de no repetir la primera clase.
¿En este caso con cuál habría que quedarse...?..

Otra forma de hacerlo más compacta (hasta aclarar el punto) es así:


Lines <- "   GRUPO ORDENCLASE
1  A 1 CLASE-01
2  A 2 CLASE-02
3  A 5 CLASE-03
4  B 1 CLASE-01
5  B 2 CLASE-02
6  B 5 CLASE-03
7  B 7 CLASE-04
8  C 2 CLASE-02
9  C 5 CLASE-03
10 C 7 CLASE-04
11 D 5 CLASE-03
12 D 7 CLASE-04
13 E 1 CLASE-06
14 F 2 CLASE-02
15 F 5 CLASE-03
16 F 7 CLASE-05
17 G 1 CLASE-07"

DF <- read.table(textConnection(Lines), header = TRUE, as.is = TRUE)

library(data.table)
DT <- as.data.table(DF)
DT[, .SD[1], by="GRUPO"]

> DT[, .SD[1], by="GRUPO"]
   GRUPO ORDENCLASE
1: A 1 CLASE-01
2: B 1 CLASE-01
3: C 2 CLASE-02
4: D 5 CLASE-03
5: E 1 CLASE-06
6: F 2 CLASE-02
7: G 1 CLASE-07



El 7 de marzo de 2018, 13:35, jose luis <pepe...@yahoo.es> escribió:

> Tienes razón Javier, enseguida se me acaban las CLASES, tendría que
> descartar demasiadas.
> En el ejemplo de Carlos Ortega estaría perfecto si no se repitiera la
> primera CLASE-01.
> No se si tendré que tirar por otro lado...
>
>
> El Miércoles 7 de marzo de 2018 13:26, Carlos Ortega <
> c...@qualityexcellence.es> escribió:
>
>
> Hola,
>
> Aquí, tienes otra forma que es bastante sencilla de leer/entender...
>
>
> Lines <- "   GRUPO ORDENCLASE
> 1  A 1 CLASE-01
> 2  A 2 CLASE-02
> 3  A 5 CLASE-03
> 4  B 1 CLASE-01
> 5  B 2 CLASE-02
> 6  B 5 CLASE-03
> 7  B 7 CLASE-04
> 8  C 2 CLASE-02
> 9  C 5 CLASE-03
> 10 C 7 CLASE-04
> 11 D 5 CLASE-03
> 12 D 7 CLASE-04
> 13 E 1 CLASE-06
> 14 F 2 CLASE-02
> 15 F 5 CLASE-03
> 16 F 7 CLASE-05
> 17 G 1 CLASE-07"
>
> library(dplyr)
> DF %>%
>   group_by(GRUPO) %>%
>   select(GRUPO, ORDEN, CLASE) %>%
>   filter(ORDEN == min(ORDEN))
>
>
> Y que produce este resultado...
>
> > library(dplyr)
> > DF %>%
> +   group_by(GRUPO) %>%
> +   select(GRUPO, ORDEN, CLASE) %>%
> +   filter(ORDEN == min(ORDEN))
> # A tibble: 7 x 3
> # Groups:   GRUPO [7]
>   GRUPO ORDEN CLASE
> 
> 1 A 1 CLASE-01
> 2 B 1 CLASE-01
> 3 C 2 CLASE-02
> 4 D 5 CLASE-03
> 5 E 1 CLASE-06
> 6 F 2 CLASE-02
> 7 G 1 CLASE-07
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
>
> El 7 de marzo de 2018, 12:00, jose luis via R-help-es <
> r-help-es@r-project.org> escribió:
>
> Adjunto txt por si no se ve bien, disculpas
>
>
> El Miércoles 7 de marzo de 2018 11:53, jose luis via R-help-es <
> r-help-es@r-project.org> escribió:
>
>
> Buenas. A ver si a alguien se le ocurre cómo hacer este filtrado. Quiero
> seleccionar para cada GRUPO el numero de ORDEN más pequeño (que podría ser
> con wich.min(ORDEN)), pero sin que se repita la CLASE, de modo que si la
> CLASE-01 salió en el primer GRUPO ya no salga más.
>
>
>
>  GRUPO   ORDENCLASEA   1   CLASE-01A
> 2   CLASE-02A   5   CLASE-03B   1   CLASE-01
> B   2   CLASE-02B   5   CLASE-03B   7
> CLASE-04C   2   CLASE-02C   5   CLASE-03C
> 7   CLASE-04D   5   CLASE-03D   7   CLASE-04
> E   1   CLASE-06F   2   CLASE-02F   5
> CLASE-03F   7   CLASE-05G   1   CLASE-07
>  Tendría que quedarme tal que así:
>
> GRUPO ORDEN CLASEA   1   CLASE-01B   2
>   CLASE-02C   5   CLASE-03D   7
> CLASE-04E   1   CLASE-06F   7   CLASE-05
> G   1   CLASE-07
>
> Un saludo
>
> Jose Luis
>
> [[alternative HTML version deleted]]
>
> ______ _
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/ listinfo/r-help-es
> <https://stat.ethz.ch/mailman/listinfo/r-help-es>
>
>
> __ _
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/ listinfo/r-help-es
> <https://stat.ethz.ch/mailman/listinfo/r-help-es>
>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Más filtrado de variables

2018-03-07 Thread Carlos Ortega
Hola,

Aquí, tienes otra forma que es bastante sencilla de leer/entender...


Lines <- "   GRUPO ORDENCLASE
1  A 1 CLASE-01
2  A 2 CLASE-02
3  A 5 CLASE-03
4  B 1 CLASE-01
5  B 2 CLASE-02
6  B 5 CLASE-03
7  B 7 CLASE-04
8  C 2 CLASE-02
9  C 5 CLASE-03
10 C 7 CLASE-04
11 D 5 CLASE-03
12 D 7 CLASE-04
13 E 1 CLASE-06
14 F 2 CLASE-02
15 F 5 CLASE-03
16 F 7 CLASE-05
17 G 1 CLASE-07"

library(dplyr)
DF %>%
  group_by(GRUPO) %>%
  select(GRUPO, ORDEN, CLASE) %>%
  filter(ORDEN == min(ORDEN))


Y que produce este resultado...

> library(dplyr)
> DF %>%
+   group_by(GRUPO) %>%
+   select(GRUPO, ORDEN, CLASE) %>%
+   filter(ORDEN == min(ORDEN))
# A tibble: 7 x 3
# Groups:   GRUPO [7]
  GRUPO ORDEN CLASE

1 A 1 CLASE-01
2 B 1 CLASE-01
3 C 2 CLASE-02
4 D 5 CLASE-03
5 E 1 CLASE-06
6 F 2 CLASE-02
7 G     1 CLASE-07

Saludos,
Carlos Ortega
www.qualityexcellence.es




El 7 de marzo de 2018, 12:00, jose luis via R-help-es <
r-help-es@r-project.org> escribió:

> Adjunto txt por si no se ve bien, disculpas
>
>
> El Miércoles 7 de marzo de 2018 11:53, jose luis via R-help-es <
> r-help-es@r-project.org> escribió:
>
>
> Buenas. A ver si a alguien se le ocurre cómo hacer este filtrado. Quiero
> seleccionar para cada GRUPO el numero de ORDEN más pequeño (que podría ser
> con wich.min(ORDEN)), pero sin que se repita la CLASE, de modo que si la
> CLASE-01 salió en el primer GRUPO ya no salga más.
>
>
>
>  GRUPO   ORDENCLASEA   1   CLASE-01A
> 2   CLASE-02A   5   CLASE-03B   1   CLASE-01
> B   2   CLASE-02B   5   CLASE-03B   7
> CLASE-04C   2   CLASE-02C   5   CLASE-03C
> 7   CLASE-04D   5   CLASE-03D   7   CLASE-04
> E   1   CLASE-06F   2   CLASE-02F   5
> CLASE-03F   7   CLASE-05G   1   CLASE-07
>  Tendría que quedarme tal que así:
>
> GRUPO ORDEN CLASEA   1   CLASE-01B   2
>   CLASE-02C   5   CLASE-03D   7
> CLASE-04E   1   CLASE-06F   7   CLASE-05
> G   1   CLASE-07
>
> Un saludo
>
> Jose Luis
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] [Grupo de Usuarios de R de Madrid]: Mañana 8-marzo. Reunión.

2018-03-07 Thread Carlos Ortega
Buenas a todos,

Mañana celebramos la reunión mensual del "Grupo de Usuarios de R de
Madrid". Para todos aquellos que quieran y puedan asistir.

Para más detalles aquí:

https://www.meetup.com/es-ES/Grupo-de-Usuarios-de-R-de-Madrid/events/248021127/

Gracias,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ingesta y preprocesamiento de datos

2018-02-25 Thread Carlos Ortega
Hola,

¿Pero de qué volumen de datos estás hablando para considerar Flume?...

Y...¿esto qué tiene que ver con R?... Obviamente puedes plantearte hacer
todo el proceso de ETL desde R...
https://cloud.r-project.org/web/packages/ETLUtils/index.html

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 25 de febrero de 2018, 12:39, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas,
>
> Quiero hacer una ingesta de datos en una base de datos de un servidor. El
> proceso es hacer una consulta en la base de datos, que me dice uqe columnas
> tengo que coger.
>
> Una vez hecha dicha consulta, abrir un csv, coger las columnas que me
> indicaba esa base de datos y subir el dato concreto del csv a una base de
> datos.
>
> Estoy pensando en usar Apache Flume o similar, pero es en un servidor
> Windows. ¿Que opciones me recomendais?
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Filtrado de variables

2018-02-22 Thread Carlos Ortega
Ya... de esta forma tampoco obtienes el mes que tiene todos sus valores
NA...que es la duda ..

Otra forma más sencilla con data.table que la que envié anteriormente...

>
> Lines <- "MES|VARIABLE|RESULTADO|
+ 1|A|SI|
+ 1|B|SI|
+ 1|C|NO|
+ 2|A|NA|
+ 2|B|SI|
+ 2|C|SI|
+ 3|A|NO|
+ 3|B|NO|
+ 3|C|NO|
+ 4|A|NA|
+ 4|B|NA|
+ 4|C|NA|"
>
> DF <- read.table(textConnection(Lines), header = TRUE, as.is = TRUE,  sep
= "|")
> DF$X <- NULL
>
> #-
> library(data.table)
> DT <- as.data.table(DF)
> *DT[ ,  all(is.na <http://is.na>(RESULTADO)), by=c("MES")][ V1 == TRUE]*
   MES   V1
1:   4 TRUE

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 22 de febrero de 2018, 17:58, Javier Nieto <mac_j...@hotmail.com>
escribió:

> Hola,
>
>
> un poco más compacto, mi solución es la siguiente:
>
>
> DF[is.na(DF$RESULTADO), ]
>
>
> si se requiere un conteo, con nrow aplicado al resultado anterior.
>
>
>
> donde DF es un data frame con la información.
>
>
> Saludos
> --
> *De:* R-help-es <r-help-es-boun...@r-project.org> en nombre de Freddy
> Omar López Quintero <freddy.vat...@gmail.com>
> *Enviado:* jueves, 22 de febrero de 2018 10:10:04 a. m.
> *Para:* Carlos Ortega
> *CC:* Lista R.
> *Asunto:* Re: [R-es] Filtrado de variables
>
> Es cierto, una vez más entendí todo mal. Mis disculpas.
>
> La solución con SQL no va nada corta, me parece:
>
> # filtrar el mes en el que todos los campos de la columna RESULTADO son NA
>
> sqldf("
> select *
> from DF
> where mes in
> (
> select a.mes from
> (
> select mes, count(*) as total_NA
> from
> (select *
> from DF
> where resultado=' NA ')
> group by mes
> ) a,
> (
> select mes, count(*) as total_MES
> from DF
> group by mes
> ) b
>
> where total_na=total_mes and a.mes=b.mes
>
> )
> ")
>
> ¡Salud!
>
> 2018-02-22 9:01 GMT-03:00 Carlos Ortega <c...@qualityexcellence.es>:
>
> > Nope..,
> >
> > Sí, puede ser "sqldf" pero de esta forma no te muestra los meses que
> > tienen todos sus meses con "NA"..
> > Tienes que hacer primero un conteo de meses y luego un "left join" con el
> > conteo de "NAs" por mes y quedarte con el mes que tiene los dos valores
> > iguales (número de meses y número de NAs)...
> >
> > Estaba probando la opción, pero no he terminado de completarla...
> >
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
> > El 22 de febrero de 2018, 12:53, Freddy Omar López Quintero <
> > freddy.vat...@gmail.com> escribió:
> >
> >> El jue, 22-02-2018 a las 09:52 +0100, Carlos Ortega escribió:
> >>
> >> Aquí tienes un par de formas...
> >>
> >>
> >> ... y aún una más, con el siempre fiel lenguaje SQL:
> >>
> >>
> >> library(sqldf)
> >>
> >> # corriendo antes lo que hizo don Carlos pero dejándolo como un
> data.frame tradicional:
> >>
> >> DF<-as.data.frame(DF)
> >>
> >> sqldf("select * from DF where resultado=' NA '")
> >>
> >>
> >> ¡Saludos!
> >>
> >>
> >> --
> >>
> >> «...homines autem hominum causa esse generatos...»
> >>
> >> Cicero
> >>
> >
> >
> >
> > --
> > Saludos,
> > Carlos Ortega
> > www.qualityexcellence.es
> >
>
>
>
> --
> «...my role is to be on the bottom of things.»
>
> Donald Knuth
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Filtrado de variables

2018-02-22 Thread Carlos Ortega
Nope..,

Sí, puede ser "sqldf" pero de esta forma no te muestra los meses que tienen
todos sus meses con "NA"..
Tienes que hacer primero un conteo de meses y luego un "left join" con el
conteo de "NAs" por mes y quedarte con el mes que tiene los dos valores
iguales (número de meses y número de NAs)...

Estaba probando la opción, pero no he terminado de completarla...

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 22 de febrero de 2018, 12:53, Freddy Omar López Quintero <
freddy.vat...@gmail.com> escribió:

> El jue, 22-02-2018 a las 09:52 +0100, Carlos Ortega escribió:
>
> Aquí tienes un par de formas...
>
>
> ... y aún una más, con el siempre fiel lenguaje SQL:
>
>
> library(sqldf)
>
> # corriendo antes lo que hizo don Carlos pero dejándolo como un data.frame 
> tradicional:
>
> DF<-as.data.frame(DF)
>
> sqldf("select * from DF where resultado=' NA '")
>
>
> ¡Saludos!
>
>
> --
>
> «...homines autem hominum causa esse generatos...»
>
> Cicero
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Filtrado de variables

2018-02-22 Thread Carlos Ortega
Hola,

Aquí tienes un par de formas...


Lines <- "MES | VARIABLE | RESULTADO |
   1 | A | SI |
   1 | B | SI |
   1 | C | NO |
   2 | A | NA |
   2 | B | SI |
   2 | C | SI |
   3 | A | NO |
   3 | B | NO |
   3 | C | NO |
   4 | A | NA |
   4 | B | NA |
   4 | C | NA |"

DF <- read.table(textConnection(Lines), header = TRUE, as.is = TRUE,  sep =
"|")
DF$X <- NULL

#-
library(data.table)
DT <- as.data.table(DF)
re_dt <- DT[, num_mes :=.N, by=c("MES")][ RESULTADO == " NA ", all_na :=
.N, by=c("MES")][  all_na == num_mes]
unique(re_dt$MES)

#-
library(dplyr)
num_mes <- DF %>%
   group_by(MES) %>%
   summarize( num_mes = n())

hw_na <- DF %>%
   group_by(MES) %>%
   filter(RESULTADO == " NA ") %>%
   summarize( hw_na = n())

res_out <- left_join(num_mes, hw_na) %>%
   filter(num_mes == hw_na)

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 22 de febrero de 2018, 9:22, jose luis via R-help-es <
r-help-es@r-project.org> escribió:

> Buenos díasTengo esta pequeña matriz con tres columnas. Querría saber como
> puedo filtrar el mes en el que todos los campos de la columna RESULTADO son
> NA  (en este caso sería unicamente el mes 4). Gracias
> | MES | VARIABLE | RESULTADO |
> | 1 | A | SI |
> | 1 | B | SI |
> | 1 | C | NO |
> | 2 | A | NA |
> | 2 | B | SI |
> | 2 | C | SI |
> | 3 | A | NO |
> | 3 | B | NO |
> | 3 | C | NO |
> | 4 | A | NA |
> | 4 | B | NA |
> | 4 | C | NA |
>
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Ejecutar shinyapp sin abrir Rstudio

2018-02-21 Thread Carlos Ortega
Hola,

Mira esto:

https://stackoverflow.com/questions/33513544/deploying-r-shiny-app-as-a-standalone-application

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 21 de febrero de 2018, 22:29, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas,
>
> Se puede,en local, crear una shinyapp que se abra pinchandodirectamente
> sobre un icono del escritorio?
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] gbm.step para clasificación no binaria

2018-02-21 Thread Carlos Ortega
​Si ya vas a utilizar "gbm", por justamente mejorar la capacidad
predictiva, usaría el "gbm" de H2O o mejor "ligthgbm"...
El porqué...​

https://github.com/szilard/GBM-perf

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 21 de febrero de 2018, 10:49, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Bueno, finalmente estaba equivocado en relación a la validación cruzada;
> resulta que gbm tiene el comando gbm.perf(gbm.model, method="cv") que te
> indica el mejor nº de árboles por VC. Lo pongo por si a alguien le pudiera
> interesar. Los gradient boosted son, sin duda, uno de los algoritmos de
> machine learning con mayor capacidad predictiva.
> Un saludo.
>
>
> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>
> Hola,
>>
>> Varias cosas:
>>
>>- Puedes usar "gbm" y para los "partial plots" utilizar el paquete
>> "pdp"
>>que considera varios tipos de modelos, entre ellos "gbm".
>>- También puedes usar "xgboost" que tiene una función parecida a esta
>>
>>que quieres usar "xgb.cv" justamente para encontrar el modelo óptimo.
>>
>> De todas formas, por experiencia sí que los randomForest sobreajustan
>> cuando fuerzas un número alto de niveles (en la función en Python
>> RandomForestClassifier con el parámetro "max_depth" que no veo la
>> equivalente en randomForest o ranger de R...
>>
>
> Saludos,
>> Carlos Ortega.
>>
>> El 19 de febrero de 2018, 22:02, Manuel Mendoza <mmend...@mncn.csic.es>
>> escribió:
>>
>>
>>> Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step
>>> del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia
>>> de los random forest o cualquier otro bootstrap) pero gbm.step hace
>>> validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es
>>> fundamental.
>>>
>>>
>>>
>>> La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y
>>> usar el promedio.Vamos, hacer yo mismo un bootstrap con muchos boosted.
>>> Los
>>> métodos basados en bootstrap no sobreajustan, precisamente porque, como
>>> quizás sepas, al sobreajustar aumenta el error debido a la varianza, y el
>>> promedio de muchas predicciones con elevada varianza tiene mucha menos
>>> varianza que cada una de ellas.
>>>
>>>
>>>
>>>
>>>
>>> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>>>
>>> Hola,
>>>
>>>>
>>>> Sí, tienes razón...
>>>> ¿No puedes usar la propia función "gbm" del paquete "gbm"?...
>>>>
>>>> Gracias,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>> El 19 de febrero de 2018, 18:01, Manuel Mendoza <mmend...@mncn.csic.es>
>>>> escribió:
>>>>
>>>>
>>>> Gracias Carlos. Hasta donde yo entiendo si las hay:
>>>>>
>>>>> El argumento family puede ser:
>>>>>
>>>>> "gaussian" (for minimizing squared error); por lo que tiene que ser
>>>>> numérica
>>>>> "bernoulli" (logistic regression for 0-1 out-comes); binaria por
>>>>> narices
>>>>> "poisson" (count outcomes; requires the response to be a positive
>>>>> integer); numérica también, pues.
>>>>>
>>>>> La única podría ser "laplace" (for minimizing absolute loss), pero me
>>>>> da
>>>>> este error: Error in while (delta.deviance > tolerance.test & n.fitted
>>>>> <
>>>>> max.trees) { :
>>>>>   missing value where TRUE/FALSE needed
>>>>>
>>>>> Supongo que loss se refiere a la función de pérdida, y como habla de
>>>>> deviance (la función de pérdida por defecto en gbm) pienso que también
>>>>> es
>>>>> para variable respuesta numérica, aunque no lo encontré por ningún
>>>>> lado.
>>>>> Por eso pregunté.
>>>>>
>>>>> Probaré sin indicar la family, a ver si funciona.
>>>>> Gracias,
>>>>> Manuel
>>>>>
>>>>>
>>>>>
>>>>> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>>>>>
>>>>> Hola,
>>>>>
>>>>>
>>>>>> No 

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Thread Carlos Ortega
Hola,

Varias cosas:

   - Puedes usar "gbm" y para los "partial plots" utilizar el paquete "pdp"
   que considera varios tipos de modelos, entre ellos "gbm".
   - También puedes usar "xgboost" que tiene una función parecida a esta
   que quieres usar "xgb.cv" justamente para encontrar el modelo óptimo.

De todas formas, por experiencia sí que los randomForest sobreajustan
cuando fuerzas un número alto de niveles (en la función en Python
RandomForestClassifier con el parámetro "max_depth" que no veo la
equivalente en randomForest o ranger de R...

Saludos,
Carlos Ortega.

El 19 de febrero de 2018, 22:02, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Hola de nuevo. Se me olvidaba la principal razón para utilizar gbm.step
> del paquete dismo. Como sabéis, los boosted si sobreajustan (a diferencia
> de los random forest o cualquier otro bootstrap) pero gbm.step hace
> validación cruzada para determinar el nº óptimo de árboles y evitarlo. Es
> fundamental.
>
>
>
> La opción que me queda, Carlos, es hacerlo con gbm, pero muchas veces, y
> usar el promedio.Vamos, hacer yo mismo un bootstrap con muchos boosted. Los
> métodos basados en bootstrap no sobreajustan, precisamente porque, como
> quizás sepas, al sobreajustar aumenta el error debido a la varianza, y el
> promedio de muchas predicciones con elevada varianza tiene mucha menos
> varianza que cada una de ellas.
>
>
>
>
>
> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>
> Hola,
>>
>> Sí, tienes razón...
>> ¿No puedes usar la propia función "gbm" del paquete "gbm"?...
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 19 de febrero de 2018, 18:01, Manuel Mendoza <mmend...@mncn.csic.es>
>> escribió:
>>
>>
>>> Gracias Carlos. Hasta donde yo entiendo si las hay:
>>>
>>> El argumento family puede ser:
>>>
>>> "gaussian" (for minimizing squared error); por lo que tiene que ser
>>> numérica
>>> "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
>>> "poisson" (count outcomes; requires the response to be a positive
>>> integer); numérica también, pues.
>>>
>>> La única podría ser "laplace" (for minimizing absolute loss), pero me da
>>> este error: Error in while (delta.deviance > tolerance.test & n.fitted <
>>> max.trees) { :
>>>   missing value where TRUE/FALSE needed
>>>
>>> Supongo que loss se refiere a la función de pérdida, y como habla de
>>> deviance (la función de pérdida por defecto en gbm) pienso que también es
>>> para variable respuesta numérica, aunque no lo encontré por ningún lado.
>>> Por eso pregunté.
>>>
>>> Probaré sin indicar la family, a ver si funciona.
>>> Gracias,
>>> Manuel
>>>
>>>
>>>
>>> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>>>
>>> Hola,
>>>
>>>>
>>>> No hay ninguna limitación en la ayuda de la función en este sentido.
>>>> Tan solo se indica que han de existir dos niveles en la variable
>>>> predictora, vaya que al menos sea binaria...
>>>> En la función en el parámetro "gbm.y" es donde indicas qué columna es la
>>>> predictora. No hay otro parámetro donde por otro lado le indiques si es
>>>> un
>>>> modelo binario o multinominal...
>>>>
>>>> Saludos,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>>
>>>> 2018-02-19 14:03 GMT+01:00 Manuel Mendoza <mmend...@mncn.csic.es>:
>>>>
>>>> Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no
>>>>
>>>>> binaria?
>>>>> Gracias
>>>>> --
>>>>> Dr Manuel Mendoza
>>>>> Department of Biogeography and Global Change
>>>>> National Museum of Natural History (MNCN)
>>>>> Spanish Scientific Council (CSIC)
>>>>> C/ Serrano 115bis, 28006 MADRID
>>>>> Spain
>>>>>
>>>>> ___
>>>>> R-help-es mailing list
>>>>> R-help-es@r-project.org
>>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>>
>>>>>
>>>>>
>>>>
>>>> --
>>>> Saludos,
>>>> Carlos Ortega
>>>> www.qualityexcellence.es
>>>>
>>>>
>>>
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>>
>>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Gráficas 3D

2018-02-19 Thread Carlos Ortega
Hola,

Sí, mira estos ejemplos de cómo hacerlo...
Busca las ecuaciones paramétricas de cada una de estas figuras geométricas
(lo puedes encontrar en Wikipedia o en Wolfram Mathematica) y ya lo tendrás
casi todo...

https://alstatr.blogspot.com.es/2014/02/r-fun-with-surf3d-function.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 19 de febrero de 2018, 21:32, Andrés Hirigoyen <andreshirigo...@gmail.com
> escribió:

> Gracias Carlos, mi idea es construir un cono, un cilindro  u otros cuerpos
> geométrico y luego graficarlos. Alguna idea de como empezar?
>
> Muchas gracias como siempre
>
> El lun., 19 de feb. de 2018 15:06, <r-help-es-requ...@r-project.org>
> escribió:
>
> > Envíe los mensajes para la lista R-help-es a
> > r-help-es@r-project.org
> >
> > Para subscribirse o anular su subscripción a través de la WEB
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
> > O por correo electrónico, enviando un mensaje con el texto "help" en
> > el asunto (subject) o en el cuerpo a:
> > r-help-es-requ...@r-project.org
> >
> > Puede contactar con el responsable de la lista escribiendo a:
> > r-help-es-ow...@r-project.org
> >
> > Si responde a algún contenido de este mensaje, por favor, edite la
> > linea del asunto (subject) para que el texto sea mas especifico que:
> > "Re: Contents of R-help-es digest...". Además, por favor, incluya en
> > la respuesta sólo aquellas partes del mensaje a las que está
> > respondiendo.
> >
> >
> > Asuntos del día:
> >
> >1. Gráfica 3D (Andrés Hirigoyen)
> >2. Re:  gbm.step para clasificación no binaria (Manuel Mendoza)
> >3. Re: Gráfica 3D (Carlos Ortega)
> >4. Re:  gbm.step para clasificación no binaria (Carlos Ortega)
> >5. Re:  gbm.step para clasificación no binaria (Manuel Mendoza)
> >
> > --
> >
> > Message: 1
> > Date: Mon, 19 Feb 2018 16:44:00 +
> > From: Andrés Hirigoyen <andreshirigo...@gmail.com>
> > To: Lista R <r-help-es@r-project.org>
> > Subject: [R-es] Gráfica 3D
> > Message-ID:
> > <
> > caoatypvzasi_ltfrswcsz3soxzntnutxsdhabt2yzv64r0n...@mail.gmail.com>
> > Content-Type: text/plain; charset="utf-8"
> >
> > Buenas tardes ¿me recomiendan algún paquete para graficar objetos
> > geométricos en 3D? Alguien ya hizo este tipo de gráficos?
> >
> > Muchas gracias
> >
> > [[alternative HTML version deleted]]
> >
> >
> >
> >
> > --
> >
> > Message: 2
> > Date: Mon, 19 Feb 2018 18:01:21 +0100
> > From: Manuel Mendoza <mmend...@mncn.csic.es>
> > To: Carlos Ortega <c...@qualityexcellence.es>
> > Cc: "r-help-es@r-project.org" <r-help-es@r-project.org>
> > Subject: Re: [R-es]  gbm.step para clasificación no binaria
> > Message-ID:
> > <20180219180121.horde.4lstqnni0ein9hwjghbd...@webmail.csic.es>
> > Content-Type: text/plain; charset="utf-8"; Format="flowed";
> > DelSp="Yes"
> >
> >
> > Gracias Carlos. Hasta donde yo entiendo si las hay:
> >
> > El argumento family puede ser:
> >
> > "gaussian" (for minimizing squared error); por lo que tiene que ser
> > numérica
> > "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
> > "poisson" (count outcomes; requires the response to be a positive
> > integer); numérica también, pues.
> >
> > La única podría ser "laplace" (for minimizing absolute loss), pero me
> > da este error: Error in while (delta.deviance > tolerance.test &
> > n.fitted < max.trees) { :
> >missing value where TRUE/FALSE needed
> >
> > Supongo que loss se refiere a la función de pérdida, y como habla de
> > deviance (la función de pérdida por defecto en gbm) pienso que también
> > es para variable respuesta numérica, aunque no lo encontré por ningún
> > lado. Por eso pregunté.
> >
> > Probaré sin indicar la family, a ver si funciona.
> > Gracias,
> > Manuel
> >
> >
> > Quoting Carlos Ortega <c...@qualityexcellence.es>:
> >
> > > Hola,
> > >
> > > No hay ninguna limitación en la ayuda de la función en este sentido.
> > > Tan solo se indica que han de existir dos niveles en la variable
> > > predictora, vaya que al menos sea binaria...
> > > En la función en

Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Thread Carlos Ortega
Hola,

Sí, tienes razón...
¿No puedes usar la propia función "gbm" del paquete "gbm"?...

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 19 de febrero de 2018, 18:01, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Gracias Carlos. Hasta donde yo entiendo si las hay:
>
> El argumento family puede ser:
>
> "gaussian" (for minimizing squared error); por lo que tiene que ser
> numérica
> "bernoulli" (logistic regression for 0-1 out-comes); binaria por narices
> "poisson" (count outcomes; requires the response to be a positive
> integer); numérica también, pues.
>
> La única podría ser "laplace" (for minimizing absolute loss), pero me da
> este error: Error in while (delta.deviance > tolerance.test & n.fitted <
> max.trees) { :
>   missing value where TRUE/FALSE needed
>
> Supongo que loss se refiere a la función de pérdida, y como habla de
> deviance (la función de pérdida por defecto en gbm) pienso que también es
> para variable respuesta numérica, aunque no lo encontré por ningún lado.
> Por eso pregunté.
>
> Probaré sin indicar la family, a ver si funciona.
> Gracias,
> Manuel
>
>
>
> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>
> Hola,
>>
>> No hay ninguna limitación en la ayuda de la función en este sentido.
>> Tan solo se indica que han de existir dos niveles en la variable
>> predictora, vaya que al menos sea binaria...
>> En la función en el parámetro "gbm.y" es donde indicas qué columna es la
>> predictora. No hay otro parámetro donde por otro lado le indiques si es un
>> modelo binario o multinominal...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> 2018-02-19 14:03 GMT+01:00 Manuel Mendoza <mmend...@mncn.csic.es>:
>>
>> Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no
>>> binaria?
>>> Gracias
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] SOBRESCRIBIR EN LA PRIMERA LÍNEA DE TEXTOS

2018-02-19 Thread Carlos Ortega
Hola,

¿Qué sistema operativo usas?.

   - Si usas Linux/MacOS puedes llamar al SO desde R y decirle que
   sustituya un elemento de la primera línea de tu fichero con lo que tú
   quieres. Lo puedes hacer con varias utilidades del SO (sed, awk, o incluso
   con echo).
   - Si usas Windows lo que puedes hacer es lo siguiente, leer el fichero
   json con "readLines()", el resultado lo vas a guardar en un data.frame al
   que le puedes añadir una primera línea con lo que tú quieras y luego este
   nuevo data.frame salvarlo con "write()"

Es importante a la hora de pedir ayuda indicar este detalle del SO y además
incluir algún ejemplo/dato con el que se pueda reproducir el problema y dar
una solución que se pueda ver que funciona.

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 19 de febrero de 2018, 16:37, Carlos Córcoles <ccbcorco...@gmail.com>
escribió:

>  Hola
>
> Escribo este mensaje porque llevo unas horas y no consigo solucionar un
> obstáculo.
>
> No consigo añadir unos caracteres en la primera línea de un archivo ".json"
> desde R.
>
> Utilizando el siguiente código
>
> *write(line,file="map_wgs91.js",append=TRUE)*
> *cat("var statesData =", file="map_wgs93.js", append=TRUE, sep = "\a")*
>
> he conseguido que la palabra aparezca al final del archivo, pero eso no es
> lo que quiero.
>
> No se si me podrías dar  desde esta lista alguna sugerencia...
>
> Gracias
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] gbm.step para clasificación no binaria

2018-02-19 Thread Carlos Ortega
Hola,

No hay ninguna limitación en la ayuda de la función en este sentido.
Tan solo se indica que han de existir dos niveles en la variable
predictora, vaya que al menos sea binaria...
En la función en el parámetro "gbm.y" es donde indicas qué columna es la
predictora. No hay otro parámetro donde por otro lado le indiques si es un
modelo binario o multinominal...

Saludos,
Carlos Ortega
www.qualityexcellence.es


2018-02-19 14:03 GMT+01:00 Manuel Mendoza <mmend...@mncn.csic.es>:

> Hola erreros, ¿sabéis si gbm.step puede usarse para clasificación no
> binaria?
> Gracias
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] R encountered a fatal error

2018-02-18 Thread Carlos Ortega
Hola,

¿Cómo es de grande el conjunto que estás modelizando?.
Aunque liquidSVM es menos intenso en necesidades de máquina que SVM, fíjate
que estás explorando un número muy grande de combinaciones y es muy
probable que te estés quedando sin recursos. Abre en la ejecución

*gammas = c(0.0001,0.001,0.04,0.1,50, 1,10, 100), c_values = c(0.1,
0.0001, 0.001,1,10,25,50)*

Te sugeriría que probaras varias cosas:

   - Primero reduce el número de gammas y c_values a tres valores cada uno
   o un par. Puedes utilizar un valor muy pequeño, otro intermedio y otro
   grande y así comenzar a ver cómo se comporta el modelo.
   - Y si lo anterior tampoco funciona, reduce el número del conjunto
   "trainning". Haz un muestreo quedándote con el 80% de filas y baja si no
   funciona.


Saludos,
Carlos Ortega
www.qualityexcellence.es

2018-02-18 11:22 GMT+01:00 Alberto <alpeda...@hotmail.com>:

> Hola a todos,
>
> cada vez que intento ejecutar el código adjuntado cuando llego al comando
> de predict() salta un pop-up de R diciendo 'R encountered a fatal error'.
> No se donde puede estar el fallo y no entiendo tampoco por qué pasa esto
> puesto que a mi parecer el código está bien. Alguna idea de cual puede ser
> el problema?
>
> Muchas gracias!
>
> set.seed(6)
>
> model <- init.liquidSVM(Casualty_Severity~Vehicle_Type+Vehicle_
> Manoeuvre+Junction_Location+Skidding_and_Overturning+Hit_
> Object_off_Carriageway+First_Point_of_Impact+Journey_
> Purpose_of_Driver+Sex_of_Driver+Age_Band_of_Driver+Propulsion_Code+Age_of_
> Vehicle+Driver_Home_Area_Type+Sex_of_Casualty+Age_Band_of_
> Casualty+Car_Passenger+Casualty_Type+Number_of_Vehicles+Hour_of_Day+First_
> Road_Class+Road_Type+Speed_limit+Junction_Detail+Light_
> Conditions+Weather_Conditions+Road_Surface_Conditions+Urban_
> or_Rural_Area+month+other_vehic, trainning, threads = -1, gammas =
> c(0.0001,0.001,0.04,0.1,50, 1,10, 100), c_values = c(0.1, 0.0001,
> 0.001,1,10,25,50))
>
> trainSVMs(model, threads = -1, gammas = c(0.0001,0.001,0.04,0.1,50, 1,10,
> 100), c_values = c(0.1, 0.0001, 0.001,1,10,25,50), solver = 'ls',
> command.args=list(L=2, T=-1, d=1))
>
> selectSVMs(model)
>
> svm.probs <- predict(model, type = 'response', newdata = tst)
>
>
>
> [[alternative HTML version deleted]]
>
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Tapply para medias entre mas de 2 factores

2018-02-14 Thread Carlos Ortega
Hola,

Si el conjunto no es muy grande, puedes utilizar la función "aggregate()".

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 14 de febrero de 2018, 14:13, Yesica Pallavicini Fernandez <
yesipa...@gmail.com> escribió:

> Hola.
> Tengo unos datos de rendimiento de distintas variedades en 2 localidades.
> Quiero sacar la media de cada variedad en cada una de las localidades.
> La función tapply solo me hace la media por variedad o por localidad, pero
> no juntas.
> ¿Conoceis alguna función que calcule la media de cada variedad separada por
> localidad?
> Gracias
> Yésica
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] problema de fechas

2018-02-13 Thread Carlos Ortega
Hola,

Sí, en el ejemplo de la ayuda de "ifelse" se advierte de este problema y
ofrece dos alternativas: una la que he propuesto y otra.
Con cualquiera de las dos el problema se resuelve.

## ifelse() strips attributes
## This is important when working with Dates and factors
x <- seq(as.Date("2000-02-29"), as.Date("2004-10-04"), by = "1 month")
## has many "-mm-29", but a few "-03-01" in the non-leap years
y <- ifelse(as.POSIXlt(x)$mday == 29, x, NA)
head(y) # not what you expected ... ==> need restore the class attribute:
class(y) <- class(x)
y
## ==> Again a case where it is better *not* to use ifelse(), but
## both more efficient and clear:
y2 <- x
y2[as.POSIXlt(x)$mday != 29] <- NA
stopifnot(identical(y2, y))

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 13 de febrero de 2018, 9:11, Álvaro Hernández <alvar...@um.es> escribió:

> Yo entiendo que lo que quiere es saber cómo hacer el 'ifelse' para que no
> le devuelva un vector numérico porque para transformarlo podría hacer
> simplemente 'as_date(fechas2)'.
>
> El problema yo creo que es por tema coerción con el 'NA' (sumado al
> comportamiento de 'ifelse'). Estaba buscando alternativas como
> NA_character_, NA_numeric_, etc. pero no encuentro para fecha, así que, se
> podría hacer algo como:
>
> fechas2 <- if_else(fechas > "2016-12-31", as_date(NA), fechas)
>
> Un saludo
> Álvaro
>
> El 13/02/18 a las 01:04, Carlos Ortega escribió:
>
> Hola,
>>
>> Esta es una forma...
>>
>> library(lubridate)
>>> library(dplyr)
>>>
>>> fechas <- c("2016-07-15", "2016-10-12", "2017-02-11")
>>> fechas_new <- ymd(fechas)
>>>
>>> res_out <- ifelse(year(fechas_new) > 2016, NA, fechas_new)
>>> res_out
>>>
>> [1] 16997 17086NA
>>
>>> class(res_out) <- class(fechas_new)
>>> res_out
>>>
>> [1] "2016-07-15" "2016-10-12" NA
>>
>>
>> No lo había visto hasta ahora, es un caso que se cuenta en la ayuda de
>> "ifelse()" con un ejemplo...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> 2018-02-13 0:54 GMT+01:00 patricio fuenmayor <
>> patricio.fuenma...@gmail.com>:
>>
>> hola Patricio, usa:
>>> dplyr::if_else
>>>
>>>  [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] problema de fechas

2018-02-12 Thread Carlos Ortega
Hola,

Esta es una forma...

> library(lubridate)
> library(dplyr)
>
> fechas <- c("2016-07-15", "2016-10-12", "2017-02-11")
> fechas_new <- ymd(fechas)
>
> res_out <- ifelse(year(fechas_new) > 2016, NA, fechas_new)
> res_out
[1] 16997 17086NA
> class(res_out) <- class(fechas_new)
> res_out
[1] "2016-07-15" "2016-10-12" NA


No lo había visto hasta ahora, es un caso que se cuenta en la ayuda de
"ifelse()" con un ejemplo...

Saludos,
Carlos Ortega
www.qualityexcellence.es


2018-02-13 0:54 GMT+01:00 patricio fuenmayor <patricio.fuenma...@gmail.com>:

> hola Patricio, usa:
> dplyr::if_else
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] RStudio, Spss, SAS, Stata, txt

2018-02-12 Thread Carlos Ortega
Incluirán por defecto este paquete:

https://cloud.r-project.org/web/packages/haven/index.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 12 de febrero de 2018, 16:15, Freddy Omar López Quintero <
freddy.lopez.quint...@gmail.com> escribió:

> ¡La magia del tidyverse!
>
> 2018-02-12 12:08 GMT-03:00 Javier Marcuzzi <javier.ruben.marcuzzi@gmail.
> com>
> :
>
> > Estimados
> >
> > Hoy instale RStudio, y por sorpresa o desconocimiento de mi parte, veo
> que
> > hay la posibilidad de importar datos excel, spss, sas, stata, texto,
> > recuerdo consultas en la lista al respecto, posiblemente mucho se
> > soluciones con las herramientas propuestas por RStudio.
> >
> > Javier Rubén Marcuzzi
> >
> > [[alternative HTML version deleted]]
> >
> > ___
> > R-help-es mailing list
> > R-help-es@r-project.org
> > https://stat.ethz.ch/mailman/listinfo/r-help-es
> >
>
>
>
> --
> «...homines autem hominum causa esse generatos...»
>
> Cicero
>
> [[alternative HTML version deleted]]
>
> _______
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Contar comas de una variable

2018-02-07 Thread Carlos Ortega
Hola,

Esta es una forma...

> library(stringr)
> val <- c("hola, hola, hola, hola")
>
> num_com <- str_count(val, pattern = "," )
> num_com
[1] 3

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 7 de febrero de 2018, 17:55, Miriam Alzate <miriam.alz...@unavarra.es>
escribió:

> Buenas tardes,
>
> Necesito contar cuántas comas hay en cada celda. Los datos tienen esta
> forma:
>
>  Pros Comas
> Opinión 1calidad,1
> Opinión 2calidad, diseño, color, 3
> Opinión 3precio, accesibilidad, sienta bien, luminoso, 4
>
>
> La variable Pros es la que tengo y la variable Comas es la que recoge
> cuántas comas hay en la variable Pros.
>
> Un saludo
>
> Miriam
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Optimizar código

2018-02-06 Thread Carlos Ortega
Hola,

Esta es una forma...

> str_1 <- c("caliente","frío","gordo","flaco")
> str_2 <- c("bueno","malo","bueno","malo")
> str_3 <- cbind(str_1, str_2)
>
> l_val <- c("caliente","perro","flaco","gato","coche")
>
> row_god <- which(l_val %in% str_3[,1], arr.ind = TRUE )
> row_god
[1] 1 3

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 6 de febrero de 2018, 23:15, Fernando Sanchez via R-help-es <
r-help-es@r-project.org> escribió:

> Hola a todos,
> Os pongo aquí debajo un pequeño fragmento de código. Resulta que dispongo
> de una CADENA que tiene dos columnas. Una con palabras y la otra que dice
> si es bueno o malo. En otra variable tengo una LISTA. Quiero cruzar todas
> las palabras de la lista con todas las de la cadena y cuando alguna
> coincida, que me indique en qué fila está y también si la palabra es
> "buena" o "mala". El código que os pongo más abajo funciona, pero es poco
> eficiente cuando las listas son más largas.
> Se os ocurre otra forma de programarlo más elegantemente en R.
>
> CADENA_1<-c("caliente","frío","gordo","flaco")CADENA_2<-c("
> bueno","malo","bueno","malo")CADENA<-rbind(CADENA_1,CADENA_
> 2)CADENA<-t(CADENA)LISTA<-c("caliente","perro","flaco","gato","coche")
> for (i in 1:nrow(CADENA)) {for (j in 1:length(LISTA))
> {if(toString(LISTA[j])==toString(CADENA[i,1]))
> {print(paste("fila:",j,CADENA[i,2],sep=" "))}}}
> Un saludo y muchas gracias a todos.
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Alternativa Shiny server en windows

2018-02-02 Thread Carlos Ortega
Hola,

Podrías utilizarlo en un máquina virtual mientras crean la versión en
Windows...

https://support.rstudio.com/hc/en-us/articles/217801278-Does-Shiny-Server-Pro-run-on-Windows-

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 2 de febrero de 2018, 13:10, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas
>
> He visto que shiny server no es compatible con sevidores windows. ¿Existe
> algun paquete en R que sea parecido a Shiny, para correr en un servidor?
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] error en función ggadjustedcurves, paquete survminer

2018-01-27 Thread Carlos Ortega
Hola,

Mira el ejemplo de la ayuda:

> library(survival)
> fit2 <- coxph( Surv(stop, event) ~ size, data = bladder )
> # single curve
> ggadjustedcurves(fit2, data = bladder)

Que produce este gráfico.

[image: Imágenes integradas 1]

Solamente tienes que pasar la variable donde guardas el modelo y los datos.

Pero puedes valorar otras opciones, representar las curvas de
supervivencia, estratificadas por otra variable (los grupos, etc, etc).

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 27 de enero de 2018, 15:50, Patricio Suárez Gil <patri...@gmail.com>
escribió:

> Tengo un modelo de regresión de Cox y quiero obtener el plot ajustado por
> una covariable (sexo) con la función ‘ggadjustedcurves’, pero me da el
> siguiente error:
>
> > cox2 <- coxph(os ~ imc_25 + sexo.1, data = datos)
> > cox2
> Call:
> coxph(formula = os ~ imc_25 + sexo.1, data = datos)
>
>   coef exp(coef) se(coef) z p
> imc_25  -0.621 0.5370.299 -2.08 0.038
> sexo.1M  0.714 2.0420.387  1.84 0.065
>
> Likelihood ratio test=6.23  on 2 df, p=0.0444
> n= 76, number of events= 54
> > ggadjustedcurves(cox2, variable = datos$sexo.1, data = datos)
> Error in `[.data.frame`(data, , variable) : undefined columns selected
>
> Agradezco cualquier feedback.
>
> Saludos,
>
>
> Patricio
>
>
> Patricio Suárez Gil
> Unidad de Investigación Área V-Gijón
> Planta 5ª Impar
> Hospital Universitario de Cabueñes
> C/Prado, 395
> 33394 Gijón (Asturias)
> Tfno: 985 185 000 (Ext. 85715)
> @uinvest_psg
> unidadinvestigacion.ar...@sespa.es
> ESPAÑA
>
>
>
>
>
>
>
>
>
>
>
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es




-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Código de salida de una función R

2018-01-26 Thread Carlos Ortega
Hola,

Recupero tu pregunta porque está habiendo diferentes iniciativas en marcha
para mejorar este aspecto de "R" que es claramente muy mejorable.
En breve todos esperamos que los códigos de error de "R" sean más
entendibles.

https://methodsblog.wordpress.com/2018/01/26/r-errors/

El propio Hadley Wickham, está haciendo lo propio con su "tidyverse":

http://style.tidyverse.org/error-messages.html

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 10 de enero de 2018, 17:36, Javier Nieto <mac_j...@hotmail.com> escribió:

> Hola, tengo una duda de R espero me puedan ayudar.
>
>
>
> En linux, en bash si una instrucción no termina correctamente puedo
> obtener un código de error, por ejemplo:
>
>
> [rapusr@tstr200043 ~]$ ls -z
> ls: invalid option -- 'z'
> Try 'ls --help' for more information.
> [rapusr@tstr200043 ~]$ echo $?
> 2
>
> ¿En R existe algo parecido?, por ejemplo busco algo como
> R> rnorm(1000O)
> Error: unexpected symbol in "rnorm(1000O"
>
>
> status()
> 2
>
> status = "función o alguna forma de obtener el código de error"
>
> En una función que yo realice, esto no es problema porque con return puedo
> devolver el código de error que desee, sin embargo en funciones del paquete
> base o de otras librerías ¿se puede hacer algo parecido?
>
> entiendo que se pueden hacer validaciones del tipo
> if(as.numeric(rnorm(1000O))) o usar try o tryCatch, simplemente me dio
> curiosidad saber si existe  algo así para simplificar el código.
>
> Muchas gracias
>
> Saludos
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Más allá de group_by()

2018-01-25 Thread Carlos Ortega
Hola Rubén,

Para hacer estos cálculos, tienes que partir de las tablas de clientes de
tu "Mes_1" y de tu "Mes_2" y utilizar las funciones de mezcla de tablas que
tiene dplyr (left_join ,right_join, inner_join) con los que identificarás
los clientes que están en un mes y en otro y sumar sus cantidades de cada
caso. Y al final esas cantidades (serán data.frames) mezclarlos con la
tabla que has calculado (la inicial que no tiene ni "win" ni "loss")...

La recomendación de dplyr para hacer los joins, perfectamente la puedes
sustituir por otros paquetes/funciones: sqldf, el mismo paquete base con
"merge()", etc...


Saludos,
Carlos Ortega
www.qualityexcellence.es

El 25 de enero de 2018, 13:14, Rubén Coca <ruben.c...@gmail.com> escribió:

> Hola,
> Os planteo una situación a ver si se os ocurre un enfoque que me permita
> solucionarla.
> Partiendo de un data frame con las siguientes variables: mes, cliente,
> facturacion. Tal que así:
>
> df <- data.frame(mes = c(1,1,1,1,2,2,2,2,3,3,3), cliente = c('a', 'b', 'c',
> 'd', 'b', 'c', 'd', 'e', 'b', 'd', 'e'), fact = c(100, 110, 120, 100, 90,
> 80, 110, 100, 90, 70, 120))
>
> mes   cliente   fact
>   1 a100
>   1 b110
>   1 c120
>   1 d100
>   2 b 90
>   2 c 80
>   2 d110
>   2 e100
>   3 b 90
>   3 d 70
>   3 e120
>
> Con un simple group_by() y summarise() obtengo:
> df <- df %>% group_by(mes) %>% summarise(sumFact = sum(fact))
>
> mes   sumFact
>   1   430
>   2   380
>   3   280
>
> Y ahora viene lo complicado (para mí), quiero añadir dos nuevas columnas:
> win y loss.
> win debe sumar la facturacion de aquellos clientes que no existían en el
> mes n-1. Loss debe sumar la facturación en el mes n-1 de los clientes que
> ya no están en el mes n (y así sucesivamente). De forma que obtengamos el
> data frame final:
>
> mes   sumFact   win   loss
>   1   430NA NA
>   2   380   100100
>   3   280 0 80
>
> En el mes 2, win es la suma de la facturación del cliente e, que no estaba
> en el mes 1 y loss es la suma de la facturación del cliente a, que estaba
> en el mes 1 pero ya no en el 2.
> En el mes 3, win es 0 porque no hay ningún cliente que no existiense en n-1
> y loss es la suma de la facturación del cliente c, que estaba en el mes 2
> pero no en el 3.
>
> Espero haber explicado el caso con suficiente claridad y que podáis
> ayudarme.
> Muchas gracias!
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Streaming data en R

2018-01-23 Thread Carlos Ortega
Hola,

Bueno, puedes hacértelo tú mismo con un Sys.sleep() dentro de un bucle o
algo así y que vaya ejecutándose una función de lectura de datos y
procesado cada cierto tiempo...

Saludos,
Carlos Ortega.
www.qualityexcellence.es

El 23 de enero de 2018, 15:39, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Gracias Javier,
>
> Creo que el problema era ese, saber exactamente lo que queria
>
> Muchas gracias por el gran aporte!
> Jesús
> 
> De: Javier Marcuzzi <javier.ruben.marcu...@gmail.com>
> Enviado: martes, 23 de enero de 2018 15:26
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org
> Asunto: Re: [R-es] Streaming data en R
>
> Estimado Jesús Para Fernández
>
> Entonces posiblemente no es streaming, el planteo puede ser más simple con
> rvest, curl, o alguna otra forma. El aparato que genera los datos los
> guarda cada 4 minutos en un lugar de la web, por ejemplo los archivos se
> llaman medición_1.csv, medición_2.csv, medición_3.csv, y usted lee solo el
> que de falta, por ejemplo el medición_3.csv. Pero hay un inconveniente, R
> no está pensado para esto. Entonces lo que puede generar es un script en
> algún lenguaje que llame a R cada cierto tiempo y R ejecuta, porque de lo
> contrario R siempre tendría que estar funcionando, aunque hay alternativas
> como RServer de Microsoft. La librería que usted menciona por lo que dice
> en la parte de instalación, correría en Linux, pero independiente del
> sistema operativo, todos tienen alguna forma de ordenar que se ejecute un
> archivo cada cierto tiempo. Yo por streaming entiendo que los datos llegan
> continuamente, la comunicación permanece abierta, pero sus datos se generan
> cada cuatro minutos, por lo cuál puede abrir y cerrar la comunicación cada
> 4 minutos (se genera en el minuto par y se lee en el impar).
>
> Una búsqueda como esta puede darle ideas r script schedule
>
> Javier Ruben Marcuzzi
>
> El 23 de enero de 2018, 11:04, Jesús Para Fernández <
> j.para.fernan...@hotmail.com<mailto:j.para.fernan...@hotmail.com>>
> escribió:
> Gracias, pero eso hace streaming de twitter
>
> Lo que quiero es lo siguiente:
>
> Tengo un aparato que genera cada 4minutos una medicion y lo guarda en csv.
> Entonces queiro que ese dato lo vaya leyendo R de manera automatica.
>
> He visto la libreria cronR, pero me gustaria saber si hay algo mas...
>
> Gracias
> Jesús
> 
> De: Javier Marcuzzi <javier.ruben.marcu...@gmail.com<mailto:javier.ruben.
> marcu...@gmail.com>>
> Enviado: martes, 23 de enero de 2018 14:35
> Para: Jesús Para Fernández
> Cc: r-help-es@r-project.org<mailto:r-help-es@r-project.org>
> Asunto: Re: [R-es] Streaming data en R
>
> Estimado Jesús Para Fernández
>
> Me llamó la atención su consulta y realicé una búsqueda para ver si yo
> había entendido bien. Creo que yo entendí lo que usted busca y hay un
> ejemplo, para no perder tiempo lea las últimas líneas de la siguiente
> página https://github.com/pablobarbera/streamR<https://
> eur01.safelinks.protection.outlook.com/?url=https%3A%2F%
> 2Fgithub.com%2Fpablobarbera%2FstreamR=02%7C01%7C%
> 7C63989919eb32488397b808d562663ae4%7C84df9e7fe9f640afb435
> %7C1%7C0%7C636523113564418972=7gi5K%
> 2Fc7AiOIU5PIMftnjPSXBJGb5usYUYLl0kwg650%3D=0> (el inicio está
> incomprensible).
>
> Javier Rubén Marcuzzi
>
> El 23 de enero de 2018, 7:00, Jesús Para Fernández <
> j.para.fernan...@hotmail.com<mailto:j.para.fernan...@hotmail.com>>
> escribió:
> Buenas,
>
> ¿Como puedo hacer data streaming con R? He visot que esta el paquete
> stream, que es para clusterizacion, pero solo me interesa ingestar el dato,
> para luego aplicar modelos que nada tiene que ver con la clusterizacion...
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org<mailto:R-help-es@r-project.org>
> https://stat.ethz.ch/mailman/listinfo/r-help-es<https://
> eur01.safelinks.protection.outlook.com/?url=https%3A%2F%
> 2Fstat.ethz.ch%2Fmailman%2Flistinfo%2Fr-help-es=02%7C01%7C%
> 7C63989919eb32488397b808d562663ae4%7C84df9e7fe9f640afb435
> %7C1%7C0%7C636523113564418972=JC2yw4rGDsJ2s%2FBjhOcK2l6IHM1i1Rp%
> 2FOikup8wKLps%3D=0>
>
>
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Random Forests

2018-01-20 Thread Carlos Ortega
Hola,

No. Mira el ejemplo:

> data(iris)
> iris.rf <- randomForest(Species ~ ., iris)
> hist(treesize(iris.rf))
> treesize(iris.rf)
  [1]  7 10 13  7 10  6  9  8  7  9  8  8  6  8  7  9  7 10  6 16  4 13 11
10  8 11 10  8  7  9  9  6 11  7  5 10 12 10  7 12 12  8 11 10
 [45] 10 10  9 11  8  6  7 12  9  9  7  6 10  9 10  7  8  8  8  7  8 12  7
11 12  8  7  7  6  9  9  6  6 11  3  9 12 11 13  9  9  7  7 12
 [89] 11  6  6  8  6 11  9 10 10  6  7 14  7 10  8  7  9 11  7 14  7  7  8
9  7  6  9  8  9  8 13  9 10 10  9 11  6  7  9 10  8  9  9  6
[133]  9  8 10  9 11  8  6  7 13  6  6  9  5 14  8 10 13 10 12 13 11 12 10
9 12  9 13 10  9 11  7 10 10  9  9  8  6  5  9  9 11 10  8 10
[177]  4 10 12 10 10  8 10 11  9  5  7  8  8 15  8  7  7  9 12  9 10  9 12
8 10  8 11  9  6  7  9 12  7  8 10 12  6 14 11  4  6  6  7  9
[221] 10 11 13  5  8 10  7 10 10 12 10 11 11  8  9 11  9  9  9 10  6 10  7
10 10 14  9 10  6 10  6  8  6  9  9 10 10 10 10  9 10 10  8 14
[265]  8 11  6 11  9  9  9  8 11  7  8 11  8  4  9 11  6  8 10  8  9 10  8
9  8 11 11  9 12 14  7  9  8  9 10 10 11  8 12 12 12  4 10 11
[309]  8  8 11  9  9  8 10  9  4 10 10  6 13 10 12  9 10  9  5  9  7  4  7
15  7  8  7 11  7 11 12  5 12  7  9  8 13 14  9  9  9  9  6 13
[353] 13  7 10  6  5  6 10  6  8  8  9 11  9 11  7  7 11  8  6 10 13  7 12
11 14  7 10 11  9  8  6  8 10  8  9  6 10 10  6  7  7  7 11 13
[397]  8  5  7 14 10 14  8  9  6 11  9 11 10  9  8  7 11 10 10 11  8 10 12
9  8  8  9  9  9  9  9  5  9  7 13 10 11  8 10  9 10 12  8 12
[441]  9 10  4  7 11  7 10  4  6 13  8  7 10  9  7  6  8  9  7 11  8  8  9
10  5  8 11 12  6  5 10 10  6 10 10  5 10 13  9 13 10 10  6 12
[485]  8  7  9 12 10  9  7  7 14  6  9  6  6  8 10  6
> vtmp <- treesize(iris.rf)
> sum(vtmp)

Por defecto al no especificar nada, el "ntrees" de randomForest() es 500.
Efectivamente generas 500 árboles como ves en el número de elementos que
devuelve "treesize(iris.rf)".

Y cada árbol, tiene el número de nodos que ves en el valor de cada uno de
los elementos que igualmente devuelve "treesize(iris.rf)": 7, 10, 13...

Gracias,
Carlos

El 20 de enero de 2018, 10:36, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Gracias Carlos y Javier, ntrees es el nº de árboles y treesize sus
> respectivos tamaños (nº de nodos)
>
> ntree: Number of trees to grow. This should not be set to too small ..
>
> treesize: Size of trees (number of nodes) in and ensemble.
>
>
> Puse 1000 árboles (ntree=1000), si, pero la función treesize te da el nº
> de nodos:
>
> treesize(RFfit, terminal=TRUE) me da un vector de 1000 elementos (uno por
> cada árbol), todos ellos mayores que 4000 
>
> ¿tienen los 1000 árboles más de 4000 nodos cada uno? Parece extraño ¿no?
>
> Esa es mi pregunta
>
> Gracias nuevamente,
> Manuel
>
>
>
>
>
>
> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>
> Hola,
>>
>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>> de
>> tu modelo.
>> Y obtiene el número de nodos de cada uno de los árboles que hayas indicado
>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>> "ntrees"
>> tiene un valor de 500.
>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que seguramente
>> le hayas indicado un valor de 1000...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>> El 17 de enero de 2018, 14:29, Manuel Mendoza <mmend...@mncn.csic.es>
>> escribió:
>>
>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
>>> que es el nº de nodos. Me dan valores realmente elevados (en torno a
>>> 1000),
>>> y eso me parece extraño. ¿sabéis si es así?
>>> Gracias,
>>> Manuel
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Paquete pdp

2018-01-20 Thread Carlos Ortega
Hola,

Sí, y en la ayuda sobre el objeto que utiliza "partial()" también viene que
es posible...

object

A fitted model object of appropriate class (e.g., "gbm", "lm",
"randomForest", "train", etc.).

El 20 de enero de 2018, 13:55, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Acabo de encontrar que si sirve para gbm, por lo que no es esa la razón.
>
> Aquí: https://journal.r-project.org/archive/2017/RJ-2017-016/RJ-20
> 17-016.pdf
>
>
>
>
>
>
>
>
> Quoting Manuel Mendoza <mmend...@mncn.csic.es>:
>
> Buenas. El Paquete pdp es muy fácil de usar, pero cuando se lo aplico a
>> mis datos me da:
>>
>> Error in eval(stats::getCall(object)$data) : object 'x.data' not found.
>>
>> Os copio abajo un ejemplo de aplicación a un RF. El mio es de un boosted
>> regression trees (paquete gbm). No sé si esa puede ser la razón del error.
>> En el paquete pdp no especifica que sea solo para RF, aunque en los
>> ejemplos que encontré nunca eran de boosted ... Solo de RF y SVM.
>>
>> Gracias,
>> Manuel
>>
>>
>> library(pdp)
>> data (boston)  # load the boston housing data
>> set.seed(101)  # for reproducibility
>> boston.rf <- randomForest(cmedv ~ ., data = boston)
>>
>> # Partial dependence of cmedv on lstat and rm
>>
>> pd <- partial(boston.rf, pred.var = c("lstat", "rm"), chull = TRUE)
>>
>> head(pd)  # print first 6 rows
>> #> lstat  rm yhat
>> #> 1  7.5284 3.66538 24.13683
>> #> 2  8.2532 3.66538 23.24916
>> #> 3  8.9780 3.66538 23.13119
>> #> 4  9.7028 3.66538 22.13531
>> #> 5 10.4276 3.66538 20.62331
>> #> 6 11.1524 3.66538 20.51258
>>
>>
>>
>>
>>
>>
>>
>> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>>
>> Hola,
>>>
>>> A "treesize()" le tienes que pasar como parámetro el objeto randomForest
>>> de
>>> tu modelo.
>>> Y obtiene el número de nodos de cada uno de los árboles que hayas
>>> indicado
>>> en el valor del parámetros "ntrees" de "randomForest". Por defecto
>>> "ntrees"
>>> tiene un valor de 500.
>>> Mira qué valor tiene "ntrees" en tu modelo "randomForest", que
>>> seguramente
>>> le hayas indicado un valor de 1000...
>>>
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>> El 17 de enero de 2018, 14:29, Manuel Mendoza <mmend...@mncn.csic.es>
>>> escribió:
>>>
>>> Buenas tardes a todos. El paquete randomForest tiene la función treesize,
>>>> que es el nº de nodos. Me dan valores realmente elevados (en torno a
>>>> 1000),
>>>> y eso me parece extraño. ¿sabéis si es así?
>>>> Gracias,
>>>> Manuel
>>>> --
>>>> Dr Manuel Mendoza
>>>> Department of Biogeography and Global Change
>>>> National Museum of Natural History (MNCN)
>>>> Spanish Scientific Council (CSIC)
>>>> C/ Serrano 115bis, 28006 MADRID
>>>> Spain
>>>>
>>>> ___
>>>> R-help-es mailing list
>>>> R-help-es@r-project.org
>>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>>
>>>>
>>>
>>>
>>> --
>>> Saludos,
>>> Carlos Ortega
>>> www.qualityexcellence.es
>>>
>>
>>
>> --
>> Dr Manuel Mendoza
>> Department of Biogeography and Global Change
>> National Museum of Natural History (MNCN)
>> Spanish Scientific Council (CSIC)
>> C/ Serrano 115bis, 28006 MADRID
>> Spain
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] partialPlot en un Randomforest

2018-01-07 Thread Carlos Ortega
Hola Manuel,

Es que me confundí de día y me quedé esperando a los Reyes Magos... :-)...

Sí, eso de la probabilidad como indica la ayuda realmente es algo confuso.
Tómalo como una medida de referencia sobre el de la mejora en el valor de
probabilidad a la hora de hacer una clasificación.
También considera este enfoque para la regresión. El gráfico te muestra en
qué intervalos se maximiza la probabilidad de una clase en la variable
objetivo (para una clasificación), para una regresión no lo tengo tan claro.

Con los parámetros de la función
x

an object of class randomForest, which contains a forest component.
pred.data

a data frame used for contructing the plot, usually the training data used
to contruct the random forest.
x.var

name of the variable for which partial dependence is to be examined.
which.class

For classification data, the class to focus on (default the first class).

El parámetro which.class ("versicolor" en el ejemplo), solo se usa para los
casos de clasificación. No es la etiqueta del eje o algo parecido... Si lo
incluyes para un gráfico de regresión, no tiene efecto.

Sigo viendo el paquete "pdp" más estructurado y claro en el tratamiento de
los "partial dependence plot"...

Gracias,
Carlos.

El 7 de enero de 2018, 10:58, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Muchas gracias Carlos; ¡tu siempre al pié del cañón! (lo puse el día de
> reyes a la 1.20h y me contestas a las 2.45h)
>
> Una cosa más: si el eje y es la probabilidad ¿por qué va de 0 a 10? En un
> RF para clasificación me da valores parecidos a los de tu ejemplo, y en
> otro para regresión, valores de y entre 45 y 55.
>
> Para regresión, el último parámetro no puede ser una categoría, como
> "versicolor". Yo puse la variable entrecomillada, pensando que era el
> nombre del eje x, pero he probado a poner otra cosa, y lo ignora; lo he
> quitado y no afecta. Pensé que podría ser el valor de la variable respuesta
> más esperado, en función del valor del predictor, pero no se mueve en el
> mismo rango.
>
> Voy a ver el paquete pdp del que me hablas.
>
> Gracias nuevamente,
>
> Manuel
>
>
>
> Quoting Carlos Ortega <c...@qualityexcellence.es>:
>
> Hola,
>>
>> Ya es que la explicación de la función es un tanto oscura...
>>
>> Mira el ejemplo (clasificación):
>>
>> data(iris)
>>> set.seed(543)
>>> iris.rf <- randomForest(Species~., iris)
>>> partialPlot(iris.rf, iris, Petal.Width, "versicolor")
>>>
>>
>> Y el gráfico que se produce:
>>
>> [image: Imágenes integradas 1]
>> El gráfico mide la variación de la probabilidad sobre una de las clases de
>> la variable target (en este caso la variable target es "Species" y la
>> clase
>> es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
>> caso "Petal.Width". El gráfico te indica que valores de Petal.Width
>> cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
>> "versicolor".
>>
>> Y algo parecido para cuando tienes un modelo de "regresión".
>>
>> No sé ese "VR" que comentas en tu duda de dónde sale...
>>
>> Si estás interesado en este tema, mira también el paquete  "pdp".
>>
>> Gracias,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>>
>> El 7 de enero de 2018, 1:21, Manuel Mendoza <mmend...@mncn.csic.es>
>> escribió:
>>
>>
>>> Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
>>> plot que resulta de aplicar partialPlot en un Randomforest.
>>>
>>> Encuentro que:
>>>
>>> Partial dependence plot gives a graphical depiction of the marginal
>>> effect
>>> of a variable on the class probability (classification) or response
>>> (regression)
>>>
>>> que nos indica como varía la VR en función de la variable considerada,
>>> manteniendo el resto de variables fijas.
>>>
>>> No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
>>> explicación de qué son los dos ejes.
>>>
>>> Gracias,
>>> Manuel
>>>
>>>
>>> --
>>> Dr Manuel Mendoza
>>> Department of Biogeography and Global Change
>>> National Museum of Natural History (MNCN)
>>> Spanish Scientific Council (CSIC)
>>> C/ Serrano 115bis, 28006 MADRID
>>> Spain
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] partialPlot en un Randomforest

2018-01-06 Thread Carlos Ortega
Hola,

Ya es que la explicación de la función es un tanto oscura...

Mira el ejemplo (clasificación):

> data(iris)
> set.seed(543)
> iris.rf <- randomForest(Species~., iris)
> partialPlot(iris.rf, iris, Petal.Width, "versicolor")

Y el gráfico que se produce:

[image: Imágenes integradas 1]
El gráfico mide la variación de la probabilidad sobre una de las clases de
la variable target (en este caso la variable target es "Species" y la clase
es "versicolor") de acuerdo a cómo varía la variable de estudio, en este
caso "Petal.Width". El gráfico te indica que valores de Petal.Width
cercanos a 1.0 se obtiene el máximo de probabilidad de que Species sea
"versicolor".

Y algo parecido para cuando tienes un modelo de "regresión".

No sé ese "VR" que comentas en tu duda de dónde sale...

Si estás interesado en este tema, mira también el paquete  "pdp".

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 7 de enero de 2018, 1:21, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

>
> Hola erreros. A ver si alguien podría decirme qué son los dos ejes del
> plot que resulta de aplicar partialPlot en un Randomforest.
>
> Encuentro que:
>
> Partial dependence plot gives a graphical depiction of the marginal effect
> of a variable on the class probability (classification) or response
> (regression)
>
> que nos indica como varía la VR en función de la variable considerada,
> manteniendo el resto de variables fijas.
>
> No encuentro lo que es esa VR por ningún sitio (varianza?), ni la
> explicación de qué son los dos ejes.
>
> Gracias,
> Manuel
>
>
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] incluir las replicas en anova

2018-01-05 Thread Carlos Ortega
Hola,

Mira este ejemplo detallado...

https://www.statmethods.net/stats/anova.html

Saludos,
Carlos Ortega
www.qualityexcellence.es

El 5 de enero de 2018, 12:58, Yesica Pallavicini Fernandez <
yesipa...@gmail.com> escribió:

> Hola
> 1) Gracias José por tu comentario, tienes razón.
> 2) como prueba ad hoc estoy usando la función pairwise.t.test(data1,
> data2,p.adjust="bonferroni")
> ¿Alguien sabe alguna otra función que me ponga letras (a ab b c etc.)
> cuando haga la comparación?
> gracias
> Yesica
>
> El 5 de enero de 2018, 12:36, Yesica Pallavicini Fernandez <
> yesipa...@gmail.com> escribió:
>
> > Hola.
> > Estoy realizando una ANOVA con la función lm()
> > El ensayo tiene 3 réplicas por tratamiento y no se cómo incluir estas
> > réplicas en la función lm().
> > Gracias por vuestra ayuda
> > Yesica
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] codificación

2017-12-22 Thread Carlos Ortega
Prueba...

https://stackoverflow.com/questions/31483964/read-csv-file-in-r-with-spanish-characters-%C2%B4-%C3%B1

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 22 de diciembre de 2017, 17:53, Juan Antonio Gil <j...@edu.uned.es>
escribió:

>
> Muchas gracias Carlos pero creo tengo los locale correctos:
>
> > Sys.getlocale()[1] 
> > "LC_COLLATE=Spanish_Spain.1252;LC_CTYPE=Spanish_Spain.1252;LC_MONETARY=Spanish_Spain.1252;LC_NUMERIC=C;LC_TIME=Spanish_Spain.1252"
>
> ¿Puede ser que no tengo UTF-8?
>
> Saludos,
>
>
> Juan
>
>
>
> El 22/12/2017 a las 17:31, Carlos Ortega escribió:
>
> Hola Juan Antonio,
>
> En Mac no me aparece este error...
>
> > dest <- getwd()
> > mdoc<-list.files(path = dest,pattern = "*.txt",  full.names = TRUE)
> > mdoc
> [1] "/Users/cof/Downloads/Adrián.txt"
> > Sys.getlocale()
> [1] "es_ES.UTF-8/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8"
>
> Mira los "locale" que tienes... con Sys.setlocale() los puedes configurar.
> Probaré en una máquina Windows si no das con una solución.
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
> El 22 de diciembre de 2017, 16:28, Juan Antonio Gil <j...@edu.uned.es>
> escribió:
>
>> Estimados compañeros me tiene loco un problema de codificación que no
>> logro resolver. Importo un fichero cuyo nombre tiene acento. Pongamos
>> por ejemplo "Adrián.doc". Escribo el siguiente comando:
>>
>> mdoc<-list.files(path = dest,pattern = "*.doc",  full.names = TRUE)
>>
>> Entonces mdoc, además del path, se me presenta como:
>>
>> "Adria´n.doc"
>>
>> Aunque le quite la tilde con:
>>
>> mdoc1<-iconv(mdoc,"UTF-8","latin1"," ")
>>
>> Como necesito llamar al fichero o ficheros para leerlo/s. No me funciona
>>
>> file.rename(from=mdoc,to=mdoc1)
>>
>> Mi pregunta es: ¿cómo puedo poner de nuevo el acento al nombre del
>> fichero?, o también ¿cómo me puede funcionar el rename?
>>
>> Muchas gracias,
>>
>>
>> Juan
>>
>>
>> --
>> Juan Antonio Gil Pascual
>> Matemático, estadístico, especialista en Text Mining
>> correo: jm...@telefonica.net
>> web: www.jgil.acta.es
>>
>>
>> AVISO LEGAL. Este mensaje puede contener información reservada y
>> confidencial. Si usted no es el destinatario no está autorizado a copiar,
>> reproducir o distribuir este mensaje ni su contenido. Si ha recibido este
>> mensaje por error, le rogamos que lo notifique al remitente.
>> Le informamos de que sus datos personales, que puedan constar en este
>> mensaje, están incorporados a un fichero titularidad de la UNED cuya
>> finalidad es la de mantener el contacto con usted. En cualquier momento
>> podrá ejercer sus derechos de acceso, rectificación, cancelación y
>> oposición ante la UNED, Departamento de Política Jurídica de Seguridad de
>> la Información<http://portal.uned.es/portal/page?_pageid=93,244
>> 32769,93_24432770&_dad=portal&_schema=PORTAL>, o a través de la Sede
>> electrónica<https://sede.uned.es/> de la Universidad.
>>
>> ___
>> R-help-es mailing list
>> R-help-es@r-project.org
>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>
>
>
>
> --
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
> --
> Juan Antonio Gil Pascual
> Matemático, estadístico, especialista en Text Mining
> correo: jm...@telefonica.net
> web: www.jgil.acta.es
>
>
> *AVISO LEGAL*. Este mensaje puede contener información reservada y
> confidencial. Si usted no es el destinatario no está autorizado a copiar,
> reproducir o distribuir este mensaje ni su contenido. Si ha recibido este
> mensaje por error, le rogamos que lo notifique al remitente.
> Le informamos de que sus datos personales, que puedan constar en este
> mensaje, están incorporados a un fichero titularidad de la UNED cuya
> finalidad es la de mantener el contacto con usted. En cualquier momento
> podrá ejercer sus derechos de acceso, rectificación, cancelación y
> oposición ante la UNED, Departamento de Política Jurídica de Seguridad de
> la Información
> <http://portal.uned.es/portal/page?_pageid=93,24432769,93_24432770&_dad=portal&_schema=PORTAL>,
> o a través de la Sede electrónica <https://sede.uned.es/> de la
> Universidad.
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] codificación

2017-12-22 Thread Carlos Ortega
Hola Juan Antonio,

En Mac no me aparece este error...

> dest <- getwd()
> mdoc<-list.files(path = dest,pattern = "*.txt",  full.names = TRUE)
> mdoc
[1] "/Users/cof/Downloads/Adrián.txt"
> Sys.getlocale()
[1] "es_ES.UTF-8/es_ES.UTF-8/es_ES.UTF-8/C/es_ES.UTF-8/es_ES.UTF-8"

Mira los "locale" que tienes... con Sys.setlocale() los puedes configurar.
Probaré en una máquina Windows si no das con una solución.

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 22 de diciembre de 2017, 16:28, Juan Antonio Gil <j...@edu.uned.es>
escribió:

> Estimados compañeros me tiene loco un problema de codificación que no
> logro resolver. Importo un fichero cuyo nombre tiene acento. Pongamos
> por ejemplo "Adrián.doc". Escribo el siguiente comando:
>
> mdoc<-list.files(path = dest,pattern = "*.doc",  full.names = TRUE)
>
> Entonces mdoc, además del path, se me presenta como:
>
> "Adria´n.doc"
>
> Aunque le quite la tilde con:
>
> mdoc1<-iconv(mdoc,"UTF-8","latin1"," ")
>
> Como necesito llamar al fichero o ficheros para leerlo/s. No me funciona
>
> file.rename(from=mdoc,to=mdoc1)
>
> Mi pregunta es: ¿cómo puedo poner de nuevo el acento al nombre del
> fichero?, o también ¿cómo me puede funcionar el rename?
>
> Muchas gracias,
>
>
> Juan
>
>
> --
> Juan Antonio Gil Pascual
> Matemático, estadístico, especialista en Text Mining
> correo: jm...@telefonica.net
> web: www.jgil.acta.es
>
>
> AVISO LEGAL. Este mensaje puede contener información reservada y
> confidencial. Si usted no es el destinatario no está autorizado a copiar,
> reproducir o distribuir este mensaje ni su contenido. Si ha recibido este
> mensaje por error, le rogamos que lo notifique al remitente.
> Le informamos de que sus datos personales, que puedan constar en este
> mensaje, están incorporados a un fichero titularidad de la UNED cuya
> finalidad es la de mantener el contacto con usted. En cualquier momento
> podrá ejercer sus derechos de acceso, rectificación, cancelación y
> oposición ante la UNED, Departamento de Política Jurídica de Seguridad de
> la Información<http://portal.uned.es/portal/page?_pageid=93,
> 24432769,93_24432770&_dad=portal&_schema=PORTAL>, o a través de la Sede
> electrónica<https://sede.uned.es/> de la Universidad.
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] [Grupo de R de Madrid]: Reunión este próximo jueves 14 de diciembre...

2017-12-15 Thread Carlos Ortega
Buenas a todos,

Ya están disponibles los videos de la sesión que celebramos el jueves
pasado:

http://madrid.r-es.org/48-jueves-14-de-diciembre-2017/

Gracias,
Carlos Ortega
www.qualityexcellence.es


El 11 de diciembre de 2017, 9:57, Carlos Ortega <c...@qualityexcellence.es>
escribió:

> Por si alguno todavía no está enterado y puede/quiere pasarse a la
> reunión...
>
> https://www.meetup.com/es-ES/preview/Grupo-de-Usuarios-de-
> R-de-Madrid/events/245493049/
>
>
> Gracias,
> Carlos  Ortega
> www.qualityexcellence.es
>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Como cambiar el tamaño de los árboles de clasificación

2017-12-15 Thread Carlos Ortega
Hola,

Yo usaría una función de Rattle para hacerlo que consigue una salida
gráfica muy atractiva y ordenada...
Mira este ejemplo...

https://stackoverflow.com/questions/45570298/what-does-the-number-on-top-of-a-node-in-a-fancyrpartplot-decision-tree-mean

Saludos,
Carlos Ortega
www.qualityexcellence.es



El 15 de diciembre de 2017, 9:49, Manuel Mendoza <mmend...@mncn.csic.es>
escribió:

> Muy buenas; mi primera consulta. Utilizo rpart (con as.party) y evtree,
> para obtener árboles de clasificación. Los represento en una windows()
> aparte, pero cuando el árbol es un poco grande, las hojas quedan muy
> estrechas y no se ven los porcentajes. ¿Sabéis como hacer que todo el árbol
> sea más pequeño para que las hojas no queden como simples líneas?
> Gracias
> --
> Dr Manuel Mendoza
> Department of Biogeography and Global Change
> National Museum of Natural History (MNCN)
> Spanish Scientific Council (CSIC)
> C/ Serrano 115bis, 28006 MADRID
> Spain
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


[R-es] [Grupo de R de Madrid]: Reunión este próximo jueves 14 de diciembre...

2017-12-11 Thread Carlos Ortega
Por si alguno todavía no está enterado y puede/quiere pasarse a la
reunión...

https://www.meetup.com/es-ES/preview/Grupo-de-Usuarios-de-R-de-Madrid/events/245493049/


Gracias,
Carlos  Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-06 Thread Carlos Ortega
Sí, estás un tanto al límite de la capacidad de tu ordenador.
Varias cosas que no has comentado:

   - ¿Qué versión de R usas?
   - ¿Usas una versión de 32bits ó 64bits?.
   - ¿Windows?, supongo.
  - En Windows puedes ver los recursos de tu máquina y confirmar que
  cuando tienes el conjunto cargado en R estás muy al límite de tu RAM.

Con todo esto cosas que puedes hacer:

   - Hacer un muestreo. Nada más cargar el conjunto puedes hacer algo como
   esto:

# De esta forma te quedas con un 75% de los datos.

datos_samp <- datos[ sample(1:nrow(datos), nrow(datos)*0.75) , ]

rm(datos)

Y a partir de aquí ya trabajas con datos_samp


   - ​Puedes convertir tus datos​ a data.table (no sé si lo has usado
   antes... que permite comprimir el data.frame. Lo harías así:


library(foreign)

​library(data.table)​

datos = as.data.
​table​
(read.dta("private98-06more_than9.dta"))


Y a partir ya trabajar con "datos" como data.table.


Saludos,
Carlos Ortega
www.qualityexcellence.es


El 6 de diciembre de 2017, 22:03, Javier Marcuzzi <
javier.ruben.marcu...@gmail.com> escribió:

> Estimados
>
> Pienso que falta memoria, aparte de las sugerencias ya aportadas, de
> pronto se podrían colocar algunos rm(liberar_de_memoria), para no tener
> ocupado espacio que no es requerido porque ese paso ya fue realizado.
>
> Javier Rubén Marcuzzi
>
> El 6 de diciembre de 2017, 13:58, Antonio Rodriguez Andres <
> antoniorodriguezandre...@gmail.com> escribió:
>
>> Carlos
>> He tecleado lo siguiente para leer el fichero de Stata
>>
>> library(foreign)
>> datos = as.data.frame(read.dta("private98-06more_than9.dta"))
>> save(datos, file="data.RData")
>> load("data.RData")
>> dim(datos)
>> class(datos)
>>
>> Tiene ese numero de filas y columnas que son las variables.
>>
>>  dim(datos)[1] 9418455  28
>>
>> Mi memoria RAM es 4GB, pero he conseguido leer los datos, y tambien
>> hacer un histograma de age, aunque es dificil ver algo por la cantidad
>> de individuos que hay en la base de datos.
>>
>> hist(datos$age, main="Titulo", xlab="Age")
>>
>> Ya cuando intento ver los valores perdidos con
>>
>> is.na(datos) me sale error
>>
>>
>> Error: cannot allocate vector of size 1006.0 Mb
>>
>> Saludos
>>
>>
>>
>> 2017-12-06 13:49 GMT+01:00 Carlos Ortega <c...@qualityexcellence.es>:
>>
>> > OK.
>> > Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo
>> que
>> > quieras).
>> > Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de
>> > memoria.
>> >
>> > Y comienza una nueva sesión con RStudio cargando los datos con
>> "fread()".
>> > Por otro lado, este conjunto de datos ¿cómo es de grande (filas y
>> > columnas)?.
>> >
>> > ¿Y qué máquina tienes?. ¿Cuanta RAM tienes?.
>> >
>> > Gracias,
>> > Carlos.
>> >
>> >
>> > El 6 de diciembre de 2017, 13:42, Antonio Rodriguez Andres <
>> > antoniorodriguezandre...@gmail.com> escribió:
>> >
>> >> Carlos
>> >>
>> >> use library foreign, y read.dta. Consegui leer los datos. Pero demora
>> >> mucho. explore los datos con head y tail, y con summary. Conseguis los
>> >> resultados. Muy lento. Una cosa a. hacer es un histograma y ahi ya
>> ponia
>> >> cannot allocate memory.
>> >>
>> >> Pense que podria leer los datos de otra manera mas eficiente.
>> >>
>> >> El 6/12/2017 13:32, "Carlos Ortega" <c...@qualityexcellence.es>
>> escribió:
>> >>
>> >>> Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido
>> >>> de Stata a csv o algún otro formato que con el que puedas trabajar en
>> >>> RStudio?.
>> >>> ¿O ahora el problema es que has convertido el fichero pero no puedes
>> >>> hacer ningún tipo de análisis porque tu equipo no tiene suficientes
>> >>> recursos?...
>> >>>
>> >>> Gracias,
>> >>> Carlos.
>> >>>
>> >>> El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres <
>> >>> antoniorodriguezandre...@gmail.com> escribió:
>> >>>
>> >>>> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda
>> >>>> mucho.
>> >>>> Y si hago un histograma de una variable edad, hay colapsa.
>> >>>>
>> >>&g

Re: [R-es] STATA base de datos

2017-12-06 Thread Carlos Ortega
OK.
Lee primero los datos, guarda el data.frame (.RData o en un .csv o lo que
quieras).
Sal de RStudio o incluso reinicia el ordenador para liberar el máximo de
memoria.

Y comienza una nueva sesión con RStudio cargando los datos con "fread()".
Por otro lado, este conjunto de datos ¿cómo es de grande (filas y
columnas)?.

¿Y qué máquina tienes?. ¿Cuanta RAM tienes?.

Gracias,
Carlos.


El 6 de diciembre de 2017, 13:42, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> escribió:

> Carlos
>
> use library foreign, y read.dta. Consegui leer los datos. Pero demora
> mucho. explore los datos con head y tail, y con summary. Conseguis los
> resultados. Muy lento. Una cosa a. hacer es un histograma y ahi ya ponia
> cannot allocate memory.
>
> Pense que podria leer los datos de otra manera mas eficiente.
>
> El 6/12/2017 13:32, "Carlos Ortega" <c...@qualityexcellence.es> escribió:
>
>> Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido de
>> Stata a csv o algún otro formato que con el que puedas trabajar en RStudio?.
>> ¿O ahora el problema es que has convertido el fichero pero no puedes
>> hacer ningún tipo de análisis porque tu equipo no tiene suficientes
>> recursos?...
>>
>> Gracias,
>> Carlos.
>>
>> El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres <
>> antoniorodriguezandre...@gmail.com> escribió:
>>
>>> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda
>>> mucho.
>>> Y si hago un histograma de una variable edad, hay colapsa.
>>>
>>> El 6/12/2017 13:05, "Antonio Rodriguez Andres" <
>>> antoniorodriguezandre...@gmail.com> escribió:
>>>
>>> > Freddy
>>> >
>>> > el archivo lo leo en segundos en Stata. puedo probar el paquete heaven.
>>> > Pero si recuerdo me dio problemas en RStudio
>>> >
>>> > El 6/12/2017 13:03, "Freddy Omar López Quintero" <
>>> freddy.vat...@gmail.com>
>>> > escribió:
>>> >
>>> >> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres
>>> escribió:
>>> >>
>>> >> me sale problema
>>> >> de memoria.
>>> >>
>>> >>
>>> >> Pregunta posiblemente tonta: ¿tienes suficiente memoria para procesar
>>> un
>>> >> archivo de tales dimensiones? Puede que ni aún cambiando la manera de
>>> leer
>>> >> el archivo realmente lo puedas procesar.
>>> >>
>>> >>
>>> >> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar
>>> el
>>> >> comando fread, y finalmente cargar los datos como RData
>>> >>
>>> >>
>>> >> ¿Has probado el paquete haven y específicamente su función read_dta?
>>> >> Parece que es bastante más eficiente que la de foreign y preserva más
>>> >> características que trae el formato de stata.
>>> >>
>>> >> ¡Ojalá algo sirva!
>>> >>
>>> >> ¡Salud!
>>> >>
>>> >> --
>>> >>
>>> >> «...homines autem hominum causa esse generatos...»
>>> >>
>>> >> Cicero
>>> >>
>>> >
>>>
>>> [[alternative HTML version deleted]]
>>>
>>> ___
>>> R-help-es mailing list
>>> R-help-es@r-project.org
>>> https://stat.ethz.ch/mailman/listinfo/r-help-es
>>>
>>
>>
>>
>> --
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es
>>
>


-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] STATA base de datos

2017-12-06 Thread Carlos Ortega
Pero entonces, ¿has leído ya el fichero en RStudio? ¿lo has convertido de
Stata a csv o algún otro formato que con el que puedas trabajar en RStudio?.
¿O ahora el problema es que has convertido el fichero pero no puedes hacer
ningún tipo de análisis porque tu equipo no tiene suficientes recursos?...

Gracias,
Carlos.

El 6 de diciembre de 2017, 13:09, Antonio Rodriguez Andres <
antoniorodriguezandre...@gmail.com> escribió:

> He llegado hacer un summary o algo asi. Despues de leerlo pero tarda mucho.
> Y si hago un histograma de una variable edad, hay colapsa.
>
> El 6/12/2017 13:05, "Antonio Rodriguez Andres" <
> antoniorodriguezandre...@gmail.com> escribió:
>
> > Freddy
> >
> > el archivo lo leo en segundos en Stata. puedo probar el paquete heaven.
> > Pero si recuerdo me dio problemas en RStudio
> >
> > El 6/12/2017 13:03, "Freddy Omar López Quintero" <
> freddy.vat...@gmail.com>
> > escribió:
> >
> >> El mié, 06-12-2017 a las 12:55 +0100, Antonio Rodriguez Andres escribió:
> >>
> >> me sale problema
> >> de memoria.
> >>
> >>
> >> Pregunta posiblemente tonta: ¿tienes suficiente memoria para procesar un
> >> archivo de tales dimensiones? Puede que ni aún cambiando la manera de
> leer
> >> el archivo realmente lo puedas procesar.
> >>
> >>
> >> Entonces, una solucion es intentar pasar de STATA a CSV y luego usar el
> >> comando fread, y finalmente cargar los datos como RData
> >>
> >>
> >> ¿Has probado el paquete haven y específicamente su función read_dta?
> >> Parece que es bastante más eficiente que la de foreign y preserva más
> >> características que trae el formato de stata.
> >>
> >> ¡Ojalá algo sirva!
> >>
> >> ¡Salud!
> >>
> >> --
> >>
> >> «...homines autem hominum causa esse generatos...»
> >>
> >> Cicero
> >>
> >
>
> [[alternative HTML version deleted]]
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] Búsqueda de palabras en una variable de R

2017-11-28 Thread Carlos Ortega
Hola,

Si te he entendido bien, este sería un ejemplo y una solución:

 > > marcas <- c('en', 'lugar')> > mydf <- data.frame(+
 x = 1:10,+ y = c('en', 'un', 'lugar', 'de',
'la', 'Mancha', 'de', 'cuyo', 'nombre', 'no'),+ z
= letters[1:10]+ )> > mydf$dum <- ifelse( mydf$y %in% marcas, 1, 0)>
mydfx  y z dum
1   1 en a   1
2   2 un b   0
3   3  lugar c   1
4   4 de d   0
5   5 la e   0
6   6 Mancha f   0
7   7 de g   0
8   8   cuyo h   0
9   9 nombre i   0
10 10 no j   0


>

​Saludos,
Carlos Ortega
www.qualityexcellence.es
​


El 28 de noviembre de 2017, 3:42, <miriam.alz...@unavarra.es> escribió:

> Buenas,
>
> Tengo un vector de 40 palabras (marca) y necesito saber si en una de las
> variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si
> se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1
> que incluye alguna palabra y 0 que no incluye.
>
> ¿Qué paquete me recomendáis? ¿Cuál sería el comando a ejecutar?
>
> Gracias!
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es

Re: [R-es] Tibble o data.table?

2017-11-22 Thread Carlos Ortega
Hola,

Si te mueves en el "tidyverse" y te gustan los "pipes", realmente no te
queda otra opción que usar los tibbles.

La sintaxis de data.table es un tanto compleja frente a la sencillez que
ofrece el trabajar con pipelines y para conjuntos medianos, no hay tanta
diferencia en rendimiento.
Por otro lado, son cada vez más los paquetes que se quieren hacer
compatibles con este esquema "tidyverse" ("tidytext", "tidyquant", hasta el
mismo "sparklyr").

Gracias,
Carlos Ortega
www.qualityexcellence.es

El 22 de noviembre de 2017, 10:39, Jesús Para Fernández <
j.para.fernan...@hotmail.com> escribió:

> Buenas
>
> Os queria preguntar que ventaja le veis a las tibbles frente a los
> data.table, ya que para mi, quitando el uso de librerias como tidyr o
> purrr, en el resto prefiero usar data.table. Me parece igual de potente y
> mucho más rápido, y no le veo las supuestas ventajas, pero quiero conocer
> vuestra opinion.
>
> Gracias
> Jesús
>
> [[alternative HTML version deleted]]
>
>
> ___
> R-help-es mailing list
> R-help-es@r-project.org
> https://stat.ethz.ch/mailman/listinfo/r-help-es
>



-- 
Saludos,
Carlos Ortega
www.qualityexcellence.es

[[alternative HTML version deleted]]

___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es


Re: [R-es] mensaje de error al usar libreria tibbletime

2017-11-21 Thread Carlos Ortega
Hola,

Así funciona:

> library(tibbletime)> library(data.table)> datIn <- fread("iridium.txt")> a <- 
> as_tbl_time(datIn,index = date)Error: Specified `index` is not time based> > 
> library(lubridate)> datIn$mydate <- ymd_hms(datIn$date)> a_new <- 
> as_tbl_time(datIn,index = mydate)> a_new# A time tibble: 8,335 x 16
# Index: mydate
 date batt_volt_Min Rshort_up Rshort_dn
long_up_corr_Avg long_dn_corr_Avg
   

 1 2016/02/08 0:00:00 12.67-1.360 5.985
336.6329.2
 2 2016/02/08 1:00:00 12.58-2.376 4.291
335.6329.2
 3 2016/02/08 2:00:00 12.54-3.297 4.259
329.5329.2
 4 2016/02/08 3:00:00 12.52-2.461 2.009
331.4328.4
 5 2016/02/08 4:00:00 12.49-2.665 2.407
335.8328.2
 6 2016/02/08 5:00:00 12.46-2.658 4.423
337.7328.8
 7 2016/02/08 6:00:00 12.43-2.039 3.843
338.9328.8
 8 2016/02/08 7:00:00 12.40-0.953 3.141
338.9328.8
 9 2016/02/08 8:00:00 12.3914.610 9.980
339.0328.8
10 2016/02/08 9:00:00 12.4461.30031.470
338.4328.9
# ... with 8,325 more rows, and 10 more variables: WinVel_Avg ,
WinDir_Avg ,
#   Taire_Avg , Haire_Avg , RTD_C_Avg , BP_hPA_Avg ,
#   AltN_corr_Avg , ejex_Avg , ejey_Avg , mydate 


El problema es que a la hora de importar el fichero, por defecto "date" no
tiene formato fecha, hay que dársela...
Y en cuanto ya tiene formato fecha, todo funciona...

Saludos,
Carlos Ortega
www.qualityexcellence.es


El 21 de noviembre de 2017, 13:54, Javier Valdes Cantallopts (DGA) <
javier.val...@mop.gov.cl> escribió:

> Carlos:
>
> Envío tabla con datos para prueba.
>
>
>
> [image: Descripción: FIRMA3]
>
>
>
> *De:* Carlos Ortega [mailto:c...@qualityexcellence.es]
> *Enviado el:* lunes, 20 de noviembre de 2017 18:01
> *Para:* Javier Valdes Cantallopts (DGA)
> *CC:* r-help-es@r-project.org
> *Asunto:* Re: mensaje de error al usar libreria tibbletime
>
>
>
> Hola,
>
>
>
> Si compartes una parte de tus datos, hasta a lo mejor lo podemos
> reproducir...
>
>
>
> Gracias,
>
> Carlos Ortega
>
> www.qualityexcellence.es
>
>
>
> El 20 de noviembre de 2017, 19:31, Javier Valdes Cantallopts (DGA) <
> javier.val...@mop.gov.cl> escribió:
>
> Hola  A todos.
>
> Aún no he podido encontrar la causa de porqué la libraría tibbletime, al
> transformar la tabla a *AS_TBL_TIME* ME ARROJA EL SIGUIENTE EL SIGUIENTE
> MENSAJE
>
>
>
> Error: assert_that: assertion must return a logical value
>
>
>
> Si alguien ha tenido ese mismo problema, solicito ayuda al foro.
>
>
>
> El seguimiento de la transformación es el siguiente;
>
>
>
> library(tibbletime)
>
> a<-read.table("iridium.txt",header = T, sep = "\t")
>
> a<-as_tbl_time(a,index = date)
>
>
>
> Error: assert_that: assertion must return a logical value
>
>
>
> [image: Descripción: FIRMA3]
>
>
>
>
> --
>
>
> CONFIDENCIALIDAD: La información contenida en este mensaje y/o en los
> archivos adjuntos es de carácter confidencial o privilegiada y está
> destinada al uso exclusivo del emisor y/o de la persona o entidad a quien
> va dirigida. Si usted no es el destinatario, cualquier almacenamiento,
> divulgación, distribución o copia de esta información está estrictamente
> prohibido y sancionado por la ley. Si recibió este mensaje por error, por
> favor infórmenos inmediatamente respondiendo este mismo mensaje y borre
> todos los archivos adjuntos. Gracias.
>
> CONFIDENTIAL NOTE: The information transmitted in this message and/or
> attachments is confidential and/or privileged and is intented only for use
> of the person or entity to whom it is addressed. If you are not the
> intended recipient, any retention, dissemination, distribution or copy of
> this information is strictly prohibited and sanctioned by law. If you
> received this message in error, please reply us this same message and
> delete this message and all attachments. Thank you.
>
>
>
>
> --
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> --
>
> CONFIDENCIALIDAD: La información contenida en este mensaje y/o en los
> archivos adjuntos es de carácter confidencial o privilegiada y está
> destinada al uso exclusivo del emisor y/o de la persona o entidad a quien
> va dirigida. Si usted no es el destinatario, cualquier almacenamiento,
> divulgación, distribución o copia de esta información está estric

<    1   2   3   4   5   6   7   8   >