Buenas tardes,
Estoy tratando de fusionar dos data.frames pero no obtengo lo deseado.
Un data.frame (Df1)tiene 53.657 observaciones (y 8 variables) que
pertenecen una a cada individuo de la muestra. El otro (Df2) tiene 63.987
observaciones (y 17 variables), de los 53.657 individuos previos
Buenas tardes,
El problema está ya resuelto. Muchas gracias a todos por vuestra ayuda.
El problema estaba en que la variable común con la que quería fusionar las
dos tablas tenía espacios en blanco al final en una de las tablas y no en
la otra. Por ello, parecía como que entre las dos tablas no
Buenas,
Necesito hacer lo siguiente:
Tengo una lista de reviews (opiniones). Quiero ordenarlas primero por "Id
del producto", 2º por "Mas votos recibidos" y 3º por "Fecha más nueva". El
problema está en el tercer criterio, que hay varias que coinciden en
fecha. Por eso quiero tomar este método:
Buenas,
Tengo un par de dudas.
Por un lado, tengo que crear una variable "var.2" que recoja el orden de
las observaciones al ordenarlas por "var.1". Es decir, la observación con
menor número de "var.1", deberá tener el 1 en "var.2", la siguiente el 2,
etc.
Por otro lado, en otras ocasiones
Finalmente está cerrado el tema, con el último correo se creó la variable
tal y como quería.
Muchas gracias.
Mensaje original
Asunto: Re: [R-es] Asignar a observaciones de una misma fecha el mismo
número de orden en una secuencia
De:
Buenas tardes,
¿Se pueden introducir variables cuadráticas en modelos de binomiales
negativos de ceros inflados (ZINB)? He metido una y me da error, al
quitarla, el modelo va bien. Si no se puede, ¿cuál es la razón?
Muchas gracias!
Miriam
___
Buenas a todos,
Necesito crear una variable "Numero.palabras" que sea el número de
palabras de la variable "titulo". Al crearla, cuando en la variable
"titulo" aparece un NA, me cuenta como 1 palabra. Por otro lado, los
puntos o / también los cuenta como palabras. ¿Me podrías ayudar con el
Buenas tardes,
He ejecutado un modelo binomial negativo de ceros inflados y me gustaría
que me ayudarais en la interpretación del modelo. Me gustaría saber
también como validarlo y probar la robustez. Os explico un poco que estoy
modelizando.
Te explico un poco mis datos y lo que quiero modelizar
Muchas gracias. Si ahora funciona con ese código.
Gracias
El Lun, 23 de Octubre de 2017, 11:37, Alberto Carmona Bayonas escribió:
> Hola, se filtra así:
>
> datos2<-subset(datos, !(evolucionsi==0==0))
>
> Con esto creas un subgrupo de datos que cumple esas condiciones. Si en
> lugar de AND
Perdón Freddy, no pretendía que te molestara. Filtrando de una forma
normal no servía, por eso pregunté, porque tras intentarlo no me salía y
había algo que se me escapaba.
Gracias por las respuestas, finalmente he conseguido resolverlo con alguna
respuesta.
Un saludo,
El Lun, 23 de Octubre de
Perfecto, ahora sí funciona.
Muchas gracias!
Miriam
El Lun, 23 de Octubre de 2017, 9:04, Marcelino de la Cruz Rot escribió:
>
> Datos[!(Datos$evolucionsi==0 & Datos$evolucionno==0),]
>
>
>
>
> El 23/10/2017 a las 2:00, miriam.alz...@unavarra.es escribió:
>> Buenas,
>>
>> En un conjunto de
Muchas gracias,
Estoy intentado ejecutar el paquete y necesito importar el archivo txt,
pero necesito importarlo de modo que cada línea sea una observación y no
un texto único (tengo unas 63,000 lineas). No encuentro la solución en los
enlaces. ¿Sabrías como hacerlo?
Gracias!
El Mar, 28 de
Buenas,
Tengo un vector de 40 palabras (marca) y necesito saber si en una de las
variables del data.frame (datos) se incluye alguna de esas 40 palabras. Si
se incluye alguna de ellas, me gustaría crear una variable dummy siendo 1
que incluye alguna palabra y 0 que no incluye.
¿Qué paquete me
Hola a todos,
Necesito crear una variable que sólo coja los valores positivos de otra, y
que los negativos o 0 los rellene con 0. Sin embargo, me está dando este
error con el código que estoy metiendo:
> Datos$variable.nueva<-Datos$variable.antigua[Datos$variable.antigua>0]
Error in
Buenas tardes,
Tengo una lista de 600 palabras. Quiero saber cuántas de esas palabras
aparecen en cada observación de mi variable "texto". La variable "texto"
es de tipo caracter. ¿Cómo lo haríais?
Muchas gracias.
___
R-help-es mailing list
>> res_end
>
> alejandra angelesesther eva irene lidia mercedes
> sandravanesa veronica
> 2 3 3 1 2 1 1
>3 2 1
>>
> #---
>
>
> Gracias,
>
Buenas tardes,
Necesito fusionar dos dataframes por una variable de texto pero al
hacerlo veo que no lo hace bien. ¿Hay alguna forma de que sí lo haga?
Gracias
___
R-help-es mailing list
R-help-es@r-project.org
Buenas,
En un conjunto de datos, llamado Datos, necesito quedarme con todas la
observaciones del conjunto excepto con las observaciones que cumplan dos
requisitos a la vez.
Necesitaría tener todos los datos excepto cuando se de simultáneamente
que: Datos$evolucionsi=0 y Datos$evolucionno=0.
Perfecto, muchas gracias! Solucionado.
El Sab, 21 de Octubre de 2017, 8:36, Xavier-Andoni Tibau Alberdi escribió:
> Exacto,
>
> Lo más cómodo es crear una copia de la variable i substituir los valors
> más
> pequeños o iguales a 0 por cero.
>
> Un saludo,
>
> Xavi
>
> 2017-10-21 6:13 GMT+02:00
Gracias por la respuesta. Quizá me he explicado mal.
Si utilizo esa funcion me filtra el conjunto de datos y me deja las
observaciones en las que evolucionsi=0 y todas en las que evolucionno=0.
Yo lo que quiero es que me las quite del conjunto de datos no que me las
deje. Es decir que solo quite
Gracias...sí pero creo que no me has entendido...El código tampoco es el
que necesito. Necesito todas las observaciones de Datos, excepto aquellas
para las que se cumpla conjuntamente que evollucionsi=0 y evolucionno>0.
El Lun, 23 de Octubre de 2017, 3:46, Freddy Omar López Quintero escribió:
>
>
Gracias...sí pero creo que no me has entendido...El código tampoco es el
que necesito. Necesito todas las observaciones de Datos, excepto aquellas
para las que se cumpla conjuntamente que evollucionsi=0 y evolucionno>0.
El Lun, 23 de Octubre de 2017, 3:46, Freddy Omar López Quintero escribió:
>
>
Buenas tardes,
Necesito contar cuántas comas hay en cada celda. Los datos tienen esta
forma:
Pros Comas
Opinión 1calidad,1
Opinión 2calidad, diseño, color, 3
Opinión 3precio,
Hola,
Tengo un grupo de 600 palabras que he recogido en una lista en R llamada
"Atributos". Necesito saber cuántas veces cualquiera de esas palabras
aparece en cada observación de la variable "Opinion" del dataframe
"Datos", esta es una variable de texto.
¿Qué paquete se usaría?
Gracias!
Muchas gracias! Solucionado!
El 07/02/2018 a las 18:21, Carlos Ortega escribió:
num_com <- str_count(val, pattern = "," )
___
R-help-es mailing list
R-help-es@r-project.org
https://stat.ethz.ch/mailman/listinfo/r-help-es
Hola,
Tengo que crear un panel de 9 fechas diferentes para hacer un análisis
longitudinal para un conjunto de productos. Las variables son las mismas
para cada fecha. ¿Me recomendáis algún enlace o fuente para saber cómo
hacerlo? ¿Hay alguna función o paquete destinado a ello?
Muchas gracias
Buenas tardes,
Estoy importando un archivo excel a R y no me reconoce los valores
numéricos. ¿Hay alguna forma rápida de cambiar las variables a número sin
tener que ir en R una a una?
Muchas gracias
Miriam
___
R-help-es mailing list
Buenas tardes,
Estoy estimando un modelo binomial negativo de ceros inflados (ZINB)
utilizando el comando zeroinfl() del paquete pscl. Al ejecutarlo me da el
siguiente aviso:
Warning: glm.fit: fitted probabilities numerically 0 or 1 occurred
¿Sabéis que significa y si puedo usar el modelo aún
Muchas gracias por la respuesta. He mirado y los coeficientes no son altos
pero sí tengo una gran cantidad de ceros en la variable dependiente (más
del 90%). Sin embargo, al incluir otro tipo de variables independientes no
me da ese aviso, dejando la misma variable dependiente.
¿Cómo podría
Muchas gracias Carlos por la respuesta y enlaces. Entiendo lo qué
significa el tema de separación perfecta pero no logro entender cómo
solucionarlo, estoy intentado seguir los enlaces pero me parece bastante
complicado...
El 10/04/2018 a las 21:16, Carlos J. Gil Bellosta escribió:
> Hola,
¿Quieres decir que para un nivel de una variable categorica todas las
observaciones de la variable respuesta sean ceros?
Gracias
El Lun, 9 de Abril de 2018, 19:59, Carlos J. Gil Bellosta escribió:
> ¿Podría ser que para algún nivel de alguna variable independiente
> categórica solo hubiese
Hola de nuevo Carlos, he probado a quitar esa variable categórica y me
sigue dando el aviso...
El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió:
> Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
> plausible. Sobre todo cuando tienes más de un 90% de ceros.
En ese caso, ¿tendría sentido el modelo? o ¿debería quitar esa variable
categórica?
Muchas gracias
El Lun, 9 de Abril de 2018, 20:17, Carlos J. Gil Bellosta escribió:
> Si, creo que el motivo del warning puede ser ese. Es hipotético, pero
> plausible. Sobre todo cuando tienes más de un 90% de
Buenas tardes,
¿Cómo interpretarías el intercepto que da R en un modelo de ceros
inflados? Por un lado en la parte de conteo tengo un intercepto de -4.2 y
en la parte de ceros de 102, ambos salen significativos (***). ¿Qué me
dirían?
Gracias
___
Muchas gracias por la respuesta!
Miriam
El Jue, 19 de Abril de 2018, 15:03, Freddy Omar López Quintero escribió:
> Hola.
>
> Esta es una pregunta interesante porque, en mi caso, me hace preguntarme
> hace cuánto tiempo no interpreto realmente un intercepto, no solo este
> tipo
> de modelos, sino
Perfecto, muchas gracias! Solucionado
El Jue, 1 de Marzo de 2018, 20:23, jose luis escribió:
> HolaMira la función weighted.meanHow to compute weighted mean in R?
>
>
> |
> |
> |
> | ||
>
>|
>
> |
> |
> | |
> How to compute weighted mean in R?
> Possible Duplicate: Calculating
Buenas tardes,
Estoy intentando conseguir la media de la variable "numerocaracteres" por
"producto" de mi base de datos, datos. Lo estoy haciendo con la función
aggregate de este modo:
AggregatedData<- aggregate(numerocaracteres ~ producto,
data=datos, FUN=mean)
El problema me viene porque
Buenas tardes,
Quiero aplicar la función rbind y necesito tener los mismos nombres de
columnas. Como tengo unas 195 variables en cada dataframe, necesito
hacerlo de una forma rápida. Tengo 9 bases de datos y tengo que fusionar
todas. ¿Como puedo comprobar que los nombres de las variables son los
amp; Fecha <= '2016-12-28',.(rating.sem =
> mean(Rating)),by=Id.producto]
>
> Un saludo
> Jes�s
>
> Obtener Outlook para Android <https://aka.ms/ghei36>
>
>
>
> De: Miriam Alzate
> Enviado: lunes, 22 de octubre 19:27
> Asunto: [R-es] Agregar variable entre do
Buenas,
Tengo un dataframe con 64.000 observaciones llamado Datos y las
variables "Id.Producto","Fecha"y "Rating" . La variable fecha tiene el
formato: 2016-12-28 (ymd). Quiero crear la variable:
"Rating.Semanal" - Esta variable tiene que ser la media agregada por
"Id.Producto" de la
nte una fecha.
> Compruébalo con class(datos$Fecha).
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
>
>
> El lun., 22 oct. 2018 a las 20:34, Miriam Alzate
> ()
> escribió:
>
>> Muchas gracias por la respuesta pero me da NA. ¿Qué puede ocur
qualityexcellence.es
>
>
>
> El lun., 22 oct. 2018 a las 20:34, Miriam Alzate
> ()
> escribió:
>
>> Muchas gracias por la respuesta pero me da NA. ¿Qué puede ocurrir?
>>
>> Un saludo
>>
>>
>> El 22/10/2018 a las 20:12, Jesús Para Fernández
o mayores...
>
> Saludos,
> Carlos Ortega
> www.qualityexcellence.es
>
> El lun., 1 oct. 2018 a las 19:05, Miriam Alzate
> ()
> escribió:
>
>> Hola,
>>
>> No me sirve porque tengo dos tipos de formatos de fechas. En unos tengo
>> 0 delante del día del mes cua
; Usa la función "dmy()", que entenderá esas pequeñas diferencias con
>> respecto al día. Puede gestionar incluso diferencias mucho mayores...
>>
>> Saludos,
>> Carlos Ortega
>> www.qualityexcellence.es<http://www.qualityexcellence.es>
>>
>> El l
Hola,
No me sirve porque tengo dos tipos de formatos de fechas. En unos tengo
0 delante del día del mes cuando es entre el 1 y el 9 y en otros no...No
sé como unificar eso para que todas tengan el formato por ejemplo:
02/12/2017 y no 2/12/2017.
Un saludo
El 29/09/2018 a las 13:06, jose
ot;fecha" (imagen adjunta). Todos los registros
> quedan con el mismo formato.
> Espero que funcione
> josemiguel.
>
> El 03/10/2018 a las 4:37, Javier Marcuzzi escribi�:
>> Estimada Miriam Alzate
>>
>> Puede enviar un archivo con todas las fechas, y a partir de est
Buenas,
Necesito crear una variable que viene de agregar otra por la media. El
dataframe tiene 65000 obsrvaciones.Tengo estas variables
Product.Id (145 diferentes)
Word.Count
Review.number
Necesito agregar la variable Word.Count por Product.Id. Al agregarlo,
tengo un data.frame de 2
gt; --------
> *De:* R-help-es en nombre de Miriam
> Alzate
> *Enviado:* mi�rcoles, 12 de septiembre de 2018 13:38
> *Para:* r-help-es
> *Asunto:* [R-es] Crear columna en data frame agregando otra y fusionando
> Bu
Buenos días,
Tengo en un mismo data frame dos variables con el mismo nombre, ha sido
un error pero ahora para cambiar sólo el nombre a una, ¿cómo tengo que
hacer? Al ejecutar rename() me cambia el nombre a las dos.
Un saludo y gracias
___
Buenas noches,
Tengo el data.frame "datos" y las variables "x1","x2","x3" y "x4".
Me gustaría crear nuevas variables que fueran la transformación
logarítmica de las variables originales. Se llamarían "log_x1",
"log_x2"...
¿Hay alguna forma de crear todas las variables de una vez?
Por otro
Hola,
Quiero estimar un modelo Poisson con instrumentos porque tengo una
variable endógena. Se que en Stata hay un comando para el iv poisson pero
me gustaría saber si en R hay algo parecido. El ivregress del paquete AER
estima un modelo 2sls pero con regresión lineal y yo necesito que la
segunda
Buenas tardes,
Tengo una pregunta sobre un error que me da R. Estoy usando un modelo
Poisson con función de control para corregir la endogeneidad (de
instrumentos) y tengo que calcular primero los residuos de una regresión
lineal para posteriormente introducirlos en la segunda etapa.
Cuando los
Buenas tardes,
Estoy haciendo un análisis de contenido con el paquete tm. A la hora de
ejecutar este código:
tdm<-TermDocumentMatrix(corpus,control=list(weighting =weightTf))
tdm.reviews.m<-as.matrix(tdm)
La primera línea sí me la ejecuta bien pero en la segunda tengo este error:
Error: cannot
Es la primera vez que trabajo con este tipo de datos...No se si se puede
dividir esa matriz. ¿Cómo lo podría hacer?
Muchas gracias!
El Vie, 7 de Febrero de 2020, 17:55, Xavier-Andoni Tibau Alberdi escribió:
> Significa que tus datos són muy grandes y no se pueden guardar en la RAM.
> Tienes
Buenas,
El archivo de R ocupa 33 megas. La matriz que quiero construir cupa 14 gb.
En el disco local (C) tengo 400 gb disponibles de 670.
No estoy muy puesta en trabajar con este tipo de datos. ¿Qué diferencia es
trabajar con data.frame?
Gracias!
El Vie, 7 de Febrero de 2020, 18:07,
Muchas gracias Xabier.
He intentaddo trabajar con la sparse matrix pero al pasar tdm a matriz me
dice también que "cannot allocate a vector of size 12 gb".
He hecho tdm<-as.matrix(tdm)
¿Está bien hecho eso para trabajar con la sparse matrix?
Gracias!
El Lun, 10 de Febrero de 2020, 16:15,
De acuerdo, muchas gracias!
El Jue, 30 de Abril de 2020, 14:45, Carlos Ortega escribió:
> Hola Miriam,
>
> No he visto que se use un filtro por defecto para el valor de tf-idf.
>
> En tu caso, tendrás que ver cúal es ese punto de corte que te revela
> señal,
> justo de los términos que te
Buenos días,
Estoy realizando un análisis de topic models con el método LDA. En
principio, he quitado del análisis las palabras "stopwords" universales. A
la hora de ver los topics y sus palabras más frecuentes encuentro que son
muy similares y hay palabras que aparecen en todos los topics. Los
Hola Pedro, muchas gracias por tu respuesta.
Estoy analizando 64.000 documentos con una media de 53 palabras cada uno.
Los 65.000 pertenecen a 41 productos diferentes.
Había elegido k=15 porque al ver el indice de perplexity entre 2 y 20 k´s
parece que era el óptimo, si bien quizá tenga que
Gracias Carlos! Apunto tu sugerencia.
El Mar, 28 de Abril de 2020, 12:53, Carlos Ortega escribió:
> Hola,
> Yo de primeras los quitaría para qué otros topics aparecen.
>
> Y también aplicaría tf-idf a tus comentarios. Con tf-idf seguro que
> desaparecen como relevantes esas palabras comunes, será
Hola,
Acabo de calcular tf-idf y me surge una duda. ¿Habría un valor de idf o
tf-idf que se considerara como umbral para establecer que una palabra es
muy común o no? Los valores de idf en mis datos van entre 0 y 3.78 y los
de tf-idf ente 0 y 0.07.
Un saludo
El Mar, 28 de Abril de 2020, 12:53,
Buenas tardes,
Tengo un modelo con una variable que interacciona con todas las variables
independientes y estoy usando un modlo Binomial Negativo de Ceros
Inflados (ZINB), el que consta de 2 partes: una logit y otra binomial
negativa. Necesito dibujar las interacciones, y por lo que veo, no es
Buenas tardes
Estoy haciendo un análisis LDA y me gustaría cambiar el nombre de los
topics a la hora de visualizarlos y en vez de que se llamen 1,2,3...darles
un nombre. ¿Es posible en este código?
lda22 <- LDA(reviews_dtm, k = 22, control = list(seed = 1234))
lda22 %>%
tidy() %>%
Hola Carlos,
Sí, pero veo que es para incluir "robust standard errors" pero no consigo
el código para que no incluya ninguno.
Gracias!
El Jue, 19 de Noviembre de 2020, 20:44, Carlos Ortega escribió:
> Hola Miriam,
>
> ¿Has visto el punto "2.2 Including Custom Standard Errors" de la viñeta
> del
Buenas tardes,
Quiero representar los resultados de una regresión con la librería
Stargazer pero no se cómo hacer para que no me reporte los standard
errors. Este es el código:
stargazer(Model 1, Model 2,type = "html", digits = 2, title = "Model
comparison (count)",out = "Modelcomparison.htm")
Buenas,
Estoy analizando texto en R y no encuentro cómo eliminar los números y
símbolos del texto como ",", "%", etc.
Estoy pasando este código, text_data es donde está el texto en la variable
"text".
tidy_data <- text_data%>%
unnest_tokens(word, text)%>%
anti_join(stop_words)
¿Cómo podría
Hola, muchas gracias por contestar,
Creo que no es exactamente eso porque a veces la variable
Data$Order.individual es común a varias observaciones de la base de datos,
es decir, puede haber varias observaciones que tengan valor 1 en esa
variable. Si lo hago de la forma que me dices, no se si está
Perfecto! He ejecutado el código y funciona, sí es lo que necesitaba.
Muchísimas gracias.
Miriam
El Mie, 4 de Noviembre de 2020, 20:27, Marcelino de la Cruz Rot escribió:
> No sé si te he entendido pero con el código que te he mandado, todas las
> observaciones que tengan 1, 2, 3, 4 o 5 en
Hola,
Necesito asignar a cada observación un orden según su posición en un
listado, estoy aplicando el siguiente código, pero no se cómo extenderlo
para que lo haga hasta el final de las observaciones sin hacerlo
manualmente:
Data$Order.Page <- ifelse(Data$Order.individual <=5, 1,
69 matches
Mail list logo