Hola.
Lo que yo haría es crear los folds, (10 por ejemplo) antes de balancear.
Luego en cada ciclo de la validación cruzada, balancearía los datos que
utilizo para entrenar el modelo y valido sobre el fold que queda sin
balancear. Creo que caret hace justo eso.
Saludos
El 19 de enero de 2017,
Estimados
Yo estoy de acuerdo, en muchas oportunidades lo más sencillo es abrir el
archivo con un editor de textos, reemplazar, borrar, guardar, y luego leer en R.
Pero gedit no es muy apto que digamos para muchos datos, a mi me paso “colgar”
Linux con gedit abriendo archivo de texto,
Sensacional! Muchas gracias, Marcelino. Funcionó muy bien.
Opté por el Gedit como editor de texto decente. Así que sumé por ese lado
también.
Gracias a la lista.
Saludos.
El 19 de enero de 2017, 8:25, Marcelino de la Cruz Rot <
marcelino.delac...@urjc.es> escribió:
> Hola,
> de todas formas, si
Muy bueno, Carlos.
Tener un "editor de texto decente" me parece BÁSICO!
...de hecho, si tienes un "editor de código de R decente" ese mismo te
sirve.
:-)
Un saludo,
--
Miguel Ángel Rodríguez Muíños
Dirección Xeral de Saúde Pública
Consellería de Sanidade
Xunta de Galicia
http://dxsp.sergas.es
Muchas gracias por tu sugerencia, Carlos.
Andamos cortos de decencia por estos pagos, pero la voy a tomar en cuenta
si no logro hacer el str_replace una vez cargado el archivo con fread!!
El 19 de enero de 2017, 7:31, Carlos J. Gil Bellosta
escribió:
> Hola, ¿qué tal?
>
>
Tenía la versión data.table 1.9.6.- Actualicé a la data.table 1.10.0 y
funcionó tal cual lo indicás. Muchas gracias.
Para eliminar las " adicionales estoy usando:
library(stringr)
library(plyr)
datos$d_nomenclador <- str_replace(datos$d_nomenclador, pattern='\\","',
replacement="")
Hola, ¿qué tal?
Abre el fichero con un editor de texto decente. Excel no es un editor
de texto decente. Notepad, tampoco. Elige uno y hazte amigo de él para
siempre. Con su concurso, sustituye todas (¡todas sin excepción!) las
comillas por nada.
Luego, guarda el fichero y