Hola. Lo que yo haría es crear los folds, (10 por ejemplo) antes de balancear. Luego en cada ciclo de la validación cruzada, balancearía los datos que utilizo para entrenar el modelo y valido sobre el fold que queda sin balancear. Creo que caret hace justo eso.
Saludos El 19 de enero de 2017, 14:40, Jesús Para Fernández < [email protected]> escribió: > buenas > > > Tengo unos datos muy desbalanceados en l avariable respuesta. Mi duda es > si tengo que primero balancear los datos mediante alguna sde las técnicas, > como SMOTE y luego hacer el cv o al reves?? > > > Como lo planteariais vosotros? > > Gracias > > Jesús > > [[alternative HTML version deleted]] > > > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
