Hola, ¿qué tal? Yo te recomendaría echarle un vistazo a
http://gking.harvard.edu/files/0s.pdf y en particular, a la sección 4.1. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El día 14 de noviembre de 2014, 10:46, Isa García Barón <[email protected]> escribió: > Hola, espero ser clara en el mensaje ya que es la primera vez que recurro a > este tipo de ayudas, explico mi duda: > > Tengo un dataset con 4505 observaciones en el que la variable dependiente > son presencias (n=97 y clasificadas como 1) y ausencias (n=4408 y > clasificadas como 0). Mi primer paso fue realizar un GLM con una muestra > compensada de ausencias y presencias para la variable dependiente, es decir > 97 presencias y 97 ausencias. Sin embargo, como todo lo que tengo son > ausencias y no pseudoausencias me recomendaron utilizar las 97 presencias > frente a todas las ausencias, aquí viene el problema. Si realizo un GLM con > ausencia/presencia como variable dependiente no siendo ésta proporcional > entre 1 y 0 debo ponderar las observaciones, lo cuál creo que se realiza > añadiendo el vector "weights" a la función, quedando asi: > > modelo <- glm(v_dependiente ~ v1 + v2 + v3, data = datset, weights="x", > family = binomial (link=logit) > > Mi duda es cómo calcular el factor de ponderación de las presencias y las > ausencias para crear el vector que pueda introducir en la función weights. > > Muchas gracias! Un saludo > > *-------------* > *Isabel García Barón* > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es _______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
