Hola Juan, Primero de todo, no estoy seguro de si tu variable respuesta 'prop' representa la proporción de semillas germinadas? No es lo mismo que esa proporción sea 1 de 2 que 50 de 100, aunque el porcentaje de germinación sea el mismo (50%). Ver https://stats.stackexchange.com/questions/241983/using-proportions-directly-instead-of-cbind-in-glm-binomial-regression-is-th.
Mi opción preferida para tener en cuenta el tamaño de muestra es proporcionar el número de semillas germinadas y el de no germinadas como variable respuesta, esto es glm(cbind(germin, nogermin) ~ condicion etc, family = binomial) En cuanto a la interpretación de los parámetros, en tu modelo el intercept representaría la probabilidad de germinación (en escala logit) cuando la condición es a y HFe es 0. Para interpretar un modelo así con interacciones creo que lo mejor es visualizarlo, por ejemplo usando el paquete effects o visreg. Aquí tengo algunos ejemplos (https://github.com/Pakillo/LM-GLM-GLMM-intro/blob/trees/glm_binomial.pdf), pero hay mucha más información en internet. Para obtener los valores estimados de germinación en distintas condiciones de humedad y estratificación, creo que lo más fácil es usar la función predict. Le pasas un data frame con los valores de humedad y estratificación y obtienes la probabilidad de germinación, con su incertidumbre. Si usaste HFe como predictor, debes mantener la misma escala. Si te interesa que el modelo se aplique en el futuro a otros datos, mejor usar HF tal cual o usar puntos de referencia fijos (p. ej. HF = 1000 horas) como propone Carlos. Espero que sirva. Suerte Paco On 14/9/20 21:44, Juan Seco Lopez wrote: > Estimada comunidad, tengo unas dudas que son muy básicas creo, pero es mi > primera incursión en GLM. > Estoy ajustando un modelo binomial a unos datos de germinación. El modelo > es muy sencillo, tengo un factor "Condicion" con dos niveles: "a" y "b" > (nivel de humedad en suelo). Por otro lado, tengo una variable explicativa > "HF" (horas frío=estratificación) que va de 0 a 2160 (en el modelo esta > variable es HFe por estandarizada y centrada). > Acá van mis preguntas: > - ¿cómo interpreto la salida? Si, por ejemplo, me > encuentro bajo la "condicion a", ¿no incluyo los > términos +1.97820*Condicionb y +1.22376*Condicionb*HFe? > - cuando tengo que reemplazar los valores HFe en la > fórmula, ¿tengo que utilizar los valores centrados y estandarizados o > puedo usar los valores "crudos" HF? Pregunto esto porque perdería > reproducibilidad del modelo si utilizo los datos centrados > > Les dejo el summary de mi modelo y agradezco de antemano su colaboración. > Saludos > > > Call: > glm(formula = prop ~ Condicion + HFe + Condicion * HFe, family = binomial, > data = datos) > > Deviance Residuals: > Min 1Q Median 3Q Max > -4.0365 -1.2027 0.0994 0.9577 3.4023 > > Coefficients: > Estimate Std. Error z value > Pr(>|z|) > (Intercept) -1.17749 0.04484 -26.262 < 2e-16 > *** > Condicionb 1.97820 0.06434 30.745 < 2e-16 > *** > HFe -0.20626 0.04503 -4.581 > 4.64e-06 *** > Condicionb:HFe 1.22376 0.06667 18.355 < 2e-16 *** > --- > Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 > > (Dispersion parameter for binomial family taken to be 1) > > Null deviance: 1923.94 on 139 degrees of freedom > Residual deviance: 348.59 on 136 degrees of freedom > AIC: 875.09 > > Number of Fisher Scoring iterations: 4 > > [[alternative HTML version deleted]] > > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es -- Dr Francisco Rodríguez-Sánchez https://frodriguezsanchez.net [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
