Hola, ¿qué tal? Yo plantearía, de entrada, algo en las siguiente línea:
total <- c(56, 49,51) positivos <- c(14, 10, 17) negativos <- total - positivos grupos <- letters[1:3] # proporciones <- positivos / total mod.1 <- glm(cbind(positivos, negativos) ~ grupos, family = binomial) mod.0 <- glm(cbind(positivos, negativos) ~ 1, family = binomial) anova(mod.0, mod.1, test = "Chisq") El problema de la no independencia de las observaciones (por tener individuos repetidos), lo afrontaría así: 1) Si son pocos, me quedaría con la primera observación por individuo (es decir, eliminando observaciones). 2) En el otro caso, introduciendo efectos adicionales (¿por invididuo?) en el modelo anterior y añadiendo efectos aleatorios (por individuo) si procede. Nótese que tanto en los modelos anteriores (mod.0 y mod.1) se podrían añadir otras variables explicativas relevantes de los individuos en el estudio. Un saludo, Carlos J. Gil Bellosta http://www.datanalytics.com El 24 de enero de 2016, 16:57, José Trujillo <[email protected]> escribió: > El 24/01/16 a las 16:29, Fernando Sánchez Lasheras escribió: > >> Hola José, >> >> Efectivamente le mensaje me lo enviaste a mí, pero yo al contestar lo >> mandé >> a la lista. >> >> Los grupos son tratamientos distintos. Es decir, se estudia a una serie de >> personas a las que se les aplican tres tratamientos distintos (A, B y C) >> durante el mismo tiempo y vemos el número de eventos (ocurrencias de la >> enfermedad) en cada grupo, con la peculiaridad que algunas personas pueden >> enfermar más de una vez. Por tanto, al final, lo que tengo es que después >> del mismo tiempo de seguimiento, a los que se les aplicó el tratamiento A, >> que eran 56 pacientes, han sufrido 14 veces la enfermedad (en esas 14 >> veces >> se incluye que algún paciente la ha sufrido más de una vez). >> > > Pues esa es la situación típica en la que no es posible aplicar ni el test > Z, ni el test Ji^2 porque ambos son aproximaciones para grandes muestras > del test binomial en el que se supone que los 50 intentos aproximados de > encontrar un enfermo son independientes entre sí (y con probabilidad de > enfermar antes del experimento igual para todos porque todos pertenecen a > la misma población). > > Tendrías que cambiar los datos y pasar a considerar si un individuo la ha > padecido o no, de este modo tendrías la condición de independencia exigida > por lo tests. > > Por supuesto que si un individuo la ha padecido puede tener predisposición > genética o ambiental y cambiar la probabilidad de tenerla, o por el > contrario tener inmunidad. La segunda aparición no puede ser incluida en el > estudio porque se rige por leyes de probabilidad distintas de la primera. > No puedes mezclar churras y merinas y esperar que la mezcla cumpla unas > probabilidades predecibles igual que si no mezclas. Los tests se construyen > haciendo algunas suposiciones y la de independencia es de las más básicas. > > Saludos. > > Esto mismo en >> los grupos de tratamientos B y C, disponiendo en el grupo B de 49 >> pacientes >> con 10 ocurrencias de la enfermedad y el C de 51 pacientes con 17 >> ocurrencias de la enfermedad en total. ¿Es aplicable aquí un test de >> Ji-Cuadrado? Es mi gran duda, yo veía más apropiado uno de proporciones. >> >> Saludos, >> >> Fernando >> >> -----Mensaje original----- >> De: José Trujillo [mailto:[email protected]] >> Enviado el: domingo, 24 de enero de 2016 14:43 >> Para: Fernando Sánchez Lasheras <[email protected]> >> Asunto: Re: [R-es] test z de tres proporciones >> >> El 24/01/16 a las 00:32, Fernando Sánchez Lasheras escribió: >> >>> Estimado José, >>> >>> Muchas gracias por el tiempo que has dedicado a elaborar tu respuesta >>> que me ha sido de mucha utilidad. Se trata de una serie de individuos, >>> que en cierto periodo de tiempo pueden presentar una enfermedad o no. >>> El que haya algunos que tengan más de un evento es porque algunos (muy >>> pocos) padecen la enfermedad y transcurrido cierto tiempo la vuelven a >>> >> sufrir. >> >>> Es decir, tengo pacientes de tres tipos: >>> >>> Grupo A nº total de casos: 56 nº eventos (ocurrencias de la enfermedad >>> en un periodo de tiempo de 2 años): 14 >>> >>> Grupo B nº total de casos: 49 nº eventos (ocurrencias de la enfermedad >>> en un periodo de tiempo de 2 años):: 10 >>> >>> Grupo C nº total de casos: 51 nº eventos (ocurrencias de la enfermedad >>> en un periodo de tiempo de 2 años):: 17 >>> >>> Espero que con esto haya sido capaz de dejar más claro lo que ando >>> >> buscando. >> >>> Saludos, >>> >>> Fernando >>> >>> Deduzco pues que los grupos son periodos de tiempos distintos. Si es así >> no >> tienes ningún problema en utilizar una ji-cuadrado. >> >> Has hecho el sesguimiento de 50 individuos (más o menos) en tres periodos >> de >> tiempo entiendo que diferentes (si no volvemos al problema grave). >> >> Me acabo de dar cuenta que estos mensajes no lo estoy enviando a la lista, >> sino a tí. De modo que si agluien puede aportar algo más no le está >> siriviendo de pie. >> >> Es torpeza mía, pero si te ha servido me alegro. >> >> Saludos. >> >> > _______________________________________________ > R-help-es mailing list > [email protected] > https://stat.ethz.ch/mailman/listinfo/r-help-es > [[alternative HTML version deleted]] _______________________________________________ R-help-es mailing list [email protected] https://stat.ethz.ch/mailman/listinfo/r-help-es
