Hola a todos, en estos momentos me encuentro inmerso en laresolución del
siguiente problema. Resulta que dispongo de una variable categóricadenominada
Severity y que consta de tres categorías (low, medium, high). Además,tengo otra
variable que se denomina ZX y que puede tomar cualquier valorcomprendido entre
0 y 10. Quiero determinar los dos puntos de corte óptimos demanera que me
dividan a la variable ZX en tres categorías (llamadas tambiénlow, medium y
high) y que exista el máximo nivel de acuerdo entre las variablesZX y Severity.
Por acuerdo me refiero a que el porcentaje de casos (filas) queen ambas
variables caiga en la misma categoría sea el máximo posible.Dado que no se me
ocurría cómo resolverlo de formasistemática, he hecho un pequeño código en R
que fija dos puntos de cortealeatorios y calculo la tasa de acuerdo. A base de
repetirlo 500.000 veces, mehe hecho una idea de hasta qué nivel de concordancia
puedo llegar pero buscabauna forma más sistemática. En el caso de un único
punto de corte, sé queexisten métodos y librerías en R como OptimalCutPoints
que permitenhacerlo.Debajo os pongo un ejemplo de los datos que estoy
manejandopara que os hagáis mejor una idea de su aspecto.ZX
Severity 2.818181818 high2.084242424 high5.326666667
medium4.758484848 low4.795454545 high3.367878788 high5.734848485
high3.417575758 medium3.16000 medium4.307272727 lowCualquier
sugerencia es bienvenida. Si mi código le puedeayudar a alguien, estaré
encantado en pasárselo.
[[alternative HTML version deleted]]
_______________________________________________
R-help-es mailing list
[email protected]
https://stat.ethz.ch/mailman/listinfo/r-help-es