Um colega pediu para que rodasse uns dados binarios para obtenção de
dissimilaridade e respectivo dendrograma por meio da distância
euclidiana. Eu sempre udei Jaccard ou Nei e Li para dados binários.

Mas, o pacote vegan tem a função vegdist que aceita binários para
euclidiana. Rodei os dados e a matriz de dissimilaridade tem valores
entre 0 e 4! Eu esperava valores entre 0 e 1!

Eis o código:

library(vegan)
library(MASS)
lili.dist.euc <- vegdist(lili, method="euclidian", binary=TRUE)
lili.clua.euc <- hclust(lili.dist.euc, "average")
plot(lili.clua.euc, cex=0.9, hang = -1)

Pergunto:

Tem algo errado?
Euclidiana é aplicada a dados binários?
Se não, como argumentar com o colega e demovê-lo da ideia?
Jaccard é melhor neste caso?

Se desejar, posso disponibilizar o BD.

Laia

-- 
Marcelo
_______________________________________________
R-br mailing list
[email protected]
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça código 
mínimo reproduzível.

Responder a