Re: [R-br] Regressão linear - Excluindo outliers

2016-11-07 Por tôpico Fernando Antonio de souza via R-br
O arquivo água foi o meu banco de dados, vc pode rodar colocando seu
próprio dataframe contendo seus dados e fazer as modificações necessárias.
Att

Em 07/11/2016 21:42,  escreveu:

> Eu tentei rodar, e diz que não existe o arquivo água!
>
> Eu trabalho assim
> #-Analise de Cook's distance
> ---
> install.packages(sfsmisc); library(sfsmisc)
> analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
> n<-length(agua$CONSUMO)  # número de observações
> n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
> criterio<-4/analise$df.residual
> abline(v=criterio)
> #Eliminacao de
> outiliers--
> ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
> analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0
> & GEST!=0 )) #eliminando outliers.
> ==
> Fernando Souza
> Zootecnista, DSc. Produção e Alimentação Animal
> celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
> e-mail:nandodeso...@gmail.com
> Lattes: http://lattes.cnpq.br/6519538815038307
> blog: https://producaoanimalcomr.wordpress.com/
> =
>
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-11-07 Por tôpico Mauro Sznelwar via R-br
Eu tentei rodar, e diz que não existe o arquivo água!
 
Eu trabalho assim
#-Analise de Cook's distance ---
install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data="" />
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de outiliers--
ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data="" & GEST!=0 )) #eliminando outliers.==Fernando SouzaZootecnista, DSc. Produção e Alimentação Animalcelular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)e-mail:nandodeso...@gmail.comLattes: http://lattes.cnpq.br/6519538815038307blog: https://producaoanimalcomr.wordpress.com/= 

___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Mac David S. Pinto via R-br
oi Pessoa, boa noite
Vou tentar filtrar nos outliers pelos técnicas propostos por vocês.
Amanha posto aqui os resultados
Obrigado pela Ajuda
David 

Em Sexta-feira, 14 de Outubro de 2016 20:29, Cesar Rabak via R-br 
 escreveu:
 

 FCosta,
Você viu o posto do Valmes sobre o influence.measures()?

2016-10-14 17:45 GMT-03:00 Felinto COSTA via R-br :

  Antes do estabelecimento de critérios empíricos de corte para os valores da 
distância de Cook,
 há esse trabalho sobre sua distribuição exata:
 
https://www.researchgate.net/ publication/274062960_Exact_ 
distribution_of_Cook%27s_ distance_and_identification_ 
of_influential_observations
 
  FCosta
 
 
  Em 14/10/2016 17:03, Fernando Souza via R-br escreveu:
  
 Eu trabalho assim #-Analise de Cook's distance 
-- - install.packages(sfsmisc); 
library(sfsmisc)
 analise<-lm(CONSUMO~factor( GEST)*factor(MANEJO),data= agua)
 n<-length(agua$CONSUMO)  # número de observações 
n.plot(cooks.distance(analise) ,seq(1:n),cex=.5,nam=agua$ ANIMAL) 
criterio<-4/analise$df. residual abline(v=criterio) 
#- ---Eliminacao de outiliers- 
- ifelse(cooks.distance(analise) >criterio,1,0)->agua$cook 
analisecook<-lm(CONSUMO~ factor(MANEJO)*factor(GEST), data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.
 == 
 Fernando Souza
 Zootecnista, DSc. Produção e  Alimentação Animal
 celular: (31)99796-8781 (Vivo)  / (31)97358-4685 (Tim)
 e-mail:nandodeso...@gmail.com
 Lattes: http://lattes.cnpq.br/ 6519538815038307
 blog: https:// producaoanimalcomr.wordpress. com/
 == === 
 
 Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
 
  Além da distância de Cook, você tem mais opções de medidas de influência com 
a inflence.measures(). Dê uma olhada aqui para ver  exemplos 
http://leg.ufpr.br/~walmes/ cursoR/mgest/1medidas-influen. html. Eu gosto de 
usar o DFits como medida.
 
  À disposição.
  Walmes.
  ​ 

  
 __ _
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/ cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br- guia) e forne�a c�digo 
m�nimo reproduz�vel. 
 
 
__ _
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/ cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br- guia) e forneça código 
mínimo reproduzível.



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne� c�igo m�imo 
reproduz�el.

   ___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Cesar Rabak via R-br
FCosta,

Você viu o posto do Valmes sobre o influence.measures()?


2016-10-14 17:45 GMT-03:00 Felinto COSTA via R-br 
:

> Antes do estabelecimento de critérios empíricos de corte para os valores
> da distância de Cook,
> há esse trabalho sobre sua distribuição exata:
>
> https://www.researchgate.net/publication/274062960_Exact_
> distribution_of_Cook%27s_distance_and_identification_
> of_influential_observations
>
> FCosta
>
>
> Em 14/10/2016 17:03, Fernando Souza via R-br escreveu:
>
> Eu trabalho assim
> #-Analise de Cook's distance
> ---
> install.packages(sfsmisc); library(sfsmisc)
> analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
> n<-length(agua$CONSUMO)  # número de observações
> n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
> criterio<-4/analise$df.residual
> abline(v=criterio)
> #Eliminacao de
> outiliers--
> ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
> analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0
> & GEST!=0 )) #eliminando outliers.
> ==
> Fernando Souza
> Zootecnista, DSc. Produção e Alimentação Animal
> celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
> e-mail:nandodeso...@gmail.com
> Lattes: http://lattes.cnpq.br/6519538815038307
> blog: https://producaoanimalcomr.wordpress.com/
> =
>
> Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br
>   escreveu:
>
> Além da distância de Cook, você tem mais opções de medidas de influência
> com a inflence.measures(). Dê uma olhada aqui para ver exemplos
> http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html. Eu gosto
> de usar o DFits como medida.
>
> À disposição.
> Walmes.
> ​
>
>
>
> ___
> R-br mailing 
> listr...@listas.c3sl.ufpr.brhttps://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
> m�nimo reproduz�vel.
>
>
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Felinto COSTA via R-br
Antes do estabelecimento de critérios empíricos de corte para os valores 
da distância de Cook,

há esse trabalho sobre sua distribuição exata:

https://www.researchgate.net/publication/274062960_Exact_distribution_of_Cook%27s_distance_and_identification_of_influential_observations

FCosta


Em 14/10/2016 17:03, Fernando Souza via R-br escreveu:

Eu trabalho assim
#-Analise de Cook's distance 
---

install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de 
outiliers--

ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.

==
Fernando Souza
Zootecnista, DSc. Produção e Alimentação Animal
celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
e-mail:nandodeso...@gmail.com
Lattes: http://lattes.cnpq.br/6519538815038307
blog: https://producaoanimalcomr.wordpress.com/
=

Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
Além da distância de Cook, você tem mais opções de medidas de 
influência com a inflence.measures(). Dê uma olhada aqui para ver 
exemplos 
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html 
. Eu 
gosto de usar o DFits como medida.


À disposição.
Walmes.
​



___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.


___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Fernando Souza via R-br

Eu trabalho assim
#-Analise de Cook's distance 
---

install.packages(sfsmisc); library(sfsmisc)
analise<-lm(CONSUMO~factor(GEST)*factor(MANEJO),data=agua)
n<-length(agua$CONSUMO)  # número de observações
n.plot(cooks.distance(analise),seq(1:n),cex=.5,nam=agua$ANIMAL)
criterio<-4/analise$df.residual
abline(v=criterio)
#Eliminacao de 
outiliers--

ifelse(cooks.distance(analise)>criterio,1,0)->agua$cook
analisecook<-lm(CONSUMO~factor(MANEJO)*factor(GEST),data=agua,subset=(cook==0 
& GEST!=0 )) #eliminando outliers.

==
Fernando Souza
Zootecnista, DSc. Produção e Alimentação Animal
celular: (31)99796-8781 (Vivo) / (31)97358-4685 (Tim)
e-mail:nandodeso...@gmail.com
Lattes: http://lattes.cnpq.br/6519538815038307
blog: https://producaoanimalcomr.wordpress.com/
=

Em Sex, Out 14, 2016 em 3:52 , Walmes Zeviani via R-br 
 escreveu:
Além da distância de Cook, você tem mais opções de medidas de 
influência com a inflence.measures(). Dê uma olhada aqui para ver 
exemplos 
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html. Eu 
gosto de usar o DFits como medida.


À disposição.
Walmes.
​
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Walmes Zeviani via R-br
Além da distância de Cook, você tem mais opções de medidas de influência
com a inflence.measures(). Dê uma olhada aqui para ver exemplos
http://leg.ufpr.br/~walmes/cursoR/mgest/1medidas-influen.html. Eu gosto de
usar o DFits como medida.

À disposição.
Walmes.
​
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

Re: [R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Paulo Dick via R-br
David,

Depende de como você identifica os outliers. Coloquei um exemplo usando a
distancia de Cook, mas da para generalizar com outros critérios

# gera dados e forca outlier
x <- 1:20
y <- 2*x + 5 + rnorm(20)
dados <- data.frame(x,y)
dados$y[c(7,11)] <- dados$y[c(7,11)] + 15

# modelo inicial e sem outliers
mod <- lm(y~x, dados)
outliers <- (cooks.distance(mod) > 0.2)
mod2 <- lm(y~x, subset(dados, !outliers))



*Paulo Dick*
Estatístico / Epidemiologia em Saúde Pública
Tel.: (55 21) 99591-2716

Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:

> Pessoal, bom dia
>
> Estou fazendo algumas regressões lineares entre Comprimento x Peso de
> peixes com um conjunto de dados bastante extenso (+- 1000 linhas).
>
> Acontece que alguns destes valores são outliers (+- 50) e na analise, eles
> não são importantes.
>
> Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que
> não seja considerado na analise? Sem precisa mudar minha planilha original
> (já que vou utilizar para outras coisas futuramente)
>
> Tem alguns valores que estão no meio dos planilhas de dados.
>
> Eu consegui resolver os extremos selecionado um conjunto de linhas
>
> Exemplo:
>
> Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
>
> ## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e
> linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+-
> entre as linhas  251 a 260)
>
> De já, eu agradeço a ajuda
>
> David
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Regressão linear - Excluindo outliers

2016-10-14 Por tôpico Mac David S. Pinto via R-br
Pessoal, bom dia
Estou fazendo algumas regressões lineares entre Comprimento x Peso de peixes 
com um conjunto de dados bastante extenso (+- 1000 linhas).
Acontece que alguns destes valores são outliers (+- 50) e na analise, eles não 
são importantes.
Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que não 
seja considerado na analise? Sem precisa mudar minha planilha original (já que 
vou utilizar para outras coisas futuramente)
Tem alguns valores que estão no meio dos planilhas de dados. 
Eu consegui resolver os extremos selecionado um conjunto de linhas
Exemplo:
Local.F.1<-lm(pt[4:970,7]~ls[4:970,6])
## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e linhas 
971 a 1000), mais ainda tem alguns valores no meio do analise (+- entre as 
linhas  251 a 260)
De já, eu agradeço a ajuda
David___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.