David, Depende de como você identifica os outliers. Coloquei um exemplo usando a distancia de Cook, mas da para generalizar com outros critérios
# gera dados e forca outlier x <- 1:20 y <- 2*x + 5 + rnorm(20) dados <- data.frame(x,y) dados$y[c(7,11)] <- dados$y[c(7,11)] + 15 # modelo inicial e sem outliers mod <- lm(y~x, dados) outliers <- (cooks.distance(mod) > 0.2) mod2 <- lm(y~x, subset(dados, !outliers)) *Paulo Dick* Estatístico / Epidemiologia em Saúde Pública Tel.: (55 21) 99591-2716 Em 14 de outubro de 2016 11:26, Mac David S. Pinto via R-br < r-br@listas.c3sl.ufpr.br> escreveu: > Pessoal, bom dia > > Estou fazendo algumas regressões lineares entre Comprimento x Peso de > peixes com um conjunto de dados bastante extenso (+- 1000 linhas). > > Acontece que alguns destes valores são outliers (+- 50) e na analise, eles > não são importantes. > > Tem alguma função no R que eu consiga "selecionar" os outliers e pedir que > não seja considerado na analise? Sem precisa mudar minha planilha original > (já que vou utilizar para outras coisas futuramente) > > Tem alguns valores que estão no meio dos planilhas de dados. > > Eu consegui resolver os extremos selecionado um conjunto de linhas > > Exemplo: > > Local.F.1<-lm(pt[4:970,7]~ls[4:970,6]) > > ## Com este comando eu retire os outliers dos extremos (linhas 1 a 3 e > linhas 971 a 1000), mais ainda tem alguns valores no meio do analise (+- > entre as linhas 251 a 260) > > De já, eu agradeço a ajuda > > David > > _______________________________________________ > R-br mailing list > R-br@listas.c3sl.ufpr.br > https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br > Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça > código mínimo reproduzível. >
_______________________________________________ R-br mailing list R-br@listas.c3sl.ufpr.br https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo m�nimo reproduz�vel.