Re: [R-br] Random Forest

2017-07-05 Por tôpico Jefferson Ferreira-Ferreira via R-br
Olá Ary. Eu trabalhei bastane com o randomForest e talvez pudesse ajudar
mais efetivamente se tu pudesse fornecer um código mínimo reproduzível que
represente teu problema.
De qualquer maneira, quando me deparei com questão similar à que estás
enfrentando, esta referência foi importante e pode te ajudar também (te
repasso aqui):

https://stats.stackexchange.com/questions/197827/how-to-interpret-mean-decrease-in-accuracy-and-mean-decrease-gini-in-random-fore


Abraços



*Jefferson Ferreira-Ferreira, **PhD (abd)*

*Geographer*



*Ecosystem Dynamics Observatory  -
EcoDyn/UNESP*
*Department of **Geography *
*Institute of Geosciences and Exact Sciences** (IGCE)*
*São Paulo State University (UNESP)*
*Rio Claro, SP - Brazil*


Em 4 de julho de 2017 21:41, Ary Serpa Neto via R-br <
r-br@listas.c3sl.ufpr.br> escreveu:

> Pessoal,
>
> Estou iniciando os estudos em Random Forest e gostaria de uma ajuda na
> interpretação do modelo. Tenho um modelo com diversas variáveis tentando
> predizer mortalidade hospitalar. Após rodar o random forest, ao verificar a
> importância de cada uma das variáveis (usando o comando varImpPlot) obtive
> resultados conflitantes. Uma variável por exemplo é a última no gráfico de
> Mean Decrease Accuracy (8.079) e a terceira no gráfico de Mean Decrease
> Gini (154.1359).
>
> Como interpretar e lidar com esta diferença? Neste cenário de predição de
> mortalidade, qual levar em conta?
>
> Ary Serpa Neto, MD, MSc, PhD
> Hospital Israelita Albert Einstein, São Paulo, Brazil (
> http://www.einstein.br): Department of Critical Care Medicine & Jewish
> Institute of Education and Research Albert Einstein (
> http://www.einstein.br/pesquisa)
> The PROtective VEntilation NETwork (www.provenet.eu)
> Associate Editor: BMC Anesthesiology and BMC Pulmonary Medicine
> http://publicationslist.org/a.serpa_neto
> http://lattes.cnpq.br/0254664157557375
>
> ___
> R-br mailing list
> R-br@listas.c3sl.ufpr.br
> https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
> Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forneça
> código mínimo reproduzível.
>
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.

[R-br] Random Forest

2017-07-04 Por tôpico Ary Serpa Neto via R-br
Pessoal, Estou iniciando os estudos em Random Forest e gostaria de uma ajuda na interpretação do modelo. Tenho um modelo com diversas variáveis tentando predizer mortalidade hospitalar. Após rodar o random forest, ao verificar a importância de cada uma das variáveis (usando o comando varImpPlot) obtive resultados conflitantes. Uma variável por exemplo é a última no gráfico de Mean Decrease Accuracy (8.079) e a terceira no gráfico de Mean Decrease Gini (154.1359).Como interpretar e lidar com esta diferença? Neste cenário de predição de mortalidade, qual levar em conta?Ary Serpa Neto, MD, MSc, PhDHospital Israelita Albert Einstein, São Paulo, Brazil (http://www.einstein.br): Department of Critical Care Medicine & Jewish Institute of Education and Research Albert Einstein (http://www.einstein.br/pesquisa)The PROtective VEntilation NETwork (www.provenet.eu)Associate Editor: BMC Anesthesiology and BMC Pulmonary Medicinehttp://publicationslist.org/a.serpa_netohttp://lattes.cnpq.br/0254664157557375
___
R-br mailing list
R-br@listas.c3sl.ufpr.br
https://listas.inf.ufpr.br/cgi-bin/mailman/listinfo/r-br
Leia o guia de postagem (http://www.leg.ufpr.br/r-br-guia) e forne�a c�digo 
m�nimo reproduz�vel.