O módulo scikit-learn do Python tem excelentes algoritmos de clusterização que poderiam ser usados para esse tipo de análise em larga escala. Bastaria pegar o XML de um mapa (pode ser o do mundo), abrí-lo com o pandas e fazer a visualização dos grupos com, por exemplo, um dendrograma. Objetos vandalizados tendem a formar grupos pequenos ou de um só elemento, tal como dito no artigo, daí é fácil detectar tais situações. Mas a dificuldade é definir que métricas usar para obter tal separação. E é aí que entra a ciência de dados.
Seria interessante que houvesse um servidor onde pudéssemos instalar a base do OSM global (ou só do BR) e o Anaconda (pacote com Python + bibliotecas de visualização, análise e computação científica) onde as pessoas pudessem fazer suas análises através de Jupyter Notebooks. Para quem é programador, existe a biblioteca TensorFlow que também tem algoritmos de clusterização para big data. Em 8 de agosto de 2018 20:46, Gerald Weber <[email protected]> escreveu: > Oi Pessoal > > artigo sobre deteção de vandalismo no OSM: > > http://drops.dagstuhl.de/opus/volltexte/2018/9389/pdf/ > LIPIcs-GISCIENCE-2018-61.pdf > > fico imaginando se a gente conseguiria implementar algo assim em grande > escala > > abraço > > Gerald > > _______________________________________________ > Talk-br mailing list > [email protected] > https://lists.openstreetmap.org/listinfo/talk-br > >
_______________________________________________ Talk-br mailing list [email protected] https://lists.openstreetmap.org/listinfo/talk-br
