(*oops* desculpem dei Enter ... pronto agora no computador tela grande) O nó da questão, que invalidada ou não seus argumentos, e nos forçaria a recomeçar do zero a discussão, está na sua afirmação incompleta de que * "(...) constatamos que a projeção dos endereços nas ruas cerca de 5% de endereços errados (...)"*
Exagerando, é como usar algoritmo de Bubble Sort <https://en.wikipedia.org/wiki/Bubble_sort> para afirmar que a ordenação por computador é coisa ruim, ou *pegar dados sem filtrar e dizer que os dados estão ruins*... Todo algoritmo de importação bem feitinho tem critério objetivo de filtragem, tem um "nível de descarte" que fica meio informal na receita complementar que chamamos de *metodologia*, já que em geral o computador não pode avaliar sozinho, precisa do parecer final do humano em vários passos... Alias podemos dizer que a *metodologia assistida é a única válida*, o acompanhamento humano é uma é uma obrigação (*pelas normas OSM <https://wiki.openstreetmap.org/wiki/Import>). * Resumindo o que talvez seja um posicionamento pessoal, convém conferir se alguém concorda: * a métrica de erros para fazer sentido nas nossas discussões precisa ser da metodologia assistida, não do algoritmo sozinho. * não se pode afirmar que "importação é coisa ruim", o que se pode afirmar é que "a metodologia X com o algoritmo Y para os dados Z é ruim".. Até que se prove o contrário. On Thu, Feb 14, 2019 at 4:20 PM Fernando Trebien <fernando.treb...@gmail.com> wrote: > On Thu, Feb 14, 2019 at 7:55 AM Peter Krauss <ppkra...@gmail.com> wrote: > > 2.2. Ponto oficial incompleto: pode ser importando? Essa é a discussão. > As fontes de informação na verdade existem, só que não é uma fonte única, > pode estar misturando verdade de campo, norma oficial (por exemplo leis de > nomenclatura de rua), dado oficial (ex. os pontos fornecidos pela > prefeitura), etc. O algorítomo mesmo sendo aberto é complexo e poucas > pessoas do OSM terão tempo e capacidade de avaliar. ESTÁ EM DISCUSSÃO, mas > precisamos primeiro arrumar a casa, chegar a uma descrição satisfatória no > "ponto oficial completo" (2.1 acima). Mesmo depois de discutir e chegar a > um consenso aqui precisaremos verificar com restante da comunidade OSM. > > > > 2.2.1. Com numeração (addr:housenumber) obtida por > interpolação/proximidade. > > Acho que depende das características do dado original. Se o que ele > tem é o endereço inicial e final de cada quadra, ou um endereço no > meio de cada quadra, ele pode ser importado sem problema algum usando > linhas interpoladoras, tal como se faz sem Buenos Aires e em alguns > outras cidades do mundo, contanto que os pontos de endereço contenham > o nome da rua. Seria indesejável interpolar o endereço gerando cada > ponto intermediário. > > > 2.2.2. Com nome de rua (addr:street) obtido por proximidade. > > Entre poder/não poder eu prefiro responder isso com as consequências > pro OSM de importar com ou sem um tratamento dos problemas dessa > abordagem. > > Em Porto Alegre já constatamos que a projeção dos endereços nas ruas > para obter o nome da rua produz cerca de 5% de endereços errados, ou > seja, 1 erro em cada 20 endereços. Um dado com tantos erros não possui > qualidade suficiente para suportar satisfatoriamente um serviço de > geocodificação. Se, por exemplo, alguém quiser usar o mapa para > oferecer um serviço de entregas ou de transporte individual, muitos > endereços estarão a quilômetros de distância do local correto, o que > obviamente seria bem ruim pra confiabilidade do serviço. Nesse caso, > eu esperaria que o usuário simplesmente descartaria o OSM e adotaria > um concorrente, como o Google Maps. Pior do que isso, se alguém quiser > usar os endereços existentes para inserir pontos de interesse a partir > de uma listagem local, os erros serão propagados e a correção exigirá > mais esforço (talvez o dobro) do que se tivesse sido feita antes. > > Mesmo numa cidade do tamanho de Porto Alegre, a solução manual desses > problemas exigiria um trabalho contínuo de ~2 semanas eu acho. Vale a > pena considerando o benefício. Na maioria dos municípios (em geral > pequenos) um trabalho desse tipo poderia ser feito completamente em > poucas horas. > > Onde não houver mão-de-obra disposta a realizar a correção, acho que é > fundamental no mínimo documentar (de preferência no wiki) que ficou > pendente de correção, do contrário ninguém vai saber onde procurar os > erros. Idealmente seria aberta também uma tarefa em algum sistema de > gestão de tarefas para orientar e monitorar esse trabalho. Agora que > temos o Kaart interessado em nos ajudar, podemos também tentar um > contato com eles para que realizem as correções manualmente. Se este > caso surgir com frequência em municípios diferentes, acho que vale a > pena organizar um grupo de trabalho para fazer as correções manuais. > Um grupo especializado assim estaria familiarizado com o tipo de erro > desse processo e poderia trabalhar rápido e com menos erros humanos. > > Caso a etapa de documentar a correção não for feita, o resultado mais > provável é que os erros permanecerão no mapa por um bom tempo e que > serão esquecidos, prejudicando a confiabilidade dos dados. Por > exemplo, na importação dos edifícios em Porto Alegre, uma informação > foi colocada na etiqueta description, foi solicitado aos mapeadores > que fosse convertida em etiquetas consumíveis (geralmente amenity=*), > mas esse trabalho nunca foi feito por ninguém. A informação está lá no > OSM, parada há anos, sem usufruto pelas aplicações. Como diz o wiki > [2] num texto proveniente do original em inglês, "nunca suponha que > essas pessoas vão alegremente arrumar a bagunça que você fez." > > Não estou dizendo que é obrigação de quem importa fazer a correção > manual. O importante é traçar um plano de correção e engajar as > pessoas que o executarão, e havendo interessados em fazer isso antes > mesmo da importação, melhor ainda. Como você pode ver lá na discussão > de Porto Alegre, há também questões relativas à limpeza de dados > existentes. > > > O que acha? Podemos seguir com essa terminologia? importação de "ponto > invalido" (obviamente invalida), de "ponto oficial completo" e de "ponto > oficial incompleto". > > Eu chamaria isso de um endereço incompleto/insuficiente, não de > inválido. O que realmente é inválido (em ~5% dos casos) é a heurística > de projetar o endereço sobre a rua mais próxima, seja ela feita antes > da importação ou feita pelo geocodificador caso a addr:street esteja > faltando no endereço. > > -- > Fernando Trebien > > _______________________________________________ > Talk-br mailing list > Talk-br@openstreetmap.org > https://lists.openstreetmap.org/listinfo/talk-br >
_______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br