Oi Fernando On Fri, 14 Feb 2020 at 14:34, Fernando Trebien <fernando.treb...@gmail.com> wrote:
> On Thu, Feb 13, 2020 at 10:41 PM Gerald Weber <gwebe...@gmail.com> wrote: > >> Enfim, se eu já achava que a proposta era uma má ideia, agora estou >> convencido que se trata de um grande desastre. >> > > Para quem? > Para quem precisa confiar que os dados são reflexo da realidade e não reflexo de um algorítmo. > > >> Daqui a duas semanas participo de uma banca de mestrado onde se fez >> precisamente isto, extrairam os dados do OSM e fizeram uma análise de >> conectividade. Eu já vi que tiveram problemas com as classificações das >> rodovias. A atual proposta vai agravar a situação e tornar o OSM inútil >> para estudos científicos deste tipo. >> > > Pode dar mais detalhes? Eu acredito fortemente que a nova proposta > resolverá problemas de classificação ao invés de prejudicar. Para poder > ajudar e poder dizer se a nova proposta realmente prejudica alguém, > gostaria de saber: que trabalho foi esse, o que estavam tentando fazer, que > problemas tiveram, que estudos científicos estão sendo feitos usando o OSM, > etc. > Eu vou terminar de ler a dissertação e te falo com mais propriedade. Penso que o texto, após as correções deva ficar disponível on-line, quando isto acontecer eu aviso aqui. Mas para ficar em exemplos de trabalhos científicos, vamos considerar este artigo: https://www.sciencedirect.com/science/article/pii/S2226585615000199 Na Eq (2) ele calcula uma diversidade de rodovias, H', na China referente ao OSM de 2014. Eu não sei como os mapeadores chineses classificaram suas vias e que regras usaram. Mas note que o trabalho tira várias conclusões importantes, e fica claro que neste trabalho os autores tem a consciência que essas classificações dependem fortemente da decisão do mapeador. Os autores comparam densidade de rodovias com diversidade de classificação e tiram várias conclusões, dentre elas que o OSM se aproxima mais da realidade que mapas comerciais. Imagina agora que você introduz um viés algorítmico na classificação das vias, o que pode acontecer é que estudos similares no futuro vão gerar resultados que vão estar "contaminados" por isto. Por exemplo alguém poderia analisar a diversidade de rodovias do Brasil e ficar espantado em concluir que ela segue uma lei perfeita que depende da raíz quadrada das populaçoes que conectam as vias. Ou seja, em vez de capturar a realidade, capturou o modo de funcionamento do algorítmo. > Eu também entendo que o "algoritmo" proposto (que eu sempre chamei de > "metodologia") não deve ser levado sempre ao pé da letra sempre, alguma > dose de ponderação e interpretação deve ser permitida para tratar de casos > limítrofes pelo consenso. A "metodologia" é pra ajudar a orientar o > trabalho de classificação e eliminar da discussão a grande maioria dos > casos principais. > O ponto central da sua metodologia é uma abordagem algorítmica. Eu entendo a sua preocupação e respeito o seu esforço, mas eu prefiro uma metodologia ancorada na verificação (survey) ou, na impossibilidade desta, na consulta de uma autoridade que realiza este tipo de verificação como o DEER. Agora eu acho que tem muito mérito esse seu trabalho. Ele reflete a disparidade da conectividade de rodovias no Brasil. Isto está muito claro. Por exemplo, no caso de MG, o seu algoritmo considerou algumas rodovias ao redor de Diamantina deviam ser trunk. Já pelo DEER-MG ali tem um grande vazio, não há qualquer rodovia trunk (e eu concordo com o DEER neste caso). O que aconteceu? É o Vale do Jequitinhonha, umas das regiões mais pobres de Minas. Tem população que satisfaz o seu critério, mas não tem renda, não tem PIB. Tem gente, mas não tem produtos para transportar que justifiquem uma malha tipo trunk. O grande contraste aqui é o Triângulo Mineiro que é uma região rica permeada por trunks. Olhando a lista de rodovias que você mostrou no seu email anterior, aquilo basicamente esgota o que pode ser trunk em MG, a maioria são rodovias pedagiadas, isso é de fácil verificação. Agora como a proposta também cobre classificação de primary, eu temo que a situação possa ficar mais intratável. Quando chegar o momento de classificar as vias primárias pelo algorítmo aí eu penso que distorções bem maiores podem acontecer sem nenhum claro benefício para o usuário do mapa. De todo modo agradeço por este trabalho e pela proposta, mas acho desaconselhável substituir o atual esquema de rodovias por algo assim. um abraço e bom final de semana Gerald
_______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br