Oi Fernando

On Fri, 14 Feb 2020 at 14:34, Fernando Trebien <fernando.treb...@gmail.com>
wrote:

> On Thu, Feb 13, 2020 at 10:41 PM Gerald Weber <gwebe...@gmail.com> wrote:
>
>> Enfim, se eu já achava que a proposta era uma má ideia, agora estou
>> convencido que se trata de um grande desastre.
>>
>
> Para quem?
>

Para quem precisa confiar que os dados são reflexo da realidade e não
reflexo de um algorítmo.


>
>
>> Daqui a duas semanas participo de uma banca de mestrado onde se fez
>> precisamente isto, extrairam os dados do OSM e fizeram uma análise de
>> conectividade. Eu já vi que tiveram problemas com as classificações das
>> rodovias. A atual proposta vai agravar a situação e tornar o OSM inútil
>> para estudos científicos deste tipo.
>>
>
> Pode dar mais detalhes? Eu acredito fortemente que a nova proposta
> resolverá problemas de classificação ao invés de prejudicar. Para poder
> ajudar e poder dizer se a nova proposta realmente prejudica alguém,
> gostaria de saber: que trabalho foi esse, o que estavam tentando fazer, que
> problemas tiveram, que estudos científicos estão sendo feitos usando o OSM,
> etc.
>

Eu vou terminar de ler a dissertação e te falo com mais propriedade. Penso
que o texto, após as correções deva ficar disponível on-line, quando isto
acontecer eu aviso aqui.

Mas para ficar em exemplos de trabalhos científicos, vamos considerar este
artigo:
https://www.sciencedirect.com/science/article/pii/S2226585615000199

Na Eq (2) ele calcula uma diversidade de rodovias, H', na China referente
ao OSM de 2014. Eu não sei como os mapeadores chineses classificaram suas
vias e que regras usaram. Mas note que o trabalho tira várias conclusões
importantes, e fica claro que neste trabalho os autores tem a consciência
que essas classificações dependem fortemente da decisão do mapeador. Os
autores comparam densidade de rodovias com diversidade de classificação e
tiram várias conclusões, dentre elas que o OSM se aproxima mais da
realidade que mapas comerciais.

Imagina agora que você introduz um viés algorítmico na classificação das
vias, o que pode acontecer é que estudos similares no futuro vão gerar
resultados que vão estar "contaminados" por isto.  Por exemplo alguém
poderia analisar a diversidade de rodovias do Brasil e ficar espantado em
concluir que ela segue uma lei perfeita que depende da raíz quadrada das
populaçoes que conectam as vias. Ou seja, em vez de capturar a realidade,
capturou o modo de funcionamento do algorítmo.


> Eu também entendo que o "algoritmo" proposto (que eu sempre chamei de
> "metodologia") não deve ser levado sempre ao pé da letra sempre, alguma
> dose de ponderação e interpretação deve ser permitida para tratar de casos
> limítrofes pelo consenso. A "metodologia" é pra ajudar a orientar o
> trabalho de classificação e eliminar da discussão a grande maioria dos
> casos principais.
>

O ponto central da sua metodologia é uma abordagem algorítmica. Eu entendo
a sua preocupação e respeito o seu esforço, mas eu prefiro uma metodologia
ancorada na verificação (survey) ou, na impossibilidade desta, na consulta
de uma autoridade que realiza este tipo de verificação como o DEER.

Agora eu acho que tem muito mérito esse seu trabalho. Ele reflete a
disparidade da conectividade de rodovias no Brasil. Isto está muito claro.
Por exemplo, no caso de MG, o seu algoritmo considerou algumas rodovias ao
redor de Diamantina deviam ser trunk. Já pelo DEER-MG ali tem um grande
vazio, não há qualquer rodovia trunk (e eu concordo com o DEER neste caso).
O que aconteceu? É o Vale do Jequitinhonha, umas das regiões mais pobres de
Minas. Tem população que satisfaz o seu critério, mas não tem renda, não
tem PIB. Tem gente, mas não tem produtos para transportar que justifiquem
uma malha tipo trunk. O grande contraste aqui é o Triângulo Mineiro que é
uma região rica permeada por trunks.

Olhando a lista de rodovias que você mostrou no seu email anterior, aquilo
basicamente esgota o que pode ser trunk em MG, a maioria são rodovias
pedagiadas, isso é de fácil verificação. Agora como a proposta também cobre
classificação de primary, eu temo que a situação possa ficar mais
intratável. Quando chegar o momento de classificar as vias primárias pelo
algorítmo aí eu penso que distorções bem maiores podem acontecer sem nenhum
claro benefício para o usuário do mapa.

De todo modo agradeço por este trabalho e pela proposta, mas acho
desaconselhável substituir o atual esquema de rodovias por algo assim.

um abraço e bom final de semana

Gerald
_______________________________________________
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br

Responder a