Grafia de rua realmente é um problema sério, penas para ficar em um exemplo que 
tenho catalogado devido ao processo de Auditoria de Endereços que faço em 
relação a base de CEPs, este é um caso real retirado de arquivo de um cliente:

 


RUA RROUXINOL NR 575

R ROXINOL NUM 575


R ROUCHINOL 575

R REGIONOL 575


RUA AV ROUXINOL 575

R ROXINO 575


R AVENIDA ROUXINOL 575

R ROUSCHINOL 575

 

Algumas coisas podem ser dicionarizadas mas com muito critério, outras somente 
um trabalho manual mesmo, apenas para ficar num caso já citado aqui não é 
possível dicionarizar usando fonética ( Izabel e Isabel, Sousa e Souza ) entre 
outros, pois ambas as grafias são corretas.

 

Os cadastros da prefeitura são as melhores referências, seguido pelo correio 
(Base mantida a mais tempos com objetivo de endereçamento) e o CNEFE em ultima 
instância ( pelo volume de dados disponível numa única fonte ), nos casos de 
placas de rua o problema não é o cadastro mas a execução do serviço até pouco 
tempo atrás tínhamos placas para a R Estela e R Stela uma em frente a outra 
aqui em São Paulo.  Só para constar o Correio não tem nenhuma Rua Doutor Ébano 
catalogada no CEP.

 

Mesmo podendo existir algum erro no CNEFE alguma informação é melhor que 
nenhuma informação, de qualquer maneira estou corrigindo a base CNEFE que tenho 
aqui e padronizando de acordo com a EXCT no caso de cidades com CEP por 
logradouro, mas o processo é realmente longo.

 

De resto para minhas inserções no OSM sigo o critério de não alterar o source 
para correções do tipo ROUCHINOL  para ROUXINOL, MEM SA para MEM DE SA, 
acentuação, pluralidade, etc

 

Reinaldo 

 

 

 

De: John Packer [mailto:[email protected]] 
Enviada em: quinta-feira, 24 de abril de 2014 23:36
Para: OpenStreetMap no Brasil
Assunto: Re: [Talk-br] Listas de endereços por município

 

Por mim, poderia ser passado um corretor ortográfico pelos nomes de ruas 
retirados pelo IBGE.

Não tem nenhuma garantia de qualidade neles.

 

Em 24 de abril de 2014 23:30, Lucas Ferreira Mation <[email protected]> 
escreveu:

Tem casos em que é clara a grafia, como em JK e outros nomes comuns,  da para 
fazer um dicionário. Mas tem vários casos em que não da para saber.

Se conseguíssemos juntar listas de varias fontes "oficiais"/corretas, ou pelo 
menos mais corretas que o CNEFE, eu posso fazer um matching probabilístico p 
ficar c um cnefe com as grafias corrigidas. Assim daria p juntar as vantagens 
do cnefe ter ruas com algumas indicação de localização (setor censitário), com 
a grafia correta das listagens oficiais

Em 24/04/2014 23:17, "Alexandre Magno Brito de Medeiros" 
<[email protected]> escreveu:

Sim, é basicamente isso. Não me lembro de ter inserido ou retirado termos ou 
letras de algum nome. A não ser um singular/plural evidentemente destoante.

Alexandre Magno

 

Em 24 de abril de 2014 23:12, Nelson A. de Oliveira <[email protected]> escreveu:

Se são correções do tipo Joao → João não há necessidade de mudar o source.

 

 

_______________________________________________
Talk-br mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-br


_______________________________________________
Talk-br mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-br

 

_______________________________________________
Talk-br mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-br

Responder a