Caros,
Eu trabalhei alguns anos com essa parte de endereçamento e tenho muito a ajudar 
nesse processo do CNEFE.
Além dos acentos e da lógica fuzzy (que pode adicionar erros), podemos usar 
alguma coisa de fonética brasileira(que pode adicionar erros) e tabelas 
auxiliares(que pode adicionar erros) com nomes padrão, dando replace em erros 
conhecidos de grafia (AKA: juscelino kubitschek é difícil de escrever).
Tem esse algoritimo em Delphi que eu achei uma vez, que faz um trabalho 
fantastico de fonética BR (tecnicamente não é BR é do Portugês) (AKA: soundex 
não é bom para matches exatos) http://pastebin.com/KpYxxw5e.
Vamos supor que o "quarteirão" tenha 4 ruas e 3 delas tem nome no OSM e estes 
nomes batem, a gente pode supor que a rua que faltou no OSM tem o nome da rua 
que sobrou no CNEFE.
A gente pode usar não só os municipios, mas também os setores censitários para 
achar exatamente onde estão os nomes faltantes.
Os setores censitários tem uma tabela de descrição do entorno. É um campo de 
texto livre para cada setor falando as ruas por onde ele é delimitado. Com 
alguma inteligência a gente pode quebrar esse campo em ruas e cruzar com o OSM 
também.
O problema conhecido de cruzar diferentes bases de dados espaciais é o 
deslocamento que pode haver entre uma e outra, tenho alguns esboços 
interessantes de como resolver isso saíndo do mundo tabular e utilizando GIS.
Minha ideia se baseia em 2 coisas, achar alguns setores por cidade onde tudo 
bate e usar eles como referência de posicionamento. Depois extrapolar o erro 
destes setores para os setores próximos encaixando eles no lugar mais próximo 
do correto. (se o setor que a gente sabe que bate com o OSM estiver 5m para a 
direita, o setor vizinho dele estara provavelmente a algo próximo de 5m a 
direita também, pois eles tem paredes que se tocam)
Existe também o problema de ruas que de fato mudaram de nome, podemos usar a 
tag old_name do OSM neste processo, se o nome do CNEFE constar lá, não é erro, 
realmente foi mudado o nome da rua.
Então os dados seriam OSM(Vetor, Name, Alt_Name, Official_Name, Ref, Old_Name, 
No_Name), CNEFE, Shapes dos setores censitários, Descrições dos setores 
censitários.
Pegar as áreas verdes (acho que village_green e park) com nome seria legal 
também, pois muitas praças dão nomes a logradouros, mas nem sempre isso se 
reflete na base de arruamento.
Eu quero muito de ajudar nisso, estudei isso do OSM e do CNEFE bastante tempo e 
por isso tenho bastante conhecimento para tal, se tiverem interesse em expandir 
essa conversa além da lista (dá uma preguiça de escrever e a discussão demora, 
principalmente para brain storming) estou disposto a participar de discussões 
via áudio sobre o tema em horário não comercial e depois a gente pode colocar 
na lista um resumo para não perder o histórico.
Sou programador experiente, posso ajudar a desenvolver rotinas de transformação 
de texto, consultas e análises espaciais necessárias para esse processo.
Parabéns pelo trabalho até então, essa iniciativa é 10, somando esforços a 
gente vai destruir de deixar o OSM completo!

Atenciosamente
Marcos Fedato


Date: Wed, 30 Sep 2015 01:33:03 -0300
From: [email protected]
To: [email protected]
Subject: Re: [Talk-br] RES: RES: OSM - CNEFE

coloquei agora. 
Mudei o codigo mesmo , que estava grande demais pro Readme para 

https://github.com/lucasmation/osm_cnefe_import/blob/master/OMS_and_CNEFE_blocks_matching.sql



2015-09-29 15:45 GMT-03:00 Márcio Aguiar Ribeiro <[email protected]>:
Oi, Lucas!
Muito bom! Eu venho planejando fazer isso faz um tempo já. Entrei no 
repositório e fiquei fuçando o código e o que eu entendi é que ainda não está 
disponível, certo?Marcio Aguiar Ribeiro

2015-09-28 13:19 GMT-03:00 Lucas Ferreira Mation <[email protected]>:
Pessoal, 
retomando este assunto:  consegui (finalmente!!!) cruzar os quarteirões do 
CNEFE com os do OSM. 
O Cnefe tem 2.1 milhões de quarteirões. O OSM tem 1.6 milhões de "quarteirões" 
(os quarteirões são algo que eu mesmo crio, a partir da interseção das Ruas do 
OSM). Destes apenas 480 mil tem todos os lados nomeados. 
O primeiro critério do cruzamento foi que os quarteirões tinham que cair no 
mesmo município (a partir do shapefile de municípios de 2010 do IBGE). O 2o 
critéiro foi que os nomes de todas as ruas que compõem o quarteirão batessem 
nas duas bases. 
Com este critério consegui identificar 95mil quarteirões do CNEFE no OSM. Para 
estes quarteirões temos todos os endereços que estão no CNEFE. 
Os municípios com mais quarteirões são: 
São Paulo - 5mil. Bejo Horizonte -  3,5milCuritiba - 3.2milCampo Grande - 
2.7milFortaleza - 1.9milRibeirão Preto - 1.7milRio de Janeiro - 1.5mil
e assim vai. Encontrei quarteirões em 1822 municípios, mas a maioria tem menos 
de 20 quarteirões encontrados. 
Isso foi com pareamento extato. Vou começar agora a testar com fuzzy matches. 


ao longo do dia vou migrar o código para: 
https://github.com/lucasmation/osm_cnefe_import



Lucas







2015-07-14 12:12 GMT-03:00 Peter Krauss <[email protected]>:
Oi Lucas, ótimo trabalho (!), assim que sobrar um tempo (algum final de semana) 
ponho a mão-na-massa, para entender o que voce fez e como podemos conversar 
mais tecnicamente ;-) (se tiver ilustrações, ex. UML, de modelo de dados para 
postar no git também ajuda)Como sou novato, pretendo seguir um pouco "pelas 
bordas" e no escopo mais geral das discussões...
A ideia geral do projeto de Mapa-do-CEP ainda é rascunho mas pode ser apreciada 
em   http://wiki.okfn.org/Open_Knowledge_Brasil/Mapa-do-CEPque tal começarmos 
pelo CEP2?
- - - - Quanto os problemas legais (direitos autorais reclamados pela ECT bem 
como lei do monopólio) , precisamos de apoio internacional, inclusive da OSM... 
Comecei a busca por essa discussão (link abaixo), e senti receptividade,       
http://opendata.stackexchange.com/q/5600/1313
a parte juridica é importante para não jogarmos nosso tempo no lixo... Até onde 
conversei com advogados, se criarmos uma metodologia (algoritmos) para 
espacialização do CEP (ver links Wikipedia com preliminares), não tem problema 
algum: o primeiro a publicar é o autor... Por isso acho importante termos 
resultado a curto prazo de um projeto-piloto com OSM e publicarmos no 
http://arxiv.org

 

Em 14 de julho de 2015 11:13, Lucas Ferreira Mation <[email protected]> 
escreveu:
Pessoal, estou colocando o que já tenho de código em: 

https://github.com/lucasmation/osm_cnefe_import
(que perdoe a lingua portuguesa, escrevi em ingles para poder pegar mais 
feedback dos desenvolvedores do OSM no mundo, foruns, etc) 
Peter, bem vindo. Eu usei mesmo esta pergunta do gis.stackexchange. E elaborei 
em cima. Esta questão de dois lados do mesmo seguimento de rua teremo o mesmo 
CEP eu poderia explorar para melhorar o paramento, mesmo em quadras não 
pareadas. Mas o quão certo, 100% é isso?

absLucas



2015-07-13 19:01 GMT-03:00 Peter Krauss <[email protected]>:
Oi gente, acabo de me inscrever na lista... Posso participar da discussão?
Eu tenho interesse no mapeamento do CEP e do CNEFE, que justamente ajudam a 
resolver ambiguidades edar mais confiança à geocodificação... Até onde 
verifiquei, o Mapa-do-CEP não oferece problema jurídico...Postei um esboço 
metodológico da sua construção, na Wikipedia,    
https://en.wikipedia.org/wiki/Postal_code#Codes_defined_indirectly_to_administrative_borders
que acham?Alguem falou em quadras por aqui, é justamente o foco metodológico... 
  http://gis.stackexchange.com/q/80498/7505
PS: sobre pontos de endereçamento de utilidade publica, um bom projeto de 
referencia é o http://adresse.data.gouv.fr/


_______________________________________________

Talk-br mailing list

[email protected]

https://lists.openstreetmap.org/listinfo/talk-br





_______________________________________________

Talk-br mailing list

[email protected]

https://lists.openstreetmap.org/listinfo/talk-br





_______________________________________________

Talk-br mailing list

[email protected]

https://lists.openstreetmap.org/listinfo/talk-br





_______________________________________________

Talk-br mailing list

[email protected]

https://lists.openstreetmap.org/listinfo/talk-br





_______________________________________________

Talk-br mailing list

[email protected]

https://lists.openstreetmap.org/listinfo/talk-br





_______________________________________________
Talk-br mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-br                                
          
_______________________________________________
Talk-br mailing list
[email protected]
https://lists.openstreetmap.org/listinfo/talk-br

Responder a