Caros,

estamos no Hackathon da Câmara Municipal, trabalhando com alguns dados de
proposições de lei. Uma das coisas que queriamos fazer era 'georeferenciar'
as proposições e visualizar mapas de influências.

Não manjo muito de processamento de linguagem natural e coisas afins.
Alguém tem alguma luz de como extrair os endereços das ementas? Elas não
seguem um formato muito específico... mas acho que tem elementos comuns o
suficiente pra gente montar uma regra que funcione bem... mas antes de
partir pruma série de regexes doidos, achei que valia um alô.

Os dados da Câmara estão aqui:
http://www.camara.sp.gov.br/index.php?option=com_content&view=article&id=10008:detalhes-tramitacao-projetos-dados-abertos&catid=119

E jogo alguns exemplos randomicamente extraidos dos projetos com a tag
'DENOMINAÇÃO':
AUTORIZA SEJA DADO O NOME DE LELLIS VIEIRA A UMA DAS RUAS DO PERIMETRO
URBANO DA CAPITAL
DA A DENOMINACAO DE ITOBI ( CIDADE PAULISTA ) A UM DOS LOGRADOUROS PUBLICOS
DO MUNICIPIO.
DA A DENOMINACAO DE EDUARDO CINELLI A UMA VIAS PUBLICAS SITUADAS NO
SUBDISTRITO DE JARDIM AMERICA NESTE MUNICIPIO.
AUTORIZA A DENOMINACAO DE DANTE CARRARO A UM DOS LOGRADOUROS PUBLICOS DA
CIDADE.
DENOMINA RUA PROFESSOR FILADELFO DE AZEVEDO, TRECHO DA ATUAL RUA DO GADO.
DENOMINA VIAS DE QUINTA DA PAINEIRAS, NO 27\xba SUBDISTRITO - VILA PRUDENTE

e por ai vai...

abs,
Pedro Markun
_______________________________________________
Talk-br mailing list
Talk-br@openstreetmap.org
http://lists.openstreetmap.org/listinfo/talk-br

Responder a