Caros, estamos no Hackathon da Câmara Municipal, trabalhando com alguns dados de proposições de lei. Uma das coisas que queriamos fazer era 'georeferenciar' as proposições e visualizar mapas de influências.
Não manjo muito de processamento de linguagem natural e coisas afins. Alguém tem alguma luz de como extrair os endereços das ementas? Elas não seguem um formato muito específico... mas acho que tem elementos comuns o suficiente pra gente montar uma regra que funcione bem... mas antes de partir pruma série de regexes doidos, achei que valia um alô. Os dados da Câmara estão aqui: http://www.camara.sp.gov.br/index.php?option=com_content&view=article&id=10008:detalhes-tramitacao-projetos-dados-abertos&catid=119 E jogo alguns exemplos randomicamente extraidos dos projetos com a tag 'DENOMINAÇÃO': AUTORIZA SEJA DADO O NOME DE LELLIS VIEIRA A UMA DAS RUAS DO PERIMETRO URBANO DA CAPITAL DA A DENOMINACAO DE ITOBI ( CIDADE PAULISTA ) A UM DOS LOGRADOUROS PUBLICOS DO MUNICIPIO. DA A DENOMINACAO DE EDUARDO CINELLI A UMA VIAS PUBLICAS SITUADAS NO SUBDISTRITO DE JARDIM AMERICA NESTE MUNICIPIO. AUTORIZA A DENOMINACAO DE DANTE CARRARO A UM DOS LOGRADOUROS PUBLICOS DA CIDADE. DENOMINA RUA PROFESSOR FILADELFO DE AZEVEDO, TRECHO DA ATUAL RUA DO GADO. DENOMINA VIAS DE QUINTA DA PAINEIRAS, NO 27\xba SUBDISTRITO - VILA PRUDENTE e por ai vai... abs, Pedro Markun
_______________________________________________ Talk-br mailing list Talk-br@openstreetmap.org http://lists.openstreetmap.org/listinfo/talk-br