Pedro, Eu não conheço nada de processamento de linguagem natural, mas posso sugerir que, caso você consiga extrair alguma informação sobre o endereço, bairro ou região, utilize o Nominatim para extrair a posição.
O Nominatim é um geocoder aberto que usa a base do OpenStreetMap: http://wiki.openstreetmap.org/wiki/Nominatim O GeoNames utliza outras bases, mas também pode ser útil: http://www.geonames.org Abs, Vitor George mapaslivres.org twitter.com/mapaslivres 2012/5/12 Pedro Markun <[email protected]> > Caros, > > estamos no Hackathon da Câmara Municipal, trabalhando com alguns dados de > proposições de lei. Uma das coisas que queriamos fazer era 'georeferenciar' > as proposições e visualizar mapas de influências. > > Não manjo muito de processamento de linguagem natural e coisas afins. > Alguém tem alguma luz de como extrair os endereços das ementas? Elas não > seguem um formato muito específico... mas acho que tem elementos comuns o > suficiente pra gente montar uma regra que funcione bem... mas antes de > partir pruma série de regexes doidos, achei que valia um alô. > > Os dados da Câmara estão aqui: > > http://www.camara.sp.gov.br/index.php?option=com_content&view=article&id=10008:detalhes-tramitacao-projetos-dados-abertos&catid=119 > > E jogo alguns exemplos randomicamente extraidos dos projetos com a tag > 'DENOMINAÇÃO': > AUTORIZA SEJA DADO O NOME DE LELLIS VIEIRA A UMA DAS RUAS DO PERIMETRO > URBANO DA CAPITAL > DA A DENOMINACAO DE ITOBI ( CIDADE PAULISTA ) A UM DOS LOGRADOUROS > PUBLICOS DO MUNICIPIO. > DA A DENOMINACAO DE EDUARDO CINELLI A UMA VIAS PUBLICAS SITUADAS NO > SUBDISTRITO DE JARDIM AMERICA NESTE MUNICIPIO. > AUTORIZA A DENOMINACAO DE DANTE CARRARO A UM DOS LOGRADOUROS PUBLICOS DA > CIDADE. > DENOMINA RUA PROFESSOR FILADELFO DE AZEVEDO, TRECHO DA ATUAL RUA DO GADO. > DENOMINA VIAS DE QUINTA DA PAINEIRAS, NO 27\xba SUBDISTRITO - VILA PRUDENTE > > e por ai vai... > > abs, > Pedro Markun > > _______________________________________________ > Talk-br mailing list > [email protected] > http://lists.openstreetmap.org/listinfo/talk-br > >
_______________________________________________ Talk-br mailing list [email protected] http://lists.openstreetmap.org/listinfo/talk-br
