Re: [Talk-br] spell check
Marcelo, Boa iniciativa. Como disseste que estás corrigindo tudo a mão e só usas o script para localizar os potenciais erros, não vejo necessidade de tags adicionais (acho que até atrapalha). Em 03/02/2014 13:19, Marcelo Pereira pereirahol...@gmail.com escreveu: Srs, Postei no fórum o script e a explicação do processo, para análise. Att, Marcelo Pereira Em 3 de fevereiro de 2014 17:40, Paulo Carvalho paulo.r.m.carva...@gmail.com escreveu: Em 3 de fevereiro de 2014 17:17, Marcelo Pereira pereirahol...@gmail.com escreveu: Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Também acho interessante poder passar o script para corrigir tais erros. ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- ... Edileuz, eu não tem nada a ver com Creuza, É mentira da Ivete, não é meu esse caniveete... Halley, Luiz - Poeta, Cantor, Compsitor ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para a grafia original e source:spelling:pt=survey sempre que se verificou inequívocamente que a grafia da rua diverge do normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em outras línguas (por exemplo Berlin e Berlim, München e Munique). Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma alteração e olhar todos os changesets um por um no JOSM. Que eu saiba quem usa o iD ficaria sem saber mesmo. 1) como proteger uma grafia que de fato diverge do usual? 2) o que deve valer? o que está na placa ou o que está
Re: [Talk-br] spell check
Fernando, Não entendi a pergunta. Marcelo Pereira Em 4 de fevereiro de 2014 13:17, Fernando Trebien fernando.treb...@gmail.com escreveu: Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para a grafia original e source:spelling:pt=survey sempre que se verificou inequívocamente que a grafia da rua diverge do normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em outras línguas (por exemplo Berlin e Berlim, München e Munique). Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que isto existe. Quer
Re: [Talk-br] spell check
A área que o seu spell check cobre é muito grande: http://www.openstreetmap.org/user/TrevorInserts/history#map Eu acho pouco provável que você tenha revisado manualmente todos os erros de português indicados pelo aspell nessas áreas todas. Se eu estiver enganado, gostaria de conhecer o seu método. 2014-02-04 Marcelo Pereira pereirahol...@gmail.com: Fernando, Não entendi a pergunta. Marcelo Pereira Em 4 de fevereiro de 2014 13:17, Fernando Trebien fernando.treb...@gmail.com escreveu: Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para
Re: [Talk-br] spell check
Imagino que ele esteja corrigindo esses nomes possivelmente por ordem de ID - que denota a ordem temporal em que foram mapeadas -, ou por ordem alfabética, de forma que os itens alterados não necessariamente são próximos. []s Arlindo 2014-02-04 Fernando Trebien fernando.treb...@gmail.com: A área que o seu spell check cobre é muito grande: http://www.openstreetmap.org/user/TrevorInserts/history#map Eu acho pouco provável que você tenha revisado manualmente todos os erros de português indicados pelo aspell nessas áreas todas. Se eu estiver enganado, gostaria de conhecer o seu método. 2014-02-04 Marcelo Pereira pereirahol...@gmail.com: Fernando, Não entendi a pergunta. Marcelo Pereira Em 4 de fevereiro de 2014 13:17, Fernando Trebien fernando.treb...@gmail.com escreveu: Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma
Re: [Talk-br] spell check
Ah bom, assim faz sentido. É bastante incomum essa forma de edição (seja manual ou automática), elas geralmente são concentradas em regiões pequenas. Posso sugerir quebrar os changesets em regiões menores? Ajudaria na revisão das alterações, e caso uma reversão for necessária afetaria menos gente de uma só vez. O ideal seria dividir por cidade, ou pelo menos por estado. Se você fizesse assim não precisaria dividir por tipo de via, mas se você ainda achar interessante pra revisão, acho que só faria sentido dividir em dois grupos: vias tipicamente rurais (motorway, motorway_link, trunk, trunk_link) e vias tipicamente urbanas (primary, primary_link, secondary, secondary_link, tertiary, tertiary_link, residential, unclassified). Sugeriria ainda colocar no source dos seus changesets um link permanente (não encurtado) pra esse seu post no fórum. Pode ser muito útil daqui a alguns anos. 2014-02-04 Marcelo Pereira pereirahol...@gmail.com: Fernando, Como disse aqui ontem, eu postei no fórum o script e a descrição do processo. Só faltou o link, taí : http://goo.gl/YGF0XG Nada além disso. Marcelo Pereira Em 4 de fevereiro de 2014 16:08, Arlindo Pereira openstreet...@arlindopereira.com escreveu: Imagino que ele esteja corrigindo esses nomes possivelmente por ordem de ID - que denota a ordem temporal em que foram mapeadas -, ou por ordem alfabética, de forma que os itens alterados não necessariamente são próximos. []s Arlindo 2014-02-04 Fernando Trebien fernando.treb...@gmail.com: A área que o seu spell check cobre é muito grande: http://www.openstreetmap.org/user/TrevorInserts/history#map Eu acho pouco provável que você tenha revisado manualmente todos os erros de português indicados pelo aspell nessas áreas todas. Se eu estiver enganado, gostaria de conhecer o seu método. 2014-02-04 Marcelo Pereira pereirahol...@gmail.com: Fernando, Não entendi a pergunta. Marcelo Pereira Em 4 de fevereiro de 2014 13:17, Fernando Trebien fernando.treb...@gmail.com escreveu: Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não
Re: [Talk-br] spell check
De repente os erros não são tantos assim, mesmo numa área tão grande. Acho que dá para corrigir manualmente uns 200 erros acusados pelo script bem rápido. 200 erros é muita coisa, certamente eles estarão espalhados numa área tão grande. Em 4 de fevereiro de 2014 14:17, Fernando Trebien fernando.treb...@gmail.com escreveu: Hm ok. Mas como você está conseguindo fazer isso manualmente numa escala tão grande e tão rápido? 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para a grafia original e source:spelling:pt=survey sempre que se verificou inequívocamente que a grafia da rua diverge do normal. Aqui o pt é de protuguês já que uma localidade pode
[Talk-br] spell check
Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.com escreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Ah OK Marcelo, nunca ia adivinhar ;) mas rodar spell check? O que exatamente você está fazendo? abraço Gerald 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- Dr. Gerald Weber gwebe...@gmail.com Personal website https://sites.google.com/site/geraldweberufmg/ Departamento de Física/Universidade Federal de Minas Gerais Department of Physics/Federal University of Minas Gerais Campus da Pampulha Av. Antônio Carlos, 6627, 31270-901 Belo Horizonte, MG, Brazil mobile: +55-(0)31-96462277 (mudou/changed 02/07/2013) ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no OpenStreetMap, o que está na placa que conta mais. Mas posso apontar pelo menos um erro que foi corrigido por ele e confirmado por mim. Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche *ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que passou despercebido por um bom tempo. Em 3 de fevereiro de 2014 10:05, Marcelo Pereira pereirahol...@gmail.comescreveu: Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Srs, Eu não estou rodando um spell check automático. 1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik. 2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os highways=primary ) 3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui significa trabalho manual ) 4. Faço o upload do arquivo atualizado usando o upload.py Gerald, O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer alterações em lote no OSM ficasse mais fácil para identificar. Na descrição que fiz no fórum sobre o processo que rodei no mapa para trocar as abreviações por suas versões por extenso, eu citei a criação desas conta. Esse trabalho de spell check é uma continuidade natural do trabalho acima citado, pelo menos entendi assim. John, A palavra Kubitschek tem respondido por boa parte das mudanças, dava para escrever um livro com as versões encontradas. :) Vc encontrou o erro consertado em parte da via, provavelmente porque ela mudou de classificação, de primary para secundary, por exemplo, ou parte dela é um link, e como estou fazendo o spell check por partes, uma para cada tipo, é esperado que isso aconteça. Estou fazendo isso porque encontrei muitos erros de ortografia, isso é comum num projeto onde muitos contribuem, e com ferramentas que não fornecem o serviço de correção, ou pelo menos sugestão, de termos inseridos. Além disso, estou me atendo aos erros mais danosos, como por exemplo os que podem impedir, ou mesmo dificultar, a pesquisa das vias, como por exemplo o do Kubitschek citado, ou outro pior, como o Aveinda. Não estou dizendo que estou fazendo um trabalho perfeito, e por isso pode, e até deve, haver falsos positivos, mas imagino que valha o custo benefício. Se for a opinião dominante que este é um trabalho que não deva ser feito, eu o abandonarei imediatamente, assim como deixo aqui já registrado que permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM, se forem verificados erros que os inviabilizem. Assim como todos os mappers, encontrei um filão de atuação no OSM, e venho fazendo o melhor para poder ajudar. Marcelo Pereira Em 3 de fevereiro de 2014 09:19, John Packer john.pack...@gmail.comescreveu: PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois). Tem que tomar cuidado com isso. Em 3 de fevereiro de 2014 10:15, John Packer john.pack...@gmail.comescreveu: Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no OpenStreetMap, o que está na placa que conta mais. Mas posso apontar pelo menos um erro que foi corrigido por ele e confirmado por mim. Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche *ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que passou despercebido por um bom tempo. Em 3 de fevereiro de 2014 10:05, Marcelo Pereira pereirahol...@gmail.com escreveu: Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Mas o que acontece se *de fato* a prefeitura fez as placas com Kubitsche *ck*? Na placa vai ter uma coisa e no OSM outra? Neste caso *específico*, tendo *a placa* com um erro de ortografia, eu colocaria um deles(provavelmente a versão correta) como name, e o que está na placa como alt_name. Em 3 de fevereiro de 2014 10:35, Gerald Weber gwebe...@gmail.com escreveu: Mas o que acontece se *de fato* a prefeitura fez as placas com Kubitsche *ck*? Na placa vai ter uma coisa e no OSM outra? E se alguém resolveu imitar o Café Kubitsche*ck* aqui no Brasil? http://www.das-neue-kubitscheck.de/ (que nada tem a ver com o Presidente), vai corrigir também introduzindo um erro? abraço Gerald 2014-02-03 John Packer john.pack...@gmail.com: PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois). Tem que tomar cuidado com isso. Em 3 de fevereiro de 2014 10:15, John Packer john.pack...@gmail.comescreveu: Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no OpenStreetMap, o que está na placa que conta mais. Mas posso apontar pelo menos um erro que foi corrigido por ele e confirmado por mim. Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche*ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que passou despercebido por um bom tempo. Em 3 de fevereiro de 2014 10:05, Marcelo Pereira pereirahol...@gmail.com escreveu: Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- Dr. Gerald Weber gwebe...@gmail.com Personal website https://sites.google.com/site/geraldweberufmg/ Departamento de Física/Universidade Federal de Minas Gerais Department of Physics/Federal University of Minas Gerais Campus da Pampulha Av. Antônio Carlos, 6627, 31270-901 Belo Horizonte, MG, Brazil mobile: +55-(0)31-96462277 (mudou/changed 02/07/2013) ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Marcelo, só pra deixar claro, eu não sou contra essas correções. É verdade que podem ter falsos positivos, mas como no exemplo que eu citei, ainda ficaria Kubitschek errado por muito tempo aqui, então eu acho que no final das contas são mudanças bem-vindas. Em 3 de fevereiro de 2014 10:43, Marcelo Pereira pereirahol...@gmail.comescreveu: Srs, Eu não estou rodando um spell check automático. 1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik. 2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os highways=primary ) 3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui significa trabalho manual ) 4. Faço o upload do arquivo atualizado usando o upload.py Gerald, O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer alterações em lote no OSM ficasse mais fácil para identificar. Na descrição que fiz no fórum sobre o processo que rodei no mapa para trocar as abreviações por suas versões por extenso, eu citei a criação desas conta. Esse trabalho de spell check é uma continuidade natural do trabalho acima citado, pelo menos entendi assim. John, A palavra Kubitschek tem respondido por boa parte das mudanças, dava para escrever um livro com as versões encontradas. :) Vc encontrou o erro consertado em parte da via, provavelmente porque ela mudou de classificação, de primary para secundary, por exemplo, ou parte dela é um link, e como estou fazendo o spell check por partes, uma para cada tipo, é esperado que isso aconteça. Estou fazendo isso porque encontrei muitos erros de ortografia, isso é comum num projeto onde muitos contribuem, e com ferramentas que não fornecem o serviço de correção, ou pelo menos sugestão, de termos inseridos. Além disso, estou me atendo aos erros mais danosos, como por exemplo os que podem impedir, ou mesmo dificultar, a pesquisa das vias, como por exemplo o do Kubitschek citado, ou outro pior, como o Aveinda. Não estou dizendo que estou fazendo um trabalho perfeito, e por isso pode, e até deve, haver falsos positivos, mas imagino que valha o custo benefício. Se for a opinião dominante que este é um trabalho que não deva ser feito, eu o abandonarei imediatamente, assim como deixo aqui já registrado que permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM, se forem verificados erros que os inviabilizem. Assim como todos os mappers, encontrei um filão de atuação no OSM, e venho fazendo o melhor para poder ajudar. Marcelo Pereira Em 3 de fevereiro de 2014 09:19, John Packer john.pack...@gmail.comescreveu: PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois). Tem que tomar cuidado com isso. Em 3 de fevereiro de 2014 10:15, John Packer john.pack...@gmail.comescreveu: Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no OpenStreetMap, o que está na placa que conta mais. Mas posso apontar pelo menos um erro que foi corrigido por ele e confirmado por mim. Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche*ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que passou despercebido por um bom tempo. Em 3 de fevereiro de 2014 10:05, Marcelo Pereira pereirahol...@gmail.com escreveu: Eu conheço. Sou eu. Marcelo Pereira Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu: Oi Pessoal tem um usuário rodando spell check http://www.openstreetmap.org/user/TrevorInserts http://www.openstreetmap.org/changeset/20274327 isto é potencialmente perigoso fazer correções automatizadas assim alguém conhece este usuário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- - TImbuSérieA2013 ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Oi Marcelo obrigado pelos esclarecimentos e pelo trabalho realizado. Vão aqui algumas sugestões: 2014-02-03 Marcelo Pereira pereirahol...@gmail.com: Srs, Eu não estou rodando um spell check automático. 1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik. 2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os highways=primary ) 3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui significa trabalho manual ) 4. Faço o upload do arquivo atualizado usando o upload.py Coloque um source:spelling= assim na revisão sabemos o que houve Gerald, O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer alterações em lote no OSM ficasse mais fácil para identificar. Ótimo. Sugiro colocar uma pequena explicação no perfil deste usuário. Do jeito que está apenas parece um usuário com 1 mês de atividade que resolveu trocar o mapa do Brasil inteiro ;) Na descrição que fiz no fórum sobre o processo que rodei no mapa para trocar as abreviações por suas versões por extenso, eu citei a criação desas conta. Estava de férias, acho que perdi o fio da meada desta discussão, pelo que peço desculpas. Se for a opinião dominante que este é um trabalho que não deva ser feito, eu o abandonarei imediatamente, assim como deixo aqui já registrado que permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM, se forem verificados erros que os inviabilizem. Sou da opinião que o trabalho deve continuar sim, apenas fui pego de surpresa e não soube indentificar o usuário. Ficam apenas 2 perguntas: 1) como proteger uma grafia que de fato diverge do usual? 2) o que deve valer? o que está na placa ou o que está no dicionário? abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Gerald, Comentários em vermelho, Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Ótimo. Sugiro colocar uma pequena explicação no perfil deste usuário. Do jeito que está apenas parece um usuário com 1 mês de atividade que resolveu trocar o mapa do Brasil inteiro ;) Atualizarei o perfil desta conta. Ficam apenas 2 perguntas: 1) como proteger uma grafia que de fato diverge do usual? 2) o que deve valer? o que está na placa ou o que está no dicionário? Se a grafia diverge do usual por um fator da cultura local, não acho que tenha problemas em mante-la. Mas acho que esse não é o foco do meu trabalho, por exemplo, toda vez que encontro Julia, Cesar, Claudio , nas tag, o aspell ( e qq outro editor ) reclama da falta dos acentos, mas mesmo assim não altero por imaginar que as grafias podem variar. Outro exemplo, aqui perto de casa tem uma Rua Doutor Zé Maria, ninguem saberia encontrar a Rua Doutor José Maria. O que estou tentando fazer é corrigir os casos conhecidos, o exemplo do JK é, para mim, passível de mudança, pois só houve um Presidente Juscelino Kubitschek, e o nome dele é esse, independente de como foi escrito nas placas. Se vc grafar diferente, está errado. Se não for assim, o trabalho de spell check não é possível nos mapas do OSM, pois qualquer erro poderia ser considerado neologismo ou regionalismo. Para mim isso encobertaria os muitos erros que se veem no mapa, podendo até afastar os possíveis usuários dele. Marcelo Pereira ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para a grafia original e source:spelling:pt=survey sempre que se verificou inequívocamente que a grafia da rua diverge do normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em outras línguas (por exemplo Berlin e Berlim, München e Munique). Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma alteração e olhar todos os changesets um por um no JOSM. Que eu saiba quem usa o iD ficaria sem saber mesmo. 1) como proteger uma grafia que de fato diverge do usual? 2) o que deve valer? o que está na placa ou o que está no dicionário? Se a grafia diverge do usual por um fator da cultura local, não acho que tenha problemas em mante-la. A questão é: como sabemos que a grafia era de fato esta e que não foi um erro do mapeador? Sem verificar no local? Eu não tenho uma solução para este problema. E como fazemos para avisar que a grafia da rua está correta e que não deve ser alterada? Acho que source:spelling:pt=survey pode ser a solução Para mim isso encobertaria os muitos erros que se veem no mapa, podendo até afastar os possíveis usuários dele. Sim e não. O correto seria verificar no local, por exemplo olhando a placa da rua, e ver que está lá de fato. Exemplo: aqui em BH temos a Rua Passa Tempo, no dicionário você só vai achar passatempo, mas o nome da rua é grafado separado mesmo (conferi pessoalmente e tenho um amigo que mora nesta rua que confirmou). E note que na rua há placas com as duas grafias! Eu já tomei tanta supresa com nomes estranhos que eu pensaria duas vezes antes de sair corrigindo só me baseando em dicionário, sem verificar com cuidado. Talvez em casos de dúvidas eu acrescentaria um fixme=verificar grafia da rua pessoalmente no local ou em documentos oficiais ao invés de alterar só baseado no dicionário. abraço Gerald ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- Fernando Trebien +55 (51) 9962-5409 The speed of computer chips doubles every 18 months. (Moore's law) The speed of software halves every 18 months. (Gates' law) ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Fernando, pessoal, Como citei em mensagem anterior neste post, não estou fazendo spell check automático, a parte automatizada do script que uso é para atualizar e extrair do mapa o extract que preciso para trabalhar, e no fim fazer o upload do resultado. Uso o aspell para o spell check, e toda alteração que faço é manual, nem o replace all eu rodo. Além disso não estou focado em correções de nomes próprios, e sim em outros erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau, e por aí vai. Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo, e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo errado na área de conhecimento dele. Gerald, Ainda não estou convencido de que haja a necessidade de se inserir uma tag em cada nome corrigido, e explico isso. Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o trabalho de contribuição seria muito penoso, e lento, e ainda por cima afastaria os contribuintes, pelo custo-benefício das contribuições. Assim, como entendo estar fazendo a mesma coisa, com a diferença única de trabalhar com lotes de dados, considero que a descrição do changeset seja suficiente. Outra coisa que parece ter ficado mal explicado por mim, eu não estou me preocupando em normalizar a grafia dos nomes usados nas vias, e sim em identificar erros nos nomes digitados. Se for necessário adicionar essas tag em cada elemento, o trabalho adicional que terei ao acrescentar isso ao script tornará o trabalho dispendioso para mim e assim o abandonarei. Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Como já disse, mesmo com todo cuidado, não há como garantir que não haja falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não haveria essa garantia. Volto a registrar que se alguem encontrar algum erro nos meus changesets que os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a isso. Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes. Assim que possível irei publicar o script no fórum do projeto e avisarei por aqui. Att, Marcelo Pereira Em 3 de fevereiro de 2014 15:39, Fernando Trebien fernando.treb...@gmail.com escreveu: Eu também não faria essa correção automática. Você pode estar corrigindo 10% de erros e introduzindo outros 10% de erros novos. Processos automáticos precisam ser muito bem pensados, testados, avaliados com grandes conjuntos de dados E (principalmente) combinados com a comunidade antes de se iniciar o processo. O melhor também seria descrever o processo no wiki, de modo similar ao que se faz com as importações. Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado nas suas correções (algo que poderia não dar caso tivesse contatado a gente), desfazer provavelmente atrapalharia o trabalho de muitas pessoas de uma só vez. 2014-02-03 Gerald Weber gwebe...@gmail.com: Coloque um source:spelling= assim na revisão sabemos o que houve Isso é necessário mesmo ? No próprio changeset isso já está registrado. Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi alterado baseado em grafia de dicionário. Sugiro colocar source:spelling:pt=dictionary quando for trocar para a grafia original e source:spelling:pt=survey sempre que se verificou inequívocamente que a grafia da rua diverge do normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em outras línguas (por exemplo Berlin e Berlim, München e Munique). Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma alteração e olhar todos os changesets um por um no JOSM. Que eu saiba quem usa o iD ficaria sem saber mesmo. 1) como proteger uma grafia que de fato diverge do usual? 2) o que deve valer? o que está na placa ou o que está no dicionário? Se a grafia diverge do usual por um fator da cultura local, não acho que tenha problemas em mante-la. A questão é: como sabemos que a grafia era de fato esta e que não foi um
Re: [Talk-br] spell check
Em 3 de fevereiro de 2014 17:17, Marcelo Pereira pereirahol...@gmail.comescreveu: Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Também acho interessante poder passar o script para corrigir tais erros. ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br
Re: [Talk-br] spell check
Srs, Postei no fórum o script e a explicação do processo, para análise. Att, Marcelo Pereira Em 3 de fevereiro de 2014 17:40, Paulo Carvalho paulo.r.m.carva...@gmail.com escreveu: Em 3 de fevereiro de 2014 17:17, Marcelo Pereira pereirahol...@gmail.comescreveu: Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do Tracksource, e considero isso uma boa forma de contribuir para o projeto, pois já estou acostumado com ele, apesar de chato e repetitivo. Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar gastando mais tempo explicando do que trabalhando no mapa. O processo que uso neste script é quase igual ao usado nos scripts anteriores que usei para substituir as abreviações pelos seus extensos, por exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram publicados no fórum. Também acho interessante poder passar o script para corrigir tais erros. ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br -- ... Edileuz, eu não tem nada a ver com Creuza, É mentira da Ivete, não é meu esse caniveete... Halley, Luiz - Poeta, Cantor, Compsitor ___ Talk-br mailing list Talk-br@openstreetmap.org https://lists.openstreetmap.org/listinfo/talk-br