Re: [Talk-br] spell check

2014-02-04 Por tôpico Flavio Bello Fialho
Marcelo,
Boa iniciativa. Como disseste que estás corrigindo tudo a mão e só usas o
script para localizar os potenciais erros, não vejo necessidade de tags
adicionais (acho que até atrapalha).
Em 03/02/2014 13:19, Marcelo Pereira pereirahol...@gmail.com escreveu:

 Srs,

 Postei no fórum o script e a explicação do processo, para análise.

 Att,

 Marcelo Pereira




 Em 3 de fevereiro de 2014 17:40, Paulo Carvalho 
 paulo.r.m.carva...@gmail.com escreveu:




 Em 3 de fevereiro de 2014 17:17, Marcelo Pereira pereirahol...@gmail.com
  escreveu:



 Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
 mapas do Tracksource, e considero isso uma boa forma de contribuir para o
 projeto, pois já estou acostumado com ele, apesar de chato e repetitivo.

 Porém não quero que ele seja motivo para problemas ou que eu tenha que
 ficar gastando mais tempo explicando do que trabalhando no mapa.

 O processo que uso neste script é quase igual ao usado nos scripts
 anteriores que usei para substituir as abreviações pelos seus extensos, por
 exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
 publicados no fórum.


 Também acho interessante poder passar o script para corrigir tais erros.

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --

 ... Edileuz, eu não tem nada a ver com Creuza,
É mentira da Ivete, não é meu esse caniveete...
 Halley, Luiz - Poeta, Cantor, Compsitor

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br


___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-04 Por tôpico Fernando Trebien
Hm ok. Mas como você está conseguindo fazer isso manualmente numa
escala tão grande e tão rápido?

2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
 Fernando, pessoal,

 Como citei em mensagem anterior neste post, não estou fazendo spell check
 automático, a parte automatizada do script que uso é para atualizar e
 extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
 upload do resultado.

 Uso o aspell para o spell check, e toda alteração que faço é manual, nem o
 replace all eu rodo.

 Além disso não estou focado em correções de nomes próprios, e sim em outros
 erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau,
 e por aí vai.

 Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo,
 e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
 errado na área de conhecimento dele.


 Gerald,

 Ainda não estou convencido de que haja a necessidade de se inserir uma tag
 em cada nome corrigido, e explico isso.

 Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não há
 a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o
 trabalho de contribuição seria muito penoso, e lento, e ainda por cima
 afastaria os contribuintes, pelo custo-benefício das contribuições.

 Assim, como entendo estar fazendo a mesma coisa, com a diferença única de
 trabalhar com lotes de dados, considero que a descrição do changeset seja
 suficiente.

 Outra coisa que parece ter ficado mal explicado por mim, eu não estou me
 preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
 identificar erros nos nomes digitados.

 Se for necessário adicionar essas tag em cada elemento, o trabalho adicional
 que terei ao acrescentar isso ao script tornará o trabalho dispendioso para
 mim e assim o abandonarei.

 Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas do
 Tracksource, e considero isso uma boa forma de contribuir para o projeto,
 pois já estou acostumado com ele, apesar de chato e repetitivo.

 Porém não quero que ele seja motivo para problemas ou que eu tenha que ficar
 gastando mais tempo explicando do que trabalhando no mapa.

 O processo que uso neste script é quase igual ao usado nos scripts
 anteriores que usei para substituir as abreviações pelos seus extensos, por
 exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
 publicados no fórum.

 Como já disse, mesmo com todo cuidado, não há como garantir que não haja
 falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não
 haveria essa garantia.

 Volto a registrar que se alguem encontrar algum erro nos meus changesets que
 os inviabilize, podem revertê-los sem dó, não tenho problemas com relação a
 isso.

 Entendo que pela natureza aberta da edição dos dados do OSM, é necessário um
 cuidado redobrado quando da alteração dos dados, e é por isso que eu mesmo
 me cerquei de certas garantias, como NÃO fazer replaces automáticos, e sim
 alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras vezes.

 Assim que possível irei publicar o script no fórum do projeto e avisarei por
 aqui.

 Att,

 Marcelo Pereira



 Em 3 de fevereiro de 2014 15:39, Fernando Trebien
 fernando.treb...@gmail.com escreveu:

 Eu também não faria essa correção automática. Você pode estar
 corrigindo 10% de erros e introduzindo outros 10% de erros novos.

 Processos automáticos precisam ser muito bem pensados, testados,
 avaliados com grandes conjuntos de dados E (principalmente) combinados
 com a comunidade antes de se iniciar o processo. O melhor também seria
 descrever o processo no wiki, de modo similar ao que se faz com as
 importações.

 Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
 nas suas correções (algo que poderia não dar caso tivesse contatado a
 gente), desfazer provavelmente atrapalharia o trabalho de muitas
 pessoas de uma só vez.

 2014-02-03 Gerald Weber gwebe...@gmail.com:
 
  Coloque um source:spelling=
 
  assim na revisão sabemos o que houve
 
 
 
 
 
  Isso é necessário mesmo ? No próprio changeset isso já está registrado.
 
 
  Eu acho necessário sim. Você está dizendo diretamente que aquele nome
  foi
  alterado baseado em grafia de dicionário.
 
  Sugiro colocar
  source:spelling:pt=dictionary
  quando for trocar para a grafia original
 
  e
 
  source:spelling:pt=survey
 
  sempre que se verificou inequívocamente que a grafia da rua diverge do
  normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em
  outras línguas (por exemplo Berlin e Berlim, München e Munique).
 
  Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe
  que
  isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma
  alteração e olhar todos os changesets um por um no JOSM. Que eu saiba
  quem
  usa o iD ficaria sem saber mesmo.
 
 
 
  1) como proteger uma grafia que de fato diverge do usual?
  2) o que deve valer? o que está na placa ou o que está 

Re: [Talk-br] spell check

2014-02-04 Por tôpico Marcelo Pereira
Fernando,

Não entendi a pergunta.

Marcelo Pereira


Em 4 de fevereiro de 2014 13:17, Fernando Trebien 
fernando.treb...@gmail.com escreveu:

 Hm ok. Mas como você está conseguindo fazer isso manualmente numa
 escala tão grande e tão rápido?

 2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
  Fernando, pessoal,
 
  Como citei em mensagem anterior neste post, não estou fazendo spell check
  automático, a parte automatizada do script que uso é para atualizar e
  extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
  upload do resultado.
 
  Uso o aspell para o spell check, e toda alteração que faço é manual, nem
 o
  replace all eu rodo.
 
  Além disso não estou focado em correções de nomes próprios, e sim em
 outros
  erros encontrados como grafias errôneas de nomes comuns, como Aveinda,
 Rau,
  e por aí vai.
 
  Os exemplos que foram descritos aqui, como o caso do JK, foi só um
 exemplo,
  e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
  errado na área de conhecimento dele.
 
 
  Gerald,
 
  Ainda não estou convencido de que haja a necessidade de se inserir uma
 tag
  em cada nome corrigido, e explico isso.
 
  Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua,
 não há
  a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o
  trabalho de contribuição seria muito penoso, e lento, e ainda por cima
  afastaria os contribuintes, pelo custo-benefício das contribuições.
 
  Assim, como entendo estar fazendo a mesma coisa, com a diferença única de
  trabalhar com lotes de dados, considero que a descrição do changeset seja
  suficiente.
 
  Outra coisa que parece ter ficado mal explicado por mim, eu não estou me
  preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
  identificar erros nos nomes digitados.
 
  Se for necessário adicionar essas tag em cada elemento, o trabalho
 adicional
  que terei ao acrescentar isso ao script tornará o trabalho dispendioso
 para
  mim e assim o abandonarei.
 
  Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
 mapas do
  Tracksource, e considero isso uma boa forma de contribuir para o projeto,
  pois já estou acostumado com ele, apesar de chato e repetitivo.
 
  Porém não quero que ele seja motivo para problemas ou que eu tenha que
 ficar
  gastando mais tempo explicando do que trabalhando no mapa.
 
  O processo que uso neste script é quase igual ao usado nos scripts
  anteriores que usei para substituir as abreviações pelos seus extensos,
 por
  exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
  publicados no fórum.
 
  Como já disse, mesmo com todo cuidado, não há como garantir que não haja
  falsos positivos, mas mesmo que o processo fosse feito pelo iD, também
 não
  haveria essa garantia.
 
  Volto a registrar que se alguem encontrar algum erro nos meus changesets
 que
  os inviabilize, podem revertê-los sem dó, não tenho problemas com
 relação a
  isso.
 
  Entendo que pela natureza aberta da edição dos dados do OSM, é
 necessário um
  cuidado redobrado quando da alteração dos dados, e é por isso que eu
 mesmo
  me cerquei de certas garantias, como NÃO fazer replaces automáticos, e
 sim
  alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras
 vezes.
 
  Assim que possível irei publicar o script no fórum do projeto e avisarei
 por
  aqui.
 
  Att,
 
  Marcelo Pereira
 
 
 
  Em 3 de fevereiro de 2014 15:39, Fernando Trebien
  fernando.treb...@gmail.com escreveu:
 
  Eu também não faria essa correção automática. Você pode estar
  corrigindo 10% de erros e introduzindo outros 10% de erros novos.
 
  Processos automáticos precisam ser muito bem pensados, testados,
  avaliados com grandes conjuntos de dados E (principalmente) combinados
  com a comunidade antes de se iniciar o processo. O melhor também seria
  descrever o processo no wiki, de modo similar ao que se faz com as
  importações.
 
  Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
  nas suas correções (algo que poderia não dar caso tivesse contatado a
  gente), desfazer provavelmente atrapalharia o trabalho de muitas
  pessoas de uma só vez.
 
  2014-02-03 Gerald Weber gwebe...@gmail.com:
  
   Coloque um source:spelling=
  
   assim na revisão sabemos o que houve
  
  
  
  
  
   Isso é necessário mesmo ? No próprio changeset isso já está
 registrado.
  
  
   Eu acho necessário sim. Você está dizendo diretamente que aquele nome
   foi
   alterado baseado em grafia de dicionário.
  
   Sugiro colocar
   source:spelling:pt=dictionary
   quando for trocar para a grafia original
  
   e
  
   source:spelling:pt=survey
  
   sempre que se verificou inequívocamente que a grafia da rua diverge do
   normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes
 em
   outras línguas (por exemplo Berlin e Berlim, München e Munique).
  
   Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe
   que
   isto existe. Quer 

Re: [Talk-br] spell check

2014-02-04 Por tôpico Fernando Trebien
A área que o seu spell check cobre é muito grande:
http://www.openstreetmap.org/user/TrevorInserts/history#map

Eu acho pouco provável que você tenha revisado manualmente todos os
erros de português indicados pelo aspell nessas áreas todas. Se eu
estiver enganado, gostaria de conhecer o seu método.

2014-02-04 Marcelo Pereira pereirahol...@gmail.com:
 Fernando,

 Não entendi a pergunta.

 Marcelo Pereira


 Em 4 de fevereiro de 2014 13:17, Fernando Trebien
 fernando.treb...@gmail.com escreveu:

 Hm ok. Mas como você está conseguindo fazer isso manualmente numa
 escala tão grande e tão rápido?

 2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
  Fernando, pessoal,
 
  Como citei em mensagem anterior neste post, não estou fazendo spell
  check
  automático, a parte automatizada do script que uso é para atualizar e
  extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
  upload do resultado.
 
  Uso o aspell para o spell check, e toda alteração que faço é manual, nem
  o
  replace all eu rodo.
 
  Além disso não estou focado em correções de nomes próprios, e sim em
  outros
  erros encontrados como grafias errôneas de nomes comuns, como Aveinda,
  Rau,
  e por aí vai.
 
  Os exemplos que foram descritos aqui, como o caso do JK, foi só um
  exemplo,
  e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
  errado na área de conhecimento dele.
 
 
  Gerald,
 
  Ainda não estou convencido de que haja a necessidade de se inserir uma
  tag
  em cada nome corrigido, e explico isso.
 
  Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua,
  não há
  a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o
  trabalho de contribuição seria muito penoso, e lento, e ainda por cima
  afastaria os contribuintes, pelo custo-benefício das contribuições.
 
  Assim, como entendo estar fazendo a mesma coisa, com a diferença única
  de
  trabalhar com lotes de dados, considero que a descrição do changeset
  seja
  suficiente.
 
  Outra coisa que parece ter ficado mal explicado por mim, eu não estou me
  preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
  identificar erros nos nomes digitados.
 
  Se for necessário adicionar essas tag em cada elemento, o trabalho
  adicional
  que terei ao acrescentar isso ao script tornará o trabalho dispendioso
  para
  mim e assim o abandonarei.
 
  Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
  mapas do
  Tracksource, e considero isso uma boa forma de contribuir para o
  projeto,
  pois já estou acostumado com ele, apesar de chato e repetitivo.
 
  Porém não quero que ele seja motivo para problemas ou que eu tenha que
  ficar
  gastando mais tempo explicando do que trabalhando no mapa.
 
  O processo que uso neste script é quase igual ao usado nos scripts
  anteriores que usei para substituir as abreviações pelos seus extensos,
  por
  exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
  publicados no fórum.
 
  Como já disse, mesmo com todo cuidado, não há como garantir que não haja
  falsos positivos, mas mesmo que o processo fosse feito pelo iD, também
  não
  haveria essa garantia.
 
  Volto a registrar que se alguem encontrar algum erro nos meus changesets
  que
  os inviabilize, podem revertê-los sem dó, não tenho problemas com
  relação a
  isso.
 
  Entendo que pela natureza aberta da edição dos dados do OSM, é
  necessário um
  cuidado redobrado quando da alteração dos dados, e é por isso que eu
  mesmo
  me cerquei de certas garantias, como NÃO fazer replaces automáticos, e
  sim
  alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras
  vezes.
 
  Assim que possível irei publicar o script no fórum do projeto e avisarei
  por
  aqui.
 
  Att,
 
  Marcelo Pereira
 
 
 
  Em 3 de fevereiro de 2014 15:39, Fernando Trebien
  fernando.treb...@gmail.com escreveu:
 
  Eu também não faria essa correção automática. Você pode estar
  corrigindo 10% de erros e introduzindo outros 10% de erros novos.
 
  Processos automáticos precisam ser muito bem pensados, testados,
  avaliados com grandes conjuntos de dados E (principalmente) combinados
  com a comunidade antes de se iniciar o processo. O melhor também seria
  descrever o processo no wiki, de modo similar ao que se faz com as
  importações.
 
  Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
  nas suas correções (algo que poderia não dar caso tivesse contatado a
  gente), desfazer provavelmente atrapalharia o trabalho de muitas
  pessoas de uma só vez.
 
  2014-02-03 Gerald Weber gwebe...@gmail.com:
  
   Coloque um source:spelling=
  
   assim na revisão sabemos o que houve
  
  
  
  
  
   Isso é necessário mesmo ? No próprio changeset isso já está
   registrado.
  
  
   Eu acho necessário sim. Você está dizendo diretamente que aquele nome
   foi
   alterado baseado em grafia de dicionário.
  
   Sugiro colocar
   source:spelling:pt=dictionary
   quando for trocar para 

Re: [Talk-br] spell check

2014-02-04 Por tôpico Arlindo Pereira
Imagino que ele esteja corrigindo esses nomes possivelmente por ordem de ID
- que denota a ordem temporal em que foram mapeadas -, ou por ordem
alfabética, de forma que os itens alterados não necessariamente são
próximos.


[]s
Arlindo

2014-02-04 Fernando Trebien fernando.treb...@gmail.com:

 A área que o seu spell check cobre é muito grande:
 http://www.openstreetmap.org/user/TrevorInserts/history#map

 Eu acho pouco provável que você tenha revisado manualmente todos os
 erros de português indicados pelo aspell nessas áreas todas. Se eu
 estiver enganado, gostaria de conhecer o seu método.

 2014-02-04 Marcelo Pereira pereirahol...@gmail.com:
  Fernando,
 
  Não entendi a pergunta.
 
  Marcelo Pereira
 
 
  Em 4 de fevereiro de 2014 13:17, Fernando Trebien
  fernando.treb...@gmail.com escreveu:
 
  Hm ok. Mas como você está conseguindo fazer isso manualmente numa
  escala tão grande e tão rápido?
 
  2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
   Fernando, pessoal,
  
   Como citei em mensagem anterior neste post, não estou fazendo spell
   check
   automático, a parte automatizada do script que uso é para atualizar e
   extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
   upload do resultado.
  
   Uso o aspell para o spell check, e toda alteração que faço é manual,
 nem
   o
   replace all eu rodo.
  
   Além disso não estou focado em correções de nomes próprios, e sim em
   outros
   erros encontrados como grafias errôneas de nomes comuns, como Aveinda,
   Rau,
   e por aí vai.
  
   Os exemplos que foram descritos aqui, como o caso do JK, foi só um
   exemplo,
   e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
   errado na área de conhecimento dele.
  
  
   Gerald,
  
   Ainda não estou convencido de que haja a necessidade de se inserir uma
   tag
   em cada nome corrigido, e explico isso.
  
   Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua,
   não há
   a necessidade de se incluir esse ou outro tipo de tag, se assim
 fosse, o
   trabalho de contribuição seria muito penoso, e lento, e ainda por cima
   afastaria os contribuintes, pelo custo-benefício das contribuições.
  
   Assim, como entendo estar fazendo a mesma coisa, com a diferença única
   de
   trabalhar com lotes de dados, considero que a descrição do changeset
   seja
   suficiente.
  
   Outra coisa que parece ter ficado mal explicado por mim, eu não estou
 me
   preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
   identificar erros nos nomes digitados.
  
   Se for necessário adicionar essas tag em cada elemento, o trabalho
   adicional
   que terei ao acrescentar isso ao script tornará o trabalho dispendioso
   para
   mim e assim o abandonarei.
  
   Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
   mapas do
   Tracksource, e considero isso uma boa forma de contribuir para o
   projeto,
   pois já estou acostumado com ele, apesar de chato e repetitivo.
  
   Porém não quero que ele seja motivo para problemas ou que eu tenha que
   ficar
   gastando mais tempo explicando do que trabalhando no mapa.
  
   O processo que uso neste script é quase igual ao usado nos scripts
   anteriores que usei para substituir as abreviações pelos seus
 extensos,
   por
   exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
   publicados no fórum.
  
   Como já disse, mesmo com todo cuidado, não há como garantir que não
 haja
   falsos positivos, mas mesmo que o processo fosse feito pelo iD, também
   não
   haveria essa garantia.
  
   Volto a registrar que se alguem encontrar algum erro nos meus
 changesets
   que
   os inviabilize, podem revertê-los sem dó, não tenho problemas com
   relação a
   isso.
  
   Entendo que pela natureza aberta da edição dos dados do OSM, é
   necessário um
   cuidado redobrado quando da alteração dos dados, e é por isso que eu
   mesmo
   me cerquei de certas garantias, como NÃO fazer replaces automáticos, e
   sim
   alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras
   vezes.
  
   Assim que possível irei publicar o script no fórum do projeto e
 avisarei
   por
   aqui.
  
   Att,
  
   Marcelo Pereira
  
  
  
   Em 3 de fevereiro de 2014 15:39, Fernando Trebien
   fernando.treb...@gmail.com escreveu:
  
   Eu também não faria essa correção automática. Você pode estar
   corrigindo 10% de erros e introduzindo outros 10% de erros novos.
  
   Processos automáticos precisam ser muito bem pensados, testados,
   avaliados com grandes conjuntos de dados E (principalmente)
 combinados
   com a comunidade antes de se iniciar o processo. O melhor também
 seria
   descrever o processo no wiki, de modo similar ao que se faz com as
   importações.
  
   Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
   nas suas correções (algo que poderia não dar caso tivesse contatado a
   gente), desfazer provavelmente atrapalharia o trabalho de muitas
   pessoas de uma 

Re: [Talk-br] spell check

2014-02-04 Por tôpico Fernando Trebien
Ah bom, assim faz sentido. É bastante incomum essa forma de edição
(seja manual ou automática), elas geralmente são concentradas em
regiões pequenas.

Posso sugerir quebrar os changesets em regiões menores? Ajudaria na
revisão das alterações, e caso uma reversão for necessária afetaria
menos gente de uma só vez. O ideal seria dividir por cidade, ou pelo
menos por estado. Se você fizesse assim não precisaria dividir por
tipo de via, mas se você ainda achar interessante pra revisão, acho
que só faria sentido dividir em dois grupos: vias tipicamente rurais
(motorway, motorway_link, trunk, trunk_link) e vias tipicamente
urbanas (primary, primary_link, secondary, secondary_link, tertiary,
tertiary_link, residential, unclassified).

Sugeriria ainda colocar no source dos seus changesets um link
permanente (não encurtado) pra esse seu post no fórum. Pode ser muito
útil daqui a alguns anos.

2014-02-04 Marcelo Pereira pereirahol...@gmail.com:
 Fernando,

 Como disse aqui ontem, eu postei no fórum o script e a descrição do
 processo.

 Só faltou o link, taí :

 http://goo.gl/YGF0XG

 Nada além disso.

 Marcelo Pereira


 Em 4 de fevereiro de 2014 16:08, Arlindo Pereira
 openstreet...@arlindopereira.com escreveu:

 Imagino que ele esteja corrigindo esses nomes possivelmente por ordem de
 ID - que denota a ordem temporal em que foram mapeadas -, ou por ordem
 alfabética, de forma que os itens alterados não necessariamente são
 próximos.


 []s
 Arlindo

 2014-02-04 Fernando Trebien fernando.treb...@gmail.com:

 A área que o seu spell check cobre é muito grande:
 http://www.openstreetmap.org/user/TrevorInserts/history#map

 Eu acho pouco provável que você tenha revisado manualmente todos os
 erros de português indicados pelo aspell nessas áreas todas. Se eu
 estiver enganado, gostaria de conhecer o seu método.

 2014-02-04 Marcelo Pereira pereirahol...@gmail.com:
  Fernando,
 
  Não entendi a pergunta.
 
  Marcelo Pereira
 
 
  Em 4 de fevereiro de 2014 13:17, Fernando Trebien
  fernando.treb...@gmail.com escreveu:
 
  Hm ok. Mas como você está conseguindo fazer isso manualmente numa
  escala tão grande e tão rápido?
 
  2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
   Fernando, pessoal,
  
   Como citei em mensagem anterior neste post, não estou fazendo spell
   check
   automático, a parte automatizada do script que uso é para atualizar
   e
   extrair do mapa o extract que preciso para trabalhar, e no fim fazer
   o
   upload do resultado.
  
   Uso o aspell para o spell check, e toda alteração que faço é manual,
   nem
   o
   replace all eu rodo.
  
   Além disso não estou focado em correções de nomes próprios, e sim em
   outros
   erros encontrados como grafias errôneas de nomes comuns, como
   Aveinda,
   Rau,
   e por aí vai.
  
   Os exemplos que foram descritos aqui, como o caso do JK, foi só um
   exemplo,
   e pelo que vi, acertado, pois alguem confirmou que o nome estava
   mesmo
   errado na área de conhecimento dele.
  
  
   Gerald,
  
   Ainda não estou convencido de que haja a necessidade de se inserir
   uma
   tag
   em cada nome corrigido, e explico isso.
  
   Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma
   rua,
   não há
   a necessidade de se incluir esse ou outro tipo de tag, se assim
   fosse, o
   trabalho de contribuição seria muito penoso, e lento, e ainda por
   cima
   afastaria os contribuintes, pelo custo-benefício das contribuições.
  
   Assim, como entendo estar fazendo a mesma coisa, com a diferença
   única
   de
   trabalhar com lotes de dados, considero que a descrição do changeset
   seja
   suficiente.
  
   Outra coisa que parece ter ficado mal explicado por mim, eu não
   estou me
   preocupando em normalizar a grafia dos nomes usados nas vias, e sim
   em
   identificar erros nos nomes digitados.
  
   Se for necessário adicionar essas tag em cada elemento, o trabalho
   adicional
   que terei ao acrescentar isso ao script tornará o trabalho
   dispendioso
   para
   mim e assim o abandonarei.
  
   Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
   mapas do
   Tracksource, e considero isso uma boa forma de contribuir para o
   projeto,
   pois já estou acostumado com ele, apesar de chato e repetitivo.
  
   Porém não quero que ele seja motivo para problemas ou que eu tenha
   que
   ficar
   gastando mais tempo explicando do que trabalhando no mapa.
  
   O processo que uso neste script é quase igual ao usado nos scripts
   anteriores que usei para substituir as abreviações pelos seus
   extensos,
   por
   exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts
   foram
   publicados no fórum.
  
   Como já disse, mesmo com todo cuidado, não há como garantir que não
   haja
   falsos positivos, mas mesmo que o processo fosse feito pelo iD,
   também
   não
   haveria essa garantia.
  
   Volto a registrar que se alguem encontrar algum erro nos meus
   changesets
   que
   os inviabilize, podem revertê-los sem dó, não 

Re: [Talk-br] spell check

2014-02-04 Por tôpico Paulo Carvalho
De repente os erros não são tantos assim, mesmo numa área tão grande.  Acho
que dá para corrigir manualmente uns 200 erros acusados pelo script bem
rápido. 200 erros é muita coisa, certamente eles estarão espalhados numa
área tão grande.


Em 4 de fevereiro de 2014 14:17, Fernando Trebien 
fernando.treb...@gmail.com escreveu:

 Hm ok. Mas como você está conseguindo fazer isso manualmente numa
 escala tão grande e tão rápido?

 2014-02-03 Marcelo Pereira pereirahol...@gmail.com:
  Fernando, pessoal,
 
  Como citei em mensagem anterior neste post, não estou fazendo spell check
  automático, a parte automatizada do script que uso é para atualizar e
  extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
  upload do resultado.
 
  Uso o aspell para o spell check, e toda alteração que faço é manual, nem
 o
  replace all eu rodo.
 
  Além disso não estou focado em correções de nomes próprios, e sim em
 outros
  erros encontrados como grafias errôneas de nomes comuns, como Aveinda,
 Rau,
  e por aí vai.
 
  Os exemplos que foram descritos aqui, como o caso do JK, foi só um
 exemplo,
  e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
  errado na área de conhecimento dele.
 
 
  Gerald,
 
  Ainda não estou convencido de que haja a necessidade de se inserir uma
 tag
  em cada nome corrigido, e explico isso.
 
  Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua,
 não há
  a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o
  trabalho de contribuição seria muito penoso, e lento, e ainda por cima
  afastaria os contribuintes, pelo custo-benefício das contribuições.
 
  Assim, como entendo estar fazendo a mesma coisa, com a diferença única de
  trabalhar com lotes de dados, considero que a descrição do changeset seja
  suficiente.
 
  Outra coisa que parece ter ficado mal explicado por mim, eu não estou me
  preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
  identificar erros nos nomes digitados.
 
  Se for necessário adicionar essas tag em cada elemento, o trabalho
 adicional
  que terei ao acrescentar isso ao script tornará o trabalho dispendioso
 para
  mim e assim o abandonarei.
 
  Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos
 mapas do
  Tracksource, e considero isso uma boa forma de contribuir para o projeto,
  pois já estou acostumado com ele, apesar de chato e repetitivo.
 
  Porém não quero que ele seja motivo para problemas ou que eu tenha que
 ficar
  gastando mais tempo explicando do que trabalhando no mapa.
 
  O processo que uso neste script é quase igual ao usado nos scripts
  anteriores que usei para substituir as abreviações pelos seus extensos,
 por
  exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
  publicados no fórum.
 
  Como já disse, mesmo com todo cuidado, não há como garantir que não haja
  falsos positivos, mas mesmo que o processo fosse feito pelo iD, também
 não
  haveria essa garantia.
 
  Volto a registrar que se alguem encontrar algum erro nos meus changesets
 que
  os inviabilize, podem revertê-los sem dó, não tenho problemas com
 relação a
  isso.
 
  Entendo que pela natureza aberta da edição dos dados do OSM, é
 necessário um
  cuidado redobrado quando da alteração dos dados, e é por isso que eu
 mesmo
  me cerquei de certas garantias, como NÃO fazer replaces automáticos, e
 sim
  alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras
 vezes.
 
  Assim que possível irei publicar o script no fórum do projeto e avisarei
 por
  aqui.
 
  Att,
 
  Marcelo Pereira
 
 
 
  Em 3 de fevereiro de 2014 15:39, Fernando Trebien
  fernando.treb...@gmail.com escreveu:
 
  Eu também não faria essa correção automática. Você pode estar
  corrigindo 10% de erros e introduzindo outros 10% de erros novos.
 
  Processos automáticos precisam ser muito bem pensados, testados,
  avaliados com grandes conjuntos de dados E (principalmente) combinados
  com a comunidade antes de se iniciar o processo. O melhor também seria
  descrever o processo no wiki, de modo similar ao que se faz com as
  importações.
 
  Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
  nas suas correções (algo que poderia não dar caso tivesse contatado a
  gente), desfazer provavelmente atrapalharia o trabalho de muitas
  pessoas de uma só vez.
 
  2014-02-03 Gerald Weber gwebe...@gmail.com:
  
   Coloque um source:spelling=
  
   assim na revisão sabemos o que houve
  
  
  
  
  
   Isso é necessário mesmo ? No próprio changeset isso já está
 registrado.
  
  
   Eu acho necessário sim. Você está dizendo diretamente que aquele nome
   foi
   alterado baseado em grafia de dicionário.
  
   Sugiro colocar
   source:spelling:pt=dictionary
   quando for trocar para a grafia original
  
   e
  
   source:spelling:pt=survey
  
   sempre que se verificou inequívocamente que a grafia da rua diverge do
   normal. Aqui o pt é de protuguês já que uma localidade pode 

[Talk-br] spell check

2014-02-03 Por tôpico Gerald Weber
Oi Pessoal

tem um usuário rodando spell check
http://www.openstreetmap.org/user/TrevorInserts

http://www.openstreetmap.org/changeset/20274327

isto é potencialmente perigoso fazer correções automatizadas assim

alguém conhece este usuário?

abraço

Gerald
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Marcelo Pereira
Eu conheço.

Sou eu.

Marcelo Pereira


Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.com escreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




-- 
-
TImbuSérieA2013
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Gerald Weber
Ah OK Marcelo, nunca ia adivinhar ;)

mas rodar spell check? O que exatamente você está fazendo?

abraço

Gerald


2014-02-03 Marcelo Pereira pereirahol...@gmail.com:

 Eu conheço.

 Sou eu.

 Marcelo Pereira


 Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




-- 

Dr. Gerald Weber

gwebe...@gmail.com

Personal website https://sites.google.com/site/geraldweberufmg/


 Departamento de Física/Universidade Federal de Minas Gerais

Department of Physics/Federal University of Minas Gerais

Campus da Pampulha

Av. Antônio Carlos, 6627, 31270-901 Belo Horizonte, MG, Brazil

mobile: +55-(0)31-96462277 (mudou/changed 02/07/2013)
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico John Packer
Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no
OpenStreetMap, o que está na placa que conta mais.

Mas posso apontar pelo menos um erro que foi corrigido por ele e confirmado
por mim.
Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche
*ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na placa
e realmente é sem o *'c'*. Isso é algo que passou despercebido por um bom
tempo.


Em 3 de fevereiro de 2014 10:05, Marcelo Pereira
pereirahol...@gmail.comescreveu:

 Eu conheço.

 Sou eu.

 Marcelo Pereira


 Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br


___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Marcelo Pereira
Srs,

Eu não estou rodando um spell check automático.

1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik.
2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os
highways=primary )
3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui
significa trabalho manual )
4. Faço o upload do arquivo atualizado usando o upload.py

Gerald,

O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer
alterações em lote no OSM ficasse mais fácil para identificar.

Na descrição que fiz no fórum sobre o processo que rodei no mapa para
trocar as abreviações por suas versões por extenso, eu citei a criação
desas conta.

Esse trabalho de spell check é uma continuidade natural do trabalho acima
citado, pelo menos entendi assim.

John,

  A palavra Kubitschek tem respondido por boa parte das mudanças, dava
para escrever um livro com as versões encontradas. :)

 Vc encontrou o erro consertado em parte da via, provavelmente porque ela
mudou de classificação, de primary para secundary, por exemplo, ou parte
dela é um link, e como estou fazendo o spell check por partes, uma para
cada tipo, é esperado que isso aconteça.

Estou fazendo isso porque encontrei muitos erros de ortografia, isso é
comum num projeto onde muitos contribuem, e com ferramentas que não
fornecem o serviço de correção, ou pelo menos sugestão, de termos inseridos.

Além disso, estou me atendo aos erros mais danosos, como por exemplo os
que podem impedir, ou mesmo dificultar, a pesquisa das vias, como por
exemplo o do Kubitschek citado, ou outro pior, como o Aveinda.

Não estou dizendo que estou fazendo um trabalho perfeito, e por isso pode,
e até deve, haver falsos positivos, mas imagino que valha o custo benefício.

Se for a opinião dominante que este é um trabalho que não deva ser feito,
eu o abandonarei imediatamente, assim como deixo aqui já registrado que
permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM,
se forem verificados erros que os inviabilizem.

Assim como todos os mappers, encontrei um filão de atuação no OSM, e venho
fazendo o melhor para poder ajudar.

Marcelo Pereira





Em 3 de fevereiro de 2014 09:19, John Packer john.pack...@gmail.comescreveu:

 PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só
 uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois).
 Tem que tomar cuidado com isso.


 Em 3 de fevereiro de 2014 10:15, John Packer john.pack...@gmail.comescreveu:

 Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no
 OpenStreetMap, o que está na placa que conta mais.

 Mas posso apontar pelo menos um erro que foi corrigido por ele e
 confirmado por mim.
 Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como Kubitsche
 *ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu verifiquei lá na
 placa e realmente é sem o *'c'*. Isso é algo que passou despercebido por
 um bom tempo.


 Em 3 de fevereiro de 2014 10:05, Marcelo Pereira pereirahol...@gmail.com
  escreveu:

 Eu conheço.

 Sou eu.

 Marcelo Pereira


 Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




-- 
-
TImbuSérieA2013
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico John Packer

 Mas o que acontece se *de fato* a prefeitura fez as placas com Kubitsche
 *ck*? Na placa vai ter uma coisa e no OSM outra?

Neste caso *específico*, tendo *a placa* com um erro de ortografia, eu
colocaria um deles(provavelmente a versão correta) como name, e o que está
na placa como alt_name.


Em 3 de fevereiro de 2014 10:35, Gerald Weber gwebe...@gmail.com escreveu:

 Mas o que acontece se *de fato* a prefeitura fez as placas com Kubitsche
 *ck*? Na placa vai ter uma coisa e no OSM outra?

 E se alguém resolveu imitar o Café Kubitsche*ck* aqui no Brasil?
 http://www.das-neue-kubitscheck.de/ (que nada tem a ver com o
 Presidente), vai corrigir também introduzindo um erro?

 abraço

 Gerald


 2014-02-03 John Packer john.pack...@gmail.com:

 PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só
 uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois).
 Tem que tomar cuidado com isso.


 Em 3 de fevereiro de 2014 10:15, John Packer 
 john.pack...@gmail.comescreveu:

 Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no
 OpenStreetMap, o que está na placa que conta mais.

 Mas posso apontar pelo menos um erro que foi corrigido por ele e
 confirmado por mim.
 Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como
 Kubitsche*ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu
 verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que
 passou despercebido por um bom tempo.


 Em 3 de fevereiro de 2014 10:05, Marcelo Pereira 
 pereirahol...@gmail.com escreveu:

 Eu conheço.

 Sou eu.

 Marcelo Pereira


 Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --

 Dr. Gerald Weber

 gwebe...@gmail.com

 Personal website https://sites.google.com/site/geraldweberufmg/


  Departamento de Física/Universidade Federal de Minas Gerais

 Department of Physics/Federal University of Minas Gerais

 Campus da Pampulha

 Av. Antônio Carlos, 6627, 31270-901 Belo Horizonte, MG, Brazil

 mobile: +55-(0)31-96462277 (mudou/changed 02/07/2013)

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br


___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico John Packer
Marcelo, só pra deixar claro, eu não sou contra essas correções.

É verdade que podem ter falsos positivos, mas como no exemplo que eu citei,
ainda ficaria Kubitschek errado por muito tempo aqui, então eu acho que no
final das contas são mudanças bem-vindas.


Em 3 de fevereiro de 2014 10:43, Marcelo Pereira
pereirahol...@gmail.comescreveu:

 Srs,

 Eu não estou rodando um spell check automático.

 1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik.
 2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os
 highways=primary )
 3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui
 significa trabalho manual )
 4. Faço o upload do arquivo atualizado usando o upload.py

 Gerald,

 O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer
 alterações em lote no OSM ficasse mais fácil para identificar.

 Na descrição que fiz no fórum sobre o processo que rodei no mapa para
 trocar as abreviações por suas versões por extenso, eu citei a criação
 desas conta.

 Esse trabalho de spell check é uma continuidade natural do trabalho acima
 citado, pelo menos entendi assim.

 John,

   A palavra Kubitschek tem respondido por boa parte das mudanças, dava
 para escrever um livro com as versões encontradas. :)

  Vc encontrou o erro consertado em parte da via, provavelmente porque ela
 mudou de classificação, de primary para secundary, por exemplo, ou parte
 dela é um link, e como estou fazendo o spell check por partes, uma para
 cada tipo, é esperado que isso aconteça.

 Estou fazendo isso porque encontrei muitos erros de ortografia, isso é
 comum num projeto onde muitos contribuem, e com ferramentas que não
 fornecem o serviço de correção, ou pelo menos sugestão, de termos inseridos.

 Além disso, estou me atendo aos erros mais danosos, como por exemplo os
 que podem impedir, ou mesmo dificultar, a pesquisa das vias, como por
 exemplo o do Kubitschek citado, ou outro pior, como o Aveinda.

 Não estou dizendo que estou fazendo um trabalho perfeito, e por isso pode,
 e até deve, haver falsos positivos, mas imagino que valha o custo benefício.

 Se for a opinião dominante que este é um trabalho que não deva ser feito,
 eu o abandonarei imediatamente, assim como deixo aqui já registrado que
 permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM,
 se forem verificados erros que os inviabilizem.

 Assim como todos os mappers, encontrei um filão de atuação no OSM, e venho
 fazendo o melhor para poder ajudar.

 Marcelo Pereira





 Em 3 de fevereiro de 2014 09:19, John Packer john.pack...@gmail.comescreveu:

 PS: Acho que vale ressaltar, que nesta avenida Juscelino Kubitschek, só
 uma parte da rua teve seu nome corrigido(eu corrigi o resto da rua depois).
 Tem que tomar cuidado com isso.


 Em 3 de fevereiro de 2014 10:15, John Packer 
 john.pack...@gmail.comescreveu:

 Pois é, eu também achei potencialmente perigoso, pois que eu lembre, no
 OpenStreetMap, o que está na placa que conta mais.

 Mas posso apontar pelo menos um erro que foi corrigido por ele e
 confirmado por mim.
 Tem uma avenida chamada Juscelino Kubitschek aqui, e estava como
 Kubitsche*ck*. O TrevorInserts corrigiu como Kubitsche*k*. Eu
 verifiquei lá na placa e realmente é sem o *'c'*. Isso é algo que
 passou despercebido por um bom tempo.


 Em 3 de fevereiro de 2014 10:05, Marcelo Pereira 
 pereirahol...@gmail.com escreveu:

 Eu conheço.

 Sou eu.

 Marcelo Pereira


 Em 3 de fevereiro de 2014 08:55, Gerald Weber gwebe...@gmail.comescreveu:

 Oi Pessoal

 tem um usuário rodando spell check
 http://www.openstreetmap.org/user/TrevorInserts

 http://www.openstreetmap.org/changeset/20274327

 isto é potencialmente perigoso fazer correções automatizadas assim

 alguém conhece este usuário?

 abraço

 Gerald

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




 --
 -
 TImbuSérieA2013

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br


___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Gerald Weber
Oi Marcelo

obrigado pelos esclarecimentos e pelo trabalho realizado.

Vão aqui algumas sugestões:


2014-02-03 Marcelo Pereira pereirahol...@gmail.com:

 Srs,

 Eu não estou rodando um spell check automático.

 1. Uso o osmupdate para atualizar um mapa do brasil baixado do Geofabrik.
 2. Uso o osmosis para extrair pedaços do mapa ( por exemplo, somente os
 highways=primary )
 3. Rodo o aspell interativamente no arquivo gerado. ( interativamente aqui
 significa trabalho manual )
 4. Faço o upload do arquivo atualizado usando o upload.py


Coloque um source:spelling=

assim na revisão sabemos o que houve



 Gerald,

 O usuário trevorinserts foi uma sugestão do Trebien para que ao fazer
 alterações em lote no OSM ficasse mais fácil para identificar.


Ótimo. Sugiro colocar uma pequena explicação no perfil deste usuário. Do
jeito que está apenas parece um usuário com 1 mês de atividade que resolveu
trocar o mapa do Brasil inteiro ;)



 Na descrição que fiz no fórum sobre o processo que rodei no mapa para
 trocar as abreviações por suas versões por extenso, eu citei a criação
 desas conta.


Estava de férias, acho que perdi o fio da meada desta discussão, pelo que
peço desculpas.


 Se for a opinião dominante que este é um trabalho que não deva ser feito,
 eu o abandonarei imediatamente, assim como deixo aqui já registrado que
 permito a reversão de QUALQUER um dos changesets que inseri no mapa do OSM,
 se forem verificados erros que os inviabilizem.


Sou da opinião que o trabalho deve continuar sim, apenas fui pego de
surpresa e não soube indentificar o usuário.

Ficam apenas 2 perguntas:

1) como proteger uma grafia que de fato diverge do usual?
2) o que deve valer? o que está na placa ou o que está no dicionário?

abraço

Gerald
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Marcelo Pereira
Gerald,

Comentários em vermelho,


 Coloque um source:spelling=

 assim na revisão sabemos o que houve





Isso é necessário mesmo ? No próprio changeset isso já está registrado.


Ótimo. Sugiro colocar uma pequena explicação no perfil deste usuário. Do
 jeito que está apenas parece um usuário com 1 mês de atividade que resolveu
 trocar o mapa do Brasil inteiro ;)


 Atualizarei o perfil desta conta.



 Ficam apenas 2 perguntas:

 1) como proteger uma grafia que de fato diverge do usual?
 2) o que deve valer? o que está na placa ou o que está no dicionário?

   Se a grafia diverge do usual por um fator da cultura local, não acho que
tenha problemas em mante-la.

  Mas acho que esse não é o foco do meu trabalho, por exemplo, toda vez que
encontro Julia, Cesar, Claudio , nas tag, o aspell ( e qq outro editor )
reclama da falta dos acentos, mas mesmo assim não altero por imaginar que
as grafias podem variar.

   Outro exemplo, aqui perto de casa tem uma Rua Doutor Zé Maria, ninguem
saberia encontrar a Rua Doutor José Maria.

   O que estou tentando fazer é corrigir os casos conhecidos, o exemplo do
JK é, para mim, passível de mudança, pois só houve um Presidente
Juscelino Kubitschek,
e o nome dele é esse, independente de como foi escrito nas placas.

   Se vc grafar diferente, está errado.

   Se não for assim, o trabalho de spell check não é possível nos mapas do
OSM, pois qualquer erro poderia ser considerado neologismo ou regionalismo.

   Para mim isso encobertaria os muitos erros que se veem no mapa, podendo
até afastar os possíveis usuários dele.

Marcelo Pereira
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Fernando Trebien
Eu também não faria essa correção automática. Você pode estar
corrigindo 10% de erros e introduzindo outros 10% de erros novos.

Processos automáticos precisam ser muito bem pensados, testados,
avaliados com grandes conjuntos de dados E (principalmente) combinados
com a comunidade antes de se iniciar o processo. O melhor também seria
descrever o processo no wiki, de modo similar ao que se faz com as
importações.

Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
nas suas correções (algo que poderia não dar caso tivesse contatado a
gente), desfazer provavelmente atrapalharia o trabalho de muitas
pessoas de uma só vez.

2014-02-03 Gerald Weber gwebe...@gmail.com:

 Coloque um source:spelling=

 assim na revisão sabemos o que houve





 Isso é necessário mesmo ? No próprio changeset isso já está registrado.


 Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi
 alterado baseado em grafia de dicionário.

 Sugiro colocar
 source:spelling:pt=dictionary
 quando for trocar para a grafia original

 e

 source:spelling:pt=survey

 sempre que se verificou inequívocamente que a grafia da rua diverge do
 normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em
 outras línguas (por exemplo Berlin e Berlim, München e Munique).

 Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que
 isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma
 alteração e olhar todos os changesets um por um no JOSM. Que eu saiba quem
 usa o iD ficaria sem saber mesmo.



 1) como proteger uma grafia que de fato diverge do usual?
 2) o que deve valer? o que está na placa ou o que está no dicionário?

   Se a grafia diverge do usual por um fator da cultura local, não acho que
 tenha problemas em mante-la.


 A questão é: como sabemos que a grafia era de fato esta e que não foi um
 erro do mapeador? Sem verificar no local? Eu não tenho uma solução para este
 problema.

 E como fazemos para avisar que a grafia da rua está correta e que não deve
 ser alterada? Acho que
 source:spelling:pt=survey
 pode ser a solução



Para mim isso encobertaria os muitos erros que se veem no mapa, podendo
 até afastar os possíveis usuários dele.


 Sim e não. O correto seria verificar no local, por exemplo olhando a placa
 da rua, e ver que está lá de fato.

 Exemplo: aqui em BH temos a Rua Passa Tempo, no dicionário você só vai
 achar passatempo, mas o nome da rua é grafado separado mesmo (conferi
 pessoalmente e tenho um amigo que mora nesta rua que confirmou). E note que
 na rua há placas com as duas grafias!

 Eu já tomei tanta supresa com nomes estranhos que eu pensaria duas vezes
 antes de sair corrigindo só me baseando em dicionário, sem verificar com
 cuidado.

 Talvez em casos de dúvidas eu acrescentaria um
 fixme=verificar grafia da rua pessoalmente no local ou em documentos
 oficiais
 ao invés de alterar só baseado no dicionário.

 abraço

 Gerald







 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




-- 
Fernando Trebien
+55 (51) 9962-5409

The speed of computer chips doubles every 18 months. (Moore's law)
The speed of software halves every 18 months. (Gates' law)

___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Marcelo Pereira
Fernando, pessoal,

Como citei em mensagem anterior neste post, não estou fazendo spell check
automático, a parte automatizada do script que uso é para atualizar e
extrair do mapa o extract que preciso para trabalhar, e no fim fazer o
upload do resultado.

Uso o aspell para o spell check, e toda alteração que faço é manual, nem o
replace all eu rodo.

Além disso não estou focado em correções de nomes próprios, e sim em outros
erros encontrados como grafias errôneas de nomes comuns, como Aveinda, Rau,
e por aí vai.

Os exemplos que foram descritos aqui, como o caso do JK, foi só um exemplo,
e pelo que vi, acertado, pois alguem confirmou que o nome estava mesmo
errado na área de conhecimento dele.


Gerald,

Ainda não estou convencido de que haja a necessidade de se inserir uma tag
em cada nome corrigido, e explico isso.

Quando se abre o iD, ou mesmo o JOSM e se atualiza o nome de uma rua, não
há a necessidade de se incluir esse ou outro tipo de tag, se assim fosse, o
trabalho de contribuição seria muito penoso, e lento, e ainda por cima
afastaria os contribuintes, pelo custo-benefício das contribuições.

Assim, como entendo estar fazendo a mesma coisa, com a diferença única de
trabalhar com lotes de dados, considero que a descrição do changeset seja
suficiente.

Outra coisa que parece ter ficado mal explicado por mim, eu não estou me
preocupando em normalizar a grafia dos nomes usados nas vias, e sim em
identificar erros nos nomes digitados.

Se for necessário adicionar essas tag em cada elemento, o trabalho
adicional que terei ao acrescentar isso ao script tornará o trabalho
dispendioso para mim e assim o abandonarei.

Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas
do Tracksource, e considero isso uma boa forma de contribuir para o
projeto, pois já estou acostumado com ele, apesar de chato e repetitivo.

Porém não quero que ele seja motivo para problemas ou que eu tenha que
ficar gastando mais tempo explicando do que trabalhando no mapa.

O processo que uso neste script é quase igual ao usado nos scripts
anteriores que usei para substituir as abreviações pelos seus extensos, por
exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
publicados no fórum.

Como já disse, mesmo com todo cuidado, não há como garantir que não haja
falsos positivos, mas mesmo que o processo fosse feito pelo iD, também não
haveria essa garantia.

Volto a registrar que se alguem encontrar algum erro nos meus changesets
que os inviabilize, podem revertê-los sem dó, não tenho problemas com
relação a isso.

Entendo que pela natureza aberta da edição dos dados do OSM, é necessário
um cuidado redobrado quando da alteração dos dados, e é por isso que eu
mesmo me cerquei de certas garantias, como NÃO fazer replaces automáticos,
e sim alterar caso a caso, mesmo que a mesma palavra se repetisse inúmeras
vezes.

Assim que possível irei publicar o script no fórum do projeto e avisarei
por aqui.

Att,

Marcelo Pereira



Em 3 de fevereiro de 2014 15:39, Fernando Trebien 
fernando.treb...@gmail.com escreveu:

 Eu também não faria essa correção automática. Você pode estar
 corrigindo 10% de erros e introduzindo outros 10% de erros novos.

 Processos automáticos precisam ser muito bem pensados, testados,
 avaliados com grandes conjuntos de dados E (principalmente) combinados
 com a comunidade antes de se iniciar o processo. O melhor também seria
 descrever o processo no wiki, de modo similar ao que se faz com as
 importações.

 Sua iniciativa é louvável, Marcelo, mas se por acaso algo der errado
 nas suas correções (algo que poderia não dar caso tivesse contatado a
 gente), desfazer provavelmente atrapalharia o trabalho de muitas
 pessoas de uma só vez.

 2014-02-03 Gerald Weber gwebe...@gmail.com:
 
  Coloque um source:spelling=
 
  assim na revisão sabemos o que houve
 
 
 
 
 
  Isso é necessário mesmo ? No próprio changeset isso já está registrado.
 
 
  Eu acho necessário sim. Você está dizendo diretamente que aquele nome foi
  alterado baseado em grafia de dicionário.
 
  Sugiro colocar
  source:spelling:pt=dictionary
  quando for trocar para a grafia original
 
  e
 
  source:spelling:pt=survey
 
  sempre que se verificou inequívocamente que a grafia da rua diverge do
  normal. Aqui o pt é de protuguês já que uma localidade pode ter nomes em
  outras línguas (por exemplo Berlin e Berlim, München e Munique).
 
  Já pesquisar pelo changeset é mais complicado e nem todo usuário sabe que
  isto existe. Quer dizer, você tem que primeiro desconfiar que houve uma
  alteração e olhar todos os changesets um por um no JOSM. Que eu saiba
 quem
  usa o iD ficaria sem saber mesmo.
 
 
 
  1) como proteger uma grafia que de fato diverge do usual?
  2) o que deve valer? o que está na placa ou o que está no dicionário?
 
Se a grafia diverge do usual por um fator da cultura local, não acho
 que
  tenha problemas em mante-la.
 
 
  A questão é: como sabemos que a grafia era de fato esta e que não foi um
  

Re: [Talk-br] spell check

2014-02-03 Por tôpico Paulo Carvalho
Em 3 de fevereiro de 2014 17:17, Marcelo Pereira
pereirahol...@gmail.comescreveu:



 Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas
 do Tracksource, e considero isso uma boa forma de contribuir para o
 projeto, pois já estou acostumado com ele, apesar de chato e repetitivo.

 Porém não quero que ele seja motivo para problemas ou que eu tenha que
 ficar gastando mais tempo explicando do que trabalhando no mapa.

 O processo que uso neste script é quase igual ao usado nos scripts
 anteriores que usei para substituir as abreviações pelos seus extensos, por
 exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
 publicados no fórum.


Também acho interessante poder passar o script para corrigir tais erros.
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br


Re: [Talk-br] spell check

2014-02-03 Por tôpico Marcelo Pereira
Srs,

Postei no fórum o script e a explicação do processo, para análise.

Att,

Marcelo Pereira




Em 3 de fevereiro de 2014 17:40, Paulo Carvalho 
paulo.r.m.carva...@gmail.com escreveu:




 Em 3 de fevereiro de 2014 17:17, Marcelo Pereira 
 pereirahol...@gmail.comescreveu:



 Me interesso em continuar a fazer isso no OSM, pois assim o fiz nos mapas
 do Tracksource, e considero isso uma boa forma de contribuir para o
 projeto, pois já estou acostumado com ele, apesar de chato e repetitivo.

 Porém não quero que ele seja motivo para problemas ou que eu tenha que
 ficar gastando mais tempo explicando do que trabalhando no mapa.

 O processo que uso neste script é quase igual ao usado nos scripts
 anteriores que usei para substituir as abreviações pelos seus extensos, por
 exemplo, Dr. Prof, Av. Trav, e por aí vai. Nesse caso o scripts foram
 publicados no fórum.


 Também acho interessante poder passar o script para corrigir tais erros.

 ___
 Talk-br mailing list
 Talk-br@openstreetmap.org
 https://lists.openstreetmap.org/listinfo/talk-br




-- 

... Edileuz, eu não tem nada a ver com Creuza,
   É mentira da Ivete, não é meu esse caniveete...
Halley, Luiz - Poeta, Cantor, Compsitor
___
Talk-br mailing list
Talk-br@openstreetmap.org
https://lists.openstreetmap.org/listinfo/talk-br