Ola Manuel,
Benvido
Podes colaborar de varias maneiras, porque o proxecto terá varias
etapas sucesivas
Agora mesmo estamos recollendo frases naturais (non refráns), de
conversa e temática variada para compoñer o corpus de frases que se
teñen que meter no sistema para que a xente as grave.

Por tanto agora o mellor é que nos mandes listas de frases, cantas máis mellor


Como

Engadir frases novas


Toda frase que envíe debe ser baixo a licenza de Dominio Público (CC-0).

Números. Non debería haber ningún díxito no texto fonte porque poden
causar os problemas cando se len en voz alta. O xeito en que se le un
número depende do contexto e podería introducir confusión no conxunto
de datos. Por exemplo, o número “2409” podería ser lido con precisión
tanto como “vinte e catro cero nove” e tamén como “dous mil
catrocentos nove”.

Abreviacións e acrónimos. As abreviacións e os acrónimos como “EE.UU.
ou XEO” deben ser evitados no texto de fonte porque poden ser lidos
nun xeito que non coincide coa súa ortografía. Ademais, pode haber
lecturas múltiplas para unha soa abbreviation. Por exemplo, o XEO “de
acrónimo” podería ser pronunciado “X-E-O” ou como palabra soa; ou a
"etc." pode lerse "etecé" ou "etcétera".

Puntuación. Puntuación e símbolos especiais só terían que ser
incluídos cando é absolutamente necesario. Por exemplo, un apóstrofo é
incluído na palabras inglesas como "don't" ou “we're” e tería que ser
incluído no texto de fonte, mais é improbábel que necesite un símbolo
especial como “@” ou “#.”

Letras estranxeiras. As letras teñen que ser válidas no alfabeto da
lingua que se vai falar. Por exemplo, “ж” é unha letra no alfabeto
ruso mais nunca é utilizado en inglés e así que nunca tería que
aparecer en calquera texto de fonte inglés. En galego teríamos o caso
"ç"

Lonxitude. As frases teñen que ter 14 palabras ou menos.


Podemos engadir que non escribiremos a gheada nin o seseo nas frases
aínda que pretendamos recoller a súa pronuncia na fase de gravación:
Así o "O gato vai no saco", uns leramo como gato e outros como ghato.
E iso é o que queremos, que o motor recoñeza as dúas lecturas como
equivalentes.


Preferimos frases naturais/conversacionais. Ademais, aínda que a
diversidade fonética e a riqueza de vocabulario é importante,
tentaremos gravar as frases tan divertidas como se posíbel. Por tanto,
sería bo se pode tentar manter as frases nun compromiso aceptable
respecto da lingua natural.


Revisión de frases

Asegúrese de que segue os seguintes criterios:


A frase ten que estar escrita ortograficamente.

A frase ten que ser gramaticalmente correcta.

A frase ten que ser pronunciable, un enunciado, sexa afirmativo,
interrogativo, imperativo...

Se a frase cumpre os criterios, prema o botón "si" á dereita.

Se a frase non cumpre os criterios antes indicados, prema o botón
"non" á dereita. Se está inseguro sobre a frase, tamén podes saltala e
avanzar á seguinte.

Se se queda sen frases que revisar, axúdenos recolle máis frases!


Buscando frases que estean en dominio público


Buscalas na Internet


Lembre que necesitamos permiso para publicar as frases, asegúrese
sempre que o texto pertence ao dominio público. Se non hai unha
indicación, contacte coa persoa á que o texto pertence e pregunte se
pode utilizar o seu texto.


Aquí algúns consellos para atopar frases:


As fontes mellores pode buscar son os podcasts, transcricións, guións
de filmes e calquera cousa con potencial de conter conversacións
diarias.

As actas de goberno, os libros e os artigos son tamén bos con todo e
que os textos tenden a ser un pouco máis formais e son menos
preferibles.


Asóciese con individuos ou organizacións locais


Hai moitas organizacións públicas que poderían querer colaborar e xa
ter moitos textos que poden doar ao como dominio público. Contacte con
universidades locais, gobernos e organizacións con fontes abertas para
falar sobre o proxecto e pedirlles a súa axuda.


Expertos lingüistas poden tamén ser de axuda, tente contactar con
facultades lingüísticas locais (tanto para profesores coma con
estudantes) e ver se poden axudar para reunir un conxunto de frases de
son diverso na nosa lingua.


5 de febreiro de 2020

Proxecto Trasno

O sáb., 13 de feb. de 2021 ás 12:15, Manuel Reices
(<[email protected]>) escribiu:
>
> Bo día!
>
> Gustaríame colaborar co proxecto Common Voice.
>
> Como tería que facer?
>
> Un saúdo
>
> - Lista de correo de Proxecto Trasno - Enviar correo a - [email protected]
> - Correo do administrador - [email protected] - de - Proxecto Trasno
> - Cancelar a subscrición  no URL: 
> http://trasno.gal/web?confirm_unsubscribe=indeed&m=7283&h=633e4301fec133bc0d6332e7cb9cfb549d2f8a47&sa=1264894155

- Lista de correo de Proxecto Trasno - Enviar correo a - [email protected]
- Administrador - [email protected] - de - Proxecto Trasno
- Cancelar a subscrición no URL : 
http://trasno.gal/web?confirm_unsubscribe=indeed&m=7285&h=06d87db1e67f49b960e6d55769587dde1112c0f7&sa=1391496753

Responderlle a