Volvemos á carga, logo! Lembrades que vos falei do proxecto Common Voice? Pois xa está en marcha! https://commonvoice.mozilla.org/gl
Se recordades faleivos de que nesta fase cumpría recoller 5000 frases, de todo tipo e rexistro, en galego: 1. A frase debe estar escrita correctamente 2. A frase debe ser gramaticalmente correcta 3. A frase debe ser pronunciable e tan natural como sexa posible 4. Cada frase non debe superar as 14 palabras - todas as frases incorporaranse con licenza de dominio público (por tanto, teñen que ser ou espontáneas ou compatibles) - non deben conter números (en guarismos), nin abreviacións, nin acrónimos - puntuación só a imprescindible (nada de @, #...) - que non conteñan letras de alfabeto que non sexa o galego (“ж” do ruso por exemplo) Ollo! non se poden coller frases da Wikipedia (só 3 por artigo) Agradecería que me mandásedes as que poidades, se son 1000 mellor que 50, que tamén serán moi benvidas :-D O segundo paso será validalas, unha a unha por xente competente (profesores, lingüistas, mesmo estudantes...). Cada frase candidata deberá ser validada polo menos por 3 persoas diferentes. Cando academos as 5000, abrirán o sistema para gravar as voces (tan variadas en acentos e falas como sexa posible) e por tanto será unha fase xa moi pública e que necesitará toda unha campaña de difusión. Non podo dicir agora cantas gravacións de cada frase serán necesarias para acadar a calidade necesaria do sistema pero serán necesarias moitas persoas a doar a voz. Lembrades que vos falei do proxecto Common Voice? Pois xa está en marcha! https://commonvoice.mozilla.org/gl Se recordades faleivos de que nesta fase cumpría recoller 5000 frases, de todo tipo e rexistro, en galego: 1. A frase debe estar escrita correctamente 2. A frase debe ser gramaticalmente correcta 3. A frase debe ser pronunciable e tan natural como sexa posible 4. Cada frase non debe superar as 14 palabras - todas as frases incorporaranse con licenza de dominio público (por tanto, teñen que ser ou espontáneas ou compatibles) - non deben conter números (en guarismos), nin abreviacións, nin acrónimos - puntuación só a imprescindible (nada de @, #...) - que non conteñan letras de alfabeto que non sexa o galego (“ж” do ruso por exemplo) Ollo! non se poden coller frases da Wikipedia (só 3 por artigo) Agradecería que me mandásedes as que poidades, se son 1000 mellor que 50, que tamén serán moi benvidas :-D O segundo paso será validalas, unha a unha por xente competente (profesores, lingüistas, mesmo estudantes...). Cada frase candidata deberá ser validada polo menos por 3 persoas diferentes. Cando academos as 5000, abrirán o sistema para gravar as voces (tan variadas en acentos e falas como sexa posible) e por tanto será unha fase xa moi pública e que necesitará toda unha campaña de difusión. Non podo dicir agora cantas gravacións de cada frase serán necesarias para acadar a calidade necesaria do sistema pero serán necesarias moitas persoas a doar a voz. [image: image.png] ---------- Forwarded message --------- De: Antón Méixome <[email protected]> Date: xov., 21 de mar. de 2019 ás 11:06 Subject: Common Voice To: Lista de correo de Proxecto Trasno <[email protected]> Como algún sabedes, estamos a promover un proxecto de colaboración con Mozilla a medio prazo que deberá implicar a moita xente para crear a primeira base de datos libre de rexistro de voces en lingua galega, fundamental para o desenvolvemento e aplicación en galego das tecnoloxías que permiten a existencia dos conversores de texto a voz, os asistentes dixitais, a voz sintética, a interacción e conversa mediante a voz con dispositivos, IoT e demais. Para Trasno trátase dun proxecto novidoso e creo que somos a mellor opción dentro do mundo dos Guls para sacalo adiante porque somos os que tratamos coa lingua máis a fondo. Para poder lanzar o proxecto Common Voice de Mozilla, necesítase recoller como mínimo unhas 5000 frases en texto. A interface web do sistema xa está traducida pero necesítase andar varias fases máis antes de sacalo ao público. Ese repertorio de frases escritas é o que deben ler en voz alta os participantes para rexistrar a súa voz. Con esas voces adéstrase o sistema de intelixencia artificial que debe interpretar a fala da persoa. Son moitas Creo que será conveniente recollelas nunha folla de cálculo, antes de entregalas ao proxecto porque aínda non teño claro o procedemento nin a interface que utilizar e sempre será conveniente que fagamos unha autorevisión para que cumpran as normas, sobre todo ortográficas e de puntuación. Pídovos que vaiades facendo a vosa lista; de cada un trasnego unhas 100, polo menos. É moi importante que a fonte da frase sexa absolutamente libre (non valen da Wikipedia) e que se cedan ao dominio público. É importante que sexan en estilo coloquial ou neutral (non académico, nin artístico) É recomendable que teñan sentido para que ao lelas en voz alta, os voluntarios poidan darlle a entoación adecuada. Como se busca a variedade de acentos é conveniente que traten sobre temas da vida corrente, onde resulta máis doado ser natural. De aquí a uns días, podo concretar máis. Mentres tanto, se tedes algo que achegar ou ideas ou ofertas concretas de colaboración, etc. pois este é o mellor momento. Antón Méixome - Lista de correo de Proxecto Trasno - Enviar correo a - [email protected] - Administrador - [email protected] - de - Proxecto Trasno - Cancelar a subscrición no URL : http://trasno.gal/web?confirm_unsubscribe=indeed&m=7168&h=2bf0cdd55a1a3b4cce8503d06e4110f23667d30e&sa=931159194
