26/01/11

Zambolbimiento de recursos lhenguísticos fundamentales pa la lhéngua mirandesa (3)

José Pedro Ferreira



[Testo salido na Fuolha Mirandesa / Jornal Nordeste de l die 25 de janeiro i que eiqui se deixa por bias de la sue amportança pa la lhéngua mirandesa. Este ye l 3.º de ls quatro testos que stamos a publicar. L 1.º testo fui eiqui publicado l die 13 deste més de las giladas i l 2º ne l die 19. Cumben ler ou reler ls dous testos para melhor antender l porjeto que stá a ser zambolbido pula Microsoft an parcerie cul ILTEC [Anstituto de Lhenguística Teórica i Cumputacional] i la ALM [Associaçon de Lhéngua Mirandesa].]




Zambolbimiento de recursos lhenguísticos fundamentales pa la lhéngua mirandesa (cont.)

Cuntinamos hoije a apersentar las repuostas a las preguntas que fazimos a respeito de l grande porjeto que stá a ser zambolbido an cunjunto pula Microsoft, l ILTEC (Anstituto de Lhenguística Teórica i Cumputacional). L testo que hoije apersentamos fui screbido por Jesé Pedro Ferreira lhicenciado an lhenguística pula Faculdade de Letras de l'Ounibersidade de Lisboa an 2006. Zde ende ten trabalhado an bárias anstituiçones de ambestigaçon nessa área, L Centro de Lhenguística de l'Ounibersidade de Lisboua (CLUL), l Anstituto de Lhenguística Teórica e Cumputacional (ILTEC) i la ALM (Associaçon de Lhéngua Mirandesa) ne ls redadeiros meses ne l Centro Microsoft pa l Zambolbimento de la Lhenguaige. Tamien dá classes de lhenguística na Scuola Superior de Salude de l Alcoitão. Trabalhou subretodo subre l pertués, na custrucion de corpora, léxicos i ferramientas lhenguísticas, mas nunca deixou de ir fazendo tamien cousas subre l mirandés: recuolhas, un dicionairo (cun Amadeu Ferreira), çcriçones lhenguísticas de base i outros studos. Afuora l porjeto de que eiqui falamos, stá a acabar alguns recursos lhenguísticos de base pa l mirandés que saliran deiqui a pouco tiempo. Anque seia mui nuobo, José Pedro Ferreira apersenta-se cumo un de ls mirandeses que melhor domina la nuossa lhéngua an termos científicos i que mais cuntributos le ten dados nesses domínios.

Eiqui queda la pergunta que le fazimos i la repuosta que mos screbiu.


Puodes-mos çcrebir las percipales caratelísticas de l porjeto an que stás ambolbido, quanto a la lhéngua mirandesa, i quando ye que las pessonas l ban a coincer?


L resultado deste porjeto bai a ser un aparato degital que cunsigue ler qualquiera testo screbido an mirandés ne l cumputador. Mas antes de chegarmos ende hai que fazer muita cousa. Purmeiro, hai que amanolhar un riestra buona de testos an mirandés, que al todo subírtan un milhon de formas (un 'corpus'). Apuis, hai que fazer ua lista lharga de palabras de l mirandés (arrimado a cien mil) cula sue categorie gramatical, la debison an sílabas i l assento marcado. Al fin, hai que streformar essas palabras todas an trascriçon fonética i rebé-la a la mano, pa que quede registrado nessa base de dados cumo sona cada palabra an mirandés. Ls dados que fúren feitos pa l porjeto ban a ser puostos na Anternete pa que outros puodan resolber dúbedas que le aparéçan ou fazer studos própios.

Mas na fin l que se quier ye que essas palabras séian lidas pul cumputador: para esso, hai que treminar qual bai a ser la boç que bamos a oubir ler ls nuossos testos, la boç de l mirandés. Yá tenemos andado a fazer la scuolha, culas purmeiras grabaçones - tubimos muita repuosta -, i yá se fizo la scuolha. Las pessonas scolhidas ban a ler ua buona parba de las frases que ajuntemos ne l purmeiro passo (ne l tal 'corpus'). Apuis pon-se anriba desso todo uas aplicaçones anformáticas que fazimos ne l MLDC i, cun esto todo, qualquiera testo que scríbamos puode ser apuis lido cula boç que fur scolhida.

L porjeto ampeçou an júlio i yá bai a tener ls purmeiros resultados an abril d'astanho, anque cuntínemos apuis inda un cacho mais pa que quede todo bien apilarado. Spero que a las pessonas le guste l resultado.

Testo screbido por José Pedro Ferreira

Pregunta i antroducion por Amadeu Ferreira




2 comentários:

leonardo antao disse...

Buonas nuites José Pedro,

Gustei muito de saber que stais a fazer un trabalho de grande amportança neste porjeto cunjunto de custruçon de un aparato degital que cunsigue ler qualquiera testo screbido an mirandés ne l cumputador.

Parabienes i ls maiores sucessos para bós i para todos ls partecipantes neste porjeto que speramos que muito cuntribuirá pa l zambolbimiento de la lhéngua mirandesa.

Un abraço,
Leonardo

ACangueiro disse...

Nun tengo dubedas que bai quedar mui bien apilarado!
Son muitas horas, muitos dies a fazer todo l trabalho que bai fazer cun la lhéngua biba mais uns buonos manolhos de anhos.

Abraço,
ac