20/01/11

Zambolbimiento de recursos lhenguísticos fundamentales pa la lhéngua mirandesa (2)





[Testo salido na Fuolha Mirandesa / Jornal Nordeste de l die 19 de janeiro i que eiqui se deixa por bias de la sue amportança pa la lhéngua mirandesa. Este ye l 2.º de ls quatro testos que stamos a publicar. L 1.º testo fui eiqui publicado l die 13 deste més de las giladas, i que cumben ler para melhor antender l porjeto que stá a ser zambolbido pula Microsoft an parcerie cul ILTEC [Anstituto de Lhenguística Teórica i Cumputacional] i la ALM [Associaçon de Lhéngua Mirandesa].]




TORNAR LA LHÉNGUA MIRANDESA FALADA EIMORTAL, ye l nuosso oujetibo, dixo-mos la doutora Daniela Braga, lhicenciada an studos Pertueses pula Ounibersidade de l Porto, i que zde 2000 a 2006 trabalhou cumo ambestigadora ne l Lhaboratório de Porcessamento de Fala de la Faculdade de Angenharie de l Porto. An 2008 fizo l adoutoramento ouropeu na ária de Síntese de la Fala, pula Ounibersidade de A Corunha. Zde 2006 derige l’eiquipa de Síntese de la Fala i Spanson de Lhénguas de l MLDC - Microsoft Language Development Center, l único centro de zambolbimiento de la Microsoft na ária de la Lhenguaige que hai an to la Ouropa. An atençon a las sues repunsablidades na Microsdoft, preguntemos-le:



Tenendo an cuonta la buossa spriença an porjetos desta natureza, que deficuldades speciales teneis spurmentado cula lhéngua mirandesa quando acumparada cun outras lhénguas para las quales yá fui zambolbido un porjeto aparecido?

L que çtingue este porjeto de outros i que, por esso, l torna specialmente defícele ye la falta de recursos çponibles al ampeço, l que ten a ber cun ser l mirandés ua lhéngua minoritária i cun ua tradiçon de scrita inda mui pequeinha. Nunca deregi un porjeto an que tubíramos de custruir todo de raiç cumo neste causo. An lhenguaige simples, un sistema de síntese de fala ye un cacho de software que premite dezir an boç alta qualquiera testo nua cierta lhéngua. Para fazer un sistema de síntese de fala nua lhéngua son percisos: un léxico fonético cun al menos 100.000 palabras (quier dezir, antradas seguidas de trascriçon fonética, anformaçon de sílaba tónica i de debison silábica i classeficaçon gramatical), l mássimo possible de corpora de testo screbido de bários géneros çcursibos, ua base de dados de fala grabada por un locutor porfissional an stúdio cun al menos 5 mil frases, ua eiquipa cumpuosta por un cordenador de l porjeto, un specialista na lhéngua i un angenheiro i abaluadores sternos que ban a oubir l sistema nas sues bárias fases i a dar-mos oupenion subre la sue culidade. Estas son, podemos dezir, las matérias primas. Apuis seguimos un porcesso yá mui maduro, siempre cula tecnologie de síntese mais abançada, que yá fui spurmentada an 26 lhénguas nacionales i que stá hoije çponible an bários perdutos Microsoft. Léxico i corpora de testo ye l que l mirandés nun tenie i que tubo de ser custruído de raiç. Habie un dicionário an berson anformática de que las antradas serbírun cumo aliçace, mas nun solo nun éran sbercientes cumo l tipo de anformaçon de que percisamos nun eisistie. Por outro lhado, habie bastantes testos an mirandés, mas fui perciso cumberté-los pa l mesmo formato. Quando esto se passa, la pieça fundamental ne ls porjetos ye l lhenguista, que ye l repunsable por criar ls recursos neçairos i «ansinar» las regras de la lhéngua al sistema. José Pedro, l nuosso lhenguista de l mirandés, ten feito un trabalho abselutamente pioneiro, einobador pa l mirandés i heircúleo porque se trata de recursos que eisígen muito coincimiento i muito trabalho. Quanto a esso l mirandés nun ye un causo único: yá deregi porjetos de síntese de fala para outras lhénguas an que tubimos de custruir un léxico quaijeque de raiç, an special l catalan i l dinamarqués, que ampeçórun cun ua lista de arrimado a 50.000 antradas sien mais anformaçones. Mesmo nas lhénguas an que stamos a spera que haba mais recursos, nien siempre l que eisiste ye suberciente, cumo se dou cun l pertués ouropeu, l pertués de l Brasil i l galhego. L pequeinho númaro de falantes pon tamien las speradas deficuldades de achar un grupo de locutores porfissionales i de abaluadores mais pequeinho. Assi i todo, essa lhemitaçon amostrou-se que era solo de númaro, sien nanhun perjuízo pa la culidade. An porjetos antes deste, era normal tenermos un grupo de 12 locutores porfissionales de adonde scolhiemos l melhor apuis de un rigoroso poorcesso de scuolha. Ne l causo de l mirandés, anque solo tubíramos menos candidatos, ls finalistas stan al nible de locutores porfissionales an outras lhénguas, anque nun lo séian. Nun prázio de meio anho speramos tener l purmeiro sistema de fala an mirandés, l que faç cun que todas las pessonas que nel stan ambolbidas síntan que stan a fazer stória i al mesmo tiempo a tornar que la lhéngua mirandesa falada se torne eimortal, de algun modo fixada cun l modo cumo ye falada ne l seclo XXI. Esta sensaçon de fazer stória yá mos acunteciu antes, mas ye mais special neste porjeto puis sentimos que stamos a cuntrebuir berdadeiramente pa la balorizaçon i l anriquecimiento de l nuosso património cultural i lhenguístico.

Daniela Braga derige l’eiquipa de Síntese de la Fala i Spanson de Lhénguas de l MLDC - Microsoft Language Development Center

(Anterbista i traduçon de l testo por Amadeu Ferreira)





3 comentários:

"Scacição" disse...

Son estas amboras que mos fázen tener ainda mais proua de la nuossa lhéngua.
Bien haiades i fuorça a todos ls ambolbidos neste projecto!

ACangueiro disse...

Si ye berdade, nien mos damos cuonta de l trabalho que stá a ser feito i sue grandura. Fuorça a todos i pa delantre ye l feturo!

leonardo antao disse...

Buonas nuites doutora Daniela i buonas nuites Amadeu:

Ye mui recunfortante para nós ls mirandeses, oubir la doutora Daniela Braga dezir que ten por oubjetibo TORNAR LA LHÉNGUA MIRANDESA FALADA EIMORTAL.

Ye motibo de sperança i satisfaçon para todos ls mirandeses oubir la doutora Daniela Braga dezir que l lhenguista de l mirandês, “José Pedro, ten feito un trabalho abselutamente pioneiro, einobador pa l mirandés i heircúleo…” i que “nun prázio de meio anho speramos tener l purmeiro sistema de fala an mirandés, l que faç cun que … la lhéngua mirandesa falada se torne eimortal”

Ye bien berdade qu'assi “stam a cuntrebuir berdadeiramente pa la balorizaçon i l anriquecimiento de l nuosso património cultural i lhenguístico”.

Parabienes Amadeu por esta amportante antrebista i parabienes redobrados a la doutora Daniela Braga i a José Pedro pula sastifaçon, sperança i ansinamientos que mos que mos trasmitiran nesta antrebista.

Un arrochado abraço,
Leonardo