Borrar
Adimen artifizialari buruzko bideoak liluratuta utzi zituen agintari eta enpresetako arduradunak Euskorpusen aurkezpenean. F. De la Hera
Euskararen bihotzari corpus digitala jartzera dator Euskorpus ekimena
Teknologia eta hizkuntza

Euskararen bihotzari corpus digitala jartzera dator Euskorpus ekimena

Ekimen honek adimen artifizialaren eta hizkuntzaren teknologien potentzial osoa euskal hizkuntzaren zerbitzura jartzea du xede lankidetza publiko-pribatuaren bidez

Gaizka Lasa

Donostia

Miércoles, 19 de febrero 2025, 11:27

Euskarak baditu hiztunak eta komunitate baten bizi nahia. Bihotza, alegia. Gorputza jarri behar orain. Corpusa. Garai hauetan, digitala noski. Horretarako sortu da Euskorpora elkartea. Gero eta gehiago erabiltzen ditugun tresna teknologikoetan gure hizkuntza ere erabili ahal izateko. Lan asko dago helburu hori lortzeko, beste hizkuntzekiko arrakala ez baita nolanahikoa, baina nonbaitetik hasi behar eta Euskorpus proiektua jarri du abian lankidetza publiko-pribatuaren bidez eratu berri den talde honek.

Azken batean, Euskorpusi esker, euskarazko datu-paketeak garatuko dira, fabrikatzaileek internetera konektatutako gailuetan inportatu ahal izan ditzaten, euskaraz funtzionatzeko gaitasuna emanez. Horrela, smartphoneek, tabletek, smartwatchek, aplikazioek edo laguntzaile digitalek -hala nola Sirik eta Alexak- erabiltzaileekin euskaraz elkarreragiteko gaitasuna izango dute, adimen artifiziala euskalduntzeko prozesu batekin, Adimen Artifizialeko tresnen erabiltzaileek hizkuntza horretan erabili ahal izan ditzaten.

Etxe askotan arruntak dira halako galderak, gero eta gehiagotan umeen edota aitona-amonen artean gainera. «Alexa, esadazu zein eguraldi egingo duen gaur». Eta makinaren erantzuna, gaur-gaurkoz, beti bera: «Lo siento, no entiendo lo que dices». Bada, hori aldatzera dator, besteak beste, proiektu hau.

Lehendakariak ere goizetan familia agurtzeko whatsapp taldea erabiltzen du eta hitzorduetara garaiz iristeko baita nabigatzailea ere. Hala onartu zuen atzo. Zergatik ez euskaraz? Argi dauka berak: «Euskarak tren honetan presente egon behar du, bai ala bai». Imanol Pradalesek azpimarratu zuenez, «Euskorpusek, adimen artifizialaren eta hizkuntzaren teknologien potentzial osoa euskararen, gure enpresen eta ikerketaren zerbitzura jarriko du. Horretarako, gure gaitasun guztiak lerrokatuko ditugu, lankidetza publiko-pribatuaren bidez, euskarazko testuen corpus digitala hobetzeko».

5,5 milioiko aurrekontua

Hitz gutxitan esateko, adimen artifizialaren eta datuaren kudeaketaren euskal ekosistema dinamizatu nahi da. Haatik, asmo potoloak ezinbestean diru-iturria eskatzen du eta Industria, Trantsizio Energetiko eta Jasangarritasunaren Sailaren bidez, 5,55 milioi euroko hasierako aurrekontu-zuzkidura du proiektuak. 2025erako 2 milioi euro esleituta ditu, eta 2026rako beste 3 milioi. Gainera, Kultura eta Hizkuntza Politika Sailak eta Zientzia, Unibertsitate eta Berrikuntza Sailak ere parte hartzen dute proiektuan, 550.000 euroko ekarpena eginez hasieran.

Euskorporako presidente Julian Florezek nabarmendu zuenez, «ingurune digital berrietan euskararen presentzia zaintzeko ardura eta betebeharra dugu, baita adimen artifizialeko sistemen eta euskararen zerbitzura dauden hizkuntzaren teknologien ahalmen guztia aprobetxatzekoa ere. Hori da gure apustua, erronka handia da, eta badakigu gauzak nola egin, eta horretarako ondo kokatuta gaude».

Era berean, Vicomtecheko Ahotsa eta Hizkuntza Naturala Prozesatzeko Teknologien zuzendari Arantza del Pozok azpimarratu zuenez, «hizkuntza-baliabideak modu koordinatuan biltzea funtsezkoa da euskaraz hizkera eta hizkuntzako teknologien garapena bultzatzeko, eta horrela, mundu digitalean beste hizkuntzen maila berean egotea bermatzeko».

Arantzak azaldu zuenez, gurea «baliabide urriko hizkuntza da» eta «datuak giltzarri dira». Gaztelania edo ingelesaren edukietatik urrun dago oraindik euskara, baina hori ez da geldik egoteko aitzakia eta Euskorporak jarri ditu asmo handiko adierazleak plan estrategikoan. Mila ordu pasatxoko corpusa dago gaur egun ahozko mezuetan eta 2030erako 40.000 izatea nahi dute, saltoa kualitatiboa ez ezik kuantitatiboa ere izan dadin. Elkarteak egoitza nagusia Miramongo Parke Teknologikoan izango du eta hamabost pertsonako lantaldea osatzen ari da.

Euskararen corpus digitala hiru fase nagusitan gauzatuko da: lehenengo fasea plangintzarena eta definizioarena izango da, eta bertan corpusaren tipologia eta garatu beharreko ereduak zehaztuko dituen bulego teknikoa eratuko da. Bigarren fasean, euskarazko corpus linguistikoen bilduma bultzatu, kode irekien oinarrizko ereduen garapena bultzatu, eta biltegiratze segururako, saiakuntzetarako eta balidaziorako azpiegiturak bultzatu nahi dira. Azkenik, hirugarren fasean, biltzen diren hizkuntza-corpusak eta kode irekiko oinarrizko ereduak enpresetara, gizartera eta Europako beste datu-plataforma batzuetara transferitzea eta bertan ustiatzea bultzatuko da.

Azken finean, euskararen bihotzari gorputza jarri behar zaio eta hezur-haragi horiek digitalak behar dute etorkizunean.

Euskorpus proiektua aurkezteko ekitaldiaren aurretik, Euskorpora elkarteak batzarra egin du. Bertan, enpresa berriek bat egin dute elkartearekin, eta horrela geratu da elkartea osatzen duten enpresa eta erakunde publiko zein pribatuen zerrenda: Vicomtech, EREIL Technologies SL, TREBE Language Technologies, Euskaltzaindia, Eusko Jaurlaritza, Baleuko, MIXER, EiTB, CAF, MCC, Petronor, Euskaltel Fundazioa, Kutxabank, PWC, eta Logikaline.

Esta funcionalidad es exclusiva para suscriptores.

Reporta un error en esta noticia

* Campos obligatorios

diariovasco Euskararen bihotzari corpus digitala jartzera dator Euskorpus ekimena