Informatika Fakultateko IXA taldea, itzulpen perfektuaren bila

IXA taldea osatzen duten hainbat kide. Guztira hamabi laguneko lan taldea da./
IXA taldea osatzen duten hainbat kide. Guztira hamabi laguneko lan taldea da.

EHU/UPV-ko irakasleak, Europako zortzi erakunderen partzuergoan, kalitatezko itzulpen automatikoa lantzen ari dira, hainbat hizkuntzatan eskaintzen diren laguntza teknikoko zerbitzuetan

M.I.donostia

"Testu bat beste hizkuntza batera itzuli behar zuela, nor ez da desesperatu edo nork ez du, gutxienez, irribarre egin, sarean dauden itzultzaileen emaitzak ikusita?", galdetu du ohar batean Euskal Herriko Unibertsitateko Gipuzkoako campuseko prentsa zerbitzuak, itzulpen automatikorako baliabideak erabili dituen edonork egin duen galdera berbera errepikatuz. Oharrak, dena den, fenomeno irrigarri (edo amorragarri) horren zergatia ere azaltzen du: "Egungo itzulpen automatikoen arazoa itzulpenen literaltasuna da; hau da, aplikazioak literalki itzultzen du hitza, bere esanahia edo perpausaren sintaxia aintzat hartu gabe". Eta aurreratzen du soluzioa bidean dela: "Egoera hori nabarmen hobe daiteke, partzuergo bat egiten ari den lanari esker: Portugaleko enpresa teknologiko batek eta Europako zazpi unibertsitatek osatzen dute partzuergoa, eta horien artean dago Euskal Herriko Unibertsitatea, Informatika Fakultatearen irakasle hauen bidez: Eneko Agirre, Gorka Labaka, Nora Aranberri, Arantxa Otegi, Mikel Artetxe, Ander Barrena, Koldo Gojenola, Mikel Lersundi, Josu Goikoetxea, Arantza Diaz de Ilarraza, Iñaki Alegria eta Kepa Sarasola -ikastegiko dekanoa".

Zortzi hizkuntza

QTLeap (Quality Translation by Deep Language Engineering Approaches) proiektuaren helburua da (Europako Batzordearen hiru milioi euroko finantzazioa izan du hiru urterako) metodologia berritzaile bat ikertzea eta sortzea, zortzi hizkuntzaren itzulpen automatikoa lortzeko: euskara, gaztelania, ingelesa, portugesa, alemana, txekiera, bulgariera eta nederlandera. Kalitate handiagoko itzulpenak lortu nahi dira. "Zientzia ikerketako proiektu anbiziotsuenetako bat da, azken urteotan itzulpen automatikoaren eta hizkuntzaren teknologien esparruan egin direnen artean", azaldu du ikerketaren koordinatzaile zientifikoak, António Brancok (Lisboako Unibertsitatea).

Lanak lehenengo urterako helburua lortu du: itzulpen sistema bat agertoki erreal batean aplikatzea; zehazki, Portugaleko HF (Higher Fuctions) enpresak eskaintzen duen informatikako laguntza teknikoko zerbitzuan. Enpresa hori partzuergoko kide da.

"Itzulpen automatikoaren bidez PCmedic deritzan on-line kontsultoria enpresaren errendimendua hobetu dugu. Bi urte barru, proiektua bukatzean, are lagungarriagoa izango da, informazio linguistiko sakonagoa erabiliko dugu eta", dio Eneko Agirre irakasle eta UPV/EHUko baitan proiektuaren buruak.

Baina zertan datza proiektu berri honek? "Interneten bidez, txat batekin, erabiltzaileak informatika arazo bat aurkezten dio aplikazioari, lantzen ditugun hizkuntzetako batean. Aplikazioak arazoaren irtenbidea bilatzen du bere datu basean, eta galdera egiteko erabilitako hizkuntza berberean erantzuten du; hau da, galdera euskaraz egiten bada, erantzuna ere euskaraz emango da", azaldu du Kepa Sarasolak, UPV/EHUko Informatika Fakultateko dekanoak eta proiektuko ikertaldeko kideak. Beraz, zein da berrikuntza? "Egungo itzultzaile automatikoek, oro har, ez dituzte aintzat hartzen hitzen esanahia eta perpausaren sintaxia. Hitz bat hartu eta literalki itzultzen dute. Esate baterako, 'la ministra Pilar del Casillo' itzultzean, 'gazteluaren zutabe ministroa' ematen dute, izen propio bat dela aintzat hartu gabe. Gu harago goaz: lanean ari gara, itzulpen automatikoko sistemak, hitz egokiak bilatzeaz gain, hitz horiek perpausean zuzen ordena ditzan, arreta berezia jarriz izen berezietan. Horrela, kalitate eta zehaztasun handiagoko itzulpenak lortuko ditugu", azpimarratu du Sarasola irakasleak.

Prozedura soila da. Itzuli beharreko hitzak hartzen ditu sistemak, eta bere datu basean bilatzen du, hainbat testuren artean, zein beste hitzekin konbinatu ohi diren. Ondoren, konbinazio horien arabera ordenatzen ditu perpausean, esanahia ere aintzat hartuta. Zerbitzu honen ebaluazioak % 60ko gogobetetzea erakutsi du; hau da, sistema erabili duten gehienek uste dute erantzun egokia behar den bezala jaso dutela, galdera egin zen jatorrizko hizkuntzan.

 

Fotos

Vídeos