Diario Vasco

Xuxen 5-en marra gorri, berde eta urdinak

Leire Cancio, Xabier Artola eta Itziar Cortés, Elhuyarren egoitzan egin den aurkezpenean.
Leire Cancio, Xabier Artola eta Itziar Cortés, Elhuyarren egoitzan egin den aurkezpenean. / DV
  • Hiztegietako azken aldaketak sartu eta erregela gramatikalak berritu dizkiote, ortografia-akatsak zuzentzeaz gain proposamen lexiko eta gramatikalak ere egiten dituen zuzentzailearen azken bertsioari

Asko aldatu dira gauzak orain dela hogei urte baino gehiago hizkuntzaren tratamendu automatikoan lan egiten duen Euskal Herriko Unibertsitateko IXA taldeak 'Xuxen' zuzentzaile ortografikoaren aurreneko bertsioa aurkeztu zuenetik. Batez ere, ia horren berriak ez diren teknologien alorrean, eta horien hedapenean. Orduantxe ari ziren etxeetara iristen gaurkoekin zerikusirik ez duten ordenagailuak. Bi datu: erabiltzaileak ordenagailuari aginduak ematetik libratu zituen Windows 95 sistema eragilearen 95 hori ez da ausazko zenbakia, merkaturatze urteari dagokiona baizik (1995eko irailean aurkeztu zen), eta urte berean aurkeztu zuen artean erabat pribatizatu gabe zegoen Telefónicak interneterako sarbidea eskaintzen zuen aurreneko zerbitzua, Infovía izenekoa. Ordenagailuen lekua hartzen ari diren tablet eta telefono adimentsuak ere, aurrekari solteren bat izan ezik, prototipoak ziren... Euskara estandarrari dagokionez, hamarkada hartantxe, 1994an Leioan egindako biltzarraren ondotik batik bat, sakatu zuen Euskaltzaindiak gomendio eta araugintzaren azeleragailua eta, horrenbestez, finkatu gabe zeuden hainbat eta hainbat kontu, baita lexikoaren alorrean ere.

Mundu hartara irten zen Xuxen, disketeetan noski, eta 1999ra arte ez zuen egin salto internetera. Eusko Jaurlaritzak bidalitako oharrak zioenez, Xuxen II hura erabili ahal izateko «Pentium bat eta 32 MB-ko memoria» behar ziren eta «PC-Windows eta Office 97rako» balio zuen bakarrik. «ez ditu akats sintaktikoak edo semantikoak antzematen», zehazten zuen oharrak. Xuxenen azkeneko bertsioaren aurkezpenean esan dutenez, «hizkuntzalari eta informatika-ingeniariek elkarlanean sortutako sistema hark iraultza ekarri zuen ordenagailu bidez testuak euskaraz idazten ditugunontzat».

Oraingoz azkena, Xuxen 5

Harrezkeroztik asko aldatu dira gauzak Xuxeni eragiten dizkioten alor nagusietan, eta zuzentzailea ez da sekula atzean gelditu. Maiz eguneratu izan dute IXAk eta Elhuyarrek elkarlanean, eta hainbat euskarritara egokitu dute: web-nabigatzaileetara, Windows eta Officen bertsio berrietara, Microsoft unibertsotik kanpoko testu-prozesatzaileetara, gailu mugikorretara...

Azkeneko egokitzapena, Xuxen 5, astearte honetan aurkeztu dute Elhuyarren egoitzan Leire Cancio Elhuyar Fundazioko zuzendari nagusiak, Xabier Artola UPV/EHUko IXA taldeko ordezkariak eta Elhuyarreko Hizkuntza eta Teknologia unitateko kidea den Itziar Cortések.

Aldaketa dezente dakartza Windows eta Office berrienetarako prestatuta dagoen bertsio honek. Funtsean, inguruan eman diren aldaketa eta berrikuntzak txertatu dituzte Xuxenen, aurretik beste hainbatetan egin duten bezala. Besteak beste, Euskaltzaindiaren Hiztegi Batuko eta Elhuyar hiztegietako azken aldaketak txertatu dituzte zuzentzailearen datu basean, eta erregela gramatikalak ere berritu egin dituzte. Horrenbestez, oraingoz Microsoft Office-rekin erabil daitekeen zuzentzaileak proposamen ortografiko, lexiko eta gramatikal eguneratuak egiten ditu. Xabier Artolak gogora ekarri duenez, 2.3 bertsioaz geroztik Xuxen eta aurreneko itzulia 2000. urtean burutu zuen Hiztegi Batua «bidelagun izan dira», eta bien arteko konjuntzioa «laguntza handia izan da euskara idatziaren normalizazioan». Onuradun nagusiak erabiltzaileak izan dira, noski. Milaka lagunek eskuratu dute Eusko Jaurlaritzaren euskarazko softwarea deskargatzeko webgunetik (Xuxen III bertsioa dago hor), eta iaz aurkeztu zuten xuxen.eus-en daude erabiltzaileen esku bertsio nagusiak. Xuxen 5 ere hor dago, doan deskargatzeko. Deskargatu gabe erabiltzeko aukera ere badago hemen, testu luzeak zuzentzeko oso-oso erosoa ez den arren. Gehienez ere, gainera, 5.000 karaktere sar daitezkete testu-koadroan.

Xuxenen azkeneko bertsioari erabateko etekina ateratzeko modurik egokiena ordenagailura deskargatzea da. Horrez gain, erabiltzailea xuxen.eus-en erregistratzen bada -250 pertsona daude erregistratuta, eta hilabetez hilabete gora ari da egiten erabilera, Itziar Cortések azaldu duenez- eguneratze eta nobedade guztien berri jasoko du eta erabiltzailearen hiztegia osatu ahal izango du, Xuxen 5-ekin batera erabiltzeko.

Esan bezala, Office berrienetan (2013 arte) funtziona dezan prestatu dute Xuxen 5, baina gainerako sistemetara ere heldu dira eguneratzeak, plugin denak berritu baitituzte zuzenketa ortografiko eguneratuak egin ditzaten.

Marra gorri, berde eta urdinak

Erabiltzailearentzat oso erraza da Xuxen baliatzea, gardena kasik (arazorik izanez gero, eta gehiago jakin nahi duenarentzat, badago eskuliburu bat), baina atzean lan handia dago, hizkuntzalariek eta informatikariek egina. Azken batean, ikerkuntza-taldea da Ixa, eta Elhuyarren helburu eta jardueretan ere garrantzi handia dute ikerkuntzak eta garapenak, Leire Canciok adierazi zuen bezala.

Xabier Artolak esan duenez, «Xuxenen atzean ikerkuntza dago. Elhuyarrek eta Ixa Taldeak hizkuntzaren tratamendu automatikoaren arloan egiten dute ikerketa, eta euskararen tratamendua dute ardatz: hor daude, besteak beste, oinarrizko tresna eta baliabideak, hainbat eta hainbat aplikaziotan euskara presente egotea, webean kontsultagarri dauden corpus eta hiztegiak…». Hain zuzen ere, Ixa Taldeak mantentzen ditu Xuxenen oinarri den hiztegia −EDBL, hau da, Euskararen Datu-Base Lexikala− eta Xuxenen motorra. Izan ere, «euskarazko zuzentzailea ez da hiztegi huts batean oinarritzen, segmentatzaile morfologikoa behar baitu hitz bat zuzen idatzita dagoen ala ez erabakitzeko. Aipatutako datu-basea hizkuntza prozesatzeko lan guztietan erabiltzen da, etengabe eguneratzen da, etengabe zuzendu eta aberasten da; eta Xuxenen bertsio berri hau prestatzeko, Elhuyarren hiztegiekin ere erkatu da, eta esan behar da erkatze horretatik eratorri diren zuzentze-aberasteak garrantzi handikoak izan direla. Gaur egun, Euskaltzaindiak Hiztegi Batuaren bidez emandako arau eta gomendio guztiek dute beren isla EDBLn, eta Euskaltzaindiak plazaratu ahala gauzatzen dira arau horiek datu-basean. Beraz, EDBL egunean mantentzen da beti, eta handik sortzen da zuzentzaileak behar duen lexikoa, zuzentzaileak behar duen formatuan». (Xabier Artolaren hitzalditxo argigarria, osorik hemen).

Horrela 'bazkatuta', zuzendu ez ezik gomendatu eta iradoki ere egiten du Xuxenek. 'Andere zorrotz' bertsioan, «zentzu kritikoz» jokatzen duenean, marra gorria jartzen dio azpitik akats ortografikoren bat duen hitzari, eta nola zuzendu proposatzen du. Ortografikoki zuzenak diren hitzak ere ez dira guztiz libratzen marretatik, baliteke-eta zuzen idatzita egon arren ez izatea Euskaltzaindiak hobesten duen forma. Kasu horietan, marra berdea edo urdina azalduko da, eta azpimarratua izan den hitzaren ordez Xuxenek proposatuko du Euskaltzaindiak Hiztegi Batuan hobetsitakoa.

Iradokizun horien aurrean «zuhur jokatzea» gomendatu du Artolak, proposamena itsu-itsuan onartu beharrean testuinguruari erreparatuz. Adibide bat jartzeko, testu honen hasieran erabilitako 'memoria' hitzaren ordez 'oroimen' edo 'oroitzapen' gomendatu du Xuxenek, Euskaltzaindiaren erabakiari men eginez.

Zenbait akats gramatikal ere azpimarratzen ditu berdez edo urdinez, zuzentzeko proposamena eginez. 'Bihar ikusiko gara' idazten bada, 'ikusiko dugu elkar' proposatuko du Xuxenek. «Esan beharrik ez dago -azaldu du Xabier Artolak-, laguntza gramatikal hori gehiago da euskara ikasten ari den edo gramatika menderatzen ez duenarentzat, euskaraz ongi eta txukun idazten duenarentzat baino; halakoak beti izango ditu eskura, noski, konfigurazio-aukerak, akats gramatikalen detekzioa gaitu edo desgaitzeko».

Temas