Borrar
Aurkezpena astelehen honetan egin dute Akademiaren egoitzan, Bilbon. Euskaltzaindia
Euskaltzaindiak Euskararen Erreferentzia Corpusa aurkeztu du

Euskaltzaindiak Euskararen Erreferentzia Corpusa aurkeztu du

Proiektu berria «hautatu den garaiaren argazkia izango da, errealitatea modu erakusgarrian, orekatuan, kodetuan eta kalitatea zainduta bilduko dituena»

Jan Echevarría

Lunes, 31 de marzo 2025, 15:34

Euskaltzaindiak Euskararen Erreferentzia Corpusa aurkeztu du astelehen honetan Akademiaren Bilboko egoitzan. Agerraldian izan dira Ibone Bengoetxea Kultura eta Hizkuntza Politikako sailburua, Andres Urrutia euskaltzainburua, Miriam Urkia euskaltzain oso eta Euskaltzaindiaren Hiztegia egitasmoaren arduraduna, eta Aitor Maritxalar Akademiaren aholkulari teknologikoa.

Ekitaldia hasi bezain laster, erreferentziazko corpus bat zer den azaldu dute: «Hizkuntza baten garai zehatz baten erakusgarri ahalik eta xeheena eta, aldi berean, zabalena izateko sortu den corpusa da. Datu-bilduma handi hau hautatu den garaiaren argazkia izango da, errealitatea modu erakusgarrian, orekatuan, kodetuan eta kalitatea zainduta bilduko dituena», esan du Urkiak.

Urrutia euskaltzainburuaren arabera, proiektu berria aurrera eramateko, «euskalki guztietako adibideak eta testu-iturri (liburuak, aldizkariak, sarea...) desberdinetako edukiak bildu ditugu, hau da, publiko mota guztiei zuzendutako testuak (gazteak, publiko orokorra, espezialistak)». Beraz, bere hitzetan, Erreferentzia Corpusa «baliagarria izango da lexiko orokor zein terminologikorako, gramatikarako, hizkuntzaren irakaskuntzarako, zuzentzaileetarako eta beste corpus handi batzuen eredu egokiak eta zehatzak baliozkotzeko». Gainera, argi dauka «hizkuntza-teknologiek ekartzen dizkiguten erronkei aurre egiteko» balioko duela.

Baina ez hori bakarrik, maila linguistikoa gainditu eta soziologikora hurbiltzeko aukera ere emango baitu, adibidez, formak agerkideak baliatuta: «Zer adjektiborekin erabiltzen da emakume izena, eta gizon? Berdinak edo antzekoak dira? Eta duela hogei urte adjektibo horiek berak erabiltzen ziren ala ez? Galdera horiei erantzuna eman zaie egitasmo berrian», azaldu du Urkiak.

Aitor Maritxalar teknikariak ere ideia hori azpimarratu du: «Adimen artifiziala terminoa bilatzen badugu, ikusiko dugu 2000. urtean ia ez zela testuetan agertzen, eta 2020tik aurrera kontzeptu horren erabilera handituz joan dela estatistikek erakusten duten moduan. Beraz, horrek, zalantzarik gabe, gizartearen bilakaera ere erakusten digu».

Azken 25 urteotako testuak

Erreferentzia Corpusean azken 25 urteotako testuak jaso dituzte, corpusa hizkuntza-, literatura- edo ikerketa-helburuetarako corpus estandar edo erreferente gisa erabilia izan dadin. Zehazki, 68 erakunde pribatu eta publikoen laguntzarekin eratu den lehen bertsio honek 123.124 dokumentu, 154,21 milioi testu hitz eta 129.817 lema bildu ditu, 2000. urtetik hasi eta 2023ra bitartean euskaraz idatzitako edo ekoitzitako testuetatik hartuak.

Azpimarratzekoa da testuen %48 liburuetatik datorrela corpusera, %48 aldizkako argitalpenetatik eta beste % 4a, sarerako berariaz sortutako materialetik, eta testuak bi sail nagusitan sailkatu direla, fikzioa (% 25) eta ez-fikzioa (% 75) multzoetan banatuta. Gainera, Maritxalarrek azaldu duenez, corpusa «urtero eguneratuko» da, urtean urteko testuak gehituz eta aurreko urteetako hutsuneak osatuz, ahalik eta erreferentzialtasunik handiena lortzeko».

Bengoetxea sailburuak, bere aldetik, «hizkuntza prestigiatzearen» garrantzia azpimarratu du, eta eskerrak eman ditu «Euskaltzaindian lantzen eta eskaintzen ari zareten euskararen corpus hau gure historiaren parte delako eta, aldi berean, gure herriaren etorkizuna gidatuko duen erreferentziazko tresna delako».

Publicidad

Publicidad

Publicidad

Publicidad

Esta funcionalidad es exclusiva para suscriptores.

Reporta un error en esta noticia

* Campos obligatorios

diariovasco Euskaltzaindiak Euskararen Erreferentzia Corpusa aurkeztu du