Basque subtitles for clip: File:Ikusgela-Hizkuntza prozesamendua.webm
Jump to navigation
Jump to search
1 00:00:03,290 --> 00:00:06,576 Irudikatu mundu bat non informazio guzti-guztia 2 00:00:06,601 --> 00:00:08,800 guk hautatutako hizkuntzan jasotzen dugun. 3 00:00:08,900 --> 00:00:10,300 Sarean bilatzen duguna. 4 00:00:10,440 --> 00:00:11,746 Gailu elektronikoak. 5 00:00:11,770 --> 00:00:12,725 Edozein liburu. 6 00:00:12,750 --> 00:00:15,390 Eta baita parean dugun pertsonak esaten diguna ere. 7 00:00:15,550 --> 00:00:18,259 Pentsa, edozeinekin hitz egin ahal izango zenuke 8 00:00:18,283 --> 00:00:19,763 hizkuntzaren mugarik gabe. 9 00:00:19,787 --> 00:00:24,700 Eta ziur asko, gero eta motibazio gutxiago izango zenuke hizkuntza berriak ikasteko. 10 00:00:24,725 --> 00:00:26,218 Ez gara oraindik horraino iritsi. 11 00:00:26,242 --> 00:00:28,621 Baina litekeena da horren urruti ez egotea. 12 00:00:28,645 --> 00:00:32,080 Eta hizkuntza guztiei eragingo die laster datorren iraultzak. 13 00:00:32,140 --> 00:00:34,177 Zer esanik ez hizkuntza ez hegemonikoei. 14 00:00:34,201 --> 00:00:35,840 Edo hobe esanda, hiztunoi. 15 00:00:43,550 --> 00:00:46,082 Hizkuntza naturalaren prozesamendua da 16 00:00:46,106 --> 00:00:49,062 hizkuntzalaritza eta informatika batzen dituen alorra. 17 00:00:49,088 --> 00:00:53,645 Ingelesezko jatorria duen NLP laburdurarekin izendatu ohi da. 18 00:00:53,670 --> 00:00:54,596 Labur esanda, 19 00:00:54,621 --> 00:01:00,170 makinen eta gizakion arteko komunikazioa eraginkorragoa izateko moduak lantzen ditu. 20 00:01:00,194 --> 00:01:03,630 Eta lan horretan trebatu diren ikerlari eta enpresa asko ditugu hemen, 21 00:01:03,680 --> 00:01:04,645 Euskal Herrian. 22 00:01:04,670 --> 00:01:08,113 Besteak beste testu-zuzentzaileak edo itzulpen tresnak garatu dira 23 00:01:08,137 --> 00:01:10,500 hizkuntza naturalaren prozesamenduari esker. 24 00:01:10,708 --> 00:01:12,332 Eta euskara, zentzu horretan, 25 00:01:12,421 --> 00:01:15,213 beste hizkuntza asko baino aurreratuago dago. 26 00:01:15,530 --> 00:01:18,478 Duela urte batzuk arte, itzulpen teknologia hitzen kontaketa 27 00:01:18,502 --> 00:01:21,082 eta probabilitate estimazioetan oinarritu izan da: 28 00:01:21,106 --> 00:01:23,860 itzulpen memoriatan egin izan diren itzulpenak aztertu, 29 00:01:23,910 --> 00:01:27,660 hitzak nola itzuli izan diren zenbatu, eta testu berri bat itzultzean, 30 00:01:27,860 --> 00:01:31,095 datu horiek erabili itzulpen probableena sortzeko. 31 00:01:31,119 --> 00:01:33,903 Ez da harritzekoa metodo horiek zailtasunak izatea 32 00:01:33,927 --> 00:01:36,530 zenbait egitura edo hitz polisemiko itzultzeko. 33 00:01:36,640 --> 00:01:40,112 Baina hizkuntza teknologiak aldaketa etengabean bizi dira. 34 00:01:40,136 --> 00:01:41,620 Eta azken pare bat urtean, 35 00:01:41,645 --> 00:01:44,121 paradigma aldaketa eragin duen zerbait gertatu da: 36 00:01:44,290 --> 00:01:46,105 adimen artifizalaren garapena. 37 00:01:46,130 --> 00:01:48,611 Beste bideo batean azaldu dizuet sakonago hori zer den. 38 00:01:48,809 --> 00:01:52,305 Adimen artifiziala giza adimena imitatzen ahalegintzen da. 39 00:01:52,329 --> 00:01:55,899 Eta giza adimenaren adierazpen nabarienetako bi dira 40 00:01:55,923 --> 00:01:58,270 hizkuntzak ulertzea eta erabiltzea. 41 00:01:58,580 --> 00:01:59,315 Beraz, 42 00:01:59,340 --> 00:02:04,613 Hizkuntza Naturalaren Prozesamendua adimen artifizialaren erdigunean dago. 43 00:02:04,638 --> 00:02:09,490 Hizkuntza bakoitzari dagokion informazioa eta arauak eskuz sartu behar izatetik, 44 00:02:09,690 --> 00:02:11,990 ikasketa automatikora igaro gara. 45 00:02:12,015 --> 00:02:15,776 Gaur egun, adibideekin erakutsitakoa ikasi dezakete programek, 46 00:02:15,800 --> 00:02:19,013 bere algoritmoak sortu eta antzeko kasuetan aplikatzeko gero. 47 00:02:19,038 --> 00:02:23,039 Eta are gehiago: Ikasketa sakona esaten zaion teknikaren bidez, 48 00:02:23,064 --> 00:02:26,050 adibideekin erakutsitakoa ez ezik, 49 00:02:26,280 --> 00:02:29,403 jasotzen duen informaziotik eratortzen diren ondorioak ere 50 00:02:29,427 --> 00:02:32,339 ikas ditzake programa batek, algoritmo berriak sortuz. 51 00:02:32,364 --> 00:02:33,620 Eta zer esan nahi du horrek? 52 00:02:33,689 --> 00:02:36,658 Makinek inoiz baino errazarrago ikas dezaketela, 53 00:02:36,682 --> 00:02:41,234 eta inoiz baino emaitza hobeak eman, datu egokiekin entrenatuz gero. 54 00:02:41,259 --> 00:02:42,491 Orain urte batzuk 55 00:02:42,540 --> 00:02:45,296 pentsaezinak diren gauzak posible dira dagoeneko: 56 00:02:45,321 --> 00:02:49,690 Badaude tresnak ahozko mezuak zuzenean idatzira eramaten dituztenak. 57 00:02:49,710 --> 00:02:52,530 Besteak beste, azpititulu automatikoak sortuz. 58 00:02:52,770 --> 00:02:53,770 Eta beste batzuk 59 00:02:53,872 --> 00:02:56,701 testu hori automatikoki itzultzen dute. 60 00:02:56,725 --> 00:03:01,002 Posible da kontrakoa ere: testu bat hartu, eta ahotsezko mezu bihurtzea. 61 00:03:01,070 --> 00:03:04,540 Pixkanaka, tresna horiek gero eta gehiago garatuko direnez, 62 00:03:04,560 --> 00:03:07,861 ez da gehiegi falta zuzenean entzuten dugun hori modu automatikoan 63 00:03:07,885 --> 00:03:10,841 beste hizkuntza batera bikoiztuta jaso ahal izateko. 64 00:03:10,865 --> 00:03:12,025 Edo behintzat, 65 00:03:12,050 --> 00:03:13,730 ez da garai batean bezain pentsaezina. 66 00:03:14,180 --> 00:03:16,850 Baina horrek berdin balio du hizkuntza guztientzat? 67 00:03:17,060 --> 00:03:19,413 Ez, eta hortxe dago gure erronka. 68 00:03:19,437 --> 00:03:22,683 Tresna horiek eraginkorrak izateko miloika datu behar dituzte, 69 00:03:22,707 --> 00:03:26,470 eta hizkuntza bakoitzak dagozkion algoritmo propioak garatu behar ditu. 70 00:03:26,661 --> 00:03:27,300 Oraingoz, 71 00:03:27,320 --> 00:03:31,040 tresna berri gehien gehienak hizkuntza hegemonikoetan landu dira. 72 00:03:31,190 --> 00:03:33,029 ChatGPT edo Dalle2 adibidez, 73 00:03:33,053 --> 00:03:37,600 ingelesez eta gaztelaniaz erabil ditzakegu, baina euskaraz ez horren ondo. 74 00:03:37,680 --> 00:03:41,355 Gauza bera gertatzen da ahotsa identifikatu eta ulertzen duten aparatuekin. 75 00:03:41,379 --> 00:03:45,190 Euskara, gaur gaurkoz, ez dago oraindik beste hizkuntza batzuen pare. 76 00:03:45,430 --> 00:03:47,538 Baina ez du zertan beti horrela izan. 77 00:03:47,562 --> 00:03:52,040 Euskal Herrian, esan dudan moduan, alor hori lantzen duten proiektu asko daude. 78 00:03:52,300 --> 00:03:55,217 IXA taldea, Orai, Eleka, Matxin… 79 00:03:55,281 --> 00:03:57,047 Eta asko ari dira lanean, 80 00:03:57,083 --> 00:03:58,459 euskarak tokia izan dezan 81 00:03:58,483 --> 00:04:02,043 adimen artifizialak eskainiko dizkigun aukera berri horietan. 82 00:04:02,180 --> 00:04:05,710 Bat baino gehiagori entzun diodan esaldia botako dut, nirea balitz bezala: 83 00:04:05,800 --> 00:04:07,370 Hizkuntza gutxituen artean 84 00:04:07,439 --> 00:04:12,379 aitzindari eta bide-urratzaile izateko profesionalak eta gaitasunak ditugu. 85 00:04:12,480 --> 00:04:13,590 Hartuko dugu olatua?