Basque subtitles for clip: File:Ikusgela-Hizkuntza prozesamendua.webm

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
1
00:00:03,290 --> 00:00:06,576
Irudikatu mundu bat non
informazio guzti-guztia

2
00:00:06,601 --> 00:00:08,800
guk hautatutako
hizkuntzan jasotzen dugun.

3
00:00:08,900 --> 00:00:10,300
Sarean bilatzen duguna.

4
00:00:10,440 --> 00:00:11,746
Gailu elektronikoak.

5
00:00:11,770 --> 00:00:12,725
Edozein liburu.

6
00:00:12,750 --> 00:00:15,390
Eta baita parean dugun
pertsonak esaten diguna ere.

7
00:00:15,550 --> 00:00:18,259
Pentsa, edozeinekin hitz
egin ahal izango zenuke

8
00:00:18,283 --> 00:00:19,763
hizkuntzaren mugarik gabe.

9
00:00:19,787 --> 00:00:24,700
Eta ziur asko, gero eta motibazio gutxiago
izango zenuke hizkuntza berriak ikasteko.

10
00:00:24,725 --> 00:00:26,218
Ez gara oraindik
horraino iritsi.

11
00:00:26,242 --> 00:00:28,621
Baina litekeena da
horren urruti ez egotea.

12
00:00:28,645 --> 00:00:32,080
Eta hizkuntza guztiei eragingo
die laster datorren iraultzak.

13
00:00:32,140 --> 00:00:34,177
Zer esanik ez hizkuntza
ez hegemonikoei.

14
00:00:34,201 --> 00:00:35,840
Edo hobe esanda, hiztunoi.

15
00:00:43,550 --> 00:00:46,082
Hizkuntza naturalaren
prozesamendua da

16
00:00:46,106 --> 00:00:49,062
hizkuntzalaritza eta
informatika batzen dituen alorra.

17
00:00:49,088 --> 00:00:53,645
Ingelesezko jatorria duen NLP
laburdurarekin izendatu ohi da.

18
00:00:53,670 --> 00:00:54,596
Labur esanda,

19
00:00:54,621 --> 00:01:00,170
makinen eta gizakion arteko komunikazioa
eraginkorragoa izateko moduak lantzen ditu.

20
00:01:00,194 --> 00:01:03,630
Eta lan horretan trebatu diren
ikerlari eta enpresa asko ditugu hemen,

21
00:01:03,680 --> 00:01:04,645
Euskal Herrian.

22
00:01:04,670 --> 00:01:08,113
Besteak beste testu-zuzentzaileak
edo itzulpen tresnak garatu dira

23
00:01:08,137 --> 00:01:10,500
hizkuntza naturalaren
prozesamenduari esker.

24
00:01:10,708 --> 00:01:12,332
Eta euskara, zentzu horretan,

25
00:01:12,421 --> 00:01:15,213
beste hizkuntza asko
baino aurreratuago dago.

26
00:01:15,530 --> 00:01:18,478
Duela urte batzuk arte, itzulpen
teknologia hitzen kontaketa

27
00:01:18,502 --> 00:01:21,082
eta probabilitate
estimazioetan oinarritu izan da:

28
00:01:21,106 --> 00:01:23,860
itzulpen memoriatan egin
izan diren itzulpenak aztertu,

29
00:01:23,910 --> 00:01:27,660
hitzak nola itzuli izan diren
zenbatu, eta testu berri bat itzultzean,

30
00:01:27,860 --> 00:01:31,095
datu horiek erabili itzulpen
probableena sortzeko.

31
00:01:31,119 --> 00:01:33,903
Ez da harritzekoa metodo
horiek zailtasunak izatea

32
00:01:33,927 --> 00:01:36,530
zenbait egitura edo
hitz polisemiko itzultzeko.

33
00:01:36,640 --> 00:01:40,112
Baina hizkuntza teknologiak
aldaketa etengabean bizi dira.

34
00:01:40,136 --> 00:01:41,620
Eta azken pare bat urtean,

35
00:01:41,645 --> 00:01:44,121
paradigma aldaketa eragin
duen zerbait gertatu da:

36
00:01:44,290 --> 00:01:46,105
adimen artifizalaren garapena.

37
00:01:46,130 --> 00:01:48,611
Beste bideo batean azaldu
dizuet sakonago hori zer den.

38
00:01:48,809 --> 00:01:52,305
Adimen artifiziala giza adimena
imitatzen ahalegintzen da.

39
00:01:52,329 --> 00:01:55,899
Eta giza adimenaren
adierazpen nabarienetako bi dira

40
00:01:55,923 --> 00:01:58,270
hizkuntzak ulertzea
eta erabiltzea.

41
00:01:58,580 --> 00:01:59,315
Beraz,

42
00:01:59,340 --> 00:02:04,613
Hizkuntza Naturalaren Prozesamendua
adimen artifizialaren erdigunean dago.

43
00:02:04,638 --> 00:02:09,490
Hizkuntza bakoitzari dagokion informazioa
eta arauak eskuz sartu behar izatetik,

44
00:02:09,690 --> 00:02:11,990
ikasketa automatikora
igaro gara.

45
00:02:12,015 --> 00:02:15,776
Gaur egun, adibideekin
erakutsitakoa ikasi dezakete programek,

46
00:02:15,800 --> 00:02:19,013
bere algoritmoak sortu eta
antzeko kasuetan aplikatzeko gero.

47
00:02:19,038 --> 00:02:23,039
Eta are gehiago: Ikasketa sakona
esaten zaion teknikaren bidez,

48
00:02:23,064 --> 00:02:26,050
adibideekin
erakutsitakoa ez ezik,

49
00:02:26,280 --> 00:02:29,403
jasotzen duen informaziotik
eratortzen diren ondorioak ere

50
00:02:29,427 --> 00:02:32,339
ikas ditzake programa
batek, algoritmo berriak sortuz.

51
00:02:32,364 --> 00:02:33,620
Eta zer esan nahi du horrek?

52
00:02:33,689 --> 00:02:36,658
Makinek inoiz baino
errazarrago ikas dezaketela,

53
00:02:36,682 --> 00:02:41,234
eta inoiz baino emaitza hobeak
eman, datu egokiekin entrenatuz gero.

54
00:02:41,259 --> 00:02:42,491
Orain urte batzuk

55
00:02:42,540 --> 00:02:45,296
pentsaezinak diren gauzak
posible dira dagoeneko:

56
00:02:45,321 --> 00:02:49,690
Badaude tresnak ahozko mezuak
zuzenean idatzira eramaten dituztenak.

57
00:02:49,710 --> 00:02:52,530
Besteak beste, azpititulu
automatikoak sortuz.

58
00:02:52,770 --> 00:02:53,770
Eta beste batzuk

59
00:02:53,872 --> 00:02:56,701
testu hori automatikoki
itzultzen dute.

60
00:02:56,725 --> 00:03:01,002
Posible da kontrakoa ere: testu bat
hartu, eta ahotsezko mezu bihurtzea.

61
00:03:01,070 --> 00:03:04,540
Pixkanaka, tresna horiek gero
eta gehiago garatuko direnez,

62
00:03:04,560 --> 00:03:07,861
ez da gehiegi falta zuzenean
entzuten dugun hori modu automatikoan

63
00:03:07,885 --> 00:03:10,841
beste hizkuntza batera
bikoiztuta jaso ahal izateko.

64
00:03:10,865 --> 00:03:12,025
Edo behintzat,

65
00:03:12,050 --> 00:03:13,730
ez da garai batean
bezain pentsaezina.

66
00:03:14,180 --> 00:03:16,850
Baina horrek berdin balio
du hizkuntza guztientzat?

67
00:03:17,060 --> 00:03:19,413
Ez, eta hortxe
dago gure erronka.

68
00:03:19,437 --> 00:03:22,683
Tresna horiek eraginkorrak
izateko miloika datu behar dituzte,

69
00:03:22,707 --> 00:03:26,470
eta hizkuntza bakoitzak dagozkion
algoritmo propioak garatu behar ditu.

70
00:03:26,661 --> 00:03:27,300
Oraingoz,

71
00:03:27,320 --> 00:03:31,040
tresna berri gehien gehienak
hizkuntza hegemonikoetan landu dira.

72
00:03:31,190 --> 00:03:33,029
ChatGPT edo Dalle2 adibidez,

73
00:03:33,053 --> 00:03:37,600
ingelesez eta gaztelaniaz erabil
ditzakegu, baina euskaraz ez horren ondo.

74
00:03:37,680 --> 00:03:41,355
Gauza bera gertatzen da ahotsa identifikatu
eta ulertzen duten aparatuekin.

75
00:03:41,379 --> 00:03:45,190
Euskara, gaur gaurkoz, ez dago
oraindik beste hizkuntza batzuen pare.

76
00:03:45,430 --> 00:03:47,538
Baina ez du zertan
beti horrela izan.

77
00:03:47,562 --> 00:03:52,040
Euskal Herrian, esan dudan moduan, alor
hori lantzen duten proiektu asko daude.

78
00:03:52,300 --> 00:03:55,217
IXA taldea, Orai, Eleka, Matxin…

79
00:03:55,281 --> 00:03:57,047
Eta asko ari dira lanean,

80
00:03:57,083 --> 00:03:58,459
euskarak tokia izan dezan

81
00:03:58,483 --> 00:04:02,043
adimen artifizialak eskainiko
dizkigun aukera berri horietan.

82
00:04:02,180 --> 00:04:05,710
Bat baino gehiagori entzun diodan
esaldia botako dut, nirea balitz bezala:

83
00:04:05,800 --> 00:04:07,370
Hizkuntza gutxituen artean

84
00:04:07,439 --> 00:04:12,379
aitzindari eta bide-urratzaile izateko
profesionalak eta gaitasunak ditugu.

85
00:04:12,480 --> 00:04:13,590
Hartuko dugu olatua?