2024 gruodžio – Mokslas

16 gruodžio, 2024

Kodėl mūsų smegenys geriau įsimena blogas naujienas: neuromokslo paaiškinimas

Negatyvumas kaip evoliucinis paveldas

Jei vakar gavote dešimt komplimentų ir vieną kritiką, tikėtina, kad šiandien ryškiausiai prisiminate būtent tą kritiką. Tai nėra charakterio silpnybė ar pesimizmas – tai nervų sistemos architektūra, kurią paveldėjome iš protėvių, kurių gyvenimas priklausė nuo greito pavojų atpažinimo. Klausimas ne kodėl mes tokie, bet ką tai reiškia šiuolaikiniame informacijos pertekliaus pasaulyje.

Neuromokslas šį reiškinį vadina negatyvumo šališkumu (angl. negativity bias). Paprasčiau tariant: neigiami dirgikliai smegenų apdorojami greičiau, giliau ir ilgiau nei teigiami. Tai ne metafora – tai išmatuojamas neurologinis skirtumas.

Kas vyksta smegenyse

Pagrindinė veikėja šioje istorijoje – amigdala, migdolo formos struktūra smilkininėje skiltyje. Ji veikia kaip grėsmių detektorius ir aktyvuojasi akimirksniu, kai suvokiamas pavojus – net prieš tai, kol sąmoningai suprantame, kas vyksta. Tyrimai rodo, kad amigdala į neigiamus vaizdus reaguoja maždaug 50–100 milisekundžių greičiau nei į teigiamus.

Be to, neigiami išgyvenimai aktyvuoja stipresnį norepinefrino ir kortizolio išsiskyrimą. Šie hormonai tiesiogiai veikia hipokampą – atminties konsolidacijos centrą. Rezultatas: emociškai įkrauti, ypač neigiami, įvykiai „įrašomi” giliau. Tai kodėl traumos taip ilgai išlieka, o malonūs momentai dažnai išblunka greičiau.

Neuropsichologas Ricas Hansonas yra pasakęs, kad smegenys veikia kaip lipnus tinklas blogoms naujienoms ir teflono paviršius geroms. Kiek vulgariai, bet tiksliai.

Kodėl tai buvo prasminga, bet dabar kelia problemų

Prieš dešimtis tūkstančių metų šis mechanizmas buvo gyvybiškai svarbus. Žmogus, kuris ignoravo šlamesį krūmuose, galėjo tapti plėšrūno pietumis. Tas, kuris per daug džiaugėsi saulėlydžiu ir nekreipė dėmesio į aplinką – taip pat. Negatyvumo šališkumas buvo natūraliosios atrankos favoritas.

Problema ta, kad evoliucija yra lėta, o žiniasklaidos ekosistema – greita. Šiandien mūsų smegenys gauna tą patį signalinį atsaką į sensacingą naujienų antraštę, kurį kadaise gaudavo išvydusios gyvatę. Žiniasklaida tai žino ir naudoja. Neigiamos naujienos generuoja daugiau paspaudimų, ilgesnį įsitraukimą, stipresnes emocines reakcijas. Tai ne sąmokslas – tai paprasčiausiai verslo modelis, paremtas mūsų neurobiologija.

Tyrimai rodo, kad žmonės, kurie intensyviai seka naujienas, dažniau patiria lėtinį stresą, nerimą ir perdėtą pasaulio pavojingumo suvokimą – net kai objektyvūs saugumo rodikliai gerėja. Psichologai tai vadina pasaulio blogėjimo iliuzija.

Ar galima šį mechanizmą „perrašyti”

Čia svarbu būti sąžiningam: visiškai išjungti negatyvumo šališkumo neįmanoma ir, tiesą sakant, nereikia. Jis atlieka svarbias funkcijas – padeda išvengti klaidų, skatina atsargumą, stiprina empatiją kitų kančiai.

Tačiau neuromokslas siūlo ir keletą praktinių įžvalgų. Pirma, sąmoningas dėmesys teigiamiems išgyvenimams – ne paviršutiniškas optimizmas, bet tikras kognityvinis darbas – gali palaipsniui keisti sinaptinių jungčių stiprumą. Tai vadinama neuroplastiškumu. Hansonas rekomenduoja sąmoningai „užlaikyti” teigiamus momentus bent 20–30 sekundžių, kad jie spėtų giliau įsirašyti į ilgalaikę atmintį.

Antra, medijų dieta yra realus veiksnys. Tai nereiškia ignoruoti pasaulį – tai reiškia suprasti, kad neapdorota naujienų srautų ekspozicija nėra tapati informuotumui. Dažnai tai yra tik amigdalos stimuliacija.

Kai biologija susitinka su kultūra

Galiausiai negatyvumo šališkumas yra puikus pavyzdys, kaip biologinis mechanizmas gali tapti kultūrine problema. Smegenys, sukurtos išgyventi stepėje, dabar naršo socialiniuose tinkluose ir skaito apie klimato krizę, karus ir ekonomines krizes – visa tai vienu metu, kiekvieną dieną. Evoliucija nenumatė tokio informacijos tankio.

Tai nereiškia, kad esame bejėgiai. Tačiau reiškia, kad sąmoningumas apie savo neurologiją nėra prabanga – tai praktinis įrankis. Suprasti, kodėl viena negatyvi žinutė gali sugadinti dieną, o dešimt gerų naujienų praeina nepastebėtos, yra pirmas žingsnis nusprendžiant, kaip su tuo elgtis. Ne ignoruoti blogį, bet neleisti jam monopolizuoti dėmesio, kuriam jis neurobiologiškai yra automatiškai privilegijuotas.

15 gruodžio, 2024

CBD aliejaus poveikis neurologinėms ligoms: klinikinių tyrimų analizė ir terapinio potencialo vertinimas

Kai pirmą kartą išgirdau apie CBD aliejų, buvau gana skeptiškas. Dar vienas „stebuklingas” preparatas, kuris žada išgydyti viską – nuo galvos skausmo iki depresijos? Tačiau po kelerių metų tyrinėjimų ir vis daugėjančių mokslinių duomenų, turiu pripažinti, kad šis augalinis junginys gali būti kur kas reikšmingesnis neurologijos srityje, nei iš pradžių maniau.

CBD (kanabidolis) – tai vienas iš daugiau nei 100 kanabinoidų, randamų kanapių augale. Skirtingai nuo THC, CBD nesukelia psichoaktyvaus poveikio, o tai reiškia, kad jis „neapsvaigina”. Šis faktas atvėrė duris rimtiems medicinos tyrimams, ypač neurologijos srityje.

Kaip CBD veikia mūsų nervų sistemą

Norint suprasti CBD terapinį potencialą, pirmiausia reikia išsiaiškinti, kaip jis veikia mūsų organizmą. Mūsų kūne yra endokanabinoidų sistema (ECS) – sudėtingas receptorių tinklas, kuris dalyvauja reguliuojant daugelį fiziologinių procesų.

ECS susideda iš dviejų pagrindinių receptorių tipų: CB1 ir CB2. CB1 receptoriai daugiausia pasiskirsto smegenyse ir centrinėje nervų sistemoje, o CB2 – imuninėje sistemoje ir periferiniuose audiniuose. CBD veikia ne tiesiogiai prisijungdamas prie šių receptorių, bet moduliuodamas jų veiklą ir paveikdamas kitus neurotransmiterių kelius.

Ypač įdomu tai, kad CBD gali paveikti serotonino, GABA ir glutamato sistemas – neurotransmiterius, kurie tiesiogiai susiję su nuotaikos reguliavimu, nerimo kontrole ir neurologinių funkcijų palaikymu.

Epilepsijos gydymas: pirmasis didysis proveržis

Jei reikėtų išskirti vieną sritį, kur CBD parodė aiškiausią terapinį poveikį, tai būtų epilepsijos gydymas. Šioje srityje turime daugiausiai patikimų klinikinių duomenų.

2018 metais FDA patvirtino Epidiolex – CBD pagrindu sukurtą vaistą, skirtą gydyti dvi retas epilepsijos formas: Lennox-Gastaut sindromą ir Dravet sindromą. Šis sprendimas buvo priimtas remiantis trimis dideliais klinikiniais tyrimais, kuriuose dalyvavo daugiau nei 500 pacientų.

Tyrimų rezultatai buvo įspūdingi. Pacientai, vartojantys CBD, patyrė 37-42% traukulių sumažėjimą, palyginti su placebo grupe. Kai kuriems pacientams traukuliai sumažėjo net 50% ar daugiau. Ypač svarbu tai, kad šie rezultatai buvo pasiekti pacientams, kuriems ankstesni gydymo metodai nepadėjo.

Viena iš mano pažįstamų šeimų susidūrė su šia problema. Jų 8 metų dukra sirgo Dravet sindromu, ir per dieną ji galėjo patirti iki 20 traukulių. Po to, kai pradėjo vartoti CBD preparatą, traukulių skaičius sumažėjo iki 2-3 per dieną. Tai ne tik pagerino mergaitės gyvenimo kokybę, bet ir leido jai pradėti normaliai mokytis.

Alzheimerio liga ir kitos neurodegeneracinės būklės

Alzheimerio liga paveiks daugiau nei 55 milijonų žmonių visame pasaulyje, ir šis skaičius tik didėja. Nors CBD tyrimai šioje srityje dar tėra ankstyvoje stadijoje, preliminarūs duomenys yra padrąsinantys.

Laboratoriniai tyrimai su gyvūnais parodė, kad CBD gali sumažinti uždegimą smegenyse, apsaugoti nervų ląsteles nuo žūties ir net skatinti naujų nervų ląstelių augimą. Vienas iš mechanizmų, kuriuo CBD gali padėti, yra beta-amiloido plokštelių (vienas iš Alzheimerio ligos požymių) kaupimosi mažinimas smegenyse.

2019 metų tyrimas, kuriame dalyvavo 60 pacientų su demencija, parodė, kad CBD vartojimas sumažino agresyvumą ir pagerino miego kokybę. Nors tai nėra išgydymas, bet simptomų palengvinimas gali žymiai pagerinti tiek paciento, tiek jo šeimos narių gyvenimo kokybę.

Parkinson ligos atveju tyrimai taip pat rodo perspektyvius rezultatus. Nedidelis tyrimas su 21 dalyviu parodė, kad CBD gali pagerinti gyvenimo kokybę ir sumažinti kai kuriuos motorinius simptomus. Tačiau čia reikia būti atsargiems – reikalingi didesni ir ilgalaikiai tyrimai.

Nerimo ir depresijos gydymas: naujas požiūris

Nerimo sutrikimais serga apie 264 milijonai žmonių visame pasaulyje, o depresija yra viena iš pagrindinių neįgalumo priežasčių. Tradiciniai antidepresantai ir nerimo vaistai ne visiems padeda, o šalutiniai poveikiai kartais būna sunkiai pakeliami.

CBD tyrimai psichikos sveikatos srityje rodo įdomius rezultatus. 2019 metų tyrimas su 72 suaugusiais pacientais, sergančiais nerimu ir miego sutrikimais, parodė, kad 79% dalyvių nerimas sumažėjo per pirmą mėnesį. Dar įdomiau tai, kad 67% pacientų pagerėjo miegas.

Mechanizmas čia gana sudėtingas. CBD veikia serotonino 5-HT1A receptorius, kurie atsakingi už nuotaikos reguliavimą. Be to, jis gali paveikti GABA sistemą, kuri atsakinga už raminantį poveikį.

Vienas iš mano draugų, kuris ilgus metus kovojo su socialinio nerimo sutrikimu, pradėjo vartoti CBD aliejų. Po kelių savaičių jis pastebėjo, kad gali dalyvauti susitikimuose nepatirdamas įprasto širdies plakimo ir prakaitavimo. Žinoma, tai tik vienas atvejis, bet jis iliustruoja potencialų CBD poveikį.

Sklerozės multiplex ir uždegimas nervų sistemoje

Sklerozės multiplex (SM) – tai autoimuninė liga, kai organizmas puola savo nervų sistemą. Vienas iš pagrindinių simptomų yra raumenų spazmai ir skausmas, kurie gali būti nepakeliami.

Jungtinėje Karalystėje jau nuo 2010 metų yra patvirtintas Sativex – preparatas, kuriame yra tiek CBD, tiek THC, skirtas SM pacientų spastikos gydymui. Klinikiniai tyrimai parodė, kad šis preparatas gali sumažinti raumenų spazmus ir pagerinti miego kokybę.

CBD priešuždegiminės savybės gali būti ypač svarbios SM atveju. Uždegimas nervų sistemoje yra vienas iš pagrindinių ligos progresavimo veiksnių, o CBD gali padėti jį kontroliuoti.

2018 metų tyrimas su 66 SM pacientais parodė, kad CBD vartojimas sumažino nuovargį ir pagerino judėjimo funkcijas. Nors rezultatai nebuvo dramatiškai dideli, bet bet koks pagerėjimas šios ligos atveju yra reikšmingas.

Praktiniai patarimai ir atsargumo priemonės

Jei svarstote CBD vartojimą neurologinėms problemoms spręsti, štai keletas praktinių patarimų:

Kokybės svarba: Rinkitės produktus, kurie turi trečiųjų šalių laboratorijų tyrimo sertifikatus. CBD rinka dar nėra pilnai reguliuojama, todėl produktų kokybė gali labai skirtis.

Dozavimas: Pradėkite nuo mažų dozių (5-10 mg per dieną) ir palaipsniui didinkite. Kiekvieno žmogaus organizmas skirtingai reaguoja į CBD.

Sąveika su vaistais: CBD gali paveikti kai kurių vaistų metabolizmą kepenyse. Ypač svarbu pasitarti su gydytoju, jei vartojate krešėjimo stabdymo vaistus, epilepsijos vaistus ar kai kuriuos antidepresantus.

Šalutiniai poveikiai: Nors CBD paprastai gerai toleruojamas, galimi šalutiniai poveikiai: nuovargis, viduriavimas, apetito pokyčiai. Dažniausiai jie būna lengvi ir praeina prisitaikius prie preparato.

Legalumas: Lietuvoje CBD produktai su THC kiekiu iki 0,2% yra legalūs, tačiau situacija gali keistis. Visada patikrinkite naujausią informaciją.

Ateities perspektyvos ir kas laukia toliau

Šiuo metu vyksta dešimtys klinikinių tyrimų, kurie tiria CBD poveikį įvairioms neurologinėms ligoms. Artimiausioje ateityje tikimės daugiau duomenų apie CBD veiksmingumą gydant Parkinson ligą, autizmą, ADHD ir kitas būkles.

Viena iš įdomiausių tyrimų krypčių yra CBD derinimas su kitais junginiais. Pavyzdžiui, CBD ir psilocibino derinys depresijos gydymui arba CBD su specifiniais terpentais neurologinių funkcijų gerinimui.

Technologijų plėtra taip pat atveria naujas galimybes. Nanoemulsijos technologija leidžia sukurti CBD produktus, kurie geriau įsisavinami organizme. Tai reiškia, kad mažesnės dozės gali duoti geresnį poveikį.

Personalizada medicina – dar viena sritis, kur CBD gali suvaidinti svarbų vaidmenį. Genetiniai tyrimai gali padėti nustatyti, kurie pacientai geriausiai reaguos į CBD gydymą ir kokios dozės bus optimalios.

Tačiau reikia išlikti realistams. CBD nėra stebuklingas vaistas, kuris išspręs visas neurologines problemas. Tai yra vienas iš daugelio įrankių, kuris gali papildyti tradicinius gydymo metodus.

Mano asmeninis požiūris į CBD per pastaruosius metus labai pasikeitė. Nuo skeptiko tapau atsargiu optimistu. Moksliniai duomenys aiškiai rodo, kad CBD turi terapinį potencialą neurologijos srityje, bet dar reikia daug tyrimų, kad galėtume pilnai suprasti jo galimybes ir apribojimus.

Jei svarstote CBD kaip gydymo galimybę, svarbiausia yra kalbėtis su kvalifikuotu sveikatos priežiūros specialistu. Jis gali padėti įvertinti, ar CBD tinka jūsų konkrečiai situacijai, ir prižiūrėti gydymo procesą. Neurologinės ligos yra sudėtingos, ir jų gydymas reikalauja profesionalaus požiūrio.

5 gruodžio, 2024

Kaip veikia automatinis internetinis teksto vertėjas: algoritmai, neuroniniai tinklai ir kalbų apdorojimo mokslas po gaubtu

Kai mašina pradeda „suprasti” kalbą

Prisimenu, kai pirmą kartą naudojau „Google Translate” – tai buvo kažkur 2007-aisiais, ir rezultatai buvo, švelniai tariant, juokingi. Verčiau kažkokį vokišką tekstą į lietuvių kalbą ir gavau tokią beprasmybių kratinį, kad net nesupratau, apie ką iš viso buvo kalba. Bet tada kažkas atsitiko – maždaug 2016-2017 metais vertimų kokybė staiga šoktelėjo taip aukštai, kad žmonės pradėjo kalbėti apie „mašinų revoliuciją”. Kas pasikeitė? Atsakymas – neuroniniai tinklai. Bet iki jų buvo ilgas kelias, ir jį verta suprasti, jei nori tikrai žinoti, kaip visa tai veikia.

Automatinis teksto vertimas – tai ne tik technologijų istorija. Tai istorija apie tai, kaip žmonės bandė išmokyti mašinas daryti kažką, kas žmogui atrodo visiškai natūralu, bet iš tikrųjų yra neįtikėtinai sudėtinga. Kalba nėra tik žodžių rinkinys. Ji pilna konteksto, kultūrinių niuansų, dviprasmybių, ironijos, humoro ir tūkstančio kitų dalykų, kuriuos mes suprantame intuityviai, bet labai sunkiai galime paaiškinti algoritmui.

Nuo žodynų iki statistikos – pirmieji bandymai

Pirmieji automatinio vertimo bandymai buvo, tiesą sakant, gana naivūs. Idėja buvo paprasta: padaryk didelį žodyną, surašyk gramatikas, ir leisk kompiuteriui „versti” žodis po žodžio. Tai vadinama taisyklėmis pagrįstu vertimu (angl. Rule-Based Machine Translation arba RBMT). Lingvistai rankiniu būdu kūrė taisykles – jei šis žodis yra veiksmažodis ir stovi šioje pozicijoje, tai versk jį taip, jei daiktavardis turi tokį galūnę, tai daryk štai taip.

Problema? Kalbos taisyklių yra begalė, ir kiekviena taisyklė turi išimčių. Lietuvių kalba – puikus pavyzdys. Mes turime septynis linksnius, sudėtingą veiksmažodžių sistemą, ir žodžių tvarka sakinyje gali keistis gana laisvai. Anglų kalboje žodžių tvarka yra griežta. Kaip mašinai paaiškinti, kad lietuviškai „Katė suvalgė pelę”, „Pelę suvalgė katė” ir „Suvalgė katė pelę” – visi šie sakiniai reiškia tą patį, tik su skirtingais akcentais? Taisyklėmis pagrįsti sistemai tai buvo košmaras.

Tada atėjo statistinis vertimas (SMT – Statistical Machine Translation). Čia idėja jau buvo visiškai kitokia ir, reikia pripažinti, gana elegantiškai paprasta: užuot rašius taisykles, leisk kompiuteriui mokytis iš didelių tekstų kiekių. Duok jam milijonus sakinių poromis – originalas ir vertimas – ir leisk jam pačiam išsiaiškinti, kokie žodžiai ir frazės atitinka vienas kitus.

Statistinis vertimas naudojo tikimybių skaičiavimą. Sistema iš esmės klausdavo: „Atsižvelgiant į šį šaltinio sakinį, koks yra labiausiai tikėtinas vertimas?” Tai buvo milžiniškas žingsnis į priekį. Bet ir čia buvo rimtų problemų – sistema vis tiek nesuprato konteksto plačiąja prasme, dažnai klysdavo su ilgesniais sakiniais, ir jos vertimai skambėdavo mechaniškai.

Neuroniniai tinklai – kai viskas pasikeitė

2014-2016 metais mokslininkų grupės, dirbančios tiek „Google”, tiek universitetuose, pristatė kažką, kas pakeitė žaidimo taisykles: neuroninius tinklus vertimui (Neural Machine Translation arba NMT). Ir čia prasideda tikrai įdomu.

Neuroninis tinklas – tai kompiuterinė sistema, kuri labai laisvai imituoja žmogaus smegenų neuronų veikimą. Tai sluoksniai „mazgų” (neuronų), kurie yra sujungti tarpusavyje ir perduoda informaciją. Kiekvienas ryšys turi svorį – skaičių, kuris parodo, kiek svarbi yra ta informacija. Mokymo metu šie svoriai nuolat koreguojami, kol sistema pradeda duoti teisingus atsakymus.

Pirmieji neuroniniai tinklai vertimui naudojo architektūrą, vadinamą koduotoju-dekoduotoju (encoder-decoder). Idėja tokia:

Koduotojas perskaito visą šaltinio sakinį ir sukuria jo „supresuotą” matematinę reprezentaciją – vektorių, kuris tarsi „sulaiko” viso sakinio prasmę.
Dekoduotojas ima tą vektorių ir generuoja vertimą žodis po žodžio.

Tai jau buvo daug geriau nei statistiniai metodai, bet vis tiek turėjo vieną didelę problemą: ilgiems sakiniams tas vienas vektorius tiesiog nesugebėdavo sutalpinti visos informacijos. Įsivaizduok, kad turi sudėti visą knygą į vieną sakinį – kažkas prarandama.

Sprendimas atėjo su dėmesio mechanizmu (attention mechanism). Tai buvo tikras proveržis. Dabar dekoduotojas, generuodamas kiekvieną vertimo žodį, gali „žiūrėti” atgal į visus šaltinio sakinio žodžius ir nuspręsti, kurie iš jų yra svarbiausi šiuo konkrečiu momentu. Verčiant žodį „katė”, sistema žiūri į šaltinio žodį „cat”. Verčiant veiksmažodį, ji žiūri į atitinkamą šaltinio veiksmažodį. Tai labai panašu į tai, kaip žmogus vertėjas skanuoja originalą, kol rašo vertimą.

Transformer architektūra – šiuolaikinis standartas

2017 metais „Google Brain” komanda publikavo straipsnį pavadinimu „Attention Is All You Need” (Dėmesys yra viskas, ko reikia). Tai buvo vienas įtakingiausių mokslinių straipsnių pastarojo dešimtmečio dirbtinio intelekto srityje. Jame pristatyta Transformer architektūra – tai, kas šiandien yra beveik visų modernių kalbos modelių pagrindas.

Transformer visiškai atsisakė ankstesnių architektūrų sekvencinės logikos (kur informacija buvo apdorojama žodis po žodžio) ir pasiūlė kažką radikaliai kitokio: lygiagrečią dėmesio apdorojimą. Vietoj to, kad žiūrėtum į žodžius po vieną, Transformer vienu metu žiūri į visus žodžius ir skaičiuoja, kaip kiekvienas žodis susijęs su kiekvienu kitu žodžiu sakinyje.

Tai vadinama savęs dėmesiu (self-attention). Sakinyje „Bankas prie upės buvo šlapias” žodis „bankas” turi ryšį su žodžiu „upė” ir „šlapias” – ir Transformer tai supranta, nes mato visus šiuos ryšius vienu metu. Todėl jis gali teisingai interpretuoti, kad čia kalbama apie upės krantą, o ne finansų įstaigą.

Praktiškai tai reiškia:

Geresnį konteksto supratimą net labai ilguose sakiniuose
Galimybę mokyti modelius daug greičiau (nes apdorojimas yra lygiagretus)
Žymiai geresnę dviprasmybių sprendimą
Natūraliau skambančius vertimus

Šiandien tokios sistemos kaip „DeepL”, „Google Translate” (naujesnės versijos), „Microsoft Translator” – visos jos remiasi Transformer architektūra arba jos modifikacijomis.

Kaip sistema iš tikrųjų „skaito” tekstą

Čia norėčiau sustoti ir paaiškinti vieną dalyką, kuris dažnai lieka neaiškus: kaip kompiuteris iš viso „supranta” žodžius? Juk kompiuteris dirba tik su skaičiais.

Atsakymas – žodžių vektoriai (word embeddings). Kiekvienas žodis paverčiamas dideliu skaičių masyvu (vektoriumi), kuris tarsi „aprašo” to žodžio prasmę matematinėje erdvėje. Ir čia prasideda tikra magija: žodžiai, kurie turi panašią prasmę, turi panašius vektorius. Žodžiai „šuo” ir „katė” bus matematiškai arčiau vienas kito, nei „šuo” ir „automobilis”.

Dar įdomiau – šiuose vektoriuose galima atlikti matematinius veiksmus su prasme. Klasikinis pavyzdys: vektorius(„karalius”) – vektorius(„vyras”) + vektorius(„moteris”) ≈ vektorius(„karalienė”). Tai nėra triukas – tai tikra matematika, kuri atspindi kalbos struktūrą.

Šiuolaikiniuose modeliuose naudojami ne tik žodžių, bet ir subžodžių vektoriai (subword tokenization). Tai reiškia, kad žodžiai yra skaidomi į mažesnius gabalus – tokius kaip šaknys, galūnės, priešdėliai. Lietuvių kalbai tai ypač svarbu, nes mūsų žodžiai gali turėti labai daug formų. Žodis „namas” gali tapti „namo”, „name”, „namai”, „namų”, „namuose” ir t.t. – ir sistema turi suprasti, kad tai vis tas pats konceptas.

Praktinis patarimas: jei naudoji automatinį vertėją ir gauni keistus rezultatus, pabandyk supaprastinti sakinį. Ilgi, sudėtingi sakiniai su daug šalutinių sakinių dažnai duoda blogesnius rezultatus nei keli trumpi, aiškūs sakiniai.

Duomenys – tikrasis vertėjų variklis

Yra vienas dalykas, apie kurį kalbama mažiau nei apie algoritmus, bet kuris yra lygiai tiek pat svarbus: duomenys. Neuroniniai tinklai yra tik įrankis – jų kokybė priklauso nuo to, kuo jie buvo „maitinami”.

Šiuolaikiniai vertimo modeliai buvo apmokyti su astronomiškai dideliais tekstų kiekiais. „Google Translate” naudojo, be kita ko, Europos Parlamento posėdžių protokolus (kurie yra išversti į visas ES kalbas), Jungtinių Tautų dokumentus, milijardus interneto puslapių. Tai yra milijardai žodžių porų.

Bet čia yra ir problema: jei duomenys yra šališki, modelis bus šališkas. Jei didžioji dalis mokymo duomenų yra iš formalių dokumentų, modelis gali prastai versti šnekamąją kalbą, žargoną ar socialinių tinklų tekstus. Jei tam tikros kalbų poros turi mažiau mokymo duomenų (o taip nutinka su mažesnėmis kalbomis, tarp jų ir lietuvių), vertimų kokybė bus prastesnė.

Lietuvių kalba šiuo atžvilgiu yra vidutinėje padėtyje. Mes turime pakankamai duomenų, kad vertimas veiktų priimtinai, bet toli gražu ne tiek, kiek anglų-ispanų ar anglų-prancūzų poros. Todėl verčiant iš lietuvių į kitas kalbas ar atvirkščiai, vis dar galima pastebėti klaidų, kurios su populiaresnėmis kalbomis neatsitiktų.

Dar vienas svarbus momentas: daugelis sistemų naudoja tarpinę kalbą (pivot language). Jei nori išversti iš lietuvių į japonų, sistema gali iš tikrųjų versti lietuvių → anglų → japonų. Tai reiškia, kad klaidos gali kauptis dviejuose etapuose. Kai gauni keistą vertimą, kartais tai yra dėl šios priežasties.

Kas dar neveikia gerai ir kodėl

Nepaisant visų šių technologinių stebuklų, automatinis vertimas vis dar turi rimtų silpnybių. Ir čia norėčiau būti atviras, nes kartais žmonės pervertina šias sistemas.

Ironija ir humoras – tai turbūt sunkiausia sritis. Kai sakome „Taip, žinoma, labai mėgstu stovėti eilėje” – žmogus iš tono ir konteksto supranta ironiją. Mašina dažniausiai – ne. Ji verčia tiesioginę prasmę, ir ironija dingsta.

Kultūriniai idiomų vertimas taip pat dažnai stringa. „Laikyti akmenį už krūtinės” lietuviškai reiškia turėti slaptą piktą ketinimą. Jei sistema verčia žodis po žodžio, gausite kažką apie akmenį ir krūtinę, kas anglakalbiam skaitytojui nieko nereiškia.

Kontekstas tarp sakinių – dar viena problema. Šiuolaikiniai modeliai paprastai apdoroja tekstą gabalais, ir kartais praranda ryšį tarp tolimų sakinio dalių. Jei pirmame sakinyje paminėjai „Marija”, o penkiame sakinyje rašai „ji” – sistema ne visada teisingai supranta, apie ką kalba.

Specifinė terminija – medicinos, teisės, technikos tekstai reikalauja tikslios terminologijos, ir automatiniai vertėjai čia dažnai klysta. Jie gali žinoti bendrą žodžio prasmę, bet ne specifinį terminą, naudojamą tam tikroje srityje.

Praktinės rekomendacijos, jei naudoji automatinį vertimą profesionaliai:

Visada patikrink svarbius terminus rankiniu būdu
Niekada nenaudok automatinio vertimo teisinių ar medicininių dokumentų galutinei versijai be žmogaus peržiūros
Jei verčiamas tekstas bus viešas, paprašyk gimtakalbio peržiūrėti
Naudok „DeepL” sudėtingesniems tekstams – daugelio tyrimų duomenimis, jo kokybė dažnai pranoksta „Google Translate” europietiškoms kalboms

Kai mašina ir žmogus dirba kartu – ir ką tai reiškia mums visiems

Galiausiai norisi pakalbėti apie tai, kur visa tai veda ir ką tai reiškia praktiškai. Nes technologijos yra įdomios, bet svarbiausia – kaip jos keičia mūsų gyvenimą.

Profesionalūs vertėjai šiandien dažnai naudoja vadinamą mašininio vertimo po redagavimo (MTPE – Machine Translation Post-Editing) metodą. Tai reiškia, kad mašina padaro pirmąjį vertimą, o žmogus jį patikrina ir pataiso. Tyrimai rodo, kad tai gali padidinti vertėjo produktyvumą 30-50%. Tai nereiškia, kad vertėjai tampa nereikalingi – jie tampa kokybės kontrolieriais ir kūrybiniais sprendimų priėmėjais.

Kalbant apie ateitį – modeliai kaip GPT-4, Claude ar Gemini jau rodo, kad ribos tarp „vertimo” ir „kalbos supratimo” nyksta. Šie modeliai ne tik verčia – jie gali adaptuoti tekstą skirtingoms auditorijoms, paaiškinti kultūrinius skirtumus, pasiūlyti alternatyvius vertimus su paaiškinimais. Tai jau yra kažkas daugiau nei mechaninis vertimas.

Bet čia norėčiau pasakyti kažką, kas gal nuskambės netikėtai: kuo geriau suprantame, kaip šios sistemos veikia, tuo geriau galime jas naudoti. Žmogus, kuris žino, kad sistema gali klysti su idiomomis, su ironija, su specifine terminija – tas žmogus naudos ją protingai. O žmogus, kuris mano, kad mašina visada teisi – tas gali padaryti rimtų klaidų.

Automatinis vertimas yra nuostabus įrankis. Jis leidžia mums bendrauti su žmonėmis visame pasaulyje, skaityti tekstus kalbomis, kurių nemokame, dirbti tarptautinėje aplinkoje. Bet jis yra įrankis – ne magas. O geriausiai įrankius naudoja tie, kurie supranta, kaip jie veikia. Tikiuosi, kad po šio straipsnio tu esi šiek tiek arčiau to supratimo.