Eksperiment: milline keelemudel tunneb eesti keelt ja kultuuri

Eksperiment: milline keelemudel tunneb eesti keelt ja kultuuri

EN

Experiment: Which Language Model Understands Estonian Language and Culture

Kui Arno isaga koolimajja jõudis, oli . See on üks vastus, mida võib saada ilt.
Novaator uuris teadlastelt ja tegi eksperimendi, et teada saada, kas , kui küsimused puudutavad eesti keelt ja kultuuri.
Eksperimendis kasutati viit : Grok, Claude Sonnet, Gemini, Chat GPT ja Mistral. Lisaks testiti Tallinna Tehnikaülikooli, Tartu Ülikooli ja Eesti Keele Instituudi juturobotit.
Kõik mudelid vastasid 20 küsimusele. Küsimused olid jagatud kaheks: . Näiteks küsimustes oli teema Juri Lotmani " " ja lause lõpetamine "Kui Arno isaga koolimajja jõudis…".
Keeleküsimustes testiti mudelite oskust ja ka seda, "jäääär".
Tartu Ülikooli professor Kairit Sirts ütles, et tulemused olid üllatavad. Grok oli kõige tundlikum eesti keele suhtes. Näiteks teadis Grok, kuidas öelda võro keeles "tolmuimeja": "pudsunudsija".
Sirts selgitas, et . Esimene etapp on tekstide peal treenimine, siis järgneb , kus mudelile näidatakse ülesandeid ja juhiseid.
Kultuuriloo küsimustes erinesid tulemused vähe. Sirts rääkis, et mudelid saavad , kuid eesti keelele spetsiifilist infot neil vähem.
Küsimuste sõnastus mängib suurt rolli. Näiteks küsimus "Mitu täishäälikut on sõnas 'jäääär'?" on pigem matemaatiline.
Tallinna Tehnikaülikooli professor Tanel Alumäe ütles, et suured keeleandmed aitavad ka väiksemate keelte kvaliteeti tõsta. Eesti keeles on mudelid juba väga head, kuid teevad siiski vigu.
Alumäe testis mudelite keeleoskust sügisel. Ta leidis, et mudelid saavad hästi hakkama sõnade käänamisega, kuid täpse grammatikaga on probleeme.
Novaatori eksperimendi tulemused näitasid, et mudelitel oli keeruline anda lausele "Jüri sai palgi pantimise eest paraja palga" mitu tähendust.
Eesti teadlased arendavad avatud eestikeelset mudelit. See tähendab, et kogu treeningmaterjal on avalik ja kontrollitav. Eesti mudeli tulemused jäävad teistele alla, kuid teadlased plaanivad treenida suuremat mudelit.
Sirts selgitas, et mudeli treenimiseks kasutatakse Eesti Keele Instituudi andmeid ja veebiandmeid. Kuid mudel ei pruugi teada kultuuriloo küsimusi, kui ta pole lugenud näiteks "Kevade" raamatut.
Jaanus ja Albert on tegelased eesti kultuslauludes. Näiteks Grok ütles, et nad destilleerivad viina, ja Gemini mainis, nad räägivas raadios.
Sirts ütles, et eesmärk ei ole konkureerida suurte kommertsmudelitega, vaid luua , mida saab enda serveris kasutada. See on oluline, kui on vaja hoida andmeid konfidentsiaalsena.
Alumäe lisas, et on vaja vähendata sõltuvust USA ja Hiina serveritest. Avatud mudel võimaldab kasutada andmeid ilma, et need lekivad välja.
Sirts arvas, et on oluline luua ja hoida kompetentsi. Tehnoloogiaettevõtted ei peaks dikteerima tingimusi ja hindu. Eestlane saab parandada avatud mudelit eesti keele tasemel ja .
When Arno and his father arrived at the schoolhouse, it had already burned down. This is one of the responses that can be obtained from a language model trained on Estonian-language material.
Novaator consulted researchers and conducted an experiment to find out whether elementary school students can trust technology when it comes to questions about Estonian language and culture.
The experiment used five widely known language models: Grok, Claude Sonnet, Gemini, Chat GPT, and Mistral. Additionally, chatbots from Tallinn University of Technology, the University of Tartu, and the Institute of the Estonian Language were tested.
All models answered 20 questions. The questions were divided into two categories: Estonian language and Estonian cultural history. For example, topics included Juri Lotman's "semiosphere" and completing the sentence "When Arno and his father arrived at the schoolhouse…".
Language questions tested the models' ability to understand dialects and, for instance, how many vowels are in the word "jäääär".
University of Tartu professor Kairit Sirts said the results were surprising. Grok was the most sensitive to Estonian language. For example, Grok knew how to say "dust remover" in Võro: "pudsunudsija".
Sirts explained that model training works in several stages. The first stage is training on texts, followed by fine-tuning, where tasks and instructions are shown to the model.
Cultural history questions showed little variation in results. Sirts mentioned that models gain cultural knowledge from English-language training but have less specific information for Estonian.
The wording of questions plays a big role. For example, the question "How many vowels are in the word 'jäääär'?" is more mathematical.
Tallinn University of Technology professor Tanel Alumäe stated that large language datasets help improve the quality of smaller languages. Estonian-language models are already very good but still make mistakes.
Alumäe tested the models' language skills in the fall. He found that models handle word inflection well but struggle with precise grammar.
The results of Novaator's experiment showed that models had difficulty providing multiple meanings for the sentence "Jüri earned a decent salary for pawning a log."
Estonian researchers are developing an open Estonian-language model. This means all training material is public and verifiable. Estonian model results lag behind others, but researchers plan to train a larger model.
Sirts explained that the model is trained using data from the Institute of the Estonian Language and web data. However, the model may not know answers to cultural history questions if it hasn't read, for example, the book "Kevade".
Jaanus and Albert are characters in Estonian cult songs. For example, Grok said they distill alcohol, and Gemini mentioned they speak on the radio.
Sirts said the goal is not to compete with large commercial models but to create an open Estonian-language model that can be used on one's own server. This is important when data confidentiality is needed.
Alumäe added that it is necessary to reduce dependence on US and Chinese servers. An open model allows data usage without leakage.
Sirts believed it is important to create and maintain competence. Technology companies should not dictate terms and prices. Estonians can improve the open model at the Estonian language level and maintain control.