Keelemudelid ja eesti keel

Keelemudelid ja eesti keel

EN

Language Models and the Estonian Language

. Nad küsisid viielt mudelilt küsimusi eesti keelest ja kultuurist.
EN

Novaator conducted an experiment. They asked five models questions about the Estonian language and culture.

Mudelid vastasid 20 küsimusele. Küsimused olid kahes osas: keel ja kultuur. Näiteks küsimused olid sõnast "jäääär" ja "semiosfäär".
EN

The models answered 20 questions. The questions were divided into two parts: language and culture. For example, questions included terms like "jäääär" and "semiosfäär".

. Grok teadis, et "pudsunudsija" tähendab võru keeles "tolmuimeja".
EN

Grok provided the best answers. Grok knew that "pudsunudsija" means "tolmuimeja" in Võro.

Professor Kairit Sirts ütles, et . Siis saavad nad juhiseid.
EN

Professor Kairit Sirts said that models learn from texts. Then they receive instructions.

Kultuuri küsimustes oli mudelitel raskusi. Mudelid saavad kultuuri teadmisi inglise keelest.
EN

The models struggled with culture-related questions. Models acquire knowledge about culture from English.

Professor Tanel Alumäe ütles, et . Mudelid saavad hästi hakkama sõnadega, aga grammatikaga on probleeme.
EN

Professor Tanel Alumäe said that models are good in Estonian but make mistakes. Models handle words well but have problems with grammar.

Teadlased loovad avatud eestikeelse mudeli. See tähendab, et kõik materjal on avalik. Mudelit kasutatakse Eesti Keele Instituudi andmetel.
EN

Scientists are creating an open-source Estonian language model. This means all materials are public. The model will use data from the Estonian Language Institute.

Sirts ütles, et . Eesmärk on luua mudel, mida saab kasutada oma serveris. See on oluline, kui andmed peavad olema turvalised.
EN

Sirts said the goal is not to compete with large models. The goal is to create a model that can be used on their own server. This is important when data needs to be secure.

Alumäe ütles, et on vaja . Avatud mudel aitab seda teha.
EN

Alumäe said it is necessary to reduce dependence on USA and Chinese servers. An open-source model helps achieve this.

Sirts ütles, et on oluline hoida oskusi. Eestlased saavad parandada mudelit ja hoida kontrolli.
EN

Sirts said it is important to maintain skills. Estonians can improve the model and maintain control.