Justiitsministeerium töötab välja seadusemuudatust, mille alusel võiks jagada avalikke keeleandmeid tehisarule teadus- ja arendustegevuseks.
Justiits- ja digiminister Liisa Pakosta ütles, et muudatusega võiksid kõik
avalikud tekstid, millele ei ole pandud keeldumismärget
, olla loetavad tehisaru poolt. Tehisaru "mõtlemist" loetakse siin samasuguseks nagu teadlaste oma.
avalikud tekstid, millele ei ole pandud keeldumismärget
Tõlge fraasile: avalikud tekstid, millele ei ole pandud keeldumismärget
EN
public texts that do not have an opt-out mark
Pakosta rääkis, et küsimus on selles, kuidas täpsustada praegu kättesaadavate andmete kasutamise
õiguslikku raamistikku
. Ta märkis, et 13 aastat tagasi, kui Eesti Keele Instituut hakkas
keelemudelit arendama
, oleks pidanud õiguslikud alused selgemalt lahendama.
õiguslikku raamistikku
Tõlge fraasile: õiguslikku raamistikku
EN
legal framework
keelemudelit arendama
Tõlge fraasile: keelemudelit arendama
EN
developing a language model
Esmaspäeval arutasid minister, ministeeriumide ja teadlaste esindajad riigikogu kultuurikomisjonis, millist rolli
keelekorpused mängivad tehisaru arendamisel
. Nad rääkisid, mida teha, et
tehisaru räägiks tulevikus paremat eesti keelt
.
keelekorpused mängivad tehisaru arendamisel
Tõlge fraasile: keelekorpused mängivad tehisaru arendamisel
EN
language corpora play a role in the development of artificial intelligence
tehisaru räägiks tulevikus paremat eesti keelt
Tõlge fraasile: tehisaru räägiks tulevikus paremat eesti keelt
EN
artificial intelligence will speak better Estonian in the future
Kultuurikomisjoni esimees Liina Kersna ütles, et Eestil on
põhiseaduslik kohustus hoolitseda
, et tehisaru räägiks võimalikult head eesti keelt. Ta rõhutas, et see on
keele püsimajäämise jaoks väga oluline
.
põhiseaduslik kohustus hoolitseda
Tõlge fraasile: põhiseaduslik kohustus hoolitseda
EN
constitutional obligation to take care
keele püsimajäämise jaoks väga oluline
Tõlge fraasile: keele püsimajäämise jaoks väga oluline
EN
very important for the survival of the language
Kersna sõnul on laual kaks võimalust: esiteks
keelekorpuse arendamine
, mida tehisaru arendajad saaksid kasutada, ja teiseks
eestisisene või Euroopas koostöös loodud tehisaru platvorm
. See võimaldaks riigil rohkem kasutada oma andmeid uute teenuste arendamiseks.
keelekorpuse arendamine
Tõlge fraasile: keelekorpuse arendamine
EN
development of the language corpus
eestisisene või Euroopas koostöös loodud tehisaru platvorm
Tõlge fraasile: eestisisene või Euroopas koostöös loodud tehisaru platvorm
EN
a domestic or European collaborative artificial intelligence platform
Kersna rõhutas, et mida
kvaliteetsem tekst on tehisaru treenimiseks
, seda paremini see suhtleb. Seetõttu on oluline, et
sisendmaterjal oleks hea kvaliteediga
.
kvaliteetsem tekst on tehisaru treenimiseks
Tõlge fraasile: kvaliteetsem tekst on tehisaru treenimiseks
EN
higher quality text is for training artificial intelligence
sisendmaterjal oleks hea kvaliteediga
Tõlge fraasile: sisendmaterjal oleks hea kvaliteediga
EN
the input material should be of good quality
Ta lisas, et juristid ei ole leidnud seaduses punkti, mis keelaks tehisarul avalike tekstide kasutamist. Justiitsministeerium on saatnud
kooskõlastusringile väljatöötamiskavatsuse
, mis ütleb, et avalikke keeleandmeid tohib tehisaru kasutada teadus- ja arendustegevuseks.
kooskõlastusringile väljatöötamiskavatsuse
Tõlge fraasile: kooskõlastusringile väljatöötamiskavatsuse
EN
draft proposal for the coordination round
Millal seadusemuudatus valitsuse või riigikoguni jõuab, pole veel selge.
The Ministry of Justice is developing a legislative amendment that would allow the sharing of public language data for artificial intelligence for scientific and development activities.
Minister of Justice and Digital Affairs Liisa Pakosta said that with the amendment, all public texts without an opt-out mark could be readable by artificial intelligence. The "thinking" of AI is considered here to be similar to that of scientists.
Pakosta said that the issue is how to clarify the legal framework for the use of currently available data. She noted that 13 years ago, when the Estonian Language Institute began developing a language model, the legal foundations should have been addressed more clearly.
On Monday, the minister, representatives of ministries, and scientists discussed in the Riigikogu Cultural Committee the role that language corpora play in the development of artificial intelligence. They talked about what to do so that AI would speak better Estonian in the future.
Chair of the Cultural Committee Liina Kersna said that Estonia has a constitutional obligation to ensure that artificial intelligence speaks the best possible Estonian. She emphasized that this is very important for the survival of the language.
According to Kersna, there are two options on the table: first, the development of a language corpus that AI developers could use, and second, a domestic or European collaborative AI platform. This would allow the state to use its data more for the development of new services.
Kersna emphasized that the higher the quality of the text for training AI, the better it will communicate. Therefore, it is important that the input material is of good quality.
She added that lawyers have not found a point in the law that would prohibit AI from using public texts. The Ministry of Justice has sent a draft proposal for consultation, stating that public language data may be used by AI for scientific and development activities.
It is not yet clear when the legislative amendment will reach the government or the Riigikogu.