Ministry Plans Legislative Amendment for Sharing Public Language Data with AI
Justiitsministeerium töötab välja seadusemuudatust, mille alusel võiks jagada avalikke keeleandmeid tehisarule teadus- ja arendustegevuseks.
EN
The Ministry of Justice is developing a legislative amendment that would allow the sharing of public language data for artificial intelligence for scientific and development activities.
Justiits- ja digiminister Liisa Pakosta ütles, et muudatusega võiksid kõik
avalikud tekstid, millele ei ole pandud keeldumismärget
avalikud tekstid, millele ei ole pandud keeldumismärget
Tõlge fraasile: avalikud tekstid, millele ei ole pandud keeldumismärget
ENpublic texts that do not have an opt-out mark
, olla loetavad tehisaru poolt. Tehisaru "mõtlemist" loetakse siin samasuguseks nagu teadlaste oma.
EN
Minister of Justice and Digital Affairs Liisa Pakosta said that with the amendment, all public texts without an opt-out mark could be readable by artificial intelligence. The "thinking" of AI is considered here to be similar to that of scientists.
Pakosta rääkis, et küsimus on selles, kuidas täpsustada praegu kättesaadavate andmete kasutamise
õiguslikku raamistikku
õiguslikku raamistikku
Tõlge fraasile: õiguslikku raamistikku
ENlegal framework
. Ta märkis, et 13 aastat tagasi, kui Eesti Keele Instituut hakkas
keelemudelit arendama
keelemudelit arendama
Tõlge fraasile: keelemudelit arendama
ENdeveloping a language model
, oleks pidanud õiguslikud alused selgemalt lahendama.
EN
Pakosta said that the issue is how to clarify the legal framework for the use of currently available data. She noted that 13 years ago, when the Estonian Language Institute began developing a language model, the legal foundations should have been addressed more clearly.
Esmaspäeval arutasid minister, ministeeriumide ja teadlaste esindajad riigikogu kultuurikomisjonis, millist rolli
keelekorpused mängivad tehisaru arendamisel
keelekorpused mängivad tehisaru arendamisel
Tõlge fraasile: keelekorpused mängivad tehisaru arendamisel
ENlanguage corpora play a role in the development of artificial intelligence
. Nad rääkisid, mida teha, et
tehisaru räägiks tulevikus paremat eesti keelt
tehisaru räägiks tulevikus paremat eesti keelt
Tõlge fraasile: tehisaru räägiks tulevikus paremat eesti keelt
ENartificial intelligence will speak better Estonian in the future
.
EN
On Monday, the minister, representatives of ministries, and scientists discussed in the Riigikogu Cultural Committee the role that language corpora play in the development of artificial intelligence. They talked about what to do so that AI would speak better Estonian in the future.
Kultuurikomisjoni esimees Liina Kersna ütles, et Eestil on
põhiseaduslik kohustus hoolitseda
põhiseaduslik kohustus hoolitseda
Tõlge fraasile: põhiseaduslik kohustus hoolitseda
ENconstitutional obligation to take care
, et tehisaru räägiks võimalikult head eesti keelt. Ta rõhutas, et see on
keele püsimajäämise jaoks väga oluline
keele püsimajäämise jaoks väga oluline
Tõlge fraasile: keele püsimajäämise jaoks väga oluline
ENvery important for the survival of the language
.
EN
Chair of the Cultural Committee Liina Kersna said that Estonia has a constitutional obligation to ensure that artificial intelligence speaks the best possible Estonian. She emphasized that this is very important for the survival of the language.
Kersna sõnul on laual kaks võimalust: esiteks
keelekorpuse arendamine
keelekorpuse arendamine
Tõlge fraasile: keelekorpuse arendamine
ENdevelopment of the language corpus
, mida tehisaru arendajad saaksid kasutada, ja teiseks
eestisisene või Euroopas koostöös loodud tehisaru platvorm
eestisisene või Euroopas koostöös loodud tehisaru platvorm
Tõlge fraasile: eestisisene või Euroopas koostöös loodud tehisaru platvorm
ENa domestic or European collaborative artificial intelligence platform
. See võimaldaks riigil rohkem kasutada oma andmeid uute teenuste arendamiseks.
EN
According to Kersna, there are two options on the table: first, the development of a language corpus that AI developers could use, and second, a domestic or European collaborative AI platform. This would allow the state to use its data more for the development of new services.
Kersna rõhutas, et mida
kvaliteetsem tekst on tehisaru treenimiseks
kvaliteetsem tekst on tehisaru treenimiseks
Tõlge fraasile: kvaliteetsem tekst on tehisaru treenimiseks
ENhigher quality text is for training artificial intelligence
, seda paremini see suhtleb. Seetõttu on oluline, et
sisendmaterjal oleks hea kvaliteediga
sisendmaterjal oleks hea kvaliteediga
Tõlge fraasile: sisendmaterjal oleks hea kvaliteediga
ENthe input material should be of good quality
.
EN
Kersna emphasized that the higher the quality of the text for training AI, the better it will communicate. Therefore, it is important that the input material is of good quality.
Ta lisas, et juristid ei ole leidnud seaduses punkti, mis keelaks tehisarul avalike tekstide kasutamist. Justiitsministeerium on saatnud
kooskõlastusringile väljatöötamiskavatsuse
, mis ütleb, et avalikke keeleandmeid tohib tehisaru kasutada teadus- ja arendustegevuseks.
EN
She added that lawyers have not found a point in the law that would prohibit AI from using public texts. The Ministry of Justice has sent a draft proposal for consultation, stating that public language data may be used by AI for scientific and development activities.
Millal seadusemuudatus valitsuse või riigikoguni jõuab, pole veel selge.
EN
It is not yet clear when the legislative amendment will reach the government or the Riigikogu.