Vyksta Klausimų–atsakymų porų tekstyno sukūrimas

Teikiama nuo2024-02-28 12:00
Teikiama iki2024-04-30 17:00
Finansavimo suma931 700.00
Pareiškėjo tipasViešasis sektorius
Projektų atrankos būdasKonkursas
RegionasNetaikomas
Atsakinga institucijaEkonomikos ir inovacijų ministerija
ProgramaNaujos kartos Lietuva
Administruojančioji institucijaCentrinė projektų valdymo agentūra

Finansuojamos projektų veiklosVeiklos nr.Veiklos pavadinimas
05-002-01-07-08-02-01-03Klausimų–atsakymų porų tekstyno sukūrimas
Tikslinės grupėsMokslo ir studijų įstaigos
Galimi pareiškėjaiMokslo ir studijų įstaigos
Pareiškėjo tipasViešasis sektorius
Galimi partneriaiMokslo ir studijų įstaigos
Didžiausia galima skirti finansavimo lėšų suma projektui įgyvendinti931 700.00
Finansuojamoji dalis100 proc.
Finansavimo formaDotacija
Reikalavimai projektams1. Pagal Aprašą remiama veikla – kalbinių išteklių dirbtinio intelekto technologijų sprendimų poreikiams plėtra (Projektas „Klausimų-atsakymų porų tekstyno sukūrimas“).

2. Galimi pareiškėjai: mokslo ir studijų įstaigos.

3. Projekto veiklos turi būti įgyvendintos iki 2026 m. balandžio 30 d.

4. Šiuo Aprašu finansuojamas 1 projektas, kuriam įgyvendinti skiriama iki 770 000 Eur (septynių šimtų septyniasdešimt tūkstančių eurų) Ekonomikos gaivinimo ir atsparumo didinimo priemonės lėšų ir iki 161 700 Eur ( šimto šešiasdešimt vieno tūkstančio septynių šimtų eurų) Lietuvos Respublikos valstybės biudžeto lėšų, skirtų netinkamam pridėtinės vertės mokesčiui (toliau – PVM) apmokėti. PVM gali būti finansuojamas tik Projektų administravimo ir finansavimo taisyklių VII skyriaus 4 skirsnyje nustatyta tvarka.

5. Vienas pareiškėjas gali pateikti tik vieną PĮP, parengtą pagal Projektų administravimo ir finansavimo taisyklių 1 priede pateiktą formą.

6. Projektas turi atitikti bendruosius projektų atrankos kriterijus, nustatytus Projektų administravimo ir finansavimo taisyklių 2 priede.

7. Projekto komunikacijos ir informavimo veiksmai atliekami vadovaujantis Projektų administravimo ir finansavimo taisyklių VIII skyriaus „Kiti projektų reikalavimai“ pirmojo skirsnio „Informavimas apie projektą ir komunikaciją“ nuostatomis.

8. Projektų atranka atliekama konkurso būdu.

9. Privalomi techniniai reikalavimai klausimų - atsakymų tekstyno sukūrimui:

9.1. Tekstyno apimtis – ne mažiau nei 15 mln. klausimų-atsakymų porų. Kuriant šį išteklių privalu paisyti atitinkamų tekstynų kūrimui taikomų kriterijų, susijusių su tekstynų tipu, dydžiu ir atskirų jo dalių proporcijų subalansuotumu, tęstinumu, reprezentatyvumu (reikiamos kalbos ir / ar jos atmainų atspindėjimu), papildomu apdorojimu (kodavimu / anotavimu), tekstyne numatytų sukaupti tekstų pobūdžiu.

9.2. Į tekstyną turi būti įtraukti tik tekstai, neapriboti jokiomis platinimo teisėmis. Jame turi atsispindėti unikali lietuviška leksika, šio ištekliaus kūrimo atveju konkretizuojama kaip tikriniai žodžiai (asmenvardžiai, vietovardžiai, pavadinimai ir kt.), tokie atvejai privalo sudaryti ne mažiau kaip 30% visų tekstų (klausimų ir / ar atsakymų). Siekiant išpildyti šį reikalavimą tekstynas turi būti anotuotas sužymint jame aktualias duomenų kategorijas, atitinkančias BDAR apibrėžtus įvardintų esybių (angl. named entities) tipus, tokius kaip asmenų vardai ir pavardės, vietos ir vietovės, organizacijų pavadinimai, kt. Duomenys turi būti anotuoti naudojant BIO arba analogiškus standartus ir pateikti CSV (angl. coma-separated values) arba TSV (angl. tab-separated values) formatu viena rinkmena arba daugiau rinkmenų. Įvardintų esybių anotavimo klaidų skaičius negali viršyti 0,5 %.

9.3. Įvertinus visuomenės veiklos sritis, kuriose tokio pobūdžio ištekliai (tekstynai) ir sprendimai (bendravimo robotai) yra aktualūs, keliamas kriterijus atrenkant tekstus kuriamam ištekliui apimti šias jo panaudojimo šakas: 1) elektroninės valstybės paslaugos, pvz., socialiniais, sveikatos, finansų ir mokesčių, nekilnojamojo turto ir infrastruktūros, komunikacijos, kultūros, laisvalaikio ir pramogų, administraciniais, švietimo, mokslo ir darbo ir kt. klausimais; 2) elektroninės parduotuvės; 3) neformalūs pokalbiai / dialogai. Tekstyne sukaupti tekstai atitinkamai turi atspindėti skirtingą kalbą: 1) formalią (iki 70–90% viso tekstyno); 2) neformalią (iki 10–30% viso tekstyno).

9.4. Išteklių sudarysiančių klausimų ir atsakymų ilgiui (žodžių ir sakinių lygmenimis) taikomi šie kriterijai: 1) ne mažiau nei 40% į tekstyną įtrauktų klausimų privalo būti bent 9 žodžių ilgio, bent 20% klausimų turi būti sudaryti iš 2 sakinių; 2) ne mažiau nei 60% į tekstyną įtrauktų atsakymų privalo būti bent 5 žodžių ilgio, bent 40% atsakymų turi būti sudaryti iš 2 sakinių. Tekstyne sukaupti klausimai privalo apimti skirtingus klausimų tipus: 1) atvirus: kas (ko, kam, ką, kuo), kur (iš kur), kada, kodėl, kiek, kaip, koks, kuris, kelintas – bent 60% visų klausimų tekstyne; 2) uždarus: ar, gal – likusi klausimų dalis tekstyne. Visos klausimų-atsakymų poros tekstyne turi būti unikalios (nesikartojančios), tačiau galimas vieno iš kiekvienos poros dėmenų (klausimo arba atsakymo) pasikartojimas ne daugiau kaip 20 kartų.

9.5. Rengiant tekstyną būtų naudojami lokalūs, debesų ir hibridiniai kompiuterijos sprendimai. Atskiruose etapuose gali būti naudojami dirbtinio intelekto (DI), mašininio mokymo, statistiniai, taisykliniai ir hibridiniai metodai, pvz. dirbtiniai neuroniniai tinklai (transformatoriai (angl. transformers), rekurentiniai neuroniniai tinklai (angl. recurrent neural networks), ilgos trumpalaikės atminties (angl. long short-term memory), Markovo modeliai (angl. hidden Markov models), atraminių vektorių metodas (angl. support vector machine), sąlyginiai atsitiktiniai laukai (angl. conditional random fields), morfosintaksinės, semantinės, statistinės, loginės ir kt. taisyklės, hibridiniai metodai, DI ir taisyklinių metodų, DI ir įvairių žodynų, žodžių sąrašų kombinacijos, ir kt.

9.6. Tekstynas privalo būti pateikiamas mažiausiai dviejose atviros prieigos platformose (pvz., „Hugging Face“, CLARIN ar kt.) ir Lietuvos atvirų duomenų portale (data.gov.lt) ir prieinamas nemokamai.

10. Tekstyno validavimui keliami šie reikalavimai:

10.1. Reikia sukurti sprendimus ir priemones, leidžiančias iš klausimų-atsakymų tekstyno apmokyti mašininio ir (ar) giliojo mokymo sprendimus ir pademonstruoti jų veikimą bei įvertinti tikslumus.

10.2. Validavimas laikomas tinkamu, jei sprendimai pademonstruoja Tekstyno tinkamumą dialogų sistemų ir (ar) klausimų-atsakymų sistemų ir (ar) pokalbių robotų konstravimui.

10.3. Validavimo sprendimas turi neviršyti 15 proc. klaidų atsakant į uždarus ir į atvirus klausimus.

10.4. Validavimo imtis turi būti ne mažesnė nei 500 klausimų atviriems klausimams ir 500 klausimų uždariems klausimams. Validavimui turi būti naudojami klausimai, kurie nebuvo naudoti tekstyno formavimui ir mokymo procesui.

11. Dokumentavimo reikalavimai: a) turi būti detaliai apibūdinta Tekstyno struktūra, jo sudarymo ir anotavimo metodikos; b) aprašytos anotacijos ir jų reikšmė; c) pateikta detali statistika įvairiais pjūviais; e) sukurtam produktui turi būti taikomas detaliai dokumentuotas tarptautinis metaduomenų standartas. (pvz., Data Catalog Vocabulary (DCAT), Dublin Core Metadata Element Set (DCMES), The Component Metadata Initiative (CMDI) arba analogiški).

12. Teisiniai reikalavimai projektui:

12.1. Kuriant visus produktus (rezultatus) privalu laikytis: a) autorių ir gretutines teises reguliuojančių Lietuvos ir ES teisės aktų; b) duomenų apsaugą reguliuojančių Lietuvos ir ES teisės aktų; c) dirbtinio intelekto sistemoms rengiamų mokymo duomenų kokybę reguliuojančių Lietuvos ir Europos teisės aktų; d) Lietuvos ir Europos Sąjungos teisės aktų, reguliuojančių atvirų duomenų formavimo ir skelbimo principus. (ES direktyva dėl atvirųjų duomenų ir viešojo sektoriaus informacijos pakartotinio naudojimo BDAR (EUR-Lex - 32016R0679 - EN - EUR-Lex).

12.2. Kuriant visus produktus (rezultatus) rekomenduojama atsižvelgti į naujai ruošiamą dirbtinio intelekto aktą (EUR-Lex - 52021PC0206 - EN - EUR-Lex (europa.eu)).

12.3. Turi būti parengta ištekliaus naudojimo licencija, kuri užtikrina atvirą ir nemokamą prieigą prie ištekliaus. Visi surinkti tekstyno įrašai turi turėti atitinkamas licencijas.

13. Pagal Aprašą galimi partneriai – mokslo ir studijų įstaigos.

14. Jeigu projektas įgyvendinamas su partneriu, partnerystė projekte turi būti pagrįsta, teikti naudą ir prisidėti prie projekto tikslo įgyvendinimo ir iki PĮP pateikimo turi būti sudaryta jungtinės veiklos (partnerystės) sutartis. Jungtinės veiklos (partnerystės) sutartį pasirašo pareiškėjas ir projekto partneris. Jungtinės veiklos (partnerystės) sutartyje turi būti aiškiai išdėstyti šalių įsipareigojimai ir teisės projekto atžvilgiu (nurodytas kiekvienos šalies finansinis ir dalykinis indėlis į projektą, aptarta, kokias veiklas vykdys kiekviena šalis, numatyti projekto rezultatai ir kita) ir šalių atsakomybė, taip pat įsipareigojimai laikytis pagrindinių gerosios partnerystės praktikos taisyklių:

14.1. Partneris turi būti perskaitęs projekto įgyvendinimo planą ir susipažinęs su savo teisėmis ir pareigomis įgyvendinant projekto įgyvendinimo planą.

14.2. Įgyvendindamas projektą projekto vykdytojas privalo reguliariai konsultuotis su partneriu ir nuolat jį informuoti apie projekto įgyvendinimo eigą.

14.3. Visi projekto įgyvendinimo plano pakeitimai, turintys įtakos partnerio įsipareigojimams ir teisėms, prieš kreipiantis į įgyvendinančiąją instituciją pirmiausia turi būti suderinti su partneriu.

15. Projekto vykdytojas kiekvieną ketvirtį (iki mėnesio 8 d.) nuo projekto sutarties pasirašymo turi informuoti Lietuvos Respublikos ekonomikos ir inovacijų ministerijos (toliau – Ministerija) paskirtą atsakingą asmenį apie projekto veiklų įgyvendinimo pažangą. Informacija apie projekto veiklų įgyvendinimo pažangą skelbiama viešai https://eimin.lrv.lt/.
Horizontaliųjų principų ir kitų nuostatų reikalavimaiHorizontaliųjų principų (toliau – HP) reikalavimai

1. Neutralus – projektas negali daryti neigiamo poveikio horizontaliesiems principams.

2. Projekto įgyvendinimo metu neturi būti pažeidžiami HP: darnaus vystymosi, įskaitant reikšmingos žalos nedarymo principą; lygių galimybių ir nediskriminavimo (dėl lyties, rasės, tautybės, pilietybės, kalbos, kilmės, socialinės padėties, tikėjimo, religijos ar įsitikinimų, pažiūrų, amžiaus, lytinės orientacijos, etninės priklausomybės, negalios ar kt.), įskaitant prieinamumo visiems reikalavimo užtikrinimą (paslaugų, infrastruktūros, fizinės ar e. aplinkos sprendimai, informacijos, transporto prieinamumo ir pan.); inovatyvumo (kūrybingumo). Projekte neturi būti numatyta veiksmų, kurie turėtų neigiamą poveikį įgyvendinant HP.

3. Projektų atitikties Reikšmingos žalos nedarymo horizontaliajam principui vertinimo reikalavimų aprašas pateikiamas Aprašo 1 priede.

4. Veikla, vadovaujantis Europos Komisijos 2021 m. vasario 12 d. patvirtintomis Reikšmingos žalos nedarymo principo taikymo pagal Ekonomikos atsparumo ir didinimo priemonės reglamentą techninėmis gairėmis, atitinka reikšmingos žalos nedarymo principą, nes neturi neigiamo numatomo poveikio 6 aplinkos tikslams, nurodytiems 2020 m. birželio 18 d. Europos Parlamento ir Tarybos reglamento (ES) Nr. 2020/852 dėl sistemos tvariam investavimui palengvinti sukūrimo, kuriuo iš dalies keičiamas Reglamentas (ES) 2019/2088, 17 straipsnyje arba numatomas jų poveikis yra nereikšmingas, t. y. nedaro tiesioginio ir pirminio netiesioginio poveikio per visą gyvavimo ciklą.

Europos Sąjungos pagrindinių teisių chartijos (toliau – Chartija) reikalavimai

Projektas neturi pažeisti Chartijos pagrindinių teisių: orumo; asmenų, privataus ir šeimos gyvenimo, sąžinės ir saviraiškos laisvės; asmens duomenų; prieglobsčio ir apsaugos perkėlimo, išsiuntimo ar išdavimo atvejų; teisių į nuosavybę ir teisių užsiimti verslu; lyčių lygybės, vienodo požiūrio ir lygių galimybių, nediskriminavimo ir neįgaliųjų teisių; vaiko teisių; gerojo administravimo, veiksmingos teisinės gynybos, teisingumo; solidarumo ir darbuotojų teisių; aplinkos apsaugos.
Reikalavimai įgyvendinus projektų veiklas3 metai po projekto įgyvendinimo pabaigos privaloma viešinti projekto įgyvendinimo rezultatus, siekiant užtikrinti sukurtų išteklių populiarinimą.
Projektų įgyvendinimo trukmėProjekto veikla turi būti baigta įgyvendinti iki 2026 m. balandžio 30 d.
Išsamiau žr. Esinvesticijos.lt.
 
Grįžti