A/S “RIX Technologies” ir uzsākusi starpnozaru pētījumu Nr. 1.17 “Dokumenta reprezentācijas modeļa veidošana dokumentu automatizētas klasifikācijas augstas precizitātes nodrošināšanai”, ID: 1.2.1.1/18/A/003.

Pētījuma īstenošana uzsākta 2021. gada aprīlī un to plānots pabeigt 2022. gada maijā. Pētījums tiek īstenots sadarbībā ar Rīgas Austrumu Klīnisko Universitātes Slimnīcu.

Digitalizētu dokumentu klasificēšana, izmantojot mašīnmācīšanā balstītas teksta klasificēšanas metodes, ļauj iegūt augstas precizitātes rezultātus. Tomēr pat 90% precizitāte  (iepriekšējā pētījumā sasniegtā maksimālā precizitāte) nozīmē, ka katrs desmitais dokuments tiek vai nu klasificēts nepareizi vai arī netiek klasificēts. Tāds kļūdas procents var būt par šķērsli risinājuma veiksmīgai izmantošanai, tāpēc ir svarīgi izmantot katru iespēju klasificēšanas precizitāti uzlabot.

Pētījuma mērķis ir attīstīt iepriekšējā pētījumā (1.10 “Dokumentu klasificēšanas, indeksēšanas un piešķiršanas automatizēta procesa modeļa izveide”) izstrādāto dokumentu klasificēšanas ietvaru trīs virzienos.

  1. Dokumenta reprezentācija tiks paplašināta līdztekus vārdnīcas vektoram iekļaujot tajā arī dokumenta loģiskās struktūras reprezentāciju.
  2. Modelī tiks iekļautas iespējas analizēt iestādes vēsturisko dokumentu kopu, izveidot labi nodalītu, stabilu un balansētu klašu sistēmu.
  3. Tiks izveidots vienots ietvars skenēto un digitālo dokumentu klasificēšanai.

Pētījuma rezultātu ieviešana uzlabos automatizētās dokumentu klasificēšanas precizitāti, kā arī paplašinās tās lietojamību, iekļaujot klasificējamajos dokumentos arī skenētos dokumentus.

Projektu līdzfinansē Eiropas Reģionālās attīstības fonds  Darbības programmas “Izaugsme un nodarbinātība” 1.2.1. specifiskā atbalsta mērķa “Palielināt privātā sektora investīcijas P&A” 1.2.1.1. pasākuma “Atbalsts jaunu produktu un tehnoloģiju izstrādei kompetences centru ietvaros” ietvaros.