13. jūlijā notika 11. starptautiskā konference DATA 2022: Conference on Data Science, Technology and Applications, kurā RIX Technologies vadošais pētnieks Juris Rāts prezentēja zinātnisko darbu: “Uzņēmuma ienākošo dokumentu tekstu klasificēšanas apmācības kopu anotēšanas atbalsts”. DATA konferences mērķis ir pulcēt pētniekus, inženierus un praktiķus, kuri interesējas par datu bāzēm, lielajiem datiem, datu pārvaldību, datu drošību un citiem informācijas sistēmu un tehnoloģiju aspektiem.

Zinātniskais darbs ir izstrādāts RIX Technologies pētījuma: “Dokumenta reprezentācijas modeļa veidošana dokumentu automatizētas klasifikācijas augstas precizitātes nodrošināšanai” ietvaros. Pētījuma mērķis bija izveidot un novērtēt mašīnmācīšanās tehnoloģijā balstītu elastīgu uzņēmuma ienākošo dokumentu automatizētās indeksēšanas un virzīšanas modeli. Modelis piedāvā metodes risinājuma uzstādīšanai uzņēmumā, kā ietvaros tas palīdz klientam izvēlēties svarīgākās dokumentu tēmas, kā arī izveidot apmācību kopas tēmu atpazīšanas botu apmācībai. Modelis piedāvā metodes klienta izvēlēto tēmu un apmācības kopu vērtēšanai, radot iespēju tēmas pārveidot (piemēram, apvienot vai sadalīt), lai tādējādi uzlabotu modeļa precizitāti.

Uzstādīšanas procesa rezultātus klients var izmantot, lai vērtētu modeļa piemērotību uzņēmuma biznesa procesam, un pieņemtu lēmumu par modeļa ieviešanu. Modeļa ekspluatācijas laikā tas nepārtraukti papildina tēmu atpazīšanas botu apmācības kopas, tēmu atpazīšanai tādējādi var tikt pievienoti jaunu tēmu atpazīšanas boti, kā arī var tikt uzlabota esošo tēmu atpazīšanas botu precizitāte.