Didelį kategorijų kiekį turinčių draudimo bendrovės klientų užklausų, gautų elektroniniais laiškais, lietuviško teksto klasifikavimas

Prasminiai žodžiai NLP, teksto klasifikavimas, elektroniniai laiškai, teksto apdorojimas

Santrauka

Natūralios kalbos apdorojimas ir klasifikavimas jau plačiai naudojamas anglakalbėse šalyse. Tačiau lietuviško teksto analizė ir klasifikacija yra sudėtinga ir dar nevisiškai įgyvendinta. Taip yra dėl lietuvių kalbos sudėtingumo ir savitumo, todėl kitoms kalboms tinkami metodai ne visada tinka lietuvių kalbai.
Šiame straipsnyje naudojamos trys pasirinktos tekstų apdorojimo parinktys bei įvairios jų kombinacijos ir įvertinama, kaip skirtingi nuoseklūs teksto klasifikavimo būdai gali klasifikuoti draudimo bendrovės klientų užklausas, gautas el. paštu. Šis tyrimas yra išskirtinis naudojamų metodų gausa ir papildomai įvertina lietuviško teksto klasifikavimo tikslumą daugelyje (33) kategorijų.
Straipsnyje aptariamos natūralios kalbos apdorojimo problemos, analogiški tyrimai su lietuvių kalba parašytų tekstų klasifikacija, pristatoma siūloma tyrimo metodika ir aptariami tyrimo rezultatai.

Autoriaus biografija

Simona Ramanauskaitė, doc. dr., Vilniaus Gedimino technikos universitetas

Technologijos mokslai (informatikos inžinerija), Vilniaus Gedimino technikos universitetas

Paskelbtas
2019-12-18
Kaip cituoti
Kiaunė, K., & Ramanauskaitė, S. (2019). Didelį kategorijų kiekį turinčių draudimo bendrovės klientų užklausų, gautų elektroniniais laiškais, lietuviško teksto klasifikavimas. Jaunųjų Mokslininkų Darbai, 49(2), 52-59. https://doi.org/10.21277/jmd.v49i2.235
Skiltis
Technologijos mokslai