Tekstianalüütika

Suur osa teabest vahendatakse meile tekstide kujul: uudised, e-kirjad, artiklid või mis tahes dokumentid. STACC ja meie spin-off ettevõtte TEXTA on aastate jooksul välja töötatud tekstianalüütika tööriistad, mille abil on võimalik tekstid nö "kvantifitseerida" ehk muuta arvutuste jaoks sobivale kujule ning teostada seejärel statistilist analüüsi ning esitada tulemusi joonistel ja graafikutel.

STACC viib aga tekstianalüütika sammu võrra kaugemale, ühendades tulemused ennustava analüütika lahendustesse ja soovitussüsteemidesse. Tulemuseks on tehisintelligentsed lahendused, mis võimaldavad määratleda automaatselt teksti sisu, määratleda teksti sobivust/mittesobivust ning anda soovitusi. Näiteid meie poolt loodud tehisintelligentsetest lahendusest:

  • Tööriist Õhtulehele kommentaaride sisu sobilikkuse automaatseks hindamiseks (solvamine, rassism, vägivalla õhutamine, jne).
  • Tööriist äripäevale tekstide automaatseks märgendamiseks - lahendus leiab automaatselt antud teksti kohta käivad olulised märksõnad ("tagwords"), olles suuteline märksõnadena määratlema ka teksti sisu mõttes olulisi, kuid tekstis endas mitteesinevaid sõnu.
  • Tööriist Inforegistrile kohtulahendite tekstidest kaasusega seotud isikute leidmiseks ning kohtuotsuse (süüdi või õigeks mõistetud) leidmiseks.

Tekstianalüütika lahenduste arendamine

Tekstianalüütika lahenduste esimeseks sammuks on koguda kokku vabatekstilised andmed ning kasutada neid analüütilistel eesmärkidel. Selliste andmete hulka võivad kuuluda nt:

  • artiklid ja postitused,
  • e-kirjad,
  • chatid,
  • kõnekeskustes tekkivad andmed,
  • pakkumised,
  • lepingud,
  • logid.

Protsessi teise sammuna kvantifitseeritakse tekstid ja teostatakse tekstide kirjeldav analüüs. Tulemuseks on lahendus, mis näitab tekstis esinevaid olulisemaid sõnu, kuvab trende ja visualiseerib andmeid graafikutel.

Kui klient soovib luua tehisintelligentse lahenduse, järgneb ka kolmas samm ehk tekstianalüütika tulemuste ühendamine ennustava analüütika või soovitussüsteemidega. Sellised lahendused suudavad määratleda automaatselt teksti sisu ja sobivust, ennustada teksti põhjal protsessi tulemust või soovitada klientidele nende profiiliga sobivaid objekte.

TEHTUD TÖÖD

Tööriist Inforegistrile kohtulahendite tekstidest kaasusega seotud isikute leidmiseks ning kohtuotsuse (süüdi või õigeks mõistetud) leidmiseks.

Tööriist Õhtulehele kommentaaride sisu sobilikkuse automaatseks hindamiseks (millised kommentaarid on solvavad, rassistlikud, vägivalda õhutavad, jne)

Tööriist äripäevale tekstide automaatseks märgendamiseks - lahendus leiab automaatselt antud teksti kohta käivad olulised märksõnad ("tagwords"), olles suuteline märksõnadena määratlema ka teksti sisu mõttes olulisi, kuid tekstis endas mitteesinevaid sõnu.