EN ET

Lexicon Miner

Texta Toolkiti abil saab luua temaatiliste sõnade leksikone, mida saab kasutada Otsingu (Searcheri) tulemuste laiendamiseks (nt klassifitseerijate tarbeks klasside määratlemiseks). Leksikonide loomiseks peab olemas olema varem treenitud Embeddingu mudel.

Kasutus

Parameetrid

positives_used:

Nimekiri sõnadest, millele sarnaseid sõnu (sarnases kontekstis kasutatavaid sõnu) soovitakse leida. Need on positiivne sisend mudeli sarnasusotsingule. GUI-s nimetatud kui „positives“.

negatives_used:

Nimekiri sõnadest, millele sarnaseid sõnu EI soovita leida või vanad soovitused, mis ei jõudnud positiivsete sõnade listi. Need on negatiivne sisend mudeli sarnasusotsingule. GUI-s nimetatud kui „negatives“.

positives_unused:

Nimekiri sõnadest, mis on juba välja kaevandatud (ehk valitud), kuid mida ei soovita kasutada mudeli sarnasusotsingus. Need ei esine soovituste (Suggestions) nimekirjas.

negatives_unused:

Nimekiri soovitustest, mida ei valitud, kuid mida ei kasutata mudeli sarnasusotsingus negatiivsete sõnadena. Need ei esine soovituste (Suggestions) nimekirjas.

n:

Väljastatavate sõnade hulk. GUI-s on see vaikimisi 20.

GUI

Leksikoni loomiseks vajuta „CREATE“-nuppu „Lexicons“ all, kirjuta leksikoni nimi „“Description“ vahemikku ja vajuta enetrit. Uus leksikon ilmub tabelisse. Vajuta selle leksikoni reale. Leksikoni kaevandamise vaade avaneb.

Vali Toolkitis treenitud sõnavektor, millega töötada soovid. Trüki sisse mõned seemnesõnad (nt ‚sport‘, kui soovid leida sporditeemalisi artikleid) Positives nimekirja. Kirjuta iga sõna eraldi reale.

Leksikoni loomise (või laiendamise) protsess on iteratiivne. Küsi uusi soovitusi kahe nupu abil:

New Suggestions nupp, mis tõstab valikust välja jäänud sõnad Negatives listi, kus neid kasutatakse negatiivsete sõnadena mudeli sarnasusotsingus.

või

Clear Suggestions nupp, mis tõstab valikust välja jäänud sõnad Negatives unused listi, kus neid ei kasutata mudeli sarnasusotsingus. Samas ei soovitata neid enam uuesti. Uute soovituste saamiseks pärast selle nupu kasutamist, vajuta uuesti New Suggestions nupule.

Vali soovitustest (Suggestions) need sõnad, mis tunduvad sobivad, neile klõpsates. Küsi soovitusi uuesti, kuni enam ei tule ühtegi sobivat soovitust. Sa võid proovida laiendada leksikoni ka ühe või kahe seemnesõnaga, hoides juba välja kaevandatud sõnu Positives unused listis.

Sobiva sõna leksikoni lisamiseks tuleb sellele klõpsata Suggestion nimekirjast. Alternatiivselt võid ise tükkida nimekirja sõnu, mille peale tulid soovituste nimekirja lehitsedes.

Ära unusta leksikoni salvestada, kui oled valmis!