EN ET

Anonymizer

Anonymizer (Anonüümija) on tööriist vabatekstis esinevate isikunimede nimekirja alusel anonüümimiseks. Iga tekstist tuvastatud nimekirjas leiduv nimi asendatakse juhuslikult genereeritud initsiaalidega.

Märkus

Anonymizer toetab hetkel täielikult üksnes eestikeelsete tekstide anonüümimist.

Märkus

Paraneetrite replace_single_last_names ja/või replace_single_first_names aktiveerimisel anonüümitakse kõik nimekirjaga kattuvad ees- ja perekonnanimed, isegi kui need on tegelikult osa mõnest teisest (nimekirja mittekaasatud) nimest.

Näide:

names = ["Trump, Donald"]
text = "Donald Trump and Ivanka Trump"
anonymized_text = "K.R and Ivanka K.R"

API viide: http://localhost:8000/api/v1/redoc/#tag/projects-greater-anonymizers

Loomine

Parameetrid

description:

Anonüümija mudeli nimi.

misspelling_threshold:

Minimaalne tekstist leitud nime ning nimekirja kaasatud nime Jaro-Winkleri sarnasus ehk kui sarnane peab olema kahe nime kirjapilt, et mudel need samaks tunnistaks.

Märkus

Kasutatakse üksnes siis, kui parameeter replace_misspelled_names on aktiveeritud.

replace_misspelled_names:

Aktiveerimisel anonüümitakse ka vigase kirjapildiga nimed.

Märkus

Parameetri aktiveerimine võib vahel tingida valede nimede (või muude olemite) anonüümimise, kuna mudel ei oska eristada vale kirjapildiga nö. õiget nime õige kirjapildiga piisavalt sarnasest valest nimest. Nt. („Eastwood“, „Eestwood“) vs. („Ahto“, „Ahti“).

replace_single_last_names:

Aktiveerimisel anonüümitakse ilma eesnimeta esinevad perenimed.

replace_single_first_names:

Aktiveerimisel anonüümitakse ilma perenimeta esinevad eesnimed.

auto_adjust_threshold:

Aktiveerimisel suurendatakse parameetrit misspelling_threshold automaatselt juhul, kui suvalise kahe nimekirjas antud anonüümitava nime sarnasus on suurem kui seadistatud misspelling_threshold, et vältida nime x anonüümimist nime y initsiaalidega (või vice versa).

GUI

Uue anonüümimismudeli loomiseks navigeeri ülemisel menüüribal „Tools“ -> „Anonymizer“ nagu kujutatud joonisel Joonis 3.

_images/anonymizer_nav.png

Joonis 3 Navigatsioon Anonymizeri tööriistani

Eduka navigatsiooni korral avaneb joonisel Joonis 4 kujutatud lehekülg, mille ülemises vasakus nurgas asub nupp nimega „Create“.

_images/anonymizer_create_button.png

Joonis 4 Anonüümija loomisnupp `“Create“`.

„Create“ nupule vajutamine avab uue akna pealkirjaga „New Anonymizer“ nagu kujutatud joonisel Joonis 5.

_images/new_anonymizer_mw.png

Joonis 5 Anonüümija loomisaken

Täida väli Description ja muuda soovi korral vaikeparameetrite väärtusi. Vajuta nupule „Create“ akna alumises vasakus nurgas (Joonis 6).

_images/default_anonymizer.png

Joonis 6 Anonüümija loomine

The created Anonymizer can now be seen as the first (or only, if no previous Anonymizers exist under the project) row in the table of Anonymizers (Joonis 7).

_images/anonymizer_list.png

Joonis 7 Anonymizeri mudelite nimekiri

API

Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_create

Otspunkt: /projects/{project_pk}/anonymizers/

Näide:

curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
        "description": "My anonymizer",
        "replace_misspelled_names": true,
        "replace_single_last_names": true,
        "replace_single_first_names": true,
        "misspelling_threshold": 0.9,
        "auto_adjust_threshold": true
    }'

Kasutamine

Anonymize Text

Parameetrid

texts

Anonüümitavad tekstid.

names

Nimekiri anonüümitavatest nimedest.

Märkus

Iga nimekirjas olev nimi peab olema vormindatud järgnevalt: „<perenimi>, <eesnimi>“

GUI

Teksti anonüümimiseks navigeeri menüüribal kõigepealt anonüümimismudelite lehele: „Tools“ -> „Anonymizer“ nagu kujutatud joonisel Joonis 3. Eduka navigatsiooni tagajärjel avaneb vaade anonüümimismudelite nimekirjast. Vali mudel, mida soovid anonüümimiseks kasutada ning ava seejärel valikmenüü klikkides kolmele vertikaalsele punktile vastava anonüümimismudeli rea lõpus (Joonis 8).

_images/anonymizer_actions_0.png

Joonis 8 Anonüümimismudeli valikmenüü asukoht

Vali menüüst „Anonymize text“ (Joonis 9).

_images/anonymizer_actions_1.png

Joonis 9 Anonymizer -> Anonymize Text

Klikkimise tagajärjel avaneb uus aken pealkirjaga „Anonymize Text“, mis sisaldab kahte sisendväljaga: „text“ (tekst) ja „names“ (nimed) (Joonis 10).

_images/anonymize_text_empty.png

Joonis 10 Tühi „Anonymize text“ vaade.

Sisesta tekst, mida soovid anonüümida, väljale „text“ ning selle all asetsevale väljale reavahetusega eraldatud nimekiri anonüümitavatest nimedest formaadis „perenimi, eesnimi“ (Joonis 11).

_images/anon_text_pre.png

Joonis 11 „Anonymize text“ vaade pärast sisendväljade täitmist.

Vajuta nupule „Submit“ akna alumises paremas nurgas. Anonüümitud tekst ilmub sama akna alumisse äärde (Joonis 12).

_images/anon_text_res.png

Joonis 12 Anonüümitud tekst.

API

Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_anonymize_text

Otspunkt /projects/{project_pk}/anonymizers/{id}/anonymize_text/

Näide:

curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/1/anonymize_text/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
        "text": "Bonnie Parker and Clyde Barrow are believed to have murdered at least nine police officers.",
        "names": ["Parker, Bonnie Elizabeth", "Barrow, Clyde Chestnut"]
    }'

Vastus:

"N.Q and X.R are believed to have murdered at least nine police officers."

Anonymize Texts

Funktsioon „Anonymize Text“ võimaldab mitme teksti üheaegset anonüümimist. Tulemuseks saadud anonüümitud tekstide järjekord ühtib vastavate sisendtekstide järjekorraga, st. kui sisendtekst t asub positsioonil i, siis väljundis asub vastava teksti anonüümitud versioon samuti positsioonil i.

Parameetrid

texts

Nimekiri anonüümitavatest tekstidest.

names

Nimekiri anonüümitavatest nimedest.

Märkus

Iga nimekirjas olev nimi peab olema vormindatud järgnevalt: „<perenimi>, <eesnimi>“

consistent_replacement

Aktiveerimisel kasutatakse erinevates tekstides nime anonüümimisel alati sama asendussümbolit.

API

Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_anonymize_texts

Otspunkt /projects/{project_pk}/anonymizers/{id}/anonymize_texts/

Näide:

curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/1/anonymize_texts/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
       "texts": [
            "Bonnie Parker and Clyde Barrow are believed to have murdered at least nine police officers.",
            "Bonnie and Clyde were killed in May 1934."
        ],
       "names": ["Parker, Bonnie Elizabeth", "Barrow, Clyde Chestnut"],
       "consistent_replacement": true
    }'

Vastus:

[
    "F.Q and T.T are believed to have murdered at least nine police officers.",
    "F.Q and T.T were killed in May 1934."
]

Edit

GUI

Anonüümimismudeli muutmiseks kliki vastava mudeli rea lõpus olevale kolmele vertikaalsele punktile.

_images/anonymizer_actions_2.png

Joonis 13 Anonymizer -> Edit

Vali avanenud menüüst „Edit“ (Joonis 13). Tee soovitud muudatused ja vajuta nende salvestamiseks nupule „Submit“ akna alumises paremas nurgas.

API

Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_update

Otspunkt /projects/{project_pk}/anonymizers/{id}/

Näide:

curl -X PATCH "http://localhost:8000/api/v1/projects/11/anonymizers/1/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
        "replace_single_last_names": false
 }'

Vastus:

{
    "id": 25,
    "url": "http://localhost:8000/api/v1/projects/11/anonymizers/1/",
    "description": "default",
    "replace_misspelled_names": true,
    "replace_single_last_names": false,
    "replace_single_first_names": true,
    "misspelling_threshold": 0.9,
    "auto_adjust_threshold": true
}

Delete

GUI

Anonüümija kustutamiseks tee märge kõikide mudelite ette, mida kustutada soovid. Seejärel vajuta punasele prügikasti ikoonile anonüümimismudelite tabeli kohal. (Joonis 14).

_images/anon_delete.png

Joonis 14 Anonüümija kustutamine

Enne mudeli lõplikku kustutamist, küsib rakendus töö lõpetamiseks kinnitust (Joonis 15). Vajuta kinnitamiseks kinnitusaknas nupule „Delete“.

_images/anon_delete_confirm.png

Joonis 15 Anonüümimismudeli kustutamise kinnitusaken

API

Viited

http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_delete

http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_bulk_delete

Otspunkt /projects/{project_pk}/anonymizers/{id}/

Näide:

curl -X DELETE "http://localhost:8000/api/v1/projects/11/anonymizers/1/" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049"