Anonymizer¶
Anonymizer (Anonüümija) on tööriist vabatekstis esinevate isikunimede nimekirja alusel anonüümimiseks. Iga tekstist tuvastatud nimekirjas leiduv nimi asendatakse juhuslikult genereeritud initsiaalidega.
Märkus
Anonymizer toetab hetkel täielikult üksnes eestikeelsete tekstide anonüümimist.
Märkus
Paraneetrite replace_single_last_names ja/või replace_single_first_names aktiveerimisel anonüümitakse kõik nimekirjaga kattuvad ees- ja perekonnanimed, isegi kui need on tegelikult osa mõnest teisest (nimekirja mittekaasatud) nimest.
Näide:
names = ["Trump, Donald"]
text = "Donald Trump and Ivanka Trump"
anonymized_text = "K.R and Ivanka K.R"
API viide: http://localhost:8000/api/v1/redoc/#tag/projects-greater-anonymizers
Loomine¶
Parameetrid¶
- description:
Anonüümija mudeli nimi.
- misspelling_threshold:
Minimaalne tekstist leitud nime ning nimekirja kaasatud nime Jaro-Winkleri sarnasus ehk kui sarnane peab olema kahe nime kirjapilt, et mudel need samaks tunnistaks.
Märkus
Kasutatakse üksnes siis, kui parameeter replace_misspelled_names on aktiveeritud.
- replace_misspelled_names:
Aktiveerimisel anonüümitakse ka vigase kirjapildiga nimed.
Märkus
Parameetri aktiveerimine võib vahel tingida valede nimede (või muude olemite) anonüümimise, kuna mudel ei oska eristada vale kirjapildiga nö. õiget nime õige kirjapildiga piisavalt sarnasest valest nimest. Nt. („Eastwood“, „Eestwood“) vs. („Ahto“, „Ahti“).
- replace_single_last_names:
Aktiveerimisel anonüümitakse ilma eesnimeta esinevad perenimed.
- replace_single_first_names:
Aktiveerimisel anonüümitakse ilma perenimeta esinevad eesnimed.
- auto_adjust_threshold:
Aktiveerimisel suurendatakse parameetrit misspelling_threshold automaatselt juhul, kui suvalise kahe nimekirjas antud anonüümitava nime sarnasus on suurem kui seadistatud misspelling_threshold, et vältida nime x anonüümimist nime y initsiaalidega (või vice versa).
GUI¶
Uue anonüümimismudeli loomiseks navigeeri ülemisel menüüribal „Tools“ -> „Anonymizer“ nagu kujutatud joonisel Joonis 3.
Eduka navigatsiooni korral avaneb joonisel Joonis 4 kujutatud lehekülg, mille ülemises vasakus nurgas asub nupp nimega „Create“.
„Create“ nupule vajutamine avab uue akna pealkirjaga „New Anonymizer“ nagu kujutatud joonisel Joonis 5.
Täida väli Description ja muuda soovi korral vaikeparameetrite väärtusi. Vajuta nupule „Create“ akna alumises vasakus nurgas (Joonis 6).
The created Anonymizer can now be seen as the first (or only, if no previous Anonymizers exist under the project) row in the table of Anonymizers (Joonis 7).
API¶
Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_create
Otspunkt: /projects/{project_pk}/anonymizers/
Näide:
curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
"description": "My anonymizer",
"replace_misspelled_names": true,
"replace_single_last_names": true,
"replace_single_first_names": true,
"misspelling_threshold": 0.9,
"auto_adjust_threshold": true
}'
Kasutamine¶
Anonymize Text¶
Parameetrid¶
- texts
Anonüümitavad tekstid.
- names
Nimekiri anonüümitavatest nimedest.
Märkus
Iga nimekirjas olev nimi peab olema vormindatud järgnevalt: „<perenimi>, <eesnimi>“
GUI¶
Teksti anonüümimiseks navigeeri menüüribal kõigepealt anonüümimismudelite lehele: „Tools“ -> „Anonymizer“ nagu kujutatud joonisel Joonis 3. Eduka navigatsiooni tagajärjel avaneb vaade anonüümimismudelite nimekirjast. Vali mudel, mida soovid anonüümimiseks kasutada ning ava seejärel valikmenüü klikkides kolmele vertikaalsele punktile vastava anonüümimismudeli rea lõpus (Joonis 8).
Vali menüüst „Anonymize text“ (Joonis 9).
Klikkimise tagajärjel avaneb uus aken pealkirjaga „Anonymize Text“, mis sisaldab kahte sisendväljaga: „text“ (tekst) ja „names“ (nimed) (Joonis 10).
Sisesta tekst, mida soovid anonüümida, väljale „text“ ning selle all asetsevale väljale reavahetusega eraldatud nimekiri anonüümitavatest nimedest formaadis „perenimi, eesnimi“ (Joonis 11).
Vajuta nupule „Submit“ akna alumises paremas nurgas. Anonüümitud tekst ilmub sama akna alumisse äärde (Joonis 12).
API¶
Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_anonymize_text
Otspunkt /projects/{project_pk}/anonymizers/{id}/anonymize_text/
Näide:
curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/1/anonymize_text/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
"text": "Bonnie Parker and Clyde Barrow are believed to have murdered at least nine police officers.",
"names": ["Parker, Bonnie Elizabeth", "Barrow, Clyde Chestnut"]
}'
Vastus:
"N.Q and X.R are believed to have murdered at least nine police officers."
Anonymize Texts¶
Funktsioon „Anonymize Text“ võimaldab mitme teksti üheaegset anonüümimist. Tulemuseks saadud anonüümitud tekstide järjekord ühtib vastavate sisendtekstide järjekorraga, st. kui sisendtekst t asub positsioonil i, siis väljundis asub vastava teksti anonüümitud versioon samuti positsioonil i.
Parameetrid¶
- texts
Nimekiri anonüümitavatest tekstidest.
- names
Nimekiri anonüümitavatest nimedest.
Märkus
Iga nimekirjas olev nimi peab olema vormindatud järgnevalt: „<perenimi>, <eesnimi>“
- consistent_replacement
Aktiveerimisel kasutatakse erinevates tekstides nime anonüümimisel alati sama asendussümbolit.
API¶
Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_anonymize_texts
Otspunkt /projects/{project_pk}/anonymizers/{id}/anonymize_texts/
Näide:
curl -X POST "http://localhost:8000/api/v1/projects/11/anonymizers/1/anonymize_texts/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
"texts": [
"Bonnie Parker and Clyde Barrow are believed to have murdered at least nine police officers.",
"Bonnie and Clyde were killed in May 1934."
],
"names": ["Parker, Bonnie Elizabeth", "Barrow, Clyde Chestnut"],
"consistent_replacement": true
}'
Vastus:
[
"F.Q and T.T are believed to have murdered at least nine police officers.",
"F.Q and T.T were killed in May 1934."
]
Edit¶
GUI¶
Anonüümimismudeli muutmiseks kliki vastava mudeli rea lõpus olevale kolmele vertikaalsele punktile.
Vali avanenud menüüst „Edit“ (Joonis 13). Tee soovitud muudatused ja vajuta nende salvestamiseks nupule „Submit“ akna alumises paremas nurgas.
API¶
Viide: http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_update
Otspunkt /projects/{project_pk}/anonymizers/{id}/
Näide:
curl -X PATCH "http://localhost:8000/api/v1/projects/11/anonymizers/1/" \
-H "accept: application/json" \
-H "Content-Type: application/json" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-d '{
"replace_single_last_names": false
}'
Vastus:
{
"id": 25,
"url": "http://localhost:8000/api/v1/projects/11/anonymizers/1/",
"description": "default",
"replace_misspelled_names": true,
"replace_single_last_names": false,
"replace_single_first_names": true,
"misspelling_threshold": 0.9,
"auto_adjust_threshold": true
}
Delete¶
GUI¶
Anonüümija kustutamiseks tee märge kõikide mudelite ette, mida kustutada soovid. Seejärel vajuta punasele prügikasti ikoonile anonüümimismudelite tabeli kohal. (Joonis 14).
Enne mudeli lõplikku kustutamist, küsib rakendus töö lõpetamiseks kinnitust (Joonis 15). Vajuta kinnitamiseks kinnitusaknas nupule „Delete“.
API¶
Viited
http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_delete
http://localhost:8000/api/v1/redoc/#operation/projects_anonymizers_bulk_delete
Otspunkt /projects/{project_pk}/anonymizers/{id}/
Näide:
curl -X DELETE "http://localhost:8000/api/v1/projects/11/anonymizers/1/" \
-H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049"