Dataset Importer¶
Dataset Importer on tööriist JSON Lines, CSV ja Exceli failide Elasticsearchi laadimiseks, et teha need kättesaadavaks TEXTA Toolkitile.
Loomine¶
Parameetrid:¶
desctiption - Tavaline töö kirjeldus, mille abil eristatakse antud importimistteistest.
index - Vastloodud indeksi nimi. Pane tähele, et sellel kehtivad Elasticsearchi index nimepiirangud.
separator - Vajalik vaid .csv failide puhul. Vaikimisi on koma (,). Selle abil saab muuta .csv failide eristajat (separator).
file - Fail, mida hakatakse importima (JSON Lines, CSV, Excel)
Märkus
- As ElasticSearch has some restrictions, the dataset name format has the following constraints:
GUI¶
Määrata importimistööle kirjeldus
Möörata andmestiku nimi
Täpsustada CSV failide eraldajat (tavaliselt koma)
Lehitseda ja valida üleslaaditavaid faile, vajutades kausta nupule.
Vajuta Create nupule importimistöö alustamiseks. Kui importimine on tehtud, saad lisada uue andmestiku oma projekti.
API¶
@ on eriline süntaksimärk binaarse faili lugemiseks.
curl -H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-F "description=Articles" \
-F "index=en_articles" \
-F "file=@FILE_NAME.csv" \
http://localhost:8000/api/v1/projects/11/dataset_imports/