EN ET

Dataset Importer

Dataset Importer on tööriist JSON Lines, CSV ja Exceli failide Elasticsearchi laadimiseks, et teha need kättesaadavaks TEXTA Toolkitile.

Loomine

Parameetrid:

  • desctiption - Tavaline töö kirjeldus, mille abil eristatakse antud importimistteistest.

  • index - Vastloodud indeksi nimi. Pane tähele, et sellel kehtivad Elasticsearchi index nimepiirangud.

  • separator - Vajalik vaid .csv failide puhul. Vaikimisi on koma (,). Selle abil saab muuta .csv failide eristajat (separator).

  • file - Fail, mida hakatakse importima (JSON Lines, CSV, Excel)

Märkus

As ElasticSearch has some restrictions, the dataset name format has the following constraints:
  • Lowercase only

  • Cannot include , /, *, ?, „, <, >, |, space (the character, not the word), ,, #

  • Indices prior to 7.0 could contain a colon (:), but that’s been deprecated and won’t be supported in 7.0+

  • Cannot start with -, _, +

  • Cannot be . or ..

  • Cannot be longer than 255 characters

GUI

Dataset Importerit saab valida rippmenüüst Tools > Dataset Importer. (Joonis 16).
Vajuta CREATE nupule, et avada uus importimistöö (Joonis 17).
Siin saad:
  1. Määrata importimistööle kirjeldus

  2. Möörata andmestiku nimi

  3. Täpsustada CSV failide eraldajat (tavaliselt koma)

  4. Lehitseda ja valida üleslaaditavaid faile, vajutades kausta nupule.

Vajuta Create nupule importimistöö alustamiseks. Kui importimine on tehtud, saad lisada uue andmestiku oma projekti.

_images/dataset_importer_loc.png

Joonis 16 Dataset Importeri juurde navigeerimine

_images/dataset_importer.png

Joonis 17 Uue andmestiku importimine

API

@ on eriline süntaksimärk binaarse faili lugemiseks.

curl -H "Authorization: Token 8229898dccf960714a9fa22662b214005aa2b049" \
-F "description=Articles" \
-F "index=en_articles" \
-F "file=@FILE_NAME.csv" \
http://localhost:8000/api/v1/projects/11/dataset_imports/