Невозможно передать данные JSONL в AutoML NLP - Entity Extraction

Итак, я пытаюсь реализовать Entity Extraction для AutoML, и я полный новичок. Моя загрузка CSV-файла прошла успешно, но мой JSONL не анализируется правильно. Где я ошибаюсь? Начальная строка файла содержит все данные для обучения. Я еще не комментировал это, поскольку собираюсь сделать это в пользовательском интерфейсе. Что я делаю неправильно?

PS: Я использовал Pandas, чтобы преобразовать его в JSONL

введите описание изображения здесь


person Arjun Ram    schedule 08.09.2020    source источник


Ответы (1)


Вы должны использовать клавишу textContent вместо text_snippet. Ознакомьтесь с документацией по платформе AI по сравнению с документами Cloud Natural Language

Недавно у меня возникла эта проблема, потому что я пытался использовать естественный язык платформы AI с форматом, определенным для Cloud Natural Language AutoML. Сначала я не понимал, что это разные продукты и разные схемы для импорта данных.

Попробуйте эту схему JSONL, чтобы убедиться, что она работает.

{
    "textSegmentAnnotations": [
      {
        "startOffset":number,
        "endOffset":number,
        "displayName": "label"
      },
      ...
    ],
    "textContent": "inline_text"|"textGcsUri": "gcs_uri_to_file",
    "dataItemResourceLabels": {
      "aiplatform.googleapis.com/ml_use": "training|test|validation"
    }
}
person Abhishek Chadha    schedule 11.01.2021