По умолчанию модуль записи индекса nutch для elasticsearch создает индекс в elasticsearch с именем, указанным в nutch-site.xml (или nutch-default.xml) в элементе свойства:
<property>
<name>elastic.index</name>
<value>nutch</value>
<description>Default index to send documents to.</description>
</property>
Раздел сопоставлений в elasticsearch для такого автоматически сгенерированного индекса всегда имеет следующую структуру
{
"nutch": {
"mappings": {
"doc": {
"properties": {
"anchor": {
"type": "string"
},
"boost": {
"type": "string"
},
"cache": {
"type": "string"
},
"content": {
"type": "string"
},
"contentLength": {
"type": "string"
},
"date": {
"type": "date",
"format": "dateOptionalTime"
},
"digest": {
"type": "string"
},
"host": {
"type": "string"
},
"id": {
"type": "string"
},
"lang": {
"type": "string"
},
"lastModified": {
"type": "date",
"format": "dateOptionalTime"
},
"segment": {
"type": "string"
},
"title": {
"type": "string"
},
"tstamp": {
"type": "date",
"format": "dateOptionalTime"
},
"type": {
"type": "string"
},
"url": {
"type": "string"
}
}
}
}
}
}
- Где шаблон для этого?
- Можно ли его изменить?
- Если да, какие поля являются обязательными, а какие необязательными?
- Где я могу найти больше информации об этом?
Любая помощь приветствуется! Спасибо, Вольфрам