Агрегирование вложенных документов с помощью безболезненного написания сценариев

ИСПОЛЬЗОВАНИЕ ELASTIC SEARCH 6.2 Итак, у меня есть глубоко вложенная структура документа, которая имеет все необходимые сопоставления (вложенные, текстовые, ключевые слова и т. д.). Образец документа выглядит следующим образом:

{
    "type": "Certain Type",
    "lineItems": [
        {
            "lineValue": 10,
            "events": [
                {
                    "name": "CREATED",
                    "timeStamp": "TIME VALUE"
                },
                {
                    "name": "ENDED",
                    "timeStamp": "TIME VALUE"
                }
            ]
        }
    ]
}

Что я хочу сделать, так это узнать среднее время, необходимое для перехода всех строк от CREATED к ENDED.

Я создал следующий запрос

GET /_search
{
  "size": 0,
  "query": {
    "match": {
      "type": "Certain Type"
    }
  },
  "aggs": {
    "avg time": {
      "nested": {
        "path": "lineItems.events"
      },
      "aggs": {
        "avg time": {
          "avg": {
            "script": {
              "lang": "painless",
              "source": """
          long timeDiff = 0; 
          long fromTime = 0; 
          long toTime = 0; 
          if(doc['lineItems.events.name.keyword'] == "CREATED"){
            fromTime = doc['lineItems.events.timeValue'].value.getMillis();
          }
          else if(doc['lineItems.events.name.keyword'] == "ENDED"){
            toTime = doc['lineItems.events.timeValue'].value.getMillis();
          }
          timeDiff = toTime-fromTime;
          return (timeDiff)
          """
            }
          }
        }
      }
    }
  }
}

В результате я получил 0 в качестве результата агрегации, что неверно.

Есть ли способ добиться этого?


person Anirudh Kanabar    schedule 26.03.2019    source источник


Ответы (1)


Использование doc[ в скрипте вложенного объекта не работает, так как вложенный документ — это новый документ для эластичного поиска.

Вместо этого используйте params._source (https://www.elastic.co/guide/en/elasticsearch/reference/current/search-request-script-fields.html). Обратите внимание, что доступ к источнику будет очень медленным, если у вас много документов или вам нужно часто запрашивать этот запрос, рассмотрите возможность добавления этого поля в основной документ.

Я считаю, что все значения существуют, при необходимости добавьте тест на надежность, это должно работать.

long toTime = 0; 
long fromTime = 0; 
timeDiff  = params['_source']['ENDED'] 
fromTime  = params['_source']['CREATED']
return (toTime - fromTime);
person LeBigCat    schedule 26.03.2019