Получение только уникальных значений в категории на языке запросов Kusto (журналы Azure Monitor)

У меня есть данные в таком формате:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        1    <--
  A         200        1    <--
  A         200        2
  B         300        1
  B         300        1    <--

Мне нужно удалить повторяющиеся значения имен шагов в каждом Session_ID. Например, в ID = 200 есть три единицы, которые нужно заменить на одну, поэтому окончательные данные будут выглядеть так:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        2
  B         300        1

person user75252    schedule 21.10.2019    source источник
comment
Может быть, Distinct работает на: | distinct Session_ID, Step_Name   -  person Markus Meyer    schedule 21.10.2019
comment
Да, это работает, спасибо. Вы можете выразить это как ответ.   -  person user75252    schedule 21.10.2019


Ответы (1)


В вашем случае вам следует использовать отдельный оператор:

your_table
| distinct Category, Session_ID, Step_Name

тогда вы можете получить ожидаемый результат, как показано ниже, он работает на моей стороне:

Category Session_ID  Step_Name

  A         100        1
  A         100        2 
  A         200        1
  A         200        2
  B         300        1

Что касается вашего вопроса в комментарии, если вы воспользуетесь приведенным выше запросом, запись типа "A 100 1" будет считаться одной сущностью, и только если имеется 2 или более одинаковых записей, таких как "A 100 1 "останется только 1 записью, если будет использован отдельный.

И если есть другая запись, такая как «B 100 1», то останутся обе 2 записи «A 100 1» и «B 100 1».

person Ivan Yang    schedule 21.10.2019
comment
Если у нас есть столбец Timestamp вместо Category, как мы будем действовать в этом случае? - учитывая, что повторяющиеся шаги в идентификаторе сеанса будут иметь разные отметки времени и будут считаться уникальными. - person user75252; 23.10.2019
comment
Если у вас есть столбец Timestamp вместо Category, каков ваш ожидаемый результат? - person Ivan Yang; 23.10.2019
comment
Повторный шаг с последней отметкой времени должен остаться (в пределах session_id), а более ранние повторяющиеся шаги должны быть удалены. (ступенька со второй стрелкой должна остаться, ступеньку с первой стрелкой нужно убрать) - person user75252; 23.10.2019
comment
@ user75252, не могли бы вы опубликовать новый выпуск по этому поводу? и предоставьте ссылку, когда это будет сделано :). - person Ivan Yang; 23.10.2019
comment
Конечно, я сделаю это. - person user75252; 23.10.2019
comment
Это более развернутый вопрос: stackoverflow.com/questions/58519476/ - person user75252; 23.10.2019
comment
@ user75252, я займусь этим вопросом позже. - person Ivan Yang; 23.10.2019
comment
Давайте продолжим это обсуждение в чате. - person user75252; 23.10.2019