Как добавить фильтр, используя регулярное выражение NOT IN?

В настоящее время я пытаюсь извлечь данные из Google Analytics с помощью скрипта Python. Мне нужно включить в сценарий условие фильтра, чтобы исключить набор сетевых доменов из существующего списка применяемых фильтров.

Значения сетевого домена, которые я хочу исключить:

  1. (не установлен)
  2. Неизвестный
  3. trackapp.net

Ниже приведен фильтр в том виде, в каком он существует в настоящее время:

'filter':'ga:medium==orgainc;ga:source==campaign;ga:landingPagePath=~(1234|5678)

Как я могу добавить здесь еще одно условие фильтра, используя регулярное выражение, чтобы исключить 3 сетевых домена, упомянутых выше.


person Nowitz41    schedule 24.05.2019    source источник
comment
Пользовательский интерфейс GA позволит только запрашивать и извлекать данные в файл CSV. Я хочу запросить сразу много дней, поэтому создаю этот скрипт и сохраняю данные в JSON. Не очень хорошо разбираюсь в функциях регулярных выражений и в том, как их использовать в скрипте Python, отсюда и вопрос.   -  person Nowitz41    schedule 25.05.2019
comment
Хорошо, я вижу. Но хотите ли вы расширить свои фильтры GA или создать/расширить скрипт Python, выполняющий дополнительную фильтрацию?   -  person wp78de    schedule 25.05.2019
comment
Фильтр, которым я поделился, уже используется в моем скрипте Python. Я хочу расширить это, используя измерение ga:networkDomain и исключив 3 домена. Так что да, я хотел бы расширить свой текущий фильтр. Это должно быть что-то вроде: 'filter':'ga:medium==orgainc;ga:source==campaign;ga:landingPagePath=~(1234|5678);ga:networkDomain‹insert_regex_here›   -  person Nowitz41    schedule 25.05.2019


Ответы (1)


Расширьте свой запрос следующим образом:

ga:networkDomain!~(^$|unknown\.unknown|trackapp\.net)

Однако часть ^$ не установленной/пустой строки, использующая операторы начальной/конечной позиции, может не работать должным образом в вашем поле ga:networkDomain.

person wp78de    schedule 24.05.2019