Как расшифровать гугл гклиды

Теперь я понимаю, что первоначальный ответ на это, скорее всего, будет «вы не можете» или «использовать аналитику», но я продолжу в надежде, что у кого-то есть больше понимания, чем это.

Google adwords с «автоматической пометкой» добавляет «gclid» (предположительно «идентификатор клика Google») к ссылке, которая отправляет вас на рекламируемый сайт. Он отображается в веб-журнале, поскольку является параметром запроса и используется аналитикой для привязки этого посещения к объявлению/кампании.

Что я хотел бы сделать, так это извлечь любую полезную информацию из gclid, чтобы провести собственный анализ нашего трафика. Причинами этого являются:

  • Статистика несовершенна, но если мы сопоставляем ее, мы точно знаем, какие предположения мы сделали и как они были рассчитаны.
  • Мы можем связать данные с остальными нашими данными и получить гораздо более точную статистику по коэффициенту конверсии.
  • Нам не нужно полагаться на JavaScript для конверсий.

Теперь ясно, что gclid закодирован в base64 (или какой-то близкий вариант), и некоторые его части различаются больше, чем другие. Кроме того, я не смог определить, к чему это относится.

Есть ли у кого-нибудь понимание того, как я могу подойти к расшифровке этого, или кто-нибудь уже связал gclid с кампаниями или даже учетными записями?

Я разговаривал с парой человек в Google, и, несмотря на их девиз «не будь злым», они совершенно не желали обсуждать возможность разглашения этой информации, даже под соглашением о неразглашении. Похоже, им нравится монополия на нашу веб-статистику.


person Draemon    schedule 13.12.2008    source источник
comment
хотя это выглядит не относящимся к делу комментарием, но, пожалуйста, разрешите это. Девиз Google в Adword — быть злым. Google высасывает деньги всех владельцев малого и среднего бизнеса, как верный вампир крови.   -  person Mani    schedule 12.05.2016


Ответы (11)


Безусловно, самое простое решение — вручную пометить ваши ссылки параметрами отслеживания кампании Google Analytics (utm_source, utm_campaign, utm_medium и т. д.), а затем извлечь эти данные.

Gclid зависит не только от учетной записи/кампании AdWords/и т. д. Если вы дважды нажмете на одно и то же объявление AdWords, оно может дать вам разные gclid, потому что с этим конкретным кликом также связаны всевозможные данные о сеансе и стоимости.

Gclid, вероятно, не на 100% случайный, правда, но я был бы очень удивлен и обеспокоен, если бы можно было извлечь все ваши данные Adwords из этого числа. Это было бы ОГРОМНЫМ недостатком безопасности (т. е. произвольный пользователь мог бы просматривать ваши данные Adwords). Скорее всего, псевдослучайный gclid генерируется при каждом показе, и если на это объявление нажимают, gclid регистрируется в Adwords (в ​​противном случае он выбрасывается). Затем Analytics использует этот номер для сверки данных с Adwords постфактум. Помимо этого, в самом номере gclid нет внутренней ценности.

Что касается вашего последнего замечания, то попытка взлома или реинжиниринга этой информации прямо запрещена как в Условиях использования Google Analytics, так и в Условиях использования Google Adwords, и является основанием для постоянного запрета. Кроме того, в TOS, с которыми вы согласились при регистрации в этих службах, говорится, что это не ваши данные, которые вы можете использовать так, как вам хочется. Google предоставляет бесплатную услугу, поэтому есть определенные условия. Если вам не нравится не иметь полного контроля над своими данными, существует множество других решений. Тем не менее, вы будете платить премию за такой контроль.

Google зарабатывает почти все свои деньги на продаже рекламы. Adwords — их самый прибыльный продукт. Они не собираются предоставлять вам конфиденциальную информацию о том, как это работает. Они не знают, кто вы и что вы собираетесь делать с этой информацией. Неважно, подписываете ли вы соглашение о неразглашении, и у них есть законные основания подать на вас в суд; если вы отдадите эту информацию конкуренту, ваша жизнь не будет стоить того, чтобы вернуть деньги, которые вы им потеряете.

Извините, что разбиваю вам это, но «Не будь злым» или нет, Google — это бизнес, а не благотворительность. Они не стали одной из самых успешных компаний в мире, отдав свой поисковый алгоритм первому, кто его об этом попросил.

person Chris    schedule 16.02.2009

Параметр gclid закодирован в буферах протокола, а затем в варианте Base64.

См. это руководство по расшифровке gclid и его интерпретации, включая (Apache- лицензированная) функция PHP, которую вы можете использовать.

Внутри него закодировано 3 параметра, один из которых — временная метка. Остальные 2 пока неизвестны.

Что касается понимания того, что означают эти другие параметры, может быть полезно сравнить их с параметром ei, который равен закодирован очень похожим образом (в основном протокольные буферы с удаленными ключами). Параметр ei также имеет временную метку, кажущуюся микросекундами, и 2 других целых числа.

person andre    schedule 16.12.2013
comment
+1. Спустя 5 лет кто-то думает попробовать protobuf. Надеюсь, кто-нибудь когда-нибудь поймет, как связать это с AdWords! - person Draemon; 17.12.2013

К вашему сведению, я только что опубликовал краткий анализ некоторых glcid-данных с моих сайтов на этом сообщение. В gclid определенно есть какая-то структура, но ее трудно расшифровать.

person Community    schedule 15.04.2009
comment
Спасибо за информацию - приятно знать, что кому-то еще интересно! Вам действительно нужно декодировать символы, прежде чем искать шаблоны, так как base64 будет распределять исходные байты по соседним закодированным байтам. Я провел аналогичный анализ сам и также убедил себя, что есть какая-то закономерность, но понятия не имею, какая. - person Draemon; 21.04.2009
comment
Анализ символов очень интересен и, по сути, доказывает, что в этих гклидах закодированы данные... очень круто. - person ojrac; 19.08.2009

Я работал над этой проблемой в нашей компании, а также. Мы хотели бы иметь возможность лучше понять, что делает наша AdWords, но мы разочарованы ограничениями в Google Analytics.

Наше текущее решение состоит в том, чтобы искать в журналах доступа Apache запросы GET с использованием регулярного выражения:

.*[?&]gclid=([^$&]*)

Если он существует, то мы смотрим на строку реферера, чтобы получить ключевое слово:

.*[?&]q=([^$&]*).*

Альтернативный вариант — изменить свой веб-журнал Apache, чтобы начать регистрировать файл cookie __utmz, который устанавливает Google, который должен иметь часть для ключевого слова в utmctr. Google __utmz cookie, и вы сможете найти много информации.

Насколько точна строка реферера? Не 100%. Брандмауэры и устройства безопасности удалят его. Но самостоятельный анализ дает вам больше гибкости, чем Google Analytics. Было бы неплохо отправить gclid в AdWords и получить обратно данные, но похоже, что эта функция недоступна.

РЕДАКТИРОВАТЬ: Поскольку я написал это, мы также создали наши собственные теги, которые добавляются к каждому URL-адресу назначения в качестве параметра запроса. Каждый тег — это просто md5-хэш текста, группы объявлений и названия кампании. Мы берем его с помощью регулярного выражения из журнала доступа и ищем его в базе данных SQL.

person Jeff Wu    schedule 04.05.2011
comment
@Jeff Wu Я прочитал ваш ответ и, в частности, ваше редактирование. Интересно, как вы добавили свои собственные параметры запроса к целевым URL-адресам - у нас уже запущено много кампаний, поэтому это было бы очень трудоемко. Для тех, кто может задаться тем же вопросом, скрипты Google AdWords — один из способов сделать это. Вот несколько полезных ссылок: документация Google и Пример скрипта, добавляющего параметры к URL - person mozz100; 18.09.2013
comment
Это довольно круто, я не знал об этой библиотеке Javascript, когда мы это реализовывали. Я написал скрипт Python, чтобы взять CSV-файл объявлений и добавить тег к каждой из ссылок. Затем наш менеджер кампании брал CSV-файл и загружал его в AdWords с помощью настольной утилиты. - person Jeff Wu; 18.09.2013

Я думаю, что вы можете получить все вкусности, связанные с gclid, через Google Adword API. В частности, вы можете запросить отчет об эффективности кликов.

https://developers.google.com/adwords/api/docs/appendix/reports#click

person shep    schedule 11.03.2014
comment
Да, это новая опция, которую предоставляет Google. Однако вы не можете получить очень старые исторические данные из этой конечной точки API, так что это просто хорошо для новых данных. - person Bani; 05.11.2014

Ну, это не ответ, но подход похож на то, как вы решаете любую проблему криптографии.

Вариант 1: они просто случайны, и в этом случае вы облажались. Это аналог одноразового блокнота.

Вариант 2: Они что-то «имеют в виду». В этом случае вы должны контролировать окружающую среду.

  1. Получить хорошую базу данных о них. Найдите gclid для своего сайта и других. Записывайте все времена, когда происходят все клики, и любые другие потенциально полезные данные.
  2. Получить трещины! Поскольку вы уже начали, начните регрессировать собранные данные по известным и посмотрите, сможете ли вы найти шаблоны, используемые методами дешифрования.
  3. Начните собирать случайные gclid и посмотрите, куда они вас приведут.

Я бы не возлагал больших надежд на успех, но желаю вам удачи!

person Gregg Lind    schedule 13.12.2008
comment
Re 1 - я почти уверен, что они не случайны. Наши гклиды похожи, чужие тоже похожи, но непохожи на наши. Это определенно не просто увеличивающийся идентификатор. 2.1. Это сложно, так как есть много gclid, которые вы не видите (если они не нажимают на них). ... - person Draemon; 14.12.2008
comment
... Я собрал большой список из журналов, и я определил, какие байты меняются больше, чем другие, и мой мозг кричит, что это не случайно, но дальше этого ничего никуда не ведет. 2.2/2.3 - Я хотел бы получить ссылку на какие-либо методы или инструменты - инстинкт меня не завел слишком далеко. - person Draemon; 14.12.2008
comment
tbh Я тоже не питаю особой надежды, но это было бы очень круто - и я действительно не думаю, что Google должен иметь монополию на это. У меня просто есть ощущение, что это легко, если вы знаете, как - person Draemon; 14.12.2008
comment
blog.merjis.com/2007/07 /16/click-fraud-google-adwords-and-gclid, кажется, много обсуждает роль gclid, и поиск в Google дает много общего понимания. Они новые для меня, я влезу, если узнаю больше. - person Gregg Lind; 14.12.2008
comment
Поскольку Google Analytics может понимать gclid, скорее всего, это двусторонний хеш, что является плюсом. Работа по referrer_id. - person Gregg Lind; 14.12.2008

Похоже, мой представитель слаб, поэтому я просто опубликую другой ответ, а не комментарий.

Это не ответ, однозначно. Просто озвучил некоторые мысли.

Когда вы включаете автоматическую пометку в Adwords, параметры gclid не добавляются к целевым URL. Вместо этого они добавляются к целевым URL-адресам во время выполнения серверами отслеживания кликов Google. Итак, происходит одно из двух:

  1. Серверы кликов хранят gclid вместе с идентификаторами объектов Adwords, чтобы Google Analytics мог позже найти их.

  2. В gclid идентификаторы объектов каким-то образом закодированы, чтобы Google Analytics могла их расшифровать.

С точки зрения производительности кажется маловероятным, что Google будет реализовывать что-либо подобное варианту 1. Принуждение Analytics к «присоединению» gclid к идентификаторам Adwords кажется исключительно неэффективным в масштабе.

person Taylor    schedule 14.02.2013

Это непрограммный способ декодирования параметра GCLID. Скорее всего, вы просто пытаетесь определить кампанию, группу объявлений, ключевое слово, место размещения, объявление, которые привели к кликам и конверсиям. Для этого вы можете загрузить GCLID в AdWords как отдельный тип конверсии, а затем сегментировать по типу конверсии, чтобы перейти к критериям, вызвавшим конверсию. Эти шаги:

  1. В пользовательском интерфейсе AdWords выберите Инструменты->Конверсии->Добавить конверсию с источником "Импорт из кликов".
  2. Посетите раздел справки AdWords об импорте конверсий https://support.google.com/adwords/answer/7014069 и создайте файл массовой загрузки со значениями GCLID, назначив конверсии новому типу конверсии "Импорт из кликов".
  3. Загрузите конверсии в AdWords в Инструменты->Конверсии->Действия-конверсии (Загрузки) на левой панели навигации.
  4. Перейдите на вкладку кампании, Сегмент->Конверсии->Название конверсии.
  5. Найдите свое новое имя конверсии в списке сегментов, отсюда и пришла конверсия. Продолжайте тот же процесс на вкладке групп объявлений и ключевых слов, пока не узнаете исходные критерии GCLID.
person TJ Wilkinson    schedule 09.09.2016

Другой подход заключается в том, чтобы просто посмотреть на данные реферера, которые, по крайней мере, предоставят ключевое слово, которое было найдено.

person Ophir Prusak    schedule 22.12.2009
comment
данные реферера отправляются клиентом (агентом пользователя) и являются ненадежными. - person Draemon; 29.12.2009

Вот мысль: есть ли шанс, что gclid — это просто криптографический хеш, например, bit.ly или какой-то другой сокращатель URL?

В этом случае содержимое хешированного текста будет записано в базу данных и заменено уникальным идентификатором.

В конце концов, gclid сокращает кучу длинного текста.

Возьмем этот пример: www.example.com?utm_source=google&utm_medium=cpc.

Преобразуется в это: www.example.com?gclid=XDF

так же, как сокращение URL.

Для обратного проектирования криптографического хэша потребуется шифр замены... не такая простая задача: https://crypto.stackexchange.com/questions/300/reverse-engineering-a-hash

Может быть, какое-то глубокое копание в журналах, поиск закономерностей и т. Д.

person Jareau Almeyda    schedule 16.01.2013
comment
Нет, gclid определенно не является криптографическим хэшем, так как у него ужасная энтропия (gclid из той же учетной записи будут очень похожи). . Что-то закодировано в этих гклидах, но выяснить, что и как — совсем другое дело. - person Draemon; 18.01.2013

Я согласен с Офиром и Крисом. Я чувствую, что это просто серийный номер / уникальный идентификатор клика, который раскрывает свои секреты только тогда, когда системы Analytics и Adwords общаются друг с другом за кулисами.

Зная это, я бы порекомендовал посмотреть на ссылающийся URL-адрес и извлечь из него как можно больше, чтобы использовать его в настройке отслеживания кликов на бэкенде.

Например, я живу в Новой Зеландии и использую Firefox. Это поиск на панели инструментов Google Firefox по запросу «переполнение стека»: http://www.google.co.nz/search?q=stack+overflow&ie=utf-8&oe=utf-8&aq=t&client=firefox-a&rlz=1R1GGLL_en-GB

Вы можете видеть, что: а) я использую домен .NZ, б) мое ключевое слово «стек + переполнение», в) я использую Firefox.

Наконец, если вы также сохраните полный URL-адрес целевой страницы, вы можете сохранить GCLID, который сообщит вам, что посетитель пришел из платного, тогда как если у него нет GCLID, то пользователь должен был прийти из обычного поиска (если URL-адрес тегирование включено, конечно).

Теоретически это позволит вам найти ключевое слово в вашей кампании и выяснить, из какой группы объявлений оно пришло. Однако узнать креатив, вероятно, будет невозможно, если только вы не разделите тестовые URL-адреса приземления или не пометите их каким-либо образом.

person Community    schedule 13.01.2010
comment
согласился, что если gclid действительно непрозрачная ссылка, то на этом все. Однако я почти уверен, что у него есть какая-то структура. Та небольшая информация, которую я получил от Google, казалось, подразумевала это. - person Draemon; 14.01.2010