Приложения глубокого обучения и анализа использования Интернета в электронных службах

Исследовательский проект по интеллектуальному анализу веб-данных и бизнес-аналитике

Технология электронной коммерции 584

Университет ДеПоля

Чикаго, Иллинойс 60604

РЕЗЮМЕ

Глубокое обучение (также известное как глубокое структурированное обучение или иерархическое обучение) является частью более широкого семейства методов машинного обучения, основанных на представлениях обучающих данных, а не на алгоритмах для конкретных задач. Обучение может быть контролируемым, полуконтролируемым или неконтролируемым. Интеллектуальный анализ веб-использования, с другой стороны, представляет собой применение методов интеллектуального анализа данных для обнаружения интересных шаблонов использования веб-данных, чтобы понять и лучше удовлетворить потребности веб-приложений. Данные об использовании фиксируют личность или происхождение веб-пользователей, а также их поведение при просмотре веб-сайта.

Извлечение знаний из всемирной паутины является утомительной задачей из-за роста доступности информационных ресурсов в ней. Таким образом, возрастает необходимость использования интеллектуальной системы для извлечения знаний из всемирной паутины[1]. Производительность поиска информации в Интернете и хранения данных в Интернете повышается за счет извлечения информации из Интернета с использованием инструментов веб-интеллектуального анализа. Интеллектуальный анализ использования веб-ресурсов — одна из наиболее быстро развивающихся областей веб-интеллектуального анализа. Его внимание к анализу поведения пользователей в Интернете после изучения журналов доступа очень быстро сделало его популярным, особенно в области электронных услуг. Большинство поставщиков электронных услуг осознали тот факт, что они могут использовать этот инструмент для удержания своих клиентов. Вы когда-нибудь задумывались, как клиенты используют данные в Интернете? Интеллектуальный анализ использования Интернета может ответить на вопросы клиентов о веб-активности, чтобы бизнес мог продаваться лучше и эффективнее. В этой статье делается попытка дать представление о веб-майнинге и различных областях веб-майнинга. Затем основное внимание уделяется интеллектуальному анализу использования Интернета, его применению и влиянию на электронные услуги.

ВВЕДЕНИЕ

Прежде чем углубиться в суть этой статьи, я хотел бы попытаться определить концепцию интеллектуального анализа данных. Хорошее определение этого понятия можно взять из конспектов лекций; который определяет интеллектуальный анализ данных как нетривиальное извлечение неявных, ранее неизвестных и потенциально полезных знаний из данных в больших хранилищах данных.

Веб-майнинг, с другой стороны, представляет собой применение методов интеллектуального анализа данных и машинного обучения для извлечения полезных знаний для обнаружения шаблонов из всемирной паутины или веб-ресурсов. Веб-майнинг можно разделить на три разных типа, а именно: интеллектуальный анализ веб-использования (который представляет собой действия из журналов сервера и отслеживание активности веб-браузера), интеллектуальный анализ веб-контента (относится к данным, найденным на веб-страницах и внутри документов) и интеллектуальный анализ веб-структуры (относится к к ссылкам между страницами, людьми и другими данными).

Теперь, когда количество источников информации, доступных во Всемирной паутине, значительно выросло, для пользователей стало очень важно использовать автоматизированные инструменты для обнаружения и поиска нужных информационных ресурсов, а также для отслеживания и анализа моделей их использования. Для извлечения информации из различных областей хранения, что является довольно сложным процессом, требуются эффективные инструменты для поиска нужной информации. С другой стороны, это порождает проблемы, которые можно решить с помощью интеллектуальной системы, которая может эффективно добывать знания.

Когда дело доходит до анализа, веб-майнинг идет гораздо дальше, объединяя другую корпоративную информацию с данными веб-трафика. Существует так много практических применений технологии веб-майнинга, которые изобилуют, и ни в коем случае не являются пределом этой технологии. Используемые инструменты могут быть расширены и запрограммированы для ответа практически на любой вопрос. Его можно применять в различных областях, таких как предоставление компаниям управленческой информации о профилях посетителей, что помогает высшему руководству принимать соответствующие стратегические меры. С помощью Web Mining компания может получить некоторые субъективные измерения эффективности своей маркетинговой кампании или маркетинговых исследований, что поможет бизнесу своевременно улучшить и согласовать свои маркетинговые стратегии. В деловом мире интеллектуальный анализ структуры может быть весьма полезен для определения связи между двумя или более деловыми веб-сайтами. Это позволяет сопоставлять учетную информацию, профиль клиента, инвентарную и демографическую информацию с просмотром веб-страниц. Компания может определить сильные и слабые стороны своей кампании веб-маркетинга с помощью Web Mining, а затем внести стратегические коррективы, снова получить отзывы от Web Mining, чтобы увидеть улучшения. Поисковая система Google предоставляет расширенные и эффективные возможности поиска. [2]

Веб-майнинг в основном делится на три категории: интеллектуальный анализ веб-контента, интеллектуальный анализ веб-структуры и интеллектуальный анализ использования Интернета.

Анализ веб-контента

Интеллектуальный анализ веб-контента фокусируется на извлечении и анализе полезной информации или знаний с веб-страниц и веб-документов. Данные контента соответствуют набору фактов, которые веб-страница предназначена для передачи пользователям. Он может состоять из текста, изображений, аудио, видео или структурированных записей, таких как списки и таблицы. Хотя существует значительный объем работ по извлечению знаний из изображений — в области обработки изображений и компьютерного зрения — применение этих методов для

Интеллектуальный анализ веб-контента не был очень быстрым. [2]

Его методы эквивалентны методам интеллектуального анализа данных для интеллектуального анализа текста, поскольку можно найти аналогичные типы информации из неструктурированных данных, находящихся в веб-документах. Веб-документ обычно содержит несколько типов данных, таких как текст, изображение, аудио, видео, метаданные и гиперссылки. Неструктурированные характеристики веб-данных вынуждают интеллектуальный анализ веб-контента использовать более сложный подход. Интеллектуальный анализ веб-контента можно объяснить в двух разных контекстах [6]: поиск информации и база данных. Роль интеллектуального анализа веб-контента в поиске информации в основном заключается в поддержке поиска информации или улучшении фильтрации информации на основе пользовательских запросов. Этот результат можно применить к поисковым системам и системам веб-персонализации. В контексте базы данных интеллектуальный анализ контента может помочь интегрировать данные в Интернете, чтобы можно было выполнять более сложные запросы, отличные от поиска на основе ключевых слов. Результат интеллектуального анализа можно использовать для создания веб-хранилища и веб-базы данных, а также для применения к данным методов хранения и базы данных.

Интеллектуальный анализ веб-структуры

Структура типичного веб-графа состоит из веб-страниц в виде узлов и гиперссылок в виде ребер, соединяющих две связанные страницы. Веб-структура Майнинг может рассматриваться как процесс обнаружения информации о структуре из Интернета. Этот тип майнинга можно разделить на два вида в зависимости от типа используемых структурных данных. [2]

Интеллектуальный анализ веб-структуры пытается идентифицировать авторитетные веб-страницы. Интернет представляет собой сложное хранилище данных, оно содержит не только страницы, но и гиперссылки, указывающие с одной страницы на другую. Давая гиперссылку на другую страницу, автор пытается показать свой отзыв о другой странице. Эта огромная информация о связях образует богатый источник веб-майнинга. Он предлагает потрясающую информацию о релевантности, качестве и структуре веб-контента. Архитектура гиперссылок, лежащих в основе веб-сайта, является результатом этой категории, и соответствующая обработка этой информации может привести к повышению точности поиска веб-страницы.

Использование веб-сайтов

Web Usage Mining — это применение методов интеллектуального анализа данных для обнаружения интересных шаблонов использования веб-данных, чтобы понять и лучше удовлетворить потребности веб-приложений [2]. Это делает то, что он пытается извлечь полезную информацию из истории веб-доступа пользователей, что их интересует в Интернете, будь то текстовые данные или мультимедийные данные и т. д. Данные здесь собираются из записей веб-журнала для обнаружения шаблонов доступа пользователей к веб-страницам. . Эти шаблоны ведут к посещаемым веб-страницам. Это жизненно важная информация для компаний и их интернет-/интранет-приложений. Они используют проанализированные отчеты об этих шаблонах для разных целей. Приложения, созданные в результате этого анализа, могут быть классифицированы как персонализация, улучшение системы, модификация сайта, бизнес-аналитика и характеристика использования [2]. Интеллектуальный анализ использования Интернета зависит от сотрудничества пользователя, чтобы разрешить доступ к записям веб-журнала. Из-за этой зависимости конфиденциальность становится новой проблемой для анализа использования Интернета, поскольку пользователи должны быть осведомлены о политике конфиденциальности, прежде чем они примут решение раскрыть свои личные данные [8].

Основное внимание в этой статье мы уделяем концепции интеллектуального анализа использования веб-ресурсов, поэтому мы будем больше отвлекаться на его приложения и другие его аспекты (интеллектуальный анализ использования веб-ресурсов). На самом деле, майнинг использования Интернета имеет много преимуществ, которые привлекают к нему бизнес и государственные учреждения. Правительственные учреждения использовали возможности этой технологии по классификации и прогнозированию для борьбы с терроризмом и выявления преступной деятельности. Бизнес-секторы выигрывают от персонализированного маркетинга, удержания клиентов и отношений с клиентами, и даже они получили возможность предоставлять рекламные предложения конкретным клиентам, чтобы удержать их.

Указанные действия выполняются тремя основными инструментами анализа использования веб-ресурсов, а именно: предварительной обработкой, обнаружением шаблонов и анализом шаблонов. Мы хотели бы сделать краткое введение в эти темы, чтобы показать, как они связаны с анализом использования веб-ресурсов.

1. Предварительная обработка

Предварительная обработка в веб-анализе использования — это преобразование пользовательской информации в формат абстракции данных. Это неотъемлемая часть обнаружения шаблонов, и в соответствии с данными предварительной обработки она подразделяется на три категории: предварительная обработка использования, предварительная обработка контента и предварительная обработка структуры. Предварительная обработка использования является одной из сложных задач в майнинге веб-сайтов. Они собирают данные с IP-адресов, агентов и потоков кликов на стороне сервера, поскольку из-за характера данных данные всегда являются неполными. Предварительная обработка текста, изображений, скриптов и мультимедийных файлов осуществляется в предобработке контента. Предварительная обработка структуры включает в себя обработку гиперссылок между просмотрами страниц [2].

Другой аспект предварительной обработки заключается в том, что она состоит из идентификации пользователя, очистки данных, завершения пути, идентификации сеанса и форматирования.

я. Для идентификации пользователя пользователь является основной переменной/объектом, использующим клиент для сбора и рендеринга ресурсов. Идентификация пользователя сильно усложняется наличием локальных кэшей, корпоративных брандмауэров и прокси-серверов. Методы интеллектуального анализа использования Интернета, основанные на сотрудничестве пользователей, являются самыми простыми способами решения этой проблемы. Однако даже для методов на основе журнала/сайта существуют эвристики, которые можно использовать для идентификации уникальных пользователей. Например, даже если IP-адрес один и тот же, если журнал агента показывает изменение программного обеспечения браузера или операционной системы, разумным предположением будет то, что каждый другой тип агента для IP-адреса представляет другого пользователя [5]. Другой эвристикой для идентификации пользователя является использование журнала доступа в сочетании с журналами источников перехода и топологией сайта для построения путей просмотра для каждого пользователя. Если запрашивается страница, которая недоступна напрямую по гиперссылке ни с одной из страниц, посещенных пользователем, эвристика предполагает, что существует другой пользователь с таким же IP-адресом.

II. Очистка данных — это метод, который может удалять повторяющиеся и неявные данные. Конец вещей, которые считаются неважными, можно разумно выполнить, проверив постфикс имени URL. Например, все фрагменты журнала с постфиксами имени файла, например, gif, jpeg, GIF, JPEG, jpg, JPG и map могут быть удалены. Кроме того, обычные скрипты, например, документы, запрашиваемые с постфиксами «.cgi», также могут быть удалены[10]. Тем не менее, время от времени возникают обязательные обращения, которые не фиксируются в журнале входа, например, расположенные рядом кэши и промежуточные серверы могут серьезно исказить общую картину обхода клиентов через веб-страницу. Текущие методы решения этой проблемы включают использование файлов cookie, очистку кеша и недвусмысленную регистрацию клиентов [5].

III. Завершение пути определяет проблему, к которой есть обязательные обращения, не зарегистрированные в журнале входа. Техники, подобные тем, которые используются для доказательства различения клиентов, могут использоваться для завершения пути. В случае, если сделан запрос страницы, который напрямую не связан с последней запрошенной клиентом страницей, в журнале реферера можно проверить, с какой страницы исходит запрос. Если страница находится в более поздней истории запросов клиента, предполагается, что клиент вернулся с помощью «обратной» перехвата, доступной в большинстве браузеров, вызывая зарезервированные варианты страниц до тех пор, пока не будет запрошена другая страница. Если журнал реферера не ясен, топология сайта может быть использована для того же эффекта. В случае, если более чем одна страница в истории клиента содержит ссылку на запрашиваемую страницу, считается, что источником нового запроса является страница, ближайшая к ранее запрошенной странице.

IV. Идентификация сеанса относится к фрагменту данных, который используется в сетевых коммуникациях для идентификации сеанса, серии связанных обменов сообщениями. Сеанс пользователя, с другой стороны, относится к количеству кликов, которые пользователь делает на одном или нескольких веб-серверах. Цель идентификации сеанса — разделить доступ к странице каждого пользователя на отдельные сеансы. Самый простой способ добиться этого — использовать тайм-аут, при котором, если время между запросами страниц превышает определенный предел, предполагается, что пользователь начинает новый сеанс.

v. Для форматирования при интеллектуальном анализе данных мы, люди, используем опыт, когда интерпретируем данные, которые видим, а компьютеры/машины не могут. После того как соответствующие шаги предварительной обработки были применены к журналу сервера, можно использовать окончательный подготовительный черновик для правильного форматирования сеансов или транзакций для того типа интеллектуального анализа данных, который необходимо выполнить. Например, поскольку информация, полученная из временных данных, не требуется для интеллектуального анализа правил ассоциации, в окончательном проекте подготовки правила ассоциации будет исключено время для каждой ссылки и выполнено любое другое форматирование данных, необходимое для конкретного интеллектуального анализа данных. используемый алгоритм [5].

2. Обнаружение закономерностей

Инструменты обнаружения шаблонов созданы в нескольких областях, таких как статистика, интеллектуальный анализ данных, машинное обучение и распознавание образов. Только после очистки данных и идентификации пользовательских транзакций и сессий из журналов доступа мы можем начать процесс обнаружения паттернов. Статистические методы используются для абстрагирования знаний о посетителях веб-сайта. Затем из этого абстрактного знания правило ассоциации создает связь между страницами, на которые часто ссылаются, а инструменты последовательного шаблона помогают прогнозировать шаблоны будущих посещений. Из этих инструментов кластеризации данных элементы схожих характеристик группируются вместе, наиболее заинтересованными группами в задачах интеллектуального анализа использования Интернета являются группа изображений, кластер изображений и группа страниц, кластер страниц и инструмент классификации, которые выполняют процесс обобщения и объединяются в один предопределенный класс. У нас есть различные инструменты обнаружения шаблонов, которые можно использовать при анализе использования веб-ресурсов. Некоторые из них включают следующее: кластеризация, правила ассоциации, последовательные шаблоны и классификация.

я. Кластеризация — это метод группирования набора элементов, имеющих схожие характеристики. В области веб-использования можно обнаружить два типа интересных кластеров: кластеры использования и кластеры страниц [5]. Кластеризация пользователей имеет тенденцию создавать группы пользователей, демонстрирующих схожие модели просмотра. Такие знания особенно полезны для определения демографических характеристик пользователей, чтобы выполнять сегментацию рынка в приложениях электронной коммерции или предоставлять пользователям персонализированный веб-контент. С другой стороны, кластеризация страниц обнаружит группы страниц со связанным содержанием.

II. Правила ассоциации — это метод обнаружения интересных отношений между переменными в больших базах данных. Он предназначен для выявления сильных правил, обнаруженных в базах данных, с использованием некоторых мер интереса [6]. Он фиксирует отношения между элементами на основе их моделей совместного появления в транзакциях. В случае веб-транзакций правила ассоциации фиксируют отношения между просмотрами страниц на основе навигационных шаблонов пользователя. Наиболее распространенные подходы к обнаружению ассоциаций основаны на априорном алгоритме, который следует методологии «генерировать и тестировать» [5]. Наличие или отсутствие правил ассоциации не только применимо для деловых и маркетинговых приложений, но и может помочь веб-дизайнерам реструктурировать свой веб-сайт.

III. Последовательные шаблоны в анализе использования веб-страниц фиксируют следы веб-страниц, которые часто посещают пользователи, в том порядке, в котором они были посещены. Последовательные паттерны — это такие последовательности элементов, которые часто встречаются в достаточно большом количестве транзакций. Используя эту методологию, веб-рекламодатели могут предвидеть планы будущих посещений, которые будут полезны при настройке рекламы для определенных групп пользователей. Это может быть полезно при анализе тенденций, обнаружении точек изменения или анализе подобия.

IV. Наконец, классификация — это попытка сопоставления элемента данных с одним из нескольких предопределенных классов. Для этого сначала разбивается модельный набор (т. е. набор случаев, признаки классов которых известны) и разрабатывается классификационная модель с учетом компонентов, доступных в информации модельного набора. Такая классификационная модель затем используется для организации набора оценок. Классификация должна быть возможной за счет использования управляемых вычислений индуктивного обучения, например, классификаторов k-ближайших соседей, деревьев решений, наивного байесовского метода и т. д.

3. Анализ закономерностей

Последней частью анализа использования веб-ресурсов является анализ шаблонов. На этом этапе будут отфильтрованы все неважные шаблоны из набора, найденного при обнаружении шаблонов. Например, после обнаружения шаблонов доступа аналитикам потребуются соответствующие инструменты и методы для понимания, визуализации и интерпретации этих шаблонов. Механизм запроса знаний, такой как SQL, является наиболее распространенной формой метода анализа шаблонов. Они используют информацию о содержании и структуре также для фильтрации шаблонов, содержащих страницы определенных типов использования, типы содержимого или страницы, которые соответствуют определенной структуре гиперссылок [4]. Всегда существует потребность в разработке методов и инструментов, которые помогут аналитику лучше понять знания, полученные из некоторых данных, и именно на этом специализируются инструменты анализа шаблонов. Наиболее распространенные инструменты анализа шаблонов OLAP-анализ, механизм запроса знаний и методы визуализации.

я. OLAP (анализ) — это аббревиатура от Online Analytical Processing. Он выполняет многомерный анализ бизнес-данных и предоставляет возможности для сложных расчетов, анализа тенденций и сложного моделирования данных [6]. OLAP также становится очень мощной парадигмой для стратегического анализа баз данных в бизнес-среде. В то время как OLAP может выполняться непосредственно поверх реляционных баз данных, промышленность разработала специализированные инструменты, чтобы сделать его более эффективным и действенным, исследовательское сообщество недавно продемонстрировало, что функциональные потребности и производительность OLAP требуют разработки новых информационных структур [7].

II. Механизм запроса знаний в основном реализует ассоциацию с SQL. Многие инструменты анализа использования Интернета, например. WUM, WebMiner и Midas предоставляют некоторые правила объектов, например, подъем, поддержку и доверие, которые помогают вручную отфильтровать неважные знания, а затем получить проанализированные результаты с помощью SQL. Запросы могут выполняться на основе знаний, которые были извлечены с помощью процесс майнинга, и в этом случае необходим язык для запроса знаний, а не данных[7].

III. Визуализация данных — это общий термин, который описывает любые усилия, направленные на то, чтобы помочь людям понять значимость данных, поместив их в визуальный контекст. Паттерны, тренды и корреляции, которые могут остаться незамеченными в текстовых данных, могут быть легко обнаружены и распознаны с помощью программного обеспечения для визуализации данных [6]. Визуализация является естественным выбором для понимания поведения пользователей Сети, поскольку она очень успешно используется для помощи людям в понимании различных видов явлений, как реальных, так и абстрактных. Например, система WebViz используется для визуализации шаблонов доступа в Интернет. Это позволяет аналитику выборочно анализировать интересующую часть Интернета, отфильтровывая ненужные части.

Диаграмма, показывающая структуру для интеллектуального анализа использования Интернета (взято из Интернета)

Приложение в электронных службах

Как я уже говорил ранее в статье, результаты интеллектуального анализа использования Интернета можно применять для понимания и анализа данных об использовании Интернета. Таким образом, мы можем применять методы анализа использования Интернета к электронным услугам. Применение интеллектуального анализа использования Интернета относится к тому, как интеллектуальный анализ использования Интернета в различных формах онлайн-сервисов. Интернет превратился в далеко идущую среду для распространения данных [1]. Развитие технологий показало, что объем информации в сети и ее сложные структуры растут без разбора. Именно по этому вопросу использование интеллектуального анализа использования Интернета имеет свою особую полезность. Быстрое развитие онлайн-администраций, называемых приложениями электронного администрирования, такими как электронная коммерция, электронное управление, электронный рынок, - управление счетом и т. д. поставило бизнес-группу и клиентов перед другим обстоятельством. В этом документе основное внимание уделяется использованию интеллектуального анализа использования Интернета в некоторых основных электронных услугах, используемых в мире: электронном обучении, электронном управлении и электронной коммерции.

Электронное обучение

Электронное обучение определяется как исследование и этическая практика облегчения обучения и повышения производительности путем создания, использования и управления соответствующими технологическими процессами и ресурсами [6]. Для лучшего понимания это можно описать как обучение, проводимое с помощью электронных средств, как правило, в Интернете. Его также можно легко определить как тип обучения с электронной поддержкой, который позволяет людям изучать любой предмет в любое время и в любом месте.

В настоящее время очень популярны веб-среды обучения. Все виды машин и инструментов электронного обучения разрабатываются для удовлетворения различных требований к электронному обучению и поддержки совместной учебной деятельности, такой как мультимедийная веб-учебная программа, онлайн-системы синхронных конференций, интерактивные доски и т. д. В значительной степени эти инструменты не только устранить ограничения по времени и пространству традиционной модели обучения и обучения в помещении, а также предоставить несколько моделей обучения, которые делают процесс обучения более привлекательным, эффективным и удобным. Тем не менее, из-за широкого распространения как учебных ресурсов, так и учащихся в сетевой среде обучения, со стороны инструктора и преподавателя им трудно тщательно отслеживать и оценивать деятельность учащихся и, кроме того, оценивать эффективность процесс обучения и структура содержания обучения [9].

Простота использования этих устройств для просмотра ресурсов в Интернете, простота развертывания и обслуживания ресурсов сделали Интернет отличным средством для проведения курсов. Интернет является одним из важных вариантов управления и поддержания учебных ресурсов и стал одним из ведущих вариантов современной продвинутой системы дистанционного обучения / онлайн-обучения. По мере того как образование становится более технологически продвинутым, сложность доступных учебных ресурсов также увеличивается. Трудно оценить структуру содержания курса и его эффективность в процессе обучения.

Это сценарий, в котором интеллектуальный анализ использования Интернета может внести свой вклад. Возможности анализа шаблонов использования веб-ресурсов играют важную роль в веб-системе обучения [1]. Они могут анализировать поведение учащихся и преподавателей и улучшать образовательный опыт. Отслеживание действий, происходящих на веб-сайте курса, и моих шаблонов также полезно для улучшения или корректировки содержания курса. Это позволяет преподавателям оценивать поведение учащихся, оценивать учебную деятельность и сравнивать учащихся. Расположение содержимого курса может быть улучшено путем анализа путей обхода веб-страниц с содержанием курса, что является еще одним преимуществом интеллектуального анализа использования Интернета.

Традиционная модель электронного обучения (взято из Интернета [6])

Электронное управление

Электронное управление или электронное управление — это применение информационных и коммуникационных технологий (ИКТ) для предоставления государственных услуг, обмена коммуникационными транзакциями, интеграции различных автономных систем и услуг между правительством и клиентом (G2C), правительством и - деловые (G2B), межправительственные (G2G), а также процессы и взаимодействия бэк-офиса в рамках всей государственной структуры.[1] Благодаря электронному управлению государственные услуги будут доступны гражданам в удобной, эффективной и прозрачной форме.

Что он делает, так это то, что он предоставляет единый веб-портал, который объединяет все услуги, включая государственные, некоммерческие и частные организации. В сервисной системе такого типа, которая обеспечивает быстрый доступ к информации, качество пользовательского интерфейса является важным фактором. Это один из сложных параметров, ориентированных на пользователя, поскольку он должен предоставлять информацию обширным и разнообразным пользователям [1]. Если подсистема представления настраивается в соответствии с индивидуальными предпочтениями каждого пользователя, это обеспечит широкое участие в системах электронного управления.

Применение интеллектуального анализа использования Интернета в электронном правительстве — это процедура, которая переводит данные об использовании гражданами или бизнесом на правительственном веб-сайте в ценные знания, которые могут обеспечить различную поддержку принятия решений в государственных делах [8]. Это может включать: выяснение интересов/желаний гражданина и повышение удовлетворенности гражданина или бизнеса; реструктуризация веб-сайта правительства и повышение производительности системы; улучшение государственного планирования и поощрение государственных инноваций; улучшение анализа и принятия решений правительства и т. д.

Обнаружив поведение и предпочтения гражданина / пользователя, он может легко увидеть, куда он нажимает, как долго он остается на определенных страницах, какие слова он искал и как он взаимодействовал с веб-сайтом.

Что касается повышения производительности системы государственного веб-сайта, веб-сайт может быть реструктурирован с учетом частых путей доступа посетителей, что значительно снижает расходы на веб-сайт. Это в основном то, что делает интеллектуальный анализ использования Интернета в электронном правительстве; эффективное наблюдение и анализ пользователей государственного веб-сайта, их действий и поведения.

Для поощрения государственных инноваций, используя технологию интеллектуального анализа данных, правительство может разумно управлять человеческими ресурсами, материальными ресурсами и информационными ресурсами, чтобы гармонизировать отношения между ресурсами внутри правительства и внешними ресурсами, например, весь процесс от планирования программы до реализации программы. могут обмениваться и совместно использовать одни и те же данные [8].

Сбор данных об использовании Интернета на правительственном сайте может быстро получить информацию о государственных делах, чтобы правительство своевременно улавливало тенденции развития общества, что в то же время делало управление и перераспределение ресурсов общества более систематическим [1].

Когда дело доходит до улучшения правительственного анализа и принятия решений, анализ и обработка больших объемов правительственных данных становятся очень полезными. Вот как правительство принимает решения о своих гражданах, анализируя информацию о гражданах и др. Например, анализ лог-файлов на стороне клиента может получить мнение граждан и эффективно помочь правительственному ведомству внести научную и рациональную корректировку в соответствии с их желаниями [8].

Электронная коммерция

Электронная коммерция в своей простейшей форме относится к покупке и продаже товаров и услуг в Интернете. Обмен товарами или услугами через Интернет Электронная коммерция порождает огромный объем отношений. Это также подразумевает наличие двух торговых сторон на базе Интернета по определенным правилам или стандарту, развивающих всю традиционную деловую активность в режиме цифровой сети [1].

Наблюдается рост технологий, которые собирают потоки кликов клиентов, модели покупок и переходов являются жизненно важной информацией для деятельности электронной коммерции и анализа поведения пользователей в Интернете. Они помогают в исследовании демографических данных и помогают им предлагать кросс-маркетинговые процедуры для продуктов и услуг. Он также поддерживает сайты электронной коммерции, чтобы удерживать самых прибыльных клиентов, улучшать функциональность веб-функций, предоставляя посетителям более специально созданный контент. В дополнение к использованию методов интеллектуального анализа данных об использовании Интернета компании электронной коммерции могут улучшить качество продукции или продажи, предвидя проблемы до того, как они произойдут. Они также дают группы с ранее неизвестными моделями покупок и эффективностью их онлайн-клиентов. Что еще более важно, быстрая критика, которую группы получают, используя интеллектуальный анализ использования Интернета, очень полезна для увеличения прибыли компании [10]. Уместно отметить, что обнаружение шаблонов использования из веб-данных — это метод, принятый при анализе использования веб-ресурсов. Это была важная технология для понимания поведения пользователей в Интернете. Его технология для сбора потоков кликов клиентов, шаблонов покупок и переходов и т. д. является жизненно важной информацией для электронного бизнеса. В целом, это помогает анализировать демографические данные и помогает владельцам бизнеса / аналитикам предлагать кросс-маркетинговые политики для продуктов и услуг. Он также поддерживает сайты электронной коммерции, чтобы удерживать наиболее прибыльных клиентов, улучшать функциональность веб-приложений, предоставлять посетителям больше пользовательского контента [1].

Методы интеллектуального анализа использования Интернета могут применяться в электронной коммерции в следующих перечисленных примерах:

я. Бизнес-аналитика (БИ)

Business Intelligence можно описать как набор методов и инструментов для сбора и преобразования необработанных данных в значимую и полезную информацию для целей бизнес-анализа [6]. Технологии бизнес-аналитики обеспечивают историческое, текущее и прогнозное представление бизнес-операций. Общими функциями технологий бизнес-аналитики являются отчетность, онлайн-аналитическая обработка, аналитика, интеллектуальный анализ данных, интеллектуальный анализ процессов, прогнозная аналитика и т. д. Их можно использовать для поддержки широкого спектра бизнес-решений, от операционных до стратегических. Сбор данных и информации о том, как клиенты используют веб-сайт, является важной информацией для владельцев бизнеса и маркетологов электронной коммерции. Изучая взаимосвязь между поведением клиентов и покупкой, мы можем намного лучше понять покупательское намерение клиентов, найти покупательские характеристики и тенденции клиентов и определить потенциального покупателя [5]. Несколько коммерческих продуктов, которые обеспечивают анализ веб-трафика в основном для сбора бизнес-аналитики: Accrue, Net-Genesis, Aria, Hitlist и WebTrends и т. д.

II. Персонализация

Веб-персонализация стала незаменимым инструментом как для веб-организаций, так и для конечных пользователей из-за огромного роста количества и сложности информационных ресурсов и услуг на веб-сайте электронной коммерции. Большое количество систем уже сосредоточено на обеспечении персонализации веб-сайтов на основе информации об использовании, хорошим примером является SiteHelper. Кроме того, способность сайта электронной коммерции привлекать посетителей на более глубоком уровне и успешно направлять их к выбору и покупке продуктов в настоящее время рассматривается как один из ключевых факторов конечного успеха компании электронной коммерции [5]. Основное преимущество использования веб-персонализации, основанной на анализе использования веб-ресурсов, заключается в том, что она может автоматизировать адаптацию веб-служб к их пользователям, что затем решает проблему традиционных систем веб-персонализации, т. е. процесс персонализации включает значительную ручную работу и большую часть время, значительные усилия со стороны пользователя.

III. Модификация сайта

От того, насколько удобен и привлекателен сайт электронной коммерции с точки зрения содержания и структуры, во многом зависит успех этого сайта; что очень важно для каталога продуктов электронной коммерции. Интеллектуальный анализ использования веб-сайтов обеспечивает подробную обратную связь о поведении пользователей, предоставляя разработчику веб-сайта информацию, на основе которой принимаются решения по изменению дизайна. Дизайнер интерфейса веб-сайта может использовать эту информацию, чтобы изменить структуру сайта, чтобы адаптировать его к клиентам, использующим его / ее систему электронной коммерции. Кластеризация страниц используется для определения того, какие страницы должны быть напрямую связаны [5].

Некоторые методы веб-интеллектуального анализа могут применяться для понимания и анализа данных и информации, сгенерированных и преобразованных в полезную информацию, которая затем может поддерживать электронный бизнес с поддержкой Интернета для улучшения его продаж, поддержки клиентов и маркетинговых операций. Некоторые включают:

Прогнозирование тренда можно использовать для получения информации для указания будущих значений. Например, компания, занимающаяся электронными аукционами, предоставляет информацию о выставленных на аукцион предметах, сведениях о предыдущих аукционах и т. д. Прогнозное моделирование можно использовать для анализа существующей информации и оценки стоимости предметов аукциониста или количества людей, участвующих в будущих аукционах [11]. .

В борьбе за удержание клиентов аналитики могут искать и удерживать наиболее прибыльных клиентов, анализируя демографические данные, покупательские способности клиентов и анализируя модели, собранные онлайн или офлайн. Здесь на помощь приходят услуги персонализации, поскольку они предлагают только возможность отслеживать общий контент, такой как СМИ, погода, новости, котировки акций и т. д. Кроме того, при попытке продвижения кампании электронной коммерции веб-майнинг может продвигать кампанию с помощью кросс-маркетинговых стратегий. по продуктам [11]. Методы веб-майнинга могут анализировать журналы различных продаж, указывая на модели покупок клиентов, например, можно применять правила ассоциации для поиска часто встречающихся продуктов, которые чаще всего покупаются вместе.

Заключение

Цель этой статьи с самого начала состояла в том, чтобы попытаться представить концепции и проблемы интеллектуального анализа данных, связанные с веб-приложениями электронных услуг, которых мы пытались достичь в огромной степени, углубляясь в различные методы и фокусируясь на них. использование Интернета может применяться на любой платформе или системе электронных услуг. Как мы все знаем и обсуждали ранее, легко собирать данные из веб-источников электронного бизнеса, поскольку все посетители веб-сайта оставляют след, который автоматически сохраняется в файлах журнала веб-сервером. Именно здесь инструменты интеллектуального анализа данных могут обрабатывать и анализировать такие файлы журналов веб-сервера или фактическое веб-содержимое, чтобы обнаруживать значимую информацию, которая затем преобразуется в знания. Методы интеллектуального анализа данных предоставляют компаниям ранее неизвестные модели покупок и поведение их клиентов в Интернете. Что еще более важно, быстрая обратная связь, полученная компаниями с помощью интеллектуального анализа данных, очень полезна для увеличения прибыли компании.

Интеллектуальный анализ использования Интернета, соответственно, является активной областью исследований из-за его потенциальных рыночных преимуществ. Кроме того, можно проанализировать эффективность посетителя, связав веб-журналы с файлами cookie и формами, что может помочь сайту электронных услуг решить несколько бизнес-вопросов. Его осведомленность в анализе действий пользователя в Интернете после обнаружения журналов доступа очень быстро прославилась, особенно в области электронных услуг. Такие детали, как файлы журналов пользователей, запросы ресурсов и т. д., хранятся на веб-серверах, что является основной областью использования Интернета. Их изучение дает пользователю возможность просмотра, и его можно использовать для целевой рекламы, улучшения веб-дизайна, удовлетворения клиентов, а также для прогнозирования и анализа рынка. Дошло до того, что большинство поставщиков электронных услуг понимают этот факт, что в их интересах использовать эту технологию/инструмент, чтобы удерживать своих клиентов.

Основываясь на наших обсуждениях, применение интеллектуального анализа использования Интернета в электронных услугах является интересной и важной областью исследований, которая дает возможность для дальнейшего улучшения работы в будущем. Электронные сервисы в целом предоставляют беспрецедентную возможность сбора подробных данных обо всех аспектах онлайн-активности. Веб-майнинг — это ключевая технология, помогающая разобраться во всех этих данных, а также лучше понять и упростить электронные услуги. По мере того, как Интернет и его использование продолжают расти, растут и возможности анализировать веб-данные и удалять из них всевозможные полезные знания. В будущем будет разработано больше приложений для интеллектуального анализа личного использования Интернета, и различные компании электронного бизнеса, которые включают результаты интеллектуального анализа данных в свою стратегию, обязательно добьются успеха. Кроме того, когда данные, полученные с сайтов и служб электронного правительства, могут помочь предвидеть и предсказать, что граждане ценят и ожидают большего от своего правительства, поскольку это поможет правительству сосредоточиться на таких областях.

В целом, когда веб-майнинг эффективно применяется к электронной коммерции, чтобы узнать поведение клиентов при просмотре, это поможет улучшить дизайн веб-сайта электронной коммерции и предоставить персонализированные услуги, а также определить успех маркетинговых усилий такого бизнеса. Любая интернет-компания, занимающаяся электронной коммерцией или бизнесом, которая включает результаты интеллектуального анализа данных в свою стратегию, имеет огромные шансы на успех. Это так просто.

Ссылки

1. Интеллектуальный анализ использования веб-ресурсов — это приложение в электронных услугах, AnupamaPrasanth.

2. Арти, Сунита Чоудхари, Г. Н. Пурохит: роль веб-майнинга в электронной коммерции.

3. Дж. Хан, М. Камбер. Интеллектуальный анализ данных: концепции и методы, Морган Кауфманн, Лос-Альтос, Калифорния (2001 г.)

4. WebUsage Mining – BomshadMombasher http://www.123seminarsonly.com/Seminar-Reports/2013-03/116918126-web-mining.pdf

5. Ли Чаофэн, Лу Яньшэн. Исследование использования Интернета для электронной коммерции. Материалы Международной конференции по науке и технике управления 2005 г., октябрь 2005 г.

6. Википедия (определения) www.wikipedia.com

7. ЛЮ Цзянь-го, ХУАН Чжэн-хун, У Вэй-пин. Веб-майнинг для приложений электронного бизнеса

8. Пин Чжоу, Чжунцзяньле. Фреймворк для анализа веб-использования в электронном правительстве

9. Синьцзинь Ли, Судзин Чжан. Применение анализа веб-использования в платформе электронного обучения.

10. Доктор С. С. Гаутам, Маниш Кумар Тивари. Веб-майнинг — концепции и приложения

11. ЛЮ Цзянь-го, ХУАН Чжэн-хун, У Вэй-пин. Веб-майнинг для приложений электронного бизнеса