Учитывая данные о местоположении различных типов ресторанов в Ахмедабаде, цель этого блога — предсказать, какая часть города будет лучше всего подходить для открытия определенного типа ресторанов.

Краткое введение

Ахмедабад — крупнейший город и бывшая столица индийского штата Гуджарат. Он расположен на берегу реки Сабармати, в 30 км от столицы штата Гандинагар, который является его городом-побратимом.

Одной из самых популярных форм еды в Ахмадабаде является типичный гуджаратский тхали. Дхокла, тепла и дхебра также очень популярны в Ахмадабаде. Напитки включают пахту и чай. Употребление алкоголя в Ахмедабаде запрещено.

Есть много ресторанов, которые предлагают широкий выбор блюд индийской и интернациональной кухни. В большинстве закусочных подают только вегетарианскую пищу, так как джайнская и индуистская общины города поддерживают сильную вегетарианскую традицию. В более старых районах, таких как Бхатияр Гали, Калупур и Джамалпур, есть несколько ресторанов, где подают типичные невегетарианские блюда Мугла.

Данные !!!

Нет доступного набора данных, который содержит районы / населенные пункты города Ахмадабад. Поэтому я искал координаты 10 случайных районов Ахмадабада и создал для них CSV-файл.

Затем я сначала использовал API FourSquare, чтобы найти рестораны в каждом районе. Я установил ограничение в 50 мест, радиус 1 км для каждого района от их информации о широте и долготе и идентификатора категории до категории «Еда» (как указано на веб-сайте Foursquare).

Данные, возвращенные из Foursquare, были объединены с первоначальными данными района. Таблица теперь состоит из района, широты района, долготы района, места проведения, широты места проведения, долготы места проведения, категории места проведения. Вот глава таблицы:

Есть несколько проблем с набором данных. Во-первых, названия ресторанов не были ни в одном случае. Некоторые названия ресторанов были написаны заглавными буквами, в некоторых некоторые слова были написаны заглавными буквами и т. д. Поэтому я преобразовал все названия в нижний регистр, создав единообразие во всем наборе данных.

Во-вторых, многие рестораны, полученные через API FourSquare, были закрыты навсегда. Поэтому мне пришлось удалить эти рестораны из набора данных, чтобы получить большую точность.

В-третьих, некоторые рестораны находились в разных районах и имели разные названия, возвращаемые API. Например: ресторан «Гвалия» был в 4 районах, и в одном из районов упоминалась «Сладости Гвалии». Поэтому я должен был убедиться, что везде в наборе данных, если название ресторана повторяется, оно должно быть одинаковым. Это обеспечило согласованность набора данных.

Исследовательский анализ данных

Знакомство с некоторыми секретами данных.

Мы видим, что в Бодакдеве больше всего ресторанов, а в Бопале меньше всего. Остальные районы находятся между 4-30 ресторанами.

Нет ни одного района, соответствующего нашему лимиту в 50 человек. Но это не значит, что запрос был неправильным. Это зависит от предоставленной информации о широте и долготе, и здесь мы просто запускаем одну пару широты и долготы для каждого района. Мы можем расширить возможности с помощью информации о соседстве с дополнительной информацией о широте и долготе.

API Foursquare вернул двадцать шесть различных категорий ресторанов, из которых наивысшей оказалась категория «Индийский ресторан». Есть масса категорий, из которых есть только одиночные рестораны по всему городу.

В кафе Coffee Day и Subway больше всего ресторанов, не сильно отстают McDonald’s и Domino’s Pizza. Есть также очень мало местных ресторанов с более чем 2 ресторанами в городе.

Выяснив наиболее распространенные категории ресторанов, присутствующих в каждом районе, получим

Кластеризация

Алгоритм K-средних является одним из наиболее распространенных кластерных методов обучения без учителя. Кластеризация K-средних направлена ​​​​на разделение n наблюдений на k кластеров, в которых каждое наблюдение принадлежит кластеру с ближайшим средним значением, выступающим в качестве прототипа кластера. Кластеры, созданные с помощью этого метода, не перекрывают друг друга.

Используя метод локтя, чтобы найти лучший K для нашей модели.

Мы видим, что K = 3 является оптимальным K для нашей модели кластеризации.

k = 3
# abad_grp_cluster is a dataframe that consists of probability of a category of restaurant to be present in a borough
kmeans = KMeans(n_clusters=k, random_state=0).fit(abad_grp_cluster)
kmeans.labels_[0:9]

После выполнения кластеризации K-средних, вот моя объединенная таблица с метками кластеров для каждого района.

Отображение всех ресторанов в соответствии с их соответствующими кластерами.

Результаты

Анализ каждого кластера и рекомендации ресторанов, которые можно открыть в районах, входящих в кластер.

Из следующего графика видно, что в кластере 0 индийские рестораны и кафе намного выше остальных категорий.

Можно открыть закусочную, пиццерию, бистро, барбекю или даже фудтрак в кластере 0, в котором преобладают индийские рестораны и кафе. Открытие ресторана из указанных категорий сделает ресторан заметным и принесет хороший бизнес.

В кластере 1 есть только один индийский ресторан и ресторан.

Кластер 1 подходит, если вы хотите открыть кафе, пиццерию, бутербродную или фаст-фуд. Они соберут много людей из близлежащих районов. Ресторан будет уникальным в кластере, и у людей не будет другого выбора, чтобы удовлетворить свою тягу в данный день.

В кластере 2 индийских ресторанов в два раза больше, чем в других категориях.

Кластер 2 состоит из индийского ресторана, пиццерии и ресторана гуджарати. Таким образом, можно открыть ресторан любой из этих категорий, поскольку ни одна из них не является доминирующей в кластере. Существует также возможность открыть ресторан нового типа, например, кафе, бутербродную, ресторан какой-то особой кухни и т. д., и стать одним из первых, кто откроет такой ресторан.

Вывод

Ахмадабад — один из умных городов Индии, признанный одним из лучших городов для жизни в стране. В таком городе, где запрещен алкоголь и люди ищут новые места для тусовок, открытие ресторана удовлетворяет не только потребности бизнеса, но и потребности людей.

С таким анализом выбрать место для открытия ресторана становится намного проще. Успех ресторана зависит от того, насколько он эксклюзивен и насколько он дополняет уже существующие рестораны в данном кластере или районе.

Для всех людей, желающих открыть ресторан в Ахмадабаде, этот анализ помогает легко и быстро принимать важные решения.