Учитывая данные о местоположении различных типов ресторанов в Ахмедабаде, цель этого блога — предсказать, какая часть города будет лучше всего подходить для открытия определенного типа ресторанов.
Краткое введение
Ахмедабад — крупнейший город и бывшая столица индийского штата Гуджарат. Он расположен на берегу реки Сабармати, в 30 км от столицы штата Гандинагар, который является его городом-побратимом.
Одной из самых популярных форм еды в Ахмадабаде является типичный гуджаратский тхали. Дхокла, тепла и дхебра также очень популярны в Ахмадабаде. Напитки включают пахту и чай. Употребление алкоголя в Ахмедабаде запрещено.
Есть много ресторанов, которые предлагают широкий выбор блюд индийской и интернациональной кухни. В большинстве закусочных подают только вегетарианскую пищу, так как джайнская и индуистская общины города поддерживают сильную вегетарианскую традицию. В более старых районах, таких как Бхатияр Гали, Калупур и Джамалпур, есть несколько ресторанов, где подают типичные невегетарианские блюда Мугла.
Данные !!!
Нет доступного набора данных, который содержит районы / населенные пункты города Ахмадабад. Поэтому я искал координаты 10 случайных районов Ахмадабада и создал для них CSV-файл.
Затем я сначала использовал API FourSquare, чтобы найти рестораны в каждом районе. Я установил ограничение в 50 мест, радиус 1 км для каждого района от их информации о широте и долготе и идентификатора категории до категории «Еда» (как указано на веб-сайте Foursquare).
Данные, возвращенные из Foursquare, были объединены с первоначальными данными района. Таблица теперь состоит из района, широты района, долготы района, места проведения, широты места проведения, долготы места проведения, категории места проведения. Вот глава таблицы:
Есть несколько проблем с набором данных. Во-первых, названия ресторанов не были ни в одном случае. Некоторые названия ресторанов были написаны заглавными буквами, в некоторых некоторые слова были написаны заглавными буквами и т. д. Поэтому я преобразовал все названия в нижний регистр, создав единообразие во всем наборе данных.
Во-вторых, многие рестораны, полученные через API FourSquare, были закрыты навсегда. Поэтому мне пришлось удалить эти рестораны из набора данных, чтобы получить большую точность.
В-третьих, некоторые рестораны находились в разных районах и имели разные названия, возвращаемые API. Например: ресторан «Гвалия» был в 4 районах, и в одном из районов упоминалась «Сладости Гвалии». Поэтому я должен был убедиться, что везде в наборе данных, если название ресторана повторяется, оно должно быть одинаковым. Это обеспечило согласованность набора данных.
Исследовательский анализ данных
Знакомство с некоторыми секретами данных.
Мы видим, что в Бодакдеве больше всего ресторанов, а в Бопале меньше всего. Остальные районы находятся между 4-30 ресторанами.
Нет ни одного района, соответствующего нашему лимиту в 50 человек. Но это не значит, что запрос был неправильным. Это зависит от предоставленной информации о широте и долготе, и здесь мы просто запускаем одну пару широты и долготы для каждого района. Мы можем расширить возможности с помощью информации о соседстве с дополнительной информацией о широте и долготе.
API Foursquare вернул двадцать шесть различных категорий ресторанов, из которых наивысшей оказалась категория «Индийский ресторан». Есть масса категорий, из которых есть только одиночные рестораны по всему городу.
В кафе Coffee Day и Subway больше всего ресторанов, не сильно отстают McDonald’s и Domino’s Pizza. Есть также очень мало местных ресторанов с более чем 2 ресторанами в городе.
Выяснив наиболее распространенные категории ресторанов, присутствующих в каждом районе, получим
Кластеризация
Алгоритм K-средних является одним из наиболее распространенных кластерных методов обучения без учителя. Кластеризация K-средних направлена на разделение n наблюдений на k кластеров, в которых каждое наблюдение принадлежит кластеру с ближайшим средним значением, выступающим в качестве прототипа кластера. Кластеры, созданные с помощью этого метода, не перекрывают друг друга.
Используя метод локтя, чтобы найти лучший K для нашей модели.
Мы видим, что K = 3 является оптимальным K для нашей модели кластеризации.
k = 3 # abad_grp_cluster is a dataframe that consists of probability of a category of restaurant to be present in a borough kmeans = KMeans(n_clusters=k, random_state=0).fit(abad_grp_cluster) kmeans.labels_[0:9]
После выполнения кластеризации K-средних, вот моя объединенная таблица с метками кластеров для каждого района.
Отображение всех ресторанов в соответствии с их соответствующими кластерами.
Результаты
Анализ каждого кластера и рекомендации ресторанов, которые можно открыть в районах, входящих в кластер.
Из следующего графика видно, что в кластере 0 индийские рестораны и кафе намного выше остальных категорий.
Можно открыть закусочную, пиццерию, бистро, барбекю или даже фудтрак в кластере 0, в котором преобладают индийские рестораны и кафе. Открытие ресторана из указанных категорий сделает ресторан заметным и принесет хороший бизнес.
В кластере 1 есть только один индийский ресторан и ресторан.
Кластер 1 подходит, если вы хотите открыть кафе, пиццерию, бутербродную или фаст-фуд. Они соберут много людей из близлежащих районов. Ресторан будет уникальным в кластере, и у людей не будет другого выбора, чтобы удовлетворить свою тягу в данный день.
В кластере 2 индийских ресторанов в два раза больше, чем в других категориях.
Кластер 2 состоит из индийского ресторана, пиццерии и ресторана гуджарати. Таким образом, можно открыть ресторан любой из этих категорий, поскольку ни одна из них не является доминирующей в кластере. Существует также возможность открыть ресторан нового типа, например, кафе, бутербродную, ресторан какой-то особой кухни и т. д., и стать одним из первых, кто откроет такой ресторан.
Вывод
Ахмадабад — один из умных городов Индии, признанный одним из лучших городов для жизни в стране. В таком городе, где запрещен алкоголь и люди ищут новые места для тусовок, открытие ресторана удовлетворяет не только потребности бизнеса, но и потребности людей.
С таким анализом выбрать место для открытия ресторана становится намного проще. Успех ресторана зависит от того, насколько он эксклюзивен и насколько он дополняет уже существующие рестораны в данном кластере или районе.
Для всех людей, желающих открыть ресторан в Ахмадабаде, этот анализ помогает легко и быстро принимать важные решения.