ПРОЕКТ: БИТВА СОСЕДОВ ГДЕ ОТКРЫТЬ ИТАЛЬЯНСКИЙ РЕСТОРАН НА МАНХЭТТЕНЕ?
Серкан ОНАР, ноябрь 2020 г.

Введение

Этот проект является моим «Проектом Capstone» из серии курсов IBM Data Science, курс 9 из 9, задание, оцениваемое коллегами. Наслаждайтесь и не стесняйтесь оставлять свои отзывы. Спасибо.

Нью-Йорк со своей столичной собственностью — в основном пишется как Нью-Йорк — является одним из самых популярных городов в мире. Будучи мегаполисом, Нью-Йорк принимает людей из разных стран. Около 65,2 миллиона туристов ежегодно посещают Нью-Йорк и его великолепные памятники.

Более 1,3 миллиона итальянцев и американцев итало-американского происхождения живут в районе Большого Нью-Йорка, из них около 800 000 проживают в одном из пяти районов Нью-Йорка. В Нижнем Манхэттене в Нью-Йорк, когда-то известный своим многочисленным итальянским населением (_Википедия: итальянские американцы в Нью-Йорке, Маленькая Италия, Манхэттен_)

Итальянская кухня, такая как пицца, паста, феттучини, ризотто, лазанья с ароматным домашним вином и восхитительным кусочком тирамису, являются очень известными актерами в мире гастрономии. Тогда как насчет открытия нового итальянского ресторана высокой кухни в Нью-Йорке, особенно на Манхэттене, среди небоскребов или рядом с Центральным парком? Где инвестору выбрать лучшее место на Манхэттене? (деловая проблема)

Данные

Исходя из бизнес-задачи, нам нужны следующие данные;

1-Данные Нью-Йорка, включая районы, районы, географические координаты.

Источник данных: https://geo.nyu.edu/catalog/nyu_2451_34572

Описание: Получим таблицу районов Нью-Йорка (Borough-Neighborhood) и получим географические координаты.

2-полигональный файл границ Манхэттена.

Источник данных: https://raw.githubusercontent.com/codeforamerica/click_that_hood/master/public/data/manhattan.geojson (немного изменил)

Описание : Мы получим карту окрестностей Манхэттена, чтобы визуализировать потенциальные места.

3-Информация о местах проведения в каждом районе Нью-Йорка:

Источник данных: Foursquare Developer-API

Описание: С помощью этого API мы будем собирать всю информацию о местах проведения мероприятий в каждом районе.

Методология

  • Район, данные о районе должны быть собраны из файла набора данных NewYork. (Веб-скрап)
  • Библиотека Pandas и Numpy для обработки данных. (обработка данных)
  • Библиотека Geopy, которая будет использоваться для сбора географических координат, данные будут собираться, очищаться и обрабатываться в кадре данных. (Визуализация карты)
  • Foursquare будет использоваться для поиска всех заведений, а затем отфильтровано по итальянским ресторанам. Место проведения, координаты места, категории места, которые будут извлечены и добавлены в фрейм данных. (Работа с API)
  • Библиотека Scikit-learn для кластеризации данных о площадках. (Машинное обучение)
  • Библиотека Folium для визуализации окрестностей, мест проведения, кластеризации данных. (Визуализация карты)
  • Библиотека Matplotlib для визуализации статистического подхода к данным ресторанов. (Визуализация данных)

Основные шаги и результаты

Обсуждение

Основываясь на результатах моего анализа, я настоятельно рекомендую следующие районы для новых инвестиций: Гринвич-Виллидж, Вест-Виллидж, Сохо, Йорквилл.

Какой из районов предпочтительнее, зависит от других критериев, таких как арендная плата, транспортные возможности и т. д. В этом проекте арендная плата или другие инвестиционные затраты не учитываются.

Южные регионы были бы лучшим вариантом, поскольку в этих районах больше туристов. Рейтинг клиентов и другие функции Foursquare были бы полезны для поддержки выбора.

Хотя я изменил файл geojson, он все еще нуждается в доработке. Некоторые районы не видны пользователю или не соответствуют файлу JSON. (Например: Ленокс Хилл)

Вывод

В этом проекте я изучил инвестиционную возможность на Манхэттене, используя данные и методы науки о данных. Чтобы обеспечить лучшую видимость, я отразил данные для карты.

Имея гораздо больше данных из других внешних баз данных, источников данных или опросов клиентов, исследование может быть расширено другими критериями, указанными в разделе обсуждения. Весь процесс может быть объединен с методами принятия решений.

В конце концов, играть с данными и изучать различные методы очень увлекательно. Благодаря поставщикам данных и рецензентам этого проекта я получил более четкое представление о своем следующем проекте.

Быть в курсе !…