У меня есть набор данных с отсутствующими именами и координатами географического местоположения одновременно. Я хочу заполнить пробелы, чтобы продолжить анализ данных в будущем. Набор данных собран из твиттера, поэтому это не созданные данные, но данные получены именно так, и мне нужно как-то заполнить пробелы и продолжить дальнейший анализ.
Вариант 1: я могу использовать любой из userLocation
и userTimezone
, чтобы найти coordinates
Вход:
userLocation, userTimezone, Coordinates,
India, Hawaii, {u'type': u'Point', u'coordinates': [73.8567, 18.5203]}
California, USA
, New Delhi,
Ft. Sam Houston,Mountain Time (US & Canada),{u'type': u'Point', u'coordinates': [86.99643, 23.68088]}
Kathmandu,Nepal, Kathmandu, {u'type': u'Point', u'coordinates': [85.3248024, 27.69765658]}
Ожидаемый результат
userLocation, userTimezone, Coordinates_one, Coordinates_two
India, Hawaii, 73.8567, 18.5203
California, USA, [fill this] [fill this]
[Fill this], New Delhi, [fill this] [fill this]
Ft. Sam Houston,Mountain Time (US & Canada), 86.99643, 23.68088
Kathmandu, Kathmandu, 85.3248024, 27.69765658
Можно ли написать скрипт на Python или pandas, чтобы заполнить отсутствующие имена и координаты местоположений одновременно с правильным форматированием вывода?
Я понимаю, что у Python или Pandas нет никакого волшебного пакета, но было бы полезно начать с чего-то.
Я задал этот вопрос в разделе GIS, но нет много помощи там. Это первый раз, когда я работаю с набором данных геолокации, и я понятия не имею, с чего начать. Если вопрос не подходит, пожалуйста, прокомментируйте, чтобы удалить его, а не голосовать против.