Привет, мир!

Сегодня мы рассмотрим, как использовать Python в качестве источника данных в Power BI.

Для тех из вас, кто не знаком с Power BI, это служба бизнес-аналитики от Microsoft, которая предоставляет интерактивные визуализации с возможностями самообслуживания для бизнес-аналитики. Лично я нахожу этот инструмент очень простым и невероятно быстрым в использовании. Если вам не нужно производить сложные расчеты, вы даже можете построить целый отчет, не написав ни одной строчки кода.

В этом уроке мы рассмотрим, как импортировать данные с помощью Python. Если вы хотите узнать больше о визуализации данных, ознакомьтесь с другими моими руководствами.

0. Требования и цель

Для этого урока вам понадобится:

  • Python 3.x (с пандами/numpy)
  • Power BI

Содержание этого руководства направлено на:

  • Промежуточные пользователи Python (вам нужно знать, как использовать pandas)
  • Промежуточные пользователи Power BI

1. Создание нового источника данных

Откройте Power BI и выберите Get Data -> Python:

Это код, который мы собираемся использовать для этого руководства, но вы, очевидно, можете использовать любой фрейм данных pandas:

Теперь вы должны увидеть окно, подобное этому:

Если вы видите окно с ошибкой, это может быть связано с одной из следующих проблем:

  • У вас нет библиотек, необходимых Power BI для правильной работы Python. Взгляните на эту ссылку и проверьте, все ли у вас установлено: https://docs.microsoft.com/en-us/power-bi/connect-data/desktop-python-scripts
  • В вашем коде ошибка. Если вам нужно протестировать код, я предлагаю вам просто запустить его в выбранной вами среде IDE и протестировать его там. Как только он заработает правильно, просто скопируйте его и вставьте обратно в редактор.

Если вы видите тот же вывод, что и на картинке выше, выберите таблицу, которая соответствует имени вашего фрейма данных, и нажмите «Трансформировать данные».

Теперь вы должны увидеть окно Power Query. Просто проверьте, все ли импортировано, как ожидалось. Если вам не нужны какие-либо преобразования, поздравляем, вы только что создали свой первый источник данных Python.

Если есть другие модификации, которые вам нужно сделать, у вас есть два способа:

  • Внесите изменения в Power Query. Это мой рекомендуемый способ сделать это, потому что я считаю, что это намного быстрее, чем в Python, поскольку я могу выполнять почти все необходимые преобразования непосредственно из интерфейса Power BI.
  • Внесите изменения в Python. Это рекомендуется только в том случае, если вы хорошо разбираетесь в Python, но ничего не знаете о Power Query и не заинтересованы в его изучении. В этом случае вам также необходимо проверить, поддерживаются ли пакеты, которые вы собираетесь использовать, в службе Power BI. Взгляните на эту ссылку: https://docs.microsoft.com/en-us/power-bi/connect-data/service-python-packages-support

Если вы хотите внести некоторые изменения в свои данные с помощью Python, вы можете перейти к преобразованию -> Запустить скрипт Python и внести изменения оттуда:

После того, как вы завершили свои изменения, вы можете нажать «Закрыть» и «Применить», и вы должны увидеть, как ваши данные загружены в модель.

Если вы хотите узнать больше о Python и Power BI, ознакомьтесь с другими моими руководствами (например, с этим):



Если вы хотите поддержать меня, рассмотрите возможность подписки на Medium, используя мою реферальную ссылку:



Другие URL-адреса:

Личный сайт: https://inzaniak.github.io
Социальные ссылки: https://inzaniak.github.io/links.html
Linkedin: https://www.linkedin .com/in/umberto-grando-a8527b150/