Публикации по теме 'analytics'


Data Engineering 101 - Исследование переменных с помощью Pandas и Plotly
Супер простые примеры Python для основ инженерии данных Начиная работать с данными? Моя любовь к данным зародилась в юном возрасте, когда я слушал разговоры родителей об акциях, но по-настоящему она стала популярной около 9 лет назад, когда я впервые открыл для себя SQL. Чтобы научиться лучше анализировать данные, несколько лет назад я присоединился к учебному лагерю по анализу данных, стал лучше программировать и изменил всю свою жизнь . Я почти два года работаю в группе Data..

3 обязательных расширения JupyterLab 2.0
JupyterLab только что стал полноценной IDE с такими функциями, как Code Assistance, Debugging и Git - добро пожаловать в будущее редактирования Notebook. Я рад подтвердить, что JupyterLab только что стал полноценной IDE с помощью последних расширений. Неделю назад я упомянул пару недостатков, которые заметил при редактировании записных книжек с помощью JupyterLab - несуществующая поддержка кода была одной из них. Вскоре один из ведущих разработчиков JupyterLab-LSP связался со мной и..

5 вопросов, на которые отвечает НАУКА ДАННЫХ
Есть пять вопросов, на которые отвечает наука о данных: На каждый из этих вопросов отвечает отдельное семейство методов машинного обучения, называемых алгоритмами. Полезно думать об алгоритме как о рецепте, а о ваших данных как об ингредиентах. Алгоритм говорит, как объединить и смешать данные, чтобы получить ответ. В. 1 Это А или Б? На этот вопрос отвечает семейство алгоритмов, называемое алгоритмом классификации. Это семейство алгоритмов называется двухклассовой..

Эволюция, заблуждения и реальность AutoML
Автор Рёхей Фудзимаки AutoML делает ИИ более доступным за счет автоматизации сложных ручных процессов обработки данных. Но есть предостережения к его использованию. Вот 5 основных мифов и фактов об AutoML. По мере того как компании во всем мире расширяют усилия в области ИИ и машинного обучения (МО), одной из ключевых проблем является поиск талантов в области ИИ. Большинство средних и крупных предприятий обнаруживают, что нанимать группы по анализу данных дорого, особенно в..

Идти в ногу с данными # 94
5 минут на 5 часов чтения Я провел большую часть недели в походах по Альпам со своей семьей. Это было совершенно фантастично — ограниченный доступ к электричеству вынудил меня перевести телефон в режим полета и посвятить все свое внимание детям и жене. А природа вокруг Санкт-Морица и перевала Бернина такая красивая. В любом случае, это также означает, что у меня не было много времени для чтения, и мне удалось прочитать только три статьи ниже в поезде, когда дети уже спали. Первый..

8 способов увеличить объем электронной торговли с помощью машинного обучения
В протонАвтоМЛ мы работали с десятками сотен компаний над улучшением их продаж. Типичное распространенное приложение для ускорения роста электронной коммерции - №1. Сегментация клиентов, персонализация услуг и таргетированная кампания: Когда покупатель заходит в обычный магазин, продавец обычно подходит к нему и спрашивает, что они ищут. Он или она также направляет дополнительные запросы, чтобы понять вкус и предпочтения клиента. Кроме того, продавец также наблюдает за поведением..

Apache Spark и Amazon SageMaker, жемчужины бесконечности аналитики
В предыдущем посте я показал вам как создать классификатор спама , запустив PySpark на экземпляре записной книжки Amazon SageMaker . Это прекрасная установка для экспериментов, но она недостаточно масштабируема и не автоматизирована для производства. А теперь давайте продолжим и воспользуемся подходящим кластером Amazon EMR , на котором запущен Spark и используем SageMaker Spark SDK для запуска учебных заданий. Мы также вкратце затронули вопрос« почему? ». Есть еще..