Публикации по теме 'big-data'


Необходимые большие данные, навыки специалиста по данным: как установить JAR-файлы для кластера AWS EMR
Необходимые большие данные, навыки специалиста по данным: как установить JAR-файлы для кластера AWS EMR Демонстрация того, где скачать JAR-файлы и как их установить в кластерах AWS EMR для доступа из EMR Notebooks Мне еще предстоит увидеть простое и исчерпывающее руководство о том, как разместить файлы JAR на каждом рабочем узле кластера EMR, и тем не менее это критически важная общая потребность. В этой статье рассматриваются эти потребности. Ниже приводится кульминация моих..

Как машинное обучение поможет стальному гиганту предотвратить мошенничество в сфере энергетики
Металлургический и горнодобывающий гигант Северсталь может занимать четвертое место среди российских производителей стали, но это самая прибыльная компания в отрасли в мире. В прошлом году череповецкая компания сообщила о прибыли в размере 2,5 млрд долларов США до вычета процентов, налогов, износа и амортизации (EBITDA) и почти 8 млрд долларов выручки за 2017 год. проблема по всей России. Андрей Костенко — директор по исследованиям и развитию проекта «Северстали» по обеспечению..

API: история любви, не зависящая от языка
Расширение истории любви с помощью выбора дизайна Возможно, вы уже заметили, что мы в RStudio уделяем большое внимание истории любви R и Python. Это обусловлено нашими усилиями по объединению групп специалистов по обработке и анализу данных и преодолению языкового барьера. Наши усилия во многом характеризуются разработкой пакета {reticulate} и нашего профессионального набора продуктов RStudio Team. История любви R & Python основана на аксиоме, согласно которой специалистов по..

Работа с сильно несбалансированными классами в алгоритмах классификации
Работа с сильно несбалансированными классами в алгоритмах классификации 26 октября я имел удовольствие выступить от имени Bluekiri с речью в PyData Mallorca , международном сообществе пользователей и разработчиков инструментов анализа данных. Целью доклада было затронуть одну из самых горячих тем в алгоритмах классификации из-за ее общего присутствия: работа с сильно несбалансированными классами . Два самых тривиальных примера, которые читатель, возможно, слышал раньше, - это..

Уроки Beam Summit Europe 2019
Саммит Beam объединяет экспертов и сообщество, чтобы поделиться захватывающими способами использования, изменения и развития Apache Beam, а также мира обработки данных и потоковой обработки. В этом году саммит проходил с 19 по 20 июня в Берлине и был организован всего во второй раз. ML6 был среди спонсоров и посетил мероприятие вместе с более чем 150 другими разработчиками и участниками Beam. В этом посте я дам обзор самых интересных тем, которые обсуждались на саммите. Будьте рады..

Сколько призраков вам нужно?
Скруджу нужны были три отдельных духа, чтобы отвечать на вопросы о прошлом, настоящем и будущем. Современному бизнес-лидеру нужен только один. Рождественская история Чарльза Диккенса очень любима в нашем доме. У нас есть дюжина его версий на DVD, и мы до сих пор ходим на него в кинотеатры почти все годы. При повторном просмотре меня поразила природа трех призраков, фигурирующих в этой истории. В ночи перед Рождеством призрак Марли говорит Эбенизеру Скруджу, что его должны..

Байесовская статистика против частотной статистики
Доктор Стилианос Кампакис Примечание. Это отрывок из моей новой книги под названием "Неопределенность". Самое популярное определение вероятности и, возможно, самое интуитивное — это частотное определение. По мнению частотников, вероятность события определяется как предел частоты этого события при большом числе испытаний. Что это значит? Вернемся к примеру с подбрасыванием честной монеты. Вы сказали, что вероятность выпадения голов на одном рулоне составляет 50%. Однако откуда..