Публикации по теме 'big-data'


Простое решение проблем выбора функций
Мы обсуждаем новый подход к выбору функций из большого набора функций в неконтролируемой среде машинного обучения. В обучении с учителем, таком как линейная регрессия или кластеризация с учителем, можно проверить прогностическую способность набора функций (также называемых статистиками независимыми переменными или предикторами) с использованием таких показателей, как соответствие ответу (зависимая переменная). , например, с использованием коэффициента R-квадрат. Это делает процесс выбора..

Тестирование распределенных бэкэндов ИИ Python с помощью Wordbatch
Сравнение трех основных серверных планировщиков: Spark, Dask и Ray. К распределенному искусственному интеллекту За последние несколько лет Python стал общепринятым языком науки о данных и искусственного интеллекта, и все известные фреймворки глубокого обучения (Keras, Pytorch, MXNet) используют Python в качестве основного языка интерфейса. По сравнению с конкурирующими языками Python конкурирует или превосходит почти во всех аспектах DS&AI: новейшие алгоритмы машинного обучения и их..

Покорение зверя больших данных
Покорение зверя больших данных Укрощение больших наборов данных с помощью Spark Мы живем и будем оставаться в мире цифровой трансформации, это неоспоримо! Объем генерируемых данных растет беспрецедентными темпами. По оценкам, основанным на исследовательском отчете IDC, при широком использовании подключенных устройств, социальных сетей и платформ электронной коммерции к 2025 году в мире будет создано более 160…

AI - Game Changer или Money Waster
Как избежать "поедания мелками" в вашей программе искусственного интеллекта Крис Эррера Чтобы быть полностью ясным, исход названия полностью зависит от вас. Искусственный интеллект - это действительно следующий горизонт в области вычислений. Принимая ИИ, организация или человек просто делегируют принятие решений алгоритму. Благодаря недавним достижениям в области машинного обучения, не только в области алгоритмической разработки, но и благодаря фреймворкам, которые делают эту..

Результаты прогноза Калифорнии на 2016 г.
В прошлом году Vinsight опубликовала свой первый прогноз урожая винограда и миндаля на весь сезон по всему штату. Эти прогнозы включают в себя множество данных и информации, в том числе о конкретных сортах сельскохозяйственных культур. Это означало, что каждый месяц с апреля по сентябрь прогнозы обновлялись и публиковались на уровне штата, округа и области. Прогнозы составлялись и передавались непосредственно клиентам. Прогнозы по винограду штата Калифорния на 2016 год были..

Машинное обучение для наблюдения Земли с Франсуа Петижаном
Приглашенный научный сотрудник Фрэн Суа Петижан делится своим опытом работы в CDS Нью-Йоркского университета. 1. Как вы начали карьеру в области науки о данных? Я защитил докторскую диссертацию, когда работал во Французском космическом агентстве (CNES); Моя роль заключалась в подготовке методов анализа данных для поддержки предстоящей миссии Sentinel-2 . Программа Sentinel-2, в рамках которой в последний раз был успешно выведен спутник на орбиту в марте 2017 года, является..

Инвентаризация книг с большими данными
быстрое сканирование томов, связанных с данными, ИИ, алгоритмами и т. Д. Меня попросили порекомендовать хорошую книгу о больших данных, которая не является большими данными (я написал ее в соавторстве с Виктором Майер-Шенбергером, изображения ниже). Это сложный вопрос по нескольким причинам. Во-первых, хотя я обычно жестко критикую свою работу, это неплохая книга. Но это еще и сложный вопрос, потому что есть так много хороших книг, из которых можно выбирать. Возникает вопрос:..