Публикации по теме 'big-data'
Простое решение проблем выбора функций
Мы обсуждаем новый подход к выбору функций из большого набора функций в неконтролируемой среде машинного обучения. В обучении с учителем, таком как линейная регрессия или кластеризация с учителем, можно проверить прогностическую способность набора функций (также называемых статистиками независимыми переменными или предикторами) с использованием таких показателей, как соответствие ответу (зависимая переменная). , например, с использованием коэффициента R-квадрат. Это делает процесс выбора..
Тестирование распределенных бэкэндов ИИ Python с помощью Wordbatch
Сравнение трех основных серверных планировщиков: Spark, Dask и Ray.
К распределенному искусственному интеллекту
За последние несколько лет Python стал общепринятым языком науки о данных и искусственного интеллекта, и все известные фреймворки глубокого обучения (Keras, Pytorch, MXNet) используют Python в качестве основного языка интерфейса. По сравнению с конкурирующими языками Python конкурирует или превосходит почти во всех аспектах DS&AI: новейшие алгоритмы машинного обучения и их..
Покорение зверя больших данных
Покорение зверя больших данных
Укрощение больших наборов данных с помощью Spark
Мы живем и будем оставаться в мире цифровой трансформации, это неоспоримо! Объем генерируемых данных растет беспрецедентными темпами. По оценкам, основанным на исследовательском отчете IDC, при широком использовании подключенных устройств, социальных сетей и платформ электронной коммерции к 2025 году в мире будет создано более 160…
AI - Game Changer или Money Waster
Как избежать "поедания мелками" в вашей программе искусственного интеллекта
Крис Эррера
Чтобы быть полностью ясным, исход названия полностью зависит от вас.
Искусственный интеллект - это действительно следующий горизонт в области вычислений. Принимая ИИ, организация или человек просто делегируют принятие решений алгоритму. Благодаря недавним достижениям в области машинного обучения, не только в области алгоритмической разработки, но и благодаря фреймворкам, которые делают эту..
Результаты прогноза Калифорнии на 2016 г.
В прошлом году Vinsight опубликовала свой первый прогноз урожая винограда и миндаля на весь сезон по всему штату. Эти прогнозы включают в себя множество данных и информации, в том числе о конкретных сортах сельскохозяйственных культур. Это означало, что каждый месяц с апреля по сентябрь прогнозы обновлялись и публиковались на уровне штата, округа и области. Прогнозы составлялись и передавались непосредственно клиентам. Прогнозы по винограду штата Калифорния на 2016 год были..
Машинное обучение для наблюдения Земли с Франсуа Петижаном
Приглашенный научный сотрудник Фрэн Суа Петижан делится своим опытом работы в CDS Нью-Йоркского университета.
1. Как вы начали карьеру в области науки о данных?
Я защитил докторскую диссертацию, когда работал во Французском космическом агентстве (CNES); Моя роль заключалась в подготовке методов анализа данных для поддержки предстоящей миссии Sentinel-2 . Программа Sentinel-2, в рамках которой в последний раз был успешно выведен спутник на орбиту в марте 2017 года, является..
Инвентаризация книг с большими данными
быстрое сканирование томов, связанных с данными, ИИ, алгоритмами и т. Д.
Меня попросили порекомендовать хорошую книгу о больших данных, которая не является большими данными (я написал ее в соавторстве с Виктором Майер-Шенбергером, изображения ниже).
Это сложный вопрос по нескольким причинам. Во-первых, хотя я обычно жестко критикую свою работу, это неплохая книга.
Но это еще и сложный вопрос, потому что есть так много хороших книг, из которых можно выбирать. Возникает вопрос:..