Публикации по теме 'big-data'


Обучение «робота» обнаруживать ксенофобию в Интернете
Робот? Не совсем. Машинное обучение (ML) и искусственный интеллект (AI) - два модных слова, особенно когда речь идет об инновациях в области данных. Искусственный интеллект - это способность машин имитировать когнитивные процессы человека. Слово искусственный происходит от идеи, что машины неразумны сами по себе . За ними стоят люди, программирующие их для выполнения определенных задач. Тем не менее, в зависимости от сложности их программирования, некоторые машины более..

Что делает хороший вариант использования машинного обучения?
Что делает хороший вариант использования машинного обучения? Подсказка: дело не только в данных Машинное обучение (ML) - горячая тема. Хотя машинное обучение не ново, снижение стоимости вычислительных мощностей и огромных объемов данных, которые мы собираем как предприятия, так и частные лица, снижает начальные затраты на внедрение этой технологии. Однако у наших потенциальных партнеров по развитию всегда возникает один вопрос: «Что делает хороший вариант использования машинного..

Учебное пособие по Spark, часть 1 (базовое понимание)
Spark — это быстрый распределенный аналитический вычислительный движок для крупномасштабной обработки данных. Spark позволяет обмениваться данными между этапами обработки посредством обработки данных в памяти конвейера данных. Основные понятия Задание . Фрагмент кода, который считывает некоторые входные данные из HDFS или локально, выполняет некоторые вычисления с данными и записывает выходные данные. Этапы. Задания делятся на этапы. Этапы классифицируются как карта и этап..

Адаптивная выборка в мире IoT
Сократите энергопотребление и пропускную способность с помощью методов адаптивной выборки для приложений IoT. Интернет вещей (IoT) теперь представляет собой вездесущую сеть подключенных устройств, которые общаются и обмениваются данными через Интернет. Эти устройства могут быть чем угодно: от мониторинга промышленного оборудования, систем мониторинга погоды и качества воздуха и камер видеонаблюдения до интеллектуальных термостатов и холодильников, а также носимых фитнес-трекеров. По..

Когда следует использовать PySpark вместо Scikit-Learn ?
Исследование масштабируемости дерева решений в контексте больших данных: PySpark vs Scikit-Learn. PySpark известен тем, что использует парадигму MapReduce , что приводит к распределению классификации между разными машинами в кластере, тогда как Scikit-Learn делает это локально.

Существует альтернатива SQL. Попробуешь?
У крупнейших компаний это уже давно есть. Но их решения индивидуальны и могут использоваться только внутри компании. #wefinallydidit #dreamcometrue Arc — первая платформа, демократизирующая эту технологию. Вместо SQL вы просто создаете объекты источников данных, берете то, что хотите, и используете это. Все остальное мы сделаем за вас. Эта статья написана нашим спонсором nautilus2k.com, новым стартапом, пытающимся помочь другим стартапам создавать приложения, управляемые..

ТЕМНАЯ СТОРОНА БОЛЬШИХ ДАННЫХ — КАК МАТЕМАТИЧЕСКИЕ МОДЕЛИ УВЕЛИЧИВАЮТ НЕРАВЕНСТВО
Мы живем в век алгоритмов. Где интернет, там и алгоритмы. Приложения на наших телефонах — результат работы алгоритмов. Система GPS может привести нас из точки А в точку Б благодаря алгоритмам. Все больше и больше решений, влияющих на нашу повседневную жизнь, передаются автоматизации. Поступаем ли мы в колледж, ищем ли работу или берем кредит, математические модели все чаще участвуют в принятии решений. Они пронизывают школы, суды , рабочие места и даже процесс голосования . Нас..