Публикации по теме 'big-data'


Эксперименты с Hive 2 LLAP
В последней версии Hortonworks Data Platform (HDP) 2.6.2 у нас появился новый механизм SQL для обработки данных через HDFS, то есть Hive 2 LLAP. Функциональность Live Long and Process (LLAP) была добавлена ​​в Hive 2.0. С течением времени в Hive были внесены существенные улучшения со стороны Tez и оптимизации затрат (CBO), а теперь с помощью LLAP он перешел на новый уровень. На следующей диаграмме показана его архитектура. В LLAP нам нужны демоны LLAP, работающие в кластере YARN...

Простая программа Java для добавления в файл в Hdfs
В этом блоге я представлю вам Java-программу для добавления в файл в HDFS. Я буду использовать Maven в качестве инструмента сборки. Теперь для начала- Во-первых, нам нужно добавить зависимости maven в pom.xml. Теперь нам нужно импортировать следующие классы: import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataOutputStream; import org.apache.hadoop.fs.FileSystem; import org.apache.hadoop.fs.Path; import java.io.*; Мы будем использовать класс..

Blue Ice Cloud объявляет о выпуске версии 2.3
Последнее обновление службы Интернета вещей и офлайн-платформы больших данных для действенной бизнес-аналитики Управляйте своим бизнесом лучше с аналитическими решениями IoT / Big Data от Blue Ice Cloud. Blue Ice Cloud, канадская программная платформа для промышленного Интернета и аналитики больших данных, интегрированная с возможностями искусственного интеллекта (ИИ) и машинного обучения (МО). Сегодня компания объявила о выпуске Blue Ice Cloud v2.3, обновленной версии своей платформы,..

Мой опыт работы с реальным машинным обучением в Couture AI
Середина июля, и моя летняя стажировка в Couture AI., Бангалор подошла к концу. Оглядываясь назад, я понимаю, что последние два месяца были очень продуктивными и находчивыми. До прихода в Couture я практически не имел представления о машинном обучении, больших данных или даже, например, о Hadoop. За эти два месяца я вырос как личность и погрузился в такие темы, как машинное обучение, искусственный интеллект и алгоритмы, и получил ценную профессиональную информацию о рабочей культуре и..

Инженер по машинному обучению и специалист по данным
Инженер по машинному обучению и специалист по данным Мы ищем одаренного специалиста по обработке и анализу данных с опытом работы в области разработки программного обеспечения. Мы предполагаем, что вы либо инженер-программист со статистикой, либо статистик, который действительно хорошо разбирается в программировании. Чтобы подать заявку на эту вакансию, посетите наш сайт по найму по адресу Workable: https://vester.workable.com/jobs/387522 Уникальная возможность Это..

10 самых желанных навыков в области науки о данных, которые вы должны развить, чтобы получить высокооплачиваемую работу в области науки о данных
10 самых желанных навыков в области обработки данных, которые вы должны развить, чтобы получить высокооплачиваемую работу в области обработки и анализа данных В последнее время специалисты по данным пользуются большим спросом. По данным Glassdoor , Data Science — работа номер один в США, что неизменно делает ее одной из самых высокооплачиваемых профессий. Однако деньги даются нелегко. Наука о данных может быть сложной профессией. Есть несколько очень специфических жестких и..

Не позволяйте данным разрушить ваш успех в машинном обучении
Дрейф данных, также известный как дрейф понятий, — это явление, возникающее, когда статистические свойства распределения данных изменяются с течением времени. Это может привести к тому, что модель машинного обучения, обученная на этих данных, станет менее точной при применении к новым данным. Проблема дрейфа данных особенно актуальна в области машинного обучения, где модели часто используются для прогнозирования или принятия решений на основе данных. Когда точность модели снижается..