Публикации по теме 'big-data'


Образовательный интеллектуальный анализ данных и образовательная аналитика
Есть песня Леонарда Коэна, в которой говорится, что «все знают» и «так оно и есть». То же самое касается и того факта, что количество данных, генерируемых онлайн-деятельностью, стремительно растет. Это верно, потому что все больше и больше нашей торговли, развлечений и общения происходит через Интернет, и, несмотря на опасения по поводу глобализации и точности информации, эту тенденцию невозможно обуздать. Как поток данных, это цунами данных касается всех нас, поэтому более чем..

Как установить Hadoop в операционной системе Linux
Hadoop - это основной компонент экосистемы аналитики больших данных с открытым исходным кодом. Он включает в себя систему хранения HDFS для хранения больших данных и MapReduce для обработки данных. Отрасль больших данных уже более десяти лет полагается на Hadoop для обработки крупномасштабных и огромных объемов больших данных с масштабируемостью и отказоустойчивостью с распределенным глубоким обучением на Apache Spark и CaffeonSpark. Hadoop имеет отказоустойчивую систему, которая..

Почему я не клянусь в верности Большим данным
От онлайн-знакомств до микротаргетированной политической рекламы в вашей ленте Facebook - мир, управляемый информацией и алгоритмами, стал новой нормой. Однако рост принятия решений на основе данных сопровождался опасной уловкой объективности - ложным предположением о том, что числа должны быть нейтральными . Следует отметить, что компьютерная наука и наука о данных предлагают множество полезных и даже новаторских идей по наиболее насущным социальным проблемам мира. Они позволяют..

Apache Spark - Словарь терминов - Часть 1
Многие люди хотят узнать больше об Apache Spark. Это одна из самых популярных технологий, используемых сегодня для множества различных приложений. Apache Spark был впервые создан как альтернатива Hadoop MapReduce и предлагал примерно в 100 раз большую производительность. Вы можете узнать больше об Apache Spark, щелкнув эту статью: Что такое Apache Spark . По этой ссылке вы узнаете, кто использует Spark, почему он используется, что это такое и как вы можете воспользоваться этой..

Почему у вас не так много данных, как вы думаете. И 3 способа исправить это
Машинному обучению требуется большой объем данных. Итак, первый вопрос, который мы задаем клиентам: достаточно ли у вас? Вы можете ответить «Да», но, вероятно, у вас не так много, как вы думаете. Как мы можем быть так уверены? И как получить больше и добиться наилучших результатов? Найдите интересующие вас ответы в следующей статье. Всегда легче понять концепцию на примере из реальной жизни, поэтому начнем с этого. Представьте, что вы устраиваете вечеринку. Это важное..

Как сделать вывод модели машинного обучения на KFServing из контейнерных приложений (веб, Spark), работающих в Google…
Допустим, у вас есть приложение для электронной коммерции и / или приложение для работы с большими данными (например, Apache Spark), работающее на платформе Kubernetes (система оркестровки контейнеров с открытым исходным кодом для автоматизации развертывания, масштабирования и управления контейнерными приложениями). Теперь у вас есть потребность в обслуживании предварительно обученной модели машинного обучения в существующей инфраструктуре Kubernetes с использованием ваших устоявшихся..

Машинное обучение увеличивает спрос на формальные теоретические модели целых пространств
В условиях развития Интернета, который сейчас является огромным источником ценной информации для фирм, но с необходимостью сбора, анализа и агрегирования данных для получения информации, имеющей значение для принятия управленческих решений, больших данных и машинное обучение стали модным словом в деловых кругах. Сбор, просеивание и агрегирование данных для получения ценной информации потребовало разработки новых алгоритмов , платформ и программного обеспечения , это ,..