Публикации по теме 'big-data'


Представляем настоящие гибридные облачные данные и платформу искусственного интеллекта
По мере того, как предприятия используют данные в качестве стратегического актива, они стремятся максимально увеличить влияние ИИ как основы своей бизнес-стратегии. Для этого клиенты должны изучить машинное обучение и искусственный интеллект, освоиться с наукой о данных, встроенной в бизнес-процессы. Мы в IBM Data and AI стремимся дать вам возможность преобразовать свой бизнес, уникальным образом сочетая инновации в области ИИ с проверенной корпоративной платформой, извлекая..

Почему аналитики больших данных всегда выбирают Apache Spark для обработки
Почему Apache Spark Apache Spark — это наиболее широко используемый механизм обработки больших данных. Вы можете использовать этот инструмент для анализа в реальном времени, интерактивного анализа, потоковой обработки, пакетной обработки и вычисления графов. В отличие от Hadoop MapReduce, который предлагает только режим пакетной обработки, Apache Spark предлагает гораздо больше возможностей. В индустриальном мире видно, что…

Изменение экономики ухода за ранами и потребность в более качественных данных
Из-за перехода к более низким возмещениям, оплате за качество и перспективным платежам больница должна значительно увеличить количество пациентов, чтобы сохранить свою линию доходов неизменной. Это дополнительное давление ложится на раневой центр, которому не хватает инвестиций в свои возможности управления данными. Сегодня лечение ран сталкивается с проблемами целостности данных, связанными с ручным измерением ран, неправильной классификацией ран и данными о ранах и пациентах, находящихся..

В отрицательном биномиальном распределении нет ничего отрицательного.
Все мы знаем, что испытаниями к первому успеху является геометрическое распределение. Может потребоваться одно испытание, два испытания, три испытания и т. д., чтобы увидеть первый успех. Эти испытания предполагаются случайной величиной X = {1, 2, 3, …}; они имеют вероятность, т. е. P(X = 1), P(X = 2), P(X = 3) и так далее. Количество испытаний, которое требуется, чтобы увидеть второй успех, равно отрицательному биномиальному распределению. Количество испытаний, которое требуется,..

Как формула 1 может помочь вам понять недостаточную и чрезмерную посадку
Когда идентифицировать это и что вы можете с этим поделать Введение Иногда мне кажется, что я обманул систему. Бесчисленные экзамены проверяли мою способность определять и объяснять методы регрессионного моделирования, и если бы мне пришлось взглянуть на свои ответы сейчас, я был бы поражен своими знаниями…

Как запустить ML в облаке
Создание изображений с помощью нейронной сети на AWS Sagemaker с ускорением графического процессора вступление Если вам приходится иметь дело с машинным обучением в повседневной рабочей жизни (как мы делаем в Unit8), наступает момент, когда вам нужно выполнить некоторые интенсивные вычисления для обучения вашей модели. Если вам повезло и у вас есть настольный компьютер с мощным графическим процессором, проблема решена - вы можете с радостью запустить обучение локально. Если вам..

Инжиниринг качества наших конвейеров данных
Конвейер данных — это программное обеспечение, которое получает данные из нескольких источников, преобразует их и, наконец, делает доступными для внутренних или внешних продуктов. Конвейеры данных по своей природе очень сложны в построении и еще сложнее в тестировании. Есть много аспектов построения конвейера данных, которые часто игнорируются и позволяют ошибкам просачиваться через утечки. Язык конвейеров данных не так важен, как его архитектура и поток данных. Я видел, поверьте..