Публикации по теме 'data-engineering'


Ученый-прагматик
Data Science в реальном мире , B otXO Ученый-прагматик 5 Идеи коммерческого машинного обучения, о которых должны знать все специалисты по данным. Эта статья предназначена для специалистов по анализу данных, менеджеров групп по анализу данных и заинтересованных сторон. Я надеюсь, что эти идеи дадут вам общее представление о проблемах в области ИИ и заставят задуматься о том, как разрабатывать прагматичные решения для науки о данных. TL; DR (краткое изложение 5 идей): В..

Обеспечение непрерывного развертывания наших конвейеров толстокожих животных
Наш главный архитектор, Олли, рассказывает нам о пробеле, который мы обнаружили при улучшении интеграции Pachyderm в Adarga Data Science Workbench, и о коде с открытым исходным кодом, который мы создали для его устранения; вся часть нашей инфраструктуры, которая обеспечивает высокоскоростной анализ данных и создание нашего программного обеспечения искусственного интеллекта. Здесь, в Adarga, мы широко используем Pachyderm в рамках наших исследований и разработок. Наша команда..

Почему микросервисы не годятся для машинного обучения… и как Feature Store делает его лучше!
В этой статье я объясню, почему архитектуры, ориентированные на микросервисы, не годятся для машинного обучения. Затем я расскажу, как такие компании, как AirBnB и Uber, использовали для управления хранилище функций, такое как StreamSQL . Хранилища функций позволяют декларативно определять определения функций машинного обучения и использовать их при обучении и обслуживании. Это позволяет командам совместно использовать, повторно использовать и обнаруживать эти функции в разных группах и..

Семинар: Как ИИ может помочь вам в диагностике заболеваний?
HKU Technology Transfer Office сотрудничал с Microsoft, чтобы выступить с прекрасным докладом о применении ИИ в медицинских исследованиях. Перед тем, как поделиться доктором Хе, клинический доцент кафедры диагностической радиологии HKU, доктор Винс Вардханабхути, поделился своими исследованиями в области радиомики и МРТ рака простаты. Помимо того, что он показал, как он использовал платформу машинного обучения Azure, он очень хорошо рассказал о методах подготовки данных, таких..

SnowPark - опыт разработчика Scala в Snowflake Data Cloud
Масштабный запуск пользовательских функций кода Scala в облаке данных Snowflake Обзор В прошлом году Snowflake анонсировала множество функций, таких как поддержка неструктурированных данных, Snowtire, Snowpark, Snowsight и т. Д. В этом случае одна из ожидаемых функций SnowPark теперь доступна для предварительного просмотра. До недавнего времени у Snowflake не было встроенной интеграции с приложениями машинного обучения, а также поддержки наличия инфраструктуры качества данных на этапе..

Постоянная опасность машинного обучения
Постоянная опасность машинного обучения В нашем февральском посте о тенденциях в области машинного обучения и данных мы обсуждали, считает ли кто-то, что MLOps преодолел пропасть или нет, рост MLOps (т.е. DevOps для ML) сигнализирует о переходе отрасли от PoC (как создавать модели) к операциям (как для запуска моделей). Несмотря на то, что этот сдвиг - то, что нас очень волнует, из года в год мы постоянно сталкиваемся с проблемой, которая не дает нам покоя: качество данных. В..

Навыки управления данными
Мой друг задал мне интересный вопрос о том, какие навыки стоит изучать специалистам по управлению данными и как построить дорожную карту роста . На самом деле вопрос заставил меня задуматься, потому что у меня не было четкой картины в голове. Это всего лишь мои мысли на эту тему, и по большей части я просто предполагаю текущее состояние и будущее управления данными. Предпосылки В начале, как и в любой другой области, есть базовые вещи, которые должен знать любой..