Публикации по теме 'data-engineering'
Ученый-прагматик
Data Science в реальном мире , B otXO
Ученый-прагматик
5 Идеи коммерческого машинного обучения, о которых должны знать все специалисты по данным.
Эта статья предназначена для специалистов по анализу данных, менеджеров групп по анализу данных и заинтересованных сторон. Я надеюсь, что эти идеи дадут вам общее представление о проблемах в области ИИ и заставят задуматься о том, как разрабатывать прагматичные решения для науки о данных.
TL; DR (краткое изложение 5 идей):
В..
Обеспечение непрерывного развертывания наших конвейеров толстокожих животных
Наш главный архитектор, Олли, рассказывает нам о пробеле, который мы обнаружили при улучшении интеграции Pachyderm в Adarga Data Science Workbench, и о коде с открытым исходным кодом, который мы создали для его устранения; вся часть нашей инфраструктуры, которая обеспечивает высокоскоростной анализ данных и создание нашего программного обеспечения искусственного интеллекта.
Здесь, в Adarga, мы широко используем Pachyderm в рамках наших исследований и разработок. Наша команда..
Почему микросервисы не годятся для машинного обучения… и как Feature Store делает его лучше!
В этой статье я объясню, почему архитектуры, ориентированные на микросервисы, не годятся для машинного обучения. Затем я расскажу, как такие компании, как AirBnB и Uber, использовали для управления хранилище функций, такое как StreamSQL .
Хранилища функций позволяют декларативно определять определения функций машинного обучения и использовать их при обучении и обслуживании. Это позволяет командам совместно использовать, повторно использовать и обнаруживать эти функции в разных группах и..
Семинар: Как ИИ может помочь вам в диагностике заболеваний?
HKU Technology Transfer Office сотрудничал с Microsoft, чтобы выступить с прекрасным докладом о применении ИИ в медицинских исследованиях.
Перед тем, как поделиться доктором Хе, клинический доцент кафедры диагностической радиологии HKU, доктор Винс Вардханабхути, поделился своими исследованиями в области радиомики и МРТ рака простаты.
Помимо того, что он показал, как он использовал платформу машинного обучения Azure, он очень хорошо рассказал о методах подготовки данных, таких..
SnowPark - опыт разработчика Scala в Snowflake Data Cloud
Масштабный запуск пользовательских функций кода Scala в облаке данных Snowflake
Обзор
В прошлом году Snowflake анонсировала множество функций, таких как поддержка неструктурированных данных, Snowtire, Snowpark, Snowsight и т. Д. В этом случае одна из ожидаемых функций SnowPark теперь доступна для предварительного просмотра. До недавнего времени у Snowflake не было встроенной интеграции с приложениями машинного обучения, а также поддержки наличия инфраструктуры качества данных на этапе..
Постоянная опасность машинного обучения
Постоянная опасность машинного обучения
В нашем февральском посте о тенденциях в области машинного обучения и данных мы обсуждали, считает ли кто-то, что MLOps преодолел пропасть или нет, рост MLOps (т.е. DevOps для ML) сигнализирует о переходе отрасли от PoC (как создавать модели) к операциям (как для запуска моделей). Несмотря на то, что этот сдвиг - то, что нас очень волнует, из года в год мы постоянно сталкиваемся с проблемой, которая не дает нам покоя: качество данных.
В..
Навыки управления данными
Мой друг задал мне интересный вопрос о том, какие навыки стоит изучать специалистам по управлению данными и как построить дорожную карту роста .
На самом деле вопрос заставил меня задуматься, потому что у меня не было четкой картины в голове. Это всего лишь мои мысли на эту тему, и по большей части я просто предполагаю текущее состояние и будущее управления данными.
Предпосылки
В начале, как и в любой другой области, есть базовые вещи, которые должен знать любой..