Публикации по теме 'reproducibility'


Докеризация для ваших следующих проектов по науке о данных
Абсолютно базовый учебник по Docker для специалистов по данным Концепция окружающей среды  — один из наиболее важных факторов, которые следует учитывать в науке о данных, но многие часто упускают из виду. С помощью менеджеров пакетов, таких как pip или conda , можно установить кучу зависимостей на локальный компьютер. Но проекты Data Science часто предназначены для совместной работы, а это означает, что в них могут быть вовлечены и другие люди, такие как ваши коллеги, клиенты,..

Воспроизводимая подготовка данных
Ваше будущее «я» и члены вашей команды будут вам благодарны за это. Продолжайте читать, чтобы увидеть реальный пример воспроизводимого конвейера данных для подготовки спутниковых изображений для глубокого обучения нейронной сети. При работе над проектом машинного обучения подготовка данных часто является самой трудоемкой и подверженной ошибкам задачей. В спешке, чтобы получить результаты, заманчиво использовать ярлыки и вручную подготавливать данные. Однако затраты времени на..

Сталкивается ли Deep Learning с кризисом воспроизводимости?
За последние несколько лет в некоторых статьях отмечалось, что прогресс, достигнутый с появлением глубокого обучения в некоторых областях исследований, включая рекомендательные системы и поиск информации, может быть не таким значительным, как мы думали. Глубокое обучение в рекомендательных системах На конференции RecSys ’19 по этому поводу были представлены два доклада. Первый - сравнивает 4 нейронных подхода в рекомендациях на основе сеанса с более простыми и старыми базовыми..

Воспроизводимость и данные
TL; DR → Контроль версий для ваших данных не означает дерьмо, если вы не управляете версиями вплоть до того момента, когда вы их используете Я уже писал о кризисе воспроизводимости машинного обучения . Не вдаваясь в кровавые подробности (просто прочтите вместо этого пост ), поле представляет собой идеальный шторм, который возникает из-за объединения огромных - нет, массивных - наборов данных, заданий, выполнение которых требует бесконечного времени, конвейерных рабочих..

Омни-тестовая классификация изображений (и многое другое)
Омни-тестовая классификация изображений (и многое другое) Классификация изображений - популярная площадка для исследования компромиссов между эффективностью и качеством моделей машинного обучения. Например, современная модель FixResNeXt-101 достигает точности Top-1 86,4% на валидационном наборе ImageNet , но с 829M параметрами подходит только для кластерного использования . Другой пример: точность Top-1 семейства моделей MobileNets-v2 , подходящих для мобильных устройств,..

Подведение итогов с вызовом воспроизводимости Code ML — весна 2021 г.
Подведение итогов с вызовом воспроизводимости Code ML — весна 2021 г. Весенний выпуск ML Reproducibility Challenge официально завершен, и у нас есть несколько вдохновляющих проектов, предоставленных сообществом DagsHub, чтобы поделиться! Воспроизводимость Data Science — одна из основных причин создания DagsHub, и мы постоянно разрабатываем новые инструменты и интеграцию для поддержки полностью воспроизводимого рабочего процесса . Вот почему мы так взволнованы Papers with Code —..

Преодоление кризиса воспроизводимости машинного обучения
Почему код, тренированные веса и веб-интерфейс - три необходимых компонента воспроизводимого машинного обучения. Вы, наверное, знаете, что машинное обучение (ML) имеет проблему воспроизводимости . Сотни препринтов и статей публикуются каждую неделю в области машинного обучения, но слишком многие из них не могут быть воспроизведены или проверены [ 1 ]. В результате они представляют собой не более чем шумиху и ставят под угрозу доверие и устойчивость в этой области. Проблема..