Публикации по теме 'data-augmentation'


Итак, вы думаете, что у вас недостаточно данных для машинного обучения
Спросите новичка, почему машинное обучение такое сложное, и вы, скорее всего, получите ответ в виде «математика очень сложна» или «Я не совсем понимаю, что такое все эти слои». делать' . Хотя это очевидно верно, и, безусловно, интерпретация моделей машинного обучения — запутанная тема, правда в том, что машинное обучение сложно, потому что чаще всего имеющиеся у нас данные не соответствуют сложности наших моделей. На практике это очень распространенная проблема, и, поскольку ваши модели..

TL;DR Papers — MixMatch
MixMatch — это форма увеличения данных и псевдомаркировки, предложенная Berthelot из Google et al. в своей статье MixMatch: Целостный подход к полуконтролируемому обучению ( arXiv:1905.02249 ). Все, что он делает, это, по сути, объединяет некоторые уже известные методы псевдомаркировки, но документ показывает, что акт объединения этих различных методов приводит к значительному повышению производительности на таких наборах данных, как CIFAR-10 и CIFAR-100. . Основная предпосылка..

Часть 1: нейронный шахматист
Игра в шахматы была частью моей жизни с младших классов, я играл в старшей школе, в шахматном клубе, в колледже и в городе, и все это время было весело. Шахматы действительно наполнили мое детство чудесами. Изучение дебютных стратегий, тактики миттельшпиля и грубых ошибок в конце игры, особенно таких движений, как цугцванги, в то время было настоящей головной болью, но это действительно помогло мне хорошо сыграть и подготовиться к турнирам. Знание этих концепций является..

Повышение производительности сверточной нейронной сети!
Повышение производительности сверточной нейронной сети! Сверточная нейронная сеть - основной алгоритм глубокого обучения - стала одним из самых влиятельных нововведений в области компьютерного зрения. Они работают намного лучше, чем традиционные алгоритмы компьютерного зрения. Эти нейронные сети оказались успешными во многих различных практических примерах и приложениях, например: · Классификация изображений, обнаружение объектов, сегментация, распознавание лиц; · Классификация..

Лай и мяуканье для классификации звука
После представления исследований кластеризации и визуализации набора данных изображения собаки/кошки стоит рассмотреть задачи для набора аудиоданных собаки/кошки. В этом посте рассматриваются некоторые проблемы дизайна для разработки и оценки подходов машинного обучения для классификации аудио в Audio Cats and Dogs in Kaggle . Поскольку это небольшой и несбалансированный набор аудиоданных (164 wav-файла о кошках, 113 wav-файлов о собаках, длительность от 0,9 до 17,9 секунд), в..

Большая проблема в небольшом количестве данных
Советы по работе с небольшими данными в науке о данных Большие проблемы с небольшими данными Небольшие данные есть повсюду, и они очень полезны на начальном этапе изучения различных методов науки о данных. В некоторых условиях, например в исследованиях, для ответа на очень целевые исследовательские вопросы доступны лишь небольшие данные. Фактически, небольшие данные могут даже присутствовать в очень больших наборах данных, когда мы заинтересованы в лучшем понимании небольшой..

Увеличение количества и разнообразия данных с помощью scikit-image в Python
Осмысление больших данных Увеличение количества и разнообразия данных с помощью scikit-image в Python Серия по библиотекам увеличения данных изображений в Python Методы глубокого обучения нашли большой успех в задачах компьютерного зрения, а именно в распознавании изображений, сегментации изображений, обнаружении объектов и т. Д. Такие методы глубокого обучения сильно зависят от больших данных, чтобы избежать переобучения. Итак, что вы делаете, когда у вас ограниченные данные?..