Публикации по теме 'data-augmentation'


Revamper: интеллектуальное расширение данных для более быстрого обучения DNN
Автор Сью Хён Пак По мере усложнения задачи глубокого обучения (DL) модель DL должна иметь больше весовых коэффициентов для повышения точности. Благодаря обучению глубокой нейронной сети (DNN), веса модели постоянно корректируются с учетом заданного набора обучающих данных. Одна из проблем заключается в том, что современные модели DL имеют миллионы весов, в то время как количество обучающих выборок обычно намного меньше. Крайне важно увеличить набор обучающих данных , чтобы..

Увеличение данных с использованием Tensorflow
В основном для обучения любых моделей машинного обучения на основе изображений или моделей глубокого обучения требуется большее количество изображений, чтобы повысить точность классификации или mAp при обнаружении объектов. В сценариях реального мира сбор изображений некоторых классов является сложной задачей, потому что мы не можем найти эти изображения нигде в Интернете. Это может привести к переоснащению или недообучению. Если модель не может классифицировать обучающие изображения,..

Увеличение данных на ТПУ
КОМПЬЮТЕРНОЕ ЗРЕНИЕ Увеличение данных на ТПУ Обучение модели — это повторяющийся процесс, но он не должен быть медленным. С конвейером tf.data , TFRecords → TPU, работа, которая длилась часами на ЦП, выполняется в кратчайшие сроки. Вот почему Google создала TFRecords и TPU. Тем не менее проблемы остаются. Tensorflow и Keras имеют ограниченные возможности для увеличения данных. Большинство из нас обращаются к специализированным библиотекам, таким как Sci-kit Image, OpenCV или..

Увеличение текстовых данных с помощью NLP Cloud API
Использование API, таких как spaCy, WordNet, SyntaxNet и т. Д. Методы увеличения данных используются для увеличения объема данных путем добавления слегка измененных копий уже существующих данных или вновь созданных синтетических данных из существующих данных. Вы почти никогда не найдете достаточно органических данных для обучения моделей глубокого обучения. Также затратно нанимать людей для аннотаций. Одна очень хорошая альтернатива - генерировать синтетические данные путем анализа..