Публикации по теме 'convolutional-network'


Мой дневник машинного обучения: день 71
Я, наконец, получил основные идеи YOLO сегодня. Я хотел бы резюмировать YOLO и то, что я узнал вчера об обнаружении объектов. Локализация объекта Мы не просто хотим знать, содержит ли данное изображение кошку или нет, но также хотим знать, где кошка находится на изображении. Локализация объекта определяется как выяснение того, где объект получает изображение. Чтобы выполнить локализацию объекта, нам сначала нужно настроить вывод y, чтобы он также содержал информацию о..

Классификация пород собак с CNN
Следующий проект машинного обучения был завершен в рамках программы Data Scientist Nanodegree, которую я завершил в апреле 2020 года. Весь код можно найти на моем Github . 1. Введение Основная цель этого проекта - изображение собаки, алгоритм определит приблизительную породу собаки. Если он снабжен изображением человека, код идентифицирует похожую породу собаки. Во время проекта я создал CNN из Scatch и два CNN, используя технику Transfer Learning, используя разные архитектуры...

Понимание работы сверточного фильтра в CNN.
Сверточные фильтры, также называемые ядрами, предназначены для обнаружения определенных закономерностей или особенностей во входных данных. Например, при обработке изображений фильтры могут быть предназначены для обнаружения краев, углов или текстур. При глубоком обучении веса этих фильтров изучаются автоматически посредством обучения на больших наборах данных. Рисунок 1 иллюстрирует сверточную операцию. У нас есть одна входная матрица формы (1,5,5), которая может быть, например,..

Увеличение данных для изображений
Увеличение данных  — это один из методов, используемых для повышения производительности в системах компьютерного зрения . Большинство задач компьютерного зрения могли бы использовать больше данных. Используя увеличение данных, мы можем увеличить размер нашего набора данных. Увеличение данных может применяться к различным областям машинного обучения . В этом уроке мы поговорим о том, как использовать аугментацию данных в задачах Computer Vision. Мы можем увеличить размер набора данных..

Прогнозирование хитов на основе мультимодальных данных
Наука о хитовых песнях занимается возможностью предсказать, станет ли песня хитом, до ее распространения с использованием автоматизированных средств, таких как программное обеспечение для машинного обучения. Это побудило нас копнуть глубже, чтобы выяснить, как различные звуковые функции помогут предсказать, попадет ли песня в чарт Billboard Top 100, и построить двустороннюю модель удобства использования — как для музыкантов, сочиняющих музыку, так и для лейблов, транслирующих ее...

Классификация изображений с помощью MobileNet в браузере
Что такое классификация изображений? Классификация изображений - очень важная задача в глубоком обучении, используемом в обширных областях, и имеет очень высокое удобство использования и масштаб. В повседневной жизни мы сталкиваемся с проблемами классификации изображений в одну или несколько групп. Предположим, вы рассматриваете следующее изображение. Это футболка. Вы можете узнать ее мгновенно. Это потому, что наш мозг невероятно развит, и он видел такие изображения снова и снова. Но..

Расчет параметров свертки
Сегодня мы поговорим о вычислении параметров свертки. Прежде чем мы углубимся в это, давайте посмотрим, что такое сверточная нейронная сеть. Что такое сверточная нейронная сеть? В глубоком обучении сверточная нейронная сеть — это класс глубоких нейронных сетей, чаще всего применяемых для анализа визуальных образов. Он широко поддерживается благодаря своей архитектуре с общим весом и инвариантным характеристикам перевода. Теперь давайте вернемся к нашей теме, на изображениях ниже..