Питон вас не спасет!

Компьютерное зрение — это когда вы видите мир своими глазами, объясняете его компьютеру и заставляете его смотреть на мир так же, как и вы.

Компьютерное зрение – это увлекательная и разнообразная область исследований, которая находит применение во многих областях. Это наука о том, как заставить компьютеры понимать и интерпретировать визуальную информацию, такую ​​как изображения, видео и сцены. Компьютерное зрение является особенным, поскольку оно сочетает в себе аспекты различных дисциплин, таких как математика, физика, психология и инженерия.

Вот некоторые из подполей компьютерного зрения:

Обработка изображений обработка изображений и их улучшение, например фильтрация, сжатие, сегментация и восстановление.

Распознавание объектов идентификация и классификация объектов на изображениях или видео, таких как лица, машины, животные или текст.

Понимание сцены анализ и интерпретация сложных сцен, таких как внутренняя или внешняя среда, события или действия.

Компьютерная графика создание и рендеринг синтетических изображений или анимации, таких как 3D-модели, виртуальная или дополненная реальность.

Машинное обучение — использование алгоритмов и данных для изучения закономерностей и прогнозирования или принятия решений, например глубокое обучение, нейронные сети или обучение с подкреплением.

Компьютерное зрение — это сложная и захватывающая область, требующая творчества и инноваций. Он имеет много потенциальных преимуществ для общества, таких как повышение безопасности, здравоохранение, образование, развлечения и многое другое. Компьютерное зрение также является быстро развивающейся областью, которая предлагает новые возможности и задачи для исследователей и практиков.

Место, где компьютерное зрение точно чешет зуд (диаграмма ниже), показано в Michigan Online на одном из их уроков, смотрите здесь

Выход на такое поле был захватывающим. Это было похоже на размышление с разных точек зрения одновременно, как на несколько водных аттракционов одновременно.
Немного о себе У меня есть степень бакалавра компьютерных наук, поэтому я некоторые знания о кодировании и о том, как оно работает, хотя я никогда не практиковал программирование в студенческие годы, так как был слишком занят другими творческими начинаниями. После получения степени бакалавра я получил степень магистра в области науки о данных, чтобы узнать, что нового в этой области. и у меня было сильное желание быть уникальным, и в то время это был новый предмет, на который было зачислено всего несколько человек, что пробудило во мне интерес, и я выбрал его.

Я познакомился с Computer Vision в прошлом семестре, и часть меня считала, что это мой профессиональный путь. Итак, после некоторого времени в поле, вот некоторые вещи, которые я хотел бы знать.

Python может не спасти вас.

Это относится только к указанным обстоятельствам использования. Python был повальным увлечением, когда я только начинал, и, поскольку я не особо увлекался программированием, Python предлагал мне простые шаги для начала. Это было легко понять, поэтому я перестал изучать другие языки и сосредоточился исключительно на Python. Еще раз хочу сказать, что это ограничено несколькими сценариями использования.

Пришло время для развертывания после того, как я запачкал руки созданием моделей и обучением нейронных сетей с использованием различных наборов данных. Я очень ждал этого этапа. Мне почему-то нравятся развертывания; это как предлагать свой свет остальному миру для использования. Я ошибся в том, насколько просто я предполагал, что это будет по сравнению с другими этапами. Вам нужно будет изучить ряд реальных критериев, чтобы убедиться, что ваше решение не останавливается и продолжает функционировать должным образом. Вишенкой на торте является то, что развертывание компьютерного зрения происходит в основном на периферийных устройствах. Пограничные устройства — это крошечные компьютеры с некоторой памятью графического процессора. Благодаря своей компактности их можно разместить практически в любом месте, что делает их широко используемыми в различных отраслях промышленности. Поскольку эти гаджеты компактны, их процессоры и память будут такими же. Итак, если вы успешно обучились работе с графическим процессором RTX или Quadro, теперь вы должны оптимизировать свое решение для работы на периферийном устройстве.

Python хорошо работает на этом устройстве; тем не менее, C++ или C дадут дополнительные возможности оптимизации. Библиотеки Nvidia CUDA, а также другие ключевые библиотеки, такие как openCV и Tensorflow, разработаны на C. Использование C дает вам прямой доступ к памяти, позволяя использовать многопоточность и другие возможности оптимизации. Python, на мой взгляд, по-прежнему полезен для обучения/построения моделей из-за его интерпретативного характера, но когда дело доходит до развертывания, C или C++ предлагают больше.

Идея о домене бизнеса / отрасли поможет вам.

Это для вашей части «Я хочу спасти мир». Мы никогда не сможем отстать от того, сколько средств решения проблем нам нужно в этом мире? Если вы можете посмотреть на проблему своими глазами и придумать алгоритм компьютерного зрения для ее решения, вы герой. Вы можете легко продать решение или сделать его доступным для реального мира, что сильно изменит жизнь людей. Многие отрасли также застряли с методологиями, и им наверняка понадобится ваша помощь в области компьютерного зрения.

Например, если вы хотите интегрировать машинное обучение в сферу здравоохранения, вот как вы это сделаете!



Подсчет людей, изучение трафика, фильтры дополненной реальности, распознавание лиц — каждый алгоритм решает проблему реального мира, а компьютерное зрение является довольно сложной областью, многие проблемы реального мира еще предстоит решить, и большинство из них значительно выиграют от добавление компьютерного зрения. Если вы только что подумали об этой идее, я бы порекомендовал вам следовать ей.

Никто не знает всего.

Это поле, которое образует линию, пересекающую многие другие поля. В результате никто никогда не может полностью понять, как все работает. Каждый имеет базовое представление о том, как устроен мир, и может использовать это знание для решения насущной проблемы, в то время как кто-то в другой части мира делает то же самое, но с другой сложностью.

Какую бы проблему мы ни выбрали, всегда можно узнать что-то новое, что подводит меня к следующему пункту.

Это может показаться вечным обучением

На каждом этапе проекта есть чему поучиться. Вы можете думать и узнавать о множестве параметров, связанных с реальным миром, имитируя возможную блокировку вашего решения, а затем находя для него исправление, а затем изучая, как именно все работает в реальном мире, чтобы изменить свое решение, чтобы получить результат. лучший результат. Это обучение, обучение, обучение. Это Учиться, учиться, учиться.

Вам нужна докторская степень

Я не уверен в этом. Текущая ситуация не позволяет мне отвечать на это, но я обязательно обновлю ее здесь, или это может быть шансом для вас оставить комментарий и вдохновить других.
Я считаю, что навыки кодирования и глубокого обучения может помочь вам начать свою карьеру, но я видел много объявлений о вакансиях, требующих докторской степени, поэтому я включил этот пункт.

В конце

Если вам нравится думать о нескольких темах и комбинировать знания из других дисциплин, чтобы найти решение, эта область может быть для вас.

Это увлекательно. Это потрясающе. Будьте готовы узнать больше.

Если вы вдохновлены и хотите начать работу с Computer Vision, вот несколько инструментов, которые вы хотели бы сохранить.