Работа с Fynd's Applied Machine Group. Возьмите домой графический процессор Nvidia!
Fynd - первая в мире омниканальная компания в сфере электронной коммерции без инвентаря. Поскольку мы получаем каталог контента напрямую из магазинов бренда, мы должны проверять и часто классифицировать многие атрибуты продукта в соответствии с руководящими принципами Fynd в отношении контента. В Fynd мы используем машинное обучение для решения различных задач, таких как динамическое ценообразование, фид на основе профиля, рекомендации по продукту, автоматическая маркировка атрибутов продукта и т. Д. Наша работа хорошо резюмируется в этой презентации. Мы ищем стажера, который будет работать с основной командой ML для решения подобных проблем.
Описание данных
Общедоступный набор данных: содержит файл CSV с названием столбца класс и URL-адресами изображений для различных представлений. Загрузите изображения по URL для соответствующих классов. Нажмите здесь, чтобы загрузить набор данных.
Примечание: у нас есть 20% частный набор данных для нашей собственной оценки.
Проблема Заявление
1) Каждый продукт имеет несколько представлений (спереди, слева, справа, сзади), и только несколько представлений содержат информацию о продукте, с помощью которой вы можете заставить модель машинного обучения изучить его функции. Создайте модель машинного обучения и объясните свой подход к выбору конкретного представления из заданного набора различных представлений.
Пример: в случае обуви вид сбоку (слева / справа) содержит больше всего информации о типе каблука (высокий, средний или плоский). Точно так же разные виды имеют разную информацию для каждого варианта использования.
(Плоский тип : "кликните сюда")
2) Определите тип застежки обуви на основе предоставленных данных (CSV), которые имеют несбалансированное распределение данных по 6 классам. Вы можете собрать больше данных, используя веб-скрейпинг или другие источники. Постройте модель ML, которая эффективно определяет тип застежки обуви.
Вот ссылка на визуальный документ для понимания каждого класса данных.
Отправка
- Создайте окончательный сценарий python, который принимает CSV в качестве входных данных со столбцом [image_name] и дает прогноз для каждого image_name в столбце с именем «label» (предпочтительно использовать синтаксический анализатор аргументов в сценарии)
- Вес модели и файлы определений
- Все коды, связанные с обучением и выводом (почтовый индекс или URL-адрес репо)
Сделайте PPT, объясняя свой подход к проблеме. Укажите ключевые моменты, такие как:
- Предоставьте информацию о вашем обучении, точности проверки и матрице недоразумений в общедоступном наборе данных. Объясните другие показатели оценки, которые можно использовать
- Вы почувствовали потребность в дополнительных данных? Если да, объясните, как вы собирали данные.
- Объясните все использованные гиперпараметры и почему вы в итоге использовали только их
- (Необязательно) Основные сведения о предоставленном общедоступном наборе данных. Любое особое наблюдение
- Что еще можно сделать для повышения производительности?
- Ссылка на все исследовательские работы / проблемы с Github / блоги и т. Д., Которые помогли вам в решении проблемы.
- Отправьте свой код / репо на [email protected] вместе с последним резюме.
- У нас нет ограничений по времени для проведения теста. Мы набираем по правилам FIFO.
- Вы можете использовать Google Colab для обучения своих моделей.
Награда
- Стажировка в Fynd со стипендией в составе основной команды машинного обучения, которая может быть продлена.
- NVIDIA GPU
Чтобы получить разъяснения, напишите на [email protected] или оставьте комментарий ниже.