Работа с Fynd's Applied Machine Group. Возьмите домой графический процессор Nvidia!

Fynd - первая в мире омниканальная компания в сфере электронной коммерции без инвентаря. Поскольку мы получаем каталог контента напрямую из магазинов бренда, мы должны проверять и часто классифицировать многие атрибуты продукта в соответствии с руководящими принципами Fynd в отношении контента. В Fynd мы используем машинное обучение для решения различных задач, таких как динамическое ценообразование, фид на основе профиля, рекомендации по продукту, автоматическая маркировка атрибутов продукта и т. Д. Наша работа хорошо резюмируется в этой презентации. Мы ищем стажера, который будет работать с основной командой ML для решения подобных проблем.

Описание данных

Общедоступный набор данных: содержит файл CSV с названием столбца класс и URL-адресами изображений для различных представлений. Загрузите изображения по URL для соответствующих классов. Нажмите здесь, чтобы загрузить набор данных.

Примечание: у нас есть 20% частный набор данных для нашей собственной оценки.

Проблема Заявление

1) Каждый продукт имеет несколько представлений (спереди, слева, справа, сзади), и только несколько представлений содержат информацию о продукте, с помощью которой вы можете заставить модель машинного обучения изучить его функции. Создайте модель машинного обучения и объясните свой подход к выбору конкретного представления из заданного набора различных представлений.

Пример: в случае обуви вид сбоку (слева / справа) содержит больше всего информации о типе каблука (высокий, средний или плоский). Точно так же разные виды имеют разную информацию для каждого варианта использования.
(Плоский тип : "кликните сюда")

2) Определите тип застежки обуви на основе предоставленных данных (CSV), которые имеют несбалансированное распределение данных по 6 классам. Вы можете собрать больше данных, используя веб-скрейпинг или другие источники. Постройте модель ML, которая эффективно определяет тип застежки обуви.
Вот ссылка на визуальный документ для понимания каждого класса данных.

Отправка

  • Создайте окончательный сценарий python, который принимает CSV в качестве входных данных со столбцом [image_name] и дает прогноз для каждого image_name в столбце с именем «label» (предпочтительно использовать синтаксический анализатор аргументов в сценарии)
  • Вес модели и файлы определений
  • Все коды, связанные с обучением и выводом (почтовый индекс или URL-адрес репо)

Сделайте PPT, объясняя свой подход к проблеме. Укажите ключевые моменты, такие как:

  • Предоставьте информацию о вашем обучении, точности проверки и матрице недоразумений в общедоступном наборе данных. Объясните другие показатели оценки, которые можно использовать
  • Вы почувствовали потребность в дополнительных данных? Если да, объясните, как вы собирали данные.
  • Объясните все использованные гиперпараметры и почему вы в итоге использовали только их
  • (Необязательно) Основные сведения о предоставленном общедоступном наборе данных. Любое особое наблюдение
  • Что еще можно сделать для повышения производительности?
  • Ссылка на все исследовательские работы / проблемы с Github / блоги и т. Д., Которые помогли вам в решении проблемы.
  • Отправьте свой код / ​​репо на [email protected] вместе с последним резюме.
  • У нас нет ограничений по времени для проведения теста. Мы набираем по правилам FIFO.
  • Вы можете использовать Google Colab для обучения своих моделей.

Награда

  • Стажировка в Fynd со стипендией в составе основной команды машинного обучения, которая может быть продлена.
  • NVIDIA GPU

Чтобы получить разъяснения, напишите на [email protected] или оставьте комментарий ниже.