Стажировка по машинному обучению 2019

Работа с Fynd's Applied Machine Group. Возьмите домой графический процессор Nvidia!

Fynd - первая в мире омниканальная компания в сфере электронной коммерции без инвентаря. Поскольку мы получаем каталог контента напрямую из магазинов бренда, мы должны проверять и часто классифицировать многие атрибуты продукта в соответствии с руководящими принципами Fynd в отношении контента. В Fynd мы используем машинное обучение для решения различных задач, таких как динамическое ценообразование, фид на основе профиля, рекомендации по продукту, автоматическая маркировка атрибутов продукта и т. Д. Наша работа хорошо резюмируется в этой презентации. Мы ищем стажера, который будет работать с основной командой ML для решения подобных проблем.

Описание данных

Общедоступный набор данных: содержит файл CSV с названием столбца класс и URL-адресами изображений для различных представлений. Загрузите изображения по URL для соответствующих классов. Нажмите здесь, чтобы загрузить набор данных.

Примечание: у нас есть 20% частный набор данных для нашей собственной оценки.

Проблема Заявление

1) Каждый продукт имеет несколько представлений (спереди, слева, справа, сзади), и только несколько представлений содержат информацию о продукте, с помощью которой вы можете заставить модель машинного обучения изучить его функции. Создайте модель машинного обучения и объясните свой подход к выбору конкретного представления из заданного набора различных представлений.

Пример: в случае обуви вид сбоку (слева / справа) содержит больше всего информации о типе каблука (высокий, средний или плоский). Точно так же разные виды имеют разную информацию для каждого варианта использования.
(Плоский тип : "кликните сюда")

2) Определите тип застежки обуви на основе предоставленных данных (CSV), которые имеют несбалансированное распределение данных по 6 классам. Вы можете собрать больше данных, используя веб-скрейпинг или другие источники. Постройте модель ML, которая эффективно определяет тип застежки обуви.
Вот ссылка на визуальный документ для понимания каждого класса данных.

Отправка

Создайте окончательный сценарий python, который принимает CSV в качестве входных данных со столбцом [image_name] и дает прогноз для каждого image_name в столбце с именем «label» (предпочтительно использовать синтаксический анализатор аргументов в сценарии)
Вес модели и файлы определений
Все коды, связанные с обучением и выводом (почтовый индекс или URL-адрес репо)

Сделайте PPT, объясняя свой подход к проблеме. Укажите ключевые моменты, такие как:

Предоставьте информацию о вашем обучении, точности проверки и матрице недоразумений в общедоступном наборе данных. Объясните другие показатели оценки, которые можно использовать
Вы почувствовали потребность в дополнительных данных? Если да, объясните, как вы собирали данные.
Объясните все использованные гиперпараметры и почему вы в итоге использовали только их
(Необязательно) Основные сведения о предоставленном общедоступном наборе данных. Любое особое наблюдение
Что еще можно сделать для повышения производительности?
Ссылка на все исследовательские работы / проблемы с Github / блоги и т. Д., Которые помогли вам в решении проблемы.
Отправьте свой код / репо на [email protected] вместе с последним резюме.
У нас нет ограничений по времени для проведения теста. Мы набираем по правилам FIFO.
Вы можете использовать Google Colab для обучения своих моделей.

Награда

Стажировка в Fynd со стипендией в составе основной команды машинного обучения, которая может быть продлена.
NVIDIA GPU

Чтобы получить разъяснения, напишите на [email protected] или оставьте комментарий ниже.