Наши первые уроки от создания стартапа в сфере глубоких технологий

Прошло 6 месяцев с момента запуска Scalia; интеллектуальная платформа, которая органично соединяет беспорядочные потоки данных о товарах между брендами и интернет-магазинами. Потоки данных о продуктах - серьезная проблема в электронной коммерции, полностью замедляющая работу всей отрасли. Мы узнали об этом из первых рук на собственном профессиональном опыте и на основе обширных отзывов от ключевых игроков отрасли.

Хотя общепризнано, что никто еще не смог должным образом решить эту проблему. Для нас это была прекрасная возможность. Подключив разрозненные системы и оптимизируя рабочие процессы, мы сэкономим много денег и времени для наших клиентов. Это значительная возможность, которую можно реализовать только с помощью продукта, имеющего масштабируемую основу. Во многих отношениях глубокие технологии казались подходящими. У нас была правильная комбинация навыков в нашей команде основателей для создания таких основ и, в конечном итоге, такого SaaS-решения. Так родилась Скалия.

Чтобы максимально увеличить наши шансы на создание правильного продукта, мы быстро остановились на нескольких ключевых функциях и выпустили ранний MVP для двух лидеров отрасли. Они сразу увидели огромные возможности и начали помогать нам с обратной связью. Некоторые из этих отзывов сэкономили нам много ресурсов. Ресурсы, которые мы теперь можем использовать для дальнейшего подтверждения нашей гипотезы о ценности и для скорейшего выполнения на этапе адаптации продукта к рынку. Поразмыслив над этим, вот наши основные выводы, полученные при создании глубокой платформы SaaS.

1. Дело в их потребностях, а не в технологиях.

Машинное обучение и глубокие технологии - модные словечки. Многие люди, от учредителей до инвесторов и прессы, любят говорить об этом. Однако нашим клиентам наплевать. Для них речь идет об удовлетворении своих потребностей, а не о лежащих в основе технологиях. Нам предстояло выяснить, за какие функции продукта Scalia они будут готовы платить.

В этом отношении машинное обучение ничуть не хуже любых других технологий в нашем ценностном предложении, если оно выполняет свою работу. Он быстро стал одним из ингредиентов. Как только вы это осознаете, происходит важный сдвиг в мировоззрении. Вы становитесь прагматиком и сосредотачиваетесь на конечном результате, построенном на прочном фундаменте.

2. Не изобретать велосипед

С появлением облака и снижением цен на инструменты программирования программное обеспечение становится товаром. То же самое и с алгоритмами глубоких технологий. В мире очень ограниченное количество мест, где разрабатываются новые алгоритмы глубоких технологий: государственные исследовательские институты, академические элитные программы или очень крупные корпорации, которые имеют сильную тенденцию публично публиковать свои технологии.

Большинство доступных облачных решений теперь предлагают вычисления с использованием машинного обучения непосредственно в своих продуктах, которые одинаково хороши, если не лучше, из того, что мы могли бы создать сами. Мы хотели действовать быстро, быстро перебирать варианты, чтобы найти подходящее решение, и использование этих предложений позволило нам сэкономить невероятное количество времени.

Когда мы начали создавать собственные алгоритмы, мы полагались на существующую структуру, такую ​​как Keras и Tensorflow, и использовали общие стандартные библиотеки Python.

3. Качество важнее количества

В течение первых нескольких месяцев, так как в нашей базе данных почти не было артикулов, когда мы подавали предложения, мы иногда чувствовали себя мошенниками. Но когда мы начали создавать наш набор данных, мы поняли, что вы можете добиться довольно хороших прогнозов с относительно небольшим набором данных при условии, что вы создадите правильный продукт на его основе. Опять же, это был гораздо больше вопрос наличия правильного сочетания продукта / алгоритма, чем количества данных, которые мы могли бы получить в свои руки.

Вы можете искать огромные данные. Во многих случаях вы даже можете очистить Интернет, чтобы попытаться собрать гигантские наборы данных. Но если это плохие данные, неважно, сколько у вас миллиардов точек данных. Мусор на входе, мусор на выходе. Следовательно, мы решили сосредоточиться на получении качественных данных и их правильном использовании с помощью точно настроенного продукта.

Не поймите меня неправильно, при прочих равных вы хотели бы иметь больше данных, чем меньше данных, но наличие правильных данных, настроенных на рутинную и узкую задачу, является наиболее эффективным способом для небольшого стартапа быстро генерировать ценность.

В Scalia мы не зависящие от источников данных, что означает, что мы будем агрегировать данные из всех возможных источников: данные клиентов, общедоступные данные, данные списания, данные по компаниям, данные партнеров и т. Д. Однако мы тратим время на очистку входных данных и прикладываем много усилий к конвейеру обработки данных, чтобы обеспечить его качество.

4. Если это в их интересах, пользователи будут защищать вас за вас

Итак, как мы намереваемся опередить конкурентов, если (A) мы используем готовые алгоритмы и (B) у нас пока нет большого количества проприетарных данных?

В очередной раз ответ заключался в том, чтобы усилить наши отношения с нашими первыми пользователями. Наш MVP должен быть качественным; мы сделали его еще и привлекательным. Вместо того, чтобы тратить впустую ресурсы на сборку максимально возможного набора данных, мы сосредоточили наши ресурсы на создании удивительного пользовательского опыта, который побудит первых клиентов использовать наш продукт, а также на постоянном обучении наших алгоритмов. Каждый посещаемый нами пользователь укрепляет наш основной актив. Наш набор данных постоянно пополняется дополнительными входящими данными, которые вводятся в алгоритмы для получения стабильно лучших результатов и, таким образом, генерируют еще более полезные данные. Нам удалось создать эффективный цикл обратной связи с данными.

Scalia - это SaaS-платформа, которая помогает модным и модным брендам делиться данными о своих товарах с розничными продавцами и другими бизнес-партнерами. Благодаря алгоритмам машинного обучения мы консолидируем, обогащаем, стандартизируем и синхронизируем данные о продуктах, чтобы любой мог получить к ним доступ в желаемом формате, предлагая гибкость, контроль и согласованность для всей экосистемы.