На прошлой неделе я присутствовал на выступлении Эндрю Нга в Стэнфорде, где он обсуждал будущее искусственного интеллекта.

Он укрепил мои мысли о важности данных для успеха любой компании, работающей над конкретным приложением искусственного интеллекта. Он также подтвердил мою гипотезу о том, что крупные игроки, такие как Google и Baidu, открывают источники своих алгоритмов и приложений, чтобы собрать еще больше данных с тегами для своих обучающих наборов.

Несмотря на то, что появляются новые методы, которые могут позволить обучение на меньших наборах данных или на тех, которые в будущем будут полностью неструктурированы, сегодня эти методы все еще находятся в зачаточном состоянии. В результате, чтобы построить надежный бизнес, компания должна создать большой закрытый набор данных, который приведет к созданию наиболее подготовленных алгоритмов в своей области.

В то же время очень сложно получить доступ или собрать значительный объем данных, особенно если они чистые и помечены. Даже крупные компании все еще усердно работают над расширением своих наборов данных. Как заявил Нг, он часто выпускает продукты на Baidu с целью сбора большего количества данных, а не увеличения доходов.

Так как же новый стартап, использующий искусственный интеллект? создать выигрышный подход?

Во-первых, компании должны сосредоточиться на конкретном сценарии использования, когда они могут получить целевые данные и стать очень точными в одном конкретном приложении (например, прогнозирование запасов или распознавание изображений при открытии лекарств).

Во-вторых, поскольку данные являются дефицитным ресурсом, стартапам необходимо либо убедить устоявшуюся корпорацию получить доступ к их данным, предоставив ценную информацию, которую партнер не сможет извлечь, либо расширить свои данные, создав продукт, который побуждает пользователей предоставлять данные.

В качестве примера партнерского подхода Onera работает с розничными торговцами над оптимизацией их запасов, логистики и затрат через онлайн- и офлайн-каналы, обеспечивая значительную ценность и собирая их данные в процессе. Facebook - отличный пример продукта, который собирает данные, побуждая пользователей вводить информацию. Вы видели, как Facebook предлагает место для отметки вашего сообщения? Вы приняли или отклонили эту информацию? Если да, то вы помогли Facebook собрать и пометить их данные о геолокации.

В любом случае важно уделять повышенное внимание качеству продукта и услуги, которые вы предоставляете партнерам или конечным пользователям, потому что именно это обеспечивает большую ценность, привлекая пользователей, которые будут предоставлять данные.

Baidu - отличный тому пример. Нг упомянул, что использование голоса растет на 100% в год, так что Baidu собирается обучить свои алгоритмы анализа речи на 100 000 часов аудио, на прослушивание которых уйдет 10 лет! Они также тренируют свои алгоритмы распознавания лиц на 200 миллионах изображений, в то время как многие ведущие газеты используют 15 миллионов изображений.

Эти цифры ошеломляют и показывают, какой уровень масштаба используется на самых высоких уровнях в отрасли.

В то же время существует так много процессов, которые будут преобразованы с помощью искусственного интеллекта и машинного обучения. У новых компаний, которые сосредоточены на конкретном сценарии использования лучшего в своем классе продукта, есть потрясающие возможности, в которых они могут выиграть благодаря своей уникальной способности доступа к данным.

Чтобы узнать больше об искусственном интеллекте и его значении для продуктов и стартапов, подпишитесь на меня в Linkedin, Twitter на @mkhandel и на Medium at @medhaa.