Новости искусственного интеллекта и машинного обучения

С 11 августа по 3 октября 2016 г.

Добро пожаловать в выпуск №15 моего информационного бюллетеня, посвященного новостям в области искусственного интеллекта. Если что-то вас заинтересовало или вы хотите поделиться заметкой, которую я пропустил, просто нажмите "Ответить".

Вы создаете стартап, основанный на искусственном интеллекте? Предлагаю вам пролистать эти слайды. Вы хотите погрузиться в актуальные исследования ИИ? Вот твое спасение.

Я активно ищу предпринимателей, создающих компании, которые используют ИИ для решения интересных и важных задач в любой отрасли. Свяжитесь с нами 👍

Предпочитаете получать это как информационный бюллетень по электронной почте? Зарегистрируйтесь здесь!

Новости, тенденции и мнения в сфере технологий

💪 От больших мальчиков

Китайский гигант поиска, Baidu, объявил об инвестиционной инициативе на 200 миллионов долларов, ориентированной на ИИ и провел предварительный выпуск своей новой платформы глубокого обучения с открытым исходным кодом под названием PaddlePaddle. У компании есть способы конкурировать, учитывая, что разработчики по-прежнему с большей вероятностью будут использовать TensorFlow, который лидирует вместе с Caffe, Keras и Theano. Говоря о растущем количестве конфигураций аппаратного и программного обеспечения, доступных сегодня, этот исследовательский документ предоставляет полезные тесты.

Backchannel опубликовал редкую статью о том, как Apple использует машинное обучение. В нем говорится, что на iPhone работает программный пакет объемом 200 МБ, включающий данные об использовании приложений, взаимодействия с контактами, обработку нейронной сети, средство моделирования речи и систему моделирования событий естественного языка. Некоторое время я придерживался мнения, что сегодняшние методы и инфраструктура искусственного интеллекта вновь откроют класс исторически трудноразрешимых проблем, а также позволят нам переосмыслить, как должны разрабатываться продукты и функции. Apple, похоже, думает то же самое: Машинное обучение позволяет нам сказать« да некоторым вещам, на которые в прошлые годы мы бы сказали нет . Он становится неотъемлемой частью процесса принятия решения о продуктах, которые мы собираемся делать дальше ».

Salesforce объявил о своей внутренней зонтичной инициативе ИИ, скромно названной Эйнштейн, которая в дальнейшем будет обеспечивать работу многих облачных сервисов компании, а также открывать инструменты ИИ для конечных пользователей. В команду из 175 специалистов по данным входят специалисты из приобретенных стартапов MetaMind, PredictionIO и RelateIQ. Флагманское мероприятие компании Dreamforce на следующей неделе соберет 170 тысяч человек в Сан-Франциско.

Шесть самых влиятельных технологических компаний учредили Партнерство по ИИ как некоммерческую организацию, цель которой - углубить понимание ИИ населением и сформулировать передовой опыт решения проблем и возможностей в этой области. Важным катализатором в этом направлении, несомненно, станет продолжение разработки технологий с открытым исходным кодом, о которых основатель Селдона формулирует в этой статье.

🌎 О важности и влиянии ИИ на мир

Стэнфордское 100-летнее исследование ИИ опубликовало свой первый отчет. Он не находит причин для беспокойства о том, что ИИ представляет собой неминуемую угрозу человечеству. Никаких машин с самоподдерживающимися долгосрочными целями и намерениями не было разработано, и вряд ли они будут разработаны в ближайшем будущем . С точки зрения государственной политики он рекомендует:

Определите путь к накоплению технических знаний в области ИИ на всех уровнях государственного управления.
Устранение предполагаемых и фактических препятствий для исследования справедливости, безопасности, конфиденциальности и социальных последствий систем искусственного интеллекта.
Увеличить государственное и частное финансирование междисциплинарных исследований воздействия ИИ на общество.

Постдок из Принстона, Аарон Борнштейн, пишет увлекательную статью об интерпретируемости систем ИИ. Учитывая, что модели глубокого обучения создают внутренние представления входных данных с использованием функций, которые не были созданы вручную, их внутреннюю работу сложно (но не совсем невозможно) понять. Без интерпретируемости прецеденты с высокими ставками (например, здравоохранение, правительство, финансы) просто не примут моделей, которые в противном случае обеспечивали бы современную производительность. По той же теме эта статья проходит через несколько инициатив, направленных на проверку, в том числе новый проект DARPA по объяснимому ИИ.

Крис Диксон из a16z излагает 11 причин быть воодушевленными технологиями будущего с короткими комментариями по каждой. Пять из них либо напрямую связаны с ИИ и машинным обучением, либо будут задействованы ими.

👍 Удобный ИИ

Калифорнийский университет в Беркли объявил о создании нового Центра ИИ, совместимого с людьми, чтобы изучить, как ИИ, используемый для решения критически важных задач, действует в соответствии с общечеловеческими ценностями. Одним из вспомогательных методов является обучение с обратным подкреплением, при котором агент (например, робот) может изучить задачу, наблюдая за действиями человека, вместо того, чтобы учиться оптимизировать задачу самостоятельно.

Дизайнер Инес Монтани объясняет, как фронтенд-разработка может улучшить ИИ. Музыка для моих ушей! Я считаю, что, хотя ИИ можно использовать для решения удивительно сложных проблем, объединение службы с API, чтобы другие могли придумать наиболее эффективный вариант использования, - это не путь к созданию ценной компании. Вместо этого следует создавать технологии с ориентированным на пользователя дизайном в качестве главного приоритета. Инес рассказывает, как дизайн может улучшить сбор аннотированных данных, сообщить о возможностях технологии ключевым заинтересованным сторонам и изучить поведение и ошибки системы.

💻 AI работает в масштабе

Google опубликовал высокоуровневое описание своей системы рекомендаций на основе глубокого обучения для YouTube с использованием TensorFlow. Система использует две сети: одна для генерации потенциальных кандидатов из корпуса видео, а вторая для ранжирования этих кандидатов с использованием функций видео, истории пользователей и контекста. В отличие от многих моделей глубокого обучения, модели ранжирования используют сотни инженерных функций, потому что необработанные данные не подходят для прямого ввода. Две недели спустя компания открыла исходный код набора данных из 8 миллионов URL-адресов видео YouTube вместе с ярлыками из набора из 4800 классов.

Spotify проводит нас через эволюцию своих команд машинного обучения, которые руководствуются рекомендациями, лежащими в основе их продуктов Discovery Weekly и Radio.

Bloomberg опубликовал статью о том, как 12 хедж-фондов, использующих количественные стратегии на основе машинного обучения, в этом году превысили показатели всех хедж-фондов. Аналогичным образом, распределенный хедж-фонд Numerai объясняет свой тезис об объединении машинного интеллекта тысяч специалистов по данным со всего мира для достижения прорыва в точности прогнозов фондового рынка.

Спустя десять лет после первого выпуска Google Translate команда Google Brain объявляет о новой современной системе нейронного машинного перевода (здесь бумага). Система берет весь текст для перевода в качестве входных данных для повторяющейся нейронной сети вместо того, чтобы разбивать входное предложение на слова и фразы. Сеть обращает внимание на взвешенное распределение по закодированному входному вектору (т. Е. Китайскому слову), наиболее релевантному для генерации выходного слова (т. Е. Английского слова). Следует отметить, что служба Google Translate с китайского на английский полностью основана на машинном переводе и выполняет 18 миллионов переводов в день!

🔬 ИИ в здравоохранении и биологических науках

Google DeepMind объявила о исследовательском партнерстве с отделением лучевой терапии Университетского колледжа Лондонских больниц NHS Foundation Trust. Проект направлен на улучшение процесса отделения здоровых тканей от рака в области головы и шеи, чтобы лучевая терапия причиняла меньший побочный ущерб нераковым областям.

Платформа Next Platform с лета отслеживает исследовательские публикации в области глубокого обучения и уделяет особое внимание медицинским приложениям для пренатального УЗИ, маммографии груди, рака мозга и меланомы.

Чуть более левый, Илон Маск объявил, что добился прогресса в дизайне нейронного шнурка. Это могло бы эффективно служить интерфейсом между нашим мозгом и машиной, чтобы избежать благоприятной ситуации, когда люди становятся домашними кошками в эпоху сверхразумного ИИ.

🚗 Департамент беспилотных автомобилей

На прошлой неделе я посетил конференцию NVIDIA по технологиям графических процессоров (GTC) в Амстердаме и был приятно удивлен масштабами инвестиций компании в автономное управление. Джен-Хсун Хуанг, основавший компанию в 1993 году и до сих пор возглавляющий ее в качестве генерального директора, потратил большую часть своего 1,5-часового вступительного выступления на интегрированную аппаратную и программную платформу, которую NVIDIA запускает для обеспечения автономности. Эти продукты и услуги являются подключаемыми, так что их более 80 партнеров могут выбирать, что они хотят покупать, а что строить. NVIDIA явно готова предоставить лопаты для золотой лихорадки беспилотников, так же как TensorFlow от Google позволяет компании продавать больше времени на вычислительную инфраструктуру. Анонсы включены:

DRIVE PX 2, автомобильная вычислительная платформа с графическим процессором, доступная в трех конфигурациях для обеспечения автоматического вождения по шоссе (1x GPU @ 10 Вт), двухточечного транспорта (два мобильных процессора + 2 GPU) или полной автономии (несколько PX 2 системы).
DRIVEWORKS, комплект для разработки программного обеспечения, который обеспечивает среду выполнения для обнаружения, локализации, планирования среды и приборной панели визуализации для пассажира.

DGX-1, суперкомпьютер с глубоким обучением для обучения нескольких сетей, работающих на DRIVE PX 2.
Беспилотный автомобиль BB8 (посмотрите это видео), который научился водить как в дождливую, так и в темную погоду, преодолевать крутые повороты, перемещаться по конусам и строительным площадкам, а также ездить без каких-либо полос движения.
Партнерство по картированию в формате HD с TomTom на платформе DRIVE PX 2.

Stratechery пишет о Google, Uber и развитии транспорта как услуги. Он утверждает, что Uber, который развертывает свой автопарк в Питтсбурге, занимает поул-позицию в гонке, которую Трэвис Каланик называет экзистенциальной.

Fortune внесла свой вклад в путешествие основателей Justin.tv от создания бизнеса потоковой передачи в реальном времени до компании по производству технологий для самоуправляемых автомобилей, которые были проданы за более чем 1 миллиард долларов.

Федеральное правительство США выпустило свой первый свод правил по автономным транспортным средствам, включая постановление о безопасном тестировании и развертывании АВ (включая обмен данными), а также модель государственной политики США по регулированию АВ.

Mapillary, шведская компания, управляющая краудсорсинговым сервисом изображений улиц, присоединилась к Deep Drive Калифорнийского университета в Беркли, где она сосредоточится на семантической сегментации реальных изображений и структуры движения, чтобы помочь стимулировать исследования в области глубокого обучения и компьютерного зрения для автономии.

Исследования, разработки и ресурсы

Большинство моделей машинного обучения, о которых мы говорим в реальном мире, являются дискриминационными, поскольку они моделируют зависимость ненаблюдаемой переменной y от наблюдаемой переменной x для прогнозирования y от x. Таким образом, они используются для контролируемой классификации или задач регрессии. Генеративные модели, с другой стороны, представляют собой полностью вероятностные модели всех переменных, из которых могут быть получены случайно сгенерированные наблюдаемые точки данных. Сейчас они в пике популярности, потому что, как было показано, они синтезируют искусственный контент (текст, изображения, видео, звук), который выглядит и звучит реальным из небольших наборов данных без ярлыков. Вот ряд исследований и ресурсов, которые помогут нам понять, как они работают, почему они интересны, и примеры использования:

Студент UCLA показывает, как работают генеративные состязательные сети.
Команда Twitter Cortex Vx (Magic Pony Technology) провела загруженное лето публикацией трех статей: сверхразрешение изображений и видео на одном графическом процессоре K2 с использованием архитектуры сверточной нейронной сети (бумага), сверхвысокое разрешение 4-кратного субдискретизации. имидж с помощью генеративной враждебной сети (бумага) и расширенного обсуждения своей работы (бумага).
Google DeepMind публикует WaveNet, генеративную модель для сырого звука (статья здесь). В этой работе используется архитектура генеративной сверточной нейронной сети, которая работает непосредственно с необработанной формой аудиосигнала, чтобы моделировать условное распределение вероятностей будущих прогнозов на основе непосредственно предшествующей выборки. Сеть делает выборку звука 16000 раз в секунду, и каждая предсказанная выборка возвращается через сеть для предсказания следующей выборки. Результаты по задачам преобразования текста в речь впечатляют!
Шакир Мохамед, научный сотрудник Google DeepMind, представляет свою работу по созданию машин, которые воображают и рассуждают на Летней школе глубокого обучения этим летом. Он также является соавтором статьи Неконтролируемое изучение трехмерной структуры из изображений, в которой генеративные модели используются для вывода трехмерных представлений на основе двухмерного изображения.
Исследователи из Эдинбурга публикуют Neural Photo Editor, новый интерфейс для изучения изученного скрытого пространства генеративных моделей и для внесения определенных семантических изменений в естественные изображения. Метод позволяет пользователю производить указанные изменения в выходном изображении с помощью контекстной кисти, которая косвенно изменяет скрытый вектор.

Внимание и расширенные рекуррентные нейронные сети, Google Brain. В этой статье авторы описывают, как RNN полезны для моделирования последовательностей данных, и исследуют четыре их расширения. Эта часть включает в себя множество визуализаций, которые помогают выделить важные части.

Покажи и расскажи: подписи к изображениям с открытым исходным кодом в TensorFlow, Google Brain. Эта система включает в себя классификацию целевого изображения и использование этих кодировок для инициализации кодировщика изображений с моделью зрения для системы подписи к изображениям для создания описательной подписи. В этой работе авторы добавляют этап тонкой настройки, во время которого система субтитров улучшается за счет совместной тренировки ее видения и языковых компонентов на субтитрах, созданных человеком. Интересно, что новая модель, реализованная в TensorFlow, может генерировать новые естественно звучащие описания сцен на английском языке, которые не были включены в обучающие данные. Бумага здесь.

Похищение моделей машинного обучения через API прогнозирования, EPFL. С ростом предложения машинного обучения на основе облака в качестве услуги безопасность обучающих данных и прогнозов выходит на первый план. В этой работе исследуются атаки извлечения модели, которые стремятся дублировать функциональность модели путем обратного проектирования ее параметров. Авторы демонстрируют, что успешные атаки полагаются на выходные данные API-интерфейсов прогнозирования, а именно на высокоточные доверительные значения и метки классов, для итеративной идентификации параметров модели. Они показывают, что сервисы, созданные Google, Amazon, Microsoft и BigML, особенно обеспокоены.

Финансирование венчурного капитала и выход

Большая сделка: европейская компания Movidius, которая создавала чипы вычислительного процессора изображений и программное обеспечение для подключенных устройств, продала Intel за 400 миллионов долларов. Компания была основана в 2005 году и привлекла 95 миллионов долларов за 7 раундов от Draper Esprit, Atlantic Bridge Capital, Robert Bosch Venture и других. Согласно Intel, алгоритмы Movidius, настроенные для глубокого обучения, навигации и картографии, а также естественного взаимодействия будут развернуты в рамках усилий Intel в области дополненной, виртуальной и объединенной реальности (AR / VR / MR), дронов, робототехники, цифровой безопасности. камеры и не только .

61 компания привлекла 305 млн долларов в ходе 62 раундов финансирования от 112 инвесторов. Средний размер сделки составил 2 млн долларов (по сравнению с 2,8 млн долларов в предыдущем выпуске) при предварительной оценке в 7,7 млн долларов (по сравнению с 6,3 млн долларов в предыдущем выпуске). Сделки включают:

Quanergy, производитель трехмерных времяпролетных датчиков LiDAR, привлекла серию B на 100 млн долларов при оценке после внесения денег в размере 1 млрд долларов от публичных компаний Sensata Technologies и Delphi Automotive. С момента основания в 2012 году компания привлекла 134 миллиона долларов.
Blackwood Seven, датская платформа медиа-аналитики и прогнозного моделирования продаж, привлекла $ 15,1 млн от JOLT Capital, Sunstone Capital и Conor Venture Partners. С момента основания в 2012 году компания привлекла $ 22,6 млн.
Skymind, создатель корпоративной платформы глубокого обучения с открытым исходным кодом, включая Deeplearning4j, объявил о начальном раунде на 3 миллиона долларов от Westlake Ventures, Tencent Holdings, YC и ряда бизнес-ангелов.
Базирующийся в Лондоне акселератор предварительных идей и предкоманды, Entrepreneur First, завершил свою шестую когорту с более чем дюжиной компаний, использующих ИИ для решения проблем в здравоохранении, производстве, продажах, биоинформатике и финансах.

Чтобы получить обзор европейского ландшафта для компаний, занимающихся ИИ, ознакомьтесь с этим исследованием Project Juno AI.

Что еще привлекло ваше внимание? Просто нажмите "Ответить"! Я активно ищу предпринимателей, создающих компании, которые создают / используют ИИ, чтобы переосмыслить то, как мы живем и работаем.

Новости искусственного интеллекта и машинного обучения

Новости, тенденции и мнения в сфере технологий

Исследования, разработки и ресурсы

Финансирование венчурного капитала и выход

Вопросы по теме