Google объявил о своем пути к созданию более персонального мобильного опыта — Pixel 6 и Pixel 6 pro. Есть много причин, по которым Google может захотеть создать более персонализированный телефон: во-первых, есть спрос на этот тип персонализации, и, во-вторых, Google видит возможность отличить Pixel от других смартфонов.

Если целью является персонализация, неудивительно, что машинное обучение (МО) лежит в основе сегодняшних предложений. Потребители ожидают все больше и больше персонализированных продуктов, а программное обеспечение, способное создавать персональные, уникальные впечатления для пользователей, выделяется на рынке.

Этот запуск также демонстрирует, что стандарты для приложений и мобильных функций растут. Другим игрокам отрасли придется использовать машинное обучение, чтобы оставаться конкурентоспособными.

Сегодняшнее объявление привлекло внимание к машинному обучению несколькими интересными способами:

  1. Новый тензорный чип Google, предназначенный для включения машинного обучения на устройстве
  2. Расширенные возможности камеры для таких функций, как Magic Eraser, Face Unblur, Motion Mode и Real Tone.
  3. Расширенные текстовые и звуковые возможности для функций вызова, голосового набора, транскрипции и перевода.

Тензорный чип

Пиксели оснащены специально изготовленным чипом, предназначенным для включения возможностей искусственного интеллекта на мобильных устройствах. Запуск подчеркивает предполагаемую потребность Google в оборудовании такого типа, поскольку он может предложить «последние достижения Google в области искусственного интеллекта непосредственно на мобильном устройстве». Независимо от того, произойдет ли будущее машинного обучения в основном на устройстве или в облаке, ясно, что Google считает, что машинное обучение является ядром этой новейшей версии пикселя Google.

Функции камеры

Первая категория объявленных функций относится к камере и изображениям. Эти функции включают в себя Magic Eraser, Motion Mode, Face Unblur и Real Tone.

Волшебный ластик позволяет пользователям использовать интеллектуальные технологии на ходу, чтобы идентифицировать и удалять нежелательные объекты или людей на заднем плане (попрощайтесь с фотобомбой). Режим движения позволяет пользователям иметь неподвижный объект на переднем плане с эстетическим размытием на заднем плане. Режим движения использует машинное обучение для разделения объекта и движущегося элемента изображения, а затем, делая несколько быстрых снимков, объединяет изображения вместе. Размытие лица использует данные двух камер и четырех моделей машинного обучения для объединения изображений для создания наилучшего снимка. Последняя функция — Реальный тон, которая пытается более точно передать широкий диапазон оттенков кожи на фотографиях. В рамках функции Real Tone несколько опытных фотографов сделали миллионы фотографий исторически недопредставленных групп населения, создав, как сообщает Google, набор данных изображений, который стал на 25% более разнообразным. Если вам интересно узнать больше о предвзятости в данных, я рекомендую этот предыдущий пост, но недостаточное представление в данных может быть основным фактором в создании предвзятых моделей. Создание более разнообразного набора данных является важной частью устранения предвзятости в алгоритмах и моделях машинного обучения.

Текстовые и звуковые функции

Вторая основная категория функций, анонсированных при запуске, связана с распознаванием текста и звука. Google использует обработку естественного языка для создания функций вызовов, улучшенного голосового набора и живого перевода текста и речи.

Функции вызова могут один показать вам ожидаемое время ожидания для бесплатного номера, по которому вы планируете позвонить; два – перевод пунктов автоматизированного меню в текст, с которым можно взаимодействовать на телефоне; и три, ждать вас на линии, пока вы ждете живого представителя. Считалось, что все эти задачи могут решить только люди, но с появлением машинного обучения программистам больше не нужно разрабатывать код с миллионами различных правил для реагирования на различные ситуации. Машинное обучение позволяет компьютерам реагировать на гораздо большее количество обстоятельств.

Это лишь некоторые из многих функций на основе машинного обучения, анонсированных сегодня при запуске Google Pixel. Этот запуск, в значительной степени сосредоточенный на искусственном интеллекте и машинном обучении, подчеркивает растущий спрос на более персонализированные потребительские продукты и приоритет, отдаваемый компаниям в использовании персонализации, чтобы выделиться.

Первоначально опубликовано на https://telepath.io.