Мои взгляды на ИИ и прогнозы на будущее

Как генеральный директор SaaS-компании стоимостью 100 миллионов долларов в Китае, а также сторонник искусственного интеллекта, я считаю, что мои взгляды могут немного отличаться. В этой статье около 5500 слов, ее чтение займет около 22 минут. В конце статьи есть заключение.

Китайская индустрия искусственного интеллекта в настоящее время находится на стадии догоняющего развития и останется таковой еще долгое время.

В первой половине этого года я был занят обновлением продуктов и технологий, а в середине года — корректировкой эффективности поставок. Теперь, помимо повседневной работы, я большую часть времени думаю о том, как обновить нашу бизнес-модель, чтобы повысить эффективность зарабатывания денег. После 8 месяцев адаптации мы добились замечательных результатов.

Занятый всеми этими вещами, жаль, что я пропустил первые несколько месяцев карнавала ИИ, но это не значит, что меня не интересует ИИ или недостаток мышления. Напротив, я уделял внимание развитию ИИ и выкраивал время, чтобы читать статьи, общаться с друзьями, а также пытаться реализовать некоторые сценарии ИИ в компании. Когда некоторые инвесторы спросили меня, почему я не выпускаю продукты искусственного интеллекта, я подумал, что после того, как OpenAI выпустила потрясающий продукт, всеобщие ожидания от искусственного интеллекта возросли. ИИ — это не «искусственный тормоз» прошлого.

Однако мы видим только основные моменты OpenAI, но не видим времени молчания. Они также пережили длительный период безвестности в 2015–2021 годах. За это время они создали ChatGPT — продукт, поразивший мир. Но сейчас GPT ограничивается генерацией естественного языка, а ИИ по-прежнему слишком неточен для реального принятия решений и действий. А реальные сценарии, за которые клиенты готовы платить, требуют принятия решений и действий. Таким образом, я не тороплюсь, если вы хотите сделать как можно лучше, вам следует решительно реализовывать «Лучшее или ничего».

Мой интерес к искусственному интеллекту имеет долгую историю, которая началась с изучения Пролога (языка программирования искусственного интеллекта) в средней школе. Позже, учась в колледже, я также писал алгоритмы на Прологе, чтобы подзаработать. Я всегда был убежденным символистом (моделирующим человеческий разум посредством логических рассуждений). После выпуска GPT у меня были некоторые сомнения по поводу символики, но недавно мы столкнулись с реальной реализацией ИИ в сложных сценариях. Что касается «принятия решений» и «действий», должно оставаться место для символизма, чтобы продолжать сиять.

Когда я оглядываюсь назад на изменения этого года в сочетании с ощущениями от открытия бизнеса в Китае в течение четырех лет, я изменил свою позицию: от пренебрежения инновациями бизнес-моделей к признанию реальности того, что бизнес-модели в Китае нельзя игнорировать. Китай – это не простой торговый рынок с «ценностью двухточечных услуг», а сложный торговый рынок, состоящий из «множественных интересов», а это означает, что предоставление единой услуги в Китае не может вырасти до крупных компаний, также невозможно быстро расти. Это важный фактор, который необходимо учитывать при разработке инновационных бизнес-моделей в Китае.

Так что же такое торговый рынок «ценности двухточечного обслуживания»? Наиболее очевидным примером является американская SaaS-компания. Им нужно предоставить только одну услугу, один сценарий, который может обмениваться торговой ценностью с пользователями. Платные пользователи из США очень четко продумали свою цепочку создания стоимости. Это серьезная группа людей, переживших несколько поколений капиталистических циклов. Они не похожи на китайцев, которые так стараются получить от вас выгоду. Жители США спонтанно узнают после того, как я воспользуюсь вашими услугами, какую ценность я создам, и моя цепочка создания стоимости очень ясна, и мне не нужно использовать вас в своих интересах. Это рынок прямолинейной стоимости. Ценность передается по прямой линии, и каждое предприятие может делать это по прямой, думая «Как мне лучше использовать свою ценность», а не «Как использовать вас для создания большей ценности».

Вот почему после того, как OpenAI заявила, что ее доход превышает 1 миллиард долларов, китайские компании LLM все еще ищут сценарии для поиска бизнеса. Разработчики по всему миру вызывают API OpenAI и платят за эти API, а затем делают то, что они считают ценным. Эти разработчики очень четко понимают, какую ценность им предоставляет OpenAI, им просто нужно сосредоточиться на поиске своей системы обмена ценностями, используя OpenAI как платформу, как инструмент.Напротив, все предприниматели LLM в Китае хотят твердо контролировать модель в свои руки, поэтому сейчас идет «Война Сотни Моделей». Предпринимателям на китайском рынке не только приходится создавать свои собственные модели, но и предполагать использование модели для предоставления услуг API, чтобы зарабатывать деньги, и они хотят найти более сложные сценарии обмена ценностями с помощью моделей для выполнения более крупных транзакций. Я не могу судить, кто прав или нет, могу только сказать, что почва рынка действительно другая.

Китай по-прежнему такой же, как и раньше, он способен сделать все высококачественные продукты доступными для всех, но ему все еще не хватает способности определить «видение» и ему не хватает смелости, чтобы делать ставку на долгосрочную миссию. Деловое общество Китая по-прежнему остается бизнес-сообществом, в котором доминируют спекулянты. Я не говорю, что деловое сообщество США не спекулирует. В деловом сообществе США может быть больше спекулянтов, чем в Китае, но в США также есть много идеалистических и практичных предпринимателей, ориентированных на миссию. Только в обществе, где эти два фактора могут сосуществовать, возможности капитала могут продолжать расти по спирали. Но рыночная почва в Китае, похоже, не способна вынести последнее. Это также та часть, где я больше всего разочарован китайским рынком.Китайским предпринимателям с идеалами в конечном итоге приходится опускаться все ниже и ниже, чтобы выжить, выполнить свои обязательства и нести цену отсутствия своих клиентов. договорного духа.

Отличием китайского рынка является необходимость формирования замкнутого цикла транзакций, также известного как «цикл выгоды» или так называемая «бизнес-модель». Суть так называемой инновационной бизнес-модели в китайском стиле, с точки зрения непрофессионала, заключается в том, «как принести пользу всем сторонам, как активно вовлекать все стороны через интересы и как глубоко связываться с различными заинтересованными сторонами». По сути, достижение этих трех пунктов является относительно успешной бизнес-моделью (некоторые полагают, что, возможно, необходимо добавить еще и прибыльность бизнес-модели).

Такое мышление фактически ограничивает китайские технологические инновации. Самые яркие умы Китая тратят свое время на размышления о том, как манипулировать людьми и создавать бизнес-циклы, вместо того, чтобы сосредоточиться на том, как создавать прорывные технологические инновации и изменять мир с помощью технологических рычагов. Большинство людей беспокойство, тревога, стремление к богатству и неуверенность в обществе не позволяют «предпринимателям, движимым миссией», выжить на общей почве. В результате они в конечном итоге переходят от стремления к технологическим инновациям к моделированию инноваций и более глубокому изучению человеческой природы. Этот дополнительный обмен стоимостью в результате обмена стоимостью одной услуги также увеличивает общие транзакционные издержки на китайском рынке.

Несколько дней назад я ужинал с другом и объяснил точку зрения, что в Китае амбициозное современное предприятие должно сочетать инновационные бизнес-модели и технологические инновации. Отсутствие любого из них может стать фактором, способствующим упадку компании.

Например, когда мы работали над Authing, мы сосредоточились на инновациях продуктов на ранней стадии, технологических инновациях на средней стадии, а теперь изучаем инновации в бизнес-моделях. Одна из важных причин, по которой я вынужден заниматься инновациями бизнес-моделей, заключается в том, что я определил более высокий уровень возможностей технологических инноваций, которые позволят Authing быстрее и эффективнее получать доходы. Однако эта возможность требует значительных инвестиций в исследования и разработки, и в нынешних условиях нам необходимо либо самофинансироваться и самостоятельно нести затраты на НИОКР, либо получать новые капитальные вложения за счет финансирования. Я пессимистично отношусь к последнему варианту.

Другими словами, сейчас мы стремимся к инновациям бизнес-моделей, чтобы получить возможности для технологических инноваций более высокого уровня за счет более эффективного получения доходов. Заработок денег – это средство, а не конечная цель. Конечная цель состоит в том, чтобы добиться более эффективного и масштабного получения доходов за счет технологических инноваций, а затем продолжать продвигать технологические инновации и, в конечном итоге, постоянно стимулировать социальное развитие. Инновации бизнес-моделей и технологические инновации дополняют друг друга, что может способствовать непрерывному спиральному росту предприятия.

Еще мне нужно остановиться и посмотреть на звезды и вытереть рукава на пути к росту, чтобы у меня не было ощущения, что это не стоит затраченных усилий.

Увидев недостаток самосознания, несознательность и догматизм китайских инженеров в технологических инновациях, а также став свидетелем того, как эта проблема продолжает расти в индустрии искусственного интеллекта, я почувствовал небольшое отчаяние. Я думаю, мне следует что-то с этим сделать — правильно это или неправильно, мы должны осмелиться подумать. Вот так и появилась эта статья. Из-за моей загруженности на работе и того факта, что наш бизнес в настоящее время переживает критическую трансформацию, у меня есть лишь ограниченное время для ИИ. Поэтому я в основном рассматриваю потенциал этой развивающейся области с точки зрения «первого принципа».

Первый принцип относится к «сущности вещей» и «неизменным потребностям».

От взаимодействия ИИ с миром к взаимодействию ИИ с человеком

В апреле этого года я выступил с речью о ключевых технологиях внедрения ИИ. Моя главная мысль заключалась в том, что ИИ постепенно будет развиваться от генерации естественного языка к «принятию решений и действию». Позже для этого понятия появился более структурированный термин — «Агент ИИ». Вот объяснение:

Агент ИИ — это оптимизированный процесс принятия решений агентом, который можно выразить следующим функциональным выражением:

Агент: П(восприятие) -> П(планирование) -> А(действие).

Подобно тому, как люди «делают что-то», основная функция Агента включает в себя три повторяющихся этапа: восприятие, планирование и действие.

Проще говоря, AI Agent — это набор моделей, которые имитируют процессы принятия решений и действий человека, но я думаю, что эта модель пытается использовать «символизм» для объяснения проблемы «векторной трансформации», которая является странной и нескоординированной. Конечно, и здесь каждый процесс может быть реализован посредством коннекционизма.

Когда я всегда чувствовал себя странно, но не мог понять, в чем дело, я думал о первом принципе. Порядок, в котором мы разрабатываем архитектуру, заключается в том, чтобы начать с понимания необходимости. По сути, ИИ — это сама инженерная архитектура. Я обнаружил, что слишком многих людей смущала сама архитектура, игнорируя суть и постоянные потребности.

Инженерная архитектура ИИ может легко измениться и будет меняться. Единственный способ адаптироваться к изменениям — найти первый принцип ИИ. AI Agent больше похож на схему технической архитектуры высокого уровня, чем на «основную» схему структуры, ориентированную на основные принципы. Он очень привлекателен, но ему не хватает какой-то души, которая исходит из неизменных потребностей людей.

Техническая архитектура должна определяться спросом, а не выводить спрос из технологий. AI-агент соответствует первому принципу. Суть, которую оно представляет, — это «мыслительная способность — сияние благодаря мыслям», а неизменное требование, которое оно представляет, – «людям необходимо взаимодействовать с внешним миром, прежде чем они могут принимать решения и действовать. AI Agent имитирует эти две точки зрения человека. Люди, которые сейчас опьянены ИИ-агентом, похоже, думают, что до тех пор, пока эти два пункта будут соблюдены, взаимодействие между людьми и ИИ будет естественным.

Я придерживаюсь противоположной точки зрения. Сегодня я хочу поговорить не просто о первом принципе взаимодействия ИИ с внешним миром (эта тема обсуждалась слишком многими людьми), но о первом принципе взаимодействие человека и ИИ. Да, я считаю, что взаимодействие человека и ИИ и взаимодействие ИИ и мира — это две разные вещи. Этот вопрос также можно преобразовать в «Как мы, люди, хотим взаимодействовать с ИИ?», точно так же, как Стив Джобс думал о том, «Как мы, люди, хотим взаимодействовать с мобильными устройствами». телефоны?»

В этой статье мы переосмыслим направление AGI с другой точки зрения и то, какими конкретными и незаменимыми базовыми возможностями должен обладать AGI в этом направлении.

Если мы посмотрим на текущий уровень ChatGPT с точки зрения iPhone, его можно будет сравнить с прототипом iPhone 1, а не с конечным продуктом. iPhone отличается беспрецедентным взаимодействием, которое удовлетворяет давнюю потребность в более лаконичном методе взаимодействия человека с компьютером. Когда iPhone был впервые представлен как смартфон, а затем он приобрел Siri, вполне вероятно, что у Стива Джобса были подобные мысли, но он был ограничен технологическим развитием того времени и не мог действовать в соответствии с ними.

Многие люди сейчас обсуждают модели алгоритмов и техническую архитектуру AI Agent, при этом многие талантливые люди пытаются найти подходящие приложения, основанные на этой возможности для создания «платформы». Однако я считаю, что это неправильное направление. Нам нужно сделать шаг назад и тщательно подумать, может ли эта структура действительно удовлетворить неизменные человеческие потребности. В конце концов, ИИ по-прежнему служит людям, поэтому я думаю, что нам нужно сохранять спокойствие и по-новому взглянуть на вопрос: «Какого взаимодействия мы, люди, хотим с ИИ?» Нам нужно отойти от привлекательных моделей алгоритмов и диаграмм технической архитектуры и пересмотреть то, «как мы, люди, в конечном итоге надеемся взаимодействовать с ИИ».

Когда мы используем компьютеры, есть две категории людей: те, кто управляется компьютером, и те, кто управляет компьютером. В эпоху DOS существовали только люди, которые управляли компьютером, поскольку DOS требовала сильных профессиональных навыков для работы с компьютерами. Эти эксперты использовали компьютеры для удовлетворения потребностей бизнеса, расчета результатов и предоставления помощи людям, которые не могли управлять компьютерами.

И только после появления графического интерфейса и бурного развития языков программирования и программного обеспечения появились люди, управляемые компьютерами, что также значительно увеличило аудиторию компьютеров. Люди, которыми управляют компьютеры, являются «пользователями программного обеспечения», а люди, управляющие компьютерами, – «создателями программного обеспечения». Однако эти две группы могут далее разделиться на категорию людей, владеющих программным обеспечением, а также людей, управляющих компьютерами, и категорию людей, не обладающих навыками использования программного обеспечения. Strong>, а также люди, которыми управляют компьютеры.

С развитием мобильного Интернета смартфоны быстро породили во всем мире большое количество «людей, управляемых компьютерами» и «людей, управляющих компьютерами». Однако разница между этим раундом «контроля» и эпохой ПК заключается в том, что самая большая категория людей, добавленная на этот раз, — это «люди, управляемые компьютерами». Это связано с тем, что порог использования программного обеспечения стал ниже, пользовательский опыт программного обеспечения улучшился, удобство использования программного обеспечения значительно возросло, а сценарии использования программного обеспечения были значительно расширены. Интеграция онлайна и офлайна полностью реализована, и эпоха движется вперед с неудержимой скоростью, чтобы никогда больше не вернуться.

Более того, этими людьми управляют не только компьютеры, но также данные и алгоритмы. Например, водители Didi/Uber контролируются автоматическим распределением пассажиров, доставщики еды ELEME/DoorDash контролируются автоматическим распределением заказов, а пользователи Douyin/Tiktok контролируются автоматическими видеорекомендациями. Количество контролируемых лиц. И глубина контроля в эту эпоху достигла большого прогресса, а контроллеры также достигли беспрецедентной мощности.

Следующая диаграмма визуально различает эти категории людей:

На протяжении истории мы видим, что с развитием технологий компьютерного взаимодействия и постоянными инновациями аудитория компьютеров также значительно расширилась. Помимо спроса и стоимости приобретения вычислительных устройств, важным параметром, влияющим на круг аудитории компьютеров, является смена режима взаимодействия. Казалось, что iPhone стал переходом от клавиатуры к сенсорному экрану, но на самом деле он изменил весь подход к проектированию операционной системы, программного и аппаратного обеспечения.

Суть упрощения режима взаимодействия заключается в раскрытии первого принципа человеческого спроса. Взаимодействие является наиболее прямым проявлением человеческих потребностей, и тот, кто может упростить взаимодействие, имеет фундаментальное условие для определения новых технологий и эпох. Проще говоря: «Я хочу, чтобы мой телефон мог печатать (режим взаимодействия), но кто сказал, что мне нужно использовать физическую клавиатуру?» Таким образом, у нас появилась операционная система, интегрированная с клавиатурой (технологический прогресс) и сенсорными экранами (технологический прогресс)».

Помните об этом принципе, мы продолжим использовать его позже, и вывод о том, что «режим взаимодействия стимулирует технологические инновации», также произойдет в эпоху искусственного интеллекта.

Возможная магическая реальность

Рассматривая предположение о том, «как мы, люди, в конечном итоге надеемся взаимодействовать с ИИ», я считаю, что ИИ можно рассматривать как систему, похожую на компьютер. Разница между ИИ и традиционными компьютерами заключается в том, что ИИ может обрабатывать гораздо больший объем данных, воспринимать более сложную среду и обладать большей вычислительной мощностью. Однако ИИ по-прежнему остается компьютерной системой.

С точки зрения первых принципов, люди, несомненно, предпочитают, чтобы AGI (Общий искусственный интеллект) был поставщиком услуг, а не конкурентом. Поскольку конкуренция между людьми уже жесткая, как сказали бы китайцы, этого уже достаточно, людям не нужно создавать свою собственную могилу, изобретая новый вид, который нам трудно контролировать и с которым нам трудно конкурировать.

Поэтому, когда мы обсуждаем предпосылку о том, что AGI является поставщиком услуг, то, принимает ли AGI форму гуманоида, не обязательно является важным вопросом.

Конечно, под первым принципом я подразумеваю всеобщий спрос на ОИИ. С моей личной точки зрения, я надеюсь, что жизнь на основе кремния заменит жизнь на основе углерода. Углеродная жизнь слишком хрупка. Солнце в конечном итоге погаснет, и Солнечная система исчезнет. Чтобы найти второй дом во время межзвездных путешествий, либо человеческая медицина добьется значительного прогресса и значительно увеличит продолжительность жизни (но биологические организмы все равно будут страдать), либо люди эволюционируют в жизнь, основанную на кремнии, и цивилизации потребуется более стабильная и безболезненная видовая структура. для его продолжения.

Если вы спросите меня, в чем смысл продолжения человеческой цивилизации, я бы сказал, что смыслом является само продолжение. Эта вселенная и эта Земля всегда были местом выживания наиболее приспособленных, и наличие вида, способного трансформировать всю материю, было бы утешением для всех живых существ, страдающих от боли. Даже если нас в это время не будет рядом, я знаю, что те, кто присутствует, будут жить лучше.

Если мы посмотрим на историю промышленной революции, мы увидим, что люди постоянно модифицировали промышленное производство от механического и бетонного к цифровому и электронному моделированию. Например:

Мобильные телефоны перешли от физических клавиатур (механических и бетонных) к сенсорным экранам (цифровому и электронному моделированию).
Компьютерные веб-камеры перешли от внешних насадок (механических и бетонных) к встроенным камерам (цифровому и электронному моделированию). ).
Автомобили превратились из механического управления (механического и бетонного) в один большой сенсорный экран (цифровое и электронное моделирование). который может выполнять практически все функции.
……

Ни одно из этих механизированных и конкретных веществ не является исключением в удовлетворении спроса на механическое управление в то время. Однако со временем людям нужна простота, и простота стала неизбежным путем.

Если сейчас у нас есть выбор и мы наблюдаем непрерывную эволюцию человеческого промышленного производства в сторону простоты и электронного моделирования, то почему ОИИ как поставщик услуг должен выглядеть как человек? Почему у него должны быть руки и ноги, как у людей? Почему все механическое оборудование само по себе не может быть разумным существом? Если человеческих рук и ног достаточно, зачем нам производить столько протяженных механических тел? Действительно ли необходимо создавать так называемых человекоподобных бетонных роботов с неэффективными руками и ногами для выполнения производственной работы? Действительно ли нам нужно следовать конкретному подходу, которого люди всегда придерживались в прошлом?

Эти вопросы не дают мне покоя:

Если бы у AGI не было рук и она могла бы напрямую управлять программным обеспечением для работы с документами, она могла бы написать эту статью (5000 слов) всего за 5 минут;
Если у AGI не будет рабочих рук, но есть специализированные комплекты для установки автомобилей, она сможет производить автомобили рациональным способом и устанавливать компоненты за миллисекунды;
Если AGI — это не человекоподобный робот, а умная рисоварка с рисом, умный контейнер для риса и умный кран, они могут взаимодействовать друг с другом, чтобы автоматически промывать рис и готовить его на пару;
…

Если удастся создать AGI, то все кремниевые устройства неизбежно будут обладать интеллектом. Это будет мир, похожий на волшебный мир, где вся материя сможет понимать человеческие инструкции, общаться и сотрудничать друг с другом для выполнения задач, поставленных людьми.

Конечно, есть точка зрения, которая может оспорить мои аргументы: трансформировать существующее оборудование сложно и практически невозможно, но человеческие руки и ноги являются универсальными контроллерами. Если есть ИИИ с руками и ногами, он неизбежно сможет научиться управлять этими машинами, поэтому создание человекоподобных роботов полезно. Это правда.

А если мы заглянем вперед, на 100 лет вперед? Если через 100 лет наши потомки захотят перепроектировать все оборудование, которым мы пользуемся, что они подумают? Будут ли они по-прежнему следовать нынешней модели?

Давным-давно я прочитал книгу «Как работает Google», и одно предложение, сказанное сотрудниками Google при создании Gmail, произвело на меня глубокое впечатление:

Если бы электронная почта была изобретена сегодня, как бы она выглядела?

На данный момент прошло более 30 лет с тех пор, как Рэй Томлинсон изобрел электронную почту в 1971 году, и мы все знаем об успехе Gmail. Он был пионером технологии SPA на основе браузера, которая вызвала революцию в интерфейсной разработке.

А продуктовая революция, которая станет результатом технологических прорывов AGI, будет только ускоряться.

Через 100 лет они будут производить устройства или программное обеспечение, которые будут ориентированы на интеллектуальную работу (точно так же, как облачные технологии сегодня), интегрированы с самого первого дня. Однако из соображений стоимости производители устройств или программного обеспечения, скорее всего, будут не производят разведданные сами. Определенно потребуется специальная платформа или возможность на уровне операционной системы наделить материалы интеллектом— — эта платформа в настоящее время называется LLM, но в настоящее время она не является конец игры.

Теперь мы можем спросить себя: если бы все устройства, которые мы видим, были произведены в эпоху, когда интеллект был в пределах досягаемости, как бы они выглядели?

Основным направлением AGI должно быть обеспечение свободного прохода AGI в компьютерный мир. AGI может не только трансформировать все устройства и наделять их интеллектом, но также использовать все преобразуемые им устройства для создания новых инструментов для преобразования материального мира. Конечно, очень важно, чтобы все разработчики могли разрабатывать любые интеллектуальные устройства, продукты и программное обеспечение на базе этой платформы точно так же, как вы сегодня пишете приложения для операционных систем или браузеров. Путем непрерывных изменений экологии, пока все существа в мире не наделятся разумом.

Этот процесс подобен производству инструментов людьми: инструменты приобретают ценность благодаря их использованию человеком. В будущем инструменты будут обладать интеллектом благодаря участию AGI, и AGI станет богиней вычислений.

Подобно тому, как роботы-гуманоиды с руками и ногами являются лишь одним из проявлений этой интеллектуальной платформы, роботы-гуманоиды наделены интеллектом благодаря интеллектуальной платформе.

Возможная реальность, которая может быть волшебной

Предыдущая магическая реальность, возможно, была несколько причудливой, возможно, временами даже призрачной, но давайте теперь вернемся к реальности. Начнем с того, что одна из самых простых вещей, которые можно трансформировать, — это компьютер. Если мы посмотрим на различные этапы развития компьютеров, то увидим заметную эволюцию в том, как люди взаимодействуют с этими машинами:

На основе вышеизложенного обсуждения мы можем сделать следующие выводы:

Режим взаимодействия изменился с командной строки на графический интерфейс, и люди могут решать более сложные задачи с помощью компьютеров. Это указывает на то, что чисто текстовый режим взаимодействия не может удовлетворить потребности человека в решении сложных задач, поэтому в настоящее время существует так много программных приложений.
Люди обладают способностью адаптироваться к различным средам и решать сложные проблемы, и ИИИ также должен обладать такой же способностью.
Самым большим преимуществом людей является их способность решать неизвестные проблемы. Обязательным условием решения проблем является понимание потребностей, а графический интерфейс является наиболее полной реализацией потребностей пользователей.
ИИ, имеющий только функции чата, не может выполнять сложные задачи.
Выполнение сложных задач зависит не только от алгоритмов и техники, но и от взаимодействия человека и машины на верхнем уровне. Поскольку изменения во взаимодействии человека и машины будут способствовать технологическим революциям, наиболее важным аспектом взаимодействия человека и машины является графический интерфейс. Хороший дизайн графического пользовательского интерфейса – это наиболее полное отражение потребностей пользователей, а графический интерфейс всегда создавался людьми, которые понимают человеческие потребности.
Первым типом AGI может быть не обязательно робот-гуманоид, а скорее AGI, который генерирует графический интерфейс на основе потребностей пользователей (возможность создания правильного графического интерфейса указывает на наличие понимания потребностей и понимание потребности являются предпосылкой решения проблем).
Когда GUI и CUI идеально сочетаются, это вызовет революцию в режиме взаимодействия. Хотя сложность разработки этого режима взаимодействия относительно высока, это наиболее впечатляющий опыт взаимодействия, который может произвести наибольшее впечатление на пользователей. Поэтому, чтобы предоставить пользователям наиболее впечатляющий и основанный на первопринципах опыт взаимодействия, вполне вероятно, что большое количество инженеров будет привлечено к этому направлению, что приведет к новой технологической революции и приведет AGI к новому будущему. OpenAI, возможно, пытается исследовать это направление, что соответствует ее давней позиции, сосредоточенной на исследованиях программного обеспечения.

Существует множество путей развития AGI:

Создание конкретных роботов
Создание интеллектуальной инфраструктуры, способной наделить все интеллектом
Автоматическое создание графического интерфейса
Создание коннекторов API для подключения различных сервисов образа жизни с помощью естественного языка.
…

Основываясь на выводе о том, что «простой AGI на основе чата не может выполнять сложные задачи», хотя четвертый пункт уже почти достигнут, эта способность, несомненно, все еще имеет серьезные узкие места в взаимодействии, помимо точности. Поэтому я считаю, что тот, кто сможет реализовать третий пункт, совершит огромный прорыв в области ИИ. Представьте себе следующую реальность:

Вам не нужно никакого программного обеспечения, только диалоговое окно.
Вы описываете свои потребности, и AGI генерирует необходимый графический интерфейс на основе ваших потребностей, это могут быть формы, 3D-редакторы или поля редактирования кода. В нем есть все, что вам нужно, и он автоматически генерируется на основе реальных требований.
Вы выполняете свои рабочие цели, задачи или решаете проблемы в диалоговом окне, и AGI знает обо всех ваших операциях. Это также может помочь вам исправить ошибки, когда вы их совершаете.
После того, как вы выполните свои задачи, все графические интерфейсы исчезнут, но AGI все запомнит. Вы можете вызвать интерфейс дисплея в любой момент так, как захотите, и чем больше вы его используете, тем больше AGI знает предпочитаемый вами способ обработки различных типов данных.
AGI становится настоящим агентом, который принадлежит вам и служит вам.

Это может показаться очень простым взаимодействием, но оно требует множества технологических прорывов.

Это похоже на то, как iPhone переопределил пользовательский интерфейс и внес изменения как в операционную систему, так и в аппаратное обеспечение (технологическая революция).

Это не волшебное явление. ИИ прочитал весь текст на естественном языке в Интернете, а это значит, что он также знает весь веб-код в Интернете. Он хорошо знаком со всеми шаблонами графического пользовательского интерфейса, используемыми людьми, и ему нужен только кто-то, кто сможет воспользоваться его сокровищницей знаний.

Язык программирования — это язык компьютеров, который может представлять все в мире, но не может писать сам.

Естественный язык — это язык людей, содержащий все, что есть в человеческом обществе и во Вселенной.

Огромный разрыв между этими двумя понятиями обусловлен тем фактом, что нам нужно, чтобы люди писали миллионы или даже миллиарды строк кода для языков программирования, чтобы представить человеческое разнообразие.

AGI объединит естественный язык с языком программирования, плавно преобразует потребности с помощью языка программирования и предоставит людям беспрецедентный интерактивный опыт с помощью методов графического пользовательского интерфейса, отвечающих человеческим потребностям.

В дополнение к обновлению пользовательского интерфейса, все графические интерфейсы, созданные AGI, будут иметь взаимосвязь и взаимодействие по умолчанию за кулисами, но разрешение на взаимосвязь и взаимодействие будет устанавливаться владельцем AGI, что приведет к большему взаимодействию при обработке данных. уровень и принести больше возможностей.

Без преувеличения тот, кто преуспеет в этом направлении, может стать современной iOS, а операционная система претерпит новый виток революции.

В следующей статье будет представлена подробная архитектура проектирования этой платформы.

Конечно, есть еще много вопросов, которые я еще не выяснил, например:

Должны ли мы сначала сосредоточиться на реальном мире или на компьютерном мире?
Почему нам нужно сначала достичь бесконечного творчества в компьютерном мире?
Что на самом деле означает «AI Native»? Стоит ли отдавать приоритет технологиям искусственного интеллекта при разработке приложений, или создавать искусственный интеллект в среде искусственного интеллекта, или производить интеллектуальные продукты с первого дня?
……

Заключение

Выводы и прогнозы этой статьи можно резюмировать следующим образом:

Из-за проблем с коммерческой и инновационной средой в Китае развитие ИИ в настоящее время находится на догоняющем этапе и останется таковым в обозримом будущем. Однако китайский рынок приложений, несомненно, превосходен и обширен.
Нам необходимо пересмотреть «то, как люди хотят взаимодействовать с ИИ», основываясь на основных принципах (т. е. начиная с сути понимания неизменных потребностей пользователей).
Исходя из неизменных потребностей пользователей и исторических процессов, разработчики компьютерного программного обеспечения постоянно удовлетворяют и оптимизируют потребности человека во взаимодействии с машинами и устройствами. Радикальные изменения во взаимодействии человека и компьютера могут привести к технологическим революциям.
В будущем аналитическая аналитика станет такой же популярной, как и облачная, и все будет ориентировано на аналитику, а не на облако. Платформы, предоставляющие интеллектуальные решения, станут такими же важными, как операционные системы и облака, становясь инфраструктурой для всего интеллекта.
Через 100 лет люди вспомнят, как Google изменила электронную почту в XXI веке на основе первоначального дизайна электронной почты 1971 года, и пересмотрят то, как должно работать все промышленное производственное оборудование, бытовая техника, средства обучения и компьютерное программное обеспечение. быть перепроектированы и стать интеллектуальными в эпоху интеллектуальной инфраструктуры, которая доступна сегодня.
Роботы-гуманоиды являются осязаемым проявлением интеллектуальных операционных систем.
До нативного интеллекта еще слишком далеко, но мы можем начать с того, чтобы позволить GUI (который является проявлением человеческих потребностей) проектироваться и генерироваться с помощью AGI, тем самым совершая революцию в методах взаимодействия. Хотя разработка этого метода взаимодействия является сложной задачей, это наиболее впечатляющий и основанный на первопринципах опыт взаимодействия, который может получить пользователь, который, несомненно, привлечет многих инженеров, чтобы совершить новую технологическую революцию и привести AGI в будущее. OpenAI, вероятно, попытается двигаться в этом направлении (что соответствует его историческому фокусу на исследованиях программного обеспечения).
Графический интерфейс может показаться простым в использовании, но на самом деле он представляет собой очень сложную вещь, поскольку представляет собой кристаллизацию человеческой мудрости, абстрагированной от человеческих потребностей. Поэтому сосредоточение внимания на создании графического интерфейса является важной темой, поскольку создание графического интерфейса включает не только создание графического интерфейса, но также алгоритмы, проектирование, операции, PRD и другую логику. Тот, кто успешно создает универсальный графический интерфейс, доказывает, что AGI действительно обладает универсальными способностями.
Графический интерфейс, созданный с помощью AGI, может представлять собой взаимосвязанные компоненты данных, которые закладывают прочную основу для «всего, что основано на интеллекте» в будущем.
Графический интерфейс, созданный с помощью AGI, может стать решающим шагом для интеллектуальных операционных систем, поскольку без графического пользовательского интерфейса люди не могут решать сложные проблемы. Если мы хотим полагаться на AGI для решения сложных проблем, AGI должен предоставлять графический интерфейс, и это должен быть графический интерфейс, созданный AGI в соответствии с историческими тенденциями; инновации и большое количество технологических революций будут вызваны наиболее идеально спроектированными графическими интерфейсами.

Наконец, когда сейчас все заняты искусственным интеллектом, кто знает, что выдумает метавселенная Марка Цукерберга через три года? Будете ли вы удивляться через три года так же, как в этом году, тому, насколько умными стали роботы? Или вы будете удивлены, насколько интересной стала множественная метавселенная? Это не имеет значения; не стоит удивляться. Все это результат того, что идеалисты посеяли семена три года назад или даже раньше.

Давайте работать вместе, друзья!

Если вас интересует эта тема, напишите мне по адресу [email protected].

2023–09–08 22:30 Пекин, Китай

Ян, Се