ИНС могут иметь разные формы и типы, в зависимости от того, с какими данными и задачами они имеют дело. Сверточные нейронные сети (CNN) — это особый тип ANN, созданный для данных изображений. Нейроны в CNN расположены в трех измерениях: высота, ширина и глубина. Измерение глубины показывает, сколько фильтров или карт объектов находят шаблоны на изображениях. Нейроны в CNN закодированы с использованием слоев, которые делают разные вещи с входными изображениями.

Рекуррентные нейронные сети (RNN) — это еще один особый тип ANN, созданный для данных, которые поступают в виде последовательности, такой как текст, речь или временные ряды. RNN имеют соединения, которые позволяют сети запоминать и использовать информацию из предыдущих входов в состоянии памяти. RNN могут узнать, как данные меняются с течением времени и что это означает во всей последовательности. RNN могут выполнять такие задачи, как понимание языка, распознавание речи, перевод языков и создание текстов.

Чтобы сделать вычисления для глубокого обучения быстрее и проще, очень полезными стали графические процессоры (GPU). Графические процессоры — это компьютерные чипы, которые изначально были созданы для создания компьютерной графики, но они также хороши для задач глубокого обучения. Графические процессоры могут очень быстро выполнять множество вычислений одновременно. Графические процессоры могут ускорить обработку больших и качественных изображений, а также обучение сложных и глубоких нейронных сетей. Графические процессоры также могут ускорить вычисление звуковых и языковых моделей, а также создание и изменение звуковых сигналов.

Базовые модели (FM) — это модели глубокого обучения, обученные на большом количестве данных, которые не организованы и не помечены. Их можно сразу использовать для многих задач или изменить на конкретные задачи, обучив их на небольших наборах данных с метками. Изменение предварительно обученного FM, чтобы он лучше справлялся с конкретной задачей, путем обучения его на меньшем наборе данных, называется тонкой настройкой. Тонкая настройка позволяет FM учиться и адаптироваться к деталям и закономерностям в меньшем наборе данных.

Генеративный ИИ означает удивительные способности FM-моделей создавать контент, выходящий за рамки того, что могли делать более ранние модели ИИ. FM могут создавать тексты на основе того, что им дают или что их просят сделать, например, GPT-4 или LaMDA. FM также могут создавать изображения на основе того, что им говорят или описывают, например, DALL-E или CLIP. FM также могут воспроизводить звуки из текстов или других входных данных, таких как WaveNet или Tacotron 2. FM также могут делать вещи, которые не связаны с созданием контента, например узнавать, что люди чувствуют на основе того, что они говорят, или выяснять, что с кем-то не так. на основе их изображений или записей.

Искусственный интеллект (ИИ) — это область информатики, целью которой является создание программного обеспечения, способного выполнять задачи, которые обычно требуют человеческого интеллекта, такие как рассуждение, обучение, планирование и принятие решений. Он охватывает различные методы и модели, в том числе большие языковые модели (LLM) и искусственные нейронные сети (ANN).

RNN имеют повторяющиеся соединения, которые позволяют сети хранить и повторно использовать информацию из предыдущих входов в состоянии памяти. RNN могут изучать временные зависимости и контекст в последовательных данных и генерировать выходные данные, которые зависят от всей последовательности. RNN могут выполнять такие задачи, как обработка естественного языка, распознавание речи, машинный перевод и генерация текста.

Графические процессоры (GPU) стали бесценными для удовлетворения вычислительных потребностей глубокого обучения. Первоначально разработанные для компьютерной графики, графические процессоры играют важную роль в обучении и эффективном запуске моделей глубокого обучения, предлагая значительную вычислительную мощность по сравнению с традиционными центральными процессорами (ЦП). Графические процессоры могут ускорить обработку больших изображений и изображений с высоким разрешением, а также обучение сложных и глубоких нейронных сетей. Графические процессоры также могут ускорить вычисление акустических и языковых моделей, а также декодирование и синтез речевых сигналов.

Базовые модели (FM) — это модели глубокого обучения, обученные на больших объемах неструктурированных и неразмеченных данных. Их можно использовать «из коробки» для различных задач или точно настроить для конкретных задач, обучив их на небольших помеченных наборах данных. Тонкая настройка включает в себя адаптацию предварительно обученного FM для лучшей работы в конкретной задаче путем его обучения на помеченном наборе данных, который меньше исходного набора обучающих данных. Тонкая настройка позволяет FM учиться и адаптироваться к нюансам и конкретным закономерностям, присутствующим в меньшем наборе данных.

Генеративный ИИ относится к расширенным возможностям моделей на основе FM для создания контента, превосходящим более ранние модели ИИ. FM могут генерировать тексты на естественном языке на основе заданного ввода или контекста, например GPT-4 или LaMDA. FM также может генерировать изображения на основе заданной подсказки или описания, например DALL-E или CLIP. FM также может генерировать речь из текста или других входных данных, таких как WaveNet или Tacotron 2. FM также может служить негенеративным целям, таким как классификация настроений на основе расшифровок звонков или медицинский диагноз на основе изображений или записей.