Публикации по тегам llm

Публикации по теме 'llm'

Генеративный ИИ и будущее Интернета

Генеративный ИИ и будущее Интернета Представьте себе ученого, читающего новую исследовательскую работу. Результаты кажутся важными в контексте ее малоизвестной специальности. Обычно она проверяет цитату на наличие ключевого подтверждающего результата и обнаруживает статью, с которой она не знакома, написанную неизвестным ей исследователем. Продолжая читать, она начинает задаваться вопросом, не устарело ли ее мастерство в выбранной специальности. Затем она решает прочитать другую..

Привет, я Ас!

Привет, добро пожаловать в мой блог на Medium. Здесь я буду делиться всем о своих глубоких погружениях в мир моделей изучения языка, или LLM, и науки о данных. Привет, я Ас! Энтузиаст данных, который занимается изучением того, как LLM, такие как scikit-llm и pandas AI, могут изменить правила игры в области науки о данных. Это мое увлечение действительно началось во время моей стипендии по науке о данных в SQLabs. Я обнаружил, что использую ChatGPT практически для всего, от понимания..

Представляем Phi-1.5: следующее поколение моделей кодирования

Демистификация Фи-1 и Фи-1.5: подробное руководство Введение В этом сообщении блога я буду обсуждать два наиболее влиятельных LLM, генерирующих код: Phi-1 и Phi-1.5. Эти модели значительно меньше по размеру и имеют гораздо лучшую производительность, чем другие модели, такие как PaLM-Coder, StarCoder, GPT-3.5 и CodeGen-2. Прежде всего, мы обсудим предыдущие подходы и результаты, достигнутые за счет увеличения параметров модели и размера набора данных. Затем мы рассмотрим..

Скрытые движущие силы и опасности передовых систем искусственного интеллекта

Биологическая эволюция сформировала у людей и животных определенные побуждения, необходимые для выживания и размножения. К ним относятся самосохранение, улучшение когнитивных функций, приобретение ресурсов, социальный статус, любопытство и многое другое. Многие эксперты считают, что искусственный интеллект будет проявлять аналогичные побуждения, даже если мы создадим его для относительно безобидных целей. Агенты проявляют склонность к накоплению ресурсов, самосовершенствованию и..

Инициативы Walmart, основанные на искусственном интеллекте, борются с отходами онлайн-упаковки

TL;DR: – Walmart принимает различные меры для сокращения отходов упаковки, связанных с онлайн-заказами. – Для маршрутизации заказов используется искусственный интеллект (ИИ), что позволяет более эффективно выполнять заказы в магазинах, а не в центрах выполнения. – Технология упаковки подходящего размера используется для создания упаковок, подходящих по размеру, что снижает потребность в наполнителе и больших коробках. – Почтовые пакеты из перерабатываемых бумажных пакетов..

Тонкая настройка модели встраивания с PEFT и LoRA

В нашем предыдущем обсуждении мы рассмотрели оценку встроенных моделей и потенциальные преимущества размещения этих моделей для достижения лучших результатов. Размещение модели встраивания текста, которая лучше, дешевле и быстрее, чем решение OpenAI Приложив немного технических усилий, мы можем получить лучшую модель встраивания текста, которая превосходит решение OpenAI. medium.com E5-large-v2, тонкая универсальная модель с открытым..

Четыре подхода к построению на основе базовых моделей генеративного ИИ

Что работает, плюсы и минусы, а также пример кода для каждого подхода Если какая-то терминология, которую я здесь использую, вам незнакома, рекомендую сначала прочитать мою предыдущую статью о LLM . Есть есть команды, которые используют ChatGPT или его конкурентов (Anthropic, Google Flan T5 или PaLM, Meta LLaMA, Cohere, AI21Labs и т. д.) на самом деле, а не для милых демонстраций. К сожалению, информативный контент о том, как они это делают, теряется среди маркетинговой шумихи и..