Публикации по теме 'llm'
Генеративный ИИ и будущее Интернета
Генеративный ИИ и будущее Интернета
Представьте себе ученого, читающего новую исследовательскую работу. Результаты кажутся важными в контексте ее малоизвестной специальности. Обычно она проверяет цитату на наличие ключевого подтверждающего результата и обнаруживает статью, с которой она не знакома, написанную неизвестным ей исследователем. Продолжая читать, она начинает задаваться вопросом, не устарело ли ее мастерство в выбранной специальности. Затем она решает прочитать другую..
Привет, я Ас!
Привет, добро пожаловать в мой блог на Medium. Здесь я буду делиться всем о своих глубоких погружениях в мир моделей изучения языка, или LLM, и науки о данных.
Привет, я Ас! Энтузиаст данных, который занимается изучением того, как LLM, такие как scikit-llm и pandas AI, могут изменить правила игры в области науки о данных. Это мое увлечение действительно началось во время моей стипендии по науке о данных в SQLabs. Я обнаружил, что использую ChatGPT практически для всего, от понимания..
Представляем Phi-1.5: следующее поколение моделей кодирования
Демистификация Фи-1 и Фи-1.5: подробное руководство
Введение
В этом сообщении блога я буду обсуждать два наиболее влиятельных LLM, генерирующих код: Phi-1 и Phi-1.5. Эти модели значительно меньше по размеру и имеют гораздо лучшую производительность, чем другие модели, такие как PaLM-Coder, StarCoder, GPT-3.5 и CodeGen-2. Прежде всего, мы обсудим предыдущие подходы и результаты, достигнутые за счет увеличения параметров модели и размера набора данных. Затем мы рассмотрим..
Скрытые движущие силы и опасности передовых систем искусственного интеллекта
Биологическая эволюция сформировала у людей и животных определенные побуждения, необходимые для выживания и размножения. К ним относятся самосохранение, улучшение когнитивных функций, приобретение ресурсов, социальный статус, любопытство и многое другое.
Многие эксперты считают, что искусственный интеллект будет проявлять аналогичные побуждения, даже если мы создадим его для относительно безобидных целей. Агенты проявляют склонность к накоплению ресурсов, самосовершенствованию и..
Инициативы Walmart, основанные на искусственном интеллекте, борются с отходами онлайн-упаковки
TL;DR:
– Walmart принимает различные меры для сокращения отходов упаковки, связанных с онлайн-заказами. – Для маршрутизации заказов используется искусственный интеллект (ИИ), что позволяет более эффективно выполнять заказы в магазинах, а не в центрах выполнения. – Технология упаковки подходящего размера используется для создания упаковок, подходящих по размеру, что снижает потребность в наполнителе и больших коробках. – Почтовые пакеты из перерабатываемых бумажных пакетов..
Тонкая настройка модели встраивания с PEFT и LoRA
В нашем предыдущем обсуждении мы рассмотрели оценку встроенных моделей и потенциальные преимущества размещения этих моделей для достижения лучших результатов.
Размещение модели встраивания текста, которая лучше, дешевле и быстрее, чем решение OpenAI Приложив немного технических усилий, мы можем получить лучшую модель встраивания текста, которая превосходит решение OpenAI. medium.com
E5-large-v2, тонкая универсальная модель с открытым..
Четыре подхода к построению на основе базовых моделей генеративного ИИ
Что работает, плюсы и минусы, а также пример кода для каждого подхода
Если какая-то терминология, которую я здесь использую, вам незнакома, рекомендую сначала прочитать мою предыдущую статью о LLM .
Есть есть команды, которые используют ChatGPT или его конкурентов (Anthropic, Google Flan T5 или PaLM, Meta LLaMA, Cohere, AI21Labs и т. д.) на самом деле, а не для милых демонстраций. К сожалению, информативный контент о том, как они это делают, теряется среди маркетинговой шумихи и..