Публикации по теме 'llm'


Изучение Falcon LLM: новый король джунглей
Falcon LLM, разработанный Институтом технологических инноваций в Абу-Даби, представляет собой большую языковую модель, которая переопределила возможности языковой обработки ИИ. Эта модель входит в семейство Falcon, которое включает две основные модификации: Falcon-40B и Falcon-7B. Каждая модель обладает своими уникальными преимуществами, что делает Falcon LLM инновационным и универсальным инструментом для различных областей применения. Понимание Falcon LLM По своей сути Falcon LLM..

🫦 ChatGPT : … Я никогда тебя не прощу
Корень проблемы: ChatGPT постоянно нуждается в извинениях ChatGPT был разработан, чтобы быть полезным, вежливым и не оскорблять пользователей. Создатели натренировали его таким образом, чтобы разговоры шли гладко. Но эта цель привела к непреднамеренному последствию — постоянным извинениям. Это как учить ребенка манерам, и в итоге он слишком много говорит «извините» и «спасибо». Почему ChatGPT извиняется, даже если это правильно Из-за своего обучения ChatGPT рефлекторно извиняется,..

Автоматизация развертывания LLM в Snowflake
Узнайте, как использовать библиотеку реестра моделей Snowpark ML и векторизованные пользовательские функции Python Snowflake для автоматизации развертывания больших языковых моделей HuggingFace (LLMS) для пользователей Snowflake SQL. 23 августа 2023 г.: На момент написания этой статьи реестр моделей Snowpark ML находился в режиме частной предварительной версии. Если вы уже являетесь клиентом Snowflake, обратитесь к своей команде по работе с учетными записями Snowflake для получения..

От разреженной к мягкой смеси экспертов
В этом посте мы углубимся в исследовательскую работу Google DeepMind под названием «От разреженных к мягким смесям экспертов». В последние годы мы видим, что модели на основе трансформаторов становятся все больше и больше, чтобы улучшить их производительность. Нежелательным последствием является увеличение вычислительных затрат. И здесь появляется смесь экспертов, которая помогает увеличить мощность модели без полной оплаты вычислительных затрат и, судя по отчетам, также используется..

LangChain 101: Часть 1. Создание простого приложения для вопросов и ответов
Введение LangChain — это мощная платформа для создания приложений, которые генерируют текст, отвечают на вопросы, переводят языки и выполняют многие другие действия, связанные с текстом. Я работаю с LangChain с начала года и очень впечатлен его возможностями. Эта статья — начало моего курса LangChain 101. Я начну делиться концепциями, практиками и опытом, показывая вам, как создавать собственные приложения LangChain. Сегодня мы обсудим следующие темы: Что такое LangChain? Основные..

Использование машинного обучения для решения проблем загрязнения в солнечной промышленности
TL;DR: – Загрязнение, вызванное скоплением пыли на солнечных модулях, может привести к значительным потерям доходов. – Исследователи сравнили физические модели и подходы машинного обучения для прогнозирования потерь от загрязнения. – Физические модели достигли более высокой точности с данными полевых наблюдений, в то время как подходы машинного обучения показали многообещающие результаты. – Модели машинного обучения, основанные на данных об окружающей среде, полученных со..

Руководство для практиков по тонкой настройке LLM для предметно-ориентированного варианта использования, часть 1
с Адитья Хандекар CorridorPlatforms Большие языковые модели (LLM) стали важной силой в семействе генеративного ИИ, захватывая воображение огромными возможностями. С запуском ChatGPT организации и компании все чаще используют эти сложные модели в существующих аналитических конвейерах, а также порождают новые варианты использования, которые были невозможны до LLM. Однако, хотя привлекательность генеративного ИИ может быть захватывающей, важно понимать, что развертывание LLM в..