Публикации по теме 'llm'
Изучение Falcon LLM: новый король джунглей
Falcon LLM, разработанный Институтом технологических инноваций в Абу-Даби, представляет собой большую языковую модель, которая переопределила возможности языковой обработки ИИ. Эта модель входит в семейство Falcon, которое включает две основные модификации: Falcon-40B и Falcon-7B. Каждая модель обладает своими уникальными преимуществами, что делает Falcon LLM инновационным и универсальным инструментом для различных областей применения.
Понимание Falcon LLM
По своей сути Falcon LLM..
🫦 ChatGPT : … Я никогда тебя не прощу
Корень проблемы: ChatGPT постоянно нуждается в извинениях
ChatGPT был разработан, чтобы быть полезным, вежливым и не оскорблять пользователей. Создатели натренировали его таким образом, чтобы разговоры шли гладко.
Но эта цель привела к непреднамеренному последствию — постоянным извинениям. Это как учить ребенка манерам, и в итоге он слишком много говорит «извините» и «спасибо».
Почему ChatGPT извиняется, даже если это правильно
Из-за своего обучения ChatGPT рефлекторно извиняется,..
Автоматизация развертывания LLM в Snowflake
Узнайте, как использовать библиотеку реестра моделей Snowpark ML и векторизованные пользовательские функции Python Snowflake для автоматизации развертывания больших языковых моделей HuggingFace (LLMS) для пользователей Snowflake SQL.
23 августа 2023 г.: На момент написания этой статьи реестр моделей Snowpark ML находился в режиме частной предварительной версии. Если вы уже являетесь клиентом Snowflake, обратитесь к своей команде по работе с учетными записями Snowflake для получения..
От разреженной к мягкой смеси экспертов
В этом посте мы углубимся в исследовательскую работу Google DeepMind под названием «От разреженных к мягким смесям экспертов». В последние годы мы видим, что модели на основе трансформаторов становятся все больше и больше, чтобы улучшить их производительность. Нежелательным последствием является увеличение вычислительных затрат.
И здесь появляется смесь экспертов, которая помогает увеличить мощность модели без полной оплаты вычислительных затрат и, судя по отчетам, также используется..
LangChain 101: Часть 1. Создание простого приложения для вопросов и ответов
Введение
LangChain — это мощная платформа для создания приложений, которые генерируют текст, отвечают на вопросы, переводят языки и выполняют многие другие действия, связанные с текстом. Я работаю с LangChain с начала года и очень впечатлен его возможностями.
Эта статья — начало моего курса LangChain 101. Я начну делиться концепциями, практиками и опытом, показывая вам, как создавать собственные приложения LangChain.
Сегодня мы обсудим следующие темы:
Что такое LangChain? Основные..
Использование машинного обучения для решения проблем загрязнения в солнечной промышленности
TL;DR:
– Загрязнение, вызванное скоплением пыли на солнечных модулях, может привести к значительным потерям доходов. – Исследователи сравнили физические модели и подходы машинного обучения для прогнозирования потерь от загрязнения. – Физические модели достигли более высокой точности с данными полевых наблюдений, в то время как подходы машинного обучения показали многообещающие результаты. – Модели машинного обучения, основанные на данных об окружающей среде, полученных со..
Руководство для практиков по тонкой настройке LLM для предметно-ориентированного варианта использования, часть 1
с Адитья Хандекар CorridorPlatforms
Большие языковые модели (LLM) стали важной силой в семействе генеративного ИИ, захватывая воображение огромными возможностями. С запуском ChatGPT организации и компании все чаще используют эти сложные модели в существующих аналитических конвейерах, а также порождают новые варианты использования, которые были невозможны до LLM. Однако, хотя привлекательность генеративного ИИ может быть захватывающей, важно понимать, что развертывание LLM в..