За последние две недели техническое сообщество было переполнено взрывными новостями, и я должен сказать, что это похоже на день в человеческом мире и год в мире ИИ.

Во-первых, на прошлой неделе Новый Bing открылся для всех пользователей, позволяя зарегистрироваться и сразу же использовать его. Затем, в среду, Google выпустила Bard, конкурента ChatGPT. В четверг GitHub представил GitHub Copilot X, а в пятницу команда OpenAI запустила «систему плагинов ChatGPT». Это был натиск, не оставляющий передышки.

Несколько раз я натыкался на эти новости поздно ночью и, не в силах сопротивляться, вставал с постели и всю ночь не спал, сочиняя статьи. В последнее время мой мозг мало отдыхал.

Для тех, кто еще не знаком с этими изменениями, рекомендую просмотреть предыдущие посты в паблике GitHubDaily, где я представил большинство из них.

В эти короткие дни на GitHub каждый день сыплются новые проекты. В дополнение к проектам с открытым исходным кодом, о которых я упоминал ранее, недавно появилось несколько отличных инструментов и решений.

Теперь я собираюсь поделиться шестью активными и очень практичными проектами с открытым исходным кодом на GitHub, которые имеют большой потенциал для коммерческого применения.

Без лишних слов, давайте углубимся в основную тему.

Решение Copilot с открытым исходным кодом

С тех пор, как Microsoft выпустила Microsoft 365 Copilot на прошлой неделе, термин «Copilot» был у всех на устах.

«Второй пилот поймал молнию в бутылке»

— так заявила Sequoia Capital, обсуждая следующую волну технологической революции.

При этом Copilot становится конкретной концепцией, которая постепенно проникает в домохозяйства. Чтобы разработчики могли использовать возможности больших языковых моделей (LLM), корпорация Майкрософт разместила на GitHub облегченный пакет SDK с открытым исходным кодом под названием «semantic-kernel».

Этот проект можно считать частичным решением Copilot. SDK поддерживает и инкапсулирует различные шаблоны проектирования из последних исследований ИИ, позволяя разработчикам внедрять сложные навыки в свои приложения.

GitHub: https://github.com/microsoft/semantic-kernel

Мало того, SDK также предоставляет такие функции, как создание цепочек подсказок, рекурсивное рассуждение, суммирование, обучение с нулевым/несколько выстрелов, контекстная память, долговременная память, встраивания, семантическое индексирование, планирование и доступ к внешним хранилищам знаний, а также внутренние данные.

Если вы заинтересованы в разработке продукта, который в будущем интегрирует функциональность Copilot, этот проект может послужить ценным справочным материалом для обучения.

Перенос ChatGPT в командную строку

Я считаю, что терминал командной строки является важной точкой входа для программистов и широко используемым инструментом разработки в их повседневной работе. Это отличное место для повышения производительности, поэтому вполне естественно перенести ChatGPT в командную строку.

Поэтому на GitHub есть невероятно полезный инструмент командной строки с открытым исходным кодом, который называется

Оболочка GPT

Этот инструмент интегрирует ChatGPT непосредственно в командную строку, позволяя вам быстро генерировать команды оболочки, писать фрагменты кода, составлять сообщения коммитов Git, создавать документацию, писать комментарии и многое другое.

GitHub: https://github.com/TheR1D/shell_gpt

Вот как это можно использовать:

• Получить инструкции по выполнению конкретной задачи.

• Преобразование единиц времени, расстояния, веса, температуры и т. д.

• Поиск использования оболочки в терминале командной строки.

• Автоматически генерировать и сохранять код.

• Вступить в диалог с ChatGPT в командной строке и выполнить итерацию для оптимизации.

Проще говоря, он работает как локальный бот командной строки. Вы даете ему инструкции, и он их выполняет. Даже если вы не знаете, как выполнить ту или иную задачу с помощью командной строки, вы можете спросить об этом напрямую.

Как и другие приложения ChatGPT, Shell GPT требует, чтобы вы настроили свой ключ OpenAI API перед использованием.

Система поиска кода на основе GPT-4

Следующий проект представляет собой реализацию с открытым исходным кодом, напоминающую функцию поиска кода в GitHub Copilot X.

Блуп

является поисковой системой с открытым исходным кодом. Он использует GPT-4 для ответов на вопросы, связанные с кодом, и позволяет использовать естественный язык, регулярные выражения и отфильтрованные запросы для поиска в локальных и удаленных репозиториях.

GitHub: https://github.com/BloopAI/bloop

Основные функции Bloop включают в себя:

• Поиск на основе сеанса с использованием GPT-4.

• Быстрый поиск по регулярным выражениям.

• Синхронизация локального репозитория и репозитория GitHub.

• Поддержка фильтров с различными параметрами запроса.

• Поиск по символам для поиска функций, переменных или признаков с использованием символов.

• Точная навигация по коду для более чем 10 популярных языков программирования.

Поскольку код проекта является полностью открытым исходным кодом, вы также можете интегрировать его функциональность во внутренние системы управления на предприятии, чтобы повысить эффективность поиска технических документов, руководств пользователя, учебных пособий и многого другого.

Решение ChatPDF с открытым исходным кодом

Около двух недель назад я рекомендовал проект под названием ChatPDF. Он позволяет извлекать контент из PDF-файлов и передавать этот контент в ChatGPT для анализа. После завершения синтаксического анализа вы можете участвовать в беседах один на один с ChatGPT, как если бы это был полностью понимающий человек.

Однако код этого проекта не является открытым исходным кодом. Итак, позвольте мне порекомендовать альтернативную реализацию с открытым исходным кодом.:

GPT-4 и LangChain

Используя его доступные функции, вы можете быстро создать чат-бота ChatGPT для своих PDF-документов.

GitHub: https://github.com/mayooear/gpt4-pdf-chatbot-langchain

Используемый стек технологий включает LangChain, Pinecone, TypeScript, OpenAI и Next.js.

LangChain — это платформа, упрощающая разработку масштабируемых приложений AI/LLM и чат-ботов. Pinecone — это векторное хранилище, используемое для хранения вложений и PDF-файлов в тексте, что позволяет в будущем извлекать похожие документы.

Чтобы помочь пользователям лучше понять исходный код проекта, автор записал техническое пошаговое видео продолжительностью 23 минуты, которое можно найти в README проекта.

Интеллектуальный плагин VSCode

Официальная интеграция GitHub Copilot X в VSCode может занять значительное время.

Если вы не хотите ждать слишком долго, вы можете попробовать этот плагин VSCode с открытым исходным кодом под названием

«VSCode ChatGPT».

GitHub: https://github.com/gencay/vscode-chatgpt

Его основная цель – интегрировать OpenAI ChatGPT в VSCode, предоставляя следующие функции, в том числе:

• Поддержка моделей GPT-4, GPT-3.5, GPT3 или Codex.

• Функция вопросов и ответов в диалоговом окне боковой панели.

• Контроль отклика для снижения потребления токенов.

• Генерация файлов или исправление кода одним щелчком мыши.

• Экспорт всех журналов разговоров в формате Markdown.

• Редактирование и повторная отправка подсказок.

• Генерация кода через ChatGPT.

Действительно, VSCode, кажется, способен почти на все…

Согласно закону Миллера, человеческий мозг лучше всего может обрабатывать около 7 порций информации. Поэтому в своих еженедельных рекомендациях по проектам с открытым исходным кодом я стараюсь поддерживать сдержанное число, не слишком много и не слишком мало, а ровно столько, чтобы каждый мог учиться и исследовать.