С помощью GPT-4, ScholarAI и SmartSlides

В мире обработки естественного языка (NLP) оценка производительности языковых моделей имеет решающее значение. Двумя популярными показателями, используемыми для этой цели, являются BLEU (дублер двуязычной оценки) и ROUGE (дублер, ориентированный на припоминание для оценки Gisting). Эти метрики широко используются в таких задачах, как машинный перевод и реферирование текста. Совсем недавно эти метрики активно использовались при оценке больших языковых моделей.

В этой статье я покажу вам, как я использовал разработку подсказок ChatGPT на базе GPT-4, чтобы быстро изучить соответствующие исследовательские работы об этих метриках, обобщить и кратко их понять, включая математический рендеринг в LaTeX. Я подготовил актуальные, работоспособные примеры кода Python, используя наборы данных Huggingface в Google Colab, и даже создал слайд-презентацию, и все это менее чем за 10 минут. При правильном использовании использование больших языковых моделей практически безгранично!

Контур

  • Расширения ChatGPT
  • Быстрая разработка
  • Получение научных статей, связанных с показателями BLEU и ROUGE
  • Математика показателей BLEU и ROUGE
  • Создание примеров Python для BLEU и ROUGE
  • Создание PowerPoint с помощью SmartSlides

Расширения ChatGPT

Версия ChatGPT Plus позволяет использовать плагины, которые улучшают базовую модель, предоставляя ей дополнительные специфические функции, которые были бы невозможны только с помощью LLM. В этом случае я использовал два конкретных плагина: ScholarAI и SmartSlides. ScholarAI позволяет ChatGPT получать доступ к гигантской базе данных академических статей и научных работ по тысячам тем. , а SmartSlides использует контекст беседы для автоматического создания слайдов. Хотя в этой статье я не погружаюсь в функциональность этих плагинов, я настоятельно рекомендую вам проверить их!

Быстрая разработка

Быстрая разработка — это активная область исследований, которая заключается в улучшении моделей больших языков (LLM)…