Публикации по теме 'model-training'


AutoML NLP: конвертируйте PDF-файлы в JSONL!
Научитесь использовать сценарий, предоставленный AutoML docs, для преобразования текстовых файлов в формат jsonl. Если вы начали с чего-либо, связанного с AutoML NLP на GCP, вы уже знаете первый шаг. Преобразуйте свои документы в формат .jsonl , прежде чем передавать их в качестве обучающих данных. Документация AutoML уже предоставляет вам скрипт Python, но если вы обнаружили, что скрипт немного сложен для понимания или использования, вы не одиноки! Когда я просматривал..

Reel vs Real: обучение модели
Обучение модели для обнаружения фейковых новостей включает в себя процесс обучения модели машинного обучения для изучения закономерностей и прогнозирования подлинности новостных статей. Первым шагом является получение помеченного набора данных новостных статей, где каждая статья связана с бинарной меткой, указывающей, является ли она реальной или поддельной новостью. Затем данные предварительно обрабатываются путем очистки и нормализации текста, удаления ненужной информации и..

Базовое введение в полууправляемые алгоритмы машинного обучения
Алгоритмы машинного обучения с полуучителем — это класс алгоритмов машинного обучения, которые работают с комбинацией размеченных и неразмеченных данных. В отличие от обучения с учителем, когда машина обучается только на размеченных данных, обучение с полуучителем использует преимущества как размеченных, так и неразмеченных данных для повышения производительности. В этой статье мы рассмотрим, как работает полуконтролируемое обучение, и предоставим несколько реальных примеров..

Предварительная обработка данных на первом месте
Хотя я новичок в области науки о данных. Но некоторые юниоры часто задают мне такие вопросы. Что следует изучить в первую очередь между контролируемым и неконтролируемым? Что мне решать: регрессия или классификация? Какая модель лучше всего подходит для моего набора данных? Слышал, что случайный лес работает лучше, правда? Так что для них мне есть что сказать. Насколько хорошо ваша модель будет работать, в основном зависит от того, как вы обрабатываете набор данных. На мой..

Автоматизация аннотации компьютерного зрения: пусть ваша модель сделает всю работу.
Эта статья ранее публиковалась в блоге Labelbox . Почти каждый, кто в наши дни работает над приложениями компьютерного зрения, сталкивается с одной и той же проблемой: как ускорить маркировку данных, самую дорогую и трудоемкую часть разработки контролируемой системы машинного обучения. Это не останавливается, когда система машинного обучения запускается в производство. На самом деле, он может расти. Ответом, конечно же, является автоматизация, позволяющая компьютеру выполнять..

Создание приложения для машинного обучения с нуля — Автообучение модели
Цель Привет народ!! Этот учебник является продолжением предыдущего урока, в котором мы узнали о том, как создать веб-приложение машинного обучения с нуля. В этом уроке мы узнаем, как обучить модель нашего приложения, используя входные данные пользователя. Предыдущий урок: Создание приложения машинного обучения с нуля Бэкенд и внешний интерфейс приложения машинного обучения. medium.com Делать просто приложение не обязательно,..

Распознавание рукописных цифр
Распознавание рукописного текста — это проблема, которая восходит к первым автоматическим машинам, которым нужно было распознавать отдельные символы в рукописных документах. Классификация рукописного текста или чисел важна для многих реальных сценариев. Например, почтовая служба может сканировать почтовые индексы на конвертах, чтобы автоматизировать группировку конвертов, которые должны быть отправлены в одно и то же место. В этой статье мы будем использовать набор данных Digit из..