Публикации по тегам document-classification

Публикации по теме 'document-classification'

Магия AutoML на естественном языке GCP для классификации документов

Магия AutoML на естественном языке GCP для классификации документов Классификация текстов и документов является очень распространенным вариантом использования ML в отрасли, где значительный объем текстовой информации является основным источником для каждого сектора. Будь то розничная торговля, здравоохранение, электронная коммерция, автомобили, банковское дело или финансы, всегда найдется вариант использования, требующий классификации текста и документов. Ввод может быть в виде..

Перенос обучения с keras

В этом блоге мы узнаем, что такое трансферное обучение, а также когда и как мы должны его использовать. Передача обучения – это исследовательская проблема в области глубокого обучения, которая фокусируется на сохранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме. Идея: вместо того, чтобы кодировать нейронную сеть с нуля для решения нашей проблемы, мы можем повторно использовать существующую модель (VGG16). Зачем передавать..

Вопросы по теме 'document-classification'

Классификация текста, предварительная обработка включена

Каков наилучший метод классификации документов, если время не имеет значения и мы не знаем, сколько существует классов?

462 просмотров

cluster-analysis document-classification

09.06.2023

Выводит ли SVMlight баллы классификации?

Мне нужно знать, выводит ли SVMlight баллы классификации. Я нигде не мог его найти. Я знаю, что, например, libSVM делает.thx

1249 просмотров

classification svm document-classification

08.10.2022

Как найти наиболее дискриминационные термины в классификации двоичных документов?

Я хочу использовать выбор признаков, чтобы найти термины в документе, которые наиболее полезны для задачи бинарной классификации. Я поискал: здесь упоминается взаимная информация и критерий хи-квадрат...

232 просмотров

document-classification feature-selection

17.07.2022

Использование Lingpipe для языковой модели на уровне слов

Я пытался заставить языковую модель на уровне слов работать на lingpipe. Все примеры и руководства, с которыми я сталкивался, показывают модель символов и грамм. Как мне использовать lingpipe для обучения модели на уровне слов, а затем использовать...

669 просмотров

java nlp classification document-classification

24.05.2023

Нужны данные о тренировках для таких категорий, как спорт, развлечения, здоровье и т. д., а также для всех подкатегорий.

Я экспериментирую с алгоритмами классификации в ML и ищу корпус для обучения моей модели различению различных категорий, таких как спорт, погода, технологии, футбол, крикет и т. д. Мне нужны некоторые указатели на то, где я могу найти набор данных...

727 просмотров

text machine-learning document-classification wikipedia

20.09.2022

Категоризация текста с использованием наивного Байеса

Я решаю проблему машинного обучения с категоризацией текста, используя Naive Bayes. У меня каждое слово как характеристика. Я смог реализовать это, и я получаю хорошую точность. Могу ли я использовать кортежи слов в качестве признаков?...

1844 просмотров

machine-learning document-classification naivebayes

02.04.2023

как представить данные электронной почты в качестве входных данных для классификации на основе темы обсуждения с помощью weka?

Дублировать: Как представить текст для классификации в weka? Какие будут входные данные для классификатора, если мои данные — это электронная почта, т. е. текстовые данные? Какие атрибуты/функции будут установлены в электронной почте,...

182 просмотров

machine-learning classification document-classification weka

24.03.2023

Тестовые случаи в Weka

Учитывая, что у меня может быть файл ARFF, записанный в следующем виде: @relation spamOrNot @attribute body String @attribute result {spam, notspam} "free money now!", spam "hi meet me at 10", notspam И я должен был запустить это, чтобы...

584 просмотров

machine-learning document-classification weka email-spam

13.02.2023

Тройное выпадающее меню с десятичной классификацией Дьюи

Десятичная классификация Дьюи (DDC) — очень полезный метод классификации книг и текстов. Поэтому я пытаюсь найти тройное раскрывающееся меню, которое его реализует. Гуглил разными способами, но не нашел. Давным-давно я видел двойное выпадающее...

803 просмотров

javascript html document-classification

23.02.2023

Алгоритм Centroid для классификации текста, инструменты?

Как обсуждалось здесь , знаете ли вы какие-либо инструменты, которые обеспечивают алгоритм центроида для классификации текста в java?

377 просмотров

java machine-learning algorithm document-classification centroid

23.03.2022

3-кратная перекрестная проверка с использованием света SVM Хоакима

Мне нужно сделать 3-кратную перекрестную проверку, используя свет SVM Хоакима. Перекрестная проверка и SVM для меня новые вещи, и я не знаю, правильно ли я это делаю. Что я сделал до сих пор? Я преобразовал свои данные в 3 файла, которые я назвал...

932 просмотров

classification svm document-classification data-mining

03.10.2022

Показатели выбора функций, кроме Chi-2, в sklearn.feature_selection

Я экспериментирую с sklearn.svm.SVC в некоторых задачах классификации текста. Я понимаю, что выполнение выбора функций перед моделированием с помощью SVM является несколько сомнительной задачей, поскольку производительность обычно достигает пика при...

990 просмотров

python machine-learning scikit-learn document-classification

22.03.2022

как создать файл arff для weka?

Я новичок в weka, мне нужно извлечь статусы из социальной сети и проанализировать их с помощью weka, как создать файл arff, содержащий эти статусы? содержит ли weka алгоритмы определения корней, стоп-слов и n-грамм, или мне нужно использовать другие...

2452 просмотров

android classification document-classification weka

24.05.2023

Классификация документов с использованием наивного байесовского классификатора

Я делаю классификатор документов в mahout, используя простой наивный алгоритм Байеса. В настоящее время 98% данных (документов), которые у меня есть, относятся к классу A, и только 2% относятся к классу B. Мой вопрос заключается в том, что, поскольку...

843 просмотров

machine-learning document-classification bayesian-networks mahout

17.09.2022

Масштабируемые или онлайн внесистемные классификаторы с несколькими метками

Я последние 2-3 недели ломаю голову над этой проблемой. У меня проблема с несколькими метками (не с несколькими классами), когда каждый образец может принадлежать нескольким меткам. У меня есть около 4,5 миллионов текстовых документов в качестве...

2426 просмотров

machine-learning classification scikit-learn text-classification document-classification

20.09.2022

Как указать строки в файле Weka?

Я работаю над системой классификации текстов и хотел бы использовать униграммы в качестве функций. При создании файла arff я объявил поле атрибута строки, внутри которого я хочу указать все слова, содержащиеся в сообщении, разделенные запятой....

96 просмотров

classification document-classification weka

20.06.2023

Как рассчитать TF * IDF для одного нового документа, подлежащего классификации?

Я использую векторы документа-термина для представления коллекции документов. Я использую TF * IDF для расчета веса термина для каждого вектора документа. Затем я мог бы использовать эту матрицу для обучения модели классификации документов. Я с...

12733 просмотров

machine-learning classification text-mining document-classification information-retrieval

01.08.2023

Документируйте классификацию с несколькими метками — где вы берете метки? Онтология?

Я знаком с методами интеллектуального анализа данных, но не так хорошо знаком с интеллектуальным анализом текста или веб-анализом. Вот простая задача: классифицировать статьи по набору категорий. Допустим, я извлек текст статьи и обработал его....

192 просмотров

document-classification n-gram ontology vowpalwabbit

20.07.2022

Тестирование моего классификатора на обзоре

Итак, я смог обучить свой классификатор обзоров фильмов с помощью алгоритма NaiveBayes. Задача состоит в том, чтобы: Проверьте свой классификатор на наличие негативного отзыва о ходячих мертвецах....

58 просмотров

python nlp classification nltk document-classification

09.06.2022

Получение положительного теста на отрицательный отзыв

Хорошо, поэтому я обучил классификатор обзоров фильмов NaiveBayes ... однако, когда я запускаю его против отрицательного обзора (с веб-сайта, который я скопировал и вставил в текстовый файл), я получаю «pos» ... я делаю что-то не так? Вот код ниже:...

63 просмотров

python nlp nltk document-classification nltk-trainer

06.11.2023