Публикации по теме 'document-classification'


Магия AutoML на естественном языке GCP для классификации документов
Магия AutoML на естественном языке GCP для классификации документов Классификация текстов и документов является очень распространенным вариантом использования ML в отрасли, где значительный объем текстовой информации является основным источником для каждого сектора. Будь то розничная торговля, здравоохранение, электронная коммерция, автомобили, банковское дело или финансы, всегда найдется вариант использования, требующий классификации текста и документов. Ввод может быть в виде..

Перенос обучения с keras
В этом блоге мы узнаем, что такое трансферное обучение, а также когда и как мы должны его использовать. Передача обучения  – это исследовательская проблема в области глубокого обучения, которая фокусируется на сохранении знаний, полученных при решении одной проблемы, и применении их к другой, но связанной проблеме. Идея: вместо того, чтобы кодировать нейронную сеть с нуля для решения нашей проблемы, мы можем повторно использовать существующую модель (VGG16). Зачем передавать..

Вопросы по теме 'document-classification'

Классификация текста, предварительная обработка включена
Каков наилучший метод классификации документов, если время не имеет значения и мы не знаем, сколько существует классов?
462 просмотров

Выводит ли SVMlight баллы классификации?
Мне нужно знать, выводит ли SVMlight баллы классификации. Я нигде не мог его найти. Я знаю, что, например, libSVM делает.thx
1249 просмотров

Как найти наиболее дискриминационные термины в классификации двоичных документов?
Я хочу использовать выбор признаков, чтобы найти термины в документе, которые наиболее полезны для задачи бинарной классификации. Я поискал: здесь упоминается взаимная информация и критерий хи-квадрат...
232 просмотров

Использование Lingpipe для языковой модели на уровне слов
Я пытался заставить языковую модель на уровне слов работать на lingpipe. Все примеры и руководства, с которыми я сталкивался, показывают модель символов и грамм. Как мне использовать lingpipe для обучения модели на уровне слов, а затем использовать...
669 просмотров

Нужны данные о тренировках для таких категорий, как спорт, развлечения, здоровье и т. д., а также для всех подкатегорий.
Я экспериментирую с алгоритмами классификации в ML и ищу корпус для обучения моей модели различению различных категорий, таких как спорт, погода, технологии, футбол, крикет и т. д. Мне нужны некоторые указатели на то, где я могу найти набор данных...
727 просмотров

Категоризация текста с использованием наивного Байеса
Я решаю проблему машинного обучения с категоризацией текста, используя Naive Bayes. У меня каждое слово как характеристика. Я смог реализовать это, и я получаю хорошую точность. Могу ли я использовать кортежи слов в качестве признаков?...
1844 просмотров

как представить данные электронной почты в качестве входных данных для классификации на основе темы обсуждения с помощью weka?
Дублировать: Как представить текст для классификации в weka? Какие будут входные данные для классификатора, если мои данные — это электронная почта, т. е. текстовые данные? Какие атрибуты/функции будут установлены в электронной почте,...
182 просмотров

Тестовые случаи в Weka
Учитывая, что у меня может быть файл ARFF, записанный в следующем виде: @relation spamOrNot @attribute body String @attribute result {spam, notspam} "free money now!", spam "hi meet me at 10", notspam И я должен был запустить это, чтобы...
584 просмотров

Тройное выпадающее меню с десятичной классификацией Дьюи
Десятичная классификация Дьюи (DDC) — очень полезный метод классификации книг и текстов. Поэтому я пытаюсь найти тройное раскрывающееся меню, которое его реализует. Гуглил разными способами, но не нашел. Давным-давно я видел двойное выпадающее...
803 просмотров

Алгоритм Centroid для классификации текста, инструменты?
Как обсуждалось здесь , знаете ли вы какие-либо инструменты, которые обеспечивают алгоритм центроида для классификации текста в java?
377 просмотров

3-кратная перекрестная проверка с использованием света SVM Хоакима
Мне нужно сделать 3-кратную перекрестную проверку, используя свет SVM Хоакима. Перекрестная проверка и SVM для меня новые вещи, и я не знаю, правильно ли я это делаю. Что я сделал до сих пор? Я преобразовал свои данные в 3 файла, которые я назвал...
932 просмотров

Показатели выбора функций, кроме Chi-2, в sklearn.feature_selection
Я экспериментирую с sklearn.svm.SVC в некоторых задачах классификации текста. Я понимаю, что выполнение выбора функций перед моделированием с помощью SVM является несколько сомнительной задачей, поскольку производительность обычно достигает пика при...
990 просмотров

как создать файл arff для weka?
Я новичок в weka, мне нужно извлечь статусы из социальной сети и проанализировать их с помощью weka, как создать файл arff, содержащий эти статусы? содержит ли weka алгоритмы определения корней, стоп-слов и n-грамм, или мне нужно использовать другие...
2452 просмотров

Классификация документов с использованием наивного байесовского классификатора
Я делаю классификатор документов в mahout, используя простой наивный алгоритм Байеса. В настоящее время 98% данных (документов), которые у меня есть, относятся к классу A, и только 2% относятся к классу B. Мой вопрос заключается в том, что, поскольку...
843 просмотров

Масштабируемые или онлайн внесистемные классификаторы с несколькими метками
Я последние 2-3 недели ломаю голову над этой проблемой. У меня проблема с несколькими метками (не с несколькими классами), когда каждый образец может принадлежать нескольким меткам. У меня есть около 4,5 миллионов текстовых документов в качестве...
2426 просмотров

Как указать строки в файле Weka?
Я работаю над системой классификации текстов и хотел бы использовать униграммы в качестве функций. При создании файла arff я объявил поле атрибута строки, внутри которого я хочу указать все слова, содержащиеся в сообщении, разделенные запятой....
96 просмотров

Как рассчитать TF * IDF для одного нового документа, подлежащего классификации?
Я использую векторы документа-термина для представления коллекции документов. Я использую TF * IDF для расчета веса термина для каждого вектора документа. Затем я мог бы использовать эту матрицу для обучения модели классификации документов. Я с...
12733 просмотров

Документируйте классификацию с несколькими метками — где вы берете метки? Онтология?
Я знаком с методами интеллектуального анализа данных, но не так хорошо знаком с интеллектуальным анализом текста или веб-анализом. Вот простая задача: классифицировать статьи по набору категорий. Допустим, я извлек текст статьи и обработал его....
192 просмотров

Тестирование моего классификатора на обзоре
Итак, я смог обучить свой классификатор обзоров фильмов с помощью алгоритма NaiveBayes. Задача состоит в том, чтобы: Проверьте свой классификатор на наличие негативного отзыва о ходячих мертвецах....
58 просмотров

Получение положительного теста на отрицательный отзыв
Хорошо, поэтому я обучил классификатор обзоров фильмов NaiveBayes ... однако, когда я запускаю его против отрицательного обзора (с веб-сайта, который я скопировал и вставил в текстовый файл), я получаю «pos» ... я делаю что-то не так? Вот код ниже:...
63 просмотров