Вопросы по теме 'mallet'

Тематическое моделирование в Mallet; Документация
Я ищу хорошую документацию для Mallet, особенно по его классам, связанным с тематическим моделированием. Я просмотрел документы Java, но они не слишком полезны. Например: estimate public void estimate() throws java.io.IOException...
2709 просмотров
schedule 25.02.2022

Маллет: показывает вклад в каждый прогноз
Я разрабатываю систему NER на Mallet с использованием CRF. Знаете ли вы, можно ли собрать вклад функций для каждого прогноза? Мне нужно знать и понимать точное поведение модели CRF. Какие-либо предложения? Спасибо. Ура, Украина
372 просмотров

Маллет: получить значение достоверности в алгоритме Maxent
Я использую алгоритм maxent в mallet для классификации меток. Мне было интересно, можно ли получить какое-то значение достоверности для метки, предсказанной классификатором maxent. Что мне в основном нужно, так это лучшие прогнозы K (не для каждого...
726 просмотров
schedule 21.07.2022

MALLET для автоматической пометки тем - с обучающими данными
У меня есть корпус документов, которые я уже пометил. У меня есть фиксированный список из примерно 400 тегов, относящихся к разным темам. Каждый документ был помечен одним или несколькими тегами и коротким заголовком. (У меня также есть гораздо...
377 просмотров

молоток не работает даже для команды помощи
Я собираюсь использовать тематическое моделирование молотком пихты, и я использую Linux. Я установил молоток (но не муравей), и у меня есть java в моей системе. Поэтому, когда я хочу использовать команды для молотка, он не работает. Единственная...
1711 просмотров
schedule 07.12.2022

как получить вероятность каждой темы в маллете
Я занимаюсь моделированием тем с помощью молотка. Я импортировал свой файл (каждый документ в строке) и обучил молоток с 200 темами. Теперь у меня есть 200 тем со словами, связанными с ними для каждой темы. Теперь мне нужно знать каждую тему` s...
195 просмотров
schedule 29.01.2024

Запуск MALLET в Java
Я пытаюсь запустить Mallet на Java и получаю следующую ошибку. Couldn't open cc.mallet.util.MalletLogger resources/logging.properties file. Perhaps the 'resources' directories weren't copied into the 'class' directory. Continuing. Я пытаюсь...
4622 просмотров
schedule 26.11.2022

MALLET Тематическое моделирование: входная строка
У меня есть этот код для импорта файла .mallet: File f=new File("/home/test/file.mallet"); InstanceList t=InstanceList.load(f); но если бы я хотел вручную переключать каждый экземпляр, как бы я это сделал? Я пробовал это: String...
806 просмотров
schedule 14.06.2022

Сохраняйте цифры в тематическом моделировании Mallet
Я использую Mallet для тематического моделирования. Большое количество слов в моем вводном тексте включает как буквы, так и цифры; например, A54, D892. Я только что заметил, что Маллет автоматически удаляет цифры и оставляет только буквы в словах....
127 просмотров
schedule 25.01.2023

MALLET Java API Импорт данных
Я пытаюсь сделать тематическое моделирование с помощью Java API. В пакете есть удобный пример. Однако, учитывая гораздо больший размер моих данных, я думаю, что было бы нецелесообразно импортировать их все из одного файла. Я просмотрел...
660 просмотров
schedule 18.05.2023

Моделирование темы молотком, маркировка тем
У меня есть корпус статей в одном документе, и я применяю алгоритм моделирования темы от MALLET, чтобы позже использовать функцию поиска, которая позволит пользователю искать статьи, соответствующие его вводу. Алгоритм, который я использую, — это...
502 просмотров
schedule 26.03.2023

OutOfMemoryError с классификатором Mallet CRF
Классификатор часто дает сбой OutOfMemoryError. Пожалуйста, предложите. У нас есть конвейер UIMA, который вызывает 5 банок модели (на основе CRF молотка) около 30 МБ каждый. -Xms настроен на 2G, а -Xmx установлен на 4G. Существуют ли...
188 просмотров
schedule 22.04.2023

Маллет: Алфавиты не соответствуют исключениям
Я пытаюсь реализовать классификатор документов с помощью Mallet в Java. У меня уже есть файл, содержащий значения функций. Поэтому я не хочу запускать весь конвейер обработки raw text . На данный момент строка в моем файле функций выглядит так...
420 просмотров
schedule 05.07.2022

Распределение слов по теме p(w|t) в Mallet
Мне нужно получить распределение слов для каждой темы, найденной Mallet в Java (не в CLI как задано в как получить распределение вероятностей для тема в молотке? ). Пример того, что я имею в виду: Введение в латентный Распределение Дирихле :...
430 просмотров
schedule 26.02.2024

молоточек для логического вывода для hLDA
Я пытаюсь использовать hLDA для создания тематической модели, а затем делать выводы на основе этой модели. Но, насколько я знаю, инструмент для вывода темы работает только с моделями LDA, я прав? Есть ли способ вывести темы из модели hLDA?
699 просмотров
schedule 23.01.2023

Как TF-IDF преобразовать InstanceList FeatureVectors
У меня есть MALLET InstanceList, где поля данных объектов Instance являются MALLET FeatureVector. Я хочу, чтобы TF-IDF преобразовал их с тем же эффектом, что и...
386 просмотров

Как рассчитывается вес слова в теме в Mallet?
Я пытаюсь выяснить, какой вес присваивается каждому слову в теме в Mallet. Я предполагаю, что это какая-то форма подсчета документов. Однако мне трудно понять, как получается эта цифра. В моей модели есть несколько слов, которые встречаются...
405 просмотров
schedule 05.06.2022

Как получить вероятность темы по запросу с помощью Mallet
Я хочу использовать Mallet в рамках проекта по поиску экспертов. Я почти новичок в Mallet, но знаю, что он тренирует темы из набора документов. Допустим, у меня есть 50 тем, подготовленных Маллетом. Я хочу рассчитать эту вероятность: p(topic|q)...
96 просмотров

нулевые источники в файле композиции молотка
Я хочу использовать молоток для обучающих тем. Мои данные находятся в одном файле, поэтому я изучаю документацию молотка, чтобы понять, как создать этот единственный файл. На веб-сайте Mallet в разделе Один файл, один экземпляр в строке...
86 просмотров

Молоток не распознается как внутренняя или внешняя команда
Я использую Windows 7. Я установил Mallet, и он отлично работает, когда я захожу в каталог Mallet. Однако я использую некоторое программное обеспечение Python, которое вызывает его ( https://github.com/uwgraphics/VEP_TMScripts ), и я получаю...
463 просмотров
schedule 17.03.2023