Вопросы по теме 'word-count'

Как лучше всего определить общее количество слов в файле на Java?
Как лучше всего найти общее количество слов в текстовом файле на Java? Я думаю, что Perl лучше всего подходит для поиска таких вещей. Если это правда, то вызов функции Perl из Java был бы лучшим? Что бы вы сделали в таком состоянии? Есть идеи...
3343 просмотров
schedule 30.01.2023

Служба подсчета слов AppleScript
Я пытаюсь создать службу в OSX leopard, которая подсчитывает количество слов выделенного текста. У меня есть автомат, настроенный на запуск яблочного скрипта со следующим: on run {input, parameters} count words of input display...
1839 просмотров

Ограничить количество слов в текстовом поле в JQuery
Я модифицирую некоторый код jquery, чтобы ограничить количество слов в текстовом поле, но я не могу понять, как получить значение. Вот код: <script> var $limitWords = 20; var $wordCount = $('#count').val();...
8014 просмотров
schedule 07.05.2023

пример уменьшения количества слов на карте не работает
Я пытаюсь реализовать пример подсчета слов самостоятельно, вот моя реализация картографа: public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> { public void map(LongWritable key, Text value, Context context)...
1372 просмотров
schedule 31.05.2022

Как протестировать программу подсчета слов, если есть какие-то непокрытые ошибки?
Я только что пересмотрел классический учебник C K&R. И прочитайте упражнение 1-11: Как бы вы протестировали программу подсчета слов? Какие виды ввода, скорее всего, выявят ошибки, если таковые имеются? На самом деле, у меня есть только базовая...
4251 просмотров
schedule 17.03.2023

Hadoop wordcount не может быть запущен — нужна помощь в расшифровке сообщения об ошибке Hadoop
Мне нужна помощь, чтобы понять, почему моя работа не удалась. Я построил кластер с одним узлом, просто чтобы попробовать. Я следовал примеру здесь . Кажется, все работает правильно. Я отформатировал namenode и могу подключиться к jobtracker,...
4161 просмотров
schedule 19.03.2023

Каналы Wordcount C++ Hadoop не работают
Я пытаюсь запустить пример подсчета слов на С++, как эта ссылка описывает способ: Запуск программы WordCount на C++ . Компиляция работает нормально, но когда я попытался запустить свою программу, появилась ошибка: bin/hadoop pipe -conf...
1625 просмотров
schedule 13.08.2022

Разрывы строк Wordcounts в python
Я пытаюсь написать скрипт для подсчета количества слов во многих файлах в каталоге. У меня это работает довольно близко к тому, что я хочу, но есть одна часть, которая сбивает меня с толку. Код пока такой: import glob directory =...
231 просмотров
schedule 17.04.2024

Подсчет уникальных слов в python
В прямом смысле мой код до сих пор таков: from glob import glob pattern = "D:\\report\\shakeall\\*.txt" filelist = glob(pattern) def countwords(fp): with open(fp) as fh: return len(fh.read().split()) print "There are"...
11826 просмотров
schedule 20.10.2022

Итерируемая ошибка в программе подсчета слов Python 3.3
Я пытаюсь завершить простую программу подсчета слов, которая отслеживает количество слов, символов и строк в подключенном файле. # This program counts the number of lines, words, and characters in a file, entered by the user. # The file is...
864 просмотров
schedule 25.06.2022

Пример интеграции Cassandra Hadoop и подсчета слов
Я использую Cassandra 1.1.6 и Hadoop 1.0.4. Я попытался интегрировать их и запустить пример работы в cassandra. Я знаю, что по умолчанию в этом примере используются несколько банок. Однако я хочу запустить этот пример с помощью hadoop. На данный...
947 просмотров
schedule 30.12.2022

Подсчитайте частоту слов в огромном текстовом файле
У меня есть огромный текстовый файл (больше, чем доступная оперативная память). Мне нужно подсчитать частоту всех слов и вывести слово и количество частот в новый файл. Результат должен быть отсортирован в порядке убывания частоты. Мой подход:...
12324 просмотров

Может ли openoffice считать слова с консоли?
у меня небольшая проблема, мне нужно подсчитывать слова внутри консоли, чтобы читать doc, docx, pptx, ppt, xls, xlsx, odt, pdf ... так что не предлагайте мне | wc -w или grep, потому что они работают только с текстовым или консольным выводом, и они...
1341 просмотров
schedule 05.05.2023

WebForms UnobtrusiveValidationMode требует ScriptResourceMapping для jquery. Добавьте ScriptResourceMapping с именем jquery (с учетом регистра)
Я создаю веб-приложение с помощью Visual Studio 2012. Я пытаюсь добавить количество слов в свое текстовое поле. Однако после добавления кодов javascript и кодов html. Я получаю сообщение об ошибке, как указано выше. Вот мои коды javascript...
631667 просмотров
schedule 07.06.2022

Hadoop mapreduce работает очень медленно
Я использую кластер Hadoop 4datanode/1namenode с версией 1.1.2, установленной в xenserver как vms. У меня был текстовый файл размером 1 ГБ, и я пытался подсчитать количество слов. карта заняла 2 часа, а редуктор просто завис. Обычный perl-скрипт...
1658 просмотров
schedule 08.11.2023

извлечение текста с помощью Apache Tika, а затем получение часто встречающихся слов после удаления стоп-слов
я извлек текст для файла sample.pdf с помощью Tika и lucene, и я попытался удалить стоп-слова, после чего я получил количество оставшихся слов (исключая стоп-слова) из текста. мой образец.pdf содержит This is java related information it...
1570 просмотров

Wordcount на выходах (Key, Value) из карты Reduce
У меня есть несколько (title , text ) упорядоченных пар, полученных в результате работы приложения MapReduce в Hadoop с использованием Java. Теперь я хотел бы реализовать Word Count в текстовом поле этих упорядоченных пар. Итак, мой...
1868 просмотров
schedule 05.12.2022

Как создать чистое облако слов с помощью pytagcloud без перегруженного изображения — Python
В предыдущем вопросе я спросил сообщество о том, как посчитать частоту каждых двух слов подряд в предложении, и я получил отличный ответ! теперь я пытаюсь построить облако слов из результатов, используя пакет pytagcloud. Проблема, которая у...
5760 просмотров

запуск программы HADoop Wordcount
Я изучаю hadoop, следуя michael-noll учебные пособия. Когда я пытался запустить пример wordcount, запустив hadoop jar hadoop-examples-1.2.1.jar wordcount tmp/Files tmp/Output , я получаю следующую ошибку: 13/11/10 18:09:42 ИНФОРМАЦИЯ...
4686 просмотров
schedule 31.05.2022

Как найти набор наиболее часто встречающихся пар слов в файле с помощью python?
У меня есть набор данных следующим образом: "485","AlterNet","Statistics","Estimation","Narnia","Two and half men" "717","I like Sheen", "Narnia", "Statistics", "Estimation" "633","MachineLearning","AI","I like Cars, but I also like bikes"...
5976 просмотров
schedule 26.06.2023