Вопросы по теме 'word-count'
Как лучше всего определить общее количество слов в файле на Java?
Как лучше всего найти общее количество слов в текстовом файле на Java? Я думаю, что Perl лучше всего подходит для поиска таких вещей. Если это правда, то вызов функции Perl из Java был бы лучшим? Что бы вы сделали в таком состоянии? Есть идеи...
3343 просмотров
schedule
30.01.2023
Служба подсчета слов AppleScript
Я пытаюсь создать службу в OSX leopard, которая подсчитывает количество слов выделенного текста. У меня есть автомат, настроенный на запуск яблочного скрипта со следующим:
on run {input, parameters}
count words of input
display...
1839 просмотров
schedule
25.02.2023
Ограничить количество слов в текстовом поле в JQuery
Я модифицирую некоторый код jquery, чтобы ограничить количество слов в текстовом поле, но я не могу понять, как получить значение. Вот код:
<script>
var $limitWords = 20;
var $wordCount = $('#count').val();...
8014 просмотров
schedule
07.05.2023
пример уменьшения количества слов на карте не работает
Я пытаюсь реализовать пример подсчета слов самостоятельно, вот моя реализация картографа:
public static class Map extends Mapper<LongWritable, Text, Text, IntWritable> {
public void map(LongWritable key, Text value, Context context)...
1372 просмотров
schedule
31.05.2022
Как протестировать программу подсчета слов, если есть какие-то непокрытые ошибки?
Я только что пересмотрел классический учебник C K&R. И прочитайте упражнение 1-11:
Как бы вы протестировали программу подсчета слов? Какие виды ввода, скорее всего, выявят ошибки, если таковые имеются?
На самом деле, у меня есть только базовая...
4251 просмотров
schedule
17.03.2023
Hadoop wordcount не может быть запущен — нужна помощь в расшифровке сообщения об ошибке Hadoop
Мне нужна помощь, чтобы понять, почему моя работа не удалась. Я построил кластер с одним узлом, просто чтобы попробовать. Я следовал примеру здесь .
Кажется, все работает правильно. Я отформатировал namenode и могу подключиться к jobtracker,...
4161 просмотров
schedule
19.03.2023
Каналы Wordcount C++ Hadoop не работают
Я пытаюсь запустить пример подсчета слов на С++, как эта ссылка описывает способ: Запуск программы WordCount на C++ . Компиляция работает нормально, но когда я попытался запустить свою программу, появилась ошибка:
bin/hadoop pipe -conf...
1625 просмотров
schedule
13.08.2022
Разрывы строк Wordcounts в python
Я пытаюсь написать скрипт для подсчета количества слов во многих файлах в каталоге. У меня это работает довольно близко к тому, что я хочу, но есть одна часть, которая сбивает меня с толку. Код пока такой:
import glob
directory =...
231 просмотров
schedule
17.04.2024
Подсчет уникальных слов в python
В прямом смысле мой код до сих пор таков:
from glob import glob
pattern = "D:\\report\\shakeall\\*.txt"
filelist = glob(pattern)
def countwords(fp):
with open(fp) as fh:
return len(fh.read().split())
print "There are"...
11826 просмотров
schedule
20.10.2022
Итерируемая ошибка в программе подсчета слов Python 3.3
Я пытаюсь завершить простую программу подсчета слов, которая отслеживает количество слов, символов и строк в подключенном файле.
# This program counts the number of lines, words, and characters in a file, entered by the user.
# The file is...
864 просмотров
schedule
25.06.2022
Пример интеграции Cassandra Hadoop и подсчета слов
Я использую Cassandra 1.1.6 и Hadoop 1.0.4. Я попытался интегрировать их и запустить пример работы в cassandra. Я знаю, что по умолчанию в этом примере используются несколько банок. Однако я хочу запустить этот пример с помощью hadoop. На данный...
947 просмотров
schedule
30.12.2022
Подсчитайте частоту слов в огромном текстовом файле
У меня есть огромный текстовый файл (больше, чем доступная оперативная память). Мне нужно подсчитать частоту всех слов и вывести слово и количество частот в новый файл. Результат должен быть отсортирован в порядке убывания частоты.
Мой подход:...
12324 просмотров
schedule
18.02.2023
Может ли openoffice считать слова с консоли?
у меня небольшая проблема, мне нужно подсчитывать слова внутри консоли, чтобы читать doc, docx, pptx, ppt, xls, xlsx, odt, pdf ... так что не предлагайте мне | wc -w или grep, потому что они работают только с текстовым или консольным выводом, и они...
1341 просмотров
schedule
05.05.2023
WebForms UnobtrusiveValidationMode требует ScriptResourceMapping для jquery. Добавьте ScriptResourceMapping с именем jquery (с учетом регистра)
Я создаю веб-приложение с помощью Visual Studio 2012. Я пытаюсь добавить количество слов в свое текстовое поле. Однако после добавления кодов javascript и кодов html. Я получаю сообщение об ошибке, как указано выше.
Вот мои коды javascript...
631667 просмотров
schedule
07.06.2022
Hadoop mapreduce работает очень медленно
Я использую кластер Hadoop 4datanode/1namenode с версией 1.1.2, установленной в xenserver как vms. У меня был текстовый файл размером 1 ГБ, и я пытался подсчитать количество слов. карта заняла 2 часа, а редуктор просто завис. Обычный perl-скрипт...
1658 просмотров
schedule
08.11.2023
извлечение текста с помощью Apache Tika, а затем получение часто встречающихся слов после удаления стоп-слов
я извлек текст для файла sample.pdf с помощью Tika и lucene, и я попытался удалить стоп-слова, после чего я получил количество оставшихся слов (исключая стоп-слова) из текста.
мой образец.pdf содержит
This is java related information it...
1570 просмотров
schedule
05.08.2022
Wordcount на выходах (Key, Value) из карты Reduce
У меня есть несколько (title , text ) упорядоченных пар, полученных в результате работы приложения MapReduce в Hadoop с использованием Java.
Теперь я хотел бы реализовать Word Count в текстовом поле этих упорядоченных пар.
Итак, мой...
1868 просмотров
schedule
05.12.2022
Как создать чистое облако слов с помощью pytagcloud без перегруженного изображения — Python
В предыдущем вопросе я спросил сообщество о том, как посчитать частоту каждых двух слов подряд в предложении, и я получил отличный ответ! теперь я пытаюсь построить облако слов из результатов, используя пакет pytagcloud.
Проблема, которая у...
5760 просмотров
schedule
16.06.2023
запуск программы HADoop Wordcount
Я изучаю hadoop, следуя michael-noll учебные пособия. Когда я пытался запустить пример wordcount, запустив hadoop jar hadoop-examples-1.2.1.jar wordcount tmp/Files tmp/Output , я получаю следующую ошибку:
13/11/10 18:09:42 ИНФОРМАЦИЯ...
4686 просмотров
schedule
31.05.2022
Как найти набор наиболее часто встречающихся пар слов в файле с помощью python?
У меня есть набор данных следующим образом:
"485","AlterNet","Statistics","Estimation","Narnia","Two and half men"
"717","I like Sheen", "Narnia", "Statistics", "Estimation"
"633","MachineLearning","AI","I like Cars, but I also like bikes"...
5976 просмотров
schedule
26.06.2023