Я создал программу Matlab для поиска биграмм слов и их частот в текстовом файле. Для этой цели я создал массив ячеек строк, используя функцию textread:
unigrams = textread('file.txt','%s');
Но я также хочу опустить кучу слов, таких как «к», «тот», «есть», «или» и т. д., а также специальные символы «#», «$», «&» и «%» из моего массива ячеек . Есть ли способ исключить эти слова при чтении слов из необработанного файла.
Спасибо.