Я хотел бы получить итератор в стиле istream_iterator, который возвращает каждую строку файла в виде строки, а не каждого слова. Это возможно?
Есть ли итератор С++, который может перебирать файл построчно?
Ответы (7)
EDIT: Этот же трюк уже был опубликован кем-то другим в предыдущей теме.
Легко заставить std::istream_iterator
делать то, что вы хотите:
namespace detail
{
class Line : std::string
{
friend std::istream & operator>>(std::istream & is, Line & line)
{
return std::getline(is, line);
}
};
}
template<class OutIt>
void read_lines(std::istream& is, OutIt dest)
{
typedef std::istream_iterator<detail::Line> InIt;
std::copy(InIt(is), InIt(), dest);
}
int main()
{
std::vector<std::string> v;
read_lines(std::cin, std::back_inserter(v));
return 0;
}
string * ptr = new Line; delete ptr;
, но здесь это не так.
- person Manuel; 19.02.2010
Composition
). @Manuel
докажите мне, что никто не будет использовать их в полиморфном контексте... Я жду.
- person Matthieu M.; 19.02.2010
std::string
в качестве члена, а не наследование - дело вкуса.
- person thehouse; 29.05.2012
Стандартная библиотека не предоставляет итераторов для этого (хотя вы можете реализовать что-то подобное самостоятельно), но вы можете просто использовать функция getline (не метод istream) для чтения всей строки из входного потока в строку C++.
Пример:
#include <iostream>
#include <fstream>
#include <string>
#include <algorithm>
using namespace std;
int main()
{
ifstream is("test.txt");
string str;
while(getline(is, str))
{
cout<<str<<endl;
}
return 0;
}
ios::binary
), поток автоматически преобразует eol для конкретной платформы в обычный \n
.
- person Matteo Italia; 13.07.2011
std::istream
корректно конвертирует только EOL, родной для текущей платформы, для других, вероятно, ничего не сделает. Кроме того, теперь вы говорите о потоке COM, поэтому вам следует обратиться к его документации.
- person Matteo Italia; 15.07.2011
Вот решение. Пример печатает входной файл с @@ в конце каждой строки.
#include <iostream>
#include <iterator>
#include <fstream>
#include <string>
using namespace std;
class line : public string {};
std::istream &operator>>(std::istream &is, line &l)
{
std::getline(is, l);
return is;
}
int main()
{
std::ifstream inputFile("input.txt");
istream_iterator<line> begin(inputFile);
istream_iterator<line> end;
for(istream_iterator<line> it = begin; it != end; ++it)
{
cout << *it << "@@\n";
}
getchar();
}
Редактировать: Мануэль был быстрее.
Вы можете написать свой собственный итератор. Это не так сложно. Итератор — это просто класс, в котором (просто говоря) определены операторы приращения и *.
Посетите http://www.drdobbs.com/cpp/184401417, чтобы начать писать свой собственные итераторы.
boost::iterator_facade
, который реализует полную концепцию итератора STL с точки зрения нескольких основных функций.
- person Emile Cormier; 19.02.2010
Вы можете использовать istreambuf_iterator вместо istream_iterator. Он не игнорирует управляющие символы, такие как istream_iterator.
code.cpp:
#include <iterator>
#include <iostream>
#include <fstream>
using namespace std;
int main()
{
ifstream file("input.txt");
istreambuf_iterator<char> i_file(file);
istreambuf_iterator<char> eof;
std::string buffer;
while(i_file != eof)
{
buffer += *i_file;
if(*i_file == '\n')
{
std::cout << buffer;
buffer.clear();
}
++i_file;
}
return 0;
}
входной файл.txt:
ahhhh test *<-- There is a line feed here*
bhhhh second test *<-- There is a line feed here*
вывод:
ahhhh test
bhhhh second test
Вот довольно чистый подход, который использует boost::tokenizer а>. Это возвращает объект, предоставляющий функции-члены begin()
и end()
; полный интерфейс см. в документации класса tokenizer
а>.
#include <boost/tokenizer.hpp>
#include <iostream>
#include <iterator>
using istream_tokenizer = boost::tokenizer<boost::char_separator<char>,
std::istreambuf_iterator<char>>;
istream_tokenizer line_range(std::istream& is);
{
using separator = boost::char_separator<char>;
return istream_tokenizer{std::istreambuf_iterator<char>{is},
std::istreambuf_iterator<char>{},
separator{"\n", "", boost::keep_empty_tokens}};
}
Это жестко кодирует char
как тип символа потока, но это может быть шаблоном.
Функцию можно использовать следующим образом:
#include <sstream>
std::istringstream is{"A\nBB\n\nCCC"};
auto lines = line_range(is);
std::vector<std::string> line_vec{lines.begin(), lines.end()};
assert(line_vec == (std::vector<std::string>{{"A", "BB", "", "CCC"}}));
Естественно, его также можно использовать с std::ifstream
, созданным путем открытия файла:
std::ifstream ifs{"filename.txt"};
auto lines = line_range(ifs);
В связанном потоке cin-line-by-line, процитированное выше, Джерри Коффин описал «другую возможность (которая) использует часть стандартной библиотеки, о существовании которой большинство людей даже не подозревают». Следующее применяет этот метод (который я искал) для решения построчной проблемы итерации по файлу, как это было запрошено в текущем потоке.
Сначала фрагмент, скопированный непосредственно из ответа Джерри в соответствующей ветке:
struct line_reader: std::ctype<char> {
line_reader(): std::ctype<char>(get_table()) {}
static std::ctype_base::mask const* get_table() {
static std::vector<std::ctype_base::mask> rc(table_size, std::ctype_base::mask());
rc['\n'] = std::ctype_base::space;
return &rc[0];
}};
А теперь наполните ifstream пользовательской локалью, как описано Джерри, и скопируйте из infstream в ofstream.
ifstream is {"fox.txt"};
is.imbue(locale(locale(), new line_reader()));
istream_iterator<string> ii {is};
istream_iterator<string> eos {};
ofstream os {"out.txt"};
ostream_iterator<string> oi {os,"\n"};
vector<string> lines {ii,eos};
copy(lines.begin(), lines.end(), oi);
Выходной файл ("out.txt") будет точно таким же, как входной файл ("fox.txt").