<< Пред. стр. 99 (из 121) След. >>
cin copy( cout diff_type eos for in in( intistream_iterator< it iter line_cnt main() sort( string test test.begin()
test.end() test.erase( typedef unique( vector< { }
(Потоковые итераторы ввода/вывода iostream рассматривались в разделе 12.4.)
Помимо предопределенных операторов ввода, можно определить и собственные перегруженные экземпляры для считывания в пользовательские типы данных. (Подробнее мы расскажем об этом в разделе 20.5.)
20.2.1. Строковый ввод
Считывание можно производить как в C-строки, так и в объекты класса string. Мы рекомендуем пользоваться последними. Их главное преимущество – автоматическое управление памятью для хранения символов. Чтобы прочитать данные в C-строку, т.е. массив символов, необходимо сначала задать его размер, достаточный для хранения строки. Обычно мы читаем символы в буфер, затем выделяем из хипа ровно столько памяти, сколько нужно для хранения прочитанной строки, и копируем данные из буфера в эту память:
#include
#include
char inBuf[ 1024 ];
try
{
while ( cin >> inBuf ) {
char *str = new char[ strlen( inBuf ) + 1 ];
strcpy( str, inBuf );
// ... сделать что-то с массивом символов str
delete [] str;
}
}
catch( ... ) { delete [] str; throw; }
Работать с типом string значительно проще:
#include
#include
string str;
while ( cin >> str )
// ... сделать что-то со строкой
Рассмотрим операторы ввода в C-строки и в объекты класса string. В качестве входного текста по-прежнему будет использоваться рассказ об Алисе Эмме:
Alice Emma has long flowing red hair. Her Daddy says
when the wind blows through her hair, it looks almost
alive, like a fiery bird in flight. A beautiful fiery
bird, he tells her, magical but untamed. "Daddy, shush,
there is no such creature," she tells him, at the same time
wanting him to tell her more. Shyly, she asks, "I mean,
Daddy, is there?"
Поместим этот текст в файл alice_emma, а затем перенаправим на него стандартный вход программы. Позже, когда мы познакомимся с файловым вводом, мы откроем и прочтем этот файл непосредственно. Следующая программа помещает прочитанные со стандартного ввода слова в C-строку и находит самое длинное слово:
#include
#include
int main()
{
const int bufSize = 24;
char buf[ bufSize ], largest[ bufSize ];
// для хранения статистики
int curLen, max = -1, cnt = 0;
while ( cin >> buf )
{
curLen = strlen( buf );
++cnt;
// новое самое длинное слово? сохраним его
if ( curLen > max ) {
max = curLen;
strcpy( largest, buf );
}
}
cout << "Число прочитанных слов "
<< cnt << endl;
cout << "Длина самого длинного слова "
<< max << endl;
cout << "Самое длинное слово "
<< largest << endl;
}
После компиляции и запуска программа выводит следующие сведения:
Число прочитанных слов 65
Длина самого длинного слова 10
Самое длинное слово creature,"
На самом деле этот результат неправилен: самое длинное слово beautiful, в нем девять букв. Однако выбрано creature, потому что программа сочла его частью запятую и кавычку. Следовательно, необходимо отфильтровать небуквенные символы.
Но прежде чем заняться этим, рассмотрим программу внимательнее. В ней каждое слово помещается в массив buf, длина которого равна 24. Если бы в тексте попалось слово длиной 24 символа (или более), то буфер переполнился бы и программа, вероятно, закончилась бы крахом. Чтобы предотвратить переполнение входного массива, можно воспользоваться манипулятором setw(). Модифицируем предыдущую программу:
while ( cin >> setw( bufSize ) >> buf )
Здесь bufSize – размер массива символов buf. setw() разбивает строку длиной bufSize или больше на несколько строк, каждая из которых не длиннее, чем bufSize - 1.
Завершается такая частичная строка двоичным нулем. Для использования setw() в программу необходимо включить заголовочный файл iomanip:
#include
Если в объявлении массива buf размер явно не указан:
char buf[] = "Нереалистичный пример";
то программист может применить оператор sizeof, но при условии, что идентификатор является именем массива и находится в области видимости выражения:
while ( cin >> setw(sizeof( buf )) >> buf )
Применение оператора sizeof в следующем примере дает неожиданный результат:
#include
#include
int main()
{
const int bufSize = 24;
char buf[ bufSize ];
char *pbuf = buf;
// если строка длиннее, чем sizeof(char*),
// она разбивается на несколько строк
while ( cin >> setw( sizeof( pbuf )) >> pbuf )
cout << pbuf << endl;
}
Программа печатает:
$ a.out
The winter of our discontent
The
win
ter
of
our
dis
con
ten
t
Функции setw() вместо размера массива передается размер указателя, длина которого на нашей машине равна четырем байтам, поэтому вывод разбит на строки по три символа.
Попытка исправить ошибку приводит к еще более серьезной проблеме:
while ( cin >> setw(sizeof( *pbuf )) >> pbuf )
Мы хотели передать setw() размер массива, адресуемого pbuf. Но выражение
*pbuf
дает только один символ, т.е. объект типа char. Поэтому setw() передается значение 1. На каждой итерации цикла while в массив, на который указывает pbuf, помещается только нулевой символ. До чтения из стандартного ввода дело так и не доходит, программа зацикливается.
При использовании класса string все проблемы управления памятью исчезают, об этом заботится сам string. Вот как выглядит наша программа в данном случае:
#include
#include
int main()
{
string buf, largest;
// для хранения статистики
int curLen, // длина текущего слова
max = -1, // максимальная длина слова
cnt = 0; // счетчик прочитанных слов
while ( cin >> buf )
{
curLen = buf.size();
++cnt;
// новое самое длинное слово? сохраним его
if ( curLen > max )
{
max = curLen;
largest = buf;
}
}
cout << "Число прочитанных слов " << cnt << endl;
cout << "Длина самого длинного слова " << max << endl;
cout << "Самое длинное слово " << largest << endl;
}
Однако запятая и кавычка по-прежнему считаются частью слова. Напишем функцию для удаления этих символов из слова:
#include
void filter_string( string &str )
{
// элементы, подлежащие фильтрации
string filt_elems( "\",?." );
string::size_type pos = 0;
while (( pos = str.find_first_of( filt_elems, pos ))
!= string::npos )
str.erase( pos, 1 );
}
Эта функция работает правильно, но множество символов, которые мы собираемся отбрасывать, “зашито” в код. Лучше дать пользователю возможность самому передать строку, содержащую такие символы. Если он согласен на множество по умолчанию, то может передать пустую строку.
#include
void filter_string( string &str,
string filt_elems = string("\",."))
{
string::size_type pos = 0;
while (( pos = str.find_first_of( filt_elems, pos ))
!= string::npos )
str.erase( pos, 1 );
}
Более общая версия filter_string() принимает пару итераторов, обозначающих диапазон, где производится фильтрация:
template
void filter_string( InputIterator first, InputIterator last,
string filt_elems = string("\",."))
{
for ( ; first != last; first++ )
{
string::size_type pos = 0;
while (( pos = (*first).find_first_of( filt_elems, pos ))
!= string::npos )
(*first).erase( pos, 1 );
}
}
С использованием этой функции программа будет выглядеть так:
#include
#include
#include
#include
#include
bool length_less( string s1, string s2 )
{ return s1.size() < s2.size(); }
int main()
{
istream_iterator< string > input( cin ), eos;
vector< string > text;
// copy - это обобщенный алгоритм
copy( input, eos, back_inserter( text ));
string filt_elems( "\",.;:");
filter_string( text.begin(), text.end(), filt_elems );
int cnt = text.size();
// max_element - это обобщенный алгоритм
string *max = max_element( text.begin(), text.end(),
length_less );
int len = max->size();
cout << "Число прочитанных слов "
<< cnt << endl;
cout << "Длина самого длинного слова "
<< len << endl;
cout << "Самое длинное слово "
<< *max << endl;
}
Когда мы применили в алгоритме max_element() стандартный оператор “меньше”, определенный в классе string, то были удивлены полученным результатом:
Число прочитанных слов 65
Длина самого длинного слова 4
Самое длинное слово wind
Очевидно, что wind – это не самое длинное слово. Оказывается, оператор “меньше” в классе string сравнивает строки не по длине, а в лексикографическом порядке. И в этом смысле wind – действительно максимальный элемент. Для того чтобы найти слово максимальной длины, мы должны заменить оператор “меньше” предикатом length_less(). Тогда результат будет таким:
Число прочитанных слов 65
Длина самого длинного слова 9
Самое длинное слово beautiful
Упражнение 20.2
Прочитайте из стандартного ввода последовательность данных таких типов: string, double, string, int, string. Каждый раз проверяйте, не было ли ошибки чтения.
Упражнение 20.3
Прочитайте из стандартного ввода заранее неизвестное число строк. Поместите их в список. Найдите самую длинную и самую короткую строку.
20.3. Дополнительные операторы ввода/вывода
Иногда необходимо прочитать из входного потока последовательность не интерпретируемых байтов, а типов данных, таких, как char, int, string и т.д. Функция-член get() класса istream читает по одному байту, а функция getline() читает строку, завершающуюся либо символом перехода на новую строку, либо каким-то иным символом, определяемым пользователем. У функции-члена get() есть три формы:
get(char& ch) читает из входного потока один символ (в том числе и пустой) и помещает его в ch. Она возвращает объект iostream, для которого была вызвана. Например, следующая программа собирает статистику о входном потоке, а затем копирует входной поток в выходной:
#include
int main()
{
char ch;
int tab_cnt = 0, nl_cnt = 0, space_cnt = 0,
period_cnt = 0, comma_cnt = 0;
while ( cin.get(ch)) {
switch( ch ) {
case ' ': space_cnt++; break;
case '\t': tab_cnt++; break;
case '\n': nl_cnt++; break;
case '.': period_cnt++; break;
case ',': comma_cnt++; break;
}
cout.put(ch);
}
cout << "\nнаша статистика:\n\t"
<< "пробелов: " << space_cnt << '\t'
<< "символов новой строки: " << nl_cnt << '\t'
<< "табуляций: " << tab_cnt << "\n\t"
<< "точек: " << period_cnt << '\t'
<< "запятых: " << comma_cnt << endl;
}
Функция-член put() класса ostream дает альтернативный метод вывода символа в выходной поток: put() принимает аргумент типа char и возвращает объект класса ostream, для которого была вызвана.
После компиляции и запуска программа печатает следующий результат:
Alice Emma has long flowing red hair. Her Daddy says
when the wind blows through her hair, it looks almost alive,
like a fiery bird in flight. A beautiful fiery bird, he tells her,
magical but untamed. "Daddy, shush, there is no such creature,"
she tells him, at the same time wanting him to tell her more.
Shyly, she asks, "I mean, Daddy, is there?"
наша статистика:
пробелов: 59 символов новой строки: 6 табуляций: 0
точек: 4 запятых: 12
вторая форма get() также читает из входного потока по одному символу, но возвращает не поток istream, а значение прочитанного символа. Тип возвращаемого значения равен int, а не char, поскольку необходимо возвращать еще и признак конца файла, который обычно равен -1, чтобы отличаться от кодов реальных символов. Для проверки на конец файла мы сравниваем полученное значение с константой EOF, определенной в заголовочном файле iostream. Переменная, в которой сохраняется значение, возвращенное get(), должна быть объявлена как int, чтобы в ней можно было представить не только код любого символа, но и EOF:
#include
int main()
{
int ch;
// альтернатива:
// while ( ch = cin.get() && ch != EOF )
while (( ch = cin.get()) != EOF )
cout.put( ch );
return 0;
}
При использовании любой из этих форм get() для чтения данной последовательности нужно семь итераций:
a b c
d