<< Пред.           стр. 53 (из 121)           След. >>

Список литературы по разделу

 with your alice alive blows daddy falls fiery
 lands leave looks quite rises shush shyly sight
 still stone tells there thing trees watch almost
 either flight houses night, ancient becomes bounded calling
 distant flowing heaven, magical passion through unravel untamed
 wanting darkened eternity beautiful darkening immensity journeying alternately
 immeasurable inexpressibly
 
 Подсчитать число слов, длина которых больше шести символов, можно с помощью обобщенного алгоритма count_if() и еще одного объекта-функции – GreaterThan. Этот объект чуть сложнее, так как позволяет пользователю задать размер, с которым производится сравнение. Мы сохраняем размер в члене класса и инициализируем его с помощью конструктора (по умолчанию – значением 6):
 #include
 
 class GreaterThan {
 public:
  GreaterThan( int size = 6 ) : _size( size ){}
  int size() { return _size; }
 
  bool operator()( const string & s1 )
  { return s1.size() > 6; }
 
 private:
  int _size;
 };
 Использовать его можно так:
 void process_vocab( vector *pvec )
 {
  // ...
  // подсчитать число строк, длина которых больше 6
 
  int cnt = count_if( texts.begin(), texts.end(),
  GreaterThan() );
 
  cout << "Number of words greater than length six are "
  << cnt << endl;
 
  // ...
 }
 Этот фрагмент программы выводит такую строку:
 
 Number of words greater than length six are 22
 
 Алгоритм remove() ведет себя аналогично unique(): он тоже не изменяет размер контейнера, а просто разделяет элементы на те, что следует оставить (копируя их по очереди в начало контейнера), и те, что следует удалить (перемещая их в конец контейнера). Вот как можно воспользоваться им для исключения из коллекции слов, которые мы не хотим сохранять:
 void process_vocab( vector *pvec )
 {
  // ...
  static string rw[] = { "and", "if", "or", "but", "the" };
  vector< string > remove_words( rw, rw+5 );
 
  vector< string >::iterator it2 = remove_words.begin();
  for ( ; it2 != remove_words.end(); ++it2 ) {
  // просто для демонстрации другой формы count()
  int cnt = count( texts.begin(), texts.end(), *it2 );
  cout << cnt << " instances removed: "
  << (*it2) << endl;
 
  texts.erase(
  remove(texts.begin(),texts.end(),*it2 ),
  texts.end()
  );
  }
 
  // ...
 }
 Результат применения remove():
 
 1 instances removed: and
 0 instances removed: if
 0 instances removed: or
 1 instances removed: but
 1 instances removed: the
 
 Теперь нам нужно распечатать содержимое вектора. Можно обойти все элементы и вывести каждый по очереди, но, поскольку при этом обобщенные алгоритмы не используются, мы считаем такое решение неподходящим. Вместо этого проиллюстрируем работу алгоритма for_each() для вывода всех элементов вектора. for_each() применяет указатель на функцию или объект-функцию к каждому элементу контейнера из диапазона, ограниченного парой итераторов. В нашем случае объект-функция PrintElem копирует один элемент в стандартный вывод:
 class PrintElem {
 public:
  PrintElem( int lineLen = 8 )
  : _line_length( lineLen ), _cnt( 0 )
  {}
 
  void operator()( const string &elem )
  {
  ++_cnt;
  if ( _cnt % _line_length == 0 )
  { cout << '\n'; }
 
  cout << elem << " ";
  }
 
 private:
  int _line_length;
  int _cnt;
 };
 void process_vocab( vector *pvec )
 {
  // ...
 
  for_each( texts.begin(), texts.end(), PrintElem() );
 }
 Вот и все. Мы получили законченную программу, для чего пришлось лишь последовательно записать обращения к нескольким обобщенным алгоритмам. Для удобства мы приводим ниже полный листинг вместе с функцией main() для ее тестирования (здесь используются специальные типы итераторов, которые будут обсуждаться только в разделе 12.4). Мы привели текст реально исполнявшегося кода, который не полностью удовлетворяет стандарту C++. В частности, в нашем распоряжении были лишь устаревшие реализации алгоритмов count() и count_if(), которые не возвращают результат, а требуют передачи дополнительного аргумента для вычисленного значения. Кроме того, библиотека iostream отражает предшествующую принятию стандарта реализацию, в которой требуется заголовочный файл iostream.h.
 #include
 #include
 #include
 #include
 
 // предшествующий принятию стандарта синтаксис
 #include
 
 class GreaterThan {
 public:
  GreaterThan( int size = 6 ) : _size( sz ){}
  int size() { return _size; }
 
  bool operator()(const string &s1)
  { return s1.size() > _size; }
 private:
  int _size;
 };
 
 class PrintElem {
 public:
 
  PrintElem( int lineLen = 8 )
  : _line_length( lineLen ), _cnt( 0 )
  {}
 
  void operator()( const string &elem )
  {
  ++_cnt;
  if ( _cnt % _line_length == 0 )
  { cout << '\n'; }
 
  cout << elem << " ";
  }
 
 private:
  int _line_length;
  int _cnt;
 };
 class LessThan {
 public:
  bool operator()( const string & s1,
  const string & s2 )
  { return s1.size() < s2.size(); }
 };
 
 typedef vector textwords;
 void process_vocab( vector *pvec )
 {
  if ( ! pvec ) {
  // вывести предупредительное сообщение
  return;
  }
 
  vector< string, allocator > texts;
 
  vector::iterator iter;
  for ( iter = pvec->begin() ; iter != pvec->end(); ++iter )
  copy( (*iter).begin(), (*iter).end(),
  back_inserter( texts ));
 
  // отсортировать вектор texts
  sort( texts.begin(), texts.end() );
 
  // теперь посмотрим, что получилось
  for_each( texts.begin(), texts.end(), PrintElem() );
 
  cout << "\n\n"; // разделить части выведенного текста
 
  // удалить дубликаты
  vector::iterator it;
  it = unique( texts.begin(), texts.end() );
  texts.erase( it, texts.end() );
 
  // посмотрим, что осталось
  for_each( texts.begin(), texts.end(), PrintElem() );
  cout << "\n\n";
 
  // отсортировать элементы
  // stable_sort сохраняет относительный порядок равных элементов
  stable_sort( texts.begin(), texts.end(), LessThan() );
  for_each( texts.begin(), texts.end(), PrintElem() );
 
  cout << "\n\n";
 
  // подсчитать число строк, длина которых больше 6
  int cnt = 0;
 
  // устаревшая форма count - в стандарте используется другая
  count_if( texts.begin(), texts.end(), GreaterThan(), cnt );
 
  cout << "Number of words greater than length six are "
  << cnt << endl;
 
  static string rw[] = { "and", "if", "or", "but", "the" };
  vector remove_words( rw, rw+5 );
 
  vector::iterator it2 = remove_words.begin();
 
  for ( ; it2 != remove_words.end(); ++it2 )
  {
  int cnt = 0;
 
  // устаревшая форма count - в стандарте используется другая
  count( texts.begin(), texts.end(), *it2, cnt );
 
  cout << cnt << " instances removed: "
  << (*it2) << endl;
 
  texts.erase(
  remove(texts.begin(),texts.end(),*it2),
  texts.end()
  );
  }
  cout << "\n\n";
  for_each( texts.begin(), texts.end(), PrintElem() );
 }
 
 // difference_type - это тип, с помощью которого можно хранить результат
 // вычитания двух итераторов одного и того же контейнера
 // - в данном случае вектора строк ...
 // обычно это предполагается по умолчанию
 
 typedef vector::difference_type diff_type;
 
 // предшествующий принятию стандарта синтаксис для
 #include
 
 main()
 {
  vector sample;
  vector t1, t2;
  string t1fn, t2fn;
 
  // запросить у пользователя имена входных файлов ...
  // в реальной программе надо бы выполнить проверку
  cout << "text file #1: "; cin >> t1fn;
  cout << "text file #2: "; cin >> t2fn;
 
  // открыть файлы
  ifstream infile1( t1fn.c_str());
  ifstream infile2( t2fn.c_str());
 
  // специальная форма итератора
  // обычно diff_type подразумевается по умолчанию ...
  istream_iterator< string, diff_type > input_set1( infile1 ), eos;
  istream_iterator< string, diff_type > input_set2( infile2 );
 
  // специальная форма итератора
  copy( input_set1, eos, back_inserter( t1 ));
  copy( input_set2, eos, back_inserter( t2 ));
 
  sample.push_back( t1 ); sample.push_back( t2 );
  process_vocab( &sample );
 }
 Упражнение 12.2
 Длина слова – не единственная и, вероятно, не лучшая мера трудности текста. Другой возможный критерий – это длина предложения. Напишите программу, которая читает текст из файла либо со стандартного ввода, строит вектор строк для каждого предложения и передает его алгоритму count(). Выведите предложения в порядке сложности. Любопытный способ сделать это – сохранить каждое предложение как одну большую строку во втором векторе строк, а затем передать этот вектор алгоритму sort() вместе с объектом-функцией, который считает, что чем строка короче, тем она меньше. (Более подробно с описанием конкретного обобщенного алгоритма, а также с иллюстрацией его применения вы может ознакомиться в Приложении, где все алгоритмы перечислены в алфавитном порядке.)
 Упражнение 12.3
 Более надежную оценку уровня трудности текста дает анализ структурной сложности предложений. Пусть каждой запятой присваивается 1 балл, каждому двоеточию или точке с запятой – 2 балла, а каждому тире – 3 балла. Модифицируйте программу из упражнения 12.2 так, чтобы она подсчитывала сложность каждого предложения. Воспользуйтесь алгоритмом count_if() для нахождения каждого из знаков препинания в векторе предложений. Выведите предложения в порядке сложности.
 12.3. Объекты-функции
 Наша функция min() дает хороший пример как возможностей, так и ограничений механизма шаблонов:
 template
 const Type&
 min( const Type *p, int size )
 {
  Type minval = p[ 0 ];
  for ( int ix = 1; ix < size; ++ix )
  if ( p[ ix ] < minval )
  minval = p[ ix ];
  return minval;
 }
 Достоинство этого механизма – возможность определить единственный шаблон min(), который конкретизируется для бесконечного множества типов. Ограничение же заключается в том, что даже при такой конкретизации min() будет работать не со всеми.
 Это ограничение вызвано использованием оператора “меньше”: в некоторых случаях базовый тип его не поддерживает. Так, класс изображения Image может и не предоставлять реализации такого оператора, но мы об этом не знаем и пытаемся найти минимальный кадр анимации в данном массиве изображений. Однако попытка конкретизировать min() для такого массива приведет к ошибке компиляции:
 
 error: invalid types applied to the < operator: Image < Image
 (ошибка: оператор < применен к некорректным типам: Image < Image)
 
 Возможна и другая ситуация: оператор “меньше” существует, но имеет неподходящую семантику. Например, если мы хотим найти наименьшую строку, но при этом принимать во внимание только буквы, не учитывая регистр, то такой реализованный в классе оператор не даст нужного результата.
 Традиционное решение состоит в том, чтобы параметризовать оператор сравнения. В данном случае это можно сделать, объявив указатель на функцию, принимающую два аргумента и возвращающую значение типа bool:
 template < typename Type,
  bool (*Comp)(const Type&, const Type&)>
 const Type&
 min( const Type *p, int size, Comp comp )
 {
  Type minval = p[ 0 ];
  for ( int ix = 1; ix < size; ++ix )
  if ( Comp( p[ ix ] < minval ))
  minval = p[ ix ];
  return minval;
 }
 Такое решение вместе с нашей первой реализацией на основе встроенного оператора “меньше” обеспечивает универсальную поддержку для любого типа, включая и класс Image, если только мы придумаем подходящую семантику для сравнения двух изображений. Основной недостаток указателя на функцию связан с низкой эффективностью, так как косвенный вызов не дает воспользоваться преимуществами встроенных функций.
 Альтернативная стратегия параметризации заключается в применении объекта-функции вместо указателя (примеры мы видели в предыдущем разделе). Объект-функция – это класс, перегружающий оператор вызова (operator()). Такой оператор инкапсулирует семантику обычного вызова функции. Объект-функция, как правило, передается обобщенному алгоритму в качестве аргумента, хотя можно определять и независимые объекты-функции. Например, если бы был определен объект-функция AddImages, который принимает два изображения, объединяет их некоторым образом и возвращает новое изображение, то мы могли бы объявить его следующим образом:
 AddImages AI;
 Чтобы объект-функция удовлетворял нашим требованиям, мы применяем оператор вызова, предоставляя необходимые операнды в виде объектов класса Image:
 Image im1("foreground.tiff"), im2("background.tiff");
 // ...
 
 // вызывает Image AddImages::operator()(const Image1&, const Image2&);
 Image new_image = AI (im1, im2 );
 У объекта-функции есть два преимущества по сравнению с указателем на функцию. Во-первых, если перегруженный оператор вызова – это встроенная функция, то компилятор может выполнить ее подстановку, обеспечивая значительный выигрыш в производительности. Во-вторых, объект-функция способен содержать произвольное количество дополнительных данных, например кэш или информацию, полезную для выполнения текущей операции.
 Ниже приведена измененная реализация шаблона min() (отметим, что это объявление допускает также и передачу указателя на функцию, но без проверки прототипа):
 template < typename Type,
  typename Comp >

<< Пред.           стр. 53 (из 121)           След. >>

Список литературы по разделу