Массивы

B.I.Березін,С.Б.Березін(С.83) МАСИВИ І ПОКАЖЧИКИ

Раніше ми ввели типи даних в мові С, які називаються іноді базовими або

вбудованими. На основі цих типів даних мова С дозволяє будувати інші типи

даних і структури даних. Масив - один з найбільш простих і відомих структур

даних. Під масивом в мові С розуміють набір даних одного і того ж типу,

зібраних під одним ім'ям. Кожний елемент масиву визначається ім'ям масиву і

порядковим номером елемента, який називається індексом. Індекс в мові С

завжди ціле число.

ОГОЛОШЕННЯ МАСИВУ В ПРОГРАМІ

Основна форма оголошення масиву розмірності N така:

тип [размер1][размер2]...[размерН]

Частіше за все використовуються одновимірні масиви:

тип [розмір] ;

тип - базовий тип елементів масиву, розмір - кількість елементів

одновимірного масиву.

При описі двовимірного масиву оголошення має наступний вигляд:

тип [размері][размер2];

У цьому описі можна трактувати оголошення двовимірного масиву як

оголошення масиву масивів, т. е. масив розміру [размер2], елементами якого

є одновимірні масиви [размер1].

Розмір масиву в мові С може задаватися константою або константним

виразом. Не можна задати масив змінного розміру. Для цього існує окремий

механізм, званий динамічним виділенням пам'яті.

ОДНОВИМІРНІ МАСИВИ

У мові С індекс завжди починається з нуля. Коли ми говоримо про перший

елемент масиву, то маємо на увазі елемент з індексом 0. Еслі ми оголосили

масив

int a[100] ;

це означає, що масив містить 100 елементів від а[0] до а[99]. Для

одновимірного масиву легко підрахувати, скільки байт в пам'яті буде займати

цей масив:

кільк.байтів=*.

У мові С під масив завжди виділяється безперервне місце в оперативній

пам'яті.

У мові С не перевіряється вихід індексу за межі масиву. Якщо масив

а[100] описаний як цілочисельний масив, що має 100 елементів, а ви в

програмі вкажете а[200], то повідомлення про помилку не буде видане, а як

значення елемента а[200] буде видано деяке число, що займає відповідні 2

байти. Можна визначити масив будь-якого визначеного раніше типу, наприклад

unsigned arr[40], long double al[1000], char ch[80].

|/*поміняти місцями max з min*/ |// Сортування і програвання масиву |

|#include main() |#include #include |

|{ int i,j,a[10], max. nmax, min, |#'\ nclude void main() { int |

|nmin, temp; clrscr(); for (i=0; imax) { max=a[i]; nmax=i;} |(a[i]>a[j]) { temp=a[i]; a[i]=a[j]; |

|else if(a[i] void main () main () ввели: Hello! Good I uck! Резул ьтат: Hello! ввели: Hello! Good luck! |

|Good |Результат: Hello! Good luck!|

Виведення виробляється функціями printf() або puts(). Обидві функції

виводять вміст масиву до першого нульового байта. Функція puts() додає в

кінці рядка, що виводиться символ нового рядка. У функції printf()

перехід на новий рядок треба передбачати в рядку формату самим.

ФУНКЦІЇ ДЛЯ РОБОТИ З РЯДКАМИ

Для роботи з рядками існує спеціальна бібліотека, опис якої

знаходиться в файлі string.h. Найчастіше використовуються функції

strcpyO, strcat(), strlenQ, strcmpO.

Виклик функції strcpy() має вигляд

strcpy(si, s2) ;

Функція strcpy() використовується для копіювання вмісту рядка s2 в

рядок s1. Масив s1 повинен бути досить великим, щоб в нього вмістився

рядок s2. Якщо місця мало, компілятор не видає вказівки на помилку або

попередження; це не перерве виконання програми, але може привести до

псування інших даних або самої програми і неправильній роботі програми

надалі. Виклик функції strcat() має вигляд

strcat(sl, s2) ;

Функція strcat() приєднує рядок s2 до рядка s1 і вміщує його в масив, де

знаходився рядок s1, при цьому рядок s2 не змінюється. Нульовий байт,

який завершував рядок s1, буде замінений першим символом рядка s2. їв

функції strcpyO, і в функції strcat() рядок, що виходить, автоматично

завершується нульовим байтом.

Розглянемо простий приклад використання цих функцій.

Резул ьтат:

Hello, World!

Hello, World! World!

#include

#і ncl ude

main () {

char s1[20], s2[20];

strcpy(s1 , "Hello, ");

strcpy(s2, "World!");

puts(s1);

puts(s2);

strcat(s1, s2);

puts(s1);

puts(s2);

}

Виклик функції strcmpO має вигляд

strcmp(sl, s2);

Функція strcmpO порівнює рядки si і s2 і повертає значення О, якщо рядки

однакові, тобто містять одне і те ж число однакових символів. Під

порівнянням рядків ми розуміємо порівняння в лексикографічному значенні,

так як це відбувається, наприклад, в словнику. Звичайно, в функції

відбувається посимвольне порівняння кодів символів. Код першого символа

одного рядка порівнюється з кодом символа другого рядка. Якщо вони

однакові, розглядаються другі символи тощо. Якщо зі лексикографічно (в

значенні словника) більше s2, то функція strcmpO повертає додатне значення,

якщо менше -від'ємне значення.

Виклик функції strlen() має вигляд

strlen(s) ;

Функція strlen() повертає довжину рядка з, при цьому завершальний

нульовий байт не враховується. Виклик length("Hello") поверне

значення 5.

Розглянемо застосування цієї функції для обчислення довжини рядка, що

вводиться з клавіатури.

#include

#incl ude m а і n () { char s(80], printf( "Введіть

рядок:");

gets(s);

printf( "Рядок\п%з\п має довжину %d символів \n", s, strlen(s)); }

ДВОВИМІРНІ МАСИВИ

Як ми вже зазначали, мова С допускає багатовимірні масиви, найпростішою

формою яких е двовимірний масив (two-dimentional array). Можна сказати, що

двовимірний масив - це масив одновимірних масивів .

Двовимірний масив int a[3][4] можна подати у вигляді таблички:

Другий індекс

Перший індекс

|а[0] [0] |а[0][1] |а[0][2] |а[0] [3] |

|а[1] [0] |а[1][1] |а[1][2] |а[1][3] |

|а[2][0] |а[2] [1] |а[2][2] |а[2] [3] |

Перший індекс - номер рядка, другий індекс - номер стовпця. Кількість байт

пам'яті, яке необхідне для зберігання масиву, обчислюється по формулі

Кільк.байтів = **.

У пам'яті комп'ютера масив розташовується безперервно по рядках, тобто

а[0][0], а[0][1], а[0][2], а[0][3], а[1][0], а[1][1], а[1] [2], а[2] [1],.

... а[2] [3] .

Потрібно пам'ятати, що пам'ять для всіх масивів, які визначені як

глобальні, відводиться в процесі компіляції і зберігається весь час, поки

працює програма.

Часто двовимірні масиви використовуються для роботи з таблицями, що містять

текстову інформацію. Також дуже часто використовуються масиви рядків.

ІНІЦІАЛІЗАЦІЯ МАСИВІВ

Дуже важливо уміти ініціалізувати масиви, тобто привласнювати елементам

масиву деякі початкові значення. У мові С для цього є спеціальні

можливості. Самий простий спосіб ініціалізації наступний: в процесі

оголошення масиву можна указати в фігурних дужках список ініціалізаторів:

float а[6]={1.1, 2.2, 3.3, 4.0, 5, 6};

В іншому випадку така форма запису еквівалентна набору операторів:

а[0]=1.1; а[1]=2.2; ... а [5] =6.

Багатовимірні масиви, в тому числі і двовимірні масиви, можна

ініціалізувати, розглядаючи іх як масив масивів.

Ініціалізації int а[3][5]={1,2,3,4,5,6,7,8,9,10,11,12,13,14,15};

і int а[3][5]={{1,2,3,4,5}, {6,7,8,9,10}, {11,12,13,14,15}};

еквівалентні.

Кількість ініціалізаторів не зобов'язана співпадати з кількістю

елементів масиву. Якщо ініціалізаторів менше, то значення решти

елементів масиву не визначені.

У той же час ініціалізації

int а[3][5]={1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11);

int а[3][5]={{1, 2, 3}, {4, 5, 6, 7, 8}, {9, 10, 11}};

різні.

//change strings: 1-6, 2-5, 3-4

#i nclude

void mai n()

{ int temp, i, j, a[6][4]={1,2,3,4,

5,6,7,8,

9,10,11,12,

1 3,14,1 5,16,

17,18,19,20,

21 ,22,23,24};

for (i=0;i;

У цьому оголошенні тип - деякий тип мови С, визначальний тип об'єкта,

на який вказує покажчик (адреса якого містить); * - означає, що наступна за

нею змінна є покажчиком.

ОПЕРАЦІЇ НАД ПОКАЖЧИКАМИ

З покажчиками пов'язані дві спеціальні операції.: & і *. Обидві ці

операції є унарними, т. е. мають один операнд, перед якими вони ставляться.

Операція & відповідає операції "взяти адресу". Операція * відповідає

словам "значення, розташоване за вказаною адресою" .

Особливість мови С полягає в тому, що знак * відповідає двом операціям,

що не мають один до одного ніякого відношення: арифметичній операції

множення і операції взяти значення. У той же час сплутати їх в контексті

програми не можливо, оскільки одна з операцій унарна (містить один

операнд), інша - множення - бінарна (містить два операнди). Унарні

операції & і * мають найвищий пріоритет нарівні з унарним мінусом.

В оголошенні змінної, що є покажчиком, дуже важливий базовий тип. Якщо

покажчик має базовий тип int, то змінна займає 2 байти, char - 1 байт тощо.

Приклад.

int а=3, Ь=5;

int *р;

р = &а; /* тепер р вказує на а*/ Ь = *р; /* b тепер

дорівнює З*/ *р= 0; /*а тепер дорівнює О*/

&*а => а - розадресація.

Унарні оператори * і & мають більш високий пріоритет, ніж арифметичні

оператори:

b = *р + 1 (взяти те, на що вказує р, додати до нього 1, а результат

привласнити змінній b.

До покажчиків можна застосувати операцію привласнення. Покажчики одного і

того ж типу можуть використовуватися в операції привласнення, як і будь-які

інші змінні. Розглянемо приклад. #include void mai n() { int x=

1 0;

int *p, *g;

p=&x;

g=p;

printf("%p", р); /* друк вмісту р */

printf("%p",g); /* друк вмісту g */

р г і n t f (" % d % d ", x, * g); / * друк величини хі величини за

адресою g*/

} Результат: FFF4 FFF4 10 10

У цьому прикладі приведена ще одна специфікація формату функції

printf() - %р. Цей формат використовується для друку адреси пам'яті в

шістнадцятковій формі.

Не можна створити змінну типу void, але можна створити покажчик на тип

void. Покажчику на void можна привласнити покажчик будь-якого іншого типу.

Однак при зворотному привласненні необхідно використати явне перетворення

покажчика на void/void *pv;

float f, *pf;

pf=&f;

pv=pf;

pp=(fioat*) pv;

У мові С допустимо привласнити покажчику будь-яку адресу пам'яті.

Однак, якщо оголошений покажчик на ціле

int *р;

а за адресою, яка привласнена даному покажчику, знаходиться змінна х типу

float, то при компіляції програми буде видане повідомлення про помилку в

рядку

р=&х;

Цю помилку можна виправити, перетворювавши покажчик на int до типу

покажчика на float явним перетворенням типу:

p=(int*)&x;

Але при цьому втрачається інформація про те, на який тип вказував

початковий покажчик.

Як і над іншими типами змінних, над покажчиками можна виробляти

арифметичні операції: складання і віднімання (операції ++ і є окремими

випадками операцій складання і віднімання). Арифметичні

дії над покажчиками мають свої особливості. Виконаємо найпростішу

програму

#include void main() { і n t x= 1 0;

int *p, *g;

p=&x;

g=p;

printf("%p", p); /* друк вмісту p */ printf("%p", p++); /* друк вмісту g

*/ } Результат: FFF4 FFF6

Після виконання цієї програми ми побачимо, що при операції ++1

значення покажчика р збільшилося не на 1, а на 2. І це правильне, оскільки

нове значення покажчика повинно вказувати не на наступну адресу пам'яті, а

на адресу наступного цілого. А ціле, як ми пам'ятаємо, займає 2 байти. Якби

базовий тип покажчика був не int, a double, то були б надруковані адреси,

відмінні на 8 (Результат:

FFEE FFF6), саме стільки байт пам'яті займає змінна типу double, тобто при

кожній операції ++р значення покажчика буде збільшуватися на кількість

байт, що займаються змінної базового типу покажчика .

Операції над покажчиками не обмежуються тільки операціями ++ і

--. До покажчиків можна додавати деяке ціле або відняти ціле. int *p=2000;

float *p=2000;

Р=Р+3; р=р+10;

Результат: р=2006 Результат: р=2040

Загальна формула для обчислення значення покажчика після виконання

операції р=р+п; буде мати вигляд

=+п*

Можна також відняти один покажчик з іншого. Так, якщо р і pi

-покажчики на елементи одного і того ж масиву, то операція р-рі дає такий

же результат, як і віднімання індексів відповідних елементів масиву.

Інші арифметичні операції над покажчиками заборонені, наприклад не

можна скласти два покажчики, помножити покажчик на число і т.д.

|#include void rnai n() #incl ude void main() int *p, *g, x; p=&x; Результат: p=07DO p+5=07EO g=07DO Результат: Error UKAZAT2.CPP |

|p-g=0008 |14: Invalid pointer addition |

Покажчики можна порівнювати. Застосовні всі 6 операцій:

, =, =, == і !=.

Порівняння р < g означає, що адреса, що знаходиться в р, менше адреси,

що знаходиться в g.

Якщо рід вказують на елементи одного масиву, то індекс елемента, на

який вказує р, менше індексу масиву, на який вказує g.

ЗВ'ЯЗОК ПОКАЖЧИКІВ І МАСИВІВ

Будь-який доступ до елемента масиву за допомогою операції

індексування може бути виконаний за допомогою покажчика (що в загальному

випадку працює швидше).

Декларація

int a[10]

визначає масив а розміру 10:

[pic]

Запис а[і] посилає нас до і-му елемента масиву. int *р;

р=&а[0]; /* р вказує на нульовий елемент а або містить адресу елемента а[0]

[pic]

х = *р; => х = а[0], У= *(Р+1); => У = а[1];

Значення змінної типу масив (ім'я масиву) є адреса

нульового елемента масиву.

р = &а[0]; => р = а;

*(а+і) ^ а[і] &а[і] => а+і

Результат буде один і той же. Перевага використання другого варіанту

полягає в тому, що арифметичні операції над покажчиками виконуються швидше,

якщо ми працюємо з підряд йдучими елементами масиву. Якщо ж вибір елементів

масиву випадковий, то швидше і більш наочна робота з індексами.

Між ім'ям масиву і покажчиком,-виступаючим в ролі імені масиву, існує

одна відмінність. Покажчик змінна, тому можна написати р = а або р++. Але

ім'я масиву не є змінною, і записи типу а = р або а++ не допускаються.

Дуже часто доводиться працювати над обробкою текстів, т. е. з масивами

рядків. Як ми пам'ятаємо, в мові С рядок - це масив символів, що

закінчується нульовим байтом. Розглянемо дві програми, що реалізовують

практично, одні і ті ж дії.

#incl ude

#include

void main()

{ char *p, str[]="String From Letters in Different Registers";

/* Рядок, що Складається з Букв в Різних Регістрах; */ int і=0; printf(

"Рядок Буде Надрукований Заголовними Буквами");

while (str[i]) printf("%c", toupper(str[i++]));

p=str; printf(" Рядок Буде Надрукований Малими Буквами");

while (*p) printf("%c", tolower(*p++)); }

Якщо в цих прикладах замінити рядок на англійській мові на рядок,

набраний російськими буквами, то ніякого перетворення букв в рядкові або,

навпаки, в прописні не станеться. Це пов'язано з тим, що стандартні функції

toupper() і tolower () аналізують значення

0 аргументу і повертають те ж саме значення, якщо він не є відповідно малою

або великою буквою латинського алфавіту. Якщо ж аргумент є малою буквою

латинського алфавіту, то значенням функції toupper() буде відповідна

велика буква (точніше, код цієї букви). Функція tolower () змінює код лише

великих букв латинського алфавіту. Прототипи цих функцій знаходяться в

заголовному файлі ctype.h.

МАСИВИ ПОКАЖЧИКІВ

Покажчики, як і змінні будь-якого іншого типу, можуть об'єднуватися в

масиви. Оголошення масиву покажчиків на 10 цілих чисел має вигляд int

*x[10] ;

Кожному з елементів масиву можна привласнити адресу; наприклад, третьому

елементу привласнимо адресу цілої змінної у:

х[2]=&у;

щоб знайти значення змінною у, можна написати *х(2].

Наведемо приклад використання масиву покажчиків. Частіше за все це

буває зручно при обробці масиву рядків.

/* you must run. exe-file to watch the rezult of this program. Перегляд

файлів в поточному каталозі з одним з шести розширень */

#include

#include ^include

#include

main()

{char ch, s[80], *ext[]={"exe", "corn", "cpp", "c", "pas", "*"};

clrscr();

for(;;) {do { printf( "Файли з розширенням:^");

printf("1. exe\n"); "printf( 2. com\n"); "printf( 3. cpp\n"); "pnntf( 4.

з \ n ");

printf("5. pas\n"); printf("6. *\n"); //any extension printf("7.

quit\n");

printf("BauJ вибір(1-7):)( \n");

ch=getche();

printf("\n");

} while (ch'7');

if (ch=='7') break;

strcpy(s, "dir *."); strcat(s, ext[ch-'0'-1 ]); strcat(s, "/p");

system(s);} }

Тут функція system() - бібліотечна функція, яка примушує операційну

систему DOS виконати команду, що є аргументом цієї функції.

Взагалі рядкова константа в мові С асоціюється з адресою початку рядка в

пам'яті, тип рядка виходить char* (покажчик на тип char). Тому можливо і

активно використовується наступне привласнення:

char *pc;

"рс = Hello, World!";

У мові С можлива також ситуація, коли покажчик вказує на покажчик. У

цьому випадку опис буде мати наступний вигляд:

int -*'*point;

[pic]

point має тип покажчик на покажчик на int. Відповідно, щоб набути

цілочисельного значення змінною, на яку указьіваеі point, треба у

вираженні використати **point.;

Приклад використання:

^include

void m а і n()

{ int i, pi, ppi;

і =7; pi=&i;

p p i = & p i;

printf( "i = %d pi = %p ppi = %p \n", i, pi, ppi);

*pi++;

printf( "i = %d pi = %p ppi = %p \n", i, pi, ppi);

**ppi = 12;

printf( "i = %d pi = %p ppi = %p \n", i, pi, ppi);

}

ІНІЦІАЛІЗАЦІЯ ПОКАЖЧИКІВ

Після того як покажчик був оголошений, але до того, як йому було

привласнене якесь значення, покажчик містить невідоме значення. Спроба

використати покажчик до привласнення йому якогось значення є неприємною

помилкою, оскільки вона може порушити роботу не

тільки вашої програми, але і операційної системи. Навіть якщо цього не

сталося, результат роботи програми буде неправильним і знайти цю помилку

буде досить складно.

Вважають, що покажчик, який вказує в "нікуди", повинен мати значення

null, однак і це не робить його "безпечним". Після того, як він попаде в

праву або ліву частину оператора привласнення, він знову може стати

"небезпечним".

З іншого боку нульовий покажчик можна використати, наприклад, для

позначення кінця масиву покажчиків.

Якщо була спроба привласнити яке-небудь значення тому, на що вказує

покажчик з нульовим значенням, система видає попередження, що з'являється

під час роботи програми (або після закінчення роботи програми) "Null

pointer assignment". Поява цього повідомлення є мотивом для пошуку

використання неініціалізувати покажчика в програмі.