Реферат: Побудова алгоритму LA-аналізу

Название: Побудова алгоритму LA-аналізу
Раздел: Рефераты по астрономии
Тип: реферат

Реферат на тему:

Побудова алгоритму LA(1)-аналізу

1. Правила побудови

Нехай G =(X , N , P , S ) – LA(1)-граматика без e -правил, можливо, розширена. Опишемо побудову програми синтаксичного аналізу слів мови L (G ). Програма буде містити процедури, іменами яких є відповідні їм нетермінали граматики.

Процедура, відповідна нетерміналу A , описує аналіз ланцюжків, вивідних із A . Цими ланцюжками є слова мови або їхні підслова. Алгоритм процедури такий. Нехай A ® w ₁ |…|w_k – усі продукції з нетерміналом A ліворуч, a ₁ a ₂ …a_n – ланцюжок, початок якого треба виводити з A . Спочатку визначається, якій із множин first(w ₁ ), … , first(w_k ) належить символ a ₁ . Нехай нею буде first(w ₁ ), і в найпростішому випадку w ₁ =Y ₁ Y ₂ …Y_m , де Y_i – термінал або нетермінал. Початок ланцюжка має виводитися з Y ₁ .

Якщо Y ₁ – термінал, то перевіряється рівність a ₁ =Y ₁ .

Якщо Y ₁ – нетермінал, то з a ₁ починається частина слова, вивідна з Y ₁ , і для аналізу початку ланцюжка a ₁ a ₂ … викликається процедура Y ₁ .

В обох випадках, після перевірки рівності або повернення з виклику Y ₁ , за деякого j ³ 2 початок непроаналізованої частини ланцюжка a_j a_j ₊₁ … повинен виводитися з Y ₂ тощо. Перший символ непроаналізованої частини ланцюжка називатимемо поточним .

Отже, за правими частинами w_i продукцій будуються фрагменти процедури A ; вони виконуються, коли поточний символ ланцюжка міститься у відповідній множині first ( w_i ).

Зробимо уточнення програми та правил побудови процедур. Нехай w – слово, що аналізується, ch – його поточний символ, функція getc задає добування наступного символу слова, змінна finch позначає спеціальний символ, що повертається функцією getc після закінчення слова w . Нехай ok – бульова змінна, що є ознакою належності w Î L (G ), а процедура error задає присвоювання ok:=false . Тілом програми є

begin

ok := true ;

ch := getc;

S; { виклик процедури, відповідної }

{ головному нетерміналу }

writeln ( (ch = finch) and ok )

end .

Нехай A є нетерміналом із продукціями A ® w ₁ |…|w_k , а S ₁ ,…, S_k позначають множини first(w ₁ ),…,first(w_k ), які не перетинаються. За таких умов тілом процедури A є складений оператор

begin

if ch in S₁ then оператор-для-w₁ else

…

if ch in S_k then оператор-для-w_k else

error

end

Зокрема, якщо S_i містить лише один символ x , то замість умови chin S_i можна записати ch = x .

Праві частини розширених граматик є виразами, складеними з послідовностей символів алфавіту X і метасимволів, якими є дужки (), [], {} та символи |. Розглянемо праву частину v розширеного правила як послідовність виразів Y ₁ … Y_k , в якій Y_i є або символом з X È N , або виразом вигляду (u ), [u ], чи {u }, що не міститься всередині інших дужок, де u – послідовність нетерміналів, терміналів и дужок. За правою частиною v будується складений оператор із послідовністю операторів, відповідних до Y ₁ ,…,Y_k . Нехай Y позначає один із виразів Y ₁ ,…,Y_k . Відповідний оператор визначається виглядом Y за наступними правилами.

· Якщо Y є першим терміналом Y ₁ , то оператором є

ch:=getc.

· Якщо Y є терміналом, але не першим у ланцюжку v , то оператор має вигляд

if ch = Y then ch:=getc else error,

тобто треба перевірити збігання поточного символу з Y та перейти до наступного символу.

· Якщо Y є нетерміналом, то оператором є виклик процедури

· Якщо Y має вигляд (u ₁ |…|u_m ) і T_i позначає first(u_i ) при i =1,…,m , то треба визначити, до якої з множин T_i належить поточний символ, і виконати оператор, відповідний до u_i :

if ch in T ₁ then оператор-для-u₁ else

…

if ch in T_m then оператор-для-u_m else

error.

· Якщо Y має вигляд [u ], T =first(u ), то за виконання умови chÎ T треба виконати оператор, відповідний до u :

if ch in T then оператор-для-u .

· Якщо Y має вигляд {u }, T =first(u ), то за виконання умови chÎ T треба повторювати виконання оператора, відповідного до u :

while ch in T do оператор-для-u .

Зокрема, коли ланцюжок u починається терміналом, тобто u =xu ₁ , де x Î X , то цикл має вигляд

while ch = x do

begin

ch := getc;

оператор-для-u₁

end .

Оператори, відповідні до u , u ₁ , … , u_m , записуються за цими ж правилами.

2. Побудова аналізатора арифметичних виразів

Розширена LA(1)-граматика G ₀₁ із продукціями E ® T {+T }, T ® F {*F }, F ® (E )|a породжує мову арифметичних виразів. Згідно з наведеними правилами запишемо процедури E, T, F:

procedure E;

begin

while ch = '+' do

begin ch := getc; T end

end ;

procedure T;

begin

while ch = '*' do

begin ch := getc; F end

end ;

procedure F;

begin

if ch = '(' then

begin

ch := getc; E;

if ch = ')' then ch := getc

else error

end

else

if ch = 'a' then ch := getc

else error

end

Побудовані процедури взаємно рекурсивні : тіло E містить виклики процедури T, тіло T – виклики F, а тіло F – виклики E. У мові Паскаль кожне ім'я повинно бути означеним вище від його вживання, тому незрозуміло, в якій послідовності треба записати процедури E, T, F. У таких випадках використовують конструкцію forward .

Якщо в програмі є взаємно рекурсивні підпрограми, то за правилами мови Паскаль спочатку в блоці охоплюючої їх програми (підпрограми) записуються лише заголовки кількох із них (зокрема, однієї), а замість їх блоків пишеться слово forward , тобто, "попереду". Решту підпрограм розміщують так, щоб вони містили виклики підпрограм, чиї заголовки (разом із блоком чи словом forward ) уже записано вище. Підпрограми, записані спочатку без блоку, розміщаються в кінці зі скороченим заголовком вигляду

procedure <ім'я>; або function <ім'я>.

Список параметрів, дужки й тип функції в скороченому заголовку відсутні . У даному прикладі процедури E, T, F не мають параметрів, тому скорочені заголовки не відрізняються від повних.

Запишемо програму аналізу арифметичних виразів, вважаючи, що вираз набирається на клавіатурі, а читання його символів задається процедурою getc із модуля Inbuf (розділ 20):

program Aexan ( input, output );

uses Inbuf;

var ch : char;

ok : boolean;

procedure error;

begin ok := false; ch := finch end ;

procedure E; { тут повний заголовок }

forward ;

procedure F;

… E … { виклик процедури E }

end ;

procedure T;

… F … { виклик процедури F }

end ;

procedure E; { тут скорочений заголовок }

… T … { виклик процедури T }

end ;

begin

ok := true ; ch := getc;

E; { виклик процедури, відповідної до }

{ головного нетермінала }

writeln ( (ch = finch) and ok )

end .

Як бачимо, всі виклики посилаються на процедури, чиї імена вже означено раніше.

Уживання взаємно рекурсивних підпрограм інколи називається непрямою рекурсією .