ВИКОРИСТАННЯ КОРПУСНОЇ ЛІНГВІСТИКИ У НАВЧАННІ АНГЛІЙСЬКОЇ МОВИ

PAGE 3

ЧНУ, Мельник Роксолана

ЗМІСТ

ВСТУП………………………………………………………………………….…4

РОЗДІЛ 1

ТЕОРЕТИЧНІ ЗАСАДИ КОРПУСНОЇ ЛІНГВІСТИКИ……………………….7

1.1Визначення корпусу текстів……………………………………………….....7

1.2Визначення корпусної лінгвістики……………………………………...…..11

1.3Використання корпусів у лінгвістиці…………………………………….…19

1.3.1 Корпус і семантика…………………………………………………….19

1.3.2 Корпус і лексикографія………………………………………………..21

1.3.3 Корпус і граматика…………………………………………………….24

Висновки до розділу 1…………………………………………………………...27

РОЗДІЛ 2

ВИКОРИСТАННЯ КОРПУСНОЇ ЛІНГВІСТИКИ У НАВЧАННІ АНГЛІЙСЬКОЇ МОВИ………………………………………………………….28

2.1. Корпусний метод навчання англійської мови…………………………….28

2.2. Учнівські корпуси текстів………………………………………………….31

2.3. Процес роботи над створенням корпусу текстів…………………………34

Висновки до розділу 2…………………………………………………………..37

ВИСНОВКИ……………………………………………………………………...38

ДОДАТКИ………………………………………………………………………..41

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ……………………………………….46

ВСТУП

Потреба міжнародного спілкування і вивчення та викладання іноземної мови – це ті питання, що залишаться актуальними ще протягом довгого часу. Нові перспективи у цій галузі відкрило застосування комп’ютерних технологій, зокрема, корпусів текстів. Але, оскільки це ще зовсім нове поняття у лінгвістиці, на даний час воно ще не достатньо досліджене і з розвитком технологій постійно оновлюється.

Наша курсова робота присвячена темі «Корпусна лінгвістика як метод дослідження у прикладній лінгвістиці».

Актуальність проведеного дослідження полягає у спробі ретельно розглянути основні проблеми створення, принципи та теоретичні засади корпусної лінгвістики.

Новизною курсової роботи є визначення особливостей корпусних текстів та застосування їх у вивченні англійської мови, як іноземної.

Метою роботи є визначення та висвітлення основних понять корпусної лінгвістики та її розбіжність з традиційною лінгвістикою, дослідження різних корпусів текстів, їх структуру та використання для навчання англійської мови.

Відповідно до мети у роботі передбачається розв’язання таких завдань:

- проаналізувати теоретичний матеріал, основи дослідження загальних положень корпусної лінгвістики;

- дати характеристику корпусної лінгвістики та її значення в сучасній лексикології;

- визначити доцільність використання корпусів текстів у вивченні англійської мови.

Об’єктом дослідження в роботі виступає теоретична характеристика корпусної лінгвістики в англійській мові; створення перших корпусів текстів, які стануть автентичним джерелом для подальших наукових досліджень сучасної української мови, англійської мови як іноземної, спеціалізованого наукового мовлення.

Предметом дослідження виступає процес роботи над створенням корпусу текстів.

Матеріалом дослідження послужили наукові розвідники та статті з корпусної лінгвістики, що містять в собі теоретичну інформацію необхідну для розкриття теми нашої курсової роботи, а також матеріали наукових конференцій, підручники, словники та Інтернет джерела.

В процесі роботи було застосовано такі методи:

- структурний, який дав змогу проаналізувати структуру термінів корпусної лінгвістики;

- порівняльний – для встановлення відмінності та спільних елементів з іншими лінгвістичними науками;

- узагальнення – визначення загального поняття, в якому знаходить віддзеркалення головне, основне;

- аналіз – для розуміння сутності корпусної лінгвістики, було проаналізовано її основні складові та характеристики;

- класифікація – поділ корпусів текстів за певними ознаками.

Теоретичне значення курсової роботи полягає в тому, що матеріали та результати досліджень багатьох вчених в галузі термінології було узагальнено і це дало змогу розширити теоретичну базу знань про корпусну лінгвістику.

Практична цінність роботи полягає у можливості використання результатів роботи у викладанні таких дисциплін як лексикологія, історія англійської мови, власне лінгвістика, граматика та предметах, які пов’язані з вивченням та аналізом текстів, також у загальних та контрактивних лінгвістичних дослідженнях, дослідженнях з методики викладання мови, лексикографії та термінознавства.

Структура дослідження визначається його метою та завданням. Робота складається зі вступу, двох розділів, висновків, списку використаної літератури та додатків. У вступі обґрунтовується вибір теми дослідження та його актуальність, визначається мета, завдання методологічна база дослідження, а також його новизна, теоретичне і практичне значення.

У першому розділі «Теоретичні засади корпусної лінгвістики» розглядаються загальні питання: визначення корпусу текстів, визначення корпусної лінгвістики, використання корпусів у лінгвістиці: корпус і стилістика, корпус і семантика, корпус і лексикографія, корпус і граматика

У другому розділі «Використання корпусної лінгвістики у навчанні англійської мови» розглядаються питання: . корпусний метод навчання англійської мови, учнівські корпуси текстів, процес роботи над створенням корпусу текстів.

У висновках узагальнюються результати дослідження. До роботи додається список використаних джерел та додатки.

РОЗДІЛ 1

ТЕОРЕТИЧНІ ЗАСАДИ КОРПУСНОЇ ЛІНГВІСТИКИ

  1. Визначення корпусу текстів

Говорячи про термін корпус, також маємо звернути увагу на те, що в сучасному українському мовознавстві паралельно з поняттям текстовий корпус існує поняття корпус мови. Однак корпус мови, так само як і корпусне планування, - це актуальні поняття соціолінгвістики, де під корпусом мови зазвичай розуміють «мову як таку», а корпусне планування - одне з двох типів (іншим типом є статусне) мовного планування, яке «має справу з владними зусиллями, спрямованими на характеристики мови як такої». За таких умов термін корпус стає багатозначним [6, с.36].

Отже, корпус текстів (КТ) – це „машиночитане стандартно організоване зібрання репрезентативних для певної мови, діалекту або іншої підмножини мови писемних або усних текстів, призначених для лінгвістичного аналізу й опису, відібраних і впорядкованих згідно з експліцитними екстра- та інтралінгвальними критеріями” [5, с.53]. В принципі, будь-який набір більш ніж одного тексту може бути названий корпусом. Часто окремі тексти використовуються для різного виду літературного та лінгвістичного аналізів. Однак, поняття корпусу як основи для електронної лінгвістики все ж відрізняється від перевірки одиничних текстів.

Ми можемо виділити чотири основні параметри, які характеризують корпус текстів: по-перше, він повинен бути достатньо великого обсягу; по-друге, корпус повинен бути структурованим або розміченим; по-третє, тексти, складові певного корпусу, повинні бути в електронному варіанті; по-четверте, в поняття «Електронний корпус» входить, як правило, спеціальне програмне забезпечення для роботи з цим корпусом [17].

Науковий апарат корпусу називають розміткою або анотацією. Розмітка – головна характеристика корпусу; вона відрізняє корпус від простих колекцій (або «бібліотек») текстів, удосталь представлених в сучасному Інтернеті, оскільки надає особливу додаткову інформацію про властивості текстів, які входять до корпусу. Гарна розмітка дозволяє швидко та ефективно знайти ті слова, форми та конструкції, які потрібні досліднику. Чим багатша й різноманітніша розмітка, тим вище наукова і учбова цінність корпусу. Можна стверджувати, що розмічені корпуси дозволяють суттєво прискорити та спростити процедуру збирання та обробки прикладів у мовознавчих студіях [32].

Існують різні типи розмітки: метатекстова розмітка (автор, назва, дата створення, обсяг, тематика тексту і т. д.), яка характеризує текст в цілому; структурна розмітка є інформацією про структуру тексту, яка дозволяє відокремити одне слово від іншого, виділити межі словосполучення, пропозиції, тексту; лінгвістична розмітка полягає в приписуванні одиницям тексту певної лінгвістичної інформації (негативна пропозиція або питальне, управління або примикання і т. д.). Як відомо, чим багатша і різноманітніша розмітка, тим вищою є наукова і навчальна цінність корпусу.

Також головною ознакою корпусу є те, що всі його складові викладаються в електронному варіанті і створюється спеціальне програмне забезпечення для роботи з цим корпусом. Такі програми дозволяють знаходити потрібні приклади з корпусів текстів, які зберігаються в електронному вигляді на комп'ютері. Це дозволяє економити значну кількість часу.

В.В. Риков розробив таку класифікацію корпусів текстів:

1. за ступенем організації та структурованості : електронний архів – це тексти на електронному носії , але їх форма представлена на машинному носії не стандартизовані і не уніфікована ; електронна бібліотека – тексти тут представлені однорідним і стандартизованим чином ; корпус текстів – форма стандартизована і уніфікована , тексти призначені для відображення частини лінгвістичної реальності; субкорпус – це деяка автономна частина корпусу.

2. за хронологічною ознакою: синхронічний ; моніторний ( відстежує поточний стан мови); діахронічний .

3. по індексації : простий ; анотований .

4. за мовами: одномовний ; двомовний ; багатомовний .

5. за способом застосування і використання корпусу: дослідний; ілюстративний ; паралельний.

6. за способом існування корпусу: динамічний; статичний [22].

Залежно від мети створення корпусу вони поділяються на дослідницькі, що призначені для вивчення різних аспектів і проблем функціонування мови й мови як системи і передують дослідженню; ілюстративні, що підтверджують висновки дослідника та створюються після проведення аналізу. Останнім часом з’являються так звані моніторні корпуси, які, порівняно зі статичними, відтворюють зміни мовної системи протягом певного хронологічного періоду, наприклад, процеси архаїзації та неологізації тощо [15, с.669].

Доцільність створення і зміст використання корпусів визначається такими передумовами:

1) досить великий (репрезентативний) об'єм корпусу гарантує типовість даних і забезпечує повноту представлення всього спектру мовних явищ;

2) дані різного типу знаходяться в корпусі у своїй природній контекстній формі, що створює можливість їх всебічного та об'єктивного вивчення;

3) одного разу створений масив даних може використовуватися багаторазово багатьма дослідниками і в різних цілях [11, с. 3].

Також потрібно додати, що корпус показує мовні дані в їх реальному оточенні, що дозволяє досліджувати лексичну і граматичну структуру мови, а також безперервні процеси мовних змін, що відбуваються в мові впродовж певного відрізка часу. Він має важливе значення для викладання мови, оскільки за допомогою корпусу можна швидко і ефективно перевірити особливості вживання незнайомого слова або граматичної форми.

Тексти у будь-якому корпусі об’єднуються в структурні одиниці або групи за наявності таких рис та характеристик: системномовних (загальнонародна мова – діалект – професійна мова), стилістичних (художній твір – наукова монографія – дитяче оповідання); тематичних (лінгвістика –право – медицина – міжнародні відносини –…); часових (...– XIXст. – XXст. – XXIст.) тощо [7, с.37].

Також варто зазначити, що корпус, як цілісний об'єкт, який містить відібрані текстові дані повинен відповідати певним вимогам, як зазначила Орися Демська-Кульчицька: «а)автентичність, що забороняє будь-які модифікації текстового матеріалу; б)репрезентативність, тобто введені до корпусу твори художньої літератури, політичні есе, наукові тексти, епістолярій тощо мають відтворювати реальний стан мови в кожен конкретний період її функціонування; в)квантитативність – відлік обсягу сучасних корпусів починається від одного мільйона слів і сягає понад п'ятсот мільйонів; г)закодованість – передбачає, що до звичного для нас тексту додається певна формальна інформація шляхом вписування у класичний текст відповідних символів, за допомогою яких машина розуміє цей текст і зможе відповісти на питання щодо тексту» [7, c. 36].

Напрямок науки, пов'язаний із комп'ютерними технологіями, упроваджує в мовознавчий обіг категорію стандартності. Будь-який стандартно закодований корпус повинен обов'язково складатися з двох частин: 1) електронного заголовка, 2) власне закодованого тексту.

Електронний заголовок – це початкова частина електронного документа, де через систему спеціальних символів-кодів здійснено паспортизацію текстового документа. Загалом його можна співвіднести з титульною сторінкою книжки.

Закодований текст передбачає, що у межах звичного для нас тексту мають з'явитися спеціальні позначки, які містять інформацію про структуру самого тексту, про речення і слова, іноді про звуки чи інтонацію. Така позначка дозволяє машині ідентифікувати у процесі пошуку наприклад відмінкові форми дня, днем, дню із лексемою день. Важливо, що такі операції пошуку відбуваються упродовж 20-30 секунд [7, с.37-38].

На даний час існує багато корпусів, які базуються на вивченні англійської мови учнями, які є носіями різних мов. Наприклад: The International Corpus of English, який, «започаткований у 1990 році, передбачає накопичення мовного матеріалу, який репрезентує різні регіональні варіанти англійської мови. Перевагою названого корпусу є те, що він репрезентує крім масиву матеріалу письмового мовлення також зривки усної комунікації, що розширює його дидактичні можливості.

1.2 Визначення корпусної лінгвістики

Одним із пріоритетних напрямків сучасних прикладних лінгвістичних досліджень є корпусна лінгвістика. Як відомо, корпусна лінгвістика є галуззю прикладного мовознавства, яка займається формуванням комп’ютерних корпусів текстів у різних мовах і спрямована на максимально об’єктивний аналіз мовних явищ в умовах реальної живої комунікації. Термін “корпусна лінгвістика” почали застосовувати ще в 90-х роках XX століття у зв’язку з розвитком практики створення корпусів, якому сприяв, як вже зазначалось, розвиток обчислювальної техніки. Але, як зауважує Я. Свартвік, «в історії створення корпусів був і «кам’яний вік», або докомп’ютерний період, коли корпуси укладалися вручну на папері» [27, с. 12]. По суті, ці перші паперові доелектронні корпуси представляли собою конкорданси, тобто алфавітні списки всіх ужитих у певному тексті/текстах слів у контекстному оточенні. Укладання таких паперових корпусів-конкордансів займало багато часу та вимагало напруженого аналізу, який здійснювався вручну.

У сучасному суспільстві теж використовують конкорданси, але електронні. Конкорданс є спеціалізованою лінгвістичною прикладною програмою, за допомогою якої здійснюється автоматична вибірка заданих мовних одиниць з електронних текстів [22]. Функцію конкордансу можна порівняти з функцією пошуку в текстовому редакторові, проте можливості конкордансу ширші – він аналізує не один, а відразу декілька текстів або корпусів електронних текстів, при цьому конкорданс виводить на екран інформацію про контекст використання заданих мовних одиниць. Залежно від технічних можливостей конкорданс може надавати інформацію про частотність вживання і сполучуваності тієї або іншої мовної одиниці, а також дає можливість звертатися до конкретного тексту, в якому був знайдений приклад.

Конкорданс є корисною програмою для роботи з текстами. Він володіє такими функціями:

- Пошукова функція - забезпечує можливість швидкого знаходження за одним словом потрібного фрагменту тексту. Конкорданс корисний, якщо потрібно терміново звірити або підібрати цитату, уточнити текст оригіналу. Ця функція може знадобитися і школяру, і вчителю, й науковцю - упоряднику хрестоматії. Дана функція також забезпечує пошук фраз та ідіом в тексті, пошук термінів або ідіом в пам'яті перекладів.

- Евристична функція – вона відрізняє конкорданс від іменних покажчиків, так як в конкордансі при слові наведені також і контексти. Загалом контексти можуть дати нове розуміння тексту, служити підказувачем і порадником читачеві та дослідникові.

- Функція порівняння – забезпечує можливість порівняння різних вжитків та значень слова в тексті.

- Аналітична функція – для аналізу ключових слів, фраз та ідіом, частотного вжитку слова.

- Функція індексації – для створення індексів і списків слів при підготовці текста для публікації [20].

У 60-ті р. р. уперше до засад корпусної лінгвістики звернувся британський професор Р. Квірк, який очолив колектив по формуванню Лондонсько-Лундського корпусу текстів. Обсяг цього корпусу дорівнював 1 млн. слововживань (у 100 писемних і 100 усних текстах). Цей корпус у машинному варіанті упорядковувався в Лундському університеті (Швеція) до 1979 року під керівництвом Я. Свартвіка. На його базі у 1985 році було укладено Повну граматику англійської мови. [15, 667].

Згідно з історією, першим великим комп'ютерним корпусом вважається Браунівський корпус (БК, англ. Brown Corpus , BC), який був створений в 1960-і роки в Університеті Брауна і містив 500 фрагментів текстів по 2 тисячі слів у кожному, які були опубліковані на англійській мові в США в 1961 році. В результаті він задав стандарт в 1 млн слововживань для створення представницьких корпусів на інших мовах [18]. Його автори – У. Френсис та Г. Кучера. Тексти належали п’ятнадцятьом найбільш масовим жанрам англомовної друкованої прози США. Його автори вперше вжили слово “корпус” як “сукупність текстів, яка є визначальною для даної мови і створена для лінгвістичного аналізу”. Корпус супроводжувався не лише детальним описом, але і великою кількістю зібраних матеріалів. У. Френсис та Г. Кучера поставили мету представити корпус текстів, які відповідали б наступним критеріям відбору:

1. Походження і склад тексту (автор повинен бути носієм американського варіанта англійської мови, а якщо є діалог, то він повинен займати менше половини об’єму тексту);

2. Синхронізація (в корпус входили тексти, що вперше були надруковані в 1961 році);

3. Продумане співвідношення різноманітних жанрів та відбір окремих текстів;

4. Доступність для комп’ютерної обробки (спеціальні посилання для передачі графічних особливостей тексту) [12, с.248].

Ми пропонуємо розглянути відмінність корпусної лінгвістики від традиційної. Таким чином варто зробити їхнє порівняння в ряді аспектів:

1. І традиційна, і корпусна лінгвістика основну уваги приділяє вивченню мови.

2. Мета корпусної лінгвістики - опис мови в тому вигляді, в якому вона проявила себе в мовленні, представленому у вигляді спеціально підібраного корпусу текстів. Традиційна ж лінгвістика має на меті опис та пояснення мови загалом.

3. Корпусна лінгвістика спирається на дані корпусу тексту. Традиційна ж – у своїх дослідженнях йде від теорії до її пояснення та підтвердження у фактах мови.

4. Корпусна лінгвістика віддає перевагу кількісним методам, в той час як традиційна – якісницьким методам.

5. Корпусна лінгвістика бачить себе частиною традицій, що базуються на емпіричних методах. На відміну від корпусної традиційна лінгвістика бачить себе частиною традицій, що базуються на раціоналістичних методах.

6. У корпусній лінгвістиці текст розглядається як деяка фізична сутність, у традиційній як деяка абстракція.

7. Корпусна лінгвістика займається складання граматики конкретних мов. Традиційна вивчає мовні універсалії.

8. У корпусній лінгвістиці основна увага приділяється формі. В той час як в традиційній увага приділяється не тільки формі, а й змістові.

9. Корпусна лінгвістика розглядає тексти в глобальній перспективі, а традиційна розглядає тексти в локальній перспективі.

10. Корпусна лінгвістика фокусує свою увагу на якомога ширшому погляді на текст, необмеженому ніякими догмами. Традиційна ж лінгвістика в свою чергу аналізує деяку конкретну, штучно обмежену, проблемну область.

11. У своїх висновках корпусна лінгвістика спирається на спостереження мовленнєвої діяльності, яка проявляється у вигляді текстів.

Традиційна ж – спирається на інтуїцію у відборі мовного матеріалу та у відборі емпіричних матеріалів своїх досліджень.

12. Корпусна лінгвістика часто користується імовірнісними методами і статистикою для первинної обробки мовного матеріалу, традиційна ж віддає перевагу логічним міркуванням.

13. У корпусній лінгвістиці проводиться робота з лінгвістичними даними (слововживання) в тому вигляді, в якому вони зустрічалися в контексті, а у традиційній віддається перевага штучним прикладам із ізольованих від тексту слововживань.

14. Корпусна лінгвістика віддає перевагу індуктивним методам обробки емпіричного словесного матеріалу, вважає їх суттю наукового методу, традиційна віддає перевагу дедуктивним методам обробки емпіричного словесного матеріалу.

15. Науковці, що працюють у сфері корпусної лінгвістики вірять у наукові відкриття, основані на обробці емпіричних даних, в той же час як ті, хто працюють у традиційній вірять у відкриття, основані на процедурах, оцінках, порівняннях і т.д., тобто, відкриття як результат багатовікових досліджень [19].

Як ми вже зазначили, корпусна лінгвістика займається розробкою загальних принципів побудови та використання лінгвістичних корпусів даних з використанням комп'ютерних технологій.

Вона використовує три прийоми:

- Автоматичне вилучення відомостей про мову з корпусів;

- Обробка інформації;

- Перевірка та інтерпретація оброблених даних [21].

В основі корпусної лінгвістики лежить те, що мова – це повністю соціальне явище, і його можна описати даними заснованими на досвіді, тобто в мовному акті. Це тягне за собою те , що ми не знаємо, а іноді і намагаємося не знати, як той, хто говорить або слухає, розуміє слова, пропозиції або тексти. Як соціальний феномен мова проявляє себе в текстах, які можна записати, описати і проаналізувати. Довгий час люди не могли записувати і тим самим фіксувати мовні акти, але в наш час за наявності різноманітної апаратури це зробити досить просто, тому кількість записаних мовних актів значно зросла. При цьому виникає проблема обробки всієї інформації. Отже, цей потік інформації повинен бути стисло виражений, наприклад, у вигляді окремого явища, який можна описати. Параметрами можуть бути мова, відрізок часу, район, внутрішні чи зовнішні властивості текстів і т.д.

Для корпусної лінгвістики, мова – це віртуальне функціонуюче явище , яке може бути зафіксоване і представлене у вигляді моделі людської мови в текстах. Більш коротко основне завдання комп'ютерної (корпусної) лінгвістики формулює В.В. Риков:

«Повне і системне відображення змістовного спілкування мовою . Основною особливістю напрямку дослідження, який можна назвати інформаційно-семіотичним напрямком лінгвістичних досліджень , є підхід до розгляду прикладних проблем лінгвістики строго в комунікативних процесах. При цьому в центрі уваги опиняється не мова (природній), як система , і не проблема його формалізації (яка має самі різні тлумачення), а процес змістовного спілкування мовою, і по можливості точний його опис, який може бути використаним для вирішення науково-технічних задач інформатики» [21].

Корпусна лінгвістика дає матеріал для різного роду досліджень мови та її варіантів, і визначає основний метод аналізу текстів на базі корпусів (Corpus-Based Approach). Корпусний підхід, або метод лінгвістичного дослідження, заснований на корпусах текстів, орієнтований на прикладне вивчення мови, його функціонування в реальних середовищах і текстах, що важливо для викладання мови. Наприклад, лексикографічний аналіз на базі корпусів явно допомагає розкрити контекстне вживання тих чи інших слів, особливо синонімічних (наприклад, small / little / big / large ), частотну сполучуваність їх з іншими словами, регулярність в тих чи інших стилях, і чітко визначити їх семантику [24].

На думку В.В. Рикова, «головною метою корпусної лінгвістики є:

- Лінгвістичний опис мовної системи (підхід від конкретного вивчення комунікації людей),

- Особливий спосіб відображення мовного матеріалу в корпусі текстів, який може використовуватися в свою чергу іншими лінгвістичними дисциплінами» [21].

У наявній літературі з корпусної лінгвістики часто використовуються поняття, які ніяк не визначаються, але складають вихідний категоріальний апарат цієї дисципліни. Отже ми пропонуємо розглянути їх, не претендуючи на точні, вичерпні дефініції.

Проблемна область. Під проблемною областю розуміється область реалізацій мовної системи, що містить феномени, що підлягають лінгвістичному опису [2].

Корпус даних. Корпус даних являє собою сформовану за певними правилами вибірку даних з проблемної області. Тим самим корпус даних являє собою результат відображення з проблемної області [2].

Одиниця зберігання корпусу даних. Оскільки корпус даних - це деяка вибірка з проблемної області, сформована за певними принципами, то одиниця зберігання безпосередньо залежить від того, за яких підстав здійснюється вибірка. Одиниця зберігання - це деяка сукупність природномовних виразів проблемної області, за допомогою якої зіставляється один опис на певній метамові, визначеній процедурою формування корпусу[2]. Це можуть бути окремі слова, короткі фрази, речення, словосполучення (синтагми). Якщо корпус передбачається для синтаксичного аналізу, то він повинен включати цілі тексти або їх досить великі фрагменти.

Корпус текстів. Корпус текстів – це вид корпусу даних, одиницями якого є тексти або їх досить значні фрагменти, що включають, наприклад, якісь повні фрагменти макроструктури текстів даної проблемної області.

Спосіб представлення і збереження корпусу даних. Найбільший інтерес представляють ті способи, які спираються на сучасні комп'ютерні технології зберігання і обробки даних. Для подальшого викладу важливо робити відмінність між двома основними способами подання – неструктурованим текстовим форматом зберігання (запис графем тексту в ASCI-кодах) і структурованим форматом зберігання (текст зі спеціальною розміткою); до останнього можна віднести також подання даних у форматах баз даних різного типу [2].

Параметризація проблемної області. Звуження проблемної області до дослідницького корпусу ґрунтується на виділенні деяких характеристик текстів проблемної області, що релевантні для передбачуваного дослідження.

Сукупність цих характеристик (їх можливі комбінації) утворює багатовимірну матрицю , що служить основою для відбору текстів в корпус [2].

Крім того, корпусні дослідження дозволяють, використовуючи статистичні методи, сформулювати, підтвердити або спростувати деяку гіпотезу про те чи інше мовне явище на великому обсязі матеріалу. При цьому, якщо дослідник користується вже існуючим корпусом, він повністю мине довгий і трудомісткий етап збору матеріалу (опитування інформантів, робота зі словниковими картотеками або письмовими текстами і т.д.).

Перспективи застосування іншомовних корпусів у процесі навчання іноземних мов були предметом розгляду ряду лінгвістів та педагогів. Означений напрям найбільш активно розвивається за кордоном. Значні напрацювання, які стосуються особливостей використання корпусної лінгвістики мають західні спеціалісти з викладання англійської мови як іноземної (А. О’Кіфі, М. МакКарті, Р. Картер та ін.). Останнім часом українські педагоги та лінгвісти теж акцентують увагу на доцільності застосування надбань корпусної лінгвістики в процесі викладання мовних дисциплін. Однак, в Україні фактично не має праць, присвячених застосуванню надбань корпусної лінгвістики при підготовці спеціалістів з англійської мови у вищих навчальних закладах.

1.3 Використання корпусів у лінгвістиці

1.3.1 Корпус і семантика

Корпус може бути використаний для того, щоб подивитися на появу окремих слів і щоб визначити їх значення. Але корпуси також мають важливе значення в цілому в семантиці. Семантика мовна (давніше семасіологія) – розділ мовознавства, пов'язаний з лексикологією; вивчає значення слів і їх складових частин, словосполук і фразеологізмів.

Основний внесок корпусної лінгвістики в семантику є те, що вона допомогла створити підхід до семантики, який є об’єктивний і враховує невизначеність та градієнцію.

Міндт говорить, що корпусна лінгвістики може бути використана, щоб забезпечити об’єктивні критерії для присвоєння значень лінгвістичним термінам. Також він вказує, що часто в семантиці значення лексичних одиниць і лінгвістичних конструкцій описані з посиланням на власні інтуїції лінгвіста, під цим ми розуміємо раціоналістичний підхід. Тим не менш, він продовжує стверджувати, що насправді семантичні відмінності пов'язані в текстах з контекстами – синтаксичним, морфологічним і просодичним – і, таким чином, що, беручи до уваги середовище лінгвістичних сутностей можна досягнути емпіричний об’єктивний показник для конкретного смислового відтінку [30]. Для прикладу візьмемо «специфікацію» і майбутність. Що ми знаємо про притаманний дієслівним конструкціям майбутній час, що підтверджується емпіричними даними; зокрема, як сильно почуття майбутності залежить від супутніх прислівникових одиниць, які забезпечують окремі ознаки часу (те, що він називає "специфікації") і як сильно воно виявляється незалежно присутнім в самій конструкції дієслова?

Міндт розглянув чотири часові конструкції, а саме will, be going to, прогресивний час та простий теперішній, в двох корпусах – в Корпусі розмовної англійської мови та в корпусі з дванадцяти сучасних п'єс – і оглянув частоту специфікації чотирьох різних конструкцій. Він знайшов у обох корпусах, що простий теперішній має найвищу частоту специфікації, а за ним йдуть по порядку вже й теперішній прогресивний, will та be going to. Таким чином, частотний аналіз встановив ієрархію за допомогою двох конструкцій теперішнього часу з одного боку, які часто видозмінюються прислівниково для того, щоб підсилити відчуття майбутнього часу і дві по своїй суті притаманні конструкції з іншого боку, з набагато меншою частотою додаткових супутніх слів, які вказують на майбутність. Тут, таким чином, Miндт зміг продемонструвати , що емпіричний аналіз лінгвістичних контекстів може надати об’єктивні показники для інтуїтивних семантичних відмінностей: у цьому прикладі притаманна майбутність обернено пропорційно знаходиться у співвідношенні з частотою специфікації [26, с. 112-113].

Тепер поговоримо про іншу основну роль корпусів в семантиці, яка встановлена в поняттях нечіткі категорії та градієнція. В теоретичній лінгвістиці категорії розглядаються у вигляді жорстких та швидких, тобто чи елемент належить до категорії чи ні. Проте психологічна робота з категоризації припустила, що когнітивні категорії, як правило, не жорсткі і швидкі, а натомість мають нечіткі межі так, що це вже не настільки важливе питання чи належить даний елемент до певної категорії чи ні, як те, як часто він попадає в цю категорію, на відмінну від інших. Це має важливе значення для нашого розуміння того, як мова працює. Якщо дивитися емпірично на природну мову в корпусі, то стає зрозуміло, що ця «нечітка» модель вважається кращою для даних: часто немає ніяких чітких меж категорій, а скоріше градієнти членства, які пов’язані з частотою приєднання, а не просто приєднання або вилучення. Корпус є безцінним при визначенні наявності і масштабу таких градієнтів.

1.3.2 Корпус і лексикографія

Лексикографія – розділ мовознавства, що розробляє теорію укладання словників. Отже, предметом лексикографії є збирання слів тієї чи іншої мови, систематизація їх, опис словникового матеріалу.

Існування корпусів текстів дає можливість значно розширити і автоматизувати аналіз мовного матеріалу, який є найважливішою базою будь-якого лінгвістичного дослідження. Чим більше матеріалів аналізується, тим вища значущість висновків і рівень їх достовірності.

Сучасні комп'ютерні програми дозволяють знаходити потрібні приклади з корпусів текстів, які зберігаються в електронному вигляді на комп'ютері. Це економить значну кількість часу в порівнянні з традиційною технологією збору прикладів вручну.

Аналіз наукових джерел свідчить про те, що лексикографи використовували емпіричні дані ще задовго до появи дисципліни корпусної лінгвістики. Однак, цей процес був тривалий і громіздкий, дані досліджень не ґрунтувалися на даних спостереження [9, с. 13].
Можна навіть стверджувати, що корпуси здійснили революцію в лексикографії. Послідовно застосовуючи принцип комп’ютерної обробки реального мовного матеріалу, що використовується у відповідних сферах комунікації, був сформований принципово новий тип словників. Усі сучасні словники англійської мови створюються на базі корпусів, серед них Oxford, Collins, Longman, Cambridge, Macmillan тощо [9, c. 14].

Корпусні дані – систематизовані і чіткі. З появою корпусів текстів з’явилася можливість використовувати корпусні дані для верифікації та перевірки результатів досліджень отриманих традиційним шляхом. Комп’ютерна лінгвістика змінила спосіб в який лексикографи можуть вивчати мову як феномен, використовуючи готові дані різних періодів. Корпуси містять дані для дескриптивних та теоретичних досліджень і дають можливість вносити радикальні зміни в лінгвістичну теорію на основі очевидних фактів.

Значний досвід досліджень в комп'ютерній лексикографії дозволяє розширити можливості вивчення смислової структури політичного слова. Так, сьогодні в наукових проектах активно розробляється ідея, пов'язана з організацією концептуального простору мови політики з позиції гіпертекстової єдності.

Кажучи про специфіку змісту такого словника, відзначимо, що слово в електронному варіанті реалізується в семантичному макрополі, що складається з декількох полів, збудованих в певну систему:

  1. поле індексації служить для зручного пошуку в базі даних;
  2. поле заголовного слова;
  3. поле граматичної інформації, прагматичне навантаження якої пов'язане з конкретним граматичним статусом в текстах;
  4. поле етимологічних довідок;
  5. поле авторського тлумачення будується не по всій семантичній парадигмі слова, а лише по її основній частині, тематично пов'язаній з політичною сферою вживання;
  6. поле ілюстрацій працює для верифікації дефініції, тим самим виявляє семантику політичного слова в певному контекстуальному оточенні. Важливо відзначити, що в словнику ілюстрації з текстів різних жанрів використовуються і в традиційному вигляді як виправдувальний контекст (це особливо важливо для метафоричних значень) і як лексикографічний прийом, що допомагає створити просторова, тимчасова і соціально-історична перспективи;
  7. поле фразеології;
  8. поле енциклопедичних відомостей відображає основні етапи становлення даної дефініції, еволюцію його домінантних ознак [22].

Наведемо лексикографічний віртуальний портрет слова ескалація.

Слово в електронному словнику представлене в 4-х полях:

  • поле 1 складається з блоку заголовного слова, блоку граматичних послід, етимона. У цьому ж полі обов'язковим елементом є блок авторського тлумачення;
  • поле 2 представлено ілюстративним матеріалом Корпусу російської національної мови. Ці ілюстрації допомагають описати семантичну структуру слова і визначити комунікативний статус слова;
  • поле 3 – мікроструктура електронного словника, що включає дефініції сучасних тямущих і тямущо-довідкових видань.
  • поле 4 є, на наш погляд, необхідною структурною частиною електронного довідкового видання і містить енциклопедичні відомості про дане поняття. У великому енциклопедичному словнику, наприклад, дане слово визначається як розширення, нарощування (озброєнь тощо), поступове посилення, розповсюдження (конфлікту тощо), загострення (положення тощо) [22].

У сучасній корпусній лінгвістиці, серед побудови загальномовних корпусів, також поширене створення авторських корпуси. Авторськими корпусами називають повнотекстові корпуси одного тексту, прикладом може служити корпус Біблії або текстів одного автора.

На основі створеного авторського корпусу маємо змогу укласти тезаурус. Тезаурус – це словник, що відображає весь словниковий склад мови з вичерпним переліком прикладів вживання слів у тексті. Це ідеографічний словник, а також інформаційно-пошуковий довідник, в якому перелічені всі лексичні одиниці інформаційно-пошукової мови (дескриптори), усі синонімічні їм слова, словосполучення й регулярні семантичні відношення між дескрипторами [13, c. 57].

Оскільки ідіолект письменника становить не тільки «сукупність індивідуальних (професійних, соціальних, територіальних, психофізичних та ін.) особливостей, що характеризують мовлення певного індивіда; індивідуальний різновид мови» [1, c. 165]. а й відображає сукупні менталітетні риси певної національної мови поряд із авторськими, індивідуальними рисами, то тезаурус мови письменника може мати вигляд ідеологічного словника.

Ідеологічний словник – словник, у якому словарозташовані у вигляді тематичних рядів [1, c. 421]. Цими тематичними рядами можуть бути, наприклад, концепти, що утворюють концептосферу ідіолекту певного письменника. Концептосфера об’єднує всі семантичні поля, які номінують і

характеризують найважливіші поняття.

1.3.3 Корпус і граматика

Граматичні або синтаксичні дослідження, поряд із лексичними дослідженнями вважаються одними із частих досліджень які взаємодіють з корпусною лінгвістикою. Що робить корпусну лінгвістику важливою для синтаксичного дослідження є, по-перше, те, що вона має можливість представити основні особливості граматики певної мови і, по-друге, їхню роль в якості емпіричних даних, які піддаються кількісному вимірюванню та представленню для перевірки гіпотез, отриманих з граматичної теорії.

Аналіз тенденцій функціонування та розвитку граматичного ладу мови, змодельованого словниками – морфемними, словотвірними, морфологічними, синтаксичними – потребує спеціального текстового
спорядження, спеціального корпусу, принципово відмінного від корпусу для широкого загалу.

Тейлор, Гровер та Тріско представили автоматичну програму синтаксичного аналізатора для англійської мови у вигляді генеративної граматики, яка безпосередньо не заснована на емпіричних даних, які вони хотіли перевірити на корпусних даних. Незалежно від цього, Семпсон вручну проаналізував набір іменникових словосполучень у корпусі і зробив висновок, що генеративна граматика не може бути успішно використана для аналізу текстів англійською мовою, так як кількість різних конструкцій, які появляються у звичайних текстах є настільки великою, що це робить неможливим пояснити їх всіх за допомогою системи граматичних правил. Проте, Тейлор, Гровер та Тріско використовували свою граматику для того, щоб проаналізувати розширений набір даних Самсона і досягли успіху – 87,97 відсотків іменникових фраз були правильно обробленими. Проте решта фраз можуть бути про класифікованими досить легко і зазвичай вони представляють недоліки в розробці наборів граматичних правил, а не синтаксичних дивацтв. Семпсон продовжує стверджувати, що система правил для точного граматичного аналізу є занадто відкритою та не постійною, щоб бути практичною [26, c. 111].

Відомо, що в українській і російській мовах граматичне значення виражається переважно синтетично: за допомогою закінчення, суфікса, префікса, зміни наголосу, внутрішньої флексії, суплетивної видозміни. На відміну від вищесказаного в англійській мові переважає аналітичний спосіб вираження граматичного значення – за межами слова: за допомогою прийменників, сполучників, артиклів, допоміжних дієслів, інших службових слів і порядку слів у реченні.

Зокрема, особливої уваги потребує система форм англійського дієслова, яка порівняно з українською і російською системами характеризується значною складністю й розгалуженістю. Для забезпечення можливості ефективної роботи корпусу необхідно, щоб усім дієслівним словоформам в тексті були приписані правильні морфологічні коди. Програма автоматичного морфологічного кодування дієслівних форм здійснює лише первинне розмічування. Отримані результати первинного опрацювання тексту потребують ручного редагування й виправлення помилок, допущених програмою.

У корпусі текстів з комп’ютерної лінгвістики використовується стандартний набір програм морфологічного кодування, лематизації, здійснення пошуку за словоформою, лемою та граматичним кодом й  укладання конкордансу.

Для цього застосовуються такі допоміжні програми:

1. Автоматичного визначення однозначних дієслівних форм – переважної більшості з загального списку в 526 форм.

2. Розпізнання випадків граматичної омонімії дієслівних форм Past Simple і Past Participle. У цьому разі користувачеві надсилається запит для зняття омонімії вручну.

3. Лематизації, яка приписує усім дієслівним формам їх леми.

Зазначені програми базуються на опрацюванні бази даних, в якій міститься понад 1500 англійських дієслів з їх основними формами. При морфологічному кодуванні також застосовуються прийоми контекстного аналізу.

Описані програми суттєво полегшують для дослідника процес приписування морфологічних кодів англійських дієслів, а зручний інтерфейс максимально спрощує процес корегування помилок, допущених при автоматичній розмітці.

Висновок до розділу 1

У межах класичної лінгвістичної традиції збір мовних даних завжди був і залишається складним технічним завданням, оскільки йдеться про ручне довготривале опрацювання письмових текстів, опитування інформаторів, анкетування, створення традиційних лексичних картотек тощо. До структури сучасних лінгвістичних дисциплін, завдяки прогресу комп’ютерних технологій, увійшла відносно нова дисципліна – корпусна лінгвістика, для якої характерними є осмислення, вивчення та інтерпретація усіх процесів, які пов’язані з побудовою, обробленням, використанням і аналізом машиночитаного корпусу текстів. Корпус був створений для того, щоби оперувати великими обсягами слів у реальних контекстах. Також головною його ознакою є те, що всі його складові викладаються в електронному варіанті і створюється спеціальне програмне забезпечення для роботи з цим корпусом. Такі програми дозволяють знаходити потрібні приклади, які зберігаються в електронному вигляді на комп'ютері. Це дозволяє економити значну кількість часу.

Корпусна лінгвістика також пов’язана з іншими лінгвістичними дисциплінами, адже, корпус має важливе значення для викладання мови, оскільки з його допомогою можна укладати різноманітні словники, швидко і ефективно перевірити особливості вживання незнайомого слова або граматичної форми, слідкувати за появою окремих слів і визначати їх значення.

РОЗДІЛ 2

ВИКОРИСТАННЯ КОРПУСНОЇ ЛІНГВІСТИКИ У НАВЧАННІ АНГЛІЙСЬКОЇ МОВИ

2.1. Корпусний метод навчання англійської мови

Корпусний метод навчання мови базується на здобутках однієї з галузей прикладної лінгвістики – корпусної лінгвістики. Перспективи застосування іншомовних корпусів у процесі навчання іноземних мов були предметом розгляду ряду лінгвістів та педагогів. Означений напрям найбільш активно розвивається за кордоном, зокрема російські дослідники звертають увагу на значні перспективи використання корпусів мови в процесі викладання іноземних мов. Значні напрацювання, які стосуються особливостей використання корпусної лінгвістики мають західні спеціалісти з викладання англійської мови як іноземної (А. О’Кіфі, М. МакКарті, Р. Картер та ін.) [17, с. 49].

Розглядаючи переваги використання корпусів текстів для навчання англійської мови, однією із основних позитивних рис є те, що для побудови більшості широковідомих корпусів англійської мови використовуються зразки мовного матеріалу, дібрані не лише з художньої літератури, але й писемних та усних інших джерел. Важливим є й те, що корпусна лінгвістика більшою мірою є незалежною від мовної інтуїції, власного бачення, відтворюючи більш-менш об’єктивну картину дистрибуції тієї чи іншої лексичної чи граматичної одиниці. Можна сказати, що корпус мови узагальнює досвід мовленнєвої діяльності тієї чи іншої лінгвоспільноти.

Корпуси текстів слугують інформаційною базою для проведення трьох основних напрямів дослідження: 1) власне лінгвістичних синхронних та діахронних досліджень; 2) статистичних досліджень та 3) досліджень у сфері методики викладання мов. Варто наголосити на зміцненні зв’язку між корпусною лінгвістикою та методикою викладання іноземних мов, що відображається у залученні різних видів корпусів, для розробки нових напрямків діяльності та методів навчання певної мови [23]. Найчастіше використовують учнівські корпуси, адже метою їх створення вважається можливість проведення їх аналізу для виявлення різноманітних засобів та методів покращення викладання та полегшення засвоєння іноземної мови.

В більшості англомовних країнах основні вправи, які використовуються під час уроків, передбачають використання конкордансів. Прикладом може послужити програма WordCruncher, в якій спочатку вимагається вибрати корпус, а потім вона відображає список слів з частотою їх вживаності. Учні виділяють слово або групу слів і досліджують кількість прикладів у контексті. У текстах, написаних до 1700 року, можна знайти слова, які мають декілька варіантів написання, і використовуючи цей список слів учень може вибрати будь-який варіант. Наприклад, узгоджуючи слово doctor в авторській версії потрібно також врахувати doctour. Коли слово було вибрано, WordCruncher виділяє всі приклади в корпусі, при цьому показує речення, в яких їх було виявлено. Також WordCruncher показує увесь текст, в якому це слово було вжите, знову ж його виділяючи [25, с. 196]. Таким чином, користувач може дуже швидко відстежити використання слова у великому тексті.

Чи взяти для прикладу машиночитаний Oxford English Dictionary, який використовується, як і традиційний паперовий, за винятком того, що шукати слова в ньому можна набагато швидше. Так як словникові статті розташовані історично, можна легко перевірити форму значення слова у тексті, який є типовим для свого періоду. Наприклад, написання слова doctour можна знайти в текстах з XIV по XIX століття [25, с. 196]. Таким чином студенти змогли використати словник для перевірки своїх попередніх висновків за результатами пошуку в корпусі.

Для процесу викладання англійської мови корисним є використання пошуку за семантичними параметрами. Наприклад, порівняння дистрибуції частково синонімічних лексем для виявлення семантичних відтінків значень. Завдяки використанню корпусу мови студенти мають можливість знаходити слова та вирази, притаманні тому чи іншому стилю та тематиці тексту, а також граматичні конструкції, які використовуються для реалізації тої чи іншої комунікативної функції. Такий підхід допомагає студенту оволодіти автентичними лексичними та граматичними конструкціями. У свою чергу, викладачі мають змогу створювати завдання, необхідні для досягнення дидактичних цілей, використовувати матеріали при укладанні підручників та посібників з англійської мови, забезпечуючи реалізацію принципів автентичності та частотності мовного матеріалу.

Наведемо деякі варіанти використання корпусу англійської мови в процесі іншомовної підготовки вчителя та викладача іноземної мови. Корпусні ресурси можуть бути застосовані для реалізації таких дидактичних цілей:

1. Навчання граматики: введення граматичного матеріалу, ілюстрація особливостей використання граматичних конструкцій безпосередньо в мовленні; розроблення завдань на корегування помилок, тестових завдань з граматики; вивчення специфіки використання граматичних конструкцій з огляду на соціокультурні характеристики мовців, вікові параметри, регіон проживання тощо; створення практичних завдань та вправ на використання граматичних конструкцій.

2. Вивчення лексики: створення студентами власних словників, які ґрунтуються на результатах тематичного пошуку по корпусу зразків як усного, так і писемного мовлення; використання конкордансів слів відповідно до частотності їхнього вживання; виконання ІНДЗ та творчих проектів, які стосуються особливостей функціонування тих чи інших лексичних одиниць; створення вправ націлених на розширення словникового запасу студентів тощо.

3. Навчання читання та розуміння автентичних текстів: використання тестів, розміщених в корпусі, для розвитку навичок загального розуміння тесту; визначення реалізації контекстуального значення слова; визначення тематики тексту та ін.

4. Навчання письма: використання корпусів та конкордансів як довідкового матеріалу при створенні власного письмового висловлювання; засвоєння шаблонів писемного мовлення; розвиток навичок використання граматичних конструкцій та лексичних одиниць у різних типах та жанрах письма тощо [17, с. 52 - 53].

Однією з головних переваг корпусного методу навчання є також те, що працювати з корпусом можна у дистанційному режимі. Через мережу Інтернет учень має можливість потрапити на сайт корпусу, де перед ним постає можливість без проблем виконати домашнє завдання. Найважливішою специфікою використання етнокорпусів у методиці мови як рідної чи, особливо, як іноземної, є можливість швидкого різнорівневого пошуку лінгвальної інформації у корпусі через використання програмних ресурсів. У морфологічно анотованому загальномовному корпусі можливе екстрагування лінгвальної інформації про реальну (інколи нетипову з огляду на граматичні правила, викладені в підручниках) сполучуваність слів [8, c. 108]. Наприклад, граматичне оформлення усіх частин мови; дієслівне керування; уживання прийменників; специфіку побудови еліптичних речень залежно від стилю і жанру тощо.

2.2. Учнівські корпуси текстів в методиці викладання англійської мови

Зробивши дослідження у галузі корпусної лінгвістики, ми вияснили, що існує декілька можливостей використання корпусів текстів у методиці викладання іноземних мов.

  1. Використання загальномовного (національного) корпусу текстів , який дасть можливість швидкого різнорівневого пошуку найрізноманітнішої лінгвальної інформації, важливої для методики викладання іноземних мов: найчастотнішу лексику, сполучуваність слів, уживання прийменників, конкорданси, в яких легко визначити значення слова, дієслівне керування тощо. [3, с. 20]. Як приклад презентації текстової інформації візьмемо вищезгаданий конкорданс, в якому до кожного зареєстрованого слова подано усі контексти його вживання. Його визнано найзручнішим інструментом для виявлення лексичного та граматичного оточення лексеми, можливості її сполучуваності з іншими словами. Сьогоднішні словники укладаються на їх основі.
  2. Створення паралельних корпусів (parallel corpus). Паралельний корпус – корпус, який складається з оригінальних та перекладних текстів, що вирівняні по реченнях [16, с. 95]. Отже, ми бачимо, що паралельний корпус, як правило, двомовний, а його ознакою є внутрішні зв’язки між сегментами цих різномовних текстів. Він надає доступ до безпосередніх перекладних еквівалентів слова, фрази, синтаксичної конструкції. Застосовуючи двомовні конкорданційні програми, комп’ютерна система висвітлює обидва тексти поряд, тому студент легко і швидко перекладає текст. Це сприяє легшому вивченню іноземних мов.
  3. Створення учнівських корпусів (learner corpus). Учнівський корпус – це один з різновидів електронних корпусів текстів, якому, окрім загальних ознак кожного корпусу, притаманні також власні характерні особливості. Зокрема, основну інформацію для створення та поповнення бази учнівського корпусу (усні та письмові тексти) надають люди, які вивчають іноземну мову [23].

На відміну від інших, учнівські корпуси текстів мають низку суттєвих переваг: значно більший обсяг матеріалу, електронний формат, точні критерії збору матеріалу. Такі корпуси текстів дозволяють здійснити не лише якісний, а й кількісний аналіз мовленнєвих даних учня. Cпеціальна зовнішня розмітка (анотування) учнівського корпусу розширює межі можливих досліджень. Адже залежно від дослідницьких цілей створення, у ній можуть закодовуватися також дані про учня (вік; стать; освіта; рідна мова; іноземні мови, якими володіє; рівень володіння цією іноземною мовою / рік її вивчення тощо), про умови виконання завдання (наприклад, доступ до словників), про форму відповіді (усна, письмова), довжину, жанр, тему розповіді, тощо [23].

Багаторічний досвід роботи вчителів з усього світу доводить, що вивчення мови на основі використання лінгвістичних корпусів дозволяє активізувати продуктивну діяльність учнів. Учень стає не тільки співавтором мовних правил та закономірностей, а й, завдяки сучасним електронним технологіям, можуть створювати свої корпуси. Під час створення корпусів учні зможуть освоїти нові, інноваційні методи вивчення мови, пов'язані з інформаційними технологіями й оволодіти азами комп’ютерної лінгвістики. На їх основі виявляють різноманітні засоби та методи покращення викладання та полегшення засвоєння іноземної мови, здійснюють формування списків активної лексики учнів.

На сьогодні найбільшим проектом учнівського корпусу є Міжнародний корпус учнівської англійської – International Corpus of Learner English (ICLE), що нараховує підкорпуси англійського мовлення учнів, які є носіями рідної болгарської, бразильської (варіанта португальської), грецької, данської, китайської, італійської, іспанської, литовської, німецької, норвезької, польської, португальської, російської, турецької, фінської, французької, чеської, шведської мов [3, с. 21]. Його вважають одним з найвідоміших міжнародних навчальних англомовних корпусів есе студентів.

Враховуючи всі особливості учнівських корпусів текстів, вони можуть використовуватися на усіх етапах навчання лексики іноземної мови для полегшення її засвоєння:

1. На етапі ознайомлення учнів з новими лексичними одиницями тексти учнівських корпусів застосовуються як один з найпродуктивніших засобів мовної семантизації, забезпечуючи перегляд контекстного застосування мовної одиниці та аналіз її природного оточення.

2. Для здійснення етапів автоматизації та удосконалення дій учнів/студентів з лексикою використовуються тренувальні вправи, розроблені на базі учнівських корпусів текстів [14, c. 145].

2.3. Процес створення корпусу текстів

Робота над створенням корпусу текстів достатньо тривала та багатоетапна. Її процес можна представити у вигляді наступних кроків або етапів.

  1. Першим кроком є визначення переліку джерел, збір необхідної інформації. Завдання творців корпусу – зібрати якомога більшу кількість текстів, що відносяться до тієї підмножини мови, для вивчення якої корпус створюється. Але головне не тільки кількість мовного матеріалу, але і його пропорційність. Можна сказати, що корпус – це зменшена модель мови або підмови.
  2. Перетворення текстів у комп’ютерну форму, що здійснюється шляхом їх кодування з використанням чітко-визначеної розмітки (анотування). Тексти в електронному вигляді для створення корпусів можуть бути отримані різними способами - ручне введення, сканування, авторські копії, дари і обмін, Інтернет, оригінал-макети, що надаються укладачам корпусів видавництвами та ін [11, с. 7]. Варто зауважити, що раніше введення текстів в комп’ютер було складним процесом, але сьогодні ця проблема вирішується досить легко, принаймні , що стосується сучасних текстів і в сучасній орфографії. Ця легкість базується на успіхах в скануванні, розпізнаванні та глобальній комп’ютеризації сучасного життя.
  3. Попередня обробка тексту. На цьому етапі всі тексти, отримані з різних джерел, проходять філологічну перевірку і коригування. Також здійснюється підготовка бібліографічного та екстралінгвістичного опису тексту.
  4. Конвертування і графематичний аналіз. Деякі тексти проходять також через один або кілька етапів попередньої машинної обробки , в ході яких здійснюються різного роду перекодування (якщо потрібно), видалення або перетворення нетекстових елементів (малюнки, таблиці), видалення з тексту переносів, забезпечення однакового написання тире та ін. Як правило, ці операції виконуються в автоматичному режимі. Зазвичай на цьому ж етапі здійснюється сегментування тексту на його структурні складові [11, с. 7].
  5. Розмітка тексту. Всі дані вводяться зазвичай вручну. Текстам приписується додаткова інформація, яка включає бібліографічні дані, ознаки, що характеризують жанрові та стильові особливості тексту, відомості про автора, також ім'я файлу, параметри кодування, версія мови розмітки, виконавців робіт.
  6. На цьому етапі здійснюється коригування результатів автоматичної розмітки.
  7. Конвертація розмічених текстів в структуру спеціалізованої лінгвістичної інформаційно-пошукової системи, що забезпечує швидкий багатоаспектний пошук та статистичну обробку .
  8. Завершальним етапом є забезпечення доступу до корпусу.

За останнє десятиліття корпусна лінгвістика швидко прийняла той досвід, який був накопичений в інших достатньо розвинених галузях. Робота з корпусами, тобто з масивами текстів, представленими в електронному вигляді, давно вже стала одним з основних методів лінгвістичних досліджень. Внаслідок цього з 1962-го до 1989-го року з'явилися еталонні корпуси різних варіантів англійської мови [4, с. 46]: Brown Corpus (Brown University Standard Corpus of Present-Day American English), American Heritage Intermediate Corpus, Lancaster-Oslo-Bergen Corpus, Birmingham University International Language Database / Birmingham Corpus, London-Lund Corpus / LLC, Kolhapur Corpus, Tools for Syntactic Corpus Analysis / TOSCA, Survey of English Usage / SEU/.

Ми пропонуємо розглянути деякі корпуси англійської мови. Найбільш відомим представником такого корпусу є Brown Corpus. Перший в історії представницький корпус, створений в 1960-ті рр.. Корпус складається з 500 прозових фрагментів в 2000 слів, узятих з текстів, опублікованих в США в 1961 р. Наприкінці 1970-х рр., корпус був доповнений розміткою частин мови, слів та словосполучень. Корпус базується на англійській мові та американського варіанту англійської мови.

British National Corpus – великий представницький корпус британської англійської мови, за зразком якого створювалися більшість сучасних корпусів різних мов. Корпус включає метатекстову розмітку, характеризується використанням повних текстів і наявністю підкорпуса усного мовлення обсягом 10 млн. слововживань. Загальний обсяг корпусу – понад 100 млн. слововживань.

The International Corpus of English (ICE) відображає слововживання в різних варіантах англійської мови (Австралія, Великобританія, Гонконг, Індія, Ірландія, Канада, Кенія, Малайзія, Нова Зеландія, Сінгапур, США, Танзанія, Філіппіни, Шрі-Ланка, Південна Африка, Ямайка). Кожен підкорпус включає різні типи письмових текстів і записи мовлення. Передбачається доповнити записи мовлення аудіозаписами. Обсяг кожного національного під корпуса – 1 млн. слововживань[31].

American National Corpus створюється за зразком Британського національного корпусу. На першому етапі основну частину корпусу становитимуть тексти 1990-х рр.. Проте надалі в корпус будуть включатися і більш ранні тексти (аж до 1960-х рр.) . На даний момент готова перша версія корпусу, до якої увійшли 10 % від передбачуваного обсягу корпусу (10 млн. слововживань). Представлені як письмові тексти, так і записи мовлення. Хоча планується створення представницького корпусу, на даний момент тексти включаються в корпус в порядку надходження, тому готовий фрагмент корпусу не є збалансованим [31].

Висновок до розділу 2

Сьогодні корпусна лінгвістика та корпуси мовних даних посідають неабияке місце у навчанні та вивченні мов, відкривають нові перспективи для проведення нових лінгвістичних досліджень, допомагають з’ясувати, які зміни відбуваються в мові під впливом різноманітних зовнішніх факторів. Велика кількість створених корпусів дає змогу отримати дані аналізу писемного чи спонтанного мовлення, мовлення певної вікової, гендерної, соціальної чи етнічної групи, інформацію про особливості певного діалекту. Залученні різних видів корпусів, для розробки нових напрямків діяльності та методів навчання певної мови сприяв зміцненню зв’язку між корпусною лінгвістикою та методикою викладання іноземних мов.

В Україні ця дисципліна ще не достатньо розвинена, але в англомовних школах за кордоном популярним є використання конкордансів та інших корпусних ресурсів у навчанні граматики, лексики, читання, письма. Лінгвісти також надають перевагу учнівським корпусам, базу яких поповнюють люди, які вивчають іноземну мову. Ми мали змогу розглянули популярні корпуси англійської мови та багато етапний процес їх створення.

ВИСНОВКИ

У межах класичної лінгвістичної традиції збір мовних даних завжди був і залишається складним технічним завданням, оскільки йдеться про ручне довготривале опрацювання письмових текстів, опитування інформаторів, анкетування, створення традиційних лексичних картотек тощо. Існують також інші проблеми, пов’язані з традиційним збором мовного матеріалу, зокрема його поновлення, пошук необхідних одиниць у кількамільйонних картотеках, віддалений доступ, або взагалі відсутність його у, так званих, неелектронних базах. Комп’ютерні технології, прийшовши у лінгвістику, запропонували свої технічні можливості для оформлення, зберігання і пошуку мовного матеріалу на машинних носіях, який може бути організований як база даних, машинний фонд або, корпус текстів.

Основою корпусної лінгвістики є розроблення теоретичних засад і практичних прийомів побудови, машинного опрацювання та експлуатації мовних даних, оформлених як корпус текстів. Термін “корпусна лінгвістика” почали застосовувати ще в 90-х роках XX століття у зв’язку з розвитком практики створення корпусів, якому сприяв, як вже зазначалось, розвиток обчислювальної техніки. Першим таким великим комп’ютерним корпусом вважається Браунівський корпус.

Текстовим корпусом називають сукупність текстів, зібраних відповідно до визначених принципів, розмічених за певним стандартом і забезпечених спеціалізованою пошуковою системою. Створюється спеціальне програмне забезпечення для роботи з цим корпусом, яке дозволяє знаходити потрібні приклади з корпусів текстів, які зберігаються в електронному вигляді на комп'ютері. Це дозволяє економити значну кількість часу.

Ми розглянули безліч класифікацій корпусних текстів за певними ознаками і визначили, що основними його параметрами є великий обсяг, він повинен бути розміченим, а його складові знаходитись в електронному варіанті, корпус показує мовні дані в їх реальному оточенні, що дозволяє досліджувати лексичну і граматичну структуру мови, а також безперервні процеси мовних змін, що відбуваються в мові впродовж певного відрізка часу. Він має важливе значення для викладання мови, оскільки за допомогою корпусу можна швидко і ефективно перевірити особливості вживання незнайомого слова або граматичної форми.

Як ми бачимо корпусна лінгвістика є самостійною дисципліною, яка в відрізняється від традиційної. Корпусна лінгвістика описує мову в тому вигляді, в якому вона проявила себе в мовленні спираючись на дані корпусів текстів. Вона користується імовірнісними методами і статистикою для первинної обробки мовного матеріалу, проводить роботу з лінгвістичними даними (слововживання) в тому вигляді, в якому вони зустрічалися в контексті. Науковці, що працюють у сфері корпусної лінгвістики вірять у наукові відкриття, основані на обробці емпіричних даних, в той же час як ті, хто працюють у традиційній вірять у відкриття, основані на процедурах, оцінках, порівняннях. Традиційна лінгвістика пояснює мову загалом, у своїх дослідженнях йде від теорії до її пояснення та підтвердження у фактах мови та віддає перевагу логічним міркуванням. У традиційній віддається перевага штучним прикладам із ізольованих від тексту слововживань.

Корпусна лінгвістика взаємодіє і з іншими науками: семантикою допомагає визначити значення слів, їх складові частини, фразеологізми та словосполуки, слідкувати за появою окремих слів і визначати їх значення; лексикографією - послідовно застосовуючи принцип комп’ютерної обробки реального мовного матеріалу, що використовується у відповідних сферах комунікації, був сформований принципово новий тип словників. Усі сучасні словники англійської мови створюються на базі корпусів, серед них Oxford, Collins, Longman, Cambridge, Macmillan тощо. Граматикою – допомагає дослідити вживання закінченя, суфікса, префікса, зміни наголосу, але отримані результати первинного опрацювання тексту потребують ручного редагування й виправлення помилок, допущених програмою.

Перспективи застосування іншомовних корпусів у процесі навчання іноземних мов визначаються в тому, що для побудови більшості широковідомих корпусів англійської мови використовуються зразки мовного матеріалу, дібрані не лише з художньої літератури, але й писемних та усних інших джерел. Корпусна лінгвістика є незалежною від інтуїції і таким чином відтворює більш-менш об’єктивну картину вживання тієї чи іншої лексичної чи граматичної одиниці. У методиці навчання найчастіше використовують учнівські корпуси, адже метою їх створення вважається можливість проведення їх аналізу для виявлення різноманітних засобів та методів покращення викладання та полегшення засвоєння іноземної мови. Основну інформацію для створення та поповнення бази учнівського корпусу (усні та письмові тексти) надають люди, які вивчають іноземну мову. Учень стає не тільки співавтором мовних правил та закономірностей, а й, завдяки сучасним електронним технологіям, можуть створювати свої корпуси. Також за допомогою конкордансів можна знайти способи вживання слів, які мають декілька варіантів написання.

В англомовних школах за кордоном популярним є використання конкордансів та інших корпусних ресурсів у навчанні граматики, лексики, читання, письма. Перевагою корпусного методу навчання є те, що працювати з корпусом можна через Інтернет, за допомогою якого учені без проблем виконують домашнє завдання.

Найбільш відомими представниками корпусів англійської мови є Brown Corpus – перший в історії, корпус базується на англійській мові та американського варіанту англійської мови; British National Corpus – містить понад 100 млн. слововживань; The International Corpus of English (ICE) - відображає слововживання в різних варіантах англійської мови; American National Corpus створений за зразком Британського національного корпусу.

Додаток 1

Мінікорпус корпусної термінології, який створив відомий російський дослідник корпусної лінгвістики Захаров Віктор Павлович
(фрагмент)

Термін

Цитата

Corpus

Corpora are sources of quantitative information beyond compare.

Corpus

Leech (1992) argues that the corpus is a more powerful methodology from the point of view of the scientific method, as it is open to objective verification of results.

Corpus

Whatever philosophical advantages we may eventually see in a corpus, it is the computer which allows us to exploit corpora on a large scale with speed and accuracy.

Corpus

However, the notion of a corpus as the basis for a form of empirical linguistics is different from the examination of single texts in several fundamental ways.

Corpus

In principle, any collection of more than one text can be called a corpus, (corpus being Latin for "body", hence a corpus is any body of text). But the term "corpus" when used in the context of modern linguistics tends most frequently to have more specific connotations than this simple definition.

Corpus

We are therefore interested in creating a corpus which is maximally representative of the variety under examination, that is, which provides us with an as accurate a picture as possible of the tendencies of that variety, as well as their proportions.

Corpus

Nowadays the term "corpus" nearly always implies the additional feature "machine-readable". This was not always the case as in the past the word "corpus" was only used in reference to printed text.

Corpus

There is often a tacit understanding that a corpus constitutes a standard reference for the language variety that it represents. This presupposes that it will be widely available to other researchers, which is indeed the case with many corpora - e.g. the Brown Corpus, the LOB corpus and the London-Lund corpus.

Corpus

Part-of-speech annotation is useful because it increases the specificity of data retrieval from corpora, and also forms an essential foundation for further forms of analysis (such as syntactic parsing and semantic field annotation).

Corpus

Problem-oriented tagging (as described by de Haan (1984)) is the phenomenon whereby users will take a corpus, either already annotated, or unannotated, and add to it their own form of annotation, oriented particularly towards their own research goal.

Corpus

In this session we will examine a few of the roles which corpora may play in the study of language. The importance of corpora to language study is aligned to the importance of empirical data. Empirical data enable the linguist to make objective statements, rather than those which are subjective, or based upon the individual's own internalised cognitive perception of language.

Corpus

It is important to note that although many linguists may use the term "corpus" to refer to any collection of texts, when it is used here it refers to a body of text which is carefully sampled to be maximally representative of the language or language variety.

Corpus

A linguist who has access to a corpus, or other (non-representative) collection of machine readable text can call up all the examples of a word or phrase from many millions of words of text in a few seconds. Dictionaries can be produced and revised much more quickly than before, thus providing up-to-date information about language. Also, definitions can be more complete and precise since a larger number of natural examples are examined.

Corpus

Grammatical (or syntactic) studies have, along with lexical studies, been the most frequent types of research which have used corpora.

Corpus

Because a corpus is sampled to maximally represent the population, any findings taken from the corpus can be generalised to the larger population. Hence quantification in corpus linguistics is more meaningful than other forms of linguistic quantification because it can tell us about a variety of language, not just that which is being analysed.

Corpus

Most European languages (not to mention Chinese, Japanese, Korean etc.) now have some sort of corpus already and there is a growing awareness that a good corpus can be put to many uses; hence their importance grows. Despite initial disapprovals voiced by some linguists, doubts are dispelled by obvious and indisputable facts: nobody has ever been able to manually collect and subsequently process so much data in his or her lifetime as the computer can in a very short time.

Corpus

It may still be premature to try to mark out exhaustively what corpora may do for language studies and linguists; undoubtedly, many new options are still to come while the appetite of linguists is gradually whetted and new ways of corpus exploitation are offered by corpus linguists. In fact, it is hard to see a linguistic discipline not being able to profit from a corpus one way or another, both written and oral. It is increasingly clearer that new ways and methods for retrieving information from corpora will have to be given more thought.

Corpus

Since any language needs a consistent, perpetual and next-to-exhaustive coverage of its data, it should have a corpus of corresponding qualities, although in practice it is a gradual business of taking many minor decisions in the course of its construction and maintenance. This is particularly important in the case of small languages, which, unlike English and other languages, cannot afford the luxury of having a variety and multitude of corpora for specific purposes, at least not at the moment. What is really needed is a steady increase and perpetual growth of even, by present standards, very large corpora of billions of words, which should be as much representative as possible.

Corpus

Although the degree of the coverage of language by a large corpus is considerable, it is by no means true that today's corpora reflect language as a whole. Moreover, some corpus linguists are becoming more and more susceptible to another challenge here, namely the degree of representativeness of this coverage, which is very much an open issue and matter of much dispute.

Corpus

As information is to be found coming from all fields of human life and activity, it is hard to imagine that corpora can be based on a collection of, perhaps, newspapers only. On the other hand, this diversity of sources suggests that a mapping of proportions in which various kinds of information occur should take place and be reflected in the design and structure of the corpus, should this be a general type of corpus. This raises the problem of the corpus representativeness, mentioned above.

Corpus

More generally, one may wonder where this trend actually fits in, in an attempt to pursue purely practical and utilitarian goals, or in one aiming at an exhaustive, systematic and non-eclectic description of one's language. Corpora definitely offer the latter possibility.

Corpus

Corpora are cross-sections of a discourse universe comprising all communication acts. The texts they monitor are principally transient communication acts.

Corpus

It is the task of the linguist to define and delimit the scope of the discourse universe she or he is interested in in such a way that it can be reduced to a corpus. Parameters can be language, time segment, region, situation, external and internal properties of texts, and many others.

Corpus collection

Corpus collection continued and diversified after the diary studies period: large sample studies covered the period roughly from 1927 to 1957 - analysis was gathered from a large number of children with the express aim of establishing norms of development.

Early corpus linguistics

All the work of early corpus linguistics was underpinned by two fundamental, yet flawed assumptions:

The sentences of a natural language are finite.

The sentences of a natural language can be collected and enumerated.

Додаток 2

ГЛОСАРІЙ

  1. Corpus linguistics is the study of language as expressed in samples (corpora) of "real world" text.
  2. A corpus (plural corpora) or text corpus is a large and structured set of texts (nowadays usually electronically stored and processed).
  3. Alignment the practice of defining explicit links between texts in a parallel corpus.
  4. Aligned parallel corpora is a multilingual corpora that have been specially formatted for side-by-side comparison.
  5. A parallel corpus is a corpus that contains a collection of original texts in language L1 and their translations into a set of languages L2 ... Ln. In most cases, parallel corpora contain data from only two languages.
  6. Annotation the practice of adding explicit additional information to machinereadable text.
  7. Annotated corpus - corpus enhanced with additional linguistic information.
  8. Aligned reciprocate parallel corpus is a corpus where texts and their translations are aligned, sentence by sentence, phrase by phrase.
  9. Parsed corpora - some corpora have further structured levels of analysis applied. In particular, a number of smaller corpora may be fully parsed.
  10. A concordance is an alphabetical list of the principal words used in a book or body of work, with their immediate contexts.
  11. A bilingual concordance is a concordance based on aligned parallel text.
  12. A topical concordance is a list of subjects that a book (usually The Bible) covers, with the immediate context of the coverage of those subjects.
  13. Full parsing a form of grammatical analysis which represents all of the grammatical relationships within a sentence.
  14. Skeleton parsing a form of grammatical analysis which represents only a basic subset of the grammatical relationships within a sentence.
  15. Thesaurus is a reference work that lists words grouped together according to similarity of meaning (containing synonyms and sometimes antonyms), in contrast to a dictionary, which provides definitions for words, and generally lists them in alphabetical order.
  16. Monitor corpus a growing, non-finite collection of texts, of primary use in lexicography.
  17. Machine-readable – a term to describe textual resources which have been stored on computer.

СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ

1. Ахманова О.С. Словарь лингвистических терминов / О.С. Ахманова. – М. : КомКнига, 2007. – 576 с.

2. Баранов А.Н. Введение в прикладную лингвистику: Учебное пособие / А.Н. Баранов – М. : Эдиториал УРСС, 2001. – 360 с.

3. Бук С. Учнівські корпуси в методиці викладання іноземної мови [Текст] / С. Бук // Теорія і практика викладання української мови як іноземної, 2007. – №2. – С. 19 – 23.

4. Демська-Кульчицька О.М. Деякі аспекти корпусної лінгвістики / О.М.Демська-Кульчицька // Українська мова. – 2005. – № 1. – С. 44 – 51.

5.. Демська-Кульчицька О.М. Основи національного корпусу української мови / О.М.Демська-Кульчицька // Українська мова.. – К., 2005. – С. 219.

6. Демська О. М. Текстовий корпус: поняття і визначення / О. М. Демська // Дивослово. – 2011. – № 10. – С. 35 – 37.

7. Демська-Кульчицька О. М. Що таке корпус текстів? / О.М. Демська-Кульчицька // Культура слова. – 2004. – № 64. – С. 35 – 38.

8. Дідук-Ступ'як Г. І. Лінгводидактичні можливості корпусної лінгвістики [Текст] / Г. І. Дідук-Ступ'як // Наукові записки ТНПУ ім. В. Гнатюка. Сер. Педагогіка. – Тернопіль, 2010. – № 1. – С. 105 – 109.

9. Дубравська Д. М. Внесок корпусної лінгвістики в сучасну лексикографію / Д. М. Дубравська // Наукові записки. Серія «Філологічна». – 2012. – № 27. – С.13 – 16.

10. Жуковська В.В. Корпусна лінгвістика: історична перспектива та сучасний стан / В.В. Жуковська // Материали за 8-а международна научна практична конференция, «Ключови въпроси в съвременната наука». – София, 2012. – Том 18. – С. 72.

11. Захаров В.П. Корпусная лингвистика: Учебно-метод. Пособие / В.П. Захаров. – СПб., 2005. – 48 с.

12. Кошка Н.А. Огляд розвитку та стану корпусної лінгвістики в історичному аспекті / Н.А. Кошка // Наукові записки. Серія “Філологічна”. – 2009. - № 11. – С. 247 – 252.

13. Монахова Т.В. Застосування прийомів корпусної лінгвістики в лексикографії / Т.В. Монахова // Наукові праці. – 2009. – Т. 98, № 85. – С. 55 – 60.

14. Пампурак А. Застосування учнівських корпусів текстів при навчанні лексики іноземної мови / А. Пампурак // Студентські наукові записки. Серія «Філологічна». – 2012. – № 5. – С. 144 – 146.

15. Селіванова О.О. Сучасна лінгвістика: напрями і проблеми : підручник / О.О. Селіванова. – Полтава : Довкілля-К, 2008. – 712 с.

16. Шведова М. Корпусна лінгвістика та лексико-граматична типологія / Марія Шведова, Дмитро Січінава // Українське мовознавство. – 2013. – № 43. – С. 95 – 103.

17. Грабовий П. Використання ресурсів корпусної лінгвістики в процесі підготовки фахівця з англійської мови [Електронний ресурс] / П. Грабовий // Збірник наукових праць Уманського державного педагогічного університету. – 2013. – Ч. 1. – С. 48–54. – Режим доступу: http://nbuv.gov.ua/j-pdf/znpudpu_2013_1_8.pdf. – Назва з екрану.

18. Знаймо [Електронний ресурс] – Режим доступу: http://znaimo.com.ua/Корпусна_лінгвістика. – Назва з екрану.

19. Історія контент-аналізу: створення баз електронних документів, корпусна лінгвістика [Електронний ресурс] – Режим доступу: http://webcache.googleusercontent.com/search. – Назва з екрану.

20.Конкорданс [Електронний ресурс] – Режим доступу: http://uk.wikipedia.org/wiki/Конкорданс. – Назва з екрану.

21. Корпусная лингвистика [Електронний ресурс] – Режим доступу: http://corpora.iling.spb.ru/theory.htm. – Назва з екрану.

22. Корпусна лінгвістика [Електронний ресурс] – Режим доступу: http://uk.wikipedia.org/wiki/Корпусна_лінгвістика. – Назва з екрану.

23. Пампурак А. Учнівські корпуси текстів як відображення мовлення учнів та інноваційна методика навчання. [Електронний ресурс] – Режим доступу: http://oldconf.neasmo.org.ua/node/576. – Назва з екрану.

24. Соснина Е.П. Корпусная лингвистика и корпусный подход в обучении иностранному язику [Електронний ресурс] – Режим доступу: http://ling.ulstu.ru/linguistics/resourses/literature/articles/corpus_linguistics_language_teaching. – Назва з екрану.

25. Candlin N. Christopher. Teaching and language corpora / Christopher N. Candlin. – London : Longman, 1997. – 343 p.

26. McEnery Tony, Wilson Endrew. Corpus Linguistics / Tony McEnery, Endrew Wilson. – Edinburgh : Edinburgh University Press, 2001. – 235 p.

27. Svartvik J. Corpus linguistics 25+ years on / J.Svartvik // Corpus Linguistics 25 Years on. – Amsterdam – New York, NY 2007. – P. 11 – 27.

28. British National Corpus [Електронний ресурс] – Режим доступу: http://www.natcorp.ox.ac.uk. – Назва з екрану.

29. Computer Science and Information Technologies 2009 [Електронний ресурс] – Режим доступу: http://csit2009.org/content/korpus-tekstiv-z-komp%E2%80%99yuternoyi-lingvistyky. – Назва з екрану.

30. Lancaster University [Електронний ресурс] – Режим доступу: http://www.lancaster.ac.uk. – Назва з екрану.

31. Rusling [Електронний ресурс] – Режим доступу: http://rusling.narod.ru/qqq_corp_nonslav_engl.htm. – Назва з екрану.

32. WEB-ресурс научно-практических конференцій [Електронний ресурс] – Режим доступу: http://www.confcontact.com/2009ip/crditeli.php. – Назва з екрану.

ВИКОРИСТАННЯ КОРПУСНОЇ ЛІНГВІСТИКИ У НАВЧАННІ АНГЛІЙСЬКОЇ МОВИ