Курсовая работа: Модернизація китайської мови і писемності
Курсовая работа: Модернизація китайської мови і писемності
КАФЕДРА МОВ І ЦИВІЛІЗАЦІЙ
ДАЛЕКОГО СХОДУ
Курсова робота на тему:
Модернизація китайської мови і писемності
Київ 2010
Зміст
Вступ
Розділ 1 Загальна мова та стандартизація вимови
1.1 Створення загальнокитайської мови
1.2 Стандартизація вимови
1.2.1 Основні принципи вибору орфоепічних норм для різночитання
1.2.2 Основні принципи вибору читань географічних назв
1.2.3 Значення документу "Сфера й принципи розгляду читань ієрогліфів”
1.3.Критерії рівнів володіння путунхуа
Розділ 2 Упорядкування ієрогліфів і проблема ієрогліфічної писемності на сучасному етапі
2.1 Визначення числа ієрогліфів
2.2 Спрощення й стандартизацію накреслень ієрогліфів
2.3 Стандартизацію читань ієрогліфів
2.4 Стандартизацію структури словників ієрогліфів
Розділ 3 Перехід до алфавітного письма і проблема орфографії
3.1.Різновиди алфавітного письма
3.2 Проблеми орфографії
Розділ 4 Система сполучення двох методів машинної обробки китайських текстів
4.1 Початок дослідження методів обробки китайських текстів
4.2 Способи кодування ієрогліфів
4.3 Новий спосіб "перетворення алфавіту"
Висновки
Анотація
Список використаних джерел
Вступ
З того часу, як у 1840 р. Опіумна війна відкрила двері в самоізольовану Цинську імперію, рік за роком множаться контакти культур Китаю й Заходу, обмін між ними. Спочатку китайцям була відома лише смертоносність західної зброї, потім вони довідалися, що для відновлення зброї необхідно відновити виробництва, нарешті, довідалися й про те, що коріння цих проблем криється у відновленні системи освіти. "Рух 4 Травня" 1919 р. Став кульмінацією просвітительського руху в Китаї. Так само як і в просвітительських рухах на Заході, відновленню системи освіти у Китаї передувало відновлення мови й писемності. На Заході національні мови замінили латинську мову. У Китаї байхуа прийшов на зміну веньяню.
Актуальність теми: Проблема мови й писемності в Китаї набагато складніша, ніж на Заході. Окрім проблеми зближення письмових стилів з розмовною мовою, існує проблема стандартизації вимови загальної мови і її поширення, проблема складності й численності ієрогліфів, за допомогою яких неможливо точно передати звучання слів тощо. Спрощення ієрогліфів, поширення путунхуа, розробка й впровадження проекту фонетичного алфавіту для китайської мови є трьома найважливішими завданнями вже протягом багатьох сотень років. Спрощення ієрогліфів і впровадження алфавіту - це письмовий аспект, поширення путунхуа - мовний аспект. З останніх років правління династії Цин і до тепер ці три завдання виконані поки що тільки частково. Відновлення китайської мови й писемності усе ще триває. Чи потребують відновлення китайська мова й писемність - це питання ще з часу руху за байхуа періоду "4 Травня" є спірним. Після того як рух за байхуа перейшов у рух за спрощення ієрогліфів і перехід до алфавітної писемності, суперечки стають усе більше запеклими й уже поширилися на китаємовні громади в усьому світі. Тому тема моєї роботи актуальна на цей час і буде залишатися актуальною ще протягом багатьох років.
Мета роботи: розглянути основні принципи реформ писемності і машинної обробки китайських текстів, дати оцінку становищу у цій області, яке склалося на цей час.
Методи та завдання роботи: порівнюючи матеріали китайської, української та россійської мов, з огляду на досвід японської мови у цій сфері ми спробуємо:
1. дослідити проблеми, які стають на заваді розповсюдження загальної китайської мови в Китаї та у китаємовних країнах;
2. визначити пункти, що є перешкодою у точному підрахунку ієрогліфів;
3. виділити позитивні і негативні результати реформ спрощення і стандартизації накреслень ієрогліфів;
4. виявити проблеми, які трапляються на шляху вчених- лінгвістів при спробі стандартизації читань ієрогліфів;
5. дослідити, які з методів пошуку ієрогліфів у словниках є найкращими, чому;
6. назвати складності, які виникають при спробах переходу на алфавітну писемність;
7. описати труднощі машинної обробки китайських текстів і способи їх подолання.
Наукова новизна: на матеріалах різних авторів китайської, української, російської мови довести неможливість на даний час переходу до ієрогліфічної алфавітної писемності.
Практичне значення: дослідження проблем таких, як уніфікація читання, уніфікація креслення ієрогліфів, способи роботи з китайськими текстами на ЕВМ, пошук найкращого спосубу знаходження ієрогліфів у словниках полегшує роботу перекладачів та є значною допомогою людям, які пов'язані з китайською мовою.
РОЗДІЛ 1
ЗАГАЛЬНА МОВА ТА СТАНДАРТИЗАЦІЯ ВИМОВИ
1.1 Створення загальнокитайської мови
Загальнокитайська мова спочатку мала назву "гуаньхуа", потім назва була змінена на "гоюй", а в 1955 р. – на "путунхуа". На Тайвані вона як і раніше зветься "гоюй". Термін "путунхуа" існував уже наприкінці династії Цин і спочатку являвся загальною мовою, яку всі можуть розуміти; твердий стандарт був відсутній. В 1955 р. путунхуа дали визначення: "Загальна мова китайської нації, основою якої є північні діалекти, стандартною вимовою - пекінська вимова, граматичною нормою - зразкові твори на байхуа". Зміст зміни назви на путунхуа полягає у тому, що цим виражається рівноправність усіх національностей Китаю, заперечується нав'язування путунхуа національним меншинам. Прийнята в 1982 р. нова Конституція КНР установлює, що "держава поширює путунхуа, який є загальновживаним по всій країні". Якщо розуміти під "загальновживаним по всій країні" і його вживання в районах проживання національних меншин, то зміст терміну "путунхуа" буде близький до того, який несе у собі термін "гоюй". Звичайно, вираження "загальновживаний по всій країні" зовсім не означає насильницького насадження путунхуа в районах проживання національних меншин: адже в цей час він також є маловживаним у районах, де широкого поширення здобули діалекти китайської мови. Загальнокитайська мова в Республіці Сінгапур і в інших ареалах поширення китайської мови за межами КНР називається "хуаюй". Я вважаю, що "хуаюй" – є дуже вдалою назвою, що може використовуватися в будь-якій країні, будь-якому регіоні, у різному оточенні. Той факт, що аж до теперішнього часу китайська мова не має єдиної загальної назви, показує, що, хоча китайська мова має дуже древню історію, загальнокитайська мова усе ще дуже молода. [1, 363 – 375] .
1.2 Стандартизація вимови
Встановлення стандарту вимови - це показник того, що загальна мова досягла "повноліття". Результатом історичного розвитку, у ході якого протягом тисячі із зайвим років при династіях Ляо, Цзинь, Юань, Мін, Цин столицею Китаю був Пекін є те, що « пекінська вимова є стандартною вимовою путунхуа ». В 1913 р. на Конференції по уніфікації вимови ієрогліфів методом голосування, при якому кожна провінція мала один голос, більшістю голосів як стандарт була затверджена не пекінська, а штучно створена вимова. В 1924 р. від цієї штучної вимови відмовилися на користь "стандарту, що ґрунтується на пекінській вимові". Можна сказати, що 1924 р. є "роком повноліття" загальної мови. З 1913 по 1924 р., протягом 10 років, сформувалося розуміння "стандартної вимови, основою якого є пекінська вимова". Визначення путунхуа 1955 р. - це не більш ніж проходження історичної реальності [2,13][3 ,13].
1.2.1 Основні принципи вибору орфоепічних норм для різночитання
У пекінському діалекті існує чимало слів, що мають два й більше читання. Для цих "слів з різноманітним читанням" потрібно встановити стандарт вимови. Заснована в 1956р. Орфоепічна комісія путунхуа в 1957, 1959 і 1962 р. опублікувала три частини "Проекту списку слів з рекомендованим читанням", до яких було включено 170 назв, головним чином назв міст і повітів. В 1963 р. вищезгадані матеріали були видані у вигляді брошури з "Проектом збірного списку слів путунхуа з рекомендованим читанням, що складається із трьох частин" (видавництво Комітету реформи писемності). Надалі робота в цій області протягом тривалого часу перебувала в стані застою. Орфоепічна комісія путунхуа була відтворена й відновила свою діяльність тільки в 1982 р.
В 1956 р. були визначені принципи вибору орфоепічних норм для різночитання. Їхній головний зміст зводиться до наступного:
1. Читання пропонується для слова, а не для ієрогліфа. Наприклад, слово 波浪 "хвиля" має два читання:bolang і polang, які необхідно піддати розгляду. Ієрогліф же 率 хоча й має два читання, але в слові "ефективність" має читання lu, а в слові "керувати" - тільки shuaі, і ці читання не є об'єктом розгляду.
2. Коли деякі читання ряду ієрогліфів у пекінському діалекті не настільки широко поширені, то, навіть при їхній невідповідності з загальними закономірностями розвитку пекінської вимови, їх все-таки можна використовувати; у той же час варто враховувати, наскільки широко дане читання поширене в північних діалектах. Ці читання не відповідають загальним закономірностям, однак використовуються, тому що широко поширені в пекінському діалекті, а також у більшості північних діалектів .
3. Читання вибираються за принципом віднесеності медиалей до категорії кай або хэ, до того ж перевага віддається категорії кай; при цьому як стандарт береться розмовна вимова. Наприклад, ієрогліф 淋 “мокнути” читається lin, а не lun або lűn.
4. Ієрогліфи, які в стародавності читалися вхідним тоном і мали на кінці складу глухі приголосні, у пекінському діалекті можуть читатися різними тонами, у тому числі й першим тоном. Для них, як правило, пропонується читання рівним тоном, наприклад знак 吸 'подих' - як xі, 击 'збити' - jі. В інших випадках кожний ієрогліф розглядається окремо й вибирається найпоширеніше читання.
5. Для кожного складу вибирається, як правило, одне читання, однак невелике число слів зберігає два читання. Наприклад, знак 血 'кров' читається xіe і хue [4,241-245].
1.2.2 Основні принципи вибору читань географічних назв
Основні принципи вибору читань географічних назв зводяться до наступного:
1. Якщо місцеве читання географічної назви відрізняється від його пекінського читання, то як стандарт береться пекінське. Наприклад, ієрогліф 郿 у назві повіту Мэйсянь має місцеве читання mi, а в Пекіні читається meі; ієрогліф 略 у слові Люэян має місцеве читання luo, а пекінське - lűe. Читання цих ієрогліфів змінюється відповідно до фонетичних закономірностей, як стандарт береться пекінське.
2. Якщо деякі ієрогліфи, що позначають географічні назви, мали в минулому певні особливі читання, які зараз співпадають із місцевими, то, виходячи із принципу "ім'я дається хазяїном", читання цих назв змінам більше не підлягають. Наприклад, власне ім'я 郦 样 читається Yueyang, а не Liyang, 藉虞 читається Xіeyu, а не Jіeyu .
3. Якщо ряд ієрогліфів, що позначають географічні назви, мав у минулому особливі читання, з якими сучасні читання не збігаються, то в цьому випадку відповідно до закономірностей співвідношення пекінської й місцевої вимови ці ієрогліфи одержують читання на путунхуа. Наприклад, установлено, що власне ім'я 翮仄 читається Heze (а не Geze).
1.2.3 Значення документу "Сфера й принципи розгляду читань ієрогліфів”
В 1982 р. після поновлення роботи Орфоепічної комісії був додатково розроблений документ "Сфера й принципи розгляду читань ієрогліфів". Його основний зміст:
1. Сфера розгляду
а) Розгляду підлягають тільки читання слів путунхуа, включаючи читання розповсюджених у путунхуа вэньянизмів, чэньюїв, афоризмів; читання діалектних слів (включаючи пекінський місцевий говір) і слова древньокитайскої мови не розглядаються;
б) розглядаються тільки різночитання з розмовної мови, нові читання й слова, що з'явилися лише в останні роки;
в) розглядаються тільки читання складних ієрогліфів, що позначають імена, прізвища людей і географічні назви, які з'явилися в пресі в останні роки.
2. Принципи розгляду
а) При розгляді читань окремих слів необхідно виходити з вимог відповідності закономірностям еволюції фонем пекінського діалекту, а також зручності з погляду вивчення путунхуа у районах, де говорять на діалектах; необхідно виходити також з реальної ситуації, враховуючи вимову, яка звична для більшості мовців. Наприклад, ієрогліф 播 'передавати' у слові 播音机 'радіо' у старих словниках читався BÒ, а в цей час більшістю читається як BÓ;
б) при виборі читань імен і прізвищ, географічних назв перевага віддається сучасному читанню ніж старому, більше розповсюдженому ніж менш розповсюдженому, більш звичному для більшості ніж менш звичним; до принципу "ім'я дається хазяїном" необхідно підходити обережно; варто враховувати, чи торкається дане читання діалектного і якщо так, то як воно співвідноситься із читанням на путунхуа. Діалектний варіант у цьому випадку не підходить. Наприклад, власне ім'я 江西з діалекту провінції Цзянси не слід транскрибувати Yanshan, тому що в цьому діалекті ієрогліф 'графіт' зі слова 铅 'олівець' теж читається yan;
в) якщо ієрогліф має одне значення, але кілька читань, то останні також поєднуються в одне за допомогою таких методів, як скорочення, перегляд і доповнення. Наприклад, ієрогліф 指 'палець; показувати, мати на увазі' читається zhі (у слові 指甲 'ніготь'), zhі (у слові 手指 'палець'), zhі (у слові 指 'показувати'). Всі ці читання можна замінити одним – zhǐ。
"Проект зведеного списку слів путунхуа з рекомендованим читанням, що складається із трьох частин", був розглянутий ще раз, після чого він придбав характер офіційного документа. Зміст його також було розширено. Розгляд читань(вимови) відбувається, виходячи з огляду на ситуацію, що склалася на континентальному Китаї. Але питання, чи можна застосувати результати цих реформ у інших китаємовних громадах, ще потребує детального вивчення і дослідження.
Вибір орфоепічної норми для різночитанні - це один з аспектів нормалізації китайської мови. Ще один її аспект - упорядкування лексики, головним чином науково-технічної термінології, а також імен і географічних назв, що є фонетичними запозиченнями. Калькування може бути здійснено багатьма способами; для фонетичних запозичень перешкодою служать ієрогліфи- омофони й діалектні читання. Сьогодні, коли швидко розвивається наука й техніка, у широких масштабах здійснюється гуманітарний обмін, нормалізація фонетичних запозичень перетворилася для китайської мови у важливу проблему. Тільки після того, як новий термін проіснує багато років, намічається тенденція до його однакового перекладу. Наприклад, термін "лазер" спочатку переводився методом фонетичного запозичення й читався лайсай, а згодом став переводитися калькою цзигуан, тоді як за межами континентального Китаю він переводиться й по-іншому, наприклад лэйшэ. Після приходу в США до влади Рейгана з'явилися різні способи транскрибування його прізвища, такі, як Лигэнь (Пекін), Лэйгэнь (Тайвань), Легэнь (Гонконг); при цьому використовуються різні ієрогліфи, що читаються також по-різному. В останні роки всі наукові й спеціалізовані організації приділяють велику увагу уніфікації термінології, проводять безліч нарад з питань вибору й твердження термінів, обговорюють проблему скорочення числа термінів- омонімів, видають багато різних термінологічних словників. Це зіграло відому роль у нормалізації, однак попереду ще чекає великий обсяг роботи. Появи в різних китаємовних громадах різних варіантів того самого терміна уникнути важко. Якщо виявиться можливим скоротити розбіжності й збільшити кількість однакових термінів, то використання китайської мови (хуаюй) на міжнародному рівні стане більш зручним.
1.3 Критерії рівнів володіння путунхуа
Ключовою ланкою в поширенні путунхуа є підготовка викладачів. У Пекіні й у всіх провінціях є "курси вивчення путунхуа", обов'язкові для викладачів мови й писемності навчальних закладів усіх типів. Щоб забезпечити більш точну оцінку знань, останнім часом в експериментальному порядку розроблений документ "Критерії рівнів володіння путунхуа". Перший рівень означає вміння вільно вживати стандартний путунхуа, а також точна вимова звуків і тонів при читанні розповсюджених ієрогліфів; обороти мови й інтонація повинні відповідати стандарту, лексика й граматика - бути нормативними; не допускається вживання діалектизмів під час публічних виступів, декламації й у бесідах. Другий рівень означає вміння вживати путунхуа який відповідає стандарту, але можуть проскакувати діалектизми у вимові; звуки й тони при читанні розповсюджених ієрогліфів повинні вимовлятися чітко, неточності в їхній вимові повинні відчуватися й виправлятися мовцям самостійно; обороти у мові й інтонація в цілому повинні бути правильними, лексика й граматика - у цілому відповідати нормі; діалектизми під час публічних виступів, декламаціях й у бесідах не повинні впливати на взаєморозуміння. Третій рівень означає вміння говорити не на стандартному путунхуа; при цьому звуки й тони в основному повинні бути правильними, лексика й граматика - в основному відповідати нормі; вимова під час офіційних виступів і бесідах має в цьому випадку помітний діалектний відтінок, а взаєморозуміння досягає звичайно 90%. Навички володіння путунхуа, які недосягають третього рівня, відносяться до підготовчого рівня, а ті, що перевищують вимоги першого рівня виділяються в особливий рівень. Застосовуючи ці критерії, варто висувати диференційовані вимоги з урахуванням розходжень у місці проживання, професії, віці, національності тієї або іншої особи.
Велика радість чути про значні успіхи в поширенні гоюя на Тайвані, також про те, що росте увага до поширення мови хуаюй у Сінгапурі, уживають відповідні зусилля й у Малайзії, з кожним роком росте число курсів по вивченню цієї мови для населення Гонконгу. Поширення путунхуа на континенті поперемінно переживає періоди бурхливого підйому й занепаду, у різних районах відбувається нерівномірно. Недавно в Конституцію внесене положення про поширення путунхуа. Це є сигналом до того, що китайцям треба зібратися із силами й усіляко проводити таку роботу. Те, що в китаємовних громадах по всьому світу загальній мові надається все більше й більше значення, є досить підбадьорюйочою звісткою; цей є наслідком розвитку транспорту й підвищення культури[1,363-375].
РОЗДІЛ 2
УПОРЯДКУВАННЯ ІЄРОГЛІФІВ І ПРОБЛЕМА ІЄРОГЛІФІЧНОЇ ПИСЕМНОСТІ НА СУЧАСНОМУ ЕТАПІ
2.1 Визначення числа ієрогліфів
Число ієрогліфів постійно й повселюдно зростає, при їхньому народженні про це не повідомляється, а коли в певний момент у них зникає необхідність, то після смерті їх не ховають. В ієрогліфічних словниках мертві й живі знаки перебувають поруч і розходження між ними не фіксуються. Скільки ж ієрогліфів потрібно зрештою використовувати для запису сучасної китайської мови? Ніхто не може цього сказати. Дане явище не слід розглядати як таке. Це питання потребує ретельного вивчення і чітких відповідей.
Перепис населення необхідний. Необхідний і перепис ієрогліфів. При переписі населення листуються тільки живі люди. При переписі ієрогліфів повинні листуватися тільки ієрогліфи сучасної китайської мови. "Визначити розміри ієрогліфічної спадщини, видати повний список ієрогліфів сучасної китайської мови - це стане найбільшою подією в історії китайської писемності!". У словниках ієрогліфів всіх епох число включених у них знаків відомо, однак воно не еквівалентне загальному числу ієрогліфів, що є вживаними. Скільки всього древніх і сучасних ієрогліфів? Важко відповісти на це питання. Якщо провести загальний підрахунок не дивлячись на епохи, то його цінність буде невелика. Терміновим завданням є з'ясування того, скільки всього і яких саме ієрогліфів сучасної китайської мови існує . Це має як практичне, так і наукове значення.
Хоча більшість ієрогліфів створена шляхом комбінацій елементів, після завершення такої комбінації вони стають цілісними самостійними знаками. Ієрогліфи не можна механічно розкладати на частини й з'єднувати. Якщо два ієрогліфи 木 'дерево' з'єднати разом, то вони не стануть правильним ієрогліфом 林 'ліс', тому що в останньому накреслення двох знаків 木 'дерево' неоднакове. В ієрогліфах 请'просити' і 谢 'дякувати' ключем є елемент ί 'мова'. Однак під впливом елементів, що перебувають праворуч від нього, його накреслення не може бути в різних випадках зовсім однаковим. Десять тисяч ієрогліфів - це десять тисяч індивідуальних знаків. Така ситуація у величезному ступені відрізняється від існуючої при алфавітному письмі, де "число слів не обмежене, а число знаків обмежене". Наявність невиразно великої кількості знаків є корінною причиною того, що ієрогліфи важко вчити й незручно використовувати. Тому з'ясування загального числа ієрогліфів сучасної китайської мови є основним змістом роботи в області впорядкування ієрогліфів[5,258].
Деякі говорять, що число ієрогліфів визначити неможливо. Чи вірна така теорія "неможливості"? Астрономи можуть підрахувати, скільки зірок на небі. Географи можуть визначити розміри океану. Чому ж не можна визначити число ієрогліфів? Звичайно, при цьому дослідника очікує безліч проблем. Насамперед - як розмежувати древнє й сучасне. У сучасному байхуа є цитати, ченъюі, слова з вэньяня; "стародавність" це або "сучасність"? Далі, чи треба при визначенні числа ієрогліфів обмежитися тими, які вживаються в друкованих виданнях, або ж включити в підрахунки й ті, які в друкованих виданнях не вживаються? При переписі населення виявилася безліч дивних ієрогліфів у власних іменах, при переписі географічних назв - безліч дивних ієрогліфів, які використовуються для їхнього позначення. У свій час жоден з них не потрапив у словники й книги, навіть їхнє читання є проблемою. Третя проблема: як довести, що "список ієрогліфів", що у майбутньому буде складений, стане "повним списком"? Чи буде він дійсно вичерпним? [6,56-60].
По статистиці, 6600 ієрогліфів покривають 99,999% всіх ієрогліфів, що зустрічаються в сучасних китайських текстах . Четверта проблема полягає в тім, чи можна "обмежити" число ієрогліфів, до якої межі воно може зростати й з якого моменту потрібно відбирати тільки нові слова, не створюючи нових ієрогліфів? Крім того, є й інші проблеми. Ці проблеми мають бути досліджені і треба знайти відповіді на них, хоча це й нелегко.
В 1981 р. у Пекіні опублікований державний стандарт 2312-80 "Основний набір ієрогліфів, закодованих для використання в ЕОМ", у який включено 6763 ієрогліфів: 3755 ієрогліфів першого й 3008 - другого рівнів. У цей час готуються два "допоміжних набори" приблизно по 8000 знаків у кожному; у них включені ієрогліфи в повному накресленні й різні спеціальні ієрогліфи. Усього в цих трьох наборах - більше 23 000 ієрогліфів, що досить для обробки древніх і сучасних текстів. Крім того, є ще більше 34 000 рідкісних ієрогліфів, які надалі можна додатково звести в декілька "резервних наборів", однак практична користь від цього буде невелика. На Тайвані також розроблений подібний за характером набір ієрогліфів. У майбутньому, якщо виявиться можливим уніфікувати критерії віднесення до тієї або іншої категорії, насамперед критерії віднесення того або іншого знака до ієрогліфів сучасної китайської мови, це зробить досить сприятливий вплив на машинну обробку китайських текстів.
Так як "Список ієрогліфів сучасної китайської мови" ще не з'явився, цей, який містить в собі 6763 знаків "Основний набір" можна використовувати в якості його замінника. Однак вони не рівнозначні. "Основний набір" складений на основі частотності вживання ієрогліфів, і за умов частого вживання в нього повинні входити ієрогліфи древнєкитайскої мови й спеціальні ієрогліфи. "Список ієрогліфів сучасної китайської мови" походить від "типу ієрогліфа". Навіть якщо частотність його вживання невелика, то для включення в список досить того, щоб він використовувався в сучасній китайській мові.
Опублікований в 1981 р. у Японії "Список уживаних ієрогліфів" (включає 1954 знака) за характером близький до 3755 ієрогліфів першого рівня "Основного набору". У японській писемності (а не як окремий спосіб письма) є кана, у пресі й популярній літературі можна застосовувати лише ієрогліфи з "Списку вживаних ієрогліфів", крім того, вони можуть бути замінені каною. Тому Японії потрібний тільки "Список уживаних ієрогліфів", а не "Список ієрогліфів сучасної японської мови". У китайській мові інша справа. По підрахунках, 3 800 ієрогліфів покривають 99,9% всіх уживань ієрогліфів у сучасному китайському тексті. Якщо в одній тисячі випадків, що залишилася, можна було б використовувати букви, то в пресі й популярній літературі вживалося б тільки 3755 ієрогліфів першого рівня "Основного набору". Я на власному досвіді відчула цю проблему, під час перекладів спецдокументації дуже часто трапляються ієрогліфи, яких не має у звичайних та електронних словниках. Але щоб зробити власний внесок у розв'язання цієї проблеми у мене ще замало досвіду. Нажаль у цей час це питання не підлягає розгляданню, проблема заслуговує глубокого вивчення.
2.2 Спрощення й стандартизація накреслень ієрогліфів
Спрощення накреслень є природною тенденцією розвитку письма. В історії завжди існували спрощені ієрогліфи. Якщо ієрогліф уживається часто, то в кожному такому випадку виникає безліч спрощених варіантів його накреслення. Коли імперія Цинь об'єднала 6 царств, "у ній з'явилося багато чиновників з великим колом обов'язків, і тому сформувалося, як засіб, що полегшував їхнє спілкування між собою". Зміст наступних змін письмового письма лішу полягає в його спрощенні. Опублікований в 1935 р. "Перший список спрощених ієрогліфів" (324 знака), на жаль, не був застосований. В 1956 р. був виданий "Проект спрощення китайської писемності" (515 спрощених ієрогліфів і 54 спрощених ключів), в 1964 р. за аналогією з попереднім - "Зведений список спрощених ієрогліфів" (2238 знаків), які вже використовуються в популярних друкованих виданнях континентального Китаю й Сингапуру. Застосування в експериментальному порядку опублікованого в 1977р. "Другого проекту спрощення китайської писемності" припинено через велику кількість наявних у ньому недоліків.
Досвід підтверджує, що спрощення має свої позитивні й негативні сторони. Дітям, які почали вивчати китайську писемність, і учням курсів ліквідації неграмотності спрощені знаки подобаються; вони вважають, що такі знаки легко розпізнавати й писати. Учителі початкових шкіл підтримують спрощення, тому що воно полегшує викладання. Ієрогліфи, спрощені до 6-7 рис, як і раніше зрозумілі. При введенні ієрогліфів в ЕОМ по елементах також виникають побоювання щодо їхньої графічної надмірності. Найбільше схвалення зустрічають знаки фонетичної категорії. Багато хто вимагають переходу на систематичне вживання фонетичних ієрогліфів. Це становить позитивний бік спрощення.
Негативна сторона спрощення полягає в тому, що воно привело до збільшення подібності в накресленні різних ієрогліфів. Збільшилося число ієрогліфів- омонімів, наприклад 迁( qіan 'тягти'), 纤 (xіan 'дрібний'), 干(gān 'сухий'),干( gàn 'працювати'). Збільшилося число фонетичних частин ієрогліфів, що неточно передають їхнє звучання, наприклад фонетична частина 钉(dіng 'цвях') ієрогліфа 灯 (deng 'лампа') - це гірше, ніж фонетична частина 登 (deng 'підніматися') цього ж ієрогліфа в повному накресленні, фонетична частина 定 (dіng 'обов'язково') ієрогліфа 淀(dіan 'мілководне озеро') гірше, ніж фонетична частина 殿 (dіan 'палац') цього ж ієрогліфа в повному накресленні . Прийняття скорописних накреслень як знаки статутного письма збільшило значеннєве навантаження на риси ієрогліфів. Наприклад, такі ієрогліфи, як 书 'книга', 长 'начальник, довгий' незручно писати й класифікувати по ключах. Заміна одних ієрогліфів іншими, що мають таке ж накреслення, збільшила значеннєву плутанину. При вживанні вэньянизмів проблема ще більше загострюється. У ході реформи писемності спочатку реформувалися тільки "сучасні", але не "древні" ієрогліфи. У бібліотеках є велика кількість старих книг, надрукованих ієрогліфами в повному накресленні. Їх продовжують використовувати в Гонконгу й на Тайвані. Різниться накреслення ієрогліфів у старих і нових книгах, у Китаї й за його межами[5,789][13,548-678].
При проведенні спрощення вихідним є принцип "звичності й зручності". Спрощення ґрунтується на звичках мас, що сформувалися в плин тривалого часу, і тому легко проводиться в життя. Колись ходовий скоропис, що застосовувався, Синшу фактично й ліг в основу накреслення спрощених знаків. Однак принципу "звичності й зручності" бракує раціональності й системності, що породжує безліч недоліків. Треба думати, що здійснення раціонального й системного спрощення виявиться досить важкою справою й може натрапити на протидію сили звички. "Другий проект спрощення китайської писемності" виявилося неможливим увести в дію саме тому, що в ньому мав місце відхід від принципу "звичності й зручності" і відповідно повністю змінився звичний вид ієрогліфів.
Різне накреслення тих самих ієрогліфів негативно позначається на культурному обміні. Проблема скорочення числа таких накреслень, збільшення їхньої однаковості й в остаточному підсумку стандартизація у всіх китаємовних громадах і навіть у Китаї й у Японії є складним, але важливим предметом дослідження.
2.3 Стандартизація читань ієрогліфів
Стандартизацією читань ієрогліфів зайнялася Конференція по уніфікації читань ієрогліфів,яка відбулася ще в перші роки після утворення Китайської республіки. "Розгляд читань" путунхуа може сприяти стандартизації як вимови слів усної мови, так і літературних читань ієрогліфів. Транскрипція різних читань ієрогліфів у різних словниках не збігається, і в цей час ведеться вивчення шляхів її уніфікації. Крім того, є ще проблема "різночитання". В одному зі словників зібрано 7000 ієрогліфів, з яких 700 мають декілька читань. Читання 40% цих ієрогліфів можуть бути уніфіковані. У випадку, якщо це неможливо, виявляється достатнім точно визначити, коли і як читається той або інший ієрогліф, що теж буде стандартизацією.
2.4 Стандартизація структури словників ієрогліфів
Протягом останніх 50 років були розроблені всілякі способи пошуків ієрогліфів у словнику. У цей час чотирма основними способами вважаються: пошук по ключам, пошук по останній рисці, пошук по кутах і фонетичний спосіб. Однак усім їм бракує уніфікованості й твердої стандартизації. Способом, якому необхідно стандартизувати в першу чергу, є пошук ієрогліфів по ключам. У різних словниках застосовуються різні способи пошуку ієрогліфів по ключам, існують розходження в числі ключів, їхньої класифікації, по-різному підраховується кількість рис, різниться порядок їхнього накреслення. Це положення необхідно якнайшвидше змінити.
Коли виникла необхідність уводити ієрогліфи в ЕОМ, украй актуальним стало дослідження способів кодування ієрогліфів. Кодування також здійснюється за принципами, що лежать в основі структури словників ієрогліфів. Про це я розповім нижче.
Протягом останніх 50 років багато з людей у Китаї й за його межами, застосовуючи нові концепції й методи, досліджували впорядкування ієрогліфів й інші проблеми. У результаті нагромадження матеріалу й знань у цей час відбувається становлення "сучасної теорії ієрогліфічного письма" . Традиційна теорія ієрогліфічного письма (стара назва - "мала наука", або "теорія письма"), що займається дослідженням походження накреслень і читань ієрогліфів і вивчає процес їхньої еволюції, є "історичною теорією ієрогліфічного письма». Сучасна теорія ієрогліфічного письма походить зі школи історичної теорії ієрогліфічного письма. Об'єктом її дослідження є особливості ієрогліфів сучасної китайської мови й пов'язані із цим проблеми, метою - обслуговування їхнього вживання зараз і в майбутньому. Проблеми, які досліджуються сучасною теорією ієрогліфічного письма і методи дослідження значно відрізняються від проблем і методів історичної теорії ієрогліфічного письма. Використовуючи як основу лінгвістику, сучасна теорія письма сполучить її з такими суміжними дисциплінами, як кібернетика, статистика, психологія. Це - не зневага або зрада щодо історичної теорії ієрогліфічного письма, а модернізація китайської писемності.
На мій погляд підрахувати кількість ієрогліфів китайської мови не можливо, так як мова жива і постійно змінюється, так і ієрогліфи народжуються нові і помирають маловживані, так дослідження китайських вчених підтверджують мої слова. Реформу стандартизації читань вважаю досить вдалою, так як за 4 роки навчання у моєму досвіді було лише декілька разів, що я не могла знайти значення ієоргліфа, бо він мав декілька читань.
Інша ситуація склалася з реформою стандартизації накреслень ієрогліфів: спрощені ієрогліфи на континентальному Китаї і старі на Тайвані і у Гонконгу. Положення не можна змінити, так склалося історично, що ці частини Китаю йому не належали протягом довгого часу. Уряд Китаю не робить жодних зусиль у вирішенні цієї проблеми, так як Тайвань і Гонконг так і залишаються незалежними, щоб потрапити туди треба оформлювати візу. Тому не відбувається культурний обмін жителів континентального Китаю і цих частин, кожний зберігає свою культуру.
РОЗДІЛ 3
ПЕРЕХІД ДО АЛФАВІТНОГО ПИСЬМА І ПРОБЛЕМА ОРФОГРАФІЇ
3.1 Різновиди алфавітного письма
Опублікований в 1918 р. алфавіт "чжуінь цзиму" (згодом переіменований в "гоінь фухао") мав в історії китайської писемності епохальне значення. На жаль, він став лише допоміжним засобом, а не ввійшов у писемність у якості її складової частини як це відбулося з каною у Японії. При створенні чжуінь цзиму був використаний метод розподілу складу на три, з чим була зруйнована традиція розподілу складу на дві частини - ініціаль і фіналь, що також мало прогресивне значення.
Головний недолік чжуінь цзиму - у тім, що букви цього алфавіту створені з елементів китайського ієрогліфічного письма, а це ускладнює міжнародний обмін. Тому в 1928 р. був розроблений ще один алфавіт - романізований (GR). У романізованому алфавіті латинські букви були "китаїзованими" і використовувалися відповідно до особливостей китайської мови, а не в їхніх звичних функціях в англійській або іншій західній писемності. Якби із самого початку використовувався "спрощений" романізований алфавіт, то зараз, можливо, він застосовувався б скрізь. В 1933 р. у Китаї стала відома розроблена в Радянському Союзі "нова латинізована писемність для північних діалектів", що представляє собою ще одну спробу "китаїзації" букв латинського алфавіту.
Деякі говорять, що опублікований у 1958 р. "Проект фонетичного алфавіту для китайської мови" є спадкоємцем латинізованої нової писемності. Це думка невірна. "Проект фонетичного алфавіту" у своїх основних характеристиках наполовину збігається з романізованим, наполовину - з латинізованим алфавітом, а діакритичні знаки для позначення тонів беруть свій початок у чжуінь цзиму. "Проект" поєднує безліч шкіл, а не є продуктом однієї з них[7,224-253].
Під так званим "переходом на фонетичне письмо” у широкому значенні розуміються будь-які випадки вживання алфавіту, у вузькому - досягнення ним статусу офіційної писемності. Фонетичний алфавіт піньінь цзиму досяг тільки статусу "транскрипції", але не офіційної "алфавітної писемності". Для виправлення недоліків "алфавітної писемності" у Китаї й за кордоном у період з 1958 по 1982 р. було розроблено 1667 проектів "алфавітної писемності для китайської мови". На ділі, не пройшовши етапу "транскрипції", абсолютно неможливо одним махом піднятися на вершину й досягти офіційного статусу "алфавітної писемності". Неможливо відкинути "Проект фонетичного алфавіту для китайської мови" і офіційно затвердити який-небудь інший проект у якості "алфавітної писемності". Протягом минулих 25 років відбувалося широке впровадження фонетичного алфавіту піньінь цзиму. Мимоволі виправивши навіть одну його букву – це може викликати надзвичайну плутанину. Фактично статус цього алфавіту вже не можна похитнути. Щорічно його вивчають десятки мільйонів учнів початкової школи й курсів ліквідації неграмотності. Він застосовується для транскрибування читань ієрогліфів у Сінгапурі й Малайзії. Конференція ООН по стандартизації транскрибування географічних назв і Міжнародна організація стандартизації вже прийняли рішення про використання алфавіту піньінь цзиму як засіб стандартної міжнародної транскрипції китайських слів. Майбутня робота, полягає в удосконаленні викладання алфавіту піньінь цзиму й розширенні сфери його застосування, для того щоб алфавіт використовувався паралельно з ієрогліфами й здійснив свою функцію допоміжної писемності, а не у прагненні здобуття ним офіційного статусу "алфавітної писемності", що не має практичного значення.
3.2 Проблеми орфографії
Запис китайського тексту алфавітом вимагає використання як одиниці мови слова. У словах окремо, як ієрогліфи, писати кожний склад неможливо, так само як і писати всі склади в тексті разом. Орфографія відбиває природний ритм мови. Написано разом чи окремо не представляє проблеми для суспільства, що звикло до алфавітної писемності, але в суспільстві, що звикло до ієрогліфічної писемності, є незнайомою й навіть незбагненною проблемою. З метою розв'язання проблем орфографії й інших проблем алфавітного письма у 1982 р. була створена Комісія з орфографії фонетичного алфавіту для китайської мови. "Орфографія" раніше називалася "правилами накреслення ієрогліфів", з 60- х років поступово вкоренився термін "орфографія". Проблема алфавітного письма китайської мови не в морфемі, а в слові. Відмова від розгляду проблем орфографії алфавітного письма на основі "морфеми як основної одиниці мови, затвердження у якості такої одиниці як слова, представляється нововведенням, що має принципове значення.
Завданнями Орфографічної комісії є розробка правил, редагування словників, впровадження норм алфавітного письма. Давайте звернемося до питання розробки правил.
До правил, які необхідно розробити, відносяться правила основні й спеціальні. У цей час всім зацікавленим у цьому інстанціям відісланий для висловлювання думки "Експериментальний проект основних орфографічних правил алфавітного письма".
Розробка основних правил має під собою основу. В 30- е роки були "правила орфографії слів", призначені для романізованого алфавіту. Такі правила мала й латинізована нова писемність в 30- е роки. За останні 25 років були видані різні друковані матеріали на піньінь цзиму, автори яких отримували правила орфографії на практиці. У цей час основні правила орфографії розробляються на базі минулого досвіду. Варто усунути розбіжності й прийняти все те, що одержало загальне схвалення, зберегти всі переваги й виправити недоліки, а досвід застосування алфавіту сформулювати у вигляді письмових правил, що буде зручно для його подальшого застосування. Алфавітне письмо в принципі призначено для запису звуків мови на слух, а орфографія - це правила запису слів для їхнього сприйняття в писемній формі. Поєднання системи, що ґрунтується на слуховому сприйнятті, із правилами, призначеними для сприйняття слів у писемній формі; запис зрозумілої на слух звукової мови алфавітом у формі, зрозумілої при зоровому сприйнятті, - як у тому, так і в іншому випадку, має багато проблем. Давайте виділемо деякі з них[8,175].
1. Що таке слово? Визначення слова, що було б коштовне в теоретичному відношенні й мало б конкретне практичне значення ще не існує. "Теоретичне слово", яке виділяється у граматиці і "формальне слово",яке пишеться разом, важко об'єднати в рамках одного поняття. Є спеціальний граматичний термін, але спеціального орфографічного терміна не існує, відсутність чіткості в термінології веде в ряді випадків до неточностей. В ідеалі орфографія має потребу в єдиному правилі: одне слово пишеться разом, два слова - окремо. На справді все не так просто. Слова важко розмежувати між собою. Існує багато випадків, коли декілька "теоретичних слів" варто писати, як одне "формальне слово". Наприклад, 图书馆 'бібліотека' - це одне слово? Два слова? Три слова? Чому пишеться разом? Що таке 馆 'офіційна установа'? Слово? Морфема? Суфікс? Постпозитивний елемент? Афікс? Показник приналежності до частини мови? Чи таке твердження є логічним: "Іменник (书 'книга') і наступний односкладовий показник приналежності до частини мови (馆) пишуться разом"?
2. Орфографія зв'язана з усіма аспектами мови: її граматикою, семантикою, словотвором, ритмічною організацією. Однак цей зв'язок суперечливий. Не можна враховувати тільки один аспект. При врахуванні декількох аспектів який з них вважати головним? Наприклад, у пропозиції 我吃饭,你吃面 'Я їм рис, а ти хліб' 吃饭 'їм рис' пишеться окремо, а в словосполученні 吃饭问题 'проблема їжі' 吃饭 пишеться разом. Чи правильно це? Змінилися значення слів, однак дієслівно-об'єктні відносини змін не мають. Чому ж ми виходимо не з дієслівно-об'єктних відносин, а зі значень? Знову ж якщо 兄弟 'брати' розуміти 弟弟 'молодший брат', то це слово пишеться разом, якщо ж під ним розуміються 哥哥 和 弟弟 'старший і молодший брати', то воно пишеться наполовину разом (у середині ставиться дефіс). Чи можна, виходячи з формальних критеріїв, і в тім, і в іншому випадках писати разом? [15,378-383].
3. Важливим процесом, що спостерігається в ритмічній організації китайської мови, є його перетворення у двоскладну мову. Це впливає на орфографію, однак вступає в протиріччя із граматикою й словотвором. Наприклад, назва 顺 邑 县 Шуньи сянь 'повіт Шуньи' може вимовлятися як 顺邑Шуньи, а слово сянь 'повіт' при цьому може бути опущено, тоді як назва 峒县Тунсянь 'повіт Тунсянь' не може бути скорочене до 峒Тун (не можна опустити 县сянь 'повіт'). Як тут писати 县сянь? Разом? Окремо? Або із двоскдадовим власним ім'ям писати окремо, а з односкладовим - разом? У назвах островів 鹏胡岛Пэнхудао й Пэнхуледао 蓬岵仂岛писати власне ім'я й ім'я загальне разом, окремо або односкладове ім'я загальне писати із власним ім'ям разом, а двоскладове - окремо? Чому?[14](456,265,734)
4. На орфографію також впливає частотність уживання. Наприклад, числівники й рахункові слова пишутся окремо 三本书(сань бэнь шу 'три книги'), однак 一个игэ (числівник і 'один' з рахунковим словом гэ) за звичкою пишеться разом, тому що воно часто вживається (за характером вживання подібне до невизначеного артикля). Як визначити частотність? Як часто повинне вживатися слово, для того щоб писати його разом?
5. У китайській мові багато "зчіпних слів", які можна писати як окремо так і разом. Як діяти? У вихідній формі писати їх разом, а в її варіантах - окремо? Наприклад, як записувати алфавітом 鞠躬цзюйгун 'кланятися', 鞠了躬цзюйле гун 'поклонився', 鞠了一个躬цзюйле иге гун 'відбив один уклін', 鞠没有цзюй мей ю? – 鞠了цзюйле 'поклонився? - поклонився', 几个躬цзігэ гун? – 一个躬 иге гун 'скільки уклонів? - один уклін'?
6. Слова з веньяня здебільшого односкладові, їх украй важко сприймати на слух, і за характером вони відрізняються від слів байхуа. Якщо в ченъюях веньяня кожне слово писати окремо, то перестане відчуватися єдність тексту й при їхньому вживанні в байхуа буде порушене зорове сприйняття. У контексті такі слова буде складно відокремити від тих, які стоять перед і за ним, що ускладнить читання й розуміння тексту. У японському "Словнику китайської мови" Кураіси Такесіро ченъюі вэньяня пишуться разом в один суцільний ряд що також представляється занадто громіздким. В останні роки намітилася тенденція до компромісного рішення: писати слова або словосполучення з вэньяня через дефіс, що їх одночасно й з'єднує, і роз'єднує, наприклад: 愚公移山Yugong-Yі- Shan 'Юй Гун пересуває гору', 惩前毖后 chengqіan- bіhou 'щоб помилки минулого послужили уроком на майбутнє'. Однак і тут виникає побоювання, що доведеться писати занадто багато дефісів. Як бути?
Під час відсутності затверджених правил написання слів в різних друкованих виданнях, які видаються на алфавіті піньінь цзиму написання 85% слів збігається, у написанні 15%, що залишилися є великі розбіжності. Потрібно прагнути до усунення цих розбіжностей за допомогою звичного "загальновживаного" написання, а цього не можна досягти за короткий час.
"Проект фонетичного алфавіту для китайської мови" дає норму запису складів. Орфографія дає норму запису слів і словосполучень. З'єднання "Проекту" з орфографією й стане добре розробленою системою алфавітного письма[10,68-71].
РОЗДІЛ 4
СИСТЕМА СПОЛУЧЕННЯ ДВОХ МЕТОДІВ МАШИННОЇ ОБРОБКИ КИТАЙСЬКИХ ТЕКСТІВ
4.1 Початок дослідження методів обробки китайських текстів
Деякі говорять, що, коли можлива машинна обробка ієрогліфічних текстів, алфавіт більше не потрібний. Але все навпаки. Без алфавіту ЕОМ не могло стати знаряддям підвищення культури широких мас. ЕОМ, що обробляли ієрогліфічні тексти, потребували значних коштів, у них застосовувалися складні операції, одній людині важко було працювати на такій машині. Масове впровадження ЕОМ можливе було тільки у випадку використання машин, що обробляли тексти, записані алфавітом. Це також вигідно й з боку встановлення зв'язку з міжнародною інформаційною системою. Це так само вірно, як і те, що алфавітні друкарські машинки мали масове застосування, а ієрогліфічні могли експлуатуватися не широким колом людей, а лише спеціально підготовленими друкарками в установах. Для того щоб машинна обробка китайських текстів ішла в ногу з часом , необхідно було використовувати систему, що сполучала два методи: обробляла на ЕОМ і ієрогліфічні тексти, і алфавітні. Перший із цих методів варто було застосовувати організаціям, що мали для цього необхідні людські й матеріальні ресурси й до того ж існувала велика потреба у використанні ієрогліфів. Другий - приватними особами, у родині, у шкільних класах, у порівняно невеликих установах.
У той час багатьма організаціями Пекіна проводилися експерименти з метою створення штучного інтелекту. Наприклад, в Академії китайської медицини ЕОМ використовували для постановки діагнозів хворим, ведення історій хвороби, виписки рецептів; в Інституті мовознавства на ЕОМ проводилися експерименти в рамках діалогу "людина - машина"; в Інституті психології за допомогою ЕОМ ставили експерименти по "розумінню китайської мови". У всіх цих експериментах використовували алфавіт, а не ієрогліфи. Чому? Причина дуже проста: обробка ієрогліфічних текстів вимагала дорогого устаткування й складних процедур. Тому система сполучення двох методів фактично вже існувала, причому машини, що обробляли алфавітні тексти, зайняли провідне положення[9,156-157].
Звичайно, це не означило, що не потрібно було розвивати електронно-обчислювальну техніку, яка обробляла б ієрогліфічні тексти. При обробці ієрогліфічних текстів основні труднощі полягали у введенні ієрогліфів в ЕОМ. До теперішнього часу розроблено більше 400 способів введення ієрогліфів в ЕОМ. Вони підрозділяються на три групи:
1) графічні: ієрогліфи вводяться безпосередньо в ЕОМ у порядку черговості по елементах. Цей метод уже затвердився, підходить для використання в таких великих установах, як друкарні;
2) кодування за допомогою числового коду: більше 400 наявних способів належать головним чином саме до цієї групи;
3) перетворення алфавіту.
4.2 Способи кодування ієрогліфів
Способи кодування ієрогліфів за допомогою числового коду також підрозділяються на кілька видів.
1. Кодування елементів. Елементи, з яких складаються ієрогліфи, бувають великими й малими. Великий елемент відповідає, як правило, ключу ієрогліфа, малі елементи утворяться в результаті подальшого розкладання великого. Кожному елементу відповідає певна клавіша на панелі ЕОМ або ж йому дається певний числовий код.
2. Кодування ієрогліфів за їхніми особливими ознаками. У цьому випадку кодуються певні особливі ознаки ієрогліфів, наприклад третій або четвертий кут, перша або остання риска.
3. Кодування по рисках. Ієрогліфи складаються з рисок, які зводяться до декількох основних видів. Кожному такому виду відповідає клавіша на панелі ЕОМ або ж йому дається певний числовий код. Це старий спосіб, що розвивається на новій основі.
4. Числове кодування: кожному ієрогліфу на підставі його місця в словнику, частотності вживання або якої-небудь іншої характеристики дається числовий код. Найбільш старим і розповсюдженим з таких кодів є чотиризначний телеграфний код.
5. Кодування методом комбінації звучання й накреслення: текст вводиться частково за допомогою алфавіту або алфавітних скорочень, частково - ієрогліфами. Такого роду способів надзвичайно багато.
У той час було неможливо використовувати тільки один спосіб введення ієрогліфів в ЕОМ. Звичайно, неможливо було також використовувати 400 або 40 способів. Чим більше способів - тим вужчий ринок збуту відповідної продукції, застосування такої техніки також створювало масу незручностей. Як можна було скоротити число способів? Шлях рішення питання - проведення єдиної політики в області розробки способів введення ієрогліфів в ЕОМ шляхом класифікації цих способів по групах, концентрації, підйому й стандартизації. Класифікація - це об'єднання всіх способів у зазначені п'ять або деякої іншої кількостей груп. Концентрація - це зведення знаннь про ті чи інші особливості введення ієрогліфів в ЕОМ до якогось загального знаменника. Підйом - це проведення колективних досліджень і загальне підвищення рівня розробок. Стандартизація - це затвердження у якості стандарту кращих з таких удосконалених способів. Кожні кілька років проводилася робота по аналізуванню й удосконалюванню. Застосування цього "четирьохступінчастого методу проведення єдиної політики" прискорило розвиток способів уведення ієрогліфів в ЕОМ[11,56-62].
Корінним недоліком методів кодування ієрогліфів за допомогою числового коду були великі витрати розумової енергії. Необхідна була спеціальна підготовка, вивчене легко забувається; якщо володів одним із цих методів - не володів іншим.
4.3 Новий спосіб "перетворення алфавіту"
У нових розробках в області "перетворення алфавіту" числове кодування зовсім не застосовується. Після уведення китайського алфавіту або алфавітних скорочень в ЕОМ машина автоматично перетворює їх в ієрогліфи. Це стосується як окремих знаків, так і написаних ієрогліфами слів, груп і сполучень слів, речень. У таких ЕОМ клавіш стільки ж, скільки в ЕОМ, що обробляють англійський текст. Досить у початковій школі вивчити китайський фонетичний алфавіт - і не потрібно ніякої спеціальної підготовки.
Об'єднання китайського фонетичного алфавіту й ЕОМ повністю розкриває особливості модернізації китайської мови й писемності. Це не один з 400 способів уведення ієрогліфів в ЕОМ, а зовсім інший метод, що не має нічого загального із графічним способом і кодуванням за допомогою числового коду. Він у корені відрізняється й від методу, що сполучає звучання й накреслення, коли текст уводиться в ЕОМ частково за допомогою алфавіту, а частково - за допомогою числового коду.
На даний час цей спосіб є найрозповсюдженішим, він застосовується скрізь, студенти, які вивчають китайську мову не є виключенням[12,165].
ВИСНОВКИ
У результаті проведеної мною роботи, я з впевненістю можу стверджувати
про:
1) В 1924 р. був прийнятий стандарт китайської мови, що ґрунтується на пекінській вимові, так званий путунхуа. Можна сказати, що 1924 р. є "роком повноліття" загальної мови. З 1913 по 1924 р., протягом 10 років, сформувалося розуміння "стандартної вимови, основою якої є пекінська вимова". Визначення путунхуа 1955 р. - це не більш ніж проходження історичної реальності.
Значні успіхи в поширенні гоюя на Тайвані, також про те, що росте увага до поширення мови хуаюй у Сингапурі, уживають відповідні зусилля й у Малайзії, з кожним роком росте число курсів по вивченню цієї мови для населення Гонконгу. Поширення путунхуа на континенті поперемінно переживає періоди бурхливого підйому й занепаду, у різних районах відбувається нерівномірно. В Конституцію було внесене положення про поширення путунхуа. Це було сигналом до того, що китайцям треба зібратися із силами й усіляко проводити таку роботу. Те, що в китаємовних громадах по всьому світу загальній мові надається все більше й більше значення, є досить підбадьорюйочою звісткою. Ключовою ланкою в поширенні путунхуа є підготовка викладачів. У Пекіні й у всіх провінціях є "курси вивчення путунхуа", обов'язкові для викладачів мови й писемності навчальних закладів усіх типів і публічних людей.
2) "Проект списку слів з рекомендованим читанням" - це документ, зміст якого направлений на уніфікацію читання ієрогліфів китайської мови. Він є значним досягненням у подоланні проблем «різночитання» і значно полегшує вивчення китайської мови. Реформу стандартизації читань вважаю досить вдалою, так як за 4 роки навчання у моєму досвіді було лише декілька разів, що я не могла знайти значення ієрогліфа, бо він мав декілька читань.
3) Важливою проблемою залишається визначення числа ієрогліфів В 1981 р. у Пекіні опублікований державний стандарт 2312-80 "Основний набір ієрогліфів, закодованих для використання в ЕОМ", у який включено 6763 ієрогліфів: 3755 ієрогліфів першого й 3008 - другого рівнів. Ця кількість звичайно не остаточна. На мій погляд підрахувати кількість ієрогліфів китайської мови не можливо, так як мова жива і постійно змінюється, так і ієрогліфи народжуються нові і помирають маловживані, дослідження китайських вчених підтверджують мої слова, тому на сьогодні дослідження у цій сфері тимчасово зупинені.
3) "Зведений список спрощених ієрогліфів" є значним кроком на шляху до застосування китайської мови на міжнародному рівні. Але спрощення має свої позитивні й негативні сторони. Дітям, які почали вивчати китайську писемність, і учням курсів ліквідації неграмотності спрощені знаки подобаються; вони вважають, що такі знаки легко розпізнавати й писати. Учителі початкових шкіл підтримують спрощення, тому що воно полегшує викладання. Ієрогліфи, спрощені до 6-7 рис, як і раніше зрозумілі. Це становить позитивний бік спрощення.
Негативна сторона спрощення полягає в тому, що воно привело до збільшення подібності в накресленні різних ієрогліфів.
Але мої власні дослідження показують, що проблемою є активне використання старих ієрогліфів у Гуанджоу,Гонконгу та на Тайвані. Спрощені ієрогліфи на континентальному Китаї і старі у цих районах. Положення не можна змінити, так склалося історично, що ці частини Китаю йому не належали протягом довгого часу. Уряд Китаю не робить жодних зусиль у вирішенні цієї проблеми, так як Тайвань і Гонконг так і залишаються незалежними, в'їзд до цих районі здійснюється через візовий режим. Тому не відбувається культурний обмін жителів континентального Китаю і цих частин, кожний зберігає свою культуру.
4) Всі спроби створення алфавіту закінчувалися невдачами. На мою думку така мова як китайська не скоро прийде до цього. До того ж самі китайці так пишаються складністю своєї мови, що не поспішають переходити на алфавітне письмо. Але "Проект фонетичного алфавіту для китайської мови" є дуже вдалим, він дає норму запису складів. Орфографія дає норму запису слів і словосполучень. З'єднання "Проекту" з орфографією й стало добре розробленою системою алфавітного письма. Ця реформа стала початком досліждень введення ієрогліфів у ЕОМ і назараз є основою побудови найвдалішого способу друкування ієрогліфів.
5) Протягом останніх 50 років були розроблені всілякі способи пошуків ієрогліфів у словнику. У цей час чотирма основними способами вважаються: пошук по ключам, пошук по останній рисці, пошук по кутах і фонетичний спосіб. Однак усім їм бракує уніфікованості й твердої стандартизації. Це положення необхідно якнайшвидше змінити. Нажаль зараз поки що не існує загальної системи, тому це породжує деякі проблеми у роботі зі словниками. Виходячи з власного досвіду, пошук по ключам є найвдалішим способом, цей метод підтверджує результативність проведених реформ “Розповсюдження путунхуа”, "Проект списку слів з рекомендованим читанням", "Зведений список спрощених ієрогліфів".
6) Об'єднання китайського фонетичного алфавіту й ЕОМ повністю розкриває особливості модернізації китайської мови й писемності.Ви вводите фонетику, а машина видає список ієрогліфів. Тому це не один з 400 способів уведення ієрогліфів в ЕОМ, а зовсім інший метод, що не має нічого загального із графічним способом і кодуванням за допомогою числового коду. Він у корені відрізняється й від методу, що сполучає звучання й накреслення. На даний час цей спосіб є найрозповсюдженішим, він застосовується скрізь, студенти, які вивчають китайську мову не є виключенням у його застосуванні.
Але всі вище згадані реформи і їх результати стосуються лише континентального Китаю. Хоча Тайвань і Гонконг є складовими частинами Китаю, вони залишаються самостійними і, можна сказати, ізольованими від ньго у Гонконгу лише 5-10 % розуміють путунхуа, офіційною мовою тут лишається контонський діалект і англійська мова. Розповсюдження путунхуа у цих районах потребує довгого відрізку часу, культурний досвід нації не легко змінити, лише покоління за поколінням.
Анотація
中国传统的语言学向来以书面材料为重点,汉字的研究占有很重要的地位。这种研究开始得很早,但是一直未从传统的“小学”中独立出来。本世纪初,由于受西方语言学的影响,人们逐渐认识到语言与文字的研究应该分开;到30年代,唐兰先生强调“文字的形体的研究”,他的《古文字学导论》一书标志着现代意义的汉字学的建立。汉字学研究一般可分为古文字研究和一般性汉字研究两大部分。对古文字的研究由来已久,19世纪和20世纪之交大量古文字资料的出土,带来了古文字研究的新高潮,又由于现代语言学的影响,古文字研究的方法大大加强了科学性,逐渐摆脱了旧的金石学和传统文字学的束缚,呈现出了新的面貌。本世纪的前50年,前人对古文字资料作了大量的整理、著录、考释和其他研究工作。本世纪后50年,古文字研究成果更加辉煌。随着新的出土资料的不断增加,研究上也取得了许多新的进展。除了进一步进行整理、著录、考释,编写更新更全的各类古文字字典或文编以外,考释、研究方法也更为先进,越来越多的学者注意从语言的角度利用现代语言学的知识来考释、研究古文字,从而为汉语史研究提供不少新的资料和结论;另外,大家还尽量利用现代化的技术来帮助古文字学的研究,这也有助于提高结论的科学性。古文字研究的各个分支中,战国文字的研究发展得最为迅速。这方面的资料自50年代以来不断有所发现,近年来在战国金文、陶文、玺印文字、钱币文字特别是简牍文字研究上取得了令人瞩目的成绩,彻底改变了过去战国文字研究比较冷落的局面。需要顺便提到的是,本世纪后50年主要是近二三十年来,还加强了对汉代以后、现代汉字以前的文字的研究,特别是俗字的整理研究工作,取得了可喜的成果。在一般性汉字研究方面,诸如汉字的性质、起源,汉字形体的演变,汉字结构的类型,以及《说文》、“六书”等,本世纪前50年均有学者进行研究,并取得较好的成绩。关于汉字性质的问题,70年代末80年代初曾成为讨论的热点,虽然至今并无定论,但有人提出“在认识汉字的性质时,有必要区分文字作为词或语素的符号和文字所使用的符号这两个层次有必要区分文字作为词或语素的符号和文字所使用的符号这两个层次,而汉字的性质应当由汉字的字符的性质来决定”,这种观点已引起了很多人的注意。这种认识无疑比先前认为“汉字是表意文字”,或单纯认为“汉字是语素文字”要科学、深刻得多。关于汉字起源的问题,大家讨论的重点集中在出土的新石器时代的刻划或绘写符号是否汉字的问题上。这个问题从50年代以来也一直是学者们所关注的问题。现在虽无定论,但也有共识,那就是判定这些符号是否汉字应当看它们是否真正用于记录汉语。对于汉字形体的演变,本世纪后 50年也比前50年在认识上更加深入,突出的一点是大多数人认识到了汉字演变过程中正体的关系特别是俗体在整个汉字形体演变中所起的作用。对于汉字结构类型的研究,已有不少人突破了“六书”说的局限,提出了新的“三书说”。还有学者受现代语言学中“音位”、“义位”等概念的启发,提出了“汉字构形学”的说法,认为汉字构形的基本元素是“形位”,并采用计算机处理技术,对古文字的构形系统进行了研究。有关《说文》的研究,后50年也比前50年大有进展。除了继续就与《说文》有关的字体、六书、声韵进行深入研究外,还结合文献典籍和古文字资料,纠正《说文》的错误,并扩展到语言乃至社会文化来进行研究,揭示《说文》所蕴含、反映的语言素材以及社会状况。以上所谈到的各方面的问题,都发表、出版了大量的论著或相关的工具书。本世纪后50年在汉字学研究上还值得一提的是,重视和加强了现代汉字(即“ 现代汉语用字”)的研究,这包括现代汉字正字法的研究,现代汉字定量、定形、定音、定序标准化的研究,现代汉字应用(人际界面的应用和人机界面的应用)的研究,以及现代汉字的前途与现代汉字的评以及现代汉字的前途与现代汉字的评价的研究等。这种研究不仅有助于人们对汉字的学习与应用,有助于提高识字教育和汉字输入的质量,而且为国家制定、推行科学的文字政策提供了理论基础,因此在80年代后迅速形成为汉字学的一个新的分支——现代汉字学。
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ
1.Чжоу Югуань. Модернизация китайского языка и письменность//Новое в лингвистике. – Вып. XXII Языкознание в Китае / Пер. с кит. – М.: Прогресс, 1989. – 467с.
2. Бергер Я.М. Модернизация и традиция в современном Китае // Полис.1995. №5 - 270с.
3. . Яхонтов С.Е. Классификация диалектов китайского языка. – В кн.: Исследования по филологии стран Азии и Африки, Л.,1966 – 289с.
4. Дай Цинся. Язык и нация / Пер. с кит. – Пекин: Центральный ин-т национальных меншинств, 1994. – 341с.
5. 汉语成语大词典。河南人民出版社。 1985。 - 2678.
6. Кочергина В.А. Введение в языкознание (материалы к курсу для востоковедов).М., 1970. – 189с.
7. Софронов М.В. Введение в китайский язык. – М.: Муравей, 1996. – 256с.
8. Горелов В.И. Стилистика современного китайского языка. Учеб.пособие для студентов пед. ин-тов по специальности №2103. «Иностр. яз.». М., «Просвещение», 1979. – 190с.
9. У Юйчжан 1952 – У Юйчжан. У Юйчжан сяньшэн Тань тунъи юй юй фаньянь веньти. «1950 нянь чжунго юйвень веньти луньвень цзияо» Ду Цзынь бянь. Пекин, 267с.
10. Фролова М.Г. Теоретическая фонетика китайского языка (Курс лекции)., М.,1978. – 171с.
11. Языки Юго-Восточной Азии. Проблемы морфологии, фонетики и фонологии. - М., 1970. - С. 256с.
12.《周有光语文论集》四卷本,上海文化出版社2002年出版。- 165
13. Колодко С.А. Китайсько-український словник: 80000 слів. – К.;ТОВ Видавництво «Консультант», 2004. – 1176с.
14.便携饿汉大词典 商务印书馆出版 2001年4月北京第5次印刷。
15.Прядохин М.Г., Прядохина Л.И. Краткий словарь трудностей китайского языка. – М., «Муравей»,2002. – 454с.