Особенности составления тезаурусов по теме «горный и пешеходный туризм»

Оглавление

Введение…………………………………………………………………………..3

Глава 1. Тезаурус как идеографический тематический словарь …..………..5

1.1. Определение понятия «тезаурус»….……………………………...………...6

1.2. Исторический обзор идеографических словарей………...………...............6

1.3. Классификации тезаурусов…………………………………………………12

1.4. Разработка структуры тезауруса…………………………………………...13

Выводы…………………………………………………………………………...14

ГЛАВА 2. Особенности составления тезаурусов по теме «горный и пешеходный туризм».…………………………………………………………...15

2.1 Методы и алгоритм ручного составления тезауруса……………………...15

2.2 Особенности выявления элементов тезауруса «горный и пешеходный туризм» в русском и испанском языках……………………………………......17

2.3 Выявление ключевых слов предметной области в испанском и русском языках…………………………………………………………………………….18

2.4 Классификация элементов тезауруса «горный и пешеходный туризм» в русском и испанском языках…………... ……………………………………....21

2.5 Основные приемы сопоставления элементов тезауруса «горный и пешеходный туризм» в испанском и русском языках ………………………..23

Выводы…………………………………………………………………………...37

Заключение……………………………………………………………………….39

Список использованной литературы…………………………………………...41

Приложения……………………………………………………………………...45


ВВЕДЕНИЕ

В наше время наблюдается возрастание интенсивности информационного потока, что создает определенные трудности ориентации в громадном объеме недостаточно упорядоченных материалов. По мере развития Интернета обостряется парадокс: вероятность присутствия необходимой информации в глобальном информационном пространстве растет, а вероятность ее нахождения - уменьшается. Один из способов решения этой проблемы - информационно-поисковый тезаурус. Его используют как инструмент для организации, индексирования и управления большими объемами данных.

Актуальность темы исследования. Существующих тематических русско-испанских и испано-русских словарей-тезаурусов явно недостаточно, многие отрасли знания остаются незатронутыми, или рассматриваются поверхностно (наиболее употребительные термины и выражения). Так, незаслуженно обходится стороной рассматриваемая в данной работе тематика горного и пешеходного туризма. Однако этот вид туризма становится все более популярен. Как в России, так и в Испании и в испаноговорящих странах Латинской Америки есть масса интересных туристических маршрутов. Самые знаменитые среди них это путь Сантьяго, тропа инков, а также множество горных вершин и вулканов в Андах. Многие разрабатывают и прокладывают собственные авторские маршруты, планируют индивидуальные путешествия. В связи с этим необходимо создать русско-испанский и испано-русский двуязычный тезаурус, составленный из слов и выражений, характерных для описания и употребления в профессиональной среде по теме: горный и пешеходный туризм, а также их толкований.

Такой тезаурус позволит структурировать и накапливать информацию, релевантную для этой области знания, производить смысловой поиск и перевод терминов, а также может способствовать повышению уровня подготовки будущих переводчиков в сфере туристической деятельности.

Целью данного исследования является составление тезауруса по теме «Горный и пешеходный туризм» на материале русского и испанского языков. Для достижения поставленной цели необходимо выполнить ряд задач:

- проанализировать историю создания идеографических словарей;

- рассмотреть классификацию словарей и определить в ней место тезауруса;

- изучить алгоритм составления тезауруса в исследуемой области;

-

Объектом исследования в настоящей работе являются лексические единицы тезауруса «горный и пешеходный туризм».

Предметом исследования будут выступать особенности составления двуязычного тезауруса «горный и пешеходный туризм».

Материалом для исследования послужил корпус текстов (рекламные проспекты, буклеты), туристические сайты, энциклопедии на испанском и русском языках.

Практическая значимость данной работы заключается в возможности использования ее результатов в процессе работы и при профессиональной подготовке переводчиков в сфере туристической деятельности.

В соответствии с поставленными задачами наша работа состоит из введения, двух глав, заключения и списка использованной литературы.

1 ТЕЗАУРУС КАК ИДЕОГРАФИЧЕСКИЙ ТЕМАТИЧЕСКИЙ СЛОВАРЬ.

В настоящее время словарь является одним из самых распространенных видов справочной литературы. Хотим ли мы знать, как правильно пишется то или иное слово, или ищем определение незнакомого термина – сначала мы обращаемся за помощью к словарю. Встречаются словари орфографические, толковые, синонимические, терминологические, тематические, словари названий жителей и многие другие. Но область их применения гораздо шире.

Словари разнообразны по своим типам, зависящим от их задач и целевого назначения. Они выполняют различные функции:

- регистрацию в словесной форме объективных данных о нашем мире в свойственной данному языку и эпохе форме восприятия мира (энциклопедические и толковые словари);

- упорядочение в понятийно-словесной форме субстанции содержания данного языка (идеологические словари, словари-тезаурусы);

- нормализацию словоупотребления с целью облегчения языковой коммуникации (нормативные и терминологические словари);

- систематизацию лексического материала для обучения лексике (учебные словари);

- перевод с одного языка на другой (двуязычные и многоязычные переводные словари);

- разного рода вспомогательные операции для пользования языком (словари-справочники, номенклатуры, специальные словари).

К сожалению, русско-испанские и испано-русские тематические словари представляют большую редкость. Среди них можно выделить «Краткий русско-испанский тематический словарь-памятку» М.А. Григорьева, изданный в далеком 1983 году. Некоторые термины и выражения уже устарели, а раздел, посвященный «переводу бесед по темам: съезды КПСС, партия, советы, профсоюзы, труд, выборы, марксистко-ленинская философия и политэкономия» [5, с. 6] и вовсе требует кардинального перестроения, так как не отражает адекватного политического положения в стране.

1.1 Определение понятия «тезаурус»

Прежде всего, необходимо дать определение термину «тезаурус». Так, большой толковый словарь гласит: «тезаурус – это словарь, стремящийся дать описание лексики данного языка во всём её объёме» [2, с. 388].

В новом словаре методических терминов и понятий тезаурус определяется как «1. Словарь, отражающий смысловые связи между словами, терминами и другими элементами языка. 2. Систематизированная совокупность понятий определенной отрасли науки. Этот термин восходит к словарю английского языка Р. Роже. Под Т. Понимают также словарь, отражающий весь словарный состав языка с исчерпывающим перечнем примеров употребления слов в текстах. В методике этот термин используется и для обозначения систематизированного запаса слов, необходимых для общения на заданную тему» [1, с. 54]. Таким образом, тезаурус можно рассматривать в широком и узком смысле этого слова.

В нашей работе мы будем опираться на определение тезауруса, которое дает Р.З. Загидуллин в своей книге «Теоретические и методологические основы переводческого тезауруса (на материале английского языка для специальных целей)». Он рассматривает тезаурус как «упорядоченное множество понятий некоторой предметной области вместе с заданными в этой области отношениями» [7, с. 27].

Словари, в которых слова располагаются по степени их смысловой близости, называются идеографическими. То есть, тезаурус можно считать одним из видов идеографических словарей.

1.2 Исторический обзор идеографических словарей

Одним из первых дошедших до нас словарей (II в. Н. э.), был словарь Юлия Поллукса «Ономастикон». Настоящее имя Поллукса – Полидевк, ему покровительствовали римские императоры Марк Аврелий и Коммод. «Ономастикон» состоит из десяти книг, каждая из которых представляет самостоятельный трактат, посвященный какой-либо тематике. Так, первая книга посвящена богам, правителям, священнослужителям и армии, вторая – человеку и его строению, седьмая – торговле и денежным отношениям.

Между II и III вв. н. э. древнеиндийский поэт, грамматик и лексикограф Амара Сина (согласно другим источникам, Амара Дэва) составляет санскритский словарь «Амаракоша». Его объем – десять тысяч слов. Толкования даны в стихотворной форме. Состоит «Амаракоша» из трех книг, каждая из которых делится на главы, которые в свою очередь делятся на секции, объединенные общей тематикой. Главное достоинство данного словаря состоит в отображении существующей научной картины мира, устройства общества и кастовых отношений.

Последующее развитие идеографических словарей связано с концепцией о едином мировом языке. Одно из направлений в создании всемирного языка исходило из необходимости сконструировать искусственный философский язык. В основании этого языка должна лежать логическая классификация всего, что может быть предметом человеческой мысли. Значительный вклад в разработку этого вопроса внес испанский философ и богослов Р. Лулль (в латинской огласовке Р. Луллий) (1235—1315). В главном своем труде «Великое искусство» Р. Луллий, описывая технику моделирования логических операций, предлагает оригинальную систему, состоящую из 7 концентрических кругов. Каждый круг содержит обозначение группы понятий. На одном из кругов приводятся девять субстанций: бог, ангел, небо, человек, воображаемое, чувственное, растительное, стихийное, инструментальное. Другой служит для указания на девять абсолютных предикатов: святость, величина, длительность, могущество, знание, стремление, добродетель, истина, слава; третий дает девять относительных предикатов: святой, великий, длительный, могучий и т. п. Субстанциям противополагаются акциденции: количество, качество, отношение и др. Кроме того, элементами системы испанского философа являются понятия, отражающие различные отношения между предметами (различие, тождество, противоречие, начало, середина, конец, больше, равно, меньше) и список вопросов (ли? Что? Чего? Почему? Как велико? Какого качества? И др.). При вращении кругов относительно друг друга возникают различные комбинации понятий, что дает возможность, по мнению испанского философа, находить истины и перечислять все предметы мысли.

В начале XVII в.Р. Декарт обосновывает идею о едином философском языке науке, а в основе такого языка должна лежать классификация всех объектов человеческого мышления.

В 1661 г. Д. Дальгарно представляет словарь философского языка, построенного на основе буквенных сочетаний, где буквы обозначают категории предметов и мышления, а также их отношения. Дальгарно выделяет 17 классов, каждый из которых обозначается согласной буквой. В свою очередь, классы делятся на подклассы, каждый из которых обознается второй буквой, на этот раз гласной. В результате подобного разбиения получаются такие, например, слова: Nyka — слон, Nykn — лошадь, Nyke — осел.

Епископ Д. Уилкинс развивает идеи Дальграно и издает «Опыт о реальном выражении и философском языке» в 1668 г. Понятия, составляющие язык, сводит к следующим классам: трансцендентальные понятия, субстанции, количества, качества, движения, отношения, а их он делит на 40 классов, которые обозначает слогом. Присоединение согласных b, d, g, p, t, с, z, s, n регулируют количество родов. Так, b – означает первый род, d – второй и т.д. Дальше снова присоединяются гласные. Число исходных слов в словаре Уилкинса равно примерно 3000, но по его мнению, их вполне достаточно, чтобы выразить любую мысль.

О необходимости создания всеобщего философского языка высказывались также Лейбниц и Вальтер. Но несмотря на все попытки упорядочения смыслового континуума и создания единого философского языка, или языка науки, он так и не был создан, и такой проект по сей день остается утопией.

Крупной вехой в истории создания словарей стал выход в свет в 1852 г. «Тезауруса английских слов и выражений» П. М. Роже, повлиявший на последующие словари подобного типа, и сегодня представляющий практическую ценность. Роже полагал, что классификация слов по смыслу не возможна, пока не классифицированы предметы действительности. Поэтому работу он начинает с разделения понятийного поля на несколько классов: абстрактные отношения, пространство, материю и дух, разум, волю, чувства. Классы делятся на рода, которые длятся на виды. Виды состоят из пронумерованных групп, которых насчитывается больше тысячи. Группа обозначается словом с широким семантическим значением, благодаря чему удается объединить множество слов с аналогичным значением. Важно, что Роже располагает слова по частям речи и степени их значения: существительные, глаголы, прилагательные и наречия. После каждой группы слов идет группа слов, противоположных по значению. Можно выделить следующие недостатки данного словаря: отсутствие критерия разделения на основные понятийные классы, приоритет логичности над естественной связью слов между ними. Так, академик И.И. Срезневский писал: «Общий взгляд его до того отвлеченный, что Роджет и не замечал, как предметы очень близкие расходились у него по разным частям книги. Так, например, музыка отошла у него к разряду материи, к статьям о звуке, а живопись и ваяние к разряду разумной силы, к статьям о естественных средствах сообщения идей; гражданские власти отошли к разряду воли, к общим статьям об общежительной воле, а дворянство к разряду влечений, к статьям о влечениях внешних» [8, с. 60]. Ввиду отсутствия алфавитного указателя, использование словаря было крайне затруднительно. Впоследствии был добавлен алфавитный указатель. Достоинство труда Роже в том, что это была первая научно обоснованная попытка создания словаря, в котором вся лексика была логически упорядочена.

В 1862 г. Во Франции был издан «Аналогический словарь французского языка». Автор словаря, П. Буассьер выделяет два уровня словарного запаса языка, активный и пассивный. В активный слой входят слова повседневного и спонтанного употребления. Их связь с понятиями настолько прочна, что последние приходят на ум не иначе, как в сопровождении первых. Все, о чем мы думаем, формулируется в нашем сознании при помощи слов активного слоя. Слова пассивного слоя необходимы для наиболее точного, наиболее адекватного выражения мысли. Задача, следовательно, состоит в том, чтобы сократить путь от обиходного слова, часто весьма приблизительно выражающего мысль, к слову единственно необходимому. Буассьер решил эту задачу следующим образом. Он выбирает две тысячи слов из активного запаса, которые располагает в алфавитном порядке. Их Буассьер делает словами-центрами для группы близких по смыслу слов. Такое алфавитно-смысловое расположение слов оптимально при работе со словарем. Интересно, что Буассьер использовал при создании словаря тот же метод, что и Роже. Две тысячи слов-центров, в которых сконцентрирован весь словарный запас французского языка, подобраны не случайно. Буассьер соблюдает пропорции между числом слов-центров и различными областями знания.

Через некоторое время во Франции был опубликован словарь Ш. Макэ, в котором были исправлены недостатки «Аналогического словаря французского языка» и добавлены дополнительное разделение тематических групп Буассьера. Достоинством этого словаря стало удобство использования, быстрый поиск синонимов и антонимов и т.п. Однако, как отмечает В.В. Морковкин, «Алфавитное расположение тематических групп препятствует реализации потенциальных возможностей идеографической классификации лексики. Оно создает своего рода ширму, за которой трудно разглядеть смысловые и ассоциативные нити, тянущиеся от одной тематической группы к другой» [7, с. 71].

Идеографические словари Роже и Буассьера были ориентированы на людей, занимающихся литературным трудом, то есть на тех, кто хорошо знает родной язык. Но в это же время появляется ряд словарей, адресованных изучающим язык. Можно отметить словарь К. Плетца, он состоит из 33 тематических групп, каждая из которых состоит из подтем. Группа «Искусство», например, разделяется на скульптуру, живопись и музыку. Важно, что слова сопровождаются информацией об их употреблении в речи, а сам словарь снабжен алфавитным указателем.

Принимая во внимание общие принципы классификации понятий и характер расположения слов, можно говорить о следующих типах идеографических словарей:

1. Идеографические тезаурусы. Разработка словарей этого типа началась еще в древности, привела к созданию словаря Роже. Основываются на логической рубрикации всего понятийного содержания лексики. Главной сложностью при составлении словарей такого типа является идентификация понятийных групп, с их последующей рациональной классификацией.

2. Еще одним типом идеографического словаря является аналогический словарь. Заслуга теоретической и практической разработки словарей подобного типа принадлежит Буассьеру. В аналогических словарях лексика упорядочивается тематически, но при этом лексико-семантические группы располагаются по алфавиту в порядке следования слов-центров.

3. Учебные идеографические словари. Основная проблема создания такого словаря состоит в идентификации и выборе тем, актуальных для изучения.

Настоящая работа, как мы можем судить по предварительным итогам, посвящена построению идеографического тезауруса. Но что бы быть окончательно уверенными в этом, необходимо рассмотреть другие виды классификаций.

1.3 Классификации тезаурусов

Классификация в ее наиболее общем определении есть разбиение и упорядочение множеств. Ею называют распределение предметов по классам на основании общего признака, присущего данным явлениям или предметам и отличающего их от предметов и явлений, составляющих другие классы. При необходимости каждый класс может делиться на подклассы. Рубрикатор является особой разновидностью классификации, и отличается прагматической классификацией, создающейся на основе информационных потоков и потребностей специалистов. Поэтому они созданы на основе общих положений:

- научная основа построения классификации;

- отражение современного уровня развития науки;

- наличие системы ссылок и отсылок, а также ссылочно-справочного аппарата.

Наиболее полную классификацию тезаурусов приводит И.А. Воронцова [3, с. 9]. Опираясь на работы В.В. Морковкина, Л.П. Ступина, К. Марелло, И. Бурханова, О.М. Карповой, она сформулировала 8 критериев для словарей-тезаурусов, и получила разностороннюю многоуровневую классификацию. Рассмотрим ее подробнее.

По типу смысловых связей между единицами словника тезауруса выделяет словари следующих типов:

1. Идеографический тезаурус

2. Аналогический тезаурус.

3. Ассоциативный тезаурус.

В рамках того же критерия идеографический тезаурус делится на четыре следующих типа:

1. Собственно идеографический тезаурус.

2. Тематический словарь.

3. Систематический словарь.

4. Тематико-систематический словарь.

По степени генерализованности речи тезаурусы делят на общие и специальные. Общие отражают лексику общелитературного языка, а специальные – лексику языковых стилей.

С точки зрения разработки значения лексем тезаурусы делятся на следующие типы:

1. Кумулятивные – представляющие собой группировки лексем без определения их значений.

2. Дефинитивные – содержащие одноязычное толкование каждой лексической единицы.

3. Переводные – раскрывающие смысл лексической единицы посредством другого языка.

Перед нами стоит цель составления русско-испанского и испано-русского тезауруса по теме «горный и пешеходный туризм». Опираясь на вышесказанное, необходимо заметить, что это будет переводной тематический словарь.

1.4 Разработка структуры тезауруса

Структура тезауруса определяется решаемыми задачами, функциональными требованиями и спецификой лексического наполнения языка предметной области.

По языковой направленности тезаурусы бывают одноязычными и многоязычными. Многоязычный тезаурус содержит термины из нескольких естественных языков и представляет эквивалентные по смыслу понятия в каждом из них.

Проектирование структуры двуязычного тезауруса опирается на анализ отечественных стандартов, регламентирующих построение тезаурусов, а также на анализе подходов к построению тезаурусов предметных областей.

По своему составу тезаурусы делятся на тезаурусы, все единицы которых являются дескрипторами (предпочтительными терминами) и тезаурусы, в состав которых входят как дескрипторы, так и аскрипторы (непредпочтительные термины)

Основными единицами тезауруса являются термины предметной области. Согласно ГОСТ 7.25 -2001, тезаурус включает в себя следующие типы лексических единиц: одиночные слова (существительные, прилагательные, глаголы, наречия), именные словосочетания, лексически значимые компоненты сложных слов, сокращения слов и словосочетаний.

Структура словарной статьи тезауруса состоит из следующих элементов:

1. Название термина предметной области, который представляет собой слово, словосочетание или лексически важный компонент сложного слова естественного языка

2. Определение термина, поясняющее на языке термина его смысл или значение. Наличие в тезаурусе определений терминов допускает использование тезауруса в качестве источника знаний о предметной области.

3. Релятор, представляющий собой помету, введенную для различения омонимичных терминов.

4. Множество рубрик – тематических разделов тезауруса.

5. Множество бинарных связей терминов, включая иерархические, ассоциативные отношения и отношения синонимии.

Итак, мы рассмотрели историю создания идеографических тезаурусов, подробно рассмотрели классификацию существующих словарей, а также определили структуру будущего тезауруса. На основании всего вышеперечисленного мы можем сделать следующие выводы:

  1. Тезаурус – это словарь, стремящийся дать описание лексики предметной области или целого языка во всём её объёме.
  2. Философы Нового Времени предложили идею о необходимости создания единого философского языка, или языка науки, но все попытки оказались тщетными, во-первых, по причине сложности и необъятности такой задачи, а во-вторых, по причине неудовлетворительности классификаций понятий, на основании которых предпринимались попытки создания искусственных языков.
  3. Тезаурусы представляют собой разновидность идеографических словарей.
  4. Тезаурус по теме «горный и пешеходный туризм» является переводным тематическим словарем, составленным на основе профессиональной и общеупотребительной лексики.


2 ОСОБЕННОСТИ СОСТАВЛЕНИЯ ТЕЗАУРУСОВ ПО ТЕМЕ «ГОРНЫЙ И ПЕШЕХОДНЫЙ ТУРИЗМ» В ИСПАНСКОМ И РУССКОМ ЯЗЫКАХ

В соответствии с выводами Главы 1, тезаурус, составлению и исследованию которого посвящена наша работа – это идеографический тематический словарь «Горный и пешеходный туризм». Он будет состоять из лексики русского и испанского языков.