Системно-аспектуальное функционирование компьютерной терминологии (29.06.2009)

Автор: Бабалова Галина Григорьевна

Одним из доминирующих методов перевода терминов-словосочетаний (терминов-фразем) является перевод при помощи фразеологического эквивалента (artificial life – искусственная жизнь, computer out of law – компьютер преступник). Вторым доминирующим переводческим приёмом является фразеологический аналог: Address bus – адресная шина. Этот термин обозначает набор линий в системной шине, используемой для передачи сигналов, с помощью которой определяется ячейка памяти. Использование методов подбора фразеологического эквивалента и фразеологического аналога в 44 % случаев позволяет нам сделать вывод о том, что авторы словаря [Заморин, Марков, 1987] при выборе метода перевода исходили из основного требования перевода: «фразеологизм переводится фразеологизмом».

Значительное количество терминов переведено при помощи описательного метода перевода (Business-to-business – электронная коммерция по схеме «бизнес-бизнес» (предприятие – предприятие) – схема оптовой торговли, по которой осуществляются сделки через Интернет). Не менее популярен однословный метод перевода (follow-me-forwarding – переадресация). Термин описывает функцию перенаправления вызова на другой телефонный номер. Однословный перевод вполне обоснован, на наш взгляд, особенно в тех случаях, где описательные глагольные выражения лишены экспрессии и метафоричности.

Приём калькирования фразеологических единиц также популярен (Bare metal – «голое железо»). Термин подразумевает новые аппаратные средства компьютера или неподдержанные никаким программным обеспечением. Гораздо реже используется приём создания индивидуальных эквивалентов, например: lost in the noise – пренебрежимо малая величина. Кроме того, авторы использовали приём стилистического обновления фразы, например: back end – северная часть приложения; full backup – полное страховое копирование; open ended – не ограниченный временем.

Применяется также переводческий приём «просветление» фразы, например: add-on-card – плата расширения; multi-drop – многоабонентская линия; brief case computer – портативный компьютер.

Комбинированный метод перевода: hinged clam-shell construction – конструкция (квадратный ЭВМ), типа «складень»; hot-add – устанавливаемое на ходу (без остановки компьютера); low end PC – младшие (обычно недорогие модели ПК).

В главе 4 второго раздела (п. 2.4.3) предлагается описание опыта машинного перевода текста компьютерной направленности “Enterprise-Level Project Management from Microsoft” [Seymour, 2001, p. 85-86], выполненного электронным переводчиком PROMT XT Office. Во многих случаях перевод далёк от совершенства, однако можно понять, о чём идёт речь. Вполнее естественно, что перевод нуждается в постредактировании, под которым понимается использование переводческих приёмов.

Применение переводческих трансформаций для достижения функциональной эквивалентности при переводе терминологии обусловлено объективными и субъективными причинами. Разноструктурность английского и русского языков – объективный фактор. Наличие образной лексики и конструкций экспрессивного синтаксиса в научно-популярной литературе – субъективный фактор. Тем самым возрастает роль переводчика при передаче и донесении до читателей информации.

Отдельный пункт четвёртой главы второго раздела посвящён лингвистическим проблемам систем машинного перевода, к которым относятся: омоморфия, неоднозначность слов, лексические и структурные несоответствия, устойчивые словосочетания, идиомы, терминология, особенности словообразования. Здесь высказаны некоторые соображения по поводу алгоритмизации переводческого процесса, основанные на концепциях учёных, занимающихся данной проблемой [Брандес, Провоторов, 2001], [Васильева, 2004], [Nord, 1989], [Протасов, 2003], [Узуев, 2005]. Можно попытаться с помощью ЭВМ сделать анализ текста и выявить те его особенности, на основе которых переводчик определяет стилистическую окраску, выбирает лексические единицы из ряда синонимов, омонимов и т.д. Наиболее трудной задачей является разработка системы отнесённости лексем и словосочетаний к определённой области знания.

Предпереводческий анализ текста призван направить внимание переводчика на наиболее значимые моменты в коммуникативной и предметной ситуации исходного текста, а также на существенные характеристики самого текста.

Признание значимости данного этапа для перевода послужило основанием для разработки обучающих моделей анализа текста для людей-переводчиков. Основная задача этих моделей состоит в том, чтобы научить переводчика находить релевантные для перевода, качественно отличные характеристики исходного и целевого дискурсов, определять обусловленные этими различиями переводческие проблемы и намечать пути их преодоления, т. е. переводческие стратегии.

Проводя аналогию между работой человека-переводчика и системой машинного перевода, можно предположить, что предпереводческий анализ текста также имеет определенное значение и для системы МП. Если в случае с человеком анализ призван направить внимание переводчика на наиболее значимые моменты в коммуникативной и предметной ситуации исходного текста, его существенные характеристики, то для системы МП, очевидно, целью предварительного анализа будет определение некоторых параметров текста. Эти параметры выбираются в зависимости от используемой модели перевода, подготавливают текст к обработке (делают возможной работу алгоритмов МП), а также по возможности упрощают анализ текста.

Выбор последовательности изложения темы (т. е. композиции), отбор лексики, грамматических и риторических возможностей определяются не только общей целенаправленностью исходного текста и его жанровой принадлежностью, но и соблюдением тех норм, которые существуют для соответствующей разновидности текстов в языке перевода. Представляется возможным пойти по пути формализации. Алгоритм анализа текста может включать: определение функционального стиля текста, весовых коэффициентов, оценочной функции, учет форматирования переводимого текста в электронных документах.

Прежде чем компьютерная программа сможет выдавать приемлемый перевод, предстоит решить еще множество проблем, как лингвистических, так и проблем реализации на ЭВМ. Практически все существующие программные разработки имеют недостатки одной из этих областей. Учёт форматирования переводимого текста указывает на то, что помимо улучшения собственно алгоритмов перевода, существуют способы, больше связанные с технической стороной дела. Так как эффективность моделей, предложенных лингвистами, напрямую зависит от их реализации разработчиками программ, то, возможно, стоит уделять внимание тем технологиям, на основе которых создаются электронные переводчики и тексты, которые они обрабатывают.

Третий раздел диссертации посвящён компьютерной лексикографии. Представление терминологической лексики в сфере фиксации в отраслевых словарях всегда являлось одной из основных проблем в научно-технической лексикографии. Особую значимость эта проблема приобрела в последние годы для терминографов, создающих специальные словари разных типов в связи с всё возрастающим потоком научно-технической информации и в связи с необходимостью совершенствования систем передачи и обработки информации.

К современным специальным словарям, как к традиционным отраслевым, так и к словарям автоматизированных систем, имеющим разное назначение и решающим разные задачи, предъявляется общее требование: они должны адекватно и достаточно полно описывать функционирующую терминологию той или иной предметной области. Общепризнанным является тот факт, что для адекватного описания терминология должна быть представлена в словаре не как случайный набор зафиксированных в тексте терминов, но как терминологическая система, обладающая своей определённой, характерной для данной отрасли знания структурой.

Нельзя не согласиться с В.М. Лейчиком, который полагает, что «терминосистемой (терминологической системой) можно назвать только упорядоченную (кодифицированную) терминологическую лексику с явно выраженными и зафиксированными в словарях и классификационных схемах отношениями» [Лейчик, 1980, с. 39].

Понимая необходимость системного лексикографического описания научной терминологии, составители специальных словарей стараются использовать наиболее, на их взгляд, удобную и приемлемую методику в своей работе. Лексикографов подстерегает много трудностей, в частности, проблема расположения терминов в словаре таким образом, чтобы в нём была эксплицитно отображена терминосистема. Трудности обусловлены также одновременной принадлежностью термина к двум системам: к понятийной системе отрасли знания (в плане содержания) и к языковой системе (в плане выражения).

В современной лексикографии существуют три способа организации лексических единиц в словаре: 1) алфавитный, 2) алфавитно-гнездовой, 3) идеографический (или понятийно-семантический). Последний – представляется наиболее приемлемым. Идеографический способ расположения терминологических единиц даёт возможность показать системные отношения в подъязыке какой-либо специальности, логико-понятийную структуру терминологии, а через неё – систему понятий данной конкретной области знания и их классификационные (иерархические) связи. Метод экспертного анализа, заключающийся в обязательном участии специалистов данной области знания в построении логико-понятийной схемы, помогает с достаточной степенью точности и объективности отразить логический строй науки и перспективные направления её развития.

В конце 1980-х гг. начали издавать словари компьютерной терминологии в нашей стране. В Америке они появились гораздо раньше. Например, IBM Dictionary of Computing под ред. Джорджа МакДаниэла [1994] пережил 10-е издание в августе 1994 г., т. е. около 20 лет после того, как он был издан впервые. Краткий анализ терминологических словарей по информатике и вычислительной технике, предложенный во втором разделе (п. 3.1.3) содержит неполный их перечень. Рассматривались только некоторые словари, предназначенные для широкого круга пользователей ЭВМ. Однако даже такой поверхностный анализ позволяет сделать вывод о том, что в основном составители словарей пользуются алфавитным или алфавитно-гнездовым способом составления словарей. Тезаурусный метод всё-таки остаётся ещё на периферии лексикографической практики. И это понятно, так как он требует очень тесного сотрудничества специалистов предметной области и лингвистов.

Для успешной реализации современных требований лексикографы прибегают к помощи математической и лексической символик, аппарата лексических и логико-семантических функций. Интересным с лингвистической точки зрения вопросом является вопрос о близости функций тезауруса к лексическим функциям в модели «Смысл?Текст». Как и стандартные ЛФ, тезаурусные связи выделяются только тогда, когда данное отношение устанавливается между многими парами слов. Однако основой для введения в тезаурус логико-семантических связей служит выделение отношений между понятиями, т. е. понятийная сочетаемость, которая может выражаться лексически свободными словосочетаниями. ЛФ же отражают, главным образом, несвободную лексическую сочетаемость и обусловлены требованиями синтаксического перифразирования, по которым могут выделяться функции, лишённые семантики (например, Oper (). К тому же каждая научная терминология имеет свой набор связей, тогда как ЛФ вырабатывются для всей лексики в целом [Никитина, 1978, с. 48].

Важную роль играет моделирование, предполагающее алгоритмическую реализацию. Использование математических методов в лексикографии подтверждает наличие межпредметных связей: математика - информатика – филология. Лингвистика стремится к формализации языка.

Принципиально важным является тот факт, что с точки зрения лексики любой информационно-поисковый язык (ИПЯ) – язык терминологический: элементами такого информационного языка являются термины естественного языка, выражающие информацию о тематическом содержании документов. «Если тематическое содержание статьи, главы в книге, технического отчёта, управленческого документа обозначить набором информативных для этого документа терминов, т. е. таких терминов, которые выражают темы и подтемы, получим терминологическую аннотацию документа, чтение которой даст специалисту возможность предварительно решать, следует ли ему знакомиться с этим документом» [Головин, Кобрин, 1987, с. 41].

Одной из основных задач терминоведения является правильное научно обоснованное составление терминологической аннотации с учётом синонимических, омонимических, родо-видовых, ассоциативных связей, связей по признаку «часть – целое», «объект – признак» и т. д. Это позволяет оптимально организовать работу информационной системы.

Интеллектуальные системы обработки информации с использованием ЭВМ имеют в качестве двух составляющих лингвистическое и математическое обеспечение. Одна из сторон лингвистического обеспечения – это создание электронных словарей. Всю совокупность электронных словарей можно подразделить по следующим критериям [Богданов, 2002]:

1. По используемой операционной системе. Наиболее простые электронные словари (DIC) работают под управлением OC MS-DOS, начиная с версий 2.21 и 3.30, что позволяет их использовать практически на любых IBM-совместимых персональных компьютерах, включая ХТ, АТ-286. Наиболее сложные многооконные и многофункциональные электронные словари (ЭС), позволяющие в одной оболочке подключать различные тематические базы данных, работают под управлением OC WINDOWS 3.11, WINDOWS NT, WINDOWS 95 и т. д. Естественно, что для их успешного функционирования необходим более мощный компьютер (типа АТ-486DX) с оперативной памятью не менее 8 МБ.

2. По способу загрузки. ЭС можно подразделить на нерезидентные и резидентные. К первым относятся простейшие программы (например, подстрочечный словарь DIC), которые работают только в собственной среде и не вызываются из других оболочек, например из текстовых редакторов. В большинстве случаев они функционируют в режиме автоматического (пакетного) перевода. Вторые загружают своё ядро в оперативную память компьютера (например, LINGVO for DOS) и могут быть вызваны в любой момент работы компьютера, из любого текстового редактора при помощи нажатия комбинации горячих клавиш – клавиш оперативного вызова. Эти словари обеспечивают работу переводчика в интерактивном режиме.

3. По количеству подключаемых словарных баз (словарей). Ранние версии ЭС позволяли подключать только один словарь. Современные программы, например Система электронных словарей LINGVO, независимо от того, в какой ОС они работают, позволяют подключать до нескольких десятков словарных баз и устанавливать приоритет последних.

4. По возможностям расширения словарной базы. Устаревшие ЭС не имели возможности расширения словарных баз пользователем. Современные версии, например LINGVO 4.6, имеют утилиты для создания пользователем собственных и расширения существующих словарей.

5. По режиму перевода. Можно выделить два основных режима перевода: автоматический пакетный (подстрочечный) и интерактивный (режим «запрос – ответ»).

Наиболее популярными в настоящее время на рынке словарной продукции являются такие электронные словари, как Лингво, Полиглоссум, Мультилекс и Контекст. Основываясь на вышеприведённой классификации, а также принимая во внимание общие и отличительные особенности электронных и бумажных словарей, целесообразно выделить следующие критерии для проведения сопоставительного анализа ЭС:

* принцип морфологичности,

* удобство и полнота содержания словарной статьи,

* режим поиска,

* возможность двухстороннего перевода,

* возможность перевода словосочетаний и предложений,

* возможность подключения и выбора приоритетности словарей,

* возможность создания собственных словарей,

* удобство пользования интерфейсом,

* качество и полнота лексической базы,

* основные категории пользователей,


загрузка...