Машинный перевод
обусловила огромный рост интереса к системам МП сейчас в мире. Только
благодаря онлайновым системам МП появилась возможность просматривать
иностранные сайты, не затрудняясь с их переводом. Кроме того, здесь
действуют все вышеперечисленные достоинства систем МП: перевод текстов по
любой тематике производится быстро и конфиденциально.
Коллективное использование систем МП в организациях дает дополнительные
преимущества:
1. Единообразие стиля и используемой терминологии. Как известно, затраты
на постредактирование при работе коллектива переводчиков составляют около
100-140 % от стоимости перевода. Перевод, выданный системой МПа, гораздо
легче править, поскольку он выдержан в одном стиле. Если в тексте, какой-
либо часто встречающийся термин переведен неправильно, то все эти ошибки
можно исправить простой автозаменой. Когда объемный текст переводится
группой переводчиков, то приходится вылавливать отдельные неточности,
допущенные каждым переводчиком. Редактору в этом случае требуется также
"выравнивать" и стиль перевода.
2. Отсутствие затрат на форматирование. Это особенно важно при переводе
электронной документации. Программа-переводчик полностью сохраняет исходное
форматирование, что позволяет сэкономить время и деньги при подготовке
перевода.
Однако вместо того, что бы попытаться использовать те преимущества,
которые предоставляет МП, некоторые люди пытаются довести задачу до
абсурда, например, пытаясь перевести поговорки, песни или стихотворения,
т.е. именно то, для чего системы МП не предназначены. Другие, не
удосужившись прочитать описание программы, пытаются переводить текст по
медицинской тематике с подключенным банковским словарем, а затем шумно
веселятся, увидев на выходе очевидную бессмыслицу. Подчас создается
впечатление, что таким образом они борются с собственными комплексами и
пытаются, в первую очередь, себе доказать, что они умнее компьютера.
Подобные критики зачастую уподобляются известному персонажу анекдота,
который подсунул ломик под бензопилу и был страшно горд, увидев плачевный
результат.
7. ПЕРЕВОДЧИК ДЛЯ ОФИСА
Итак, машинный перевод уже довольно уверенно вошел в повседневную жизнь
современного офиса и ни у кого не вызывает удивления. В мире существует
очень много программ МП. У нас наиболее распространены системы PROMT 98 или
Stylus (фирма ПРОМТ) и ПАРС (фирма «Лингвистика 93»). PROMT 98 (Stylus)
предназначена для профессионального перевода больших объемов информации, но
ее лицензионная копия достаточно дорога. Что же касается использования
пиратских копий, то они, как правило, имеют всего один-два словаря с
относительно небольшим количеством слов. В лицензионной же копии есть
широкий выбор специализированных словарей. Таким образом, использование
пиратских копий не только неэтично с моральной и правовой точек зрения, но
и не позволяет получить качественный перевод многих текстов.
Система ПАРС по некоторым параметрам уступает Stylus, хотя для бытового
использования она достаточно удобна и, что очень важно, цена ее
лицензионной копии доступна (компакт-диск с этой программой и несколькими
специализированными словарями стоит около $20). В продаже есть большой
набор словарей к этой системе по различным темам: вычислительная техника,
медицина, химия и т.д. вплоть до таких областей, как, например, лесная и
бумажная промышленность. Цены на компакт-диски со специализированными
словарями к системе ПАРС обычно не превышают $30, она размещается на одном
CD со словарями. Эта система спокойно работает в среде Windows 3.1 и более
поздних версий. Есть даже ее версия для операционной системы MS DOS, что
позволяет использовать для МП устаревшие компьютеры с процессорами 80286,
которые вполне пригодны для обработки текстов. В дальнейшем речь пойдет о
версии ПАРС для Windows, работающей в среде операционной системы Windows
95.
ПАРС для Windows может работать в двух режимах. В первом случае он
переводит файл в формате «текст MS DOS» и результат записывает в другой
файл с тем же форматом. Сам же переводимый текст готовится в другом
редакторе, причем в среде Windows сделать это затруднительно, так как в ней
принята другая кодировка русских букв. Кроме всего прочего, простейший
формат «текст MS DOS» все реже применяется для подготовки серьезных
документов.
Гораздо удобнее другой режим, когда программа МП работает совместно с
мощным внешним текстовым редактором. Таким редактором для ПАРС является
Microsoft Word 6.0 for Windows. Кроме удобства появляется возможность
работы с текстами в формате RTF (Rich Text Format), где записываются
размеры и форма шрифтов, и эти параметры переносятся в результат перевода.
В процессе инсталляции ПАРС определяется наличие на жестком диске
инсталлированного текстового редактора Word. Когда редактор успешно
обнаружен при инсталляции программы МП, то в его окне наверху появляется
еще одно меню – ‘Перевод’. Результат перевода представляется в редакторе
как новое окно с текстом. Если сначала была инсталлирована система ПАРС, а
потом уже Word, то для их совместной работы потребуется повторно
осуществить выборочную инсталляцию программы перевода и элементов ее связи
с внешним текстовым редактором.
Но если перевод осуществляется впервые после запуска программы, перед его
началом потребуется указать используемые словари. Зачастую пользователи
могут недооценивать применение специализированных словарей. Однако следует
вспомнить, что переводчики при работе со специализированными текстами
используют, как правило, словари по соответствующей тематике, а не
произвольные.
Рассмотрим это на примере:
Оригинал:
Nokia 9000i Communicator now supports short messages with up to 2 280
characters, the current standard being 160 characters. With the Text Web
service based on Smart Messaging, the end-user is able to obtain
information in a simple text format without graphics or logos from the
Internet by using the short message service. Text Web information can
include flight schedules, weather or traffic reports, or the stock news.
Перевод без подключения специализированного словаря:
Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до 2280
характеров (знаков), текущий стандарт, являющийся 160 характерами
(знаками). С обслуживанием (службой) Ткани (сети) Текста, основанным на
Шикарном (сильном) Messaging, конечный пользователь способен получить
информацию в простом формате текста без графики или эмблем от Internet,
используя короткое обслуживание (службу) сообщения. Информация Ткани (сети)
Текста может включать списки (графики) рейса (полета), погоду или сообщения
движения, или новости запаса (акции).
Перевод с подключенным словарем “Телекоммуникации и связь”:
Nokia 9000i Коммуникатор теперь поддерживает короткие сообщения с до
2280 символов, текущий стандарт, являющийся 160 символами. С Текстовым
обслуживанием Сети, основанным на Smart Messaging, конечный пользователь
способен получить информацию в простом текстовом формате без графики или
эмблем от Internet, используя систему передачи коротких сообщений.
Текстовая информация Сети может включать список рейса (полета), погоду или
сообщения трафика, или новости фондового рынка.
Как уже было сказано, словари выбираются в зависимости от стиля и
тематики текста. Обратим внимание на кнопку ‘Приоритет’. С ее помощью можно
перемещать словари в списке. Если в переводимом тексте имеется слово,
встречающееся в нескольких из выбранных словарей и в каждом из них его
значения различны, то будет выбран вариант перевода из словаря, стоящего в
списке первым. Возможность расположения словарей по различному приоритету
позволяет гибко подстраивать систему перевода под тексты, содержание
которых лежит на границе двух специальностей. Рассмотрим в качестве примера
использование словарей компьютерных и химических терминов. Допустим,
имеется текст про компьютеризацию химического производства. В нем, конечно,
чаще будут встречаться компьютерные, нежели химические термины, и поэтому
термин, имеющий двоякое толкование, должен скорее переводиться по словарю
компьютерных терминов. В этом случае словарь терминов компьютерных должен
иметь больший приоритет, чем словарь химических. Другой вариант – текст про
химические процессы в производстве компьютеров. Здесь чаще будем замечать
химические термины, и, соответственно, словарь химических терминов будет
иметь больший приоритет. Ну и, конечно, используя специальные словари, не
следует забывать подключать и словарь общеупотребительной лексики. При
переводе технических текстов целесообразно присвоить этому словарю
наименьший приоритет.
Но даже тонкая настройка системы под лексику переводимого текста не
учитывает всех его особенностей, поэтому переведенные слова, имеющие
несколько синонимов, помечаются звездочкой. Указав мышкой на такое слово,
можно выбрать подходящий вариант перевода либо оставить то, что предложил
компьютер.
Когда варианты перевода выбраны, можно приступать к редактированию
переведенного текста, благо Word обладает для этого мощными средствами.
Текст иногда полезно подвергнуть некоторой обработке перед МП. Так,
системы МП могут ошибаться из-за наличия в тексте сокращений,
заканчивающихся точкой. Если после такого сокращения следует слово,
начинающееся с большой буквы, то компьютер воспринимает точку как конец
предложения, из-за чего предложение может быть неправильно разобрано, и,
следовательно, ошибочно переведено. Значит, точки в сокращениях надо
убирать. Сокращения будут перенесены в текст без перевода, и их нужно
перевести вручную. В переводимом тексте должны отсутствовать переносы, что,
впрочем, легко обеспечивается при подготовке текста в редакторе Word.
Особенно внимательно надо просматривать тексты, получаемые в результате
распознавания отсканированного изображения, так как содержащиеся в них
ошибки нередко приводят к тому, что отдельные слова остаются
непереведенными всего-то из-за одной неправильной буквы. Кстати, уже
упоминавшаяся система Stylus вместе с программой FineReader входит в состав
пакета Stylus Lingvo Office, предназначенного для обработки документов,
введенных в компьютер путем сканирования.
Однако не следует забывать, что работа для переводчика найдется не только
в офисе, но и дома. Поэтому мне хотелось бы рассказать о некоторых системах
машинного перевода, изначально предназначенных домашнего применения.
8. КТО В ДОМЕ ПЕРЕВОДЧИК?
Работа для электронного полиглота найдется практически в каждом доме. Его
услугами охотно воспользуются школьники, студенты и аспиранты с их вечными
"тысячами", которые нужно сдавать, невзирая на полное или частичное
отсутствие времени, желания, а иногда и знаний. Время от времени он будет
полезен и другим членам семьи при переводе письма, полученного по
электронной почте от знакомого из-за рубежа, инструкции к импортной
стиральной машине или кулинарного рецепта из иностранного журнала. Все мы,
вне зависимости от возраста и рода занятий, являемся потенциальными
"клиентами" домашнего переводчика.
Но какие же системы вправе называться домашними? В первую очередь,
естественно, это программы, изначально создаваемые для всей семьи. Они
отличаются простотой пользовательского интерфейса, многочисленными
вспомогательными функциями и мультимедийными возможностями. Их словари
оптимизированы для перевода текстов на обычные домашние темы: хозяйство,
отдых, развлечения и т.д. Работать с ними интересно не только взрослым, но
и детям.
Вторым критерием пригодности системы МП для использования дома является
легкость управления и высокий уровень автоматизации. Мало кто, не являясь
профессионалом-лингвистом, возьмется, например, определять языковые
характеристики слов. Чаще всего нам нужно просто узнать содержание
непонятного текста на иностранном языке, а не получить его литературный
перевод.
И наконец, немаловажным фактором при покупке персональных переводчиков
является цена. Системы стоимостью выше $60–70 вряд ли смогут получить
прописку у многих пользователей на винчестере их домашнего ПК. Поэтому я
решила ограничить свой выбор продуктами, которые можно приобрести дешевле
$50.
Исходя из приведенных критериев, для домашнего применения можно
порекомендовать следующие системы МП: Magic Gooddy (от компании ПРОМТ),
"Сократ Персональный 3.0.3" и "Коперник". Первая из них была специально
разработана для этих целей, вторая попадает в наше поле зрения благодаря
своей компактности и предельной простоте использования, последняя же
обладает довольно широким набором возможностей при весьма низкой цене.
Выбранные мною системы настолько разнообразны по своим возможностям, что
какое-либо их сравнение или тестирование вряд ли имеет смысл. А поскольку
цель данной работы состоит не в том, чтобы дать полное руководство
пользователя данных программ, то позволю себе отметить лишь особенности,
преимущества и полезные функции каждой из них.
Что же выбрать? Оказывается, что выбор домашнего переводчика сегодня
однозначно зависит от его функциональных возможностей и предельно прост,
поскольку рассмотренные нами программы коренным образом различаются.
Сформулировав основные цели перевода, диапазон тематик, а также требования
к качеству результата, можно четко определить, какая из систем окажется в
данном случае наиболее подходящей.
Magic Gooddy – самый универсальный семейный переводчик. И не удивительно
– ведь он "домашний" от рождения. Он вполне годится для перевода учебных
текстов, писем, руководств к программам, интерактивной справки, и многого
другого, вплоть до кулинарных рецептов. Те, кому уже приходилоси
сталкиваться с «Волшебником Гудди», настоятельно рекомендуют эту программу
детям. Для них она окажется не только помощником и подсказчиком при
выполнении домашних заданий по английскому языку. Magic Gooddy является
ценным дополнением к обучающим программам, главным образом благодаря
возможности читать вслух произвольные тексты. Не стоит бояться, что Гудди
отучит ваших детей работать самостоятельно. Более вероятно, что он пробудит
в них интерес к иностранным языкам, а возможно, и к нелегкому труду
переводчика.
Что касается качества перевода, скорее всего у вас не будет проблем с
переводом руководства к кухонному комбайну, кулинарного рецепта или письма.
Фрагмент руководства по Quake II также будет вполне понятным, однако, самые
"заковыристые" жаргонные выражения программа переведет не совсем точно. Но
есть у этого переводчика и недостаток – зависимость качества перевода от
того, насколько точно оригинал соответствует одной из имеющихся тематик.
Тексты "на стыке" областей, а также разговорные переводятся хуже.
"Коперник" лучше всего подойдет для домашнего офиса профессионального
переводчика. Он обладает достаточными возможностями для подготовки
переводных текстов высокого качества. Программа хорошо переводит тексты
самых разнообразных тематик, иногда даже без дополнительных словарей. В
некоторых случаях после подключения словарей и несложного
постредактирования удается получить переводы, удовлетворяющие всем правилам
грамматики и стилистики русского языка. Кроме того, эта программа
поддерживает четыре языка, в том числе украинский, что в последнее время
весьма актуально. К тому же единственная система, которая может работать с
таким же набором языков, – Language Master 98 – стоит на порядок дороже. А
интеграция с Word и функция выбора вариантов перевода слов позволяют
значительно сократить затраты времени на постредактирование.
"Сократ Персональный 3.0.3" – это предельно простая система для
ознакомительного перевода небольших фрагментов текста. Ее козыри –
компактность и наличие встроенного электронного словаря, она
нетребовательна к квалификации пользователя и максимально автоматизирована.
Качество перевода этой системы не всегда высокое, но зато мало зависит от
тематики текста. Соответственно, эта программа найдет применение при
интенсивной работе с разнообразными иностранными текстами на
ознакомительном уровне. Лучше всего поддаются переводу с ее помощью тексты
интерактивной справки. Их смысл удается понять во всех случаях, а
большинство предложений построены грамотно. Также хорошие результаты можно
получить при работе с деловыми письмами – здесь сказываются хорошая
сбалансированность словаря, большой запас экономической лексики, а также
строгость и шаблонность делового стиля речи, под который, в частности, и
настраивался программный алгоритм "Сократа". Удовлетворительными можно
считать результаты работы с документацией к программам и руководствами к
бытовым приборам, однако, понять их содержание, как правило, можно. Слабым
местом программы являются научные тексты, личная переписка, разговорные
темы и особенно руководства к компьютерным играм. В первом случае
сказывается отсутствие в составе "Сократа" словарей специальных терминов.
Остальные же представляют собой естественное затруднение для всех систем
машинного перевода, вызванное неформализованной лексикой, сложностью
оборотов и стилистическим разнообразием указанных текстов.
И в заключение немного о "темных лошадках". Существует еще одна
программа, которую, признаться, мне очень хотелось бы видеть среди
недорогих домашних переводчиков. Это утилита QTrans, на сегодняшний день
поставляемая только в комплекте с PROMT 98. В ней реализованы довольно
мощные функции перевода и предельно простой пользовательский интерфейс. К
тому же, объединив QTrans с новой коллекцией тематических словарей под
названием "Домашняя", компания ПРОМТ могла бы предложить отличный продукт,
удовлетворяющий и начинающих, и более опытных пользователей.
Также сейчас наблюдается новый всплеск интереса к системам МП в связи с
развитием сети Интернет. Миллионы людей, говорящих на разных языках,
оказались в едином информационном пространстве. Доминирует в Сети
английский язык, но есть пользователи, которые им не владеют, как, впрочем,
есть множество Webстраниц, написанных не по-английски. Для облегчения
просмотра страниц Интернет на незнакомом пользователю языке появились
дополнения к броузерам, которые осуществляют немедленный перевод выбранных
пользователем фрагментов просматриваемой Webстраницы. Достаточно лишь
выделить часть текста мышкой и перенести ее на специальную панель либо
нажать указателем на специальную кнопку меню. Примером такого переводчика
является система Web Trans Site фирмы ПРОМТ, созданная на базе программы
Stylus, которая подключается как к броузеру Netscape Navigator, так и к
броузеру Microsoft Internet Explorer.
9. МАШИННЫЙ ПЕРЕВОД В ИНТЕРНЕТЕ
Онлайновый перевод информации в Интернете становится все более
популярным. Интернет стремительно превращается из преимущественно
англоязычной в многоязычную среду, что вынуждает владельцев Web-сайтов
предоставлять информацию на нескольких языках. Наиболее часто к услугам МП
прибегают информационные и поисковые сайты, которые стремятся привлечь на
свои страницы разноязычных пользователей. Так, на канадском информационно-
поисковом портале InfiniT (http://www.infiniT.com) открылся новый сервис
переводов. На сайте теперь доступен онлайновый перевод текста с английского
и немецкого языков на французский язык и обратно.
Увеличение числа посетителей портала обусловлено возможностью онлайнового
перевода Web-страниц. Для этого пользователю достаточно указать только
адрес Web-страницы, выбрать направление перевода и нажать кнопку перевода.
В результате через несколько секунд пользователь получает полностью
переведенную Web-страницу с сохранением форматирования.
Новый сервис позволяет ликвидировать языковую проблему в канадском
Интернете, где в силу исторических особенностей широко используются два
языка: английский и французский. Кроме того, онлайновый переводчик
открывает доступ к сайтам на немецком языке тем жителям Канады, которые не
владеют иностранными языками.
Сервис работает на базе серверного Интернет-решения компании ПРОМТ под
названием PROMT Internet Translation Server version 2.0. Проект был
реализован совместно с компанией Softissimo, которая занимается
продвижением продуктов компании ПРОМТ под торговой маркой REVERSO.
Интересной особенностью Web-сайтов, знакомящих с программами МП,
электронными словарями и другими программами лингвистической поддержки,
является то, что с работой многих программных продуктов можно познакомиться
в интерактивном режиме, используя версию, установленную на сервере и
имеющую шлюз для удаленного общения через Web-интерфейс. На сервере Web-
издательства "ИнфоАрт" (http://www.infoart.ru/misc/dict) организована
интерактивная демонстрация словарей Lingvo и "МультиЛекс". Вы можете ввести
слово или словосочетание и мгновенно получить перевод, толкование, примеры
употребления и устойчивые словосочетания.
Что же посоветовать пытливому читателю, решившемуся на штурм языкового
барьера в Интернет? Его оружием могут стать WebTranSite 98 (разработчик –
ПРОМТ, цена ~ $32), WebView (продукт поставляется в комплекте с PROMT и
PROMT Internet), PROMT Internet (разработчик – ПРОМТ, цена ~ $42) или
Socrat Internet (разработчик – "Арсеналъ", цена ~ $30). Наиболее
универсальным из них является PROMT Internet. Купив этот пакет, вы получите
сразу несколько программ для перевода Web-страниц, и не только их. Можно с
уверенностью сказать, что возможностей данного набора приложений вполне
достаточно для полноценной работы с документами на английском, французском
и немецком языке.
Если вы предполагаете использовать универсальную переводящую программу
WebTranSite 98 или броузер WebView больше, чем другие части пакета PROMT
Internet, и при этом желаете сэкономить немного денег, то можете приобрести
эти продукты по отдельности. В таком случае WebTranSite 98 придется по
вкусу тем, кто часто переводит небольшие фрагменты текста не только из
Интернет, но и из офисных, почтовых и других программ, а также из системы
интерактивной справки. Замечу, что WebTranSite 98 подходит не только для
перевода Web-страниц. Она достаточно универсальна и позволяет обрабатывать
фрагменты текста из любых приложений, в том числе из текстовых редакторов,
электронных таблиц, органайзеров, броузеров. Программа переводит тексты с
английского, немецкого или французского языка на русский и обратно.
Что касается WebView, то это – инструмент искушенного "интернетчика",
много времени проводящего на иноязычных серверах и не желающего пропустить
ни одной крупицы информации. Программа WebView – полноценный броузер для
загрузки и просмотра Web-страниц. Так что, используя его при работе с
Интернет-документами на иностранном языке, вы можете даже отказаться от
привычных Internet Explorer и Netscape Navigator. WebView – это
своеобразный "гибрид" броузера Internet Explorer 4.0 и системы машинного
перевода PROMT 98. Полученная в результате такого "скрещивания" программа
позволяет переводить Web-страницы, полностью сохраняя их внешний вид.
WebView может работать с тремя иностранными языками: английским,
французским и немецким, причем переводит как с любого из них на русский,
так и в обратном направлении. Функции перевода в этой программе шире, чем в
WebTranSite 98, и их набор практически такой же, как в PROMT 98. Так, в
дополнение к рассмотренным выше операциям со словарями WebView позволяет
вводить в них новые слова и фразы. Чтобы облегчить вашу задачу, программа
составляет список незнакомых ей выражений, встретившихся в тексте,
подсчитывает количество появлений каждого из них и выводит результаты в
специальном диалоговом окне. Выбрав любое из этих слов, вы можете либо
запретить его перевод, либо добавить в пользовательский словарь.
Единственный недостаток, который портит хорошее впечатление о WeView – это
то, что программа иногда зависает при несовпадении направления перевода и
языка оригинальной страницы.
Однако программы WebTranSite 98 и Web View по отдельности уже сняты с
производства. Да и экономия по сравнению с покупкой PROMT Internet не так
уж велика.
Socrat Internet – это аналог "переводящего броузера" WebView. С ее
помощью можно выполнять "синхронный" перевод Web-страниц с сохранением их
форматирования. Однако если WebView по возможностям настройки опций
перевода ничем не уступает профессиональной системе PROMT 98, то в Socrat
Internet никаких средств управления этими функциями нет вообще. Броузер от
компании "Арсеналъ" не позволяет подключать тематические словари, что
сильно ухудшает качество перевода специальных текстов (их, кстати, в
Интернет очень много). Простота использования, которой так добивались
разработчики, отнюдь не пошла на пользу программе, потерявшей гибкость и
управляемость, такие важные для систем машинного перевода. В итоге Socrat
Internet существенно уступает продуктам "ПРОМТ" по многим параметрам, в том
числе и по самому важному – качеству выходного текста.
10. КАК УЛУЧШИТЬ КАЧЕСТВО ПЕРЕВОДА?
Практические советы.
Наверняка многие уже имеют опыт "общения" с системами машинного перевода.
Кое-кто сумел уловить правильный подход к работе с этими программами и
эффективно использует их. Другие, наоборот, после первого же сеанса работы
испытали разочарование, оценив качество полученного текста. Но не стоит
отчаиваться. Существуют способы улучшения результатов машинного перевода,
доступные каждому пользователю. О некоторых из них мы сейчас и поговорим.
1. Исход работы в значительной мере решается еще до ее начала.
Прежде чем приступить к переводу, обязательно определите две вещи: во-
первых, для каких целей предполагается использовать его результаты, а во-
вторых, что представляет собой исходный текст.
Назначение перевода играет первостепенную роль при оценке его качества. В
самом деле, один и тот же результат можно считать отличным, если нужно
просто узнать, о чем идет речь в оригинальной статье, и совершенно
непригодным, если нужно получить текст для публикации в книге или журнале.
Но иногда даже самый "грубый" перевод оказывается приемлемым, если в нем
имеется достаточно информации, по которой специалист в соответствующей
предметной области может легко восстановить содержание текста.
С другой стороны, определив, к какому стилю речи принадлежит исходный
текст, нетрудно оценить его пригодность для машинного перевода, а значит, и
предугадать результат. Чем больше в тексте иносказательных оборотов,
метафор, чем свободнее стиль, тем хуже справится компьютер с его переводом.
Лучше других обрабатываются научные, технические и образовательные
тексты, которым присуще строгое изложение материала. Если своевременно
пополнять специальные словари новыми терминами, то можно получать полностью
связный перевод текстов, требующий минимальной стилистической доработки.
Разговорный и публицистический стиль, где много специфических оборотов,
но большинство слов используется в прямом смысле, пригодны для
ознакомительного перевода, однако для получения грамотного выходного текста
потребуется ручная правка. А вот поэзия и художественная литература, к
сожалению, совершенно непригодны для машинного перевода. Смысл текста,
построенного на иносказательных выражениях, при машинном переводе
искажается и недоступен даже для ознакомления.
2. Бойтесь опечаток!
Очень часто причиной неправильного перевода являются опечатки в
оригинале. В особенности это касается отсканированных и распознанных
текстов. Слова с орфографическими ошибками в большинстве случаев помечаются
системой как незнакомые, поскольку в исковерканном виде они в словарях
отсутствуют. Сложнее, если опечатка превращает одно слово в другое, которое
также существует в иностранном языке, – программа переведет его, но смысл
текста будет искажен. Но самыми серьезными "подводными камнями" являются
ошибки в пунктуации. Одна неправильно поставленная запятая способна
серьезно исказить перевод предложения. Поэтому перед переводом как можно
тщательнее проверьте исходный текст.
3. Хороший словарь – половина успеха.
Обязательно найдите и подключите специальные словари по тематике
переводимого текста. Если в точности такой тематики нет, определите
наиболее подходящую комбинацию имеющихся у вас словарей и, кроме того,
обязательно создавайте свои. Идеально, конечно, иметь для каждого текста
свой словарик, но оптимальным, с точки зрения продуктивности работы,
является разбиение наиболее распространенных тем на подпункты. Например, в
рамках компьютерной тематики можно создать словари "Офисные программы",
"Графика", "Сети", "Internet и WWW" и т.д.
4. Строим "пирамиду".
Если к системе подключено несколько словарей, то успех перевода во многом
зависит от того, в каком порядке программа ищет в них текущее слово.
Поэтому организуйте иерархию словарей в порядке от частного к общему. Самый
высокий приоритет должен иметь словарь, созданный для текущего текста,
затем – тематические (в порядке расширения предметной области), а самый
низкий уровень остается за словарем общеупотребительных понятий. Так, при
переводе текста о программе Adobe Photoshop лучше всего на самом высоком
уровне поставить словарь "Photoshop" (созданный вами специально для этого
текста), затем – "Компьютерная графика", "Информатика" и в самом конце
списка – общий словарь. Поскольку объем узкоспециализированных
пользовательских словарей, как правило, невелик, а общего, наоборот,
огромен, то полученная в результате "конструкция" в чем-то походит на
пирамиду.
5. Не надо спешить!
Никогда не переводите сразу весь текст. В нем всегда найдется как минимум
одно-два слова, отсутствующих в словарях, и превеликое множество таких,
которые система переводит неправильно. Покончив с подключением словарей и
определением других опций перевода, для начала переведите небольшой
фрагмент в начале текста, например первый абзац. Найдите в этом фрагменте
слова, переведенные неправильно, и внесите их в словарь самого высокого
уровня. Переведите фрагмент заново. Если результат вас удовлетворит,
переходите к следующему абзацу. Практика показывает, что для точной
настройки системы необходимо перевести таким образом четверть, а иногда
даже треть материала и только после этого запускать автоматическую
обработку всего текста.
6. Различайте общее и частное!
Прежде чем внести новое слово в пользовательский словарь, определите,
будет ли оно переводиться в тексте данным образом только один-два раза или
постоянно. Искусство правильной работы с системой машинного перевода
состоит в том, чтобы различать общее и частное. В идеальном случае от вас
потребуется знание иностранного языка и предметной области текста. В
словарь вносите только систематически встречающиеся варианты перевода,
единичные же исправляйте вручную. В противном случае слово по всему тексту
будет переведено неправильно.
Соблюдение приведенных выше простых правил обычно позволяет существенно
повысить качество переведенных компьютером текстов. Нельзя гарантировать,
что они всегда окажутся абсолютно правильными и стилистически грамотными.
Однако, вероятнее всего, свою первую задачу – понять смысл текста – вы
решите.
З А К Л Ю Ч Е Н И Е
Стремительные потоки информационного обмена между высокоразвитыми
промышленными странами, лавина научно-технической документации, поступающая
от производителей товаров и современных технологий, требуют совершенно
нового подхода к проблеме перевода технической литературы. Выход один:
максимально автоматизировать процесс, оставив человеку его творческую
редакционную часть. В этом помогает система машинного перевода. Ее
параметры должны удовлетворять четырем основным требованиям:
• оперативность;
• гибкость;
• скорость;
• точность.
Оперативность машинных систем — это возможность постоянного пополнения
словарного запаса и создания новых тематических словарей. В этом параметре
они значительно опережают привычные типографские издания различных
словарей.
Гибкость — это возможность "грубой настройки" на конкретную предметную
область (для этой цели служат специализированные словари) и "тонкой
настройки" на конкретный текст, книгу или группу документов (модифицируемые
пользовательские словари).
Скорость — возможность автоматического ввода и обработки текстовой
информации с бумажных носителей. Только одна система оптического ввода
текстов (OCR-System) ежедневно заменяет более десяти классных машинисток.
Точность — стилистически и грамматически правильная адекватная передача
смысла исходного текста на язык перевода. Это наиболее "уязвимое" место
систем машинного перевода. Однако столь явное улучшение качества перевода в
поздних версиях систем машинного перевода, как например, PROMT 98, вселяет
уверенность, что вскоре компьютер полностью примет на себя всю рутинную
часть перевода.
В ходе данной работы мы выяснили, что машинный перевод — это эффективное
средство для просмотра и поиска информации на иностранном языке, и именно
эта функция является главной при работе в Internet. Далее, в результате
настройки на предметную область и интеграции с другими программами
обработки документов средство машинного перевода позволяет автоматизировать
получение перевода. И наконец, — это уникальный гуманитарный инструмент,
позволяющий преодолевать проблемы общения в системах, работающих на разных
языках. И пожалуй, самый главный, поистине революционный для прикладной
лингвистики вывод состоит в том, что многие разработчики осознали: при
создании программы машинного перевода кроме хорошо реализованной
лингвистики необходима достойная программная реализация.
Несомненно, средства машинного перевода никогда не смогут улавливать все
смысловые нюансы оригинального текста. Различия в синтаксисе и семантике,
особенно между западными и восточными языками, - скажем английским и
китайским - слишком велики для этого. Даже сторонники машинного перевода
признают, что он способен в лучшем случае передать основную суть документа.
Но нельзя забывать, что ошибки часто случаются и у обычных переводчиков,
и наивно ожидать от системы машинного перевода, что она способна исправить
ошибки оригинала и выдаст грамотный перевод. Безусловно, тезис о том, что
мозг человека совершенней компьютера, не требует никаких доказательств.
Хотя честно сказать, после общения на выставках с некоторыми пользователями
в этом появляются сомнения.
В заключение хотелось бы подчеркнуть, что программа-переводчик – это,
прежде всего, инструмент, который позволяет решить проблемы перевода или
повысить эффективность труда переводчика только в том случае, если он
используется грамотно.
ЛИТЕРАТУРА
1. Англо-русский словарь. Под рук. Мюллера В.К. – М.% Русский язык, 1985.
2. Аристов Н.В. Основы перевода. – М.: изд-во литер. на иностр. языках,
1959.
3. Архипов А.Ф. Самоучитель перевода с немецкого языка на русский. – М.:
Высш. шк., 1991.
4. Бархударов Л.С. Язык и перевод. – М.: Международные отношения, 1975.
5. Бреус Е.В. Основы тории и практики перевода с русского языка на
английский. – М.: УРАО, 1998.
6. Ванников Ю.В. Языковая сложность текста как фактор трудности перевода
(Методическое пособие). – М.: Всесоюзный центр переводов, 1988.
7. Вейзе А.А, Киреев Н.Б., Мирончиков К. Перевод технической литературы с
ангилийского языка на русский. – Минск, 1997.
8. Вейзе А. А., Мирончиков И. К. Перевод технического текста с английского
языка на русский. – Мн.: МГЛУ, 1995.
9. Васильев А. (Компьютер на месте переводчика). // Подводная лодка. –
1998, № 6.
10. Винокуров А.А.,Чуканов В.О.Новый метод оценки машинного перевода.//
Информационные технологии и системы. Hardware Software Security.
Тенденции и перспективы – Сборник статей: М., Международная академия
информатизации, 1997.
11. Гвишиани Н.Б. Язык научного общения (вопросы методологии). –М.: Высш.
шк.; 1986.
12. Левин А. Самоучитель работы на компьютере. – 4-е изд., испр. И доп. М.:
Ноллидж, 1997.
13. Каничев М. (Встреча компьютерных толмачей). // Мир ПК. – 1998, № 8.
14. Климзо Б.Н. Перевод патентов. – М.: МГПИИЯ им. М.Тореза, 1976.
15. Рецкер Я.И. Теория перевода и переводческая практика. – М.:
Международные отношения, 1974.
16. Русско-английский словарь. Под рук.Смрницкого А.И. – М.: Русский язык,
1997.
17. Рыбакин А. И. Словарь английских личных имен. – 2-е изд.- М.: Рус. яз.,
1989.
18. Система перевода текста Magic Goody для Windows. Руководство
пользователя. — С.-Петербург, фирма "ПРОМТ", 1999.
19. Система перевода текста PROMT Internet. Руководство пользователя. — С.-
Петербург, фирма "ПРОМТ", 1999.
20. Система перевода текста STYLUS для Windows. Версия 2.51. Руководство
пользователя. — С.-Петербург, фирма "ПРОМТ", 1996.
21. Система перевода текста WebTranSite 98. Руководство пользователя. — С.-
Петербург, фирма "ПРОМТ", 1998.
22. Система перевода текста WebView Руководство пользователя. — С.-
Петербург, фирма "ПРОМТ", 1998.
23. Система электронных словарей LINGVO для DOS и Windows. Версия 4.0.
Руководство пользователя. — М.: фирма "БИТ", 1995.
24. Скороходько Э.Ф. Вопросы перевода английской технической литературы. –
К.: изд-во Киевского Университета, 1963.
25. Судовцев В.А. Научно-техническая информация. – М.: Высш. школа, 1989.
26. Тетради новых терминов № 6 (Англо-русские патентные термины). – 2-е
изд., испр. и доп. – Москва, ВЦП, 1975.
27. Федоров А.В. Введение в теорию перевода. – М.: ищд-во литер. на
иностр. языках, 1958.
28. Федоров А.В. Основы общей теории перевода. – М.: Высш. шк., 1968.
29. Флорин Сидер. Муки переводческие. – М.: Высш. школа, 1983.
30. Циммерман М.Г., Веденеева К. 3. Русско-английский научно-технический
словарь переводчика. – М.: Наука, 1991.
31. Черняховская Л.А. Перевод и смысловая структура. – М.: Международные
отношения, 1976.
32. Читалина Н.А. Учитесь переводить (Лексические проблемы перевода). – М.:
Международные отношения, 1975.
33. Чужакин А.П., Палажченко П.Р. Мир перевода, или Вечный поиск
взаимопонимания. – М.: Валент, 1999.
34. L.Visson. From Russian Into English. Ardis,1991.
35. http://www.itc.kiev.ua/itc/dpk/archive/1999/02/software.shtml
36. http://www.promt.ru
37. http://www.socrat.ru
38. http://www.translate.ru
-----------------------
[1] > >?@545;5=8N .$.@E8?>20.
[2] L.Visson, From Russian into English , A. 21.
[3] ..5975, ..8@552, . 8@>=G8:>2. 5@52>4 B5E=8G5A:>9 ;8B5@0 По определению
А.Ф.Архипова.
[4] L.Visson, “From Russian into English”, с. 21.
[5] А.А.Вейзе, Н.Б.Киреев, К. Мирончиков. Перевод технической литературы с
английского языка на русский. – Минск, 1997.
[6] Устройство для оптического ввода графической информации.
[7] Программы оптического ввода и распознавания текстов (Optical Character
Recognition).
[8] См. раздел 9. Машинный перевод в Интернете.
[9] Компания ПРОМТ основана в 1991 году. Компания специализируется в
разработке систем автоматического перевода для европейских языков и
является лидером в этой области. В 1993-97 годах ПРОМТ была признана одной
из 100 Наиболее Влиятельных Компаний в компьютерном бизнесе России. В 1995
и 1998 годах компания получила награду за значительный вклад в развитие
информационных технологий России.
Страницы: 1, 2
|