Как считать слова в документе

  1. 1. Оригинальный бумажный документ

Стоимость работы по переводу тесно связана с количеством слов в нем Стоимость работы по переводу тесно связана с количеством слов в нем. Подсчет слов в документе - простая задача в принципе, однако на протяжении всей моей карьеры я находил простые текстовые документы, в которых легко считать слова в отсканированных текстах в форматах самых разных (TIFF, PDF, JPG и т. д.), в котором уже не так просто сосчитать.

В этой статье, предназначенной главным образом для клиентов переводчиков, я попытаюсь объяснить, как считать слова документа, чтобы составить адекватный бюджет. Многие клиенты, прежде чем запросить расценки у переводчика, предпочитают сами пересчитать его, чтобы сравнить цены и получить предварительное приблизительное представление о том, сколько им будет стоить перевод.

Возможны два разных случая: наличие оригинала документа на бумаге (от руки или в электронном виде) или документ в электронном формате.

1. Оригинальный бумажный документ

Помимо присяжных переводов, которые делаются на официальных документах (свидетельство о рождении, семейная книжка, высшее образование и т. Д.), Все реже можно найти бумажную документацию. В случае присяжных переводов бюджет часто составляется на страницу и тип документа, а не на слово.

Оставляя в стороне этот случай, когда мы сталкиваемся с бумажным документом, есть три варианта:

  • Подсчитайте слова вручную по одному . В случае длинных документов это слишком трудоемкая работа.
  • Подсчитайте слова по выборке . Чтобы избежать подсчета всех слов, можно сделать приблизительный расчет, взяв репрезентативную выборку листов вашего документа. Например, возьмите две или три репрезентативные строки каждой страницы в произвольном порядке, посчитайте количество слов в каждой строке и нарисуйте среднее значение. Затем выполните средний расчет количества строк на странице. После расчета среднего количества слов на листе необходимо будет только умножить это среднее количество на количество страниц. Да, я знаю, слишком сложно. К счастью, мне не пришлось рассказывать таким образом годами.
  • Используйте профессиональную программу распознавания текста . Программное обеспечение Abbyy Finereader Engine ( http://www.abbyyeu.com/es/ ) позволяет реализовать оптическое распознавание символов любого отсканированного нами документа. Это хорошо работает в случае компьютерных документов и позволяет нам считать слова. Тем не менее, это платежная программа

Сегодня самое обычное дело - иметь документ в электронном формате. В этом случае у нас есть три варианта выполнения подсчета:

  • Вспомогательные инструменты перевода (CAT) . Современные инструменты CAT, которые переводчики используют в нашей работе (Trados, Wordfast, Memsource и т. Д.), Позволяют вести подсчет большинства форматов файлов. Так как эта статья была предназначена для конечных клиентов переводчиков, я не буду подробно останавливаться на этом разделе, так как эти инструменты обычно не используются широкой публикой
  • Специальные инструменты для подсчета слов . Есть много компьютерных программ (не перевод), чтобы выполнить задачу подсчета слов, как бесплатно (например, Абакус переводчика ) в качестве оплаты ( FineCount ). Есть также много веб-сайтов, которые могут выполнять подсчет, но если это конфиденциальный документ, это не очень хороший вариант. Поэтому я не буду останавливаться на этом разделе, но я перейду непосредственно к следующему, который больше всего заинтересует клиента.
  • Используйте исходную программу, в которой был создан файл . Учитывая разнообразие существующих программ и форматов файлов, я остановлюсь на наиболее распространенных:
    • Microsoft WORD (файлы с расширением * .doc, * .rtf, * .txt). Откройте документ и перейдите в «Инструменты», а затем в «Подсчет слов».
    • Microsoft EXCEL (файлы с расширением * .xls). Слова не могут быть посчитаны непосредственно из EXCEL. Весь текст должен быть скопирован в MS-WORD и указан там. Для этого откройте документ, выделите весь текст для перевода в электронной таблице Excel. Скопируйте текст из меню «Правка» в Excel. Перейдите в WORD и вставьте текст в пустой документ, используя меню «Редактировать». Наконец, перейдите в «Инструменты», а затем в «Подсчет слов».
    • Microsoft POWERPOINT (файлы с расширением * .ppt). Откройте документ и перейдите в «Файл», а затем «Свойства». Затем выберите центральную вкладку, которая называется «Статистика». Появится окно, в котором отображаются определенные свойства файла, в том числе количество страниц, абзацев, строк и слов.
    • Microsoft ACCESS (файлы с расширением * .mdb, * .dbf). Открыть документ Перейдите в «Инструменты», затем «Ссылки на Office», а затем «Публикация в MS Word». Затем перейдите к WORD, появится та же таблица, но уже в формате * .rtf, то есть в виде документа WORD. Наконец, перейдите в «Инструменты», а затем в «Подсчет слов».
    • QuarkXPRESS (файлы с расширением * .qxd). Открыть документ Перейдите в «Утилиты», затем «Проверьте орфографию» и, наконец, выберите «Документ». Появится небольшое окно, и вы сделаете «Подсчет слов».
    • Adobe ACROBAT (файлы с расширением * .pdf). Слова не могут быть посчитаны непосредственно из Adobe Acrobat или Acrobat Reader. Весь текст должен быть скопирован в MS-WORD и указан там. Для этого: откройте документ в Adobe Acrobat. Выделите весь текст, который вы хотите перевести. Скопируйте текст из меню «Правка» в Acrobat. Перейдите в WORD и вставьте текст в пустой документ, используя меню «Редактировать». Наконец, перейдите в «Инструменты», а затем в «Подсчет слов». Другой вариант, если у вас есть платная версия Adobe ACROBAT PROFESSIONAL, - конвертировать файл напрямую в WORD.
    • Adobe INDESIGN . Чтобы узнать, сколько слов содержится в текстовом блоке в InDesign, просто нажмите на блок текста с помощью инструмента «Текст». Как только это будет сделано, мы можем обратиться к меню «Окно», нажать «Информация» и появится количество слов. Проблема в том, что если у нас есть текст в разных блоках, нам придется выполнять эту операцию по одному, чтобы в итоге получить сумму слов всех блоков. Существует расширение InDesign, которое позволяет подсчитывать слова всего документа, не выполняя подсчет блок за блоком, но это расширение платное. Это называется Подсчет текста для Adobe InDesign / InCopy и это стоит 65 евро. Удивительно, что программное обеспечение качества и стоимости Adobe Indesign не имеет этой функции, уже включенной в стандартную комплектацию. Я полагаю, что в конечном итоге это будет включено.

Я уже знаю, что есть больше форматов, но я полагаю, что они собирают большинство типов документов, с которыми я работал. Вскоре я напишу еще одну статью, похожую на эту, о различных доступных вариантах подсчета слов веб-страницы (как содержимого, так и внутреннего кода) и определения адекватного бюджета для клиента.