Корректура


В начало | От автора | Форматы книг | Общие положения | Сканирование | Обработка сканов | Распознавание сканов | Корректура | Подготовка иллюстративного материала | Вёрстка | Создание выходного файла


<<< >>>

Корректура

После того, как в процессе распознавания получен файл (файлы) с текстом книги, необходимо выполнить его корректуру – исправить ошибки в нём, поскольку они возникают почти всегда, даже если проводилось распознавание сканов отличного качества. И хотя количество ошибок может быть совсем небольшим, но всё-таки ещё ни одному OCR-приложению не удалось превзойти в этом плане зоркий глаз человека.

Строго говоря, «корректура» – понятие типографское и в действительности оно имеет значительно более широкий смысл, нежели простая вычитка распознанного текста. Однако здесь под корректурой, прежде всего, будет пониматься процесс выявления и ликвидации ошибок работы OCR-программы. В этом случае рассматриваемый термин совпадает по значению с использующимся иногда англоязычным понятием “spell-checking” (переводится как «проверка орфографии»).

Как правило, для исправления ошибок распознанный текст переносят в какой-нибудь текстовый редактор и проводят правку в его среде. К сожалению, часто ограничиваются только теми исправлениями, которые предлагаются самим редактором – в современных программах этого типа имеются встроенные возможности по проверке орфографии и грамматики. Так, MS “Word” и LO “Writer” подчёркивают красной волнистой линией «подозрительные» с их точки зрения слова, которые после этого сразу бросаются в глаза. Однако не стоит забывать, что далеко не от всех ошибок можно избавиться подобным образом. После программной проверки следует провести ещё одну, хотя и затратную по времени, но значительно более действенную. Для этого нужно внимательно прочитать весь распознанный текст, используя в качестве эталона либо саму книгу, либо открытые каким-нибудь просмотрщиком сканы её страниц.

Занятие это не из лёгких, поскольку компьютерный текст сильнее утомляет глаза, нежели печатный, по причине чего при чтении довольно быстро снижается внимание и многие малозаметные ошибки в тексте (например, «бараика» вместо «баранка») могут так и остаться неисправленными. Здесь можно рекомендовать следующий подход: проверяемый текст нужно размеренно читать вслух по слогам, стараясь чётко их проговаривать. Это позволяет сконцентрироваться именно на побуквенном написании слов, а не на их общем виде (зрительном образе). Следует добавить, что при таком способе контроля текст воспринимается не только глазами, но ещё и на слух, а это также облегчает выявление ошибок.

Не стоит забывать, что и в исходных текстах книг могут присутствовать опечатки – для современных изданий это, к превеликому сожалению, стало особенно актуальным. Если в процессе проверки распознанного текста в оригинале книги действительно будет выявлена опечатка, то, по моему мнению, её нужно исправить. В дальнейшем, в готовом (выходном) файле книги, необходимо будет обязательно оставить информацию обо всех внесённых исправлениях, подобно тому, как в бумажных книгах иногда делается небольшая вклейка с перечнем невыправленных опечаток.

При создании книги в формате DJVU также вполне возможна кое-какая корректорская правка, но в этом случае вам понадобится графический редактор вместо текстового, поскольку править придётся непосредственно сканы. Далее в формируемую электронную книгу нужно будет непременно добавить дополнительную страницу со сведениями о том, какие именно изменения и в каком месте книги были внесены, туда можно также добавить и фрагмент скана исходной страницы с неисправленной опечаткой.

Заканчивая описание этого этапа создания электронной книги, хочу обратить внимание на следующее. Поскольку правила правописания, которые мы все изучаем в школе, имеют обыкновение подзабываться со временем, то нелишним будет при проведении вычитки текста дополнительно вооружиться справочными источниками – онлайновыми или печатными (например, таким: Розенталь Д.Э. Справочник по правописанию и литературной правке: Для работников печати. – 5-е изд., испр. – М.: Книга, 1989. – 320 с.).


Наверх


<<< >>>


В начало | От автора | Форматы книг | Общие положения | Сканирование | Обработка сканов | Распознавание сканов | Корректура | Подготовка иллюстративного материала | Вёрстка | Создание выходного файла