Сканирование


В начало | От автора | Форматы книг | Общие положения | Сканирование | Обработка сканов | Распознавание сканов | Корректура | Подготовка иллюстративного материала | Вёрстка | Создание выходного файла


<<< >>>

Сканирование

Эта стадия является обязательной и её по праву можно назвать самой ответственной, поскольку именно от неё зависит качество будущей электронной книги.

Прежде всего, нужен сканер подходящего типа. Спектр выпускающихся разновидностей этих устройств очень широк. Существуют модели, у которых и передача данных, и их электропитание осуществляются через какой-либо компьютерный порт (как правило, USB), то есть через него происходит подача энергии, необходимой для питания лампы сканера и работы перемещающего её электродвигателя. Это не позволяет устанавливать в такие сканеры двигатели большой мощности, по причине чего скорость поступательного движения каретки и, соответственно, скорость сканирования страницы, оказывается довольно низкой. Указанное обстоятельство весьма критично для сканирования многостраничных книг, ведь зачастую именно оно является ещё и «лимитирующей стадией» всего процесса в целом. Сканеры описанного типа хороши лишь в случаях, когда нужно отсканировать порядка десяти страниц, но не более того. Поэтому рекомендую выбирать сканер, у которого запитка его механических компонент осуществляется от обычной электрической сети (пусть даже и через адаптер).

Второй важный момент, на который следует обратить внимание – это программное обеспечение. При покупке сканера в комплект его поставки входят не только необходимые драйвера, но и программа для управления режимами работы, приёма данных с этого устройства, первичной их обработки и сохранения в виде файлов.

К сожалению, не все подобные программы хорошо подходят для работы с многостраничными книгами. Дело в том, что в некоторых из них для получения одного скана нужно каждый раз выполнять пусть и короткую, но всё же определённую последовательность действий, сводящуюся к одним и тем же операциям: выбор пунктов меню, нажатие кнопок в диалоговых окнах, установка опций, что осуществляется посредством нескольких щелчков мышью. При сканировании большого количества страниц это также заметно тормозит весь процесс, как и описанные выше медлительные сканеры, но вдобавок ещё и может сильно раздражать.

По указанной причине советую пользоваться программой, аналогичной “OmniPage”. В ней сперва выставляются необходимые параметры сканирования, а затем подаётся команда к его началу. После того, как страница будет отсканирована, программа каждый раз выдаёт маленькое диалоговое окно (Рисунок 1) с двумя кнопками, первая из которых (“Stop loading pages” – «прекратить загрузку страниц») позволяет остановиться, а чтобы продолжить сканирование дальше, нужно приложить к стеклу сканера следующую страницу и нажать на вторую кнопку “Add more pages” («добавить ещё страницы»). Таким образом “OmniPage” позволяет сначала получить группу сканов, просмотреть их, в случае необходимости отбраковать неудачные и лишь потом записать в виде совокупности файлов.


Рисунок 1. Вид диалогового окна в программе “OmniPage” после сканирования страницы


Теперь следует рассказать о параметрах сканирования, ведь именно они определяют качество скана. Прежде всего это – разрешение изображения, измеряющееся в dpi (dots per inch – количество точек-пикселей на дюйм). Рекомендуемое значение, к тому же и наиболее часто применяемое – 300 dpi. Использовать более низкое можно, но далеко не всегда целесообразно. В случае, если текст сканируемых страниц набран мелким шрифтом, то имеет смысл проводить сканирование с более высоким, нежели 300 dpi, разрешением (400 или 600 dpi), если только возможности самого сканера позволяют это делать. При этом необходимо помнить, что чем выше разрешение изображения, тем больше (при прочих равных условиях), будет размер файла-скана.

Не менее существенное значение имеет и рациональный выбор режима сканирования. Три основные их них следующие: цветной, оттенки серого и чёрно-белый.

Цветной (“color”) режим – это получение картинки (скана) с глубиной цвета (по-английски – “color depth”) в 24 бит, то есть изображения со всеми возможными (точнее – заметными среднему человеческому глазу) переходами оттенков, которых в этом случае можно закодировать аж 224 = 16 777 216 штук. Данный режим сканирования наиболее подходит для страниц, содержащих цветные иллюстрации или разноцветные надписи (например, заголовки в некоторых изданиях могут иметь цвет, отличный от цвета основного текста). Также он может понадобиться в случае потребности сохранить не только сам текст, но и внешний вид его носителя – фактуру и цвет бумаги, какие-нибудь мелкие дефекты типа царапин, чьих-то рукописных пометок, обтрепавшихся от времени уголков страниц и т. п.

При сканировании в режиме оттенков серого, который часто в англоязычных программах обозначается словом “grayscale” («шкала серого») – это получение скана с глубиной цвета 8 бит (с гаммой из 28 = 256 оттенков серого цвета, включая чёрный и белый как крайние). Если выражаться простым житейским языком, то визуально такой скан выглядит как чёрно-белая фотография. Этот режим сканирования хорош для страниц с чёрно-белыми иллюстрациями, содержащих различные оттенки серого цвета. При сканировании в этом режиме также можно сохранить, правда, в нецветном варианте, внешний вид носителя текста – например, всё ту же фактуру бумаги.

Третий режим сканирования называется чёрно-белым (“black and white”), ещё он может именоваться одноцветным или монохромным (“monochrome”). Его не следует путать с описанным выше режимом оттенков серого. В чёрно-белом режиме получаемый скан имеет глубину цвета 1 бит. По сути это означает, что при сканировании светлые участки страницы воспринимаются только как имеющие белый цвет, а тёмные – только как чёрный. Наиболее близкая жизненная аналогия такого режима – это ксерокопия, на которой зачастую мелкие или слабовыраженные детали страницы (ну например, слишком блеклый оттиск печати на документе) не фиксируются. Чёрно-белый режим наиболее подходящ для страниц, содержащих текст, таблицы и рисунки, представляющие собой совокупности контрастных, чётко очерченных линий (например, графики и схемы), в случаях, когда нужно запечатлеть именно информационное содержание страницы, отметя фон.

Некоторые программы управления сканером позволяют получать изображения в других режимах, отличных от рассмотренных трёх основных. Например, это могут быть варианты сканирования в 16- или 256-цветной палитре. Лично у меня ни разу не возникало необходимости в подобных режимах, даже при наличии возможности их использования, хотя представляется, что нельзя исключать ситуацию, когда их применение будет вполне оправданным.


Большинство программ для работы со сканером позволяют автоматически выполнять некоторые корректировки сканов-изображений, например, задавать предустановки для контрастности, яркости, цветового баланса. Зачастую это позволяет получать сканы заметно более высокого качества, что в дальнейшем упрощает дальнейшую их обработку, поэтому перед сканированием можно рекомендовать немного поварьировать этими настройками и выбрать наиболее оптимальные. Здесь же, на всякий случай, следует напомнить о такой очевидной вещи, что при сканировании страницы следует прислонять к стеклу сканера поплотнее (чтобы изображение на сканах получалось как можно более резким и чётким), держа их при этом прямо и неподвижно. Простота получения скана хорошего качества будет зависеть от типа оптической системы в используемом аппарате – для оцифровки книг лучше подходят ПЗС-сканеры, так как они обладают большей глубиной резкости (±3 мм) по сравнению КДИ-устройствами (±0,3 мм) – как легко догадаться, первые менее требовательны к плотности прилегания сканируемой страницы.

Результат сканирования в конечном счёте записывается в виде графического файла. Поскольку форматов их существует великое множество, а программы управления сканером, как правило, предоставляют пользователю определённый выбор, то в Таблице 2 приводятся рекомендуемые. Общий принцип, по которому выбирались указанные в ней форматы – стремление по возможности сохранить полученную со сканера информацию в неизменённом виде. По этой причине ни в коем случае не советую сохранять сканы в виде файлов форматов, использующих при сохранении изображения алгоритмы сжатия с потерями (к таковым относится формат JPEG). Вообще говоря, типы графических форматов, их характеристики (в том числе и упоминавшийся выше термин «глубина цвета»), достоинства и недостатки – это тема для отдельного разговора, способного увести далеко от создания электронных книг, поэтому настоятельно рекомендую дополнительно ознакомиться хотя бы с имеющейся в Интернете информацией по этому вопросу.


Таблица 2. Форматы файлов для сохранения результатов сканирования

Режим сканирования

Графические форматы (перечислены в порядке уменьшения предпочтительности)

Цветной

TIFF (без сжатия), BMP

Оттенки серого

TIFF (без сжатия), BMP, GIF

Чёрно-белый

BMP, TIFF (можно с типом сжатия “PackBits” или “LZW”), GIF


Заканчивая повествование о получении электронных копий страниц книги, хочу упомянуть, что помимо сканирования существует ещё один способ, по моему мнению менее приемлемый, но иногда используемый – применение цифрового фотоаппарата, когда страницы книги просто фотографируются, а полученные снимки далее копируются на компьютер. Поскольку фотографии нередко сохраняются в виде файлов JPEG, имеющих к тому же разрешение 72 или 96 dpi (наиболее часто встречающиеся значения разрешения компьютерных мониторов), то качество получаемых таким способом фотокопий страниц (особенно если у фотоаппарата нет системы стабилизации изображения) не очень высоко. Это порой весьма негативно сказывается и на качестве самой электронной книги, из этих файлов созданной.


Наверх


<<< >>>


В начало | От автора | Форматы книг | Общие положения | Сканирование | Обработка сканов | Распознавание сканов | Корректура | Подготовка иллюстративного материала | Вёрстка | Создание выходного файла