Немного о сканировании

Возьмите за правило: при сканировании всегда надо добиваться максимального качества картинки (для чего даже в любительском сканере есть аппаратные фильтры), а не минимального ее объема.

В сети довольно много статей на эту тему, поэтому "продвинутый" пользователь при необходимости легко найдет нужную информацию. Мы же предлагаем следующий простой вариант:

  1. Книги сканируются постранично (или попарно) с разрешением не менее 300 dpi. По умолчанию при наличии черно-белых иллюстраций или при их отсутствии используем черно-белый бинарный формат. У сканера, как правило, есть специальный режим для черно-белого текста - используем его. Если сканировать в другом режиме, то при последующем преобразовании в ч/б формат картинка "портится", привести её в читаемый вид можно только в полуручном режиме изменения карты оттенков. При наличии ч/б фото или картинок в полутонах используем оттенки серого (глубина 8 бит т.е. 255 оттенков), если есть цветные иллюстрации, то цвет (не менее 255 цветов).
  2. Файлы сохраняются в PNG, сжатом TIFF или BMP (JPEG - сжатие с потерями, допустимо для цветных изданий, фото и т.п.)
  3. Распознавание - не является обязательным, но если вы решились, то платный FineReader ("домашние" версии стоят около 1000 руб.) или бесплатный CuneiForm вам в помощь.
    Результаты правим по ходу, затем сохраняем в виде документа RTF/Word/ODF (именно в нем, а не сразу в PDF, предназначенном для просмотра и обмена) с опциями максимального сохранения формата оригинала.
    Из RTF/Word/ODF создаем PDF, например, простой отсылкой на печать (предварительно нужно установить нечто вроде бесплатного PrimoPDF или другой утилиты, "подменяющей" принтер). Для Word 2007 есть официальный плагин, позволяющий сохранять прямо в PDF.
    В дальнейшем при обнаружении неточностей можно отредактировать исходный документ RTF/Word/ODF и создать новый PDF.
  4. Если распознавание не входит в планы (пока), то предстоит работа с djvu - это распространённая технология создания книг из отсканированных изображений, для просмотра пользователю нужна специальная программа типа WinDjVu. Другой вариант - создание из файлов картинок многостраничного PDF с подобранными опциями качества и сжатия.
    Ориентируйтесь на такой размер: книга обычного формата в 300 страниц с ч/б иллюстрациями должна умещаться в пределах 3-6 мегабайт.

Цифровой документооборот: DjVu против PDF
Что такое DjVu и откуда у него такие возможности?
Что такое DJVU и как с ним бороться :-)?

Метки публикаций: 
Библиотечка: