Pierburg написал(а):
еще можно в формат djvu преобразовывать, тогда размер раз в 5-10 падает по сравнению с jpg.
+1 за
DJVU.
сам не единожды убеждался!!!
Если сравнивать разные форматы - то самый "толстый" (на мой взгляд) - это
TIFF.
За ним идет
PDF, но у него есть плюсик - в этот формат можно конвертить не только скан-копии чего-либо, но и легко добавлять, скажем, рекламную информацию.
После этого идет
JPEG, но в отличие от предыдущих двух форматов тут не сделаеш файл многостраничным. Т.е. каждая страничка будет отдельным файлом.
Ну и, наконец, формат
DJVU.
Тут добрые люди постарались, и научились автоматически распознавать в каком месте скан-копии находится текст, а в каком - картинка или схема. И, соответсвенно, разрешение (количество точек на дюйм) в разных местах даже одной странички плавно меняется. Как результат - размер файла В СОТНИ РАЗ становтися меньше, чем, скажем, первые 2 формата.
Отсюда вывод - сканировать НАДО
в цвете, и созранять в формате
DJVU.
PS как пример и для сравнения - своими глазами видел книжку по Oracle, листов 600-800, точно не помню (правда она не в цвете, но этот пример для сравнения форматов), дак у нее размер файла был порядка 2 Мбайт...
Просто представите ... 2 000 000 делим, пусть даже на 500 страниц, получаем 4 000 байт (примерно). Примерно столько машинописных символов в среднем выходит на текстовю страницу. Т.е. сравнимо с форматом
TXT...