| От | PK |  |
К | Дм. Журко |  |
Дата | 06.11.2007 20:24:24 |  |
Рубрики | Администрации; |  |
Знания не стареють :-)
... и да простят нам оффтопик.
>Не тематика Форума, но знания надо распространять современные.
Знания не стареют. Даже в мире ИТ.
>TIFF кругом плох. Самая малая степень упаковки JPEG лучше любого TIFF, если он не индексирован. Индексированный (чё1рно-белый, серый) лучше PNG и даже GIF.
Вы не поняли. TIFF (как и приведённый вами PNG и разумеется BMP) имеют от JPEG принципиальное отличие: они не теряют информацию. А жпег теряет, причём таким образом что затрудняет распозновение образов (букафф) потому что считает картинку именно картинкой с плавными отображениями цвета, а не изображением текста. Различия в размере файла оставим пока побоку. ТИФФ я назвал как пожалуй самый распростарнённый формат, с которым у меня не было проблем (с ПНГ были) на самых разных платформах. Кстати, в ТИФФе тоже есть ЗИПовский компрессор.
>Есть уже средства правки Djvu. Развивается направление хорошо. Например -- LizardTech Document Express Editor -- www.lizardtech.com.
Спасибо за ссылку, но речь шла о формате данных, а не о программаю для работы с ними.
>>В общем, ДеЖаВю есть формат принципиально ЛУЧШЕ заточенный для сканов книжек чем жпег. Ну а если матчасть неизучена...
>Всё равно не факт. JPEG совместим, средств работы с ним тысячи, иногда прекрасных средств. Начиная с FineReader.
Опять таки, речь шла о формате данных. ЖПЕГ (а так же ПДФ с компрессией через тот же ЖПЕГ) принципиально хуже для текста чем ДеЖаВю (или опять таки ПДФ с JBIG). Потому что ЖПЕГ и на нём основанные форматы-контейнеры ТЕРЯЮТ часть информации.
т.о. самым правильным будет путь
1. сканер --- ТИФФ --- ДеЖаВю+распознание либо
либо
2. сканер --- ТИФФ --- ПДФ/JBIG + распознание.
Многие выбират второй путь, но вместо JBIG пользуюутся JPG "патамушта там галка стоит". Ну и зря...
В общем, можно и не пользоватся ДеЖаВюкой и получать сравнимые результаты как по качетсву так и по размеру. Надо просто знать что делать. А если не знать и не уметь то....
http://en.wikipedia.org/wiki/JBIG