Скачать 1.1 Mb.
|
часть текста. И временами левая страница с правой по высоте сильно расходятся. По этому поводу просьба: раскройте (если можно) часть технологической информации - расскажите (хотя-бы в общих чертах), как рассчитываются поля страницы в автоматическом режиме). (А заодно - как в конце вычисляется итоговый размер страниц). Я думаю, что такая информация поможет эффективнее использовать кромсатор начинающим (а может, и не только начинающим) кромсальщикам. И, раз уж на подходе новая версия, не могу удержаться от пары пожеланий. Все в том-же режиме постобработки очень хочется иметь bitmap-editor: что-бы малюсенький кусочек изображения можно было править по пикселам (ну, скажем, клякса какая-нибудь на важном участке изображения). Какие-то другие возможности редактирования - не помешали-бы, но вполне можно и обойтись (например, cut/copy/paste для прямоугольной области - выхватываешь в тексте нужную буквочку, да поверх той-же кляксы лепишь); а вот самого примитивного редактирования здорово не хватает. И второе пожелание. Понятно, что написать подробную документацию - дело тяжелое и неблагодарное. Но если можно - выдайте восхищенным пользователям список всех hotkeys. (Например, в режиме постобработки я не нашел, можно ли изменять маштаб, не пользуясь мышью.) И пусть вещей, которые можно делать без мыши, будет побольше. Автор: bolega, Отправлено:13:43 09-08-2004 Level42 Цитата:Сарасон был очень плох, bolega сказал, что он (Сарасон) безнадежен. Учитывая, что он ещё и не полностью Ну, более-менее прочитывается. Но все-таки 4-bit 100 dpi - это, извиняюсь, полный ... member Обещал подсказать как обрабатывать такие сканы: 1) вых. dpi = x2 2) convert value = average (!) 3) при таком value мусор превращается в точки. Поэтому его можно отсечь только thresholding-ом (это где рисуется гистограмма) и despeckl-ом (новым). Нужно задать только white-thresholding (примерно 210-220). Если же картинка 4-bit, то это практически не поможет, т.е. либо мусор все-равно останется либо побледнеют буквы. 4) при таком value буквы толстеют. для 100 dpi это нормально и ничего делать не надо, т.к. идет только на пользу. Для больших dpi это лечится заданием Sharpen (1 или 2 прохода). Если что-то не работает, как я описал, возможно это глюки старой версии кромсатора. Автор: bolega, Отправлено:19:48 09-08-2004 Level42 Цитата:Все мои попытки были в 300 дпи. А о convert value у меня не было вообще никаких идей. 300 dpi тоже хорошо. Я пробовал доводить и до 600. Но результат практически тот же. Главное - именно convert value, при average используется спец. smooth-thresholding алгоритм, после которого буковки здорово поправляются и округляются, т.е. выглядят намного лучше. Правда и фон вылезает... Но для нормального Gray его, как я говорил, можно убрать гистограммой. Автор: bolega, Отправлено:14:17 10-08-2004 Level42 Получилось нормально. Мусор остался, но в старой версии его и не уберешь полностью. Цитата:Поэтому, чтобы не терять время на каждую страницу, доводя её до совершенства, я остановился на некоем усредненном варианте, когда текст в принципе читаем И это правильно. Боюсь, что автоматически подбирать параметры врядли возможно для таких сканов. Цитата:Кроме того, кривые строчки (или я что-то не так делаю?) уже сами по себе вызывают неприятное впечатление от текста, по сравнению с которым прочие огрехи как-то меркнут... Deskew выпрямляет только общий наклон страниц. В данном случае имеет место неравномерная дисторсия. Я видел только одну программу, которая могла бы справиться с таким безобразием (и она соответственно стоит 6 тыс. евро, если мне не изменяет память). В последнее время я начал потихоньку теоретические изыскания по этому вопросу. Может быть, если мозгов хватит, и это победить научусь. Автор: bolega, Отправлено:10:18 11-08-2004 vpp Пока пишу доку, скажу пару важных вещей. По умолчанию активен старый метод despeckle (Normal). Для лучшей чистки нужно переключить его на Fine. Опции, которые выставляются по умолчанию для нового создаваемого задания, можно определять самому. Причем кол-во таких наборов default-опций можно создать сколько угодно и давать им имена. Один из таких наборов будет набором по-умолчанию (какой именно, тоже задается). Перед созданием нового задания можно загружать любой набор. Например, можно сделать отдельные наборы для 300dpi, 600dpi, и т.д. Редактировать можно теперь и исх. изображение, хотя операций и меньше, чем для выходного. Поддерживается редактирование и для multi-page тифов. Для исходного изображения имеется операция быстрого удаления черной полосы. Для этого нужно щелкнуть по ней мышкой, держа нажатым Ctrl+Shift. (Есть небольшой баг: при загрузке самого первого файла ничего не происходит, если отобразить любой ругой файл из списка, то после этого все пойдет как надо для любого изображения). Добавлено Теперь для поворота изображения не нужно предварительно отщелкивать галку, причем при повороте положения резаков меняются местами как надо. При изменении опции с одновременным удержанием Alt теперь предлагается на выбор, к какому набору файлов применять опцию (раньше было только для selected). Слегка улучшил draft kromsate. При редактировании изображений (как исходного, так и выходного) поддерживаются не только прямоугольные выделения, но и эллиптические и произвольной формы, нарисованные мышкой. В выходном изображении поддерживаются Copy,Cut,Paste,Paste c прозрачностью. В clipboard можно Copy не только из кромсатора, но и из любых графич. программ. После Paste фрагмент можно двигать, растягивать и только потом merge. Процесс обработки стал более стабилен. Вероятность неожиданного вылета сведена к мизеру. Даже если что-то не заладится, кромсатор предложит сохранить текущее состояние обработки в файл для последующего продолжения. Как делать despeckle в выхлдном изображении - напишу уже в доке, т.к. там слишком много возможностей и hot-key-ев. Кстати hotkey-ев добавил много, но будут еще. Можно одновременно обрабатывать и сканировать. Например, вы загрузили в новое задание первые десять файлов. И делаете draft kromsate или уже обработку с фиксир. размерами. Одновременно сканируете. Затем нажали H и в список файлов автоматом добавились новые отсканированные файлы (при условии что в сканере вы нумеруете их). И т.д. bolega ДО создания документации Крайне хотелось бы список Hot Keys ____ при нахождении курсора на размечаемой странице средняя кнопка мыши применяет разметку к текущей странице (здорово! не надо попадать по квадратику у имени файла/страницы) но чтобы исключить движения [область разметки-список файлов] хотелось бы клавишу перехода на следующую страницу (желательно возле левого Ctrl ) оптимально Ctrl или Alt +scroll мыши (это мои мечты ?) Автор: bolega, Отправлено:00:07 18-08-2004 VictorAsp Извиняюсь за задержку с ответом. Отпуск у меня, заглядываю теперь редко. Цитата:средняя кнопка мыши применяет разметку к текущей странице Это уже не так актуально, т.к. появился режим автопринятия изменений опций. Помимо средней кнопки мыши, ту же функцию выполняет клавиша "A". Цитата:Также хотелось бы узнать судьбу Анисимов Б.В. и др Распознавание и цифр обработка изображений (не кромсаный!).djvu Видел, видел. Спасибо огромное! Кромсаю помаленьку. Для листания файлов можно использовать "Q" или "{" (листать назад) и "W" или "}" (листать вперед). Клавиши находятся с обоих концов клавы, так что думаю, и правшам, и левшам будет удобно. Автор: bolega, Отправлено:20:35 23-08-2004 Залил в Колхоз очередную подправленную версию 5.03beta (исправлена пара багов, среди них - забыл вернуть default-значение antialias-параметра поворота: вместо 170 поставил 128 и в итоге antialias-поворот превратился по-умолчанию в обычный). Добавлю, что default-значение antialias-параметра (то, которое берется кромсатором, если параметр задан как auto) можно изменить в ini-файле в секции [Options]: DefAntiAliasA=180,170,150 (это задает значение параметра для 3-х dpi: <300, 300-500, >=500 Автор: bolega, Отправлено:03:29 28-08-2004 Забыл сказать одну важную вещь по поводу последнего Кромсатора. Ранее говорилось, что antialias-deskew слегка неравномерно уширяет буквы. Я модернизировал другой метод вращения - interpolate. При этом на толщину повернутого текста влияет значение параметра convert to b/w threshold (закладка Convert). Если выбрать interpolate и задать convert=lowlight, то, на мой взгляд, уширение практически исчезает, при том, что текст поворачивается так же хорошо (т.е. не деформируется ступеньками), как и при antialias-повороте. xogok, можете проверить новую методику. To all (особенно уважаемому bolega): Я предполагаю что новая версия Кромсатора с shortcuts улучшит продуктивность работы - ведь большая часть времени тратится на: 1) Установку бегунков (особенно двух верхних, так как их надо двигать чаще всего), что трудно делать с помощью мышки в связи с тем что она норовит "перескочить" нужное место. 2) Путь, который мышке надо преодолеть чтобы перейти между бегунками до кнопок 'Apply to current'/'Apply up to current'/'Apply alternate'/ до окна списка файлов (чтобы перейти к следующему по очереди) и обратно к бегункам. Поэтому я постоянно и неутомимо мечтаю о следующих shortcuts, может возможно их добавить, если это не трудно: Определим "движение" (движение=переход) как повторяющееся с интервалом N изменение начинающееся после нажатие данной клавиши и заканчивающееся вместе с её отпусканием. Например: если изменение это передвижение объекта "бегунок" на одну единицу влево, интервал N=1/5 сек., а клавиша - это 'left arrow', то если после нажатия на 'left arrow' изменение с интервалом N происходит непрерывно до отпускания 'left arrow' - это движение, в противном же случае (в частности, если изменение происходит только один раз, и для его повтора необходимо отпустить 'left arrow' и нажать её ещё раз) это не движение. 01) 'left arrow'/'right arrow' - движение верхнего бегунка (Set internal margin or split line) влево/вправона одну единицу движения 02) Ctrl+'left arrow'/'right arrow' - движение верхнего бегунка (Set internal margin) влево/вправо на одну единицу расстояния 03) Alt+'left arrow'/'right arrow' - движение нижнего бегунка (Cut left margin) влево/вправо на одну единицу расстояния 04) Space+'left arrow'/'right arrow' - движение нижнего бегунка (Cut right margin) влево/вправо на одну единицу расстояния 05) Shift+(одна из первых 4 комбинаций) - движение ... бегунка (...) влево/вправо на 5 единиц расстояния 06) Ctrl+'up arrow'/'down arrow' - движение левого бегунка (Cut top margin) вверх/вниз на одну единицу расстояния 07) Alt+'up arrow'/'down arrow' - движение правого бегунка (Cut bottom margin) вверх/вниз на одну единицу расстояния 08) Shift+(одна из 2-х предыдущих комбинаций) - движение ... бегунка (...) вверх/вниз на 5 единиц расстояния 09) 'up arrow'/'down arrow' - переход к предыдущему/последующему файлу в списке (т.к. это действие производится гораздо чаще чем передвижение правого/левого бегунка, у него и комбинация короче) 10) Space+'up arrow'/'down arrow' - переход к предыдущему/последующему файлу в списке находящемуся на расстоянии 2-х файлов от текущего (т.е. переход через файл - для кромсания книг сканированных постранично, где обработке подвергаются чётные/нечётные файлы) 11) Shift+'up arrow'/'down arrow' - переход к предыдущему/последующему файлу в списке находящемуся на расстоянии 10-ти файлов от текущего. 12) 'z' - идентично нажатию на кнопку 'Apply to current' 13) 'x' - идентично нажатию на кнопку 'Apply up to current' 14) 'c' - идентично нажатию на кнопку 'Apply alternate' 15) 'v' - снимает selection с текущего файла 16) 'Tab' - переход между язычками Pages/Book/... слева направо (Pages=>Book=>...) 17) Shift+'Tab' - переход между язычками Pages/Book/... справа налево (Book=>Pages=>...) С таким набором shortcuts нужные клавиши всегда находятся прямо под рукой,что позволяет концентрировать всё внимание на экране, не заставляя отвлекаться для их поиска, а так же shortcuts не имеют недостатков мышки. По моим подсчётам, такое улучшение сократит время кромсания для многих книг (главным образом для тех, у которых процент страниц нуждающихся в корректировке положения одного или более бегунков по сравнению с предыдущей >=50%) до трети. Есть, конечно, ещё несколько возможностей улучшения продуктивности работы с помощью shortcuts (например, acсelerators для всех опций язычков Pages/Book/...), но они не критичны для эффективной работы, т.к. как используются редко. bolega Попробовал Ваши рекомендации deskew interpolate. Выглядит неплохо, но работает ОЧЧЧЕНЬ медленно (вместо 10 мин работал 1ч20мин). Кромсатор становится все более функциональным, жалко функции не описаны м.б. кратко/конспективно? Забыл сказать - после того как я делаю 'Draft kromsate' я отменяю (нажимая предварительно Ctrl) Despeckle, Deskew, Automargins, Clear Shadow и ставлю Page width=none, т.е. по идее все сложные и улучшенные (а поэтому и занимающие много времени) алгоритмы не применяются, и при этом 'Draft kromsate' всё ещё берёт х2 больше времени. Наверно алгоритм разметки тоже был как-то изменён. bolega Если делать Preview with Resample, резаки съезжают в другое (меньшее) разрешение. У меня это наблюдалось при включенном Split. Автор: bolega, Отправлено:15:11 16-09-2004 Вот и кончился мой отпуск. Отсканил пару книжек по image-processing, включая Контурный анализ Фурмана. Скоро начну заливать. Заканчиваю Фунд.алгоритмы Сэджвика (рус.издание) kvk Цитата:составные только в пдф, а в дежавю проблема в том что серый текст читать неприятно, посему я при кромсании такие страницы перевожу в ч/б и вручную удаляю картинку (в кромсаторе это просто. Далее в паинтшопе делаю ч/б серой (она уже была ч/б и серого фона вокруг текста нет) вырезую картинку из некромсанного исходника и вклеиваю к тексту. Картинка получается серая, но серого фона вокруг текста нет (наверное это излишний эстетизм, но 30 стр на которых половина текст и с серым фоном не оч приятно). Это можно все сделать теперь (если я правильно понял) и в Кромсаторе. Выделить в исходной картинке нужную область, дать команду Convert to bw (при этом порог конвертации берется из текущего значения Convert to b/w threshold на закладке Convert). При этом формат файла не изменяется, просто заданный кусок преобразуется в b/w и возвращается на место, т.е. снова становится как бы gray. Аналогично работает и Convert to bitonal (т.е. dithering): я страницы с худ.картинками сканирую в gray, преобразую иллюстрации (т.е. отдельные фрагменты страницы) в bitonal, нажимаю Preview (при этом т.к. вых.формат задан b/w, получаю исходный файл уже как bw), сохраняю его и в итоге на входе кромсатор уже имеет bw-файл, но с иллюстрациями, почти не попорченными прямым конвертированием в b/w. Автор: bolega, Отправлено:16:05 16-09-2004 kvk Я для этого поэтому и ввел возможность использовать не только прямоугольное выделение, но и произвольной формы. Помню, когда я обрабатывал Eberly из полностью серых сканов, там почти на каждой странице был нарисован CD-диск (в изометрии). При прямой конвертации в bw он превращался в черноту. Поэтому я на каждой странице выделял эллипс и конвертил dithering-ом. После третьего десятка вырисовывания эллиптического выделения меня уже трясло. Поэтому я сделал в кромсаторе так: по Ctrl-Insert запоминалась форма текущего выделения, по Shift-Insert она снова восстанавливалась. Поскольку CD-эллипсы были одинаковы на всех страницах, дело пошло очень быстро (их было несколько сотен в общей сложности). Автор: bolega, Отправлено:18:35 20-09-2004 sergeant20 Цитата:А можно ли добавить в Сканкромсатор возможность напрямую засасывать ТИФЫ из проектов FineReader. Я пробовал это делать, но в кромсатору оказываются черно-белые страницы. цветовая информация теряется. приходится сначала делать экспорт, а уж потом заглатывать в кромсатор. Стыдно признаться, но FineReader у меня даже не инсталлирован. Как-то не нужен был (а когда нужен - сотрудников напрягаю). Поэтому сейчас трудно что-либо сказать. Разве у него не обычные тифы хранятся? Хотя припоминаю, что FineReader хранит в каждом тифе три изображения на страницу - оригинал, ч/б и thumbnail. Если это так, то его тифы можно открыть в режиме multi-page. Для этого при щелчке на кнопке открытия файлов или выборе пункта меню "Open" нужно держать нажатым Shift (если нужно открыть только один mult-page tif, то это можно не делать). После этого необходимо избавиться от thumbnail и ч/б под-страниц в каждом тифе. Для этого: - отмаркировать все файлы в списке (стать на последний и нажать кнопку Apply up to current) - это если ничего еще не отмаркировано. (т.к. select special group работает только с маркированными файлами и игнорирует прочие). - выбрать меню edit-select group-special - поставить галку на поле b/w. В итоге будут выделены только все ч/б изображения. - затем File-Delete files from task-All selected - снять снова все маркеры и начать кромсать Цитата:Как вы думаете, поскольку FainReader тоже разворачивает картинку, то идет ли потеря в качестве уже на этой стадии за счет ошибок округления. Мы тут на форуме пришли к общему выводу (теоретическому и практическому), что любой поворот вносит искажения. Цитата:Давно мучает меня вопрос откуда берутся у меня в сканах на некоторых строках небольшие сдвиги верхней части букв относительно нихней. Сей дефект наблюдается у меня на разных моделях сканеров. А вот про это первый раз слышу. Сканеров опробовал не мало, но такого не замечал (или не приглядывался). Может все-таки, это после какой-то обработки FineReader-ом? Потому что такие сдвиги характерны для сканов 300 dpi и ниже при их повороте. Автор: bolega, Отправлено:16:05 21-09-2004 Хочу поделиться как я теперь обрабатываю книги, где четные и нечетные страницы сканируются отдельно. Сканирую сначала четные, потом нечетные, нумерация сплошная, т.е. если последний номер четной, к примеру, 200, то первая нечетная будет иметь порядковый номер 201. Потом загружаю в кромсатор все скопом. Кромсаю как есть. Т.к. теперь кромсатор автоматом может переименовывать вых. файлы при любых манипуляциях в исх. списке (удаление, добавление, перемещение, изменение признака Split), то теперь осталось только перемешать в правильном порядке четные и нечет. страницы. Становлюсь на первую нечетную страницу (пусть #201), выделяю ее, становлюсь на последнюю нечетную страницу, т.е. в конец списка, нажимаю Shift-пробел. В результате выделяются все, что находится в диапазоне от последнего выделенного (т.е. 201) до текущего. Теперь делаем Edit/Copy selected (при этом ничего не происходит, просто выделенные файлы запоминаются во внутреннем буфере), затем становимся на файл №1 и затем Edit/Paste interliev. В итоге файлы перемешиваются как надо (interliev - через один). Если до этого момента есть уже обработанные выходные файлы (все или частично), то кромсатор предложит переименовать их (что именно и как переименовывать, кромсатор позаботится сам). Бывает, что из-за пропуска в сканах после перемешивания имеет место нарушение последовательности страниц. Ничего страшного. С помощью команды Edit/Move-shift selected можно корректировать положение файлов в списке как угодно (опять же с автоматич. переименовыванием вых.файлов). Move перемещает все выделенные файлы (выделение может быть не обязательно сплошным, а, например, через один) в определенную позицию в списке файлов. Например, можно выделить все четные страницы и переместить их в конец списка, где они расположаться уже последовательно, т.е. выполнить операцию, обратную перемешиванию. При Shift же все выделенные файлы сдвигаются на заданное количество строк вверх или вниз, сохраняя при этом расстояние между друг другом. Добавлено Если нужно переместить в списке единственные файл, то это можно сделать мышкой, нажав напротив файла правую(!) кнопку и перетащить на нужное место в списке. bolega и все-все-все Проблема нумерации четных/нечетных страниц вообще надумана. Хорошо конечно, что Кромсатор это умеет, но это не особенно необходимо: можно сканировать четные и нечетные страницы, скажем, в разные папки, а затем устроить массовые переименования с пом. Total Commander. Операция занимает секунды, и совершенно безболезненна. Так что лучше сосредоточиться на чем-нибудь более актуальном... Автор: bolega, Отправлено:11:08 22-09-2004 kvk Цитата:нет ли возможности для такого трюка Сделаем. Цитата:и еще (обсуждалось решение есть но лишняя суета), нельзяли крупный поворот (90 180) применять не ко всем стр а к каждой по отдельности (как и многие другие настройки) а если ко всем то через шифт как и с другими. Тут два назначения. Если поворачивать с сохранением в оригинал, то для этого появилось меню Image/Rotate&Save. Там можно задать что поворачивать выделенные. Значение угла поворота берется либо одинаковым для всех (Angle/Flip From=user defined), либо из уже заданных опций для каждого файла. Если же поворачивать в задании (это где вверху комбобокс), то можно держать Ctrl или Alt при изменении значения в комбобокс. Ctrl - повернет для всех, Alt - спросит, для каких. bolega Full Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- stilinor Цитата:надо только подобрать подходящие опции на язычке 'Convert' в Кромсаторе, все остальные не касаются grayscale ==> bw Здесь вы не совсем правы. Если gray-скан более-менее чистый и интенсивность фона заметно отличается от текста, то да. А если есть тени, да еще близкие по цвету к тексту, то обычный convert ничем не поможет: либо тень станет в итоге черной полосой (и текст не будет виден), либо наоборот, убирание тени уничтожит и текст. Поэтому нужно убирать фон и, если текст плохо различим на нем, то еще и задействовать спец.фичу по "вытягиванию" текста из фона. Все это делается в "gray enhance" на закладке Quality. bolega Full Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- stilinor Цитата:Есть ли где нибудь описание её опций? Ох как мозоль сразу заболела Для начала нужно поставить галку на "enhance image". В противном случае все enhance-настройки при обработке будут игнорироваться (но будут срабатывать при preview). Потом нажать кнопку "gray enhance". Или hotkey = "B". Все основные фичи будут на закладке "bckground cleaner". Чтобы убрать фон, достаточно задать Cleaner passes = 1. Если текст сильно сливается с фоном (т.е. очень малый контраст между текстом и фоном) (редко, но бывает), то он может пострадать при этом. В этом случае ставится галка на correct low contrast и методом подбора подбирается чувствительность распознавания текста на фоне (sensitivity). Обычно я начинаю с 20-25 и уменьшаю последовательно на 5. Это значение по сути задает в % имеющийся контраст между фоном и текстом. Когда кромсатор убирает фон, он проверяет (для каждой точки найденного фона), имеется ли в нем текст, такой, что его контраст по отношению к фону >= заданного порога (sensitivity). Если имеется, то цвет этой точки не меняется (если не стоит галка на опции increase black) либо вообще заменяется на чисто черный (если на increase black галка стоит). Таким образом и фон убирается, и текст остается. Замечу, что данная процедура плохо работает для очень светлых сканов, т.к. сильно начинает вылазить всякий мусор, т.к. его цвет сравним как с цветом фона, так и с цветом текста. Значение sensitivity можно задавать различным для левой и правой половинок разворота. Только нужно, чтобы были уже выставлены внутренние резаки (int1 или int1+int2). Preview по ним будет судить о том, где левая половина разворота, а где - правая. Как выполнять подбор? Поставить галку на "don't change out color" (это повлияет только на preview, но не на обработку), чтобы не тратить время на конвертацию gray->bw. Либо не ставить, чтобы увидеть уже конечный результат. Нажать на preview или на preview with resample. В первом случае при preview не будет увеличиваться dpi (если это конечно задано), во втором - dpi увеличится как задано на закладке Files. Потом Undo и снова подбираем. В последней версии глубину Undo я сделал практически неограниченной. Чтобы перенести побобранные опции на все (или на группу) файлов нужно в контекстном меню закладки bckground cleaner выбрать соответствующую команду. Если же нужно перенести вообще все опции enhance, то нужно снять галку с "enhance image" и держа нажатым Alt, снова ее взвести. И еще: при работе с preview лучше отключать режим автопринятия опций, т.к. при смене dpi кромсатор положения резаков не корректирует. Добавлено Еще пара замечаний. Там есть опция protect black pixels. Это когда имеются однотонные иллюстрации, например черные квадраты и т.д. Такие области кромсатор будет трактовать как фон, и вычистит их. Чтобы этого не произошло, ставится защитный порог цвета, выше которого цвет не считается за фон. К сожалению, значение порога жестко зашито в программу, со временем я дам пользователю и его задавать. Пока только просто галка. В новой версии будет еще один способ защиты - через exclude-зоны. Сейчас такие зоны есть, но они защищают только от despeckle, который может определенным иллюстрациям нанести ущерб. Второе замечание: если gray-сканы имеют разрешение <300 dpi, то обязательно нужно увеличивать выходное dpi вдвое, иначе при конвертации в bw качество сильно пострадает. А так за счет учетверения каждого пикселя появится возможность хоть как-то интерполировать переходы gray-оттенков. bolega Full Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- Слегка продолжу тему. Помимо перечисленных, удаляются еще ряд спеклов, больших чем заданный предел. при этом анализируется соотношение площади черных точек к площади спекла и его ориентация. Методика чисто эвристическая и подбиралась экспериментально. По поводу глифов i и j, используемых в индексах формул, я уже писал. Их размеры (точнее их точечек) чаще всего меньше предельно допустимых, но беспокоится не надо - они в процессе despeckle с помощью упрощенного OCR распознаются и despeckl-ом не трогаются. Главное, что мне удалось совместить одновременное выполнение этих двух операций (OCR и despeckle), и с очень высокой скоростью. На это ушло 2 месяца мучений То, что я писал по поводу изменения DefDespeckleA в sk.ini - это крайний случай, для особой перестраховки. Можно просто ужесточить предел в Pages->Special->Despeckle, уменьшив там макс.размер удаляемых спеклов на 1-4 пикселя. Причем это можно делать как индивидуально для каждой страницы, так и для группы (через Alt или Ctrl). Я так делаю для плохо-пропечатанных страниц. Если бледный только какой-то участок страницы, я использую exclude-зону. Если в Pages->Special->Despeckle задать например Fine[-2], то этот выбор запоминается, и для остальных страниц можно использовать уже просто хоткеи E (для страницы или левой половины разворота) и R (для правой страницы разворота), т.е. не нужно все время лезть в Pages->Special->Despeckle и щелкать там, достаточно один раз. bolega Full Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- Cptn_Cook Цитата:Мне кажется, что despeckle представляет собой угрозу большую Fine despeckle действительно чистит капитально (в пределах заданного допуска). Для бледных сканов лучше конечно не использовать. Цитата:Просьба: Не использовать эту финкцию до тех пор, пока она не будет тысячу раз протестирована. А тут собственно и тестировать нечего: despeckle он и есть despeckle. По определению убирает изолированные точки заданного размера. И если линия превратилась в набор точек, то это уже не линия. Это на экране при уменьшенном масштабе и фильтре она глазом воспринимается как линия, а с точки зрения pixels это уже не так Цитата:Просьба сделать так, чтобы они при этом просто прибивалиьс к правому и нижнему краям соотв. OK. Сейчас это можно быстро сделать вручную так: щелкнуть правой кнопкой мыши на тексте, где выводится координата это линии (в верхней панели окна) и выбрать команду Reset line position. Цитата:Draft Kromsate почти всегда съедает края текста Так уж и всегда! Я заметил только на номерах страниц, и то только из первого десятка. Вообще-то точность определения края зависит только от всего нескольких параметров-констант. Причем если их увеличить - начинается спотыкание на мусоре, если их уменьшить - появляются съедания. Я жестко заложил среднее значение. В принципе можно вывести их в диалог для выбора пользователем. Cptn_Cook Member Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- stilinor Цитата:Наверное всё дело в том, что вы оптимизируете дая распечатки, а я для чтения с экрана - поэтому я не обращаю внимания на пустое место по вертикали (к тому же уменьшение этого пустого места требует ручной установки резаков) Совершенно необязательно. Нужно выставить automargins и кромсатор сам уберет поля. Это верно как для вертикали так и для горизонтали, так что Вам не придется и горизонтальные резаки устанавливать. Мои параментры центровки: Vertical - A (=top), Horizontal = C (center). На первых страницах глав: Vertical = B (bottom). Только иногда, из-за того, что я пользуюсь average width/height, некоторые страницы не влезают, но это потом решается переделкой тех страниц на этапе проверки. Цитата:а пустые страницы выбрасываю. Зачем? Чем они Вам мешают? Они не занимают места. Спросите у другого народа, все оставляют пустые страницы. Цитата:Боковые поля же я убираю по той же причины по которой вы их оставляете, т.к. предпочитаю чтобы текст заполнял весь экран (к тому же надо только изменить Zoom для того чтобы появились поля когда читают с экрана). См. выше. Поля нужны везде и всем. Вот посмотрите на эту страницу руборда, которыю вы сейчас читаете. У нее тоже есть поля, и это сделано не зря, это помогает при чтении переводить вгляд на след. строку. Издатели давно этим занимались, и если бы поля были не нужны они бы с удовольствием экономили бы на них бумагу. Вспоминте еще тетрадки, на которых вы писали в школе, там была специальная линия для отступа слева. Конечно, поля свыше 100 pts тоже неприятны, особенно при чтении с экрана, но 70 pts, которые стоят в кромсаторе по умолчанию, это самое то. Кромсатор сам умеет расставлять поля, только за это bolege памятник нужно поставить. bolega многих страницах похоже вычистились кое-какие знаки в формулах (точки, = и т.д.) и многие вещи стали непонятны. Если Вы использовали Fine Despeckle, то нужно бы уменьшить макс. размер удаляемых спеклов на таких страницах (закладка Pages, кнопка Special, Despeckle=Fine[-2]). Если это так, не могли бы Вы переделать? bolega Full Member Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору -------------------------------------------------------------------------------- kvk Цитата:Уменьшить это хорошо, я тоже уже нарвался и просто перешел на нормал А на каких сканах? (600dpi или 300). Можно в sk.ini прописать свои размеры спеклов, в секции Options написать DefDespeckleA=2,4,7 (привел значения по-умолчанию для dpi<150, 150-300, >300 соответственно). Для подавляющего большинства сканов это нормальные значения, гарантированно меньшие знаков препинания и прочих мелких символов. Но если скан плохой, то не только символы, но и знаки бывают разорванными, поэтому despeckle может их уничтожить. И еще, удаляются спеклы и большего размера (в 1,5 раза больше, чем приведенные), но только те, кот. имеют вытянутую форму (3:1). В следующей версии я добавлю возможность отключать это (через ini-файл). На чистку влияет также опция Strong connected speckles на закладке Options. По умолчанию выключена, что означает: если пиксел касается другого только по диагонали, то они все равно считаются принадлежащими одному спеклу, и размер его получается больше, и вероятность его удаления понизится. Поэтому лучше не включать этот флаг. Какой-бы ни был despeckle, он все равно попортит не-векторные иллюстрации. Поэтому такие иллюстрации всегда нужно включать в exclude-зону. Т.е. выделить мышкой прямоугольник, так, чтобы иллюстрация оказалась полностью внутри выделения, и в контекстном меню выбрать команду Exclude region - регион визуально будет в виде красного прямоугольника. Инструкция по созданию книг в формате DjVu от DMVN (специально для http://lib.mexmat.ru) </300> |
«Научно-производственный центр «Космос-2» Настройки программы на работу с базой данных производятся с помощью файла Control. Ini, расположенного в той же папке, где установлена... |
Программа инсталляции Flexpde размещает значок Flexpde на ваш рабочий... Вы можете запустить Flexpde просто, дважды нажимая этот значок. Альтернативно, Вы можете использовать Проводник Windows, чтобы переместиться... |
||
Т. В. Чубарова Данный сборник представляет материалы конференции,... Нуждается ли рынок в нравственности? Взаимодействие экономики, политики, культуры и морали в переходных обществах 22 |
Игити гу-вшэ Поэтому персонажами той истории, которую мы собираемся выстроить, будут не столько Лоренцо Валла, Бартоломео Фацио, Джовиано Понтано... |
||
Инструкция к выполнению экзаменационной работы по Географии Открыть в папке «Мои документы» папку «Экзамен по географии» и создать папку «География фамилия экзаменуемого», все созданные файлы... |
Инструкция по работе с системой fare family / branded fares в асб... Вал код валюты, в которую пересчитываются все выводимые тарифы (по умолчанию валюта,в которой работает пульт) |
||
О здоровье и об устранении главной причины болезней глава 1 Это дает возможность лучше понять механизм воздействия радиации на здоровье человека, определить правильную стратегию лечения облучённых,... |
Руководство участника форум-выставка «Импортозамещение в туризме» Мы рады, что Вы воспользовались уникальной возможностью представить Вашу продукцию и услуги на Форуме-выставке «Импортозамещение... |
||
«ЦветыЭкспо-2017» 12-14 сентября 2017 г. I павильон, залы 3, 4 Вашу продукцию и услуги на Международной выставке цветов, растений, техники и технологий в цветоводстве и ландшафтном дизайне «ЦветыЭкспо-2017».... |
Руководство участника ярмарки 20 23 марта 2018 года Москва, вднх... Вы воспользовались уникальной возможностью представить Вашу продукцию и услуги на Федеральной Оптовой Ярмарке товаров и оборудования... |
||
Ежедневный мониторинг сми 4 июля 2011 Программа модернизации железнодорожной инфраструктуры Монголии нуждается в наполнении инвестиционными проектами |
Какая прошивка на станции кх-тd1232 нормально поддерживается 74 системниками? Атс и сразу же донабор. Если прибавить время в коде 206 до 1500 мс., то успеваешь иногда набрать городской номер и тогда все работает.... |
||
Инструкция по размещению архива на сайте Для создания архива выберите... Для создания архива выберите необходимые документы и поместите их в одну папку (Рис. 1) |
Алгоритм работы с программой algo2000 (Машина Тьюринга) В папке algo2000 содержится одна папка и три файла algo2000: значок программы, файл справки и исполняемая программа (приложение) |
||
Конфигурирование разделов на жестком диске ... |
Работает официальный сайт Работает официальный сайт для просмотра баланса карты каждого ученика по программе «Школьное питание» через Интернет |
Поиск |