RasterID
Программный продукт, предназначенный для сканирования и обработки растровых изображений, автоматизированной регистрации отсканированных изображений в электронном архиве и системе документооборота.
С помощью RasterID вы сможете:
- сканировать документы, повышать их качество и корректировать искажения;
- печатать изображения;
- производить индексацию сканированных изображений;
- экспортировать информацию во внешнюю базу данных или систему документооборота.
Система поддерживает работу с наиболее распространенными форматами растровых файлов, в ней предусмотрена возможность настраивать параметры сохранения отдельных форматов и создавать новые форматы на базе существующих.
Сканирование
Модуль WiseScan — это всё, что вам понадобится для быстрого и интеллектуального сканирования на всех моделях сканеров Contex (Contex Card+) и сканеров с TWAIN-интерфейсом.
Предусмотрены пять режимов работы модуля WiseScan:
- для просмотра — с выводом изображения на экран для дальнейшей обработки;
- в файл — с автоматическим именованием документов;
- с выводом на печать для тиражирования оригиналов;
- по сети, используя технологию Scan-to-Net;
- в пакетном режиме с заданным сценарием обработки.
При работе с цветными изображениями RasterID может рассчитать палитру классифицированных цветов и сохранить ее в LUT-файле непосредственно в процессе сканирования. Это позволяет уменьшить количество цветов на растровом изображении, оставив только цвета оригинала. Соответственно уменьшается и размер растрового файла.
Печать и цветовая калибровка
Обычный способ вывода растровых изображений на печать дополнен в RasterID возможностью печати с управляемой автоматической раскладкой изображений на листе или рулоне. За счет оптимальной раскладки эта возможность экономит бумагу при выводе на печать набора растровых изображений. Предусмотрено задание полей для листа, вписывание и обрезка по формату листа, разрезание на страницы. Для цветных изображений обеспечена возможность индивидуальной цветовой коррекции пары «сканер — плоттер» и поддержка стандартных цветовых ICC-профилей.
Настроенные параметры печати можно сохранять в файл шаблона для использования при пакетном режиме печати.
Коррекция сканированных изображений
RasterID предлагает следующие возможности повышения качества сканированных растровых изображений (как в ручном, так и в пакетном режимах):
- устранение перекоса;
- коррекция по четырем точкам рамки;
- фильтрация монохромных изображений (удаление «мусора», сглаживание, заливка «дырок», утолщение и утоньшение линий);
- коррекция цветных и полутоновых изображений (цветные фильтры, регулировка яркости и контрастности, коррекция по гистограмме, гамма-коррекция, коррекция палитры и т.д.);
- обрезка пустых полей изображения, обрезка по рамке, обрезка по заданному формату в ручном режиме;
- приведение к ближайшему формату, увеличение до ближайшего формата;
- поворот и зеркальное отображение;
- масштабирование;
- преобразование в полноцветный, индексированный и полутоновой растр;
- разделение цветных и полутоновых изображений на монохромные слои;
- адаптивное размытие, используемое для устранения «зернистости» изображения;
- специальные инструменты для внесения изменений в растровую графику (возможность рисовать и стирать линии и объекты на растровом изображении, вводить текст и т.д.).
Рис. 1. RasterID. Коррекция сканированных изображений
Поиск и распознавание штампа (индексация)
Отсканированный документ может быть помещен в систему документооборота. Для поиска этого документа формируется карточка с атрибутами, полностью его описывающими (шифр, наименование и т.д.). Всю эту информацию можно взять из штампа документа. Уникальной особенностью RasterID является поиск графического изображения штампа (титульного блока) на отсканированном документе, разбиение его на отдельные ячейки и распознавание текста в этих ячейках.
Рис. 2. RasterID. Распознавание штампа
Для обучения программы тому или иному типу титульного блока достаточно обвести такой титульный блок прямоугольником — RasterID распознаёт структуру штампа, создает список полей, которые могут быть поименованы и использованы как имена полей базы данных.
Распознавание текста (Abbyy FineReader)
В состав RasterID 3.6 включен дополнительный модуль распознавания текста FineReader 9 от компании ABBYY. Модуль распознавания текста FineReader 9 способен распознавать как печатный текст (типографский, машинописный), так и текст, написанный печатными буквами от руки на разных языках.
Рис. 3. RasterID. Распознавание текста
Опции FineReader позволяют настроить его под конкретную задачу. Его настройки позволяют указать:
- язык распознаваемого текста: один из сорока вариантов, включая комбинацию «русско-английский»;
- тип печати текста: например, если текст напечатан на пишущей машинке или на матричном принтере, следует выбрать соответствующий вариант;
- предпочтительный вид символов: прописные, строчные буквы или цифры;
- FineReader предоставляет дополнительные возможности по поиску штампа и распознаванию полей. В некоторых случаях это может улучшить качество распознавания;
- возможно применение пользовательских OCR-символов из указанной библиотеки при распознавании текстов.
- FineReader выполняет распознавание с хорошим качеством без дополнительного обучения (при условии, что параметры заданы верно, например, язык).
Рис. 4. RasterID. Настройки опции распознавания текста
Распознанный текст со всего растрового изображения или с его фрагмента можно записать во внешний файл в формате *.txt
Передача распознанных данных из штампа
Графический фрагмент штампа и распознанный текст можно передать во внешнюю базу данных или систему документооборота с помощью Приемника данных. В RasterID уже реализованы наиболее распространенные приемники данных, такие как MS Excel, MS Access, TDMS, ODBC (для системы документооборота), текстовый файл с разделителями. При необходимости пользователь может самостоятельно создавать и подключать приемники данных к своим системам.
Рис. 5. RasterID. Передача распознанных данных
Автоматизация обработки
Необходимый набор команд для обработки задается простым перетаскиванием команды из списка в поле сценария в диалоге Мастер командных файлов. После задания параметров команд можно сразу запустить обработку или же сохранить заданный сценарий обработки в отдельный файл.
Рис. 6. RasterID. Автоматизация обработки
Для автоматизации обработки большого количества файлов по определенному сценарию используется инструмент Мастер пакетных заданий. В этом диалоге можно выбрать набор файлов или папку с определенным типом файла (включая вложенные папки), выбрать командный файл для обработки с заданным сценарием и нажать кнопку Выполнить. Программа выдает отчет о ходе обработки изображений, доступный для сохранения в файл.
Рис. 7. RasterID. Инструмент "Мастер пакетных заданий"
Виртуальный сканер
Виртуальный сканер в RasterID позволяет задать сценарий обработки и указать папку на диске, в которой будут появляться отсканированные изображения. Через установленный промежуток времени виртуальный сканер будет обращаться к этой папке и обрабатывать появившиеся в ней изображения по установленному сценарию.
Рис. 8. RasterID. Виртуальный сканер
ActiveX — CSRasterTT
В работе RasterID использует управляющий элемент ActiveX — CSRasterTT. Для работы с ним можно использовать стандартные средства разработки: объектно-ориентированные языки программирования, такие как MS Visual Basic, MS Visual C++, Borland Delphi, имеющие COM-интерфейс. Взаимодействие между управляющим элементом и другими приложениями может быть различного типа сложности. Например, управляющий элемент ActiveX, на котором построена программа, может предоставлять свои возможности по обработке растровых изображений и распознаванию штампов внутри других приложений. То есть вы можете создать свою программу, используя в качестве основы элемент ActiveX CSRasterTT; также вы можете добавить функциональность элемента к уже существующей программе.
Что нового в RasterID 3.6
Встроенный модуль распознавания текста FineReader 9
В состав RasterID 3.6 включен дополнительный модуль распознавания текста FineReader 9 от компании ABBYY.
Модуль распознавания текста FineReader 9 способен распознавать как печатный текст (типографский, машинописный), так и текст, написанный печатными буквами от руки на разных языках.
Команда меню Средства → Распознать текст в файл запускает распознавание текста непосредственно из самого диалога FineReader OCR.
Указывать текстовые области для распознавания можно вручную или можно запустить распознавание всего растра.
Рис. 9. RasterID. Модуль распознавания текста FineReader 9
Опции FineReader позволяют настроить его под конкретную задачу. Его настройки позволяют указать:
- язык распознаваемого текста — один из сорока вариантов, включая комбинацию «русско-английский»;
- тип печати текста: например, если текст напечатан на пишущей машинке или на матричном принтере, следует выбрать соответствующий вариант;
- предпочтительный вид символов: прописные, строчные буквы или цифры;
- FineReader предоставляет дополнительные возможности по поиску штампа и распознаванию полей. В некоторых случаях это может улучшить качество распознавания;
- возможно использование пользовательских OCR-символов из указанной библиотеки при распознавании текстов.
В большинстве случаев FineReader выполняет распознавание с хорошим качеством без дополнительного обучения (при условии, что параметры заданы верно, например, язык). Но для распознавания текстов, использующих декоративные шрифты или специальные символы, предусмотрена возможность обучения символам (кнопка). Пользовательские символы не заменяют базового набора, который уже содержит FineReader, и используются в качестве дополнения к основной базе символов.
Рис. 10. RasterID. Распознавание с хорошим качеством
Прямая поддержка SD- и HD-сканеров
Реализована прямая поддержка сканеров CONTEX серий HD и SD. Теперь установка всех настроек для этих сканеров и само сканирование может осуществляться из RasterID.
Рис. 11. RasterID. Поддержка сканеров CONTEX серий HD и SD
Системные требования
- Процессор: Intel Pentium 3 600 МГц (или его аналог).
- Оперативная память: 512 Мб или более.
- MS Windows 2000 (SP4) / XP (SP2).
- Не менее 400 Мб дискового пространства.
- Для сканирования непосредственно в программе можно использовать сканер с соответствующим программным обеспечением, поддерживающим интерфейс TWAIN или сканеры компании CONTEX.