авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:   || 2 |

Разработка автоматизированной технологии предварительной обработки бланковой информации

-- [ Страница 1 ] --

На правах рукописи

Густинович Александр Владимирович

Разработка автоматизированной технологии предварительной обработки бланковой информации

специальность 25.00.35 Геоинформатика

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Москва 2006

Работа выполнена в Московском Государственном Университете Геодезии и Картографии (МИИГАиК) на кафедре прикладной экологии

Научный руководитель доктор технических наук, профессор Малинников Василий Александрович

Официальные оппоненты доктор технических наук, профессор

Троицкий Владимир Иванович

кандидат технических наук

Бровко Елена Алексеевна

Ведущая организация ФГУП «Государственный научно-внедренческий центр геоинформационных систем и технологий» (ФГУП «ГОСГИСЦЕНТР»)

Защита состоится ____________________________________ на заседании диссертационного совета Д212.143.03 при Московском Государственном Университете Геодезии и Картографии по адресу: 105064, Москва, К-64, Гороховский пер., д.4,

С диссертацией можно ознакомиться в библиотеке Московского Государственного Университета геодезии и Картографии (МИИГАиК)

Автореферат разослан «___» __________________ 2006г

ученый секретарь

диссертационного совета Климков Юрий Михайлович

Общая характеристика работы

Актуальность проблемы

Для любой организации, научной, производственной, общественной получение информации является ключевым аспектом их эффективного функционирования. Одним из способов получения информации является проведение тестирований. Они используются во многих сферах человеческой деятельности: науке, образовании, профессиональной деятельности, средствах массовой информации (СМИ), государственном управлении и др.

Тестирования уже давно активно используются в России и за рубежом. Проводятся они в большинстве своём с использованием бланков. Так как современный уровень развития вычислительных средств позволяет хранить и обрабатывать информацию с помощью компьютерных технологий, появилась возможность проводить «компьютерные» тестирования. Но этот уровень развития недостаточен для того, чтобы полностью вытеснить бланковое тестирование, оно остаётся всё ещё более дешёвым и простым средством сбора информации.

Но мало просто собрать информацию, её необходимо ещё и обработать. Компьютерные тестирования позволяют «напрямую» вводить информацию в персональный компьютер (ПК). В случае бланкового тестирования информацию с бланка необходимо некоторым образом «передать» в ПК (предварительная обработка бланковой информации), после чего её обрабатывают.

Существует много методов перевода информации с бланка в ПК, с их помощью пользователи могут получить цифровые копии изображений бланков. С развитием программных средств, в частности, программ оптического распознавания текста, появилась возможность переводить цифровую информацию в оцифрованную (т.е. «трансформировать» единый рисунок изображения бланка в сегменты текста, рисунков, таблиц и т.п., сохраняя их положение на листе и позволяя их редактировать, соответственно, как текст, рисунок или таблицу в соответствующих редакторах).

Но всё же работа по предварительной обработке бланковой информации остаётся трудоёмкой и временизатратной, особенно при большом количестве обрабатываемых бланков. Если проводить эту работу вручную теми средствами, что предоставляет нам «свободный рынок», то мы придём к выводу, что она – комплекс монотонно повторяющихся одинаковых последовательностей операций. И, несмотря на то, что использование современного уровня технологии уменьшает количество ошибок и неточностей в обработке по сравнению с тем временем, когда не было ПК, сканеров и др. аппаратных и программных средств, их количество оставляет желать лучшего.

Всё вышесказанное подтверждает актуальность разработки технологии автоматизированной предварительной обработки бланковой информации, которая бы позволила упростить и ускорить процесс перевода информации с бланка в ПК без потери качества обработки путём автоматизации основных этапов предварительной обработки бланковой информации.

Целью диссертационной работы

является разработка автоматизированной технологии предварительной обработки бланковой информации.

Для достижения поставленной цели были решены следующие

Задачи исследования:

- рассмотрение и аналитический обзор современных средств, методов и технологий для предварительной обработки бланковой информации;

- научное обоснование содержания основных этапов предварительной обработки бланковой информации;

- выбор оптимальных технологических средств и стандартных программных продуктов для автоматизации работы на каждом промежуточном этапе предварительной обработки бланковой информации;

- разработка автоматизированной технологии процесса предва-рительной обработки бланковой информации, алгоритмов и реализующего их программного обеспечения (ПО);

- проведение экспериментальных исследований по проверке работоспособности предложенных алгоритмов и технологии автоматизированной предварительной обработки бланковой информации.

Научная новизна работы:

- впервые определены и обоснованы содержания основных этапов предварительной обработки бланковой информации;

- впервые разработаны алгоритмы, обеспечивающие автоматизацию процесса предварительной обработки бланковой информации;

- впервые создана единая технология предварительной обработки бланковой информации и проведена её автоматизация путём написания соответствующего программного обеспечения.

Практическая значимость:

создан программно-аппаратный комплекс для эффективной предварительной обработки бланковой информации, который:

- позволяет оперативно и качественно обрабатывать бланковую информацию любого вида для любых целей с той же скоростью и качеством, что и технологии, ориентированные на конкретный вид бланков;

- позволяет проводить все этапы предварительной обработки;

- способен обработать большое количество информации в короткие сроки;

- отличается простотой в использовании;

- не требует большого вложения денежных средств в аппаратно-программную базу;

- позволяет автоматически выполнять большую часть однотипных действий оператора.

Апробация работы

Основные положения диссертационной работы докладывались и обсуждались: на IX международной научно-практической конференции «Методы дистанционного зондирования и ГИС-технологии для оценки состояния окружающей среды, инвентаризации земель и объектов недвижимости» (Италия, май, 2005), на 59-ой (апрель, 2004) и 60-ой (апрель, 2005) научно-технических конференциях студентов, аспирантов и молодых учёных, проводившихся в Московском Государственном Университете Геодезии и Картографии (МИИГАиК).

Результаты, выносимые на защиту:

1. Автоматизированная технология предварительной обработки бланковой информации, которая состоит из следующих этапов: Регистрация, Сканирование (и Распознавание), Верификация.

2. Комплекс алгоритмов и программ для предварительной обработки бланковой информации, реализующий предложенную технологию, который позволяет проводить обработку в целом или по отдельным этапам, обладает системой защиты доступа, гибкой системой настроек, возможностью мониторинга процесса предварительной обработки.

3. Экспериментальные исследования эффективности разработанной технологии и ПО, позволяющие рекомендовать разработанную технологию для предварительной обработки результатов массового тестирования.

Публикации:

по теме диссертации опубликованы 4 печатные работы.

Структура и объём работы

Диссертация состоит из введения, трёх глав, заключения и списка литературы. Её объём составляет 147 страниц текста, включая 128 рисунков. Список литературы содержит 98 наименований.

Содержание работы

Во введении обосновывается необходимость создания автоматизированной технологии предварительной обработки бланковой информации для обеспечения государства, организаций и частных лиц профессиональным, эффективным и доступным средством предварительной обработки бланковой информации. Определяются цели и задачи диссертационной работы, раскрывается научная новизна и её практическая значимость.

Глава 1. Аналитический обзор состояния проблемы.

В первой главе описан процесс тестирования, рассмотрены основные проблемы тестирования, показано широкое применение тестирований в различных областях человеческой деятельности. Дано понятие бланка, рассмотрены его элементы и общие для всех бланков свойства, разновидности бланков и требования, предъявляемые к бланкам. Описаны основные средства, методы и технологии предварительной обработки бланковой информации. Описаны методики предварительной обработки бланковой информации и технология автоматизированной предварительной обработки бланковой информации. Описаны наиболее известные OCR-системы (программное обеспечение для оптического распознавания текста) и реализованные проекты, проводящие предварительную обработку бланковой информации определённого вида.

На основе анализа основных этапов предварительной подготовки и обработки бланковой информации (БИ) предлагается структура проведения тестирования, включающая в себя следующие этапы:

1) цель и требования тестирования;

2) создание оригинала бланка и требований по работе с ним;

3) создание необходимого количества бланков;

4) методика предварительной обработки бланковой информации для данного тестирования;

5) заполнение бланков;

6) обработка заполненных бланков и выдача результатов.

Рассмотрены две основных методики предварительной обработки бланковой информации:

- ручная;

- автоматизированная.

Подробно раскрыта сущность автоматизированной обработки бланковой информации, включающей в себя следующие этапы (Рис.1.):

- регистрацию;

- сканирование и распознавание;

- верификацию;

 Схема автоматизированной обработки бланковой информации Проведён обзор-0

Рис.1. Схема автоматизированной обработки бланковой информации

Проведён обзор существующих систем оптического распознавания текста и рассмотрены реализованные проекты систем автоматизированной предварительной обработки БИ, позволяющие проводить автоматизи-рованную предварительную обработку бланков конкретного вида.

Недостатки подобных систем обработки (такие, как ориентированность на конкретный вид бланка и неспособность обрабатывать бланки произвольного вида, секретность, закрытость и защищённость, не позволяющие использовать их в свободном доступе), указывают на то, что необходима свободная автоматизированная технология предварительной обработки бланковой информации.

В результате проделанной работы обоснована необходимость совершенствовать технологию автоматизированной предварительной обработки бланковой информации и создать программное обеспечение, способное обработать бланки произвольного вида без потери скорости и качества обработки.

Глава2. Разработка алгоритмов для построения технологии предварительной обработки бланковой информации.

Во второй главе разработаны требования к базовой технологии автоматизированной предварительной обработки бланковой информации и представлена оптимальная базовая технология автоматизированной предварительной обработки бланковой информации. Проведены количественные и качественные улучшения разработанной технологии. С точки зрения качественных улучшений предложены аппаратные и программные улучшения разработанной оптимальной базовой автоматизированной технологии предварительной обработки информации.

Определены требования, предъявляемые к разрабатываемой технологии:

1) эффективность - способность обрабатывать достаточно большие объёмы бланковой информации в короткие сроки;

2) универсальность - способность обрабатывать различные типы бланков с различным составом и конфигурацией полей;

3) простота - чтобы с ним могли работать неподготовленные в специальном отношении люди;

4) неприхотливость - не требовать больших аппаратных ресурсов ПК;

5) дешевизна - не требовать закупки большого количества дополнительной вычислительной, оргтехники и ПО;

6) удобство - иметь дружественный интерфейс и, по возможности, дополнительные опции настройки и управления для удобства пользователя;

7) глобальность - покрывать всю технологию предварительной обработки бланковой информации;

Показано, что эффективно работающая технология автоматизи-рованной предварительной обработки бланковой информации должна включать в себя следующие этапы:

1) регистрация с использованием файловой системы хранения информации;

2) сканирование с использованием технологии пакетного сканирования;

3) распознавание с использованием ABBYY FormReader v6.0;

4) редактирование с использованием ABBYY FormReader v6.0.

Сформулированы рекомендации по используемой аппаратно-программной базе для этой технологии:

Среднестатистический ПК (Процессор: 1 ГГц, ОЗУ: 512 Мб, Видеокарта: 16 Мб) с установленной операционной системой (ОС) Windows, сканер с автоподачей и OCR-система ABBYY FormReader v6.0.

Предложены различные количественные и качественные улучшения разработанной технологии.

Количественно улучшить технологию можно увеличением числа рабочих мест, количества сотрудников и распределением работников по этапам обработки. Если рассмотреть процесс обработки поэтапно, –

- регистрация: подпись реального пакета и запись цифрового пакета в компьютер;

- сканирование: процесс сканирования пакета;

- распознавание: ожидание окончания процесса распознавания;

- верификация: сам процесс редактирования оцифрованных бланков –

то станет очевидно, что первые два этапа требуют гораздо меньше времени на свою часть обработки пакета, чем четвёртый, а третий предположительно находится между ними. Поэтому чтобы процесс обработки проходил примерно с равной скоростью для каждого этапа, неплохо бы выделить на верификацию дополнительную рабочую силу и снабдить её всем необходимым, а для распознавания выделить дополнительные ПК.

Что касается качественных улучшений, то они делятся на аппаратные и программные улучшения.

Если нет материальных трудностей, то качественное улучшение аппаратной базы состоит в постоянном обновлении оборудования. В противном случае можно исходить из того, что для разных этапов обработки требования по аппаратной базе различны:

для регистрации не нужен сверх-компьютер в виду простоты операции: ввод имени пакета (достаточно: Процессор: 500 МГц, ОЗУ: 128 Мб, Видеокарта: 8 Мб);

для сканирования же достаточно просто хорошего среднестатистического ПК (Процессор: 1 ГГц, ОЗУ: 512 Мб, Видеокарта: 16 Мб), но необходим очень хороший сканер;

при распознавании идёт большая нагрузка на ПК, поэтому необходим более производительный компьютер (Процессор: 2-3 ГГц, ОЗУ: 512-1024 Мб, Видеокарта: 16-64 Мб);

для верификации также нужен просто хороший компьютер, но производительности, достаточной для возможных операций с изображениями бланков (Процессор: 1-2 ГГц, ОЗУ: 512-1024 Мб, Видеокарта: 16-32 Мб).

Что касается программных средств, то целью исследований не являлись усовершенствования «ядра» распознавания OCR-систем или написание более подходящей для тестирования ОС. Это вопрос эволюции программных средств. В данной главе детально описан процесс поэтапного усовершенствования разработанной технологии предварительной обработки бланковой информации. Что здесь подразумевается под усовершенствованием? Автоматизация некоторых повторяющихся манипуляций оператора, удобство ввода информации, удобство визуализации некоторых контролирующих операций, в общем, всё, что сможет помочь автоматизировать, ускорить, упростить, сделать более удобным процесс обработки на любом из этапов.

Были детально рассмотрены действия, выполняемые оператором на каждом из этапов, и возможности выполнить или упростить выполнение каждого действия программно. Причем эти действия рассмотрены для последовательной обработки (когда все этапы предварительной обработки выполняются на одном ПК – Рис.2.) и распределённой обработки (когда каждый из этапов выполняется на отдельном ПК – Рис.3.).

 Последовательная обработка Распределённая обработка В итоге-1

Рис.2. Последовательная обработка Рис.3. Распределённая обработка

В итоге сформировался окончательный вариант автоматизированной технологии предварительной обработки бланковой информации и определены её наиболее критичные этапы, которые нужно улучшить, автоматизировать.

Глава 3. Решение поставленной задачи и экспериментальное исследование.

В третьей главе подробно описан процесс создания программного обеспечения для поддержки разработанной автоматизированной технологии предварительной обработки бланковой информации. Так же описано и само созданное программное обеспечение. Проведены экспериментальные исследования, показывающие, что разработанное программное обеспечение и технология автоматизированной предварительной обработки бланковой информации с одной стороны, не уступает в качестве выходных данных ни одной из существующих технологий предварительной обработки бланковой информации, превосходя их по скорости, и при этом обеспечивая удобство контроля процесса обработки, управления и просто использования программного обеспечения. С другой стороны, позволяет обрабатывать бланки произвольного вида.

Подробно описан процесс создания ПО, реализующего разработанную технологию автоматизированной предварительной обработки бланковой информации:

1) создана база для поддержки всех этапов обработки;

2) к ней добавлены элементы простейшей безопасности и возможность выбора этапа работы;

3) добавлены элементы настроек;

4) реализован этап регистрации;

5) реализован этап сканирования;

6) реализован этап верификации, проверки и экспорта;

7) обеспечен переход от одного этапа к другому для корректной работы при выборе полной станции обработки;

8) добавлена возможность просмотра прогресса работы;

9) другие качественные улучшения.

По ходу реализации каждого этапа было описано ПО, относящееся к этому этапу. В результате произведённых действий функциональная схема работы программного обеспечения выглядит, как показано на Рис.4. Пример интерфейса ПО приведён на Рис.5.

 Функциональная схема работы ПО, реализующего разработанную автоматизированную-2

Рис.4. Функциональная схема работы ПО, реализующего разработанную автоматизированную технологию предварительной обработки бланковой информации



Pages:   || 2 |
 





 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.