авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 | 2 ||

Исследование и разработка моделей и алгоритмов системы информационной поддержки инновационной деятельности наукоемких промышленных предприятий

-- [ Страница 3 ] --

Основой для формирования тезауруса является поисковый образ документа, задание на обработку информации, определяемое оператором. Следовательно, первым шагом становится исследование и анализ задания. На первом этапе заказчик указывает интересующую тему или проблему, возможные ключевые слова и их синонимы. В результате этого получаем поверхностное представление о предметной области. Кроме того, формируется тезаурус КС по методу дедукции, для чего необходимы: массив КС, который задает сам пользователь, обозначенный в алгоритме как MP; массив КС, извлеченный из задания на поиск соответственно MZ.

Для более полного и глубинного представления о предметной области используем существующие рубрикаторы и классификаторы. С целью максимального охвата предметной области необходимо просмотреть все, имеющиеся в наличии. Массив классификаторов и рубрикаторов представляет MR.

На базе полного набора поисковых образов документов (обозначим ) можно создать отраслевые тезаурусы и единый классификатор информационного ресурса. Очевидно, что полный набор сам представляет простейший тезаурус. Однако, используя критерий отбора

, (16)

можем построить отраслевые (специализированные для данной конкретной задачи) тезаурусы. При этом множество всех отраслевых тезаурусов образует полный тезаурус

, (17)

разделы которого, могут быть, иерархически структурированы в соответствии с требованиями ГОСТов по основным рубрикаторам и классификаторам или по внутреннему единому классификатору. Автоматизация процесса построения тезауруса и классификации позволяет максимально облегчить труд оператора работающего с распределенными информационными ресурсами.

  Алгоритм построения-86

Рисунок 3 – Алгоритм построения тезаурусов

Помимо построения тезауруса, на основе поискового образа документа, предложенный подход можно использовать при автоматическом реферировании документа и кластеризации текстов.

Реферирование документов является одной из задач, направленных на обеспечение специалистов-экспертов достоверной информацией, необходимой для принятия решения о ценности, полученных из сети Интернет документов.

В общем случае алгоритм включает следующие основные этапы: 1)Производится выделение предложений из документа, закаченного из сети Интернет и находящегося в хранилище данных, путем выделения знаков препинания и сохраняем его в массиве; 2)Каждое предложение разбивается на слова путем выделения разделителей, и сохраняем их в массив, причем для каждого предложения массив разный; 3)Для каждого предложения, для каждого слова этого предложения считаем количество слов в других предложениях (до и после). Сумма повторов для каждого слова (до и после) и будет весом данного предложения; 4)Заданное число предложений с максимальным весовым коэффициентом и выбираем в реферат в порядке появления в тексте.

Предложенная модель построения тезауруса и тематических каталогов информационной системы представляет собой теоретическую основу для автоматизации семантической обработки информации и позволяет специалисту-эксперту, не только обрабатывать информацию, но и в автоматизированном режиме, реферировать документы, полученных в результате обработки информации в распределенных информационных системах сети Интернет.

При работе с распределенными информационными ресурсами сети Интернет, содержащими большие объемы неструктурированных документов, возникает проблема обработки результатов поисковых запросов, так как при релевантном поиске информации таких документов значительное количество. Важнейшим шагом при поиске информации является построение поискового образа запроса. Рассмотрим два множества: множество документов Д и множество поисковых запросов Q. Будем считать, что они полные и одно множество отображается на другое. Во множестве Q есть подмножество q, которое отвечает тематическому запросу, т.е. некоторому количеству поисковых предписаний по одной (заданной) теме. Этому подмножеству q во множестве Д соответствует подмножество д документов по заданной тематике. Предположим, что эти два множества Д и Q подобны

, (18)

соответственно можно предположить, что количество запросов nq по конкретному поисковому предписанию пропорционально количеству найденных документов nд

, (19)

где – коэффициент подобия.

Таким образом, элементарное событие заключается в определении конкретного поискового предписания и соответствующих, этому предписанию, документов. Случайная же величина определяется как отношение количества запросов к количеству найденных документов за определенный достаточно большой период времени, т.е. коэффициент подобия

(20)

Таким образом, можем определить выборку случайных величин как

(21)

Тогда средняя величина будет определяться как

(22)

где m – количество элементов в выборке.

Дисперсия же определяется как

(23)

Составление частотного словаря (рисунок 4). Для составления поискового образа запроса на обработку необходимо анализировать частоту повторяемости слов входящих в текст документа Д, являющегося по сути шаблоном для обработки информации в РИС сети Интернет.

Алгоритм составление частотного словаря реализуется следующим образом: 1) Анализируем шаблон поиска на выделение слов; 2) Выделяем текущее слово; 3) Слово заменяем на начальную словоформу из словаря словоформ Зализняка, если словоформа в словаре отсутствует, то слово остается неизменным; 4) Добавляем слово в одномерный массив, если в массиве присутствует данное слово, то его встречаемость увеличивается на 1; 5) До тех пор, пока в шаблоне документа не закончатся слова, переходим к п.2 настоящего алгоритма, если набор слов исчерпан, то анализ частоты повторяемости слов входящих в текст документа завершается.

Таким образом, предложенная модель построения поискового образа запроса и обработки информации в распределенных информационных системах сети Интернет может использоваться для предварительной оценки исследуемой предметной области.

Разработанные формальные модели семантического поиска и обработки неструктурированной информации в распределенных информационных ресурсах сети интернет служат теоретической основой для реализации автоматизированной системы семантической обработки информации.

В четвертой главе представлена практическая реализация разработанной системы информационной поддержки инновационной деятельности наукоемкого промышленного предприятия.

Система в свой состав включает три компоненты: управление системой семантической обработки информации, серверная часть системы и база данных.

Управление системой семантической обработки неструктурированной информации в РИС сети интернет осуществляет авторизацию пользователей, обработку списка заданий с их статусами (новое задание, уточнение задания, обновление задания, просмотр результатов обработки) и администрирует работу системы (настройка заданий, управление закачкой, просмотр статистки работы, добавление и удаление пользователей, просмотр заданий пользователя).

  Алгоритм составления-94

Рисунок 4 – Алгоритм составления частотного словаря

Серверная часть системы обеспечивает режим параллельной работы. В системе предусмотрены три параллельных процесса: 1) Процесс получения запроса веб-интерфейса (установка новых настроек, послать реферат, прием нового задания, прием расширенного поискового образа запроса, запуск обновления, управления закачкой, добавление нового пользователя, изменения пользователя, просмотр существующих заданий); 2) Процесс для всех непрокаченных ссылок на ресурсы в сети интернет (закачка информации, вычисление поискового образа документа, ранжирование полученной информации, выявление новых ссылок на ресурсы в сети интернет, реферирование полученной информации); 3) Процесс подсчета трафика, скорости и памяти (позволяет добавлять или удалять потоки, в зависимости от возможностей каналов связи в данный момент времени).

База данных системы. Исходя из разработанных моделей функционирования системы семантической обработки информации, сформирована инфологическая модель базы данных. Основным объектом инфологической модели является сущность «Задание», которое определяет основные характеристики обработки информации. Каждому заданию на семантическую обработку информации в распределенных информационных системах сети интернет соответствует свой набор документов.

Основные выводы и результаты работы

  1. Предложены процедурные модели формирования результатов инновационной деятельности и информационной поддержки управления инновационной деятельности промышленного предприятия, с учетом сопоставления задач информационного обеспечения на стадиях жизненного цикла создания объектов техники, представленных в нотациях IDEF0, IDEF3. Разработана теоретико-множественная модель системы информационной поддержки инновационной деятельности наукоемкого промышленного предприятия, описывающая взаимодействие основных компонент процесса информационной поддержки, через динамически меняющееся пространство состояний (потока поступающих заданий, оборудования и персонала). Описана функция обработки информации, позволяющая моделировать его состояние, как функциональной системы в произвольный момент времени;
  2. Предложены модели и алгоритмы функционального представления процесса обработки информации в сети интернет, описывающие взаимодействие основных компонент процесса информационной поддержки и функций обработки информации;
  3. Предложены модели и алгоритмы семантической обработки неструктурированной информации в распределенных информационных системах сети интернет, с использованием механизма синонимии. Разработана модель семантического поиска и обработки информации в РИС сети интернет, включая модель построения поискового образа документа, алгоритмов построения тезаурусов и реферирования документов, модель построения поискового образа запроса и алгоритма составления частотного словаря;
  4. На основе разработанных моделей реализована система информационной поддержки инновационной деятельности наукоемкого промышленного предприятия, в части семантической обработки неструктурированной информации в РИС сети интернет.
  1. НАУЧНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

Основное содержание диссертационной работы достаточно полно отражено в 1 монографии, 23 работах, из них 2 в зарубежных изданиях, 5 работ из перечня ВАК (общий объем публикаций составляет 16,704 п.л., авторских – 6,543 п.л.):

Монографии (7.68 п.л., из них автора 1,53 п.л.)

  1. Публикации в изданиях, рекомендованных ВАК РФ (2.54 п.л. из них автора 0.96 п.л.)
  2. 1. Трусов В.А., Анцифиров В.Н., Олонцев В.Ф., Анцифирова И.В., Трусов А.В., Формирование нанотехнологического комплекса Пермского края. –Пермь: Пермский ЦНТИ, 2010, -123с. - 7.68 п.л. (из них автора 1.53 п.л.).
  3. Публикации в изданиях, рекомендованных ВАК РФ (2.54 п.л. из них автора 0.96 п.л.)

2. Трусов В.А., Трусов А.В. Информационное обеспечение инновационных процессов в сфере энергосбережения // Научно-практический журнал Информационные ресурсы России №1(119), 2011г. с9-11.. - 0.18 п.л. (из них автора 0.09 п.л.).

3. Трусов В.А., Трусов А.В. Подходы к формированию смыслового поиска информации в распределенных информационных системах сети интернет // Информационные ресурсы России. Научно-практический журнал, №2 (120), - 2011 – С. 20-24. - 0.31 п.л. (из них автора 0.15 п.л.).

4. Трусов В.А. Построение тезаурусов, тематических классификаций и рубрикаторов для поиска информации в распределенных информационных системах // Информационные ресурсы России. Научно-практический журнал, №3 (121), - 2011 – С. 9-13. - 0.31 п.л. (из них автора 0.31 п.л.).

5. Трусов В.А. Модель построения поискового образа запроса в распределенных информационных системах сети интернет// Журнал научно-техническая информация/ Информационные процессы и системы НТИ серия 2, №5, 2011, с.18-22 - 0.32 п.л. (из них автора 0.32 п.л.).

6. Трусов В.А, Трусов А.В. Модель поиска информации в распределенных информационных системах сети Интернет// Журнал научно-техническая информация/ Информационные процессы и системы НТИ серия 2, №8, 2011, с.29-31- 0.18 п.л. (из них автора 0.09 п.л.).

  1. Прочие публикации (5,985 п.л. из них автора 3,651 п.л.)
  2. 7. Трусов В.А., Березовик Ю.Л. Формирование системы подготовки и распространения электронных копий документов // Информация, инновации, инвестиции: Материалы Всероссийской (с международным участием) конференции 24-25 ноября 2004 года, г.Пермь. /Пермский ЦНТИ. –Пермь, – 2004. с.45-47. - 0.18 п.л. (из них автора 0.09 п.л.).
  3. 8. Трусов В.А., Бабарыкин Е.П. Поиск информации в распределенных информационных системах глобальной вычислительной сети (РИС ГВС) // Информация, инновации, инвестиции: Материалы 6-ой Всероссийской (с международным участием) конференции 23-24 ноября 2005 года, г.Пермь. –Т.1/Пермский ЦНТИ. –Пермь, – 2005. с.31-33. - 0.18 п.л. (из них автора 0.09 п.л.).
  4. 9. Трусов В.А., Лучникова Л.В., Трусов А.В. Межрегиональная информационно-аналитическая система мониторинга развития промышленности и энергетики регионов России // Информация, инновации, инвестиции: Материалы 7-ой Всероссийской конференции 29-30 ноября 2006 года, г.Пермь. /Пермский ЦНТИ. –Пермь, –с.124-128. - 0.31 п.л. (из них автора 0.1 п.л.).
  5. 10. Трусов В.А., Трусов А.В. Модель спроса на услуги информационно-аналитического обеспечения процесса коммерциализации результатов научно-технической деятельности // VI Всероссийская школа-семинар молодых ученых «Управление большими системами»: сборник трудов. –Т1. –Ижевск: ООО «Информационно-издательский центр «Бон Анца», 2009. - с.329-336. - 0.25 п.л. (из них автора 0.125 п.л.).
  6. 11. Трусов В.А., Трусов А.В. Коммерциализация результатов инновационной деятельности в рамках регионального инновационно-технологического комплекса // Качество, инновации, издержки – три слагаемых успеха современного бизнеса: Материалы VIII Межрегионального конгресса по управлению качеством, 30 ноября 2009г. //АНО ДО «Консалтинговая фирма «Бизнес-Прогресс». –Пермь, 2009, с.47-65. 1.125 п.л. (из них автора 0.56 п.л.).
  7. 12. Трусов В.А., Трусов А.В. Формирование регионального инновационно-технологического комплекса научно-технического и промышленного развития Пермского края // Вопросы защиты и эффективного управления интеллектуальной собственностью и результатами работ, созданными за счет средств федерального бюджета: Материалы научно-практической конференции 17-18 ноября 2009г., г.Пермь. –Пермь: Пермский ЦНТИ, 2009. с.85-96. - 0.75 п.л. (из них автора 0.375 п.л.).
  8. 13. Трусов В.А., Трусов А.В. Теоретико-множественная модель управления информационной деятельностью субъектов коммерциализации результатов инновационной деятельности // Теоретические и прикладные аспекты информационных технологий: Сб. Т33 науч.тр./ОАО «НИИУМС». –Пермь, 2009. Вып.58. с.27-30. - 0.25 п.л. (из них автора 0.125 п.л.).
  9. 14. Трусов В.А., Трусов А.В. Формирование системы информационно-аналитического обеспечения региональных органов государственной власти в рамках ФЗ «Об энергосбережении и повышении энергетической эффективности и о внесении изменений в отдельные законодательные акты Российской Федерации» //3-я Всероссийская научно-техническая конференция «Инновационная энергетика»/Пермь, 4 декабря 2009 года. с.51-59. - 0.5 п.л. (из них автора 0.25 п.л.).
  10. 15. Трусов В.А., Трусов А.В. Информационно-аналитическое обеспечение региональных органов власти в области повышения энергоэффективности экономики региона // Энергетика. Энергоснабжение. Экология. Информационно-аналитический журнал. Февраль 2010 года., -Ижевск, с.36-41. – 0,375 п.л. (из них автора 0,18 п.л.).
  11. 16. Трусов В.А., Трусов А.В. Организация сбора и анализ информации для эффективной работы по энергосбережению // Ежемесячный деловой журнал/ Коммунальный комплекс России №3 (69), 2010, с.64-70. – 0.44 п.л. (из них автора 0.44 п.л.).
  12. 17. Трусов В.А., Трусов А.В. Концептуальная модель управления процессом коммерциализации результатов инновационной деятельности в рамках регионального инновационно-технологического комплекса // VII Всероссийская школа-конференция «Управление большими системами»: сборник трудов, 27-29 мая 2010 г., -Т1, -Пермь: Издательство Пермского государственного технического университета,2010, с.374-378. - 0.312 п.л. (из них автора 0.156 п.л.).
  13. 18. Трусов В.А. Принцип построения автоматизированной системы управления интеллектуальной собственностью предприятия // VII Всероссийская школа-конференция «Управление большими системами»: сборник трудов, 27-29 мая 2010 г., -Т2, -Пермь: Издательство Пермского государственного технического университета,2010, с.139-145. – 0.44 п.л. (из них автора 0.44 п.л.).
  14. 19. Трусов В.А. Принципиальные программно-технические решения разработки автоматизированной системы управления процессом коммерциализации интеллектуальной собственности предприятия // Информация, инновации, инвестиции: Материалы межрегиональной научно-практической конференции (25-26 ноября 2010 года). –Уфа: ГАУ РНТИК «Баштехинформ», 2010. с.150-155. – 0.31 п.л. (из них автора 0.31 п.л.).
  15. 20. Трусов В.А., Бочкарев С.В. Система информационной поддержки процесса управления коммерциализацией результатов инновационной деятельности промышленных предприятий //, 2011г. с. – 0.31 п.л. (из них автора 0.31 п.л.).

21. Трусов В.А. Обоснование методологической базы разработки автоматизированной системы информационной поддержки процесса // Материалы IV Всероссийской научно-технической интернет-конференции (1-31 октября 2010г.) с.138-149. – 0.69 п.л. (из них автора 0.69 п.л.).

22. Трусов А.В., Бабарыкин Е.П. Оценка границ области тематического информационного запроса в распределенных информационных системах Материалы Всероссийской (с международным участием) конференции «Информация, инновации, инвестиции», 24-25 ноября 2004 года, г.Пермь /Пермский ЦНТИ. –Пермь, 2004, с.76-79. – 0.25 п.л. (из них автора 0.125 п.л.).

Публикации в зарубежных сборниках (0,499 п.л. из них автора 0,402 п.л.)

23. Трусов В.А. A model for Designing Query Images in Distributed

Internet Information Systems // SSN 00051055, Automatic Documentation and Mathematical Linguistics, 2011, Vol. 45, No. 3, pp. 121–126. – 0.312 п.л. (из них автора 0.312 п.л.).

24. Трусов В.А., Трусов А.В. Information Search Models in Distributed Information Systems of the Internet // SSN 0005-1055, Automatic Documentation and Mathematical Linguistics, 2011, Vol. 45, No. 4, pp. 211–212. – 0.187 п.л. (из них автора 0.09 п.л.).

Трусов Владимир Александрович

Печатается в авторской редакции

Подписано в печать 15.02.2012г. Сдано в производство 16.02.2012 г.

Формат 60х84 1/16 .
Уч.-изд.л. 0.875 Тираж 80 экз. Заказ №143/01

Отпечатано в группе оперативной полиграфии Пермского ЦНТИ

614990, г.Пермь, ул. Попова, 9



Pages:     | 1 | 2 ||
 





 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.