авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 |

Исследование и разработка моделей и алгоритмов системы информационной поддержки инновационной деятельности наукоемких промышленных предприятий

-- [ Страница 2 ] --

Полученное функциональное представление способно служить инструментом по организации автоматизированной системы обработки информации в распределенных информационных системах сети интернет, что позволит осуществлять качественную информационную поддержку инновационной деятельности наукоемкого промышленного предприятия.

Математическая постановка задачи нацелена на информационную поддержку инновационной деятельности наукоемкого промышленного предприятия, в рамках жизненного цикла производства. Широкий ассортимент инновационной продукции успешно агрегируется с помощью определяющих факторов, образующих отношения эквивалентности, а значит, классы информационно-инновационных услуг, обеспечивающих удовлетворенность всех участников инновационной деятельности наукоемкого промышленного предприятия.

Пусть множество , где описывает перечень инновационной продукции I, j-го подразделения (цеха, отдела, лаборатории) наукоемкого промышленного предприятия, участника создания и реализации инновационного продукта. Тогда полный ассортимент предприятия определится объединением всех множеств в одно целое.

(2)

Успешность в создание инновационной продукции в полной мере зависти от проведения маркетинговых исследований, патентных и патентно-конъюнктурных исследований, подготовки аналитических отчетов, документации и т.п., что, в конечном счете, и приводит к созданию конкурентоспособной инновационной продукции . Исходя из этого разобьется на классы :

(3)

К классу относятся фиксированный перечень маркетинговых услуг: разработка предложений и рекомендаций по повышению инвестиционной привлекательности предприятия; выявление передовых тенденций в мировом производстве продукции по профилю деятельности предприятия; исследование факторов, определяющих структуру и динамику потребительского спроса на продукцию и конъюнктуры рынка, как регионального, так и национального. Как правило, данный класс работ носит на предприятии плановый характер

К классу следует отнести патентные и патентно-конъюнктурные исследования: анализ и прогнозирование основных конъюнктурно образующих факторов потенциальных рынков сбыта продукции; исследование потребительских свойств, производимой предприятием продукции и сбор информации об удовлетворенности ими покупателей; анализ патентно-лицензионной ситуации в отношении РИД (объекта техники); анализ технического уровня РИД (объекта техники); анализ ведущих в данном виде техники фирм; анализ тенденции развития РИД (объектов техники); анализ РИД (объекта техники) на патентную чистоту; анализ на новизну РИД (патентоспособность); анализ конкурентоспособности результатов инновационной деятельности; анализ торговых потоков объекта исследования; анализ (определение) емкости рынка РИД (объекта техники), которые в полной мере зависят от знаний специалистов-экспертов.

К классу следует отнести: подготовку аналитических отчетов, справок, технической и технологической документации; подготовку лицензионных договоров на передачу технологий; подготовку заявок на регистрацию объектов интеллектуальной собственности, определение конкурентоспособности создаваемых инновационных объектов, оценку эффективности результатов инновационной деятельности и др.

Информационная поддержка, обеспечивающая удовлетворенность всех участников инновационной деятельности, предполагает многие сотни модификаций функций обработки информации.

Анализ информационно - инновационной деятельности наукоемкого промышленного предприятия свидетельствует, что для успешного решения задач инновационной деятельности необходимо комплексно рассмотреть вопросы информационной поддержки субъектов инновационной деятельности наукоемкого промышленного предприятия с использованием систем обработки неструктурированной информации в распределенных информационных системах сети интернет.

Исходя из выше сказанного, математическая постановка задачи информационной поддержки инновационной деятельности включает в свой состав две группы задач.

Первую группу задач 1, отличающуюся наиболее простой процедурой поиска и обработки информации с минимальным вариантом сложности (уровню аналитической нагрузки) П1, совпадает по значению с функцией и имеет вид:

(4)

Вторая группа задач 2 касается тематического поиска и обработки информации с наивысшем вариантом сложности (уровнем аналитической нагрузки) П2 и отличается от первой группы 1 формой признаков информационного объекта g' способного привлечь несколько информационных ресурсов в при достаточно нечетком описании. Соответствующую функцию можно построить на базе предыдущей, введя новую элементарную функцию: 6(,) - разработка тематического запроса на аналитическую обработку информации .

Тогда искомую функцию можно представить следующим образом:

(5)

Во второй главе проведено исследование функционирования РИС сети интернет и осуществлена разработка моделей и алгоритмов обработки информации в распределенных информационных системах сети интернет.

Для правильной организации работы по поиску и обработке информации в распределенных информационных системах сети интернет значительную (основную) роль играют мета тэги (специальные тэги) введенные производителями браузеров. Одним из основных тэгов, с помощью которого реализуется релевантный способ поиска информации, является тэг указания набора ключевых слов (КС), по которым будет искать поисковый робот на предполагаемых www серверах. Тэг имеет вид:

META NAME := "Keywords" CONTENT= "КС КС КС"

Исходя из того, что тэг представляет собой совокупность ключевых слов произвольной записи Z информационного ресурса в распределенных информационных системах сети интернет Пz, где ZНПZ, то запись можно описать, как:

. (6)

где Пz – полный набор всех возможных записей информационного ресурса сети интернет характеризующего результат инновационной деятельности.

- алфавит (русский, латинский, …); Rz- разделительные знаки (« » – пробел, :, -, …); - словарь, являющийся языком в алфавите А; ; -язык информационного объекта, .

Распределенные информационные системы сети интернет технически представляют собой совокупность серверов, на которых и находятся искомые записи, характеризующие результаты инновационной деятельности. Функция сети интернет для j-ого сервера есть алгоритм реализации семейства :

(7)

преобразования на множестве состояний

где Топ – тезаурус ключевых слов, находящегося в распоряжение оператора (специалиста в области коммерциализации РИД); - предметный словарь, находящийся в распоряжение оператора; - семейство преобразований, определенных некоторым словарем; - полный набор записей информационного ресурса на j сервере.

Аналитическая составляющая представляет собой формирование тезаурусов предметной области необходимых для составления поисковых предписаний (ПП) на поиск и обработку информации с использованием механизмов синонимии, дедукции и индукции. Синонимия используется для расширения информационного ресурса (ИР) предметной области, дедукция для формирования тезаурусов с использованием подхода от общего к частному, а индукция для формирования тезаурусов с использованием подхода от частного к общему. Аналитическая составляющая базируется на использование известных рубрикаторов и классификаторов (УДК, ГРНТИ, МПК и других). Тезаурусы формируются как тезаурусы ключевых слов и дескрипторов. Сформированные тезаурусы лежат в основе составления оптимальных поисковых предписаний, отражающих в своей сути искомый поисковый образ документа в распределенных информационных системах сети Интернет.

Тезаурус предметной области представляет собой систематизированный набор данных описывающий знания в искомой области:

, (8)

где - словарь некоторой предметной области состоящих из записей Z1, и множество дескрипторов , т.е. наиболее существенных понятий в виде устойчивых словосочетаний (включающих в себя записи Z1), обладающих семантической устойчивостью и контрастностью

. (9)

В третьей главе построены формальные модели и алгоритмы системы семантической обработки неструктурированной информации в распределенных информационных системах сети интернет.

К поисковой системе сети интернет предоставляются три основных требования: контроль полноты охвата ресурсов; контроль достоверности информации, полученной из сети; высокая скорость проведения поиска. На основе обобщенной модели поиска информации в РИС сети Интернет предлагается следующий алгоритм решения задачи информационной поддержки инновационной деятельности: 1) Поиск и обработку информации в РИС сети интернет необходимо производить с использованием механизма синонимии, который включает: анализ задания на поиск информации, заданной предметной области (ПО), выявление ключевых слов (КС) и дескрипторов (ДС); поиск информации с использованием механизма синонимии; расширение предметной области за счет синонимии; формирование тезауруса синонимии. 2) Путем поисковых процедур составленных из известных оператору ключевых слов тезауруса предметной области при решение поставленной задачи осуществляется максимальное покрытие предметной области,

; (10)

3) Производится исследование полученных в результате поиска и обработки записей с целью выявления синонимии nc и дескрипторов dд; 4) Выявленная синонимия nс используется для расширения тезауруса предметной области решения задачи при

. (11)

На основе предложенного алгоритма разработана модель, дающая возможность перейти к автоматизированной семантической обработке неструктурированной информации в распределенных информационных системах сети Интернет.

Модель (рисунок 2) включает: 1) Выявление информационной потребности - образец документа, представляющий собой шаблон обработки, вводится экспертом вручную; 2) Выделение из документа темы запроса - поискового образа документа(ПОД), и определение поисковых предписаний; 3) Расширение темы запроса, за счет синонимии и ассоциативных запросов; 4) Формирование поискового образа запроса (ПОЗ) на основе частотного словаря, с разбивкой его на отдельные поисковые предписания; 5) Получение ссылок на релевантные документы, в существующих поисковых Интернет-машинах и помещение ссылок в хранилище данных; 6) Осуществление закачки найденных документов в хранилище данных; 7) Формирование ПОД, для каждого найденного документа, в хранилище данных; 8) Проведение ранжирования документов в соответствии с заданной темой (п.2); 9) Проведение реферирования найденных документов и передача рефератов для ознакомления и анализа эксперту.

Предложенный подход к организации семантической обработки неструктурированной информации в распределенных информационных системах сети Интернет позволяет качественно улучшить формирование поисковых запросов к поисковым машинам сети Интернет, позволяет автоматизировать процесс обработки релевантной информации, с ранжированием информации в соответствии с заданной темой, что дает возможность экспертам уйти от ручного последовательного просмотра найденных ресурсов.

Для правильной классификации и индексирования для каждого документа необходимо иметь поисковый образ документа. Процесс автоматизации построения ПОД можно разбить на несколько стадий: 1) Выделение словника документа или перечня слов и устойчивых словосочетаний, используемых в документе; 2) Замена словоформ и синонимов на дескрипторы; 3) Фильтрация специфической терминологии от общей лексики. Первые две стадии банальны и не вызывают сложностей с реализацией. Для реализации третьей стации необходимо получить критерий оценки специфичности того или иного термина, для этого используем вероятностную математическую модель.

Рассмотрим полное множество , элементами которого являются слова (язык значения не имеет). Тогда документом или текстом Д назовем такое множество, которое является подмножеством :

(12)

где – элемент множества Д, суть слово. А информационным ресурсом B назовем такое множество, которое является подмножеством или совпадает с ним и является объединением множеств Д:

. (13)

Введем следующие обозначения: – количество повторений слова в документе ; – количество повторений слова в информационном ресурсе B; – количество слов в информационном ресурсе B; – количество слов в документе Д.

 Модель семантической-55

Рисунок 2 –Модель семантической обработки информации в РИС сети Интернет

Информационный ресурс B содержит слов. Из всего множества слов информационного ресурса B выберем одно эталонное, которое обозначим как , тогда – количество повторений слова в документе , а – количество повторений слова в информационном ресурсе B. Частотой повторения слова в информационном ресурсе B назовем величину

, (14)

а частотой повторения слова в документе Д назовем величину

. (15)

Последовательно, перебирая все элементы множества Д, мы сравниваем текущее слово с эталонным словом. Таким образом, на всем множестве B имеет место сравнений. Пусть событие заключается в том, что из всех сравнений на всем возможном множестве B в случаях слова и – совпадают.

В процессе инновационной деятельности наукоемкой промышленного предприятия большое значение имеет выбор информационного ресурса В. Так как документальной основой, достоверно подтверждающей смысл результата инновационной деятельности является патент на изобретение (или заявка на патент на изобретение), то имеет смысл в качестве такого информационного ресурса принять национальные и международные патентные ресурсу, где в качестве документа определен патент на изобретение. Так как , то в качестве элементов патента на изобретения будут: - технический результат изобретения; - техническая задача, решаемая изобретением; - сущность разработанного технического решения; - основное отличие разработанного решения от аналогов; - пример реализации технического результата; - аналоги и прототипы предлагаемого технического решения; - формула изобретения.

В зависимости от поставленной задачи на обработку информации в распределенных информационных системах сети интернет, в качестве информационного ресурса для формирования поискового образа документа можно использовать как весь информационный ресурс B в целом, так и отдельные элементы, что является целесообразным для решения отдельных задач инновационной деятельности. Выделение элементов информационного ресурса является целесообразным для определения специальной лексики обработки информации, которая делает поисковый образ документа уникальным, не имеющим аналогов. Это в конечном итоге приведет к точности семантической обработки информации.

Алгоритм вычисления поискового образа документа. В вычислении ПОД можно выделить два этапа: подготовительный и основной. Подготовительный этап включает в себя подсчет средних частот употребления слов. Очевидно, что информационный ресурс, на которой производиться подсчет, должна быть достаточно полной, т.е. покрывать множество . Чем больше информационный ресурс, тем точнее будет средняя частота и тем ближе она будет приближаться к реальной частоте. Суть заключается в том, что на полном множестве происходит подсчет всех слов и количество повторений этих слов. Затем вычисляется частота использования слов и заносится в базу. Основной этап включает в себя подсчет повторений слов в конкретном документе и выборки ключевых фраз удовлетворяющих критерию. На данном множестве (с учетом отобранных словосочетаний) можно построить алфавитный, предметный указатели и поисковый образ документа. После создания поисковый образ документа заносится в базу.

Алгоритм построения тезаурусов (рисунок 3), тематических классификаторов и рубрикаторов обработки информации в распределенных информационных системах. Структура и принципы организации классификаторов и рубрикаторов делают возможным автоматизировать процесс построения тезаурусов T предметной области, используя метод дедукции.



Pages:     | 1 || 3 |
 





 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.