авторефераты диссертаций БЕСПЛАТНАЯ РОССИЙСКАЯ БИБЛИОТЕКА - WWW.DISLIB.RU

АВТОРЕФЕРАТЫ, ДИССЕРТАЦИИ, МОНОГРАФИИ, НАУЧНЫЕ СТАТЬИ, КНИГИ

 
<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 |

Разработка и использование технологии локально-адаптивной классификации данных спутниковых наблюдений для распознавания типов земного покрова

-- [ Страница 2 ] --

Необходимость учета пространственной изменчивости спектральных характеристик классов подтверждается и результатами классификации данных MODIS с использованием региональных и глобальных спектральных сигнатур. Для оценки точности классификации определялась доля верно распознанных эталонов. Использование региональных сигнатур обеспечило более точную классификацию, чем использование глобальных сигнатур, полученных по эталонам для всей территории России. Доля верно распознанных эталонов при использовании региональных сигнатур в среднем выше на 20%. В некоторых случаях данный показатель отличается в несколько раз (хвойный листопадный лес – 73% и 9%, болота – 72% и 26%).

Рис. 1. Сигнатуры типов земного покрова в пространстве яркостей красного (К) и ближнего ИК (БИК) диапазонов для тестовых участков в Ханты-Мансийском АО (слева) и Республике Якутия (справа)

Глава 3. Метод локально-адаптивной обучаемой классификации и его использование для картографирования растительности России

В основу разработанного алгоритма классификации (рис. 2) положено формирование для заданной территории пространственно распределенного набора спектральных сигнатур на основе совокупности эталонных объектов опорной выборки с известной принадлежностью к одному из классов некоторого множества. Алгоритм классификации исходит из предположения нормального распределения признаков распознавания, получаемые оценки параметров которого формируют сигнатуры классов. Сигнатура каждого k-го класса включает в себя параметры вектора средних значений и ковариационной матрицы признаков. В качестве источников данных для формирования обучающей выборки часто выступают существующие карты, данные наземных обследований или результаты экспертной интерпретации спутниковых изображений. Пространственное распределение локализованных сигнатур описывается заданием их значений в узлах регулярной прямоугольной сети с шагом d, где p и q – порядковые номера узлов по осям x и y соответственно (рис. 3). Обучение классификатора направлено на оценку в узлах параметров сигнатур и для каждого k-го класса.

Первоначально для каждого узла на основе расположенных в границах ближайшей клетки эталонных пикселов вычисляются следующие величины:

– сумма значений i-го признака k-го класса;

– сумма произведений значений i-го и j-го признаков k-го класса;

– количество эталонных пикселов k-го класса.

Указанные величины используются для оценки элементов ковариационной матрицы на основе следующего выражения:

(1)

Оценка элементов ковариационной матрицы и средних значений признаков на основе и позволяет получить параметры сигнатур и .

Как видно из рисунка 3, исходная обучающая выборка имеет пространственно неравномерное распределение. При этом в случае отсутствия эталонных пикселов k-го класса в окрестности узла вычисление параметров и оказывается невозможным. Кроме того, при малых значениях возрастает влияние случайных ошибок в обучающей выборке. Для учета этого фактора метод предусматривает задание порога репрезентативности , характеризующего минимально допустимое количество эталонных пикселов для оценки локальных сигнатур классов. Это приводит к появлению узлов, не обеспеченных значениями параметров сигнатур некоторых классов и, как следствие, к необходимости проведения второго этапа обучения локально-адаптивного классификатора.

Рис. 2. Блок-схема алгоритма локально-адаптивной классификации

Рис.3. Локализация сигнатур классов

На втором этапе для каждого не преодолевшего порог репрезентативности () узла проводится обработка данных соседних клеток. Количество используемых соседних клеток зависит от величины , числа эталонных пикселов в клетке и соседних клетках . Кроме того, предусмотрено задание параметров и , ограничивающих снизу и сверху число используемых соседних клеток. Число используемых соседних клеток итеративно увеличивается, начиная с до величины, соответствующей достижению порога репрезентативности . Если порог не был преодолен при достижении числа ближайших клеток значения , то сигнатура узла для класса k считается несуществующей.

Расширение анализируемой для оценки параметров локальной сигнатуры класса окрестности осуществляется дискретно путем последовательного включения соседних клеток, находящихся на одинаковом удалении от узла , и обобщения полученных на первом этапе обучения величин , и . При этом новые характеристики узла , и вычисляются как суммы соответствующих величин, полученных для соседних узлов на первом этапе обучения.

По результатам второго этапа обучения, для класса k в узлах, для которых справедливо выражение , определяются с использованием выражения аналогичного (1) параметры сигнатур и для последующей обучаемой классификации.

В рамках локально-адаптивной классификации могут быть использованы различные решающие правила классификации, такие как методы максимального правдоподобия, минимального расстояния или параллелепипеда. К настоящему времени в составе разработанного программного комплекса реализован алгоритм классификации на основе метода максимального правдоподобия. В соответствии с решающим правилом максимума правдоподобия, пиксел относится к множеству пикселов класса l, если для всех k=1, 2…m выполняется условие:

, (2)

где , – априорные вероятности классов l и k; , – плотности вероятности отнесения пиксела к множеству пикселов класса l и множеству пикселов класса k.

В свою очередь, плотность вероятности определяется по формуле:

(3)

где – вектор признаков пиксела ; – число признаков.

При классификации используются параметры и локализованных сигнатур, вычисленных на втором этапе обучения. Для классификации пиксела используются сигнатуры ближайшего узла , порядковые номера которого в строках и столбцах регулярной сетки с шагом d определяются по формулам и .

Наряду с сигнатурами, характеризующими локализованные значения признаков классов, при классификации используются априорные вероятности, полученные на основе данных об ареалах распространения типов земного покрова в пределах рассматриваемой территории. В решающем правиле (2) априорная вероятность класса задается для каждого класса и каждого пиксела территории. Априорные вероятности могут быть получены в результате обобщения обучающей выборки таким образом, что в окрестности эталонных пикселов классов их значения максимальны и снижаются по эмпирически подобранным правилам по мере удаления.

Использование существующих тематических карт для формирования обучающей выборки, как правило, требует дополнительного анализа. Это обусловлено, в частности, наличием ошибок классификации, изменениями земного покрова, различиями пространственного разрешения существующих карт и используемых спутниковых данных.

Для получения точной обучающей выборки оправданно применение итерационного подхода, включающего классификацию, экспертный контроль результатов и внесение исправлений в обучающую выборку для последующей итерации. Исправление обучающей выборки на основе экспертных знания является неотъемлемой частью процесса разработки продукта, однако целесообразно также применение автоматизированных средств фильтрации. В качестве одного из инструментов такого рода был разработан алгоритм гистограммной фильтрации, который может быть применен на начальном этапе подготовки опорной выборки.

Разработанная технология локально-адаптивной классификации была использована для создания карты растительности России TerraNorte RLC. Для классификации использованы композитные изображения MODIS с пространственным разрешением 250 м. Источником для формирования опорных данных на начальном этапе послужила карта наземных экосистем Северной Евразии GLC2000.

Легенда созданной карты включает 22 класса земного покрова, образующих группы лесов, тундры, кустарниковых и травяных типов растительного покрова. Классы не покрытых растительностью площадей включают водную поверхность, урбанизированные территории и некоторые другие классы.

Сравнение полученных на основе TerraNorte RLC и данных Росстата значений площади лесов в субъектах РФ позволило получить величину коэффициента детерминации R2=0,99 (рис. 4.а). Общая оценка площади лесов по данным TerraNorte RLC составляет 746 млн. га, что на 4% отличается от оценки Росстата 2003 года (776 млн. га). При этом установлено, что наибольшая часть площади лесов РФ приходится на субъекты, в которых относительная величина ошибки минимальна (рис. 4.б). Так, 674 млн. га (87% общей площади) расположены в 57 субъектах РФ, относительная ошибка в которых не превышает 15%.

 а) площади лесов в субъектах РФ по данным Росстата (РС) и TerraNorte RLC; б)-66

Рис. 4. а) площади лесов в субъектах РФ по данным Росстата (РС) и TerraNorte RLC;
б) распределение площади лесов в Субъектах РФ (высота столбцов) и количества субъектов РФ (числа на графике) по относительной величине ошибки

Для оценки пространственной детальности карты использован метод на основе оптимума Парето. В качестве эталонных данных высокого пространственного разрешения были использованы результаты классификации изображений Landsat-ETM+ для тестовых участков. Для корректного сопоставления легенды эталонных данных и карты TerraNorte RLC были упрощены до дихотомического вида («лес» и «не лес»). Для каждого из тестовых участков определены границы Парето, описывающие серию идеальных для данного участка продуктов с пространственным разрешением 250 м. Дополнительно, аналогичное исследование было проведено для пространственного разрешения равного 1 км. Кроме того, величины ошибок первого и второго рода были вычислены для карты TerraNorte RLC и GLC2000.

Анализ полученных данных подтвердил гипотезу о том, что величины ошибок первого и второго рода, вычисленные для реально существующих карт выше, чем у идеальных (смоделированных) продуктов такого же пространственного разрешения, что видно на графике (рис. 5) по взаимному расположению точек и линий. Одновременно с этим, удалось установить, что точность карты TerraNorte RLC выше, чем у идеальных продуктов с разрешением 1 км, несмотря на то, что для создания опорной выборки использована карта данного разрешения.

Рис. 5. Оптимумы Парето для тестовых участков: республика Коми (слева),
республика Карелия (справа)

Глава 4. Программный комплекс обработки спутниковых данных и информационная система представления результатов мониторинга земного покрова

Отсутствие программного обеспечения, позволяющего выполнять распознавать типы земного покрова методом локально-адаптивной обучаемой классификации, потребовало разработки специализированного программного комплекса. Комплекс состоит из модулей, выполняющих необходимые для реализации метода процедуры, в том числе: вычисление локализованных сигнатур, локально-адаптивная классификация, выявление участков изменений обучающих данных, гистограммная фильтрация, моделирование спектральных смесей, а также вспомогательные модули (слияние результатов работы нескольких компьютеров; визуализация локализованных сигнатур и пр.)

Модули предназначены для запуска в режиме командной строки под управлением ОС Linux. Такое устройство программного комплекса упрощает указание необходимых параметров работы, а также автоматизированный запуск модулей. Уникальность структуры данных локализованных сигнатур, большой объем обрабатываемых изображений и требование высокой производительности обработки обусловили необходимость разработки специализированной библиотеки доступа к данным, реализованной в виде набора классов на языке C++.

Процесс разработки тематических карт, как правило, связан с необходимостью многократной классификации данных, экспертной оценки результатов и исправления ошибок. Это делает актуальным вопрос минимизации временных затрат на классификацию, что в настоящей работе достигается одновременным применением следующих подходов:

  • частичная классификация территории (участки, на которых обучающая выборка осталась без изменений, повторно не классифицируются);
  • распределение вычислений между несколькими компьютерами;
  • автоматическое управление вычислительными процессами (с момента подачи обучающих данных на вход до момента получения карты на выходе участие человека не требуется).

Для обеспечения доступа пользователей к создаваемым в ИКИ РАН на основе обработки спутниковых данных информационным продуктам автором была разработана информационная система мониторинга земного покрова TerraNorte ( http://terranorte.iki.rssi.ru ). Банк данных информационной системы включает в себя ряд продуктов и баз данных, полученных по данным дистанционного зондирования и отражающих состояние и динамику растительности в результате воздействия естественных и антропогенных факторов, таких как лесные пожары, вырубки лесов, сельскохозяйственное использование земель.

Пользовательский интерфейс TerraNorte предоставляет доступ к данным в нескольких режимах:

  • загрузка информационных продуктов, предоставляющая пользователям возможность получения данных в виде файлов в векторных и растровых форматах, совместимых с распространенными программными пакетами ГИС;
  • выполнение интерактивных запросов к базам данных для получения количественных показателей в табличной и графической формах;
  • просмотр картографической информации в окне web-браузера с использованием интерактивного интерфейса (раздел «карты on-line») без необходимости установки программного обеспечения на компьютер пользователя (рис. 6).

 Интерфейс системы TerraNorte: карта TerraNorte RLC Заключение. Представленная-68Рис. 6. Интерфейс системы TerraNorte: карта TerraNorte RLC

Заключение. Представленная диссертационная работа содержит результаты исследований и разработок автора, которые можно рассматривать как решение научной проблемы развития методов и технологий распознавания и картографирования типов земного покрова по данным спутниковых наблюдений.

Разработанный метод локально-адаптивной обучаемой классификации лег в основу созданного автором программного комплекса. Функциональные возможности комплекса обеспечивают автоматизированное картографирование типов земного покрова по спутниковым данным с использованием системы управления распределенными вычислениями.

С использованием разработанного программного комплекса на основе данных MODIS была создана карта растительности России, превосходящая по пространственному разрешению (250 м) существующие аналогичные карты на территорию России.

Независимая валидация, проведенная с использованием данных Росстата продемонстрировала высокую корреляцию (R2=0,99) оценок площадей лесов в субъектах РФ. Исследование пространственной детальности карты в сравнении со спутниковыми данными высокого разрешения, выполненное методом оптимума Парето, показало высокий для данного пространственного разрешения уровень точности карты.

Благодаря высокой степени автоматизации разработанный программный комплекс позволяет получать временные серии карт типов земного покрова.

Созданная в рамках диссертационной работы информационная система мониторинга земного покрова TerraNorte обеспечивает эффективный доступ пользователей к результатам исследований и разработок автора, включая новую карту растительности России.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ



Pages:     | 1 || 3 |
 





 
© 2013 www.dislib.ru - «Авторефераты диссертаций - бесплатно»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.