Перейти на главную страницу
Создание коллекций графических документов в сети Интернет в последнее время становится все более популярным. Самые распространенные коллекции – это фотоальбомы обычных пользователей. Кроме того, сейчас активно создаются электронные графические базы данных сотрудниками музеев, научных лабораторий, университетов и т.д. Поиск в таких коллекциях является затрудненным, так как до последнего времени традиционным являлся поиск визуальной информации, опирающийся на индексирование текстовых описаний, ассоциированных с изображением.
При очевидной необходимости организации и простоте доступа к визуальной коллекции посредством поиска по текстовой информации, ассоциированной с изображениями, такой подход представляется недостаточным, в первую очередь потому что, такой поиск не всегда является однозначным. Неоднозначность соответствия между визуальным содержанием и текстовым описанием снижает показатели точности и полноты поиска. Информация, которую человек получает, глядя на картинку, “стоит” тысячи слов. А некоторые изображения вообще трудно описать словами (очевидный пример - абстрактные картины).
В связи с этим возникает проблема организации доступа к современным электронным коллекциям изображений с использованием комплекса средств - как текстовых описаний, так и характеристик визуального содержания, простейших типа цветовой гаммы, и более сложных, связанных с распознаванием образов. Текстовое описание и визуальная поисковая информация дополняют друг друга, обеспечивая возможность разностороннего поиска.
Целью данной работы является разработка методов классификации и поиска графической информации и создание информационной системы, позволяющей создавать, управлять и анализировать коллекции графических документов. Особенностью такой информационной системы является возможность хранения и использования иерархии документов и значений наборов признаков, зависящих от типа документа. Создаваемое в коллекции дерево для хранения иерархии графических объектов может иметь неограниченное число уровней и неограниченное число узлов на каждом уровне. Не смотря на то что, создаваемая система предназначена в первую очередь для научных исследований, подобный способ описания графических объектов позволяет применять систему для создания каталога запчастей/товаров с иллюстрациями, произведений художников и т.д. Исследования поддержаны грантом РГНФ № 08-01-12116в (руководитель Н.В. Лобанова).
В первой группе каждое изображение может быть описано по параметрам следующего вида:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Определение некоторых признаков, таких как толщина шеи, тип головы, тип корпуса и т.д. визуально по рисунку не всегда является точным и часто зависит от эксперта. Для того, чтобы избежать двусмысленности восприятия предлагается использовать формулы отношения между длинами соответствующих отрезков.
На изображении петроглифа лося/оленя выделяют следующие отрезки: длина головы, длина корпуса, длина хвоста, длина туловища, толщина шеи, толщина передней и средней частей корпуса. Для того, чтобы отметить эти отрезки на рисунке в программе, необходимо мышкой отметить точки начала и конца отрезков. После этого автоматически высчитываются длины этих отрезков. Чтобы определить значение признака, необходимо сравнить длины соответствующих отрезков по формулам, которые задаются пользователем. Имеется возможность использовать все арифметические операции, а так же операции сравнения. При выполнении всех действий учитывается вычислительная погрешность.
Используя подобный калькулятор происходит формализация восприятия изображения и упрощается ввод характеристик и они становятся более точными.
Выделение фрагментов изображения и их взаимосвязь происходит с помощью специального графического интерфейса при помощи мыши прямо в окне браузера. Данный признак описываются с помощью ориентированных и неориентированных графов.
Во второй группе признаков выделим:
Для анализа текстур, одним из применяемых методов является анализ независимых компонент. С его помощью выделяют фильтры, которые признаны отражать основные направления текстур для той базы изображений, на основе которой они строятся [2]. Кроме этого используется спектр фрактальной размерности Реньи [1, 5].
Классификация по цветовому и текстурному анализу может быть осуществлена несколькими методами. Примерами являются поиск по цветовым моментам и цветовым гистограмм [2]. Кроме того, существуют методы поиска нечетких дубликатов [4]. Поиск нечетких дубликатов позволяет предположить, являются ли два объекта частично одинаковыми или нет. Частично одинаковые изображения могут образовывать один кластер. Кроме того, схожесть изображений по степени цветового восприятия может быть осуществлена на: сравнительной площадь белого, при наличии большого фрагмента определенного цвета и т.д.
Рассмотрим поиск на примере наскальных изображений Северной Фенноскандии. На сегодняшний день все новейшие материалы по петроглифам представляют собой набор цветных фотографий. Определенную сложность поиска создает фактическое отсутствие некоторых частей изображения. Поиск также осложняется тем, что часто невозможно определить, где верх, а где низ изображения. При этом, требование, что при поиске необходимо только совпадение контура изображения, позволяет упростить поиск, а значит, изображение петроглифа можно рассматривать, как бинарное (скале соответствует белый цвет, а петроглифу - черный). В зависимости от выбранных параметров поиска (точность поиска, процент совпадений элементов изображений) будет найдено одно или несколько изображений. Для поиска используются сеть адаптивного резонанса и структурный метод поиска.
В результате поиска, пользователю предоставляется доступ к информации о кодовом номере, месторасположении, характерных признаках найденного петроглифа и петроглифах, близких к нему по ранее описанным признакам.
Рассмотрим работу этого модуля на примере создаваемой коллекции петроглифов Северной Фенноскандии. Там выделены несколько крупных местонахождения наскальных рисунков, среди которых мы рассматриваем Норвегию, Мурманскую область и Карелию. В каждом месте выделяют более мелкие группы, потом еще более мелкие и т.д., пока не доходят до сюжетных схем и отдельных петроглифов. Наглядным представлением такого расположения являются иерархические наборы карт, схем и рисунков. Для этого необходимо загрузить карты в систему и выделить соответствующие точки местонахождения. Точно так же можно работать со схемой петроглифов: квадратной областью выделяется петроглиф и в базу данных заносится вся необходимая информация о нем. Таким образом, с этой часть системы может работать специалист в любой области, без необходимости изучения языков работы с базами данных. Основными пользователями этого раздела будут создатели коллекции. Для больших научных коллективов (сетевого научного сообщества) возможна распределенная работа научного коллектива без принудительной синхронизации получающейся базы данных.
Целью данной работы является разработка методов классификации и поиска графической информации и создание информационной системы, позволяющей создавать, управлять и анализировать ко
26 09 2014
1 стр.
Целью данного проекта является создание системы, которая автоматизировала бы выполнение следующих задач: создание и разработка html/php-файлов с учетом стиля разрабатываемой веб-си
08 10 2014
1 стр.
Эффективное государственное управление предполагает создание интегрированной информационной системы в виде комплекса информационных систем
10 09 2014
1 стр.
СПбгэту «лэти» Перескокова Константина на тему «Разработка методов эффективного аудита информационной безопасности информационных систем малых предприятий»
25 09 2014
1 стр.
Разработка информационной системы для создания сейсмотектонических проектов «ActiveTectonics»
09 10 2014
1 стр.
10 10 2014
1 стр.
23 09 2014
1 стр.
Однако в настоящее время очень незначительное число информационных систем предоставляют возможность тематического поиска, например, поиска с использованием тезауруса
12 10 2014
1 стр.