Создание и исследование системы распознаваний форм микрообъектов (на примере кристаллограмм)
Содержание
Введение
В современном мире весьма стремительно появляются новые области и методы исследований, особенно в области медицины. Большинство данных получают по средствам визуальных наблюдений. Из-за нарастающего потока получаемой информации её анализ стараются свести к автоматическим методам, дабы исключить «человеческий фактор» и уменьшить погрешность, но из-за новизны, специфичности и малой изученности порой это становится затруднительным. Ярким примером того являются кристаллографические методы исследования биологических жидкостей. Из-за новизны метода, процесс получения данных исследований сводится к «ручному» анализу фотографий кристаллограмм и подсчитыванию коэффициентов, несущих субъективный характер и «зыбкую» шкалу оценки. Автоматизированная система анализа кристаллограмм ускорит процесс обработки данных, уменьшит погрешность и повысит информативность.
Большинство систем анализа визуальных данных имеют достаточно узкую специфику и ограниченную область применения, что в своей мере создает трудность, но быстрое развитие прикладных пакетов для работы с графической информацией отчасти её нивелирует.
Таким образом, целью нашей выпускной квалификационной работы является создание и исследование системы распознаваний форм микрообъектов (на примере кристаллограмм). Объектом исследования являются системы распознавания фор. В качестве предмета исследования мы выбираем разработку и исследование характеристик системы распознавания форм микрообъектов.
Задачи:
- рассмотреть понятие системы распознавания;
- разработать алгоритм для создания системы распознавания микрообъектов на кристаллограмме;
- реализовать алгоритм с помощью прикладных пакетов программирования;
- исследовать характеристики и работоспособность разработанного алгоритма.
Гипотеза исследования: Если разработать эффективно функционирующую систему распознавания форм микрообъектов, то это будет способствовать решению проблемы автоматизации процесса обработки кристаллограмм.
Методы исследования: а) теоретические: изучение литературы посвященной и связанной с проблемой, программ распознавания, анализ и соотнесение информации; б) практические: обобщение опыта работ в области распознавания, автоматизации, разработка и анализ работоспособности алгоритма распознавания форм.
Научная новизна исследования заключается в подходе к анализу кристаллограмм, как к анализу форм, направлений и распределений линий лежащих на окружности. Данный подход реализуется в алгоритме распознавания форм микрообъекта и отражает структурную картину кристаллограммы.
Практическая значимость работы состоит в том, что разработан и реализован алгоритм распознавания формы микрообъектов и проведено исследование его применимости.
Глава 1. Обзор систем распознавания форм
Для начала разработки системы необходимо изучить теоретическую основу систем распознавания, ознакомиться с основными этапами истории их развития, принципом работы, классификациями и сформулировать понятие системы распознавания форм микрообъектов.
- Понятие системы распознавания образов: история и современность
Распознавание это способность живых организмов обнаруживать в потоке информации, поступающей от органов чувств, определённые объекты, закономерности, явления. Оно может осуществляться на основе зрительной, слуховой, тактильной информации. Так, человек без труда может узнать другого знакомого ему человека, взглянув на него или услышав его голос. Некоторые животные активно используют обоняние для узнавания других особей и поиска пищи.
Под образом (объектом) в системе распознавания понимается совокупность данных на входе системы. Данные могут быть представлены различным образом: изображение, последовательность звуков, набор числовых характеристик и т.д.
Возможность распознавания опирается на схожесть однотипных объектов. Несмотря на то, что все предметы и ситуации уникальны в строгом смысле, между некоторыми всегда можно найти сходства по тому или иному признаку. Результат распознавания - классификация некоторого определенного объекта. Отсюда возникает понятие классификации разбиения всех объектов на классы, элементы которых имеют некоторые схожие свойства, отличающие их от элементов других классов. И, таким образом, задачей распознавания является присвоение объектов по их описанию к нужным классам.
Человеку в процессе классификации совсем не обязательно точно определять характерные признаки объекта, имеет значение только окончательный результат процесса наблюдения, восприятия и распознавания. Автоматические системы должны осуществлять такую же классификацию, как и человек, но они должны явным образом использовать характерные признаки объекта.
Таким образом, можно сформулировать понятие системы распознавания (объектов, образов, сигналов, ситуаций, явлений или процессов) сложная система выполняющая задачу идентификации объекта и присвоение ему класса или определения каких-либо его свойств по изображению (оптическое распознавание), радиосигналу (распознавание радиосигнала) или аудиосигналу (акустическое распознавание) и другим характеристикам.
В истории развития компьютерного распознавания можно выделить следующие этапы:
1955 г. - профессор Массачусетского технологического института (МТИ) Оливер Селфридж опубликовал статью «Глаза и уши для компьютера». В ней автор выдвинул теоретическую идею оснащения компьютера средствами распознавания звука и изображения.
1958 г. - психолог Фрэнк Розенблатт из Корнеллского университета создал компьютерную реализацию персептрона (от perception - восприятие) - устройства, моделирующего схему распознавания образов человеческим мозгом. Персептрон был впервые смоделирован в 1958 году, причем его обучение требовало около получаса машинного времени на ЭВМ IBM-704.
1960-е гг.- появление первых программных систем обработки изображений (в основном для удаления помех с фотоснимков, сделанных с самолетов и спутников), стали развиваться прикладные исследования в области распознавания печатных символов. Однако все еще существовали ограничения в развитии данной области науки, такие как отсутствие дешевых оптических систем ввода данных, ограниченность и довольно узкая специализация вычислительных систем. Бурное развитие систем распознавания и компьютерного зрения на протяжении 60-х годов можно объяснить расширением использования вычислительных машин и очевидной потребностью в более быстрой и эффективной связи человека с ЭВМ. К началу 60-х годов задачи компьютерного зрения в основном охватывали область космических исследований, требовавших обработки большого количества цифровой информации.
1970-е гг. - Лавренсе Робертс, аспирант МТИ, выдвинул концепцию машинного построения трехмерных образов объектов на основе анализа их двумерных изображений. На данном этапе стал проводиться более глубокий анализ данных. Начали развиваться различные подходы к распознаванию объектов на изображении, например структурные, признаковые и текстурные.
1979 г. - профессор Ганс-Хельмут Нагель из Гамбургского университета заложил основы теории анализа динамических сцен, позволяющей распознавать движущиеся объекты в видеопотоке.
В конце 1980-х годов были созданы роботы, способные более-менее удовлетворительно оценивать окружающий мир и самостоятельно выполнять действия в естественной среде
80-е и 90-е годы ознаменовались появлением нового поколения датчиков двухмерных цифровых информационных полей различной физической природы. Развитие новых измерительных систем и методов регистрации двухмерных цифровых информационных полей в реальном масштабе времени позволило получать для анализа устойчивые во времени изображения, генерируемые этими датчиками. Совершенствование же технологий производства этих датчиков позволило существенным образом снизить их стоимость, а значит, значительно расширить область их применения.
С начала 90-х годов в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой модульной парадигмой. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от «иконического» представления объектов (растровое изображение, неструктурированная информация) к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.).
В середине 90-х годов появились первые коммерческие системы автоматической навигации автомобилей. Эффективные средства компьютерного анализа движений удалось разработать в конце XX века
2003 г. - на рынок были выпущены первые достаточно надежные корпоративные системы распознавания лиц.
Развитие и распространение компьютерной обработки информации в середине ХХ века привели к появлению методов машинного распознавания, позволяющего расширить круг выполняемых компьютерами задач и сделать машинную переработку информации более интеллектуальной. Примерами сфер применения распознавания могут служить системы распознавание лиц, автомобильных номеров, распознавание речи, отпечатков пальцев, машинное зрение и прочее. Несмотря на то, что некоторые из этих задач решаются человеком на подсознательном уровне с большой скоростью, до настоящего времени ещё не создано компьютерных программ, решающих их в столь же общем виде. Существующие системы предназначены для работы лишь в специальных случаях со строго ограниченной областью применения.
1.2.Классификация систем распознавания
Следует отметить тот факт, что на данный момент в литературных источниках по проблемам распознавания отсутствует четко сформированная система классификации распознающих систем. Хотя попытки классифицировать системы распознавания предпринимались.
Однако можно предложить свой подход к классификации систем распознавания, основанный на личном опыте разработки таких систем в определенной предметной области (распознавание формы микрообъектов).
Очевидно, что начальным признаком классификации должен стать метод распознавания. В этом случае можно выделить три вида систем.
Первый метод. Метод перебора. В этом случае производится сравнение с базой данных, где для каждого вида формы представлены всевозможные модификации отображения. Например, для оптического распознавания текста можно применить метод перебора шрифта и его свойства.
Второй метод. Производится более глубокий анализ характеристик формы. В случае оптического распознавания это может быть определение различных геометрических характеристик. Ярким примером этого метода служат новейшие системы проверки изготовленных и обработанных деталей.
Третий метод использование искусственных нейронных сетей. Этот метод требует обучения на большом количестве примеров распознавания, либо специальные структуры нейронной сети, учитывающей специфику данной задачи. Несмотря на долгую историю, данный метод стал широко распространяться только с появлением суперкомпьютеров, и сразу показал огромное преимущество перед остальными методами.
Второй признак классификации систем распознавания - по критерию участия персонала (человека) в процессе функционирования системы.
Автоматические. Системы, функционирующие без участия персонала.
Автоматизированные. Предполагают обязательное участие персонала в их функционировании.
Интегрированные (комплексные). Объединяют в своем составе и автоматические, и автоматизированные.
Система, разработанная нами, будет относиться к автоматизированным системам производящим анализ характеристик формы и определения геометрических свойств. В дальнейшем мы постараемся свести участие человека в процессе функционирования к минимуму.
Предложенные методы классификации не являются полными и применимы только к системам распознавания оптических образов, то есть классификации могут быть не применимы к системам распознавания информации другого рода. Признаки классификаций не учитывают особенности систем, не рассмотренных нами в процессе изучения литературы.
- Понятие системы распознавания формы микрообъектов
Что же такое система распознавания формы микрообъектов? В изученной нами литературе данное понятие не встречается. Его можно сформулировать, опираясь на понятие системы распознавания. Можно сказать, что это система, выполняющая только распознавание форм и их характеристик применительно к микрообъектам. Для уточнения необходимо ввести понятие формы и микрообъекта.
Понятие формы можно описать как геометрическую структуру поверхности физического тела. Форма часть в системе классификации, объединяющая (выделяющая) определенную группу объектов по расположению границ (контуров). В программировании и работах по компьютерной обработке изображений представляют понятие формы как комбинацию графических примитивов. Под графическим примитивом понимается простейший геометрический объект, отображаемый на экране дисплея. Описание графического примитива обычно содержит метрическую и атрибутивную части. Метрическая часть позволяет сопоставить те величины, в которых задан графический примитив для отображения его на дисплее и те величины, которые характеризуют его физическое или логическое представление. Атрибутивная часть передает геометрические параметры, характеризующие форму и расположение графического примитива. В качестве примитива выступают, точки, отрезки, линии, прямоугольники, окружности, эллипсы и полигоны произвольных форм.
Под микрообъектами понимаются любые объекты, размеры которых могут быть определены с помощью оптического микроскопа, т.е. 200нм - 1мм. В нашей работ будут рассматриваться образцы биологического субстрата, приготовленные по любой методике кристаллографического анализа. В зависимости от методики их размер варьируется от 0,5 до 3мм, рассматриваются под микроскопом с увеличением х40.
Таким образом, группируя понятие системы распознавания, формы и микрообъекта можно сформулировать понятие системы распознавания форм микрообъектов как узконаправленной система распознавания, осуществляющей получение, преобразование оптической информации о микрообъекте её анализ и вывод, содержащий классификацию формы микрообъекта и(или) её параметры.
Глава 2. Разработка системы распознавания формы микрообъектов
В главе рассмотрена проблема оценки результатов кристаллографических методов исследований биологических жидкостей, предложен способ решения. Представлено описание и реализация алгоритма распознавания линий и расчета их проекций.
2.1. Проблема разработки автоматических систем оценки результата кристаллогенеза
Кристаллографические методы исследования совокупность методологических подходов к извлечению информации о метаболизме и гомеостазе организма и/или его частей, основанных на феномене свободного или инициированного базисными веществами различного химического состава кристаллообразования высушенного жидкого или приводимого в жидкое состояние биологического материала с последующей интерпретацией результатов кристаллогенеза.
Фация - образец биологического субстрата, приготовленный по любой методике кристаллографического анализа.
Кристаллограмма изображение всей поверхности образца высушенного биоматериала.
Особенности описания результатов свободной и инициированной кристаллизации биоматериала. Основные и дополнительные критериев оценки кристаллограмм, для учета характеристик фации, включают:
- Индекс структурности (ИС) - отражает состав элементов образца, наличие, относительное и абсолютное количество тел аморфного и кристаллического строения в микропрепарате. ценивается по 4-балльной системе: 0 баллов - присутствие в микропрепарате только вещества аморфного строения, 1балл - дискретная часть образца, представленная аморфными телами и единичными кристаллами; 2 балла - наличие в фации, кроме вышеуказанных элементов, дендритного компонента; 3балла - большая часть поля зрения или все поле образовано крупными дендритными структурами; аморфные тела и одиночные кристаллы
немногочисленны. - Кристаллизуемость (К) - индикатор активности процесса кристаллогенеза. Определяется по 4-баллой шкале: 0 баллов - нет центров кристаллизации; 1 балл - единичные мелкие кристаллы преимущественно одиночного ряда (не более 10 в поле зрения); 2 балла - значительное количество центров кристаллизации (более 10
в поле зрения); 3 балла все поле зрения покрыто кристаллами одиночно-кристаллического или дендритного ряда. - Тип взаимодействия кристаллических и аморфных структур (ТВ) Биологическая сущность и информативность данного феномена не изучены.
- Степень деструкции фации (СДФ) - интегральный показатель, отражающий правильность протекания кристаллогенеза и суммирующий как экзогенные, так и эндогенные факторы. Выражается в четырех степенях: 0 степень - все элементы фации правильной конфигурации, не разрушены как в целом, так и на отдельных участках; признаки разрушения текстуры фации отсутствуют; 1 степень - элементы фации имеют начальные признаки разрушения,
деструктивные изменения текстуры не наблюдаются; 2 степень - визуализируются многочисленные разрушенные или измененные структуры; есть локальные нарушения целостности текстуры; 3 степень - все элементы фации разрушены, невозможно различить отдельные части фации и структуры, образец представляет собой бесформенную массу аморфного, зачастую окрашенного, материала; отмечаются четкие признаки разрушения текстуры. - Равномерность распределения кристаллических и аморфных эле-ментов фации (R) - критерий, свидетельствующий о правильности протекания процесса свободного кристаллогенеза. Интерпретируется с использованием шестибалльной шкалы: 0 баллов - полная хаотичность фации, наличие разнородных элементов, пустот, мест скопления кристаллических структур, различная ориентация образований в поле зрения. 1 балл - некоторая сгруппированность кристаллов, намечаются единичные участки правильного их построения, занимающие менее 30% от общей площади поля зрения, направленность фигур еще хаотичная. 2 балла наблюдаются четкие "островки" упорядоченности, занимающие от 30 до 50% поля зрения (изучаются не менее трех), расстояния между элементами в группах приблизительно уравниваются, регистрируется некоторая закономерность направленности структурных образований фации. 3 балла - элементы фации в значительном числе (более 50% от общего
количества) структурированы, "островки" равномерности переходят в участки сравнительно большой площади. Внутри этих зон наблюдаются правильное расположение и равномерность расстояний между отдельными образованиями. Закономерность направленности элементов и зональность просматриваются достаточно четко. 4 балла - элементы фации в большинстве своем структурированы (свыше 75% от общего количества), остальные распространяются "островками" по полю зрения, чаще в краевой (маргинальной) зоне. Расстояния между отдельными образованиями практически постоянны. Ориентация элементов подчиняется определенной закономерности почти по всему полю зрения. 5 баллов - все элементы тезиграфической фации четко структурированы на всем поле зрения, что подтверждается рассмотрением нескольких полей. Деление на центральную, промежуточную и краевую зоны четко просматривается. Границы последних можно установить даже без микроскопа. Расстояния между элементами картины постоянны, ориентация фигур правильная, закономерная на всей поверхности фации. - Степень выраженности ячеистости фации (С) отражает особенности органико-минеральных взаимодействий в фации. Оценка производится по шестибалльной прямой шкале: 0 баллов - полное отсутствие признаков появления ячеистости, однородность картины, нет выделения «островков» кристаллов. Фации представляют единый «пласт» кристаллических образований. 1 балл - наличие первых признаков неоднородности, «дробления» кристаллоскопической картины (выделены наиболее диагностически значимые принципы):
-начало обособления групп элементов (менее 30% от числа всех образований, занимающих менее 30% поля зрения);
-появление некоторой неоднородности картины;
-начало «дробления» единого «пласта» кристаллических фигур.
2 балла - отмечается достаточно просматриваемая тенденция к «дроблению» фации, образованию «островков» кристаллов (выделены наиболее диагностически значимые принципы):
-количество обособившихся элементов в «островках» - от 30 до 50%
от числа всех структур, они занимают более 30% поля зрения фации;
-выраженная неоднородность, зональность картины;
-визуализируется процесс «разделения фации на участки, регистрируются формирующиеся пояса кристаллизации, служащие границами последних, в некоторых случаях не на всем протяжении, толщиной в 1 кристалл.
3балла - наблюдаются выраженные изменения в фации (выделены наиболее диагностически значимые принципы):
-элементы в «островках» составляют от 50 до 75% от общего числа, занимаемая ими поверхность - более 50% поля зрения (по нескольким полям);
-выраженная неоднородность, «зернистость» картины;
-четко просматривается процесс «расчленения» фации в нескольких
полях зрения;
-пояса кристаллизации довольно четкие, образованы более чем одним рядом кристаллических структур.
4балла - достоверно просматриваются признаки появления ячеистости (выделены наиболее диагностически значимые принципы):
-число сгруппированных в ячейки структур от 75 до 100% от общего
количества;
-сгруппированные элементы занимают все поле зрения (при изучении не менее чем трех полей);
-очень четко выражены «дробность», «зернистость» картины;
-пояса кристаллизации образованы более чем одним рядом кристаллов, имеются на всей поверхности поля зрения, окружают «островки» полностью.
5баллов - картина характеризуется следующими наиболее диагностически значимыми морфологическими признаками:
-число сгруппированных в ячейки структур от 75 до 100% от общего количества;
-сгруппированные элементы занимают все поле зрения (при изучении нескольких, не менее чем трех полей зрения);
-очень четко выражена "дробность", "зернистость" картины;
-пояса кристаллизации образованы более чем одним рядом кристаллов, имеются на всей поверхности поля зрения, окружают "островки" полностью;
-присутствуют "разломы" картины (кроме фаций сыворотки крови, для которых данный феномен является самостоятельным диагностическим признаком).
- Выраженность отдельных зон кристаллизации (Z) - четкость формирования зон в фации высушенной биологической жидкости. Выражается в баллах (от 0 до 3): 0баллов - невозможность выделения каких-либо зон кристаллоскопической фации; 1балл - при малом увеличении светового микроскопа выделение зон
неотчетливое, наблюдаются незначительные признаки зонализации; 2балла - наличие зон фации четко определяется при малом увеличении микроскопа; 3балла четкая визуализация зон даже без микроскопа. - Выраженность краевой белковой зоны (Кз) указывает на относительное содержание в биологической среде компонентов с высокой молекулярной массой, прежде всего белкового состава. Данный показатель оценивается по 4-балльной прямой полуколичественной шкале:0баллов - полное отсутствие краевой зоны, невозможно выделение краевой зоны под «малым» (мельче х56) увеличением микроскопа; 1балл - краевая зона присутствует нечетко и/или не на всем протяжении фации; 2балла - при микроскопии по всему периметру микропрепарата отмечается наличие выраженной краевой зоны; 3балла - соотношение «ширина краевой зоны - радиус фации» превышает 1:3; 4балла выраженная краевая зона в сочетании с наличием «разломов»; 5баллов - краевая зона визуализируется даже без использования микроскопа.
- Рельефность текстуры (Т) позволяет оценить состояние и особенности фонового рисунка, на котором располагаются основные кристаллические и аморфные структуры. Оценивается по прямой 4-балльной схеме: 0баллов - нет признаков наличия текстуры; 1балл - едва заметные при микроскопии элементы (участки) текстуры; 2балла - хорошо различимая при микроскопии текстура фации; 3балла - визуализируемая без использования микроскопа текстура микропрепарата.
Можно заметить, что основная проблема разработки автоматических систем оценки результата кристаллогенеза заключается в большом объеме критериев и субъективности их оценки. Для её решения необходимо минимизировать количество критериев, устранить субъективный аспект с помощью компьютерного анализа и создать конкретную шкалу оценок.
Для уменьшения количества критериев, мы провели их тщательный анализ, проверили сложность их вычисления, применимость к различным методам и информативность. По его итогам был выбран один критерий - степень деструкции фации(далее СДФ), несущий, на наш взгляд, максимальное количество информации о фации и дающий исчерпывающую картину о протекании процесса кристаллогенеза, имеющий линейную шкалу оценки и простоту вычисления. СДФ суммирует как экзогенные факторы дегидратационного процесса (температура, влажность, давление, скорость потоков воздуха, попадание дополнительных веществ и т. д.) так и эндогенные (термодинамическая составляющая кристаллообразования, наличие адекватного для формирования кристаллогидратов и стабилизации органических макромолекул количества воды и т, д.).
Исходя из описания критерия и сопоставления данных, взятых из работ по кристаллографическим методам исследований, можно точно сказать, что величина СДФ определяется плотностью трещин, отношением радиальных трещин к тангенциальным и их распределением по зонам фации. Следовательно, система, распознающая форму разломов, их направление и плотность распределения в зависимости от зоны, позволит нам устранить субъективный аспект и даст исчерпывающую информацию.
2.2. Разработка алгоритма распознавания линий и расчет их радиальных и тангенциальных составляющих
В процессе считывания и преобразования в цифровой массив изображение подвергается различным искажениям и зашумлению, что требует применения средств для его улучшения и реставрации.
Весь алгоритм можно разбить на несколько этапов:
- Ввод изображения.
- Предварительная обработка.
- Распознавание линий.
- Расчет их радиальных и тангенциальных составляющих
- Вывод результата.
Ввод изображения будет осуществляться по средствам захвата с оптического устройства (камеры) либо считывания уже имеющегося.
Предварительная обработка направлена на улучшение изображения, отсечение лишней информации и состоит из нескольких шагов:
- Преобразование в полутоновое изображение.
Так как цвет не несет для нас значимой информации, можно перевести его в полутоновое, заменив значения RGB для каждого элемента матриц на значение интенсивности яркости. Это ускорит процесс обработки, так как программе или функции, работающий с матрицей изображения, необходимо будет оперировать с одним значением для каждого элемента.
- Выравнивание освещения (компенсация разности освещения).
Большинство изображений фаций имеет неравномерное освещение, что вызывает проблемы в процессе дальнейшей обработки. Компенсацию разности будем производить с помощью алгоритма Single scale retinex (SSR).
Принцип работы данного алгоритма:
Исходное изображение (рис. 2)
Получаем приближенное изображение освещения путем низкочастотной фильтрации (рис. 3)
G матрица свертки низкочастотного фильтра
Восстановим изображение по формуле (рис. 4)
- Сглаживающая фильтрация (устранение шумов).
Как правило, фильтрация осуществляется путем свертки матрицы изображения с маской, представляющей фильтр. В нашем случае будем использовать фильтр Гаусса. Фильтр Гаусса является результатом операции размытия изображения функцией Гаусса. Данный подход широко применяется в графических редакторах, как правило, для уменьшения зашумленности изображения и сглаживания резких краев. Также Гауссово сглаживание используется в качестве оператора этапа предварительной обработки во многих системах распознавания образов.
С точки зрения математики, применение фильтра Гаусса равносильно свертке изображения с функцией Гаусса (также данный подход известен как двумерное преобразование Вейерштрасса). Механизм работы фильтра заключается в расчете функции Гаусса для каждого пикселя изображения. Уравнение гауссовой функции для одного измерения имеет следующий вид:
,(1)
где x - координата объекта в одномерном пространстве;
- среднеквадратичное гауссово отклонение.
В двумерном случае дважды осуществляется расчет функции Гаусса (1) для каждого из измерений:
,(2)
где x,y - координаты объекта в двумерном пространстве;
- среднеквадратичное гауссово отклонение.
Формула (2) дает поверхность, ограниченную концентрическими окружностями, распределенными относительно центральной точки по Гауссу. Значения, вычисляемые на основе этого распределения, используются для построения конволюционной матрицы, которая применяется к исходному изображению.
- Выделение краев.
Выделение краев будет осуществляться детектором границ Канни. Его преимущества перед остальными детекторами:
- Хорошее обнаружение, т. е. минимальная вероятность пропуска реального перепада яркости и минимальная вероятность ложного определения перепада (максимизирование выходного отношения сигнал/шум).
- Хорошая локализация (пиксели, определенные как пиксели края, должны располагаться насколько возможно ближе к центру истинного края).
- Только один отклик на один край.
Вышеперечисленные критерии были записаны в виде уравнений, которые были решены численно, и был определен путем моделирования вид оптимального (в смысле указанных выше критериев) оператора выделения края.
Принцип работы детектора:
1. Свертка изображения с ядром производной от фильтра гаусса.
2. Поиск значения и направления градиента.
3. Выделение локальных максимумов.
• Утоньшение полос в несколько пикселей до одного пикселя.
4. Связывание краев и обрезание по порогу.
• Определяем два порога: нижний и верхний
• Верхний порог используем для инициализации кривых
• Нижний порог используем для продолжения кривых
Пример работы детектора границ Канни представлен в виде исходного изображения (рис.6) и обработанного изображения (рис.7)
Процесс распознавания лини и расчет их радиальных и тангенциальных составляющих можно объединить в одну операцию. Для этого разделим изображение кристаллограммы на несколько сегментов (рис.8). В пределах каждого сегмента ведем радиус с заданным углом смещения, если на его пути будет встречаться линия, проецируем её на радиус и нормаль к нему, поворачиваем радиус на заданный угол и повторяем операцию. Проекция на радиус будет представлять собой радиальную составляющую линии, а проекция на нормаль тангенциальную.
2.3. Реализация алгоритма в программной среде
Для реализации алгоритма было выбрано две программные среды MATLAB для предварительной обработки и Matcad для реализации процесса распознавания.
MATLAB (сокращение от англ. «Matrix Laboratory») пакет прикладных программ для решения задач технических вычислений и одноимённый язык программирования, используемый в этом пакете.
Image Processing Toolbox библиотека функций для MATLAB, позволяющих решать широкий спектр задач обработки изображений.
Mathcad система компьютерной алгебры из класса систем автоматизированного проектирования, ориентированная на подготовку интерактивных документов с вычислениями и визуальным сопровождением.
Вид рабочего пространства MATLAB (рис. 9)
1 Окно файлового менеджера
2 Командное окно
3 «Рабочее место» отображает все файлы используемые выполняемым алгоритмом
4 История выполненных команд
5 Меню и доступ к дополнительным функциям
Код алгоритма предварительной обработки реализованный в MATLAB:
I = imread('1.jpg');
threshold=graythresh(I);
Ib=im2bw(I, threshold);
Ir=retinex_frankle_mccann(Ib, 2);
H=fspecial('gaussian', 5, 0.7);
If=filter2(H, Ib);
Ik = edge(If, canny);
In = max(Ik(:))-Ik;
I2=bwmorph(In, 'thicken', 5);
I3=bwmorph(I2, 'close', 2);
imshow(I4)
Пошагово разберем этап выполнения кода
%считывание изображения
I = imread('1.jpg');
%вычислени глобального порога
threshold=graythresh(I);
%преобразование изображения в полутоновое
Ib=im2bw(I, threshold);
%выравнивание освещения
Ir=retinex_frankle_mccann(Ib, 2);
%создание фильтра Гаусса
H=fspecial('gaussian', 5, 0.7);
%фильтрация с заданным фильтром
If=filter2(H, Ib);
%выделение границ методом Канни
Ik = edge(If, canny);
%инвертирование цветов изображения
In = max(Ik(:))-Ik;
%морфологическая операция "утолщение"
I2=bwmorph(In, 'thicken', 5);
%морфологическая операция "закрытие"
I3=bwmorph(I2, 'close', 2);
%морфологическая операция "утоньшение"
I4=bwmorph(I3, 'thin', 7);
%вывод изображения
imshow(I4)
Изображение, подаваемое на вход (рис. 10) и после обработки (рис. 11).
Вид рабочего пространства Mathcad (рис.12)
1 - Меню и доступ к дополнительным функциям
2 Рабочее пространство для ввода кода
3 Панель инструментов
Реализация алгоритма распознавания линий и расчет их радиальных и тангенциальных составляющих в Mathcad.
Функция READBMP производит считывание обработанного изображения. Функция Rad выполняет распознавание линии и рассчитывает её радиальную проекцию по всему изображению. Значению R присваивается сумма всех радиальных проекций в пределах заданного сегмента. График R отражает количество радиальных проекций по сегментам (см. рис. 13).
Функция fr высчитывает распределение амплитуд функции Rad (см. рис. 14).
Функция Tan выполняет распознавание линии и рассчитывает их тангенциальные проекции по всему изображению. Значению T присваивается сумма всех тангенциальных проекций в пределах заданного сегмента. Построены графики Tan и T (см. рис. 15).
Функция ft, аналогично функции fr расчитывает распределение амплдитуд функции Tan (см. рис. 16)
Kj,l суммирует значения T и R по параметрам j и l, которые задают разбиение на сегменты. Kj,l - отражает распределение плотности линий в сегментах разбиения (рис. 17). Для наглядности строится трехмерный график(рис. 18).
Глава 3. Исследование характеристик системы распознавания формы микрообъектов
В главе рассмотрен процесс тестирования разработанной системы распознавания, произведен анализ тестирования и интерпретация полученых данных.
3.1. Тестирование системы распознавания формы микрообъектов
Проверка системы производится в два этапа. Первый этап испытание алгоритма предварительной обработки на изображениях различного качества и проверка работоспособности функции выделения края в зависимости от формы и количества линий.
Второй этап проверка алгоритма распознавания линий и расчета их радиальных и тангенциальных проекций. Применение системы к изображениям кристаллограмм и регистрация данных на выходе.
Для тестирования было выбрано четыре изображения (рис. 19, 20, 21, 22).
Все изображения обладающих полным набором характеристик необходимых для проверки системы: разрешение 1500х1500 точек, различные виды краев, различная степень зашумленности, разность освещения, различная структура разломов и трещин, меняющаяся по направлению и в пределах сегментов.
Первый этап.
Для проверки работы системы с изображениями разного разрешения создаются копии с разрешениями 1000х1000, 700х700, 400х400 пикселей. Примеры, полученные в ходе проверки, отображены на рисунках 23, 24, 25, 26.
Итог применения алгоритма предварительной обработки к тестовым изображениям (рис. 27, 28, 29, 30).
Второй этап.
Результат распознавания на тестовых изображениях линий и расчета их радиальных и тангенциальных проекций. Ниже представлены данные, полученные для каждого изображения.
График распределение плотности линий в сегментах для первого тестового изображения:
График распределение плотности линий в сегментах для второго тестового изображения:
График распределение плотности линий в сегментах для третьего тестового изображения:
График распределение плотности линий в сегментах для четвертого тестового изображения:
3.2. Анализ и интерпретация результатов тестирования
На основе результатов, полученных в ходе первого этапа тестирования, можно сделать вывод, что алгоритм предварительной обработки работает при условиях зашумления среднего уровня, разности освещенности и структуре линий и трещин любой сложности. Единственное ограничением для данного алгоритма служит разрешение исходного изображения. Это следует из анализа рисунков 23, 24, 25, 26. При разрешении 700х700pix появляются утолщения в местах пересечения линий и артефакты «заливки» замкнутых областей. При дальнейшем снижении разрешения искажения значительно усиливаются.
Метод анализа данных, полученных в ходе второго этапа тестирования, заключался в соотнесении картины тестового изображения к значениям функций радиальных и тангенциальных проекций линий, а так же графиком распределения плотности линий в сегментах.
Особенность первого тестового изображения заключается в преобладании линий идущих радиально или с минимальным отклонением и симметрии относительно центра. Для удобства и наглядности будем рассматривать угловой сектор изображения. Значения функции Rad (сумма радиальных проекций) представлены графиком на рисунке 31. Рост значений функции на участке «1» можно соотнести с тем, что на сегмент «1» сектора тестового изображения приходится больше линий, а уменьшение значений на участке «2» можно соотнести с уменьшением линий и их утоньшением в сегменте «2». Данные соотношения применимы для большинства изображений (рис. 32, рис. 33).
На рисунке 34 представлен график значений функции Tan (тангенциальные проекции линий). Острые пики на данном графике можно соотнести с линиям, минимально отклоняющиеся от радиуса. Данный эффект возникает из-за того что все пиксели лежащие на радиусе при проекции на нормаль суммируются функцией Tan. Обойти его на данном этапе разработки не представляется возможным, но из-за малой протяженности данные возмущения вносят минимальный вклад в среднее значение функции. С другой стороны эти возмущения пригодны для описания радиальных линий, они несут информацию о длине и распределении по угловым секторам. Данное соотношение применимо и к другим изображениям, имеющим радиальные линии(рис. 35). Для остальных изображений установить соотношение между картиной разломов и функцией Tan не удалось, что говорит о необходимости корректировки расчета тангенциальных проекций.
Графики распределения плотности линий в сегментах для всех изображений похожи. Из визуального соотнесения картин разломов и графиков, можно предположить, что форма линий уровня, их количество, величина градиента и локальные особенности графика плотности несут информацию о структуре разломов.
Проверка данной гипотезы требует автоматизации работы алгоритмов и наличие достаточно большой выборки изображений.
Заключение
Подведем итог нашей работы.
Нами была изучена литература по кристаллографическим методам исследования, что позволило нам рассмотреть вопрос об особенностях описания результатов кристаллизации биологических жидкостей.
Выполнено изучение литературы по обработке изображений, распознаванию образов и методов реализации, на основе которых был разработан алгоритм распознавания формы трещин на изображении кристаллограммы. Алгоритм реализован в программных средах MATLAB и Mathcad.
Произведено тестирование алгоритма на специально отобранных изображениях кристаллограмм. Также били проведены анализ и интерпретация данных, полученных в ходе тестирования, сформулирован вывод о применимости алгоритма.
В итоге проведенных исследований выдвинутая нами гипотеза экспериментально подтвердилась. Поставленная цель была достигнута.
Таким образом, есть перспективы и далее продолжать работу по разработке и исследованию системы распознавании формы микрообъектов (на примере кристаллограмм) с целью решения проблемы автоматизации анализа данных кристаллографических исследований.
Библиографический список
Биокристалломика: общие представления, методология и методы исследования. [Текст] Учеб. пособие / сост. А.К. Мартусевич, А.А. Гришина. Киров: Типография ВГСХА, 2009. 26 с.
Воробьев, А.В., Кристаллогенез биологических жидкостей и субстратов в оценке состояния организма [Текст] / А.В. Воробьев, А. К. Мартусевич, С.П. Перетягин Н. Новгород: ФГУ «ННИИТО Рос-медтехнологий», 2008. 384 с.
Мартусевич А.К. Физиология и патология кристаллостаза: общая парадигма и перспективы изучения [Текст] / Вестник Нижегородского университета им Н.И. Лобачевского. 2010. №1. С. 135139.
Булатов, А. Изучение физико-биологических свойств плазмы крови онкогематологических больных с трансфузией тромбоцитов [Текст]: Выпускная квалификационная работа [Текст] / А.Булатов. Киров, 2012. - 180 с.
И.М.Журавель "Краткий курс теории обработки изображений" [Электронный ресурс]. - Режим доступа: http://matlab.exponenta.ru/imageprocess/book2/index.php
Курс «Введение в компьтерное зрение 2013» [Электронный ресурс]. - Режим доступа: http://courses.graphics.cs.msu.ru/course/view.php?id=4
Анисимов, Б.В. Распознавание и цифровая обработка изображений: Учебное пособие для студентов вузов [Текст] / Б.В Анисимов, В.Д. Курганов, В.К. Злобин - М.: Высш.шк., 1983. - 295 с. ил.
Распознавание образов. Состояние и перспективы. Пер. с англ. [Текст] / под редакцией Гуревича И.Г. М.: Радио и связь, 1985.
Гонсалес, Р. обработка изображений в среде MATLAB. Перевод с английского В.В. Чепыжова [Текст] / Р. Гонсалес, Р. Вудс, С. Эддинс М.: Техносфера, 2006. 616с.
Фу, К. Структурные методы в распознавании образов [Текст] / К. Фу. - М.: Мир, 1977.
Canny J.F. Finding edges and lines in images [Текст] / Masters thesis, MIT, Cambridge, USA, 1983.
Рис. 1. Кристаллограммы, полученные разными кристаллографическими методами
Рис. 2
Рис. 3
Рис. 4
Рис. 6
Рис. 7
Рис. 8 Схематическое представление алгоритма распознавания линий и расчета их проекций
Рис. 9
Рис. 10
Рис. 11
Рис. 12
Рис. 13
Рис. 14
Рис. 15
Рис. 16
Рис. 17
Рис. 18
Рис. 19
Рис. 20
Рис. 21
Рис. 22
Рис. 23 Разрешение 1500х1500
Рис. 24 Разрешение 1000х1000
Рис. 25 Разрешение 700х700
Рис. 26 Разрешение 400х400
Рис. 27
Рис. 28
Рис. 29
Рис. 30
Рис. 31 Сумма радиальных проекций тестового изображения №1
Тестовое изображение №2
Рис. 33 Сумма радиальных проекций тестового изображения №2
Рис. 32 Сумма радиальных проекций тестового изображения № 3
Сектор тестового изображения №3
Сектор тестового изображения №1
Рис. 34 Сумма тангенциальных проекций по всей окружности для тестового изображения №1
Тестовое изображение №3
Тестовое изображение №1
Рис. 35 Сумма тангенциальных проекций по всей окружности для тестового изображения №3
Создание и исследование системы распознаваний форм микрообъектов (на примере кристаллограмм)