Программа распознавания символов

Программа распознавания символов

Белорусский Государственный Университет Информатики и Радиоэлектроники.

Контрольная работа

по дисциплине

«МАГИ»

«Программа распознавания символов»

Выполнил студент группы 500501

Балахонов Е.В.

Задание.

Требуется написать программу, способную распознавать графически

представленные символы в виде растрового изображения и преобразовывать в

обычный текст.

- платформа: Win32,

- формат графического изображения: Windows Bitmap (BMP), 8 бит,

- шрифт для распознавания: Arial, 16

Выбор средств разработки.

В качестве среды разработки будет использоваться Borland C++ Builder

5.

Распознавание символов.

Этап 1. Выделение контура объекта, определение его границ.

В качестве алгоритма выделения контуров будем использовать алгоритм

жука.

Общее описание алгоритма.

Отслеживающие алгоритмы основаны на том, что на изображении

отыскивается объект (первая встретившаяся точка объекта) и контур объекта

отслеживается и векторизуется. Достоинством данных алгоритмов является их

простота, к недостаткам можно отнести их последовательную реализацию и

некоторую сложность при поиске и обработке внутренних контуров. Пример

отслеживающего алгоритма - "алгоритма жука" - приведен на рис. 5.12. Жук

начинает движение с белой области по направлению к черной, Как только он

попадает на черный элемент, он поворачивает налево и переходит к следующему

элементу. Если этот элемент белый, то жук поворачивается направо, иначе -

налево. Процедура повторяется до тех пор, пока жук не вернется в исходную

точку. Координаты точек перехода с черного на белое и с белого на черное и

описывают границу объекта.

На рис. 1 показана схема работы такого алгоритма.

[pic]

Рис. 1. Схема работы отслеживающего алгоритма «жука».

Этап 2. Построение на основе контура объекта скелетной линии.

При нахождении новой точки контура, рассчитывается расстояние между

предыдущей найденной точкой и новой. Если оно превышает некоторую границу

(по умолчанию в 5 единиц), она запоминается. К концу построения скелетной

линии программа имеет массив координат вершин ломаной, которая является

скелетной линией объекта.

Этап 3. Сравнение полученной скелетной линии с списком шаблонов.

После построения скелетной линии производится сравнение ее с списком

шаблонов известных символов. При нахождении совпадения, программа

записывает в строку найденный символ.

Исходный текст программы.

//--------------------------------------------------------------------------

-

#include

#pragma hdrstop

#include

#include

#include "ChildFormUnit.h"

#include "MainFormUnit.h"

#include "AverageFilterDialogFormUnit.h"

#include "OSRFormUnit.h"

//--------------------------------------------------------------------------

-

#pragma package(smart_init)

#pragma resource "*.dfm"

TChildForm *ChildForm;

TTemplates Templates;

//--------------------------------------------------------------------------

-

__fastcall TChildForm::TChildForm(TComponent* Owner)

: TForm(Owner)

{

}

//--------------------------------------------------------------------------

-

bool __fastcall TChildForm::LoadImage(AnsiString FileName)

{

try

{

Image1->Picture->LoadFromFile(FileName);

}

catch (EInvalidGraphic& Exception)

if (Image1->Picture->Bitmap->PixelFormat != pf8bit)

return true;

}

//--------------------------------------------------------------------------

-

void __fastcall TChildForm::FormClose(TObject *Sender,

TCloseAction &Action)

{

MainForm->DeleteActiveChildForm();

}

//--------------------------------------------------------------------------

-

void __fastcall TChildForm::AverageFilter()

{

AverageFilterDialogForm = new TAverageFilterDialogForm(this);

if (AverageFilterDialogForm->ShowModal() == mrCancel)

{

delete AverageFilterDialogForm;

return;

}

int Value = atoi(AverageFilterDialogForm->Edit1->Text.c_str());

delete AverageFilterDialogForm;

Byte* PrevisionLine = NULL;

Byte* CurrentLine = NULL;

Byte* NextLine = NULL;

int I = 0, J = 0;

int Summ = 0;

for (I = 0; I Picture->Bitmap->Height - 1; I++)

{

CurrentLine = (Byte*)Image1->Picture->Bitmap->ScanLine[I];

for (J = 0; J Picture->Bitmap->Width - 1; J++)

{

Summ = 0;

if (I > 0)

{

PrevisionLine = (Byte*)Image1->Picture->Bitmap->ScanLine[I - 1];

if (J > 0)

{

Summ += PrevisionLine[J - 1];

}

Summ = Summ + PrevisionLine[J];

if (J + 1 < Image1->Picture->Bitmap->Width)

{

Summ += PrevisionLine[J + 1];

}

}

if (J > 0)

{

Summ += CurrentLine[J - 1];

}

Summ += CurrentLine[J];

if (J + 1 < Image1->Picture->Bitmap->Width)

{

Summ += CurrentLine[J + 1];

}

if (I + 1 < Image1->Picture->Bitmap->Height)

{

NextLine = (Byte*)Image1->Picture->Bitmap->ScanLine[I + 1];

if (J > 0)

{

Summ += NextLine[J - 1];

}

Summ += NextLine[J];

if (J + 1 < Image1->Picture->Bitmap->Width)

{

Summ += NextLine[J + 1];

}

}

if ((int)(Summ / 9) Visible = false;

Image1->Visible = true;

}

//--------------------------------------------------------------------------

-

// Расстояние между двумя точками

int Distance(TVertex& V1, TVertex& V2)

{

int a = abs(V1.Y - V2.Y);

int b = abs(V1.X - V2.X);

return sqrt(a*a + b*b);

}

//--------------------------------------------------------------------------

-

void __fastcall TChildForm::OSR()

{

// Пороговое расстояние для простроения упрощенной фигуры

const int Treshold = 5;

// Сюда сохраняется результат распознования

AnsiString Result;

// Отладочная форма с изображением для работы

OSRForm = new TOSRForm(this);

// Направления движения жука

typedef enum {North, East, South, West} TDirectional;

TDirectional Direct;

// Координаты первой встречи с текущим объектом

int X,Y;

// Временно их используем для задания нового размера рабочего изображения

X = OSRForm->Width - OSRForm->Image1->Width;

Y = OSRForm->Height - OSRForm->Image1->Height;

OSRForm->Image1->Picture->Bitmap->Assign(Image1->Picture->Bitmap);

OSRForm->Width = OSRForm->Image1->Width + X;

OSRForm->Height = OSRForm->Image1->Height + Y;

OSRForm->Image1->Canvas->Rectangle(0, 0, OSRForm->Image1->Width - 1,

OSRForm->Image1->Height - 1);

Graphics::TBitmap* FromImage = Image1->Picture->Bitmap;

Graphics::TBitmap* ToImage = OSRForm->Image1->Picture->Bitmap;

// Текущие координаты маркера

int cX,cY;

// Максимальные координаты, которые занимает фигура

int MaxX = 0;

int MaxY = FromImage->Height;

// От этой координаты начинается новое сканирование по Y

int BeginY = 0;

// Обрабатываемые линии

Byte *Line, *ToLine;

char Symb = 'А';

// Текущий байт

Byte B = 0;

bool SkipMode = false;

while (true)

{

// Список координат текущего объекта

TShapeVector ShapeVector;

// Временная структура координат точки

TVertex Vertex;

// Поиск любого объекта

// Идем до тех пор, пока не встретим черную область

for (X = MaxX; X < FromImage->Width; X++)

{

for (Y = BeginY; Y < MaxY; Y++)

{

Line = (Byte*)FromImage->ScanLine[Y];

if (Line[X] < 255)

goto FindedLabel;

}

if ((X + 1 == FromImage->Width) && (Y == FromImage->Height))

{

X++;

goto FindedLabel;

}

// Если прошли до самого правого края, расширяем границы поиска до низа

if (X + 1 == FromImage->Width)

{

X = 0;

MaxX = 0;

BeginY = MaxY;

MaxY = FromImage->Height;

}

}

FindedLabel:

// Если не нашли ни одного черного пиксела, то выходим из процедуры

if ((X == FromImage->Width) && (Y == FromImage->Height))

break;

// Сначала задача найти максимальные границы обнаруженной фигуры,

// чтобы потом от нее начинать строить скелет

// Также ищем самую верхнюю точку фигуры, для начала построения

int MinX = Image1->Picture->Width; // Самая левая координата

MaxX = 0;

MaxY = 0;

// Самая верхняя точка

TVertex TopPoint;

TopPoint.Y = Image1->Picture->Height;

// Поворачиваем налево (новое направление - север)

cX = X;

cY = Y - 1;

Direct = North;

Line = (Byte*)FromImage->ScanLine[cY];

// Пока не придем в исходную точку, выделяем контур объекта

while ((cX != X) || (cY != Y))

{

// В зависимости от текущего направления движения жука

switch (Direct)

{

// Север

case North:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

Direct = West;

cX--;

// Может это самая левая координата?

if (MinX > cX)

MinX = cX;

}

// Иначе поворачиваем "направо"

else

{

Direct = East;

cX++;

if (MaxX < cX)

MaxX = cX;

}

}

break;

// Восток

case East:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

Direct = North;

cY--;

Line = (Byte*)FromImage->ScanLine[cY];

// Может это самая верхняя точка?

if (TopPoint.Y > cY)

{

TopPoint.Y = cY;

TopPoint.X = cX;

}

}

// Иначе поворачиваем "направо"

else

{

Direct = South;

cY++;

Line = (Byte*)FromImage->ScanLine[cY];

if (MaxY < cY)

MaxY = cY;

}

}

break;

// Юг

case South:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

Direct = East;

cX++;

if (MaxX < cX)

MaxX = cX;

}

// Иначе поворачиваем "направо"

else

{

Direct = West;

cX--;

// Может это самая левая координата?

if (MinX > cX)

MinX = cX;

}

}

break;

// Запад

case West:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

Direct = South;

cY++;

Line = (Byte*)FromImage->ScanLine[cY];

if (MaxY < cY)

MaxY = cY;

}

// Иначе поворачиваем "направо"

else

{

Direct = North;

cY--;

Line = (Byte*)FromImage->ScanLine[cY];

// Может это самая верхняя точка?

if (TopPoint.Y > cY)

{

TopPoint.Y = cY;

TopPoint.X = cX;

}

}

}

}

}

TopPoint.X++;

if ((!TopPoint.X) && (!TopPoint.Y))

{

TopPoint.X = X;

TopPoint.Y = Y;

}

else

{

X = TopPoint.X;

Y = TopPoint.Y;

}

// Постройка скелета

ToLine = (Byte*)ToImage->ScanLine[Y];

ToLine[X] = 0;

// Поворачиваем налево (новое направление - юг)

cX = X;

cY = Y;

Vertex.X = X;

Vertex.Y = Y;

ShapeVector.push_back(Vertex);

Direct = East;

Line = (Byte*)FromImage->ScanLine[cY];

// Пока не придем в исходную точку, выделяем контур объекта

do

{

// В зависимости от текущего направления движения жука

switch (Direct)

{

// Север

case North:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

ToLine = (Byte*)ToImage->ScanLine[cY];

ToLine[cX] = 0;

Vertex.X = cX;

Vertex.Y = cY;

if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >=

Treshold)

ShapeVector.push_back(Vertex);

Direct = West;

cX--;

}

// Иначе поворачиваем "направо"

else

{

Direct = East;

cX++;

}

}

break;

// Восток

case East:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

ToLine = (Byte*)ToImage->ScanLine[cY];

ToLine[cX] = 0;

Vertex.X = cX;

Vertex.Y = cY;

if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >=

Treshold)

ShapeVector.push_back(Vertex);

Direct = North;

cY--;

Line = (Byte*)FromImage->ScanLine[cY];

}

// Иначе поворачиваем "направо"

else

{

Direct = South;

cY++;

Line = (Byte*)FromImage->ScanLine[cY];

}

}

break;

// Юг

case South:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

ToLine = (Byte*)ToImage->ScanLine[cY];

ToLine[cX] = 0;

Vertex.X = cX;

Vertex.Y = cY;

if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >=

Treshold)

ShapeVector.push_back(Vertex);

Direct = East;

cX++;

}

// Иначе поворачиваем "направо"

else

{

Direct = West;

cX--;

}

}

break;

// Запад

case West:

{

B = Line[cX];

// Если элемент "черный", поворачиваем снова "налево"

if (B < 255)

{

ToLine = (Byte*)ToImage->ScanLine[cY];

ToLine[cX] = 0;

Vertex.X = cX;

Vertex.Y = cY;

if (Distance(Vertex, ShapeVector[ShapeVector.size() - 1]) >=

Treshold)

ShapeVector.push_back(Vertex);

Direct = South;

cY++;

Line = (Byte*)FromImage->ScanLine[cY];

}

// Иначе поворачиваем "направо"

else

{

Direct = North;

cY--;

Line = (Byte*)FromImage->ScanLine[cY];

}

}

}

} while ((cX != X) || (cY != Y));

Vertex.X = X;

Vertex.Y = Y;

ShapeVector.push_back(Vertex);

ToImage->Canvas->Pen->Color = clRed;

ToImage->Canvas->MoveTo(ShapeVector[0].X, ShapeVector[0].Y);

for (UINT i = 1; i < ShapeVector.size(); i++)

{

ToImage->Canvas->LineTo(ShapeVector[i].X, ShapeVector[i].Y);

}

for (UINT i = 0; i < ShapeVector.size(); i++)

{

ShapeVector[i].X -= MinX;

ShapeVector[i].Y -= Y;

}

/*

if (Symb == 'Й')

{

Symb++;

}

if (Symb == 'а')

{

// Symb = 'A';

break;

}

if ((Symb != 'Ы') && (!SkipMode))

{

AnsiString FileName = ExtractFilePath(Application->ExeName) + "TPL\\";

FileName += Symb;

ofstream OutFile(FileName.c_str());

for (UINT i = 0; i < ShapeVector.size(); i++)

{

OutFile Symb;

}

//OSRForm->Show();

delete OSRForm;

Memo1->Text = Result;

}

//--------------------------------------------------------------------------

-

TTemplate* FindTemplate(TShapeVector Vec)

{

TTemplate Template;

Template.Vec = Vec;

for (UINT i = 0; i < Templates.size(); i++)

{

if (Templates[i] == Template)

return &Templates[i];

}

return NULL;

}

//--------------------------------------------------------------------------

-

Снапшоты программы.

Начало работы

[pic]

Произведено распознавание.

[pic]