음성인식과 영상인식 - 교육 레포트

본 자료는 4페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.

해당 자료는 4페이지 까지만 미리보기를 제공합니다.
4페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

음성인식과 영상인식에 대한 보고서 자료입니다.

본문내용

러 가지 오퍼레이타에 의하여 이루어진다. 이러한 오퍼레이터는 크게 다음의 2가지로 구분지을 수 있다.
(1) 1차 또는 2차 미분 방법에 의한 표면 명암도의 근사화 방법(Roberts 1965 ; MacLeod 1970 ; Marr and Hildreth 1980 ; Canny 1983)
(2) 윤곽점 모델의 매개변수 계산에 의한 방법(Hueckel 1971 ; Haralick 1980)
윤곽점은 대체로 명암도 구배의 방향 또는 크기에 의하여 구한다. 윤곽점은 흔히 픽셀로 나타낸다. 윤곽선의 방향은 영상 명암도가 가장 급격히 변화하는 방향으로 삼는다.
윤곽선은 전기신호로 변화된 강강도에 의하여 구하므로 잡영(noise)에 매우 민감하다. 이러한 잡영은 영상 신호의 입력과정에서 여러 가지 원인에 의하여 무작위적으로 발생한다. 잡영상은 윤곽선 검출작업 전후에 보완적인 방법으로 제거한다. 여기에는 다양한 기법이 동원된다. 윤곽선 검출 작업전의 잡영 제거는 여러 가지 영상 필터에 의하여 이루어진다. 윤곽선 검출 후의 잡영 제거는 역치 방법과 같은 간단한 기법으로부터 경계선의 주변 분석기법 등에 걸쳐 다양하다.
윤곽점 검출의 출력은 선분이나 곡선과 같은 경계선 형성 과정의 입력이 된다. 윤곽점들의 국소적 특성이나 가정된 모형의 전역적 특성 등을 고려하여 경계선을 형성한다. 경계선 형성과정은 윤곽점 추적(contour follwing)과 같은 재래식 방법으로부터 다이나믹 프로그래밍(dynamic programming)에 이르기까지 다양하다. 경계선 형성과정의 결과로 얻어지는 것은 주어진 규칙을 만족하는 윤곽점의 집합이거나 또는 신분이나 곡선에 적합시킨 수식이 될 수 있다. 특수한 경우에는 Hough 변환과 같은 도형적 방법을 이용할 수 있다. Hough 변환에 의하면 선분, 원, 또는 타원형 모양의 윤곽선을 추출할 수 있다.
Burns(1984) 등은 전역적 선분 추출(global line extraction)을 하는 다른 방안을 제시하였다. 국소적 윤곽점을 구하는 대신 픽셀에서는 광강도 표면의 방향을 산출하고 그 방향이 브슷한 것들을 동일영역으로 그룹짓는다.
이러한 과정을 거친 후에 필터 조작에 의하여 원하는 선들을 골라낼 수 있다. 예를 들면 짧고 대비가 뚜렷한 선분이나 길고 곧바른 직선의 선택 등이 가능하다. 이 방법은 일반적 곡선식(conic section)에로 확장시킬 수 있다.
계층적 구조에 의한 영역 분할법도 제시된 바 있다. 사분목법(quadtree)은 Samet(1980)에 의하여 제안되었는데 이는 영상배열의 계층적 코딩법 중의 하나이다. Weiss 등은 Laplacian의 영치 교차점으로부터 직선을 추출하는 계층적 그룹 형성 방법을 제시하였다.
3.4 깊이정보(Depth information)의 산출
물체 표면의 고저(高抵) 정보를 깊이정보라고 부른다. 이는 두 대의 카메라를 이용하는 스테레오 시각기법이나 광학적 흐름(optic flow) 또는 초점 적응 방법등에 의하여 구할 수 있다.
한 대의 카메라에 맺히는 영상은 다른 카메라에 맺히는 영상과 약간의 차이가 있다. 이 차이는 거리계산에 매우 중요한 요소가 된다.
Julesz(1971)는 무작위적인 흑백 무늬에 대한 스테레오 영상을 가지고 실험한 바 있다. 같은 무늬가 양쪽 카메라 영상에 맺히나 조금 변위되어 나타나며 이 점을 깊이정보 산출에 이용하였다. 그는 또한 생물체의 시각에서 패턴 인식 이전에 깊이에 대한 인식이 먼저 일어난다고 주장함으로써 종래의 관념을 반박하였다.
i) 신경망에 의한 깊이정보
두뇌에 관한 이론을 연구하는 학자들은 깊이정보와 관련하여 다음과 같은 논술을 한 바 있다. Arbib(1974) 등은 신경망 회로의 협력적 계산(cooperative computation) 구조를 만들고 깊이정보 맵(map)을 산출하였다. 이는 우리의 시각계가 비교적 적은 수의 연결 영역(connected region)으로 구성되었다는 가설에서 출발하였다. 이 신경망 회로의 셀은 한점이 공간상의 실제 위치와 일치한다고 판단될 때에 격발(firing) 되도록 유도된다. 뉴런들은 금지뉴런(inhibitory interneurons)들을 경유하도록 연결되어 있어서 비슷한 깊이정보일 때는 격발되고 상이한 깊이정보에 대하여는 금지하도록 동작된다. 이러한 모델은 Sperling(1970), Nelson(1975) 등에 의하여 제안되었다. 이러한 시스템이 시각적 입력을 연결된 영역으로 분할시킬 수 있다는 사실은 Dev(1975)에 의하여 컴퓨터 시뮬레이션된 바 있고 Amari와 Arbib(1977)에 의하여 수학적으로 분석된 바 있다. 나중에 Prazdny(1985)에 의하여 개발된 모델은 금지 뉴런을 별도로 포함시키지 않고 있다.
ii) 스테레오시각에 의한 깊이정보
스테레오시각에 의한 깊이정보의 계산은 대개 2단계로 진행된다. 첫째 단계는 두 영상에서 선택된 것들이 대응관계(correspondence)를 가지는가를 판단하고 그 점에서의 깊이정보를 계산하는 일이다. 둘째 단계는 보간법 등을 적용하여 영상의 모든 점에 구하고 또 그것을 이용하여 3차원 공간의 표면을 기술하는 일이다.
대응관계
대응관계의 문제를 푸는 일반적 방법은 명암도에 기초한 방법과 토큰에 기초한 방법으로 구분지을 수 있다. 명암도에 기초한 대응관계 해결책은 2개의 영상에서 반사된 빛의 강도가 유사한가를 검토하는데 주안점이 있다 . 토큰에 기초한 방법은 두 영상에서 쉽게 분별할 수 있는 구조체를 추출하여 정합(match) 여부를 판정하는 방법이다.
명암도에 기초한 방법의 예로서Anandan(1984), Weiss(1985) Gennery(1980) 등에 의하여 시도된 상관관계(correlation)법을 들 수 있다. 첫 번째 영상의 관심있는 점을 선택하고 그 주위의 픽셀들을 선택하여 이를 표본창(sample window)이라 한다. 다른 영상에서 표본창과 같은 크기의 픽셀들을 선택하고 이를 탐색대상창(target window)이라 한다. 표본창과 탐색대상창과의 상호 상관관계를 구한다. 이 상관계수가 최대가 되는 지점을 구하여 대응점으로 인정한다. 상관계수를

키워드

전산개론, 음성인식, 연상인식, 하부시각, 상부시각, 학점닷컴

소개글

목차

본문내용

키워드

추천자료