U E D R , A S I H C RSS

논문번역/2012년스터디/신형준

Describe 논문번역/2012년스터디/신형준 here

번역1


자발적인 손으로 쓴 글자인식에 대한 실험

1. 요약

자필 글자 인식에 대한 체제가 발표됬다. 이 체제는 자유 분할 접근에 의한 특성을 가지고 있는데, 전체 문서의 한줄이 인식모듈에 의해 처리되어 진다는 의미를 가지고 있다. 전처리, 특징추출, 그리고 통계적 모형화에 있어 사용되는 방법이 소개되어 있고, 인식 주제(문서) 들을 자필로 하는 독립된 작가, 다수의 작가, 그리고 혼자쓰는 작가에 대한 몇몇의 실험들이 실행되었다.
특히, 선형판별인식, 이서 문자 모델, 그리고 통계적 언어 지식의 설립에 내용이 조사되어 있다. 어휘가 자유로운 자필인식에 대한 평가 결과들은 제안된 방법들이 효과적임을 보여준다.

2. 소개

패턴 인식의 도전 영역은 자필 문서 인식에 있다. 지금까지 대다수의 자필 인식 시스템은 우편 주소를 읽거나 은행 수표와 같은 형태들을 처리하는데 사용됬다. 반면에 이 시스템은 분리된 문자 또는 단어에 대해서 한계를 가지고 있는데, 오직 구속되지 않은 자필 문서의 인식에 대한 많지 않은 시스템 만이 존재했다. 이와 같은 수행의 증가된 복잡성 때문에, 문자의 부재 혹은 단어의 경계 정보, 거기에 크거나 심지어 한계가 없는 단어들에 의해 특징지어진다.
그럼에도 불구하고, 자필을 인식하는 일에 대해 기술들을 더 조사하는 건 가치가 있다. 왜냐하면 컴퓨터 성능의 향상이 더 복잡한 처리과정을 할 수 있게 해주었기 때문이다.
이 에세이에서 HMM에 기반한 어휘에 자유로운 필기 인식에 대한 시스템이 설명되어 있고, 영어로만 이루어진 문장 데이터 베이스에서 몇몇의 실험들이 필기자에 독립된 형태, 또한 다수와 개인 작가 형태에 대해서 비교하기 위해 실행되었다.
전처리 과정과 특징추출에 대한 방법이 묘사되었다. 그리고 게다가 선형 판별 해석, 이서 특징 모델들의 사용, 그리고 통계적인 언어 모델들과 같은 더 세련된 기술들을 살피게 될 것이다.
다음 부분에서 우리는 오프라인 필기인식에 관련된 일의 짧은 보고서를 볼 수 있다. 우리가 사용하는 데이터베이스는 section 3에서 소개되어질 것이다.
그후에 우리는 그다음 section들에서 전처리 과정 단계, 특징 추출에 대한 방법, 그리고 통계적 모델링과 인식을 이용한 기술들을 묘사한다. 제안된 방법들의 효율성을 입증하기 위한 평가결과는 section 7에 있다.

번역2

1.3 벡터 방정식

선형 연립 방정식의 중요한 특성들은 벡터들의 개념과 표시법에 의해 묘사되어 질 수 있습니다. 이 부분에서는 벡터들과 평범한 방정식들의 연립들이 연관된 방정식들을 연결해 줍니다. 이 백터라는 용어는 다양한 수학적이고 물리적인 문맥(우리가 Chapter 4, “백터 공간”에서 논의할)을 나타냅니다. 그때까지, 벡터는 숫자들의 정렬된 목록으로 써 의미를 가집니다. 이 간단한 생각은 우리에게 흥미롭고 중요한 적용들을 가능한 빠르게 얻게 도와줍니다.

R^2에서의 벡터들
오직 하나의 열만을 가진 행렬을 열 벡터 또는 간단히 벡터라고 부름니다. u,v,w는 두개의 entry를 가진 벡터들의 예 입니다. (w1과 w2는 실수). 두개의 entry를 지닌 모든 벡터들의 집합을 R^2라고 나타냅니다. 이 R은 벡터에서 entry들이 실수라는 걸 의미하고, 지수 2는 각각의 벡터들이 두개의 entry를 가지고 있다는걸 의미합니다.
두개의 벡터에서 대응되는 entry들이 같을 때 두 벡터들(R^2에 있는)이 같다라고 합니다.
이와 같이 (4,7)과 (7,4)는 R^2에 있는 벡터들이 정돈된 실수들의 쌍이기 때문에 같지 않습니다.
R^2에 있는 주어진 두개의 백터 u와 v에 대해서 그들의 합 즉, 벡터 u+v는 u와 v의 대응하는 entry들을 각 각 더함으로 얻어집니다. 예를 들어
(1,-2) + (2,5) = (1+2,-2+5) = (3,3)
주어진 벡터 u과 실수 c에 대해서 c에 대한 u의 스칼라 곱은 u의 각 각 의 entry에 c를 곱함으로 써 얻어진 cu벡터 입니다.

Cu에서 c를 스칼라 라고 부릅니다. 이것은 획이 가는 활자의 형태로 쓰여집니다. (벡터 u를 나타내는 볼드체 활자로부터 구별하기 위해서)
스칼라 곱과 벡터 합의 연사자들은 다음의 예에서 처럼 결합될 수 있습니다.
Example 1(p.25)

R^2의 기하학 적인 묘사
평면에서 사각 좌표 시스템을 간주해봅시다. 이 평면에서 각각의 점은 정렬된 숫자들의 쌍으로 결정되기 때문에 우리는 기하학적인 점 (a,b)를 열 벡터로 인식할 수 있습니다.
그래서 우리는 R^2를 이 평면에서의 모든 점들의 집함으로 간주 할 수 있습니다.
Fig1을 보자.

(3,1)과 같은 벡터들의 기하학적인 시각화는 종종 원점에서부터 점 (3,-1)까지의 화살표를 포함함으로써 도와줍니다. (Fig2에서)
이같은 경우에 개인적인 점들(화살표 그것 스스로에 대해서)은 특별한 중요성을 가지고 있지 않습니다.
두 벡터들의 합은 유용한 기하학적 표시법을 가지고 있습니다. 북석적인 기하학구조에 의해 앞의 규칙이 학인되어 질 수 있습니다.

합에 대한 평행사변형 규칙
만약 R^2에있는 u와 v가 평면상에서 점들로 표현된다면, 그때 u+v는 평행사변형의 제 4의 꼭짓점에 대응한다.(다른 벡터들은 u,0, 그리고 v) Fig 3를 보자

Example 2

Example 3

R^3에서 벡터들
R^3에서 벡터들은 세개의 entry를 지는 3x1 열 행렬들이다. 그들은 기하학적으로 삼차원 좌표 공간에 있는 때때로 시각적으로 명확성을 포함하는 원점으로 부터의 화살표들을 가진 점들로 나타내 집니다. a와 2a 벡터들은 Fig 6 에서 처럼 나타내집니다.

R^n에서 벡터들
만약 n이 양수라면, R^n은 모든 n개의 정렬된 실수들의 목록들의 집합으로 표시됩니다. (보통 u처럼 nx1열 행렬들로서 쓰여지는)
모든 entry가 0인 벡터를 영 벡터라고 하고, 0이라고 표기합니다. (0 벡터에서 entry의 수는 맥락으로 부터 명확해 질 것입니다.)
R^n에서의 같음과 스칼라 곱과 벡터 합 의 연산자들은 R^2에서 와 같이 entry와 entry에 대응하여 정의되어 집니다. 이 벡터들에 대한 연산자들은 실수에대한 대응하는 속성들로부터 직접적으로 증명할 수 있는 다음의 속성들을 가집니다. Practice Problem 1과 Exercises 33 그리고 34 (이 섹션 마지막에 있는) 을 보십시오.

R^n에서의 대수적인 속성
(i) u+v = v+u
(ii) (u+v)+w = u+(v+w)
(iii) u + 0 = 0 + u = u
(iv) u+(-u) = -u + u = 0 (-u는 (-1)u를 나타냄)
(v) c(u+v) = cu+ cv
(vi) (c+d)u = cu + du
(vii) c(du) = (cd)u
(viii) 1u = u

표기법의 간력성을 위해 u+(-1)v와 같은 벡터는 종종 u-v로써 쓰입니다. Fig 7은 u-v가 u와 -v의 합으로써 보여줍니다.

선형 결합
R^n에서 v1,v2,.....,vp 의 주어진 벡터와 주어진 스칼라들 c1,c2,....,cp에 대해서, 벡터 y는 y = c1v1+ .... + cpvp로써 정의되어 집니다.
그리고 이것은 c1,...cp의 weights를 같는 v1,..,vp의 선형결합이라고 불려집니다. 이와 같은 선형결합을 실행할때, 위의 속성 (ii)는 우리에게 괄호를 누락시키는걸 허용해줍니다. 선형결합에서 weights는 0을 포함한 어느 실수라도 될 수 있습니다. 예를들어 벡터 (p28의 벡터 3개) v1과 v2의 몇몇의 선형결합과 같이 나타낼 수 있습니다.

Example 4

Example 5

Example 5를 보면,a1,a2,b 벡터들은 첨가된 행령의 열들인걸 알 수 있습니다. 간결 성을 위해, a1 a2 b라 이것의 열들을 인식하기위한 방법으로 씁니다.
(1)의 백터 방정식으로 부터 즉시 첨가 행렬을 쓰는 방법은 Example 5의 중간의 과정을 통하지 않아도 간결합니다.
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2012-11-22 11:07:55
Processing time 0.0946 sec