Describe 논문번역/2012년스터디/신형준 here
번역1 ¶
자발적인 손으로 쓴 글자인식에 대한 실험
1. 요약
자필 글자 인식에 대한 체제가 발표됬다. 이 체제는 자유 분할 접근에 의한 특성을 가지고 있는데, 전체 문서의 한줄이 인식모듈에 의해 처리되어 진다는 의미를 가지고 있다. 전처리, 특징추출, 그리고 통계적 모형화에 있어 사용되는 방법이 소개되어 있고, 인식 주제(문서) 들을 자필로 하는 독립된 작가, 다수의 작가, 그리고 혼자쓰는 작가에 대한 몇몇의 실험들이 실행되었다.
특히, 선형판별인식, 이서 문자 모델, 그리고 통계적 언어 지식의 설립에 내용이 조사되어 있다. 어휘가 자유로운 자필인식에 대한 평가 결과들은 제안된 방법들이 효과적임을 보여준다.
2. 소개
특히, 선형판별인식, 이서 문자 모델, 그리고 통계적 언어 지식의 설립에 내용이 조사되어 있다. 어휘가 자유로운 자필인식에 대한 평가 결과들은 제안된 방법들이 효과적임을 보여준다.
패턴 인식의 도전 영역은 자필 문서 인식에 있다. 지금까지 대다수의 자필 인식 시스템은 우편 주소를 읽거나 은행 수표와 같은 형태들을 처리하는데 사용됬다. 반면에 이 시스템은 분리된 문자 또는 단어에 대해서 한계를 가지고 있는데, 오직 구속되지 않은 자필 문서의 인식에 대한 많지 않은 시스템 만이 존재했다. 이와 같은 수행의 증가된 복잡성 때문에, 문자의 부재 혹은 단어의 경계 정보, 거기에 크거나 심지어 한계가 없는 단어들에 의해 특징지어진다.
그럼에도 불구하고, 자필을 인식하는 일에 대해 기술들을 더 조사하는 건 가치가 있다. 왜냐하면 컴퓨터 성능의 향상이 더 복잡한 처리과정을 할 수 있게 해주었기 때문이다.
이 에세이에서 HMM에 기반한 어휘에 자유로운 필기 인식에 대한 시스템이 설명되어 있고, 영어로만 이루어진 문장 데이터 베이스에서 몇몇의 실험들이 필기자에 독립된 형태, 또한 다수와 개인 작가 형태에 대해서 비교하기 위해 실행되었다.
전처리 과정과 특징추출에 대한 방법이 묘사되었다. 그리고 게다가 선형 판별 해석, 이서 특징 모델들의 사용, 그리고 통계적인 언어 모델들과 같은 더 세련된 기술들을 살피게 될 것이다.
다음 부분에서 우리는 오프라인 필기인식에 관련된 일의 짧은 보고서를 볼 수 있다. 우리가 사용하는 데이터베이스는 section 3에서 소개되어질 것이다.
그후에 우리는 그다음 section들에서 전처리 과정 단계, 특징 추출에 대한 방법, 그리고 통계적 모델링과 인식을 이용한 기술들을 묘사한다. 제안된 방법들의 효율성을 입증하기 위한 평가결과는 section 7에 있다.
그럼에도 불구하고, 자필을 인식하는 일에 대해 기술들을 더 조사하는 건 가치가 있다. 왜냐하면 컴퓨터 성능의 향상이 더 복잡한 처리과정을 할 수 있게 해주었기 때문이다.
이 에세이에서 HMM에 기반한 어휘에 자유로운 필기 인식에 대한 시스템이 설명되어 있고, 영어로만 이루어진 문장 데이터 베이스에서 몇몇의 실험들이 필기자에 독립된 형태, 또한 다수와 개인 작가 형태에 대해서 비교하기 위해 실행되었다.
전처리 과정과 특징추출에 대한 방법이 묘사되었다. 그리고 게다가 선형 판별 해석, 이서 특징 모델들의 사용, 그리고 통계적인 언어 모델들과 같은 더 세련된 기술들을 살피게 될 것이다.
다음 부분에서 우리는 오프라인 필기인식에 관련된 일의 짧은 보고서를 볼 수 있다. 우리가 사용하는 데이터베이스는 section 3에서 소개되어질 것이다.
그후에 우리는 그다음 section들에서 전처리 과정 단계, 특징 추출에 대한 방법, 그리고 통계적 모델링과 인식을 이용한 기술들을 묘사한다. 제안된 방법들의 효율성을 입증하기 위한 평가결과는 section 7에 있다.
번역2 ¶
1.3 벡터 방정식
선형 연립 방정식의 중요한 특성들은 벡터들의 개념과 표시법에 의해 묘사되어 질 수 있습니다. 이 부분에서는 벡터들과 평범한 방정식들의 연립들이 연관된 방정식들을 연결해 줍니다. 이 백터라는 용어는 다양한 수학적이고 물리적인 문맥(우리가 Chapter 4, “백터 공간”에서 논의할)을 나타냅니다. 그때까지, 벡터는 숫자들의 정렬된 목록으로 써 의미를 가집니다. 이 간단한 생각은 우리에게 흥미롭고 중요한 적용들을 가능한 빠르게 얻게 도와줍니다.
R^2에서의 벡터들오직 하나의 열만을 가진 행렬을 열 벡터 또는 간단히 벡터라고 부름니다. u,v,w는 두개의 entry를 가진 벡터들의 예 입니다. (w1과 w2는 실수). 두개의 entry를 지닌 모든 벡터들의 집합을 R^2라고 나타냅니다. 이 R은 벡터에서 entry들이 실수라는 걸 의미하고, 지수 2는 각각의 벡터들이 두개의 entry를 가지고 있다는걸 의미합니다.
두개의 벡터에서 대응되는 entry들이 같을 때 두 벡터들(R^2에 있는)이 같다라고 합니다.
이와 같이 (4,7)과 (7,4)는 R^2에 있는 벡터들이 정돈된 실수들의 쌍이기 때문에 같지 않습니다.
R^2에 있는 주어진 두개의 백터 u와 v에 대해서 그들의 합 즉, 벡터 u+v는 u와 v의 대응하는 entry들을 각 각 더함으로 얻어집니다. 예를 들어
(1,-2) + (2,5) = (1+2,-2+5) = (3,3)
주어진 벡터 u과 실수 c에 대해서 c에 대한 u의 스칼라 곱은 u의 각 각 의 entry에 c를 곱함으로 써 얻어진 cu벡터 입니다.Cu에서 c를 스칼라 라고 부릅니다. 이것은 획이 가는 활자의 형태로 쓰여집니다. (벡터 u를 나타내는 볼드체 활자로부터 구별하기 위해서)
스칼라 곱과 벡터 합의 연사자들은 다음의 예에서 처럼 결합될 수 있습니다.
Example 1(p.25)
스칼라 곱과 벡터 합의 연사자들은 다음의 예에서 처럼 결합될 수 있습니다.
Example 1(p.25)
R^2의 기하학 적인 묘사
평면에서 사각 좌표 시스템을 간주해봅시다. 이 평면에서 각각의 점은 정렬된 숫자들의 쌍으로 결정되기 때문에 우리는 기하학적인 점 (a,b)를 열 벡터로 인식할 수 있습니다.
그래서 우리는 R^2를 이 평면에서의 모든 점들의 집함으로 간주 할 수 있습니다.
Fig1을 보자.
평면에서 사각 좌표 시스템을 간주해봅시다. 이 평면에서 각각의 점은 정렬된 숫자들의 쌍으로 결정되기 때문에 우리는 기하학적인 점 (a,b)를 열 벡터로 인식할 수 있습니다.
그래서 우리는 R^2를 이 평면에서의 모든 점들의 집함으로 간주 할 수 있습니다.
Fig1을 보자.