U E D R , A S I H C RSS

논문번역/2012년스터디/서민관

는 off-line

abstract
off-line .
모듈 (segmentation-free approach) .
리, , 모델링 , 독립, 복 , .
, (linear discriminant analysis) allograph 문 모델, .
는(lexicon-off) 는 방 .

1.
.
는 대부 off-line 는데 .
, .
방대 .
더 복 리를 볼 만 .

논문 는 off-line Hidden-Markov-Model .
독립 , 몇몇 .
데, , allograph 문 모델, .

.
3 .
, 들, 모델링 .
7 .

2.
off-line .
legal amount reading , 높 . 를 높 2, 8.

리 방대 .
문맥 . 리를 .
.
(feature extract) .
1, 18 15 HMMs recurrent neural network HMMs .
15 , 1, 18 .
off-line 16.

, 9 모듈 는 무(segmentation-free) 방 .
, .
독립 백명 만들 10 11 .
는데, .
, HMMs 모델 는 등 allograph 문 모델 .

3. 말뭉
는 Lancaster-Oslo/Bergen 말뭉 .
독립 뿐만 IAM Bern 대 .
리들(문, , 대 , ) 500명 1200 .
리는 독립 250명 a..f . 6명 만들 c03 부를 .

(Senior)들 .
25 며, .

300dpi 256 .
Fig. 1 를 보.

4.
러를 보 .
.
는 IAM 데 . 는 동 .

리를 .
.
내는 .
는 Otsu method를 .
. .

.
, .
.

리는 , .
는 방 .
.

15 (linear regression)를 . .
, -, - .
는 모 .
(slant angle) .

리는 (local extrema) .
(scaling factor)는 . .
를 보 .
0 255 .
는 말뭉 림 3 .

5.
.
11 sliding window .
4 2 . .

sliding window 7 .
(1) - (window )
(2) (position of the mean value of the intensity distribution)
(3)
(4)
(5)
(6)
(7)
(2)-(5)는 리( line fitting 됨)를 .
window 4 .

뿐만 , 리는 3 .
리는 window 내부 는 4 , . (8), (9), (10) .

문맥 , 리는 물(approximate horizental derivative) . 따 20 .(window 10 + 10 물)

(...) 리는 .(cf. 6)
는 방 (........ original feature representation) .
A는 는 class scatter matrix Sw scatter matrix Sb (eigenvalue) 문 .
scatter matrix들 HMM 리는 . (...........................)
scatter matirx들 LDA 변 .

...

... ...는 S-1wSb .
m m .
LDA 변 HMM .

6. 모델링
, , HMMs ESMERALDA 5 는 방 .
HMMs 리는 512 Gaussian mixtures with diagonal covariance matrices를 codebook - .
모델 52, 10 , 12 , 백 문 Baum-Welch .
모델들 모델 .
Viterbi beam-search 방 .

리 동 리는 13 독립 allograph 모델 .
Allograph는 (realization) .
HMMs 른 문 모델링 .
allograph HMMs (heuristically) . 를 들 allograph .
, 는 무 allograph HMMs .
는 동, 는 allograph 모델들 .
모델 .
allograph soft vector .

, 문 모델 .
는 ... 따르는 x 모델 는 문 W^를 .
P(w)는 문 w x 모델 따를 P(x|w) 모델 .
는 absolute discounting bi-gram 모델 backing-off for smoothing of probability distributions .

7.
리는 . , 복 , 독립 .
table 1 . , 모델 , bi-gram 모델 .
모델 IAM 데 a..d , .
는(lexicon-free ....) 는 table 2 .
(Senior) 데 282 141 . 문 bi-gram perplexity는 15.3.
bi-gram 모델 13.3% 12.1% .
LDA 변 . LDA 변 12 .
(table 2) 28.5%, 1.5k 는 10.5%.
(literature ......) . 만.
17 28.3% . 84.1%, 1.3k 는 16.5%.
15 6.6% 41.1% .
9 는 15.0%.

IAM 데 c03 는 440 , 109 .
6명 .
LDA( 12)를 14.2% . allograph 모델( 6 allograph) 13.3% .
bi-gram 모델 11.1%( perplexity 12.0) 더 낮.
39.0%, 421 (문 )를 13.9%. 11 20.5% .

독립 는데 .
IAM 데 a-f( 250명 ) 는데, 4321 (a-d )는 , 1097 (e-f )는 .
31.3%를 .
독립 allograph 모델 .
3 allograph를 31.1% , 10 allograph 모델 (34.8%) .
만 LDA변 29.1% .
모델 22.2% .( perplexity 12.0)
60.6%.

8. .
리는 는 off-line . , 복 , 독립 몇몇 .
.
는 문 모델 . 독립 .
allograph 문 모델 , 복 , 더 많 .

9. acknowledgement
German Research Foundation(DFG) Fi799/1 를 받.
DB를 .
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2021-02-07 05:28:54
Processing time 0.0610 sec