U E D R , A S I H C RSS

논문번역/2012년스터디/이민석


Warning:
ERROR: LaTeX does not work properly.
in /var/www/html/plugin/processor/latex.php on line 210

  • LaTeX

see also 더 보
coarse 대략,

2012/11/16

  • 「Experiments in Unconstrained Offline Handwritten Text Recognition」 번
  • 1 1 Linear Algebra and Its Applications 1.10, 2.1, 2.2

2012/11/29



Experiments in Unconstrained Offline Handwritten Text Recognition( )



. 모듈 . 리, (feature extraction), 독립, , . (Linear Discriminant Analysis), (allograph) , .

1
. 대부 는 데 . 14 는(unconstrained) . 는 데 방대 . 는, 리를 .
본 논문 마르 , (lexicon)-free 독립 , . , , . . 는 3 . 리, , 모델링 . 7 .

2
. legal amount , . 2 8
방대 . 는 문맥 . . 1, 9, 11, 18, 15, 17 . 마르(HMM) HMM 1, 18 15 . 15 1, 18 료를 . 16 .
9 는, 모듈 는 방 . . 11 백 명 , . . , HMM (LDA) .

3 말뭉(corpus)
Lancaster-Oslo/Bergen 말뭉 . 7 독립 Bern 대 IAM 10 . 데 ( , , , ...)를 500명 1200 . 리는 250명 독립 a..f form c03 .
Senior 15 . 25 .1 256 300dpi . 림 1 .
1 ftp://svr-ftp.eng.cam.ac.uk/pub/data

4
"밀남(drift)" 를 바. 따 . 4 를 IAM 데 는데 .
. (core region)들 . , threshold를 . threshold는 방foreground . threshold는 Otsu 12 . minima를 따 .
. , , (slant) 러났. .
바뀌는 리는 , , . 따 segment들 . 믿 threshold를 .
15 (linear regression)를 , 리edge 방 . 러므 -백 백- 는데 stroke만 . canny edge detector를 edge orientation 료를 . .
(local extrema) . 례(scaling) 는 더 .
리는 . 는 0 255 . 말뭉 리를 림 3 .

5
. sliding window 11 . .
sliding window 7. (1) -백 변 (windowed text image ), (2) , (3) 리, (4) 리, (5) 리, (6) , (7) . (2)-(5)는 core size, ( line fitting ) , 변동 . .
contour contour . 말 리는 lower countour , upper contour , sliding window 내 (8), (9), (10) . (뭔 리) 더 temporal context를 리는 20 . ( 10, 10)
decorrelate 리는 LDA를 . (cf. 6) . A를 (within class scatter) Sw (between class scatter) Sb를 . (scatter) HMM 를 붙 . 리는 먼 료들 . 면 LDA 변 .



−1 . reduction(?) m 는 m . 모 를 LDA 변 HMM .

6 모델링
HMM , , ESMERALDA 5 는 방 . HMM 리는 512 Gaussian mixtures with diagonal covariance matrice(더 독립 는 2048)를 는 semi-continuous . 52 , 10 , 12 , Baum-Welch . conbined model . Viterbi beam- search를 .
변동 리는 13 , / 독립 . , . 리HMM 를 모델링는 데 . HMM 는데, 리는 . 료는 HMM들 를 붙. 는 모 . 받는 . 는 soft vector quantization .
, . x ̂ 를 .

̂ = ()(|)

P(W)는 w P(X|W)는 x . absolute discounting backing-off for smoothing of probability distribution . (cf. e.g. 3)

7
, , 독립 . 1 . , 3 , 4 . IAM 데 a..d 내내 . 2-free .
Senior 데 282, 141 는데, 램 perplexity는 15.3. 13.3%는 바 12.1% . LDA 변 12 . ( 2) 28.5%, 1.5k 면 10.5%. literature(문 ) 만, . 17 28.3%, 84.1%, 1.3k 16.5%. 15 6.6%, free 41.1%. 9 15.0%.
IAM 데 c03 440, 109 . . LDA(12 )를 14.2%는 ( 6) 13.3% . 바 11.1% ( perplexity는 12.0). 39.0%, 421( )를 13.9% 는데 11 20.5% .
리는 더 독립 . IAM 데 a- f( 250명) 는데, 4321( a-d), 1097( e-f) . 31.3%. 독립 . 31.3%는 3 10 (34.8%) . LDA 변 29.1% . 22.2% ( perplexity는 12.0). 60.6%.

8
리는 , , 독립 . . 는데, / 독립 LDA를 .
, .

9
Fi799/1 German Research Foundation(DFG) .
Bern 대 Institute of Informatics and Applied Mathematics, Horst Bunke Urs-Viktor Marti . IAM10 .


1
2
...
18

Linear Algebra and Its Applications (4th ed.) by David C. Lay

2 ~ 2.3

  • 면 돼. -
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2021-02-07 05:28:55
Processing time 0.0641 sec