Warning:
ERROR: LaTeX does not work properly.in /var/www/html/plugin/processor/latex.php on line 210
¶
see also 더 보
coarse 대략,
coarse 대략,
2012/11/16 ¶
- 「Experiments in Unconstrained Offline Handwritten Text Recognition」 번
- 1 1 배 Linear Algebra and Its Applications 1.10, 2.1, 2.2 번
2012/11/29 ¶
Experiments in Unconstrained Offline Handwritten Text Recognition( 는 ) ¶
. 는 모듈 리. 리, (feature extraction), 모 방 독립, , . (Linear Discriminant Analysis), (allograph) 모, .
1
. 들 대부 리는 데 . 14 들 면 는(unconstrained) . 는 러 복 문데 는 대 보 는 데 릴 방대 . 럼 더 는 는 는, 능 따 더 복 리를 문.
본 논문는 마르 모 , (lexicon)-free 문 데 몇 독립 리 대를 , . 리 방 더 , 모 , 모 더 들 . 뒤 는 대 들 . 리 데는 3 . 리, 방, 모델링 명. 는 방 7 .
. 들 대부 리는 데 . 14 들 면 는(unconstrained) . 는 러 복 문데 는 대 보 는 데 릴 방대 . 럼 더 는 는 는, 능 따 더 복 리를 문.
본 논문는 마르 모 , (lexicon)-free 문 데 몇 독립 리 대를 , . 리 방 더 , 모 , 모 더 들 . 뒤 는 대 들 . 리 데는 3 . 리, 방, 모델링 명. 는 방 7 .
2
몇 는 . legal amount 를 , 를 높 뿐 리 를 봐 . 2 8
면 방대 는 를 는 . 는 리 본 는 문맥 보 문. 런 는 몇 . 1, 9, 11, 18, 15, 17 들 는 . 마르 모(HMM) 리 HMM 방 1, 18 15 . 15 부 데를 면 1, 18 러 료를 . 16는 범 .
는 를 9는 는, 를 모듈 는 방 . 대 를 . 11 백 명부 보 데 , 무 는 . 명는 리 방 른 . 더 모, HMM 모 뿐 벡 (LDA) .
몇 는 . legal amount 를 , 를 높 뿐 리 를 봐 . 2 8
면 방대 는 를 는 . 는 리 본 는 문맥 보 문. 런 는 몇 . 1, 9, 11, 18, 15, 17 들 는 . 마르 모(HMM) 리 HMM 방 1, 18 15 . 15 부 데를 면 1, 18 러 료를 . 16는 범 .
는 를 9는 는, 를 모듈 는 방 . 대 를 . 11 백 명부 보 데 , 무 는 . 명는 리 방 른 . 더 모, HMM 모 뿐 벡 (LDA) .
3 말뭉(corpus)
데는 문 데 Lancaster-Oslo/Bergen 말뭉 . 7 독립 뿐 Bern 대 IAM 10 데를 . 데 는 범( , , , ...)를 500명 1200 . 리는 250명 독립 범 a..f form c03 .
리 Senior 15 데 . 데는 25 며 .1 데 들 256 벨 300dpi . 림 1 데 .
1 ftp://svr-ftp.eng.cam.ac.uk/pub/data
데는 문 데 Lancaster-Oslo/Bergen 말뭉 . 7 독립 뿐 Bern 대 IAM 10 데를 . 데 는 범( , , , ...)를 500명 1200 . 리는 250명 독립 범 a..f form c03 .
리 Senior 15 데 . 데는 25 며 .1 데 들 256 벨 300dpi . 림 1 데 .
1 ftp://svr-ftp.eng.cam.ac.uk/pub/data
4 리
미 먼 미 배 "밀남(drift)" 를 바는. 따 미는 미 밀 램 를 . 4 리 를 IAM 데 는 는데 들 번 를 받 는 면 문.
더 리 . 러 미를 (core region)들 를 리. , threshold를 는. threshold는 들 방foreground 들 를 낸. threshold는 밀 램 Otsu 방 12를 면 동 . 램 미는 램 minima를 따 .
문 를 . , , (slant) 리 러났. 는 벨 를 .
끔 바뀌는 동를 리는 , , 를 . 따 segment들 백 리. 믿 만 를 는 무 threshold를 .
15 (linear regression)를 면, 리edge 방 . 러므 미는 -백 백- 는데 stroke만 . canny edge detector를 edge orientation 료를 램 . 램 .
를 (local extrema) 를 는. 례(scaling) 는 데 는 더 문.
마막 리는 벨 배 변 대는 . 미 벨 는 0 255 . 말뭉 들 리를 림 3 .
미 먼 미 배 "밀남(drift)" 를 바는. 따 미는 미 밀 램 를 . 4 리 를 IAM 데 는 는데 들 번 를 받 는 면 문.
더 리 . 러 미를 (core region)들 를 리. , threshold를 는. threshold는 들 방foreground 들 를 낸. threshold는 밀 램 Otsu 방 12를 면 동 . 램 미는 램 minima를 따 .
문 를 . , , (slant) 리 러났. 는 벨 를 .
끔 바뀌는 동를 리는 , , 를 . 따 segment들 백 리. 믿 만 를 는 무 threshold를 .
15 (linear regression)를 면, 리edge 방 . 러므 미는 -백 백- 는데 stroke만 . canny edge detector를 edge orientation 료를 램 . 램 .
를 (local extrema) 를 는. 례(scaling) 는 데 는 더 문.
마막 리는 벨 배 변 대는 . 미 벨 는 0 255 . 말뭉 들 리를 림 3 .
5
리 미는 료 . sliding window 11 명는 . 리 미 높 미 른 면 .
sliding window 7를 . (1) -백 변 (windowed text image ), (2) 대 , (3) 리, (4) 리, (5) 리, (6) , (7) . (2)-(5)는 core size, (대 line fitting ) 리 , 변동 대 더 . 모 .
변 뿐 contour contour 방 방 . 말 리는 lower countour , upper contour , sliding window 내 들 방들 (8), (9), (10) . (뭔 리) 더 temporal context를 리는 벡 마 미 20 벡를 는. ( 10, 10)
벡들 decorrelate 리는 LDA를 . (cf. 6) 변 며 . 변 A를 료 내 (within class scatter) Sw (between class scatter) Sb를 벡 문를 . (scatter) 들 벡 HMM 를 붙 . 리는 먼 료들 를 . 면 LDA 변 벡 문를 .
리 미는 료 . sliding window 11 명는 . 리 미 높 미 른 면 .
sliding window 7를 . (1) -백 변 (windowed text image ), (2) 대 , (3) 리, (4) 리, (5) 리, (6) , (7) . (2)-(5)는 core size, (대 line fitting ) 리 , 변동 대 더 . 모 .
변 뿐 contour contour 방 방 . 말 리는 lower countour , upper contour , sliding window 내 들 방들 (8), (9), (10) . (뭔 리) 더 temporal context를 리는 벡 마 미 20 벡를 는. ( 10, 10)
벡들 decorrelate 리는 LDA를 . (cf. 6) 변 며 . 변 A를 료 내 (within class scatter) Sw (between class scatter) Sb를 벡 문를 . (scatter) 들 벡 HMM 를 붙 . 리는 먼 료들 를 . 면 LDA 변 벡 문를 .
는 −1 벡. reduction(?) m 는 m 벡만 . 모 벡를 LDA 변 는 HMM .
6 모델링
HMM , , 독 ESMERALDA 5 는 방 . HMM 리는 512 Gaussian mixtures with diagonal covariance matrice(더 독립 는 2048)를 는 북 는 semi-continuous . 52 , 10 , 12 , 백 를 본 모 Baum-Welch . 를 모 대 루 conbined model . 능 높 Viterbi beam- search를 .
리 벌 는 른 변동 리는 13 , / 독립 모 . 는 , 른 . 는 리HMM른 를 모델링는 데 . HMM 는 리 는데, 리는 만 . 료는 HMM들 를 붙. 모 본 대 는 모 매변 . 능 모 매변 본 마 받는 를 . 는 는 soft vector quantization .
부, 모 . 목는 데 x 대 모 대는 ̂ 를 는 .
HMM , , 독 ESMERALDA 5 는 방 . HMM 리는 512 Gaussian mixtures with diagonal covariance matrice(더 독립 는 2048)를 는 북 는 semi-continuous . 52 , 10 , 12 , 백 를 본 모 Baum-Welch . 를 모 대 루 conbined model . 능 높 Viterbi beam- search를 .
리 벌 는 른 변동 리는 13 , / 독립 모 . 는 , 른 . 는 리HMM른 를 모델링는 데 . HMM 는 리 는데, 리는 만 . 료는 HMM들 를 붙. 모 본 대 는 모 매변 . 능 모 매변 본 마 받는 를 . 는 는 soft vector quantization .
부, 모 . 목는 데 x 대 모 대는 ̂ 를 는 .
̂ = ()(|)
P(W)는 w 모 P(X|W)는 를 모 따 데 x . 리 absolute discounting backing-off for smoothing of probability distribution 바램 모 . (cf. e.g. 3)
7
리 , , 독립 . 1 들 . , 3 모 , 4 바램 모 . 모 IAM 데 a..d 범 모 내내 . 2는 -free .
Senior 데 282, 141 는데, 바램 perplexity는 15.3. 13.3%는 바램 모 12.1% . LDA 변 12 내만 . ( 2) 28.5%, 1.5k 면 10.5%. 들 리 데를 literature(문 ) 만, . 17 28.3%, 는 84.1%, 1.3k 는 16.5%. 15 보 는 6.6%, free 41.1%. 9 15.0%.
IAM 데 c03 440, 109 . 들 른 . LDA(12 )를 14.2%는 모( 문 6) 13.3% 더 . 바램 모 11.1% 더 ( perplexity는 12.0). 는 39.0%, 421( )를 를 13.9% 들는데 11 20.5% 많 .
들 무 리는 더 독립 . IAM 데 a- f( 250명) 료 는데, 4321( a-d), 1097( e-f) . 31.3%. 독립 모 른 루 못. 31.3%는 3를 며 10를 (34.8%) 모 . 만 LDA 변 29.1% . 모 22.2% 더 ( perplexity는 12.0). 는 를 60.6% 대.
리 , , 독립 . 1 들 . , 3 모 , 4 바램 모 . 모 IAM 데 a..d 범 모 내내 . 2는 -free .
Senior 데 282, 141 는데, 바램 perplexity는 15.3. 13.3%는 바램 모 12.1% . LDA 변 12 내만 . ( 2) 28.5%, 1.5k 면 10.5%. 들 리 데를 literature(문 ) 만, . 17 28.3%, 는 84.1%, 1.3k 는 16.5%. 15 보 는 6.6%, free 41.1%. 9 15.0%.
IAM 데 c03 440, 109 . 들 른 . LDA(12 )를 14.2%는 모( 문 6) 13.3% 더 . 바램 모 11.1% 더 ( perplexity는 12.0). 는 39.0%, 421( )를 를 13.9% 들는데 11 20.5% 많 .
들 무 리는 더 독립 . IAM 데 a- f( 250명) 료 는데, 4321( a-d), 1097( e-f) . 31.3%. 독립 모 른 루 못. 31.3%는 3를 며 10를 (34.8%) 모 . 만 LDA 변 29.1% . 모 22.2% 더 ( perplexity는 12.0). 는 를 60.6% 대.
8
리는 는 , , 독립 몇 . 를 는 뿐 를 루. 는 는데, 모 / 독립 LDA를 .
, 모 .
리는 는 , , 독립 몇 . 를 는 뿐 를 루. 는 는데, 모 / 독립 LDA를 .
, 모 .
9 말
는 Fi799/1 German Research Foundation(DFG) .
Bern 대 Institute of Informatics and Applied Mathematics, Horst Bunke Urs-Viktor Marti . 들 리 데 IAM10 는 .
는 Fi799/1 German Research Foundation(DFG) .
Bern 대 Institute of Informatics and Applied Mathematics, Horst Bunke Urs-Viktor Marti . 들 리 데 IAM10 는 .
Linear Algebra and Its Applications (4th ed.) by David C. Lay ¶
2 ~ 2.3
- 보 돌들 3D 모델링 대 및 를 . 들 변 를 뮬 방 변를 대략 200만 는 방 복 . 러 대 방를 내 면 (partitioned matrix) (matrix factorization)는 념 .
- :
[A I] -> [I A-¹]
- : 는 . 높면 .