U E D R , A S I H C RSS

논문번역/2012년스터디/이민석


Warning:
ERROR: LaTeX does not work properly.
in /var/www/html/plugin/processor/latex.php on line 210

  • LaTeX

see also 더 보기
coarse 대략,

2012/11/16

  • 「Experiments in Unconstrained Offline Handwritten Text Recognition」
  • 1 1 Linear Algebra and Its Applications 1.10, 2.1, 2.2

2012/11/29



Experiments in Unconstrained Offline Handwritten Text Recognition( 기 글 )



기 글 다. 다는 것 다. 리, (feature extraction), 방법 독립, 다, 단 다. (Linear Discriminant Analysis), (allograph) 글, 다.

1
기 글 다. 대부 기나 는 데 다. 14 나 단 된 반면 는(unconstrained) 기 글 다. 그 게 복기 때문데 글 또는 단 보가 는 데다 가 방대 다. 그럼 기 글 기법는 것 는, 능력 따라 더 리를 기 때문다.
본 논문 기반, (lexicon)-free 몇 가 독립 그리고 대, 단 다. 방법 , , 기법들 다. 그 뒤 관련 게 검다. 리가 는 3 다. 그 다 리, 방법, 모델링과 기법 다. 가 결과는 방법 7 다.

2 관련
근 몇 다. 나 legal amount 기를 , 를 고려 다. 2 8
반면 방대 기 글 렵다. 는 개 는 문맥 과 단 보가 기 때문다. 런 난 기 글 몇 개 개발되다. 1, 9, 11, 18, 15, 17 되는 다. (HMM) 그리고 경망과 HMM 기반 방법 로 각각 1, 1815다. 15 로부 를 가 반면 1, 18 료를 가고 검다. 16 광범다.
류를 9 는, 기는 방법 다. 과 결 결과를 달다. 11 로부 고 보다 된, 무관 는 글 다. 로 나 방법 다른 근법 다. 그 , HMM (LDA) 결과 다.

3 말뭉(corpus)
련과 력 데 공되고 각각 Lancaster-Oslo/Bergen 말뭉 기반다. 7 독립라 다 Bern 대 IAM 10 다. 데 는 다 글 범(, 교, , ...)를 고 500명 1200개 로 구된다. 리는 250명 독립 a..f form과 가 다 c03 다.
Senior 15 다. 25로 구되며 공개 다.1 두 데 256 그 300dpi 다. 그림 1 각 데 다.
1 ftp://svr-ftp.eng.cam.ac.uk/pub/data

4
기 글 나 글 "밀려남(drift)" 류를 바로는다. 따라 그램 를 가 된다. 4 리 단를 IAM 데 는데 렬되기 때문다.
각각 다. 그러기 기 라 (core region)들 다. , 래 베 threshold를 는다. threshold는 방foreground 를 나낸다. threshold는 그램 Otsu 방법 12로 결된다. 그 다 그램 되고 그램 minima를 따라 로 나다.
때문 기를 다. , 기, 경(slant) 드러났다. 그 를 고려다.
가끔 글 바뀌는 것 동기를 리는 각 , 기, 경를 국로 교다. 따라 각segment들 리된다. 믿 threshold를 다.
15 근법과 귀(linear regression)를 반면, 경리edge 방 기반다. 그러므로 되고 -- 는데 stroke만 다. canny edge detector를 edge orientation 료를 고 각 그램 다. 그램 다.
기를 극값(local extrema) 개 는다. 례(scaling) 록 글는 더 기 때문다.
리는 그 과 배경는 것다. 벨 구 는 0 되고 밝 255가 되다. 말뭉 리를 결과가 그림 3다.

5
료로 된다. sliding window 기법 11 근법과 다. 로 두 고 기 다.
sliding window 7개를 다. (1) -(windowed text image ), (2) 베 균 값 , (3) 단 글 리, (4) 단 글 리, (5) 단과 리, (6) 단과 균 강, (7) 그 균 강. (2)-(5)는 core size, 단 베단 베(극대값 line fitting) , 글 변동다. 그 모든 된다.
균값단 contour 단 contour 고려 다. 말 리는 lower countour , upper contour , sliding window 내 균값 (8), (9), (10) 로 각각 다. (뭔 리) 더 temporal context를 고려 리는 다 근 가로 고 결과로 20 는다. ( 10개, 10개)
decorrelate 리는 련 단 LDA를 다. (cf. 6) 다. A를 구 (within class scatter) 렬 Sw (between class scatter) 렬 Sb를 다. (scatter) 렬들 HMM 를 붙 다. 리는 먼 료들 를 기다. 면 LDA 변 다.



𝜇𝑖 𝐴𝑇𝜓𝑖는 𝑆𝑤1𝑆𝑏값과 고다. reduction(경감?) m개 고 는 m개 고 다. 모든 를 LDA 변 HMM 된다.

6 모델링과
기 글 HMM, 련, ESMERALDA 개발 5 는 방법과 된다. HMM 리는 512개 Gaussian mixtures with diagonal covariance matrice(더 독립 는 2048개)를 는 공 드북 는 semi-continuous 다. 52개 글, 10개 , 12개 구두 , 공 나를 기본 Baum-Welch 련된다. 그 다 로 구된 conbined model 된다. 가 가능 Viterbi beam- search를 된다.
로 다른 글 변동 고려 리는 13 근법과 , 다/ 독립 다. 는 글 류, 로 다른 다. 는 베 과달리HMM로다른글 류를 모델링는 데 다. 글 류 개 HMM 개로 결는데, 가령 다 리는 다고 가다. 료는 HMM들 를 붙다. 모든 글 는 모든 매개변 병렬 다. 가능 매개변 나 강를 결다. 게 결 는 soft vector quantization과 다.
로, 가 발 것 같 다. x 는 글 𝑤̂ 를 는 것다.

𝑤̂ = 𝑎𝑟𝑔𝑚𝑎𝑥𝑤𝑃(𝑋)𝑃(𝑋|𝑊)

P(W)는 글 w 고 P(X|W)는 를 그 글 따라 력 데 x로 다. absolute discounting과 backing-off for smoothing of probability distribution 그램 다. (cf. e.g. 3)

7 결과
, 다, 독립 렇게 다. 1 다. 류, 3 , 4그램 결과다. IAM 데 a..d 모든 글 내내 다. 2-free 단 기반 단 다.
Senior 데 282, 검 141 는데, 글 그램 perplexity는 15.3다. 베 13.3%는 바그램 12.1%로 감다. LDA 변 12로 내려갔 그다 다. 단 ( 2) 28.5%, 1.5k 면 10.5%다. 결과들 리가 같 literature(문 닌 것 같다) 교되긴 만, 과 검 기가 달라 렵다. 17 28.3%, 는 단 84.1%, 1.3k 는 단 16.5%다. 15 보고 는 경 6.6%, free 41.1%다. 9 기반 단 15.0%다.
IAM 데 c03 440, 검 109 다. 다른 다. LDA(12로 경감)를 14.2%는 (각 6개) 가로 13.3%로 더 게 감다. 바그램 결과 11.1%로 더다(검 perplexity는 12.0). 는 단 39.0%로, 단 421개(구두 )를 13.9%로 는데 11 20.5% 교된다.
결과들 고무 리는 더 독립 다. IAM 데 a- f( 250명) 료로 는데, 4321( a-d), 검 1097( e-f) 다. 베 31.3%다. 독립 다른 다. 31.3%는 글 3개를 며 글 10개를 (34.8%)과 모두 다. LDA 변 때 29.1%로 게 감다. 가로 22.2%로 더다(검 perplexity는 12.0). 때 단 60.6%된다.

8 결론
리는 기 글 고 단 , 다, 독립 몇 개 다. 는 단 기반 뿐 라 글 결과를 다. 는 베 는데, 글 고 다/ 독립 LDA를 결과다.
가 개, 다.

9 감
구는 Fi799/1 German Research Foundation(DFG)가 다.
가로 Bern 대 Institute of Informatics and Applied Mathematics, Horst Bunke Urs-Viktor Marti게 감다. 리가 IAM10 는 것 다.

고 문
1
2
...
18

Linear Algebra and Its Applications (4th ed.) by David C. Lay

2 론 ~ 2.3

  • 렇게 면 돼. -
Valid XHTML 1.0! Valid CSS! powered by MoniWiki
last modified 2021-02-07 05:28:55
Processing time 0.0529 sec