recunoastere scris de mana - utclujusers.utcluj.ro/~tmarita/hci/c6-extra/recunoastere scris de...

17
Sistem de recunoaştere a caracterelor scrise de mâna sau de tipar cu modul de corectare folosind dicŃionar Botoiu Antonia Corina IVA Gr: 32211

Upload: others

Post on 19-Jan-2020

64 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Sistem de recunoaştere a caracterelor scrise de mâna

sau de tipar cu modul de corectare folosind dicŃionar

Botoiu Antonia Corina

IVA Gr: 32211

Page 2: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Cuprins

1. Specificarea sistemului.2. Extragere randuri din text folosind Filtrele Kalman3. Determinarea ecuatiei Filtrelor Kalman pentru cazul

studiat4. Exemplu.5. Bibliografie

Page 3: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Specificarea sistemului-Propunere proiect-

• Dezvoltarea proiectului de licenta• Recunoaştere de caractere provenite de la sisteme

de tip Whiteboard cat si din documente scanate.• Integrare de functii pentru recunoasterea

• Litere de tipar (majuscule si litere mici)• Litere de mana

– ImbunătăŃirea rezultatelor cu un dicŃionar pentru a analiza apartenenŃa cuvintelor la vocabularul limbii

române.

Page 4: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Specificarea sistemului-Proprietati ale documentelor procesate-

• Fundalul poate fi diferit de culoarea alba (cu intensitate variata)• Textul poate avea larândul sau culori diferite

- Textul poate avea la rândul sau culori diferite

- Rândurile din text pot avea la rândul lororientări diferite de orizontal

Page 5: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Extragere randuri din text folosind Filtrele Kalman

• Metoda se bazează pe viziune perceptiva [Aur 06]:• la o anumita distanta, rândurile din text se pot vedea ca un

segmente de dreapta.(viziune globala)• se urmareste reducerea detaliilor din imagine pe perioada

analizei.

• se aduce imaginea la o rezolutie mica; • aflarea valorii optime a rezolutiei depinde de

documentele care sunt supuse recunoasterii.

Page 6: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Extragere randuri din text folosind Filtrele Kalman- Proprietati pentru o extragere buna de segment -

1. Importanta vecinatatii: un aliniament de puncte izolate nu e considerat ca un segment.

2. Posibiliatea de a exista discontinuitati in segment

3. Grosimea observata

corespunzătoare fiecărui punct

Page 7: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Extragere randuri din text folosind Filtrele Kalman- Proprietati pentru o extragere buna de segment -

4. Segmente de dimensiune variabila.5. Posibilitate de segmente incrucisate.

6. Posibilitate de segment curbat.

7. Posibilitate de a avea a face cu oblicitate( pana la 300)

Page 8: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Extragere randuri din text folosind Filtrele Kalman

Aplicare filtrelor pe cazul de extragere de randuri din text

• Filtrele Folosite:• Primul pentru grosimea liniei

• Al doilea pentru pozitia si panta acesteia

• Interpretare:• Punct prezis negru, pozitie si grosima corecta => estimarea

este updatata, si analiza continua.• Punct prezis negru dar grosimea e prea mare=> stare

neapdatata si analiza continua• Punct prezis alb=> sfarsit de linie sau

intrerupere intre cuvinte=> continuare limitata

Page 9: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Determinarea ecuatiei Filtrelor Kalman pentru cazul studiat

• Vectorul de stare

unde y este poziŃia punctului pe axa OY si Vy este panta

• Matricea de tranziŃie a stărilor:

pasul dintre măsurători succesivesi se considera ca tranzitia se face incremental cu 1.

=

yv

y

iXr

r

∆=

10

1 ii

xF

ix∆

Page 10: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Determinarea ecuatiei Filtrelor Kalman pentru cazul studiat

1. Initializare:Gasirea celui mai din stanga punct negru.(primul punct

negru)y0 = randul primului punct.v0 = 0. panta initiala.

unde = 0.01 ->eroarea fata de poziŃia lui y.= tan(pi/6) ->domeniul de variaŃie al pantei. Panta poate varia sub un unghi de 300

= 2

2

0

0

0

0

0

yv

yPσ

σ

2

0yσ2

0vσ

Page 11: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Determinarea ecuatiei Filtrelor Kalman pentru cazul studiat

2. Predictie• Găsim noul x si construim Fi:• Calculam :• valoarea prezisa

• matricea de incertitudine a tranzitiei unei stari.

=0.0001 - abaterea pe y= 0,01 - abaterea pe vy

1* −= iii xFx

iT

iiii QFPFP += − ** 1

=

∆2

2

0

0

y

y

v

σ

2

y∆σ2

yv∆σ

Page 12: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Determinarea ecuatiei Filtrelor Kalman pentru cazul studiat

3. Masura:

Matricea de masuratoareSi =matricea de covarianta;Ri = matricea de covarianta

a erorii de masurare;

=0,02

Folosind valoarea pentruS se determina y masurat = +/- S;

ii xHy *=[ ]01=iH

iTiiii RHPHS += **

[ ]2

masyiR σ=

y

Page 13: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Determinarea ecuatiei Filtrelor Kalman pentru cazul studiat

4. Update• Matricea de castig :• Noua valoarea pentru vectorul de stare:• Calculul predictiei:• Caz particular: • - in cazul in care la un anumit pas nu avem

măsurătoare, ultima etapa nu se executa ecuaŃiile modificându-se:

1)**(** −+= iTii

Tiii RHPHHPK

)( iiiii yyKxx −+=Tiii

Tiiiiii KRKHKIPHKIP **)*(*)*( 22 +−−=

ii xx =

PPi =

Page 14: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Exemplu

Pentru o curba definita de ecuatia:y = 0.005*i2+10+(-1)i*0.1]

Respectand pasii de calcul pentru Filtrrul Kalman, si valorile aflate pentru fiecare matrice in parte se obtine:

Page 15: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Exemplu

Detaliu pentruevidentiereainceputuluifiltrarii

Page 16: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Exemplu

Detaliu pentruevidentiereasfarsituluifiltrarii

Page 17: Recunoastere scris de mana - UTClujusers.utcluj.ro/~tmarita/HCI/C6-extra/Recunoastere scris de mana.pdf · • Dezvoltarea proiectului de licenta • Recunoa ştere de caractere provenite

Bibliografie

• [Aur 06] Aur´elie Lemaitre IRISA / INSA „Text Line Extraction in Handwritten Document with Kalman Filter Applied on Low ResolutionImage”, 2006, Proceedings of the Second International Conferenceon Document Image Analysis for Libraries, 2006.

• [Dan 09] R.Danescu, „Tehnici de viziune artificiala in timp real bazate pe estimatori probabilistici”, Teza Doctorat , 2009

• [Dav 08] David K. Levine, Journal - Handwriting Recognition,2007• [Mat 08] Matt McGee, Google Using OCR To Index Scanned

Documents http://searchengineland.com/google-using-ocr-to-index-scanned-documents-15318, oct 2008

• [Nil 08] Nils Krahnstöver and Bart Paulhamus ,Computer VisionLaboratory Department of Computer Science and EngineeringPennsylvania State University, 2008