sisteme de vedere artificial ă · pdf file 2018-11-19 · 1 sisteme de vedere...
Post on 24-Feb-2020
5 views
Embed Size (px)
TRANSCRIPT
1
Sisteme de Vedere Artificială
Filtrarea imaginilor
Sorin M. Grigorescu
Universitatea Transilvania din Braşov Laboratorul de Vedere Artificială Robustă şi Control
2
Cuprins
�Reprezentarea imaginilor
�Distribuţia Gaussiană
�Filtrarea imaginilor
�Template matching
3
Lanţ de procesare a imaginilor �Recunoaşterea caracterelor
Segmentare Pre
procesare Achiziţia
imaginilor
Procesarea imaginilor
Clasificare şi recunoaştere
Înţelegerea imaginilor
Extragere caracteristici
Nivel inferior Nivel superior
Caracteristicile Obiectelor
(caracterelor)
Nivel mijlociu
4
Reprezentarea imaginilor
Coloane
PIXEL
Eşantionarea imaginilor
5
Reprezentarea imaginilor
Valorile pixelilor
133154157165165154138124113978167656791105
10815718919818918116511689971008158485081
13317918919619617991402642818367241656
1461961981981989726505650348973341024
1081791891891733465402458424873321016
4012417118917356482682632264824816
1034891491496724241016161816181618
10162456653416161016241818181626
1081624242418161618182418263440
50241824422616263232345648505050
6765588111365247375757367736573157
5897891161301167310510510591918191173189
50738910812413011311612111310081113179189181
6
Reprezentarea imaginilor
Coloane x(0,0)
M
N
y
f (N-2,6)
6
−−−−−−−−−−−−−−−−
−−−−
−−−−
====
),(),(),(
),(),(),(
),(),(),(
),(
111101
111101
101000
NMfMfMf
Nfff
Nfff
yxf
K
MMM
K
K
7
Tipuri de imagini digitale
Lena, imagine binară (2 nivele de gri: negru şi alb)
Lena, imagine gri (8 nivele de gri)
Lena, imagine color
Lena, imagine gri (256 nivele de gri)
8
Tipuri de imagini digitale
Lena, imagine gri
(256 nivele de gri – 8 Biţi) Lena, imagine color
Matrice M x N cu elemente aparţinând
intervalului ]255,0[∈
3 matrici M x N (o matrice pentru fiecare
canal RGB) cu elemente aparţinând intervalului ]255,0[∈
„Lena în verde roşu şi albastru“
9
Imaginea ca şi funcţie
�(�, �) �
0, 0 �
133154157165165154138124113978167656791105
10815718919818918116511689971008158485081
13317918919619617991402642818367241656
1461961981981989726505650348973341024
1081791891891733465402458424873321016
4012417118917356482682632264824816
1034891491496724241016161816181618
10162456653416161016241818181626
1081624242418161618182418263440
50241824422616263232345648505050
6765588111365247375757367736573157
5897891161301167310510510591918191173189
50738910812413011311612111310081113179189181
10
Imaginea ca şi funcţie
�
0, 0 �
�
�
Pixel value
(intensity)
11
Imaginea ca şi funcţie �O imagine (gri) poate fi considerată o funcţie f sau I, din spaţiul ℝ
în ℝ � � �, � defineşte intensitatea sau valoarea la poziţia �, �
133154157165165154138124113978167656791105
10815718919818918116511689971008158485081
13317918919619617991402642818367241656
1461961981981989726505650348973341024
1081791891891733465402458424873321016
4012417118917356482682632264824816
1034891491496724241016161816181618
10162456653416161016241818181626
1081624242418161618182418263440
50241824422616263232345648505050
6765588111365247375757367736573157
5897891161301167310510510591918191173189
50738910812413011311612111310081113179189181
�
�
0, 0 �:ℝ → ℝ
12
Imaginea ca şi funcţie
�
0, 0 �� �, � ∈ ℝ
� ∈ ℝ
� ∈ ℝ
���
13
Imaginea color ca şi funcţie
�:ℝ → ℝ�
�O imagine color este
reprezentată pe 3 canale (Red,
Green, Blue
14
Operaţii pe puncte
�Considerăm o singură imagine de intrare
)],([),( yxpGyxq =
G(.)
(x,y) (x,y)
Imaginea intrare p(x,y) Imaginea ieşire q(x,y)
(0,0) (0,0)
(M-1,N-1) (M-1,N-1)
ayxpyxq += ),(),(Adunare cu un scalar a:
15
Zgomotul în imagini
�Zgomotul este un semnal perturbator ce se combina cu imaginea
originală
�� �, � = � �, � + �(�, �) �Tipuri de zgomote:
� ”Salt and Pepper”: apariţii aleatoare de pixeli albi şi negrii
�Zgomot impuls: apariţii aleatoare de pixeli albi
�Zgomot Gaussian: variaţii ale intensităţii pixelilor generate
dintr-o distribuţie Gaussiană
16
Distribuţia Gaussiană
�Distribuţia Gauss �(�, �), sau Normală, este o funcţie continuă de probabilitate
�Funcţia de densitate de probabilitate (cazul 1-dimensional):
� � �, � = 12�� exp − (� − �) 2�
� ∈ ℝ – media � ∈ ℝ– deviaţia standard � ∈ ℝ– varianţa
17
Distribuţia Gaussiană
18
Distribuţia Gaussiană multivariată �Cazul n-dimensional �(�, Σ):
� � �, " = 1(2�)#/ |Σ|&/ exp − 1 2 (� − �)'Σ(&(� − �)
� ∈ ℝ# – vector medie Σ ∈ ℝ#×# – matricea de covarianţă |Σ| – determinantul matricei Σ
19
Ex: 2-dimensiuni
� = 00 Σ = * = 1 00 1
� = 00 Σ = 0.6 00 0.6
� = 00 Σ = 2 00 2
Distribuţia normală standard
- – matricea identitate
20
Ex: 2-dimensiuni
Σ = 1 00 1 Σ = 1 0.50.5 1 Σ = 1 0.80.8 1
21
Ex: 2-dimensiuni
Σ = 1 −0.5−0.5 1 Σ = 1 −0.8−0.8 1
Σ = 3 0.80.8 1
22
Ex: 2-dimensiuni
� = 10 Σ = *
� = −0.50 Σ = *
� = −1−1.5 Σ = *
23
Generarea de zgomot gaussian
Cazul 1-dimensional
Cazul 2-dimensional
24
Generarea de zgomot gaussian �Efectul covarianţei Σ în zgomotul Gaussian
� = 2 � = 8
� = 32 � = 64
25
Zgomotul Gaussian
�� �, � =� �, � + �(�, �)
26
Filtrarea unui semnal 1-dimensional
�
�2
�Semnalul filtrat �2 este o medie ponderată a semnalului original �
27
Filtrarea unui semnal 1-dimensional
�2(3) = � 3 − 2 + � 3 − 1 + � 3 + � 3 + 1 + � 3 + 25
�
�2
28
�2(3) = 124 + 1 5 �(3 + 6) 7
89(7
�
�2
29
�
�2
�2(3) = 124 + 1 5 �(3 + 6) 7
89(7
30
�
�2
�2(3) = 124 + 1 5 �(3 + 6) 7
89(7
31
Filtrarea unui semnal 1-dimensional
32
Filtrarea imaginilor Semnal 2-dimensional
�Filtrarea unei imagini: calculul unei funcţii de vecinătăţi la fiecare
poziţie a imaginii
�Utilizări:
� Îmbunătăţirea imaginilor:
� Reducerea zgomotului, mărire/micşorare, îmbunătăţirea contrastului, etc.
�Extragerea informaţiei din imagini:
� Textură, cante, puncte distince (colţuri)
�Detecţia de obiecte
� Template matching
7 7 7 7
7 6 6 7
7 7 7 7
7 7 7 7
7 0 7 7
7 7 7 7
1/9 1/9 1/9
1/9 1/9 1/9
1/9 1/9 1/9
Imaginea de intrare Imaginea de ieşire
Filtru (mască)
(1,1): 6222.6 9
56
9
1 78
9
1 7
9
1 7
9
1 7
9
1 7
9
1 0
9
1 7
9
1 7
9
1 7
9
1 7 ≈==⋅⋅=⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅
(1,2): 6222.6 9
56
9
1 78
9
1 7
9
1 7
9
1 7
9
1 7
9
1 7
9
1 0
9
1 7
9
1 7
9
1 7 ≈==⋅⋅=⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅
Filtre de netezire: Filtrul median
],[ lkg ],[ nmh],[ nmf
33
111
111
111
],[ ⋅⋅g
Filtrarea spaţială
- imaginea de intrare (originală)
- filtrul (masca = kernel =