Je tiens tout d'abord à remercier les membres de mon jury : - Madame Annick MONTANVERT, du TIMC-INFODIS, professeur à l’université Pierre Mendès-France, pour m'avoir fait l'honneur de présider mon jury ;
- Monsieur Jean-Pierre COQUEREZ, de l’Equipe Traitement des Images et du Signal, professeur à l’ENSEA, et Monsieur Simon THORPE, du Centre de Recherche Cerveau et Cognition, directeur de Recherche CNRS, pour avoir accepté d'être les rapporteurs de cette thèse ;
-Monsieur Jeanny HERAULT, du LIS, Professeur à l’université Joseph-Fourier et directeur de cette thèse, qui a su à la fois me guider et me conseiller au cours de ces trois années, tout en me laissant à chaque fois libre de mes choix ;
INSTITUT NATIONAL POLYTECHNIQUE DE GRENOBLE
Laboratoire des Images et des Signaux
|_/_/_/_/_/_/_/_/_/_|
THESE
Pour obtenir le grade de
DOCTEUR DE L'INSTITUT NATIONAL POLYTECHNIQUE DE
GRENOBLE
Discipline : Signal, Image, Parole
Présentée et soutenue publiquement
par
Christian CROLL
le 6 mai 1998
Titre:
Synthèse d'un banc de filtres spatialement variants,
inspiré des colonnes d'orientations du système visuel
Directeurs de thèse : Denis Pellerin et Jeanny Hérault
JURY
Madame Annick MONTANVERT : Présidente,
Monsieur Simon THORPE : Rapporteur,
Monsieur Jean-Pierre COQUEREZ : Rapporteur,
Monsieur Denis PELLERIN : Examinateur,
Monsieur Jeanny HERAULT : Examinateur.
REMERCIEMENTS
Je tiens tout d'abord à remercier les membres de mon jury :
- Madame Annick MONTANVERT, du TIMC-INFODIS, professeur à l’université Pierre
Mendès-France, pour m'avoir fait l'honneur de présider mon jury ;
- Monsieur Jean-Pierre COQUEREZ, de l’Equipe Traitement des Images et du Signal,
professeur à l’ENSEA, et Monsieur Simon THORPE, du Centre de Recherche Cerveau et
Cognition, directeur de Recherche CNRS, pour avoir accepté d'être les rapporteurs de cette
thèse ;
-Monsieur Jeanny HERAULT, du LIS, Professeur à l’université Joseph-Fourier et directeur de
cette thèse, qui a su à la fois me guider et me conseiller au cours de ces trois années, tout en
me laissant à chaque fois libre de mes choix ;
- Monsieur Denis PELLERIN, du LIS, Maître de conférence à l’université Joseph-Fourier, et
codirecteur de la thèse, pour son encadrement dynamique et chaleureux, pour sa disponibilité
et ses avis toujours éclairés ;
Cette thèse s'étant déroulée au laboratoire de Traitement d'Images et de
Reconnaissance de Formes, devenu maintenant Laboratoire des Images et des Signaux, je
tiens à remercier tous ses membres pour la bonne ambiance qui y règne, et tout
particulièrement la bande des corbeaux.
Je remercie d'autre part, Patricia, Ali, Anne, Carlos, Nabil, Aude, Boubakar, David et
bien d'autres, pour les discussions fructueuses que nous avons échangées.
Je remercie également Océ Industries et ses employés qui m'ont soutenu lors de la
rédaction de ce manuscrit.
Enfin, je suis tout particulièrement reconnaissant envers Virginie pour son aide et ses
longues relectures qui m'ont permis d'achever ce travail, et envers Louis, Carlos, Frédéric, et
Sylvain pour les moments de détentes qu'ils ont sus me faire partager.
TABLE DES MATIERES
1 NOTATIONS 5
2PERCEPTION FREQUENTIELLE DU SYSTEME VISUEL 10
2.1Une perception multidimensionnelle10
2.2Le système visuel11
2.2.1Cheminement et élaboration de l’information visuelle11 2.2.2 L’échantillonnage spatialement variable de la rétine14
2.2.3 Organisations géométrique et modulaire de l’aire visuelle primaire16
2.3 Modèles d’analyse fréquentielle19
2.3.1 Modélisation des champs récepteurs de l’aire visuelle primaire V1 20
2.3.2 Effet de la projection rétine-cortex sur le profil d’un champ récepteur22
2.3.3 Vers un modèle des champs récepteurs de V1 en hyper-colonnes26
2.4 Conclusion 28
3FILTRAGE SPATIALEMENT VARIANT PERIODIQUE29
3.1Introduction29
3.2Etat de l'art du filtrage spatialement variant30
3.3Réponse impulsionnelle d’un filtrage spatialement variant 32
3.4 Méthode de filtrage spatialement variant basée sur une projection34
3.4.1 Effet d’un changement d’échelle34
3.4.2 Influence de la projection sur la réponse impulsionnelle35
3.4.3 Exemple 1D 38
3.4.4Bande passante globale39
3.5L’étape de projection périodique41
3.5.1Synthèse d’une fonction de projection non linéaire et périodique41
3.5.2Périodicité de la projection43
3.5.3Taux d’agrandissements45
3.5.4Exemples de projections périodiques 1D46
3.5.5Exemples de projections périodiques 2D : orthogonale et hexagonale 47
3.5.6Analogie entre projection et modulation de fréquence50
3.6étape de filtrage spatialement invariant53
3.7 étape de projection réciproque55
3.8 Modélisation fréquentielle 56
3.8.1 Equations de linéarisations56
3.8.2 Exemple d’un filtre spatialement invariant 1D de Gabor58
3.8.3 Exemple d’un filtrage spatialement variant 2D de Gabor61
3.8.4 Limite de la linéarisation64
3.9 Conclusion67
4 SYNTHESE DU BANC DE FILTRES68 4.1 Représentation temps-fréquence et analyse par ondelettes 68
4.2 Principe d’un banc de filtres spatialement variant71
4.2.1 Couverture d’un secteur fréquentiel par un seul filtrage71
4.2.2 Couverture d’une bande fréquentielle partrois filtrages75
4.2.3 Amélioration de l’échantillonnage spatial77
4.2.4 Représentation spatiale du banc de filtres spatialement variant78
4.3 Les choix d’une implémentation numérique80
4.3.1 Projection d’un signal discret 80
4.3.2 Effet de ré-échantillonnage à pas variable de la projection84
4.3.3 Implémentation du filtrage spatialement invariant88
4.3.4 Choix des paramètres du banc de filtres90
4.3.5 Trois exemples du banc de filtres spatialement variant93
4.4 Qualité du banc de filtres95
4.4.1 Analogie entre le banc de filtres SV et les ondelettes95
4.4.2 Comparaison avec une famille d’ondelettes de Morlet 2D 97
4.5 Conclusion 100
5SEGMENTATION DE TEXTURES102
5.1Introduction102
5.2choix d’attributs discriminants103
5.3Extraction de caractéristiques fréquentielles103
5.3.1Critères d’homogénéité de la texture103
5.3.2Sélection du banc de filtres104
5.3.3Energie moyennée du banc de filtres104
5.4 Algorithme de segmentation par classification 107
5.4.1 Principe de l’algorithme de segmentation107
5.4.2 Etape de composition de la base d’apprentissage107
5.4.3 Etape de partitionnement de la base par quantification vectorielle108
5.4.4 Etape de catégorisation des vecteurs et des positions spatiales110
5.5 Vers un modèle de segmentation112
5.5.1 Les motivations de notre modèle112
5.5.2 Interpolation des vecteurs frontières112
5.5.3 Confiance attribuée à la catégorisation d’un vecteur113
5.5.4 Choix d’un regroupement spatial114
5.5.5 Catégorisation de chaque position spatiale 114
5.6 résultats de segmentations de textures naturelles115
5.6.1 Etude du critère d’homogénéité116
5.6.2 Comparaison de la sensibilité aux orientations120
6 CONCLUSION123
7 BIBLIOGRAPHIE 125
1 NOTATIONS
n´ espace de réels de dimension n ( n = 1 ou n = 2 )
n
Fsous espace de ´ , espace des fréquences
x , y , u , f , a vecteurs de n composantes (notation en gras pour les vecteurs et matrices) i
{x } ensemble de N échantillons i i=1..N
w , Ppulsation et période
n
distribution spatiale de signaux, de ´ fi ´ s(x), p(x), q(x), e(x)
, P(f ) réponses fréquentielles des signaux S(f ) s(x), p(x)
ta transposé de la matrice a
Ntaille de l’image source e(x) e
PROJECTION :
- 1 n n[ ] [ ]M , M opérateur continu et bijectif de projection de fi , et sa réciproque
nS T, espace source et espace projeté, sous espace de ´
[ ]Jacobien de la projection M , matrice de (n,n) J M(x)
n( )xdistribution spatiale de déformation, de fi
( )N matrice n,m de périodicité, avec m le nombre de vecteurs de périodicité
Ppériode de la projection, si les vecteurs de périodicité ont le même module M
( )rvecteur m,1 d’entiers relatifs
K , K taux d’agrandissement de surface et linéaires ( )M x M(x)
coefficient réel et positif de déformation
FILTRAGE SPATIALEMENT INVARIANT (SI) :
[ ]Gopérateur de filtrage SI
[ ]g(y) , G(f) , G(f) réponse impulsionnelle, fréquentielle, et d’amplitude du filtre SI G
[ ]f , , fréquence centrale, orientation et écart-type du filtre SI de Gabor G g g g
B(g )bande passante du filtre SI
T taille du masque de convolution g
q
s
q
q
g
j
´
´
F
´
´FILTRAGE SPATIALEMENT VARIANT (SV) :
H [ ] G [ ] q opérateur de filtrage SV, associé au filtrage SI (absence de en 1D)
, , réponse impulsionnelle, fréquentielle, et d’amplitude d’un filtre SV extrait de la h (y) H (f ) H ( )fx x x
position spatiale x (Représentation unilatérale ) H (f) = 2 ˛ ( f )TF h (y)[ ]x x
f ~ , ~ fréquence centrale, orientation du filtre SV de Gabor, d’enveloppe gaussienne
h h
orientée selon l’angle b ~ et d’écart-type ~ et ~
h h 1 h 2
~
B hbande passante d’un seul filtre SV, extrait de la position spatiale x ( )x
~
bande passante globale d’un ensemble de N filtres SV B h( ){ x }
i
i=1 N
EQM(H )erreur Quadratique Moyenne (EQM) d’un filtre SV extrait de la position spatiale x x
( )EQM H erreur maximale de EQM(H ) x
ALGORITHME DE SEGMENTATION :
V base de vecteurs de caractéristiques { }j
Wdictionnaire de prototypes { }k
Nnombre de partitions de la base W
K V classe affectée au vecteur V ( )j jv
K xclasse affectée à la position x ( )j jx
C V confiance portée sur la décision d’affecter la classe K V au vecteur V ( ) ( )j j jv v
C x ,kconfiance portée sur la décision d’affecter la classe k à la position x ( )x n n
C x confiance portée sur la décision d’affecter la classe K x à la position x ( ) ( )j j jx x
q
q
s
s
q
q
q
q
q
q
INTRODUCTION
La vision est le système de perception du monde extérieur le plus complexe et le plus
développé chez le vertébré. Entre le moment où un rayon lumineux frappe la rétine au fond de
l'oeil et le moment où se forme une "image dans le cerveau", s'écoulent quelques
millisecondes pendant lesquelles l'information lumineuse reçue par l'oeil subit des
prétraitements successifs. La durée minimale d’exposition d’un objet en vue de sa
reconnaissance n’est que de cent millisecondes. Cette image est captée par 130 millions de
photorécepteurs, ce qui constitue 70% des récepteurs de notre corps. Le système visuel
devance largement les systèmes vidéos qui comptent au mieux 50 fois moins de
photorécepteurs. Environ 15% de la surface du cortex cérébral dévolue pour la vision, est
mobilisée pour réaliser ce type de performance. Il s’agit du calculateur parallèle en temps réel
le plus efficace que l’on connaisse. Le système visuel nous offre une représentation
multidimensionnelle de notre environnement, celle-ci étant à la fois spatiale