07/10/2010METHODOLOGIE STATISTIQUEMounir MesbahCOURS 1http://www.lsta.upmc.fr/mesbah/document_pedagogiques/ISUP/CESAM/METHODO.htmMardi 5Octobre 2010METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010La variabilité est la règle dans les sciences de la viePage : 2107/10/2010METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010Exemple 1Répartition des poids de naissance de 2673 nouveau‐nésPage : 3METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010Exemple 2Nombres de malades observés sur 10 000 échantillons de 20 sujets tirés d’une population où le pourcentage vrai de malades est 30%Page : 4207/10/2010METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010Fluctuations d’échantillonnage : les observations varient (au hasard) d’un échantillon à l’autrePage : 5METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010Conséquences des fluctuations d’échantillonnage(1)• On ne peut pas donner une seule valeur pour une variable telle que le poids de naissanceil faut des indices pour résumer les observations :moyenne, variancePage : 6307/10 ...
COURS 1 http://www.lsta.upmc.fr/mesbah/document_pedagogiques/ISUP/CESAM/METHODO.htm
Mardi 5 Octobre 2010
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
La variabilité est la règle dans les sciences de la vie
Page : 2
07/10/2010
1
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010 Exemple 1 Répartition des poids de naissance de 2673 nouveau ‐ nés
Page : 3
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010 Exemple 2 Nombres de malades observés sur 10 000 échantillons de 20 sujets tirés dune population où le pourcentage vrai de malades est 30%
Page : 4
07/10/2010
2
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Fluctuations déchantillonnage : les observations varient (au hasard) dun échantillon à lautre
Page : 5
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Conséquences des fluctuations déchantillonnage On ne peut pas donner une seule valeur pour une variable telle que le poids de naissance il faut des indices pour résumer les observations : moyenne, variance
Page : 6
07/10/2010
3
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Conséquences des fluctuations déchantillonnage (2) Les conclusions quon peut tirer concernant un échantillon sont sujettes à erreur Le pourcentage de malades dans un échantillon de 20 sujets est compris entre 15% et 50% mais seulement pour 95% des échantillons.
n erva e e uc ua on
Page : 7
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Page : 8
07/10/2010
4
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
A partir dun échantillon, on ne doit pas donner une est mat on un que un pourcentage ou une moyenne , mais un intervalle : un intervalle de confiance
Page : 9
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Conséquences des fluctuations déchantillonnage (3) La comparaison de pourcentages (ou de moyennes) observés nécessite des précautions : Tests statistiques
Page : 10
07/10/2010
5
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Les méthodes statistiques permettent de prendre en compte : la variabilité individuelle et .
Page : 11
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Le raisonnement se fait au niveau de groupes de sujets.
La constitution de ces groupes conduit souvent à
Page : 12
07/10/2010
6
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Population, échantillon, variable aléatoire
Page : 13
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Les différents types de variables :
Page : 14
07/10/2010
7
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Variables quantitatives scr tes ‐ nombre denfants dune famille ‐ âge en années continues ‐ poids ‐
Page : 15
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Variables qualitatives ordinales ‐ niveau détude ‐ stade de gravité dune maladie nominales ‐ malade/non malade ‐ groupe sanguin ‐ sexe ‐ catégorie socio ‐ professionnelle
Page : 16
07/10/2010
8
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Représentation des variables qualitatives
Page : 17
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
ar a e c otom que ma a e non ma a e On donne : ‐ le pourcentage P de malades dans la population ‐ lhistogramme du nombre de malades dans un échantillon de n sujets
Page : 18
07/10/2010
9
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010 Pourcentage de malades dans la population : P = 30%
Page : 19
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
La loi de probabilité suivie par le nombre de malades observé sur un échantillon est la loi binomiale. Elle donne la probabilité dobserver k malades dans un échantillon de n sujets (connaissant le pourcentage P de malades dans la population) = = n ‐ ‐ = n n ‐ ‐ ‐
Page : 20
07/10/2010
10
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010 Représentation des variables quantitatives Faire des classes et un histogramme Histogrammes des poids de naissance des 2673 enfants nés à la maternité de Haguenau (Bas ‐ Rhin) en 1984 et 1985 en fonction de la largeur des classes de poids.
Attention : léchelle des ordonnées de cette figure est différente de celle des suivantes . Page : 21
METHODOLOGIE STATISTIQUE Cours 1 Mardi 5 Octobre 2010
Moyenne, variance Loi de probabilité Attention : léchelle des ordonnées de ces figures est différente de celle de la précédente . Page : 22