La lecture à portée de main
Description
Informations
Publié par | Nelaf |
Nombre de lectures | 131 |
Langue | Français |
Extrait
STATISTIQUES
I) Médiane et quartiles d'une série statistique quantitative
a) Cas d'une série statistique discrète
Dans ce cas, on dispose d'une famille de réels x ; x ; ... ; x que l'on a rangé dans l'ordre croissant :1 2 N
x x ... x (Certains de ces réels peuvent être confondus)1 2 N
Vocabulaire : x s'appelle le terme de rang 1 (ou d'indice 1), x le terme de rang (ou d'indice) i (1 i N)1 i
N représente l'effectif total.
On note (x ) cette famille de réels qu'on appelle encore "série statistique".i 1 i N
Exemples :
L'élève A a obtenu les 8 notes suivantes :
x = 5 x = 5 x = 6 x = 9 x = 10 x = 12 x = 13 x = 131 2 3 4 5 6 7 8
L'élève B a obtenu les 9 notes suivantes :
x = 2 x = 3 x = 5 x = 6 x = 8 x = 9 x = 9 x = 10 x = 101 2 3 4 5 6 7 8 9
L'élève C a obtenu les 10 notes suivantes :
x = 6 x = 6 x = 10 x = 12 x = 12 x = 13 x = 14 x = 15 x = 16 x = 161 2 3 4 5 6 7 8 9 10
L'élève D a obtenu les 11 notes suivantes :
x = 0 x = 0 x = 1 x = 4 x = 5 x = 8 x = 10 x = 12 x = 13 x = 16 x = 171 2 3 4 5 6 7 8 9 10 11
Définition 1 Médiane
On appelle médiane tout réel m tel que :e
au moins 50% des termes de la série ont une valeur inférieure ou égale à me
et
au moins 50% des termes de la série ont une valeur supérieure ou égale à me
On prouvera, ci-dessous (théorème 1), qu'un tel réel existe toujours !
Remarque : la médiane partage l'ensemble des termes en deux sous ensembles de même effectif. (Enfin presque !)
Exemples :
Pour l'élève A (N = 8) : m = x = 9 (x = 10 conviendrait également ou, plus généralement, tout réel de [9 ; 10])e 4 5
Pour l'élève B (N = 9) : m = x = 8 (et là, il n'y a pas d'autre choix possible)e 5
Pour l'élève C (N = 10) : m = 12,5 (ou tout réel de l'intervalle [x ; x ] = [12 ; 13])e 5 6
Pour l'élève D (N = 11) : m = 8 (et là, il n'y a pas d'autre choix possible)e
On constate que la détermination de la médiane est différente suivant que l'effectif total N est pair ou impair :
• Lorsque l'effectif total N est impair, il n'y a pas de difficulté, la médiane m est le terme central, à savoir lee
N + 1
terme de rang . On a donc : m = x .e N +12
2
Statistiques Page 1 G. COSTANTINI http://bacamaths.net/• Lorsque l'effectif total N est pair, l'usage veut que l'on choisisse pour médiane m la moyenne des deuxe
x + xN N +1N N 2 2termes centraux, à savoir : les termes de rang et + 1. On a donc : m = .e
2 2 2
Mais tout réel de l'intervalle [x ;x ] conviendrait également. (En effet, dans certaines situations, laN N
+1
2 2
moyenne des deux termes centraux, qui n'est pas une valeur de la série, n'a pas de sens : par exemple, quel
est le jour médian du mois de juin ? Le mois de juin comporte 30 jours. Les deux termes centraux sont 15 et
ème ème ème16 (15 jour et 16 jour). Dire que "le jour médian est le 15,5 " n'a pas de sens. Mieux vaut dire (dans
ème èmece type de situation) : "le jour médian est le 15 jour" ou "le jour médian est le 16 jour" (au choix !) ...)
x x+21 22Exemple : si N = 29 alors m = x ; si N = 42 alors m = .e 15 e
2
Exercice : quelle est la médiane de la série suivante : x = 1 x = 1 x = 1 x = 1 x = 1 ?1 2 3 4 5
Définition 2 Quartiles
On appelle premier quartile tout réel Q tel que :1
au moins 25% des termes de la série ont une valeur inférieure ou égale à Q1
et
au moins 75% des termes de la série ont une valeur supérieure ou égale à Q1
On appelle troisième quartile tout réel Q tel que :3
au moins 75% des termes de la série ont une valeur inférieure ou égale à Q3
et
au moins 25% des termes de la série ont une valeur supérieure ou égale à Q3
On prouvera, ci-dessous (théorème 1), que de tels réels existent toujours !
Remarques :
• Le deuxième quartile Q ne se défini pas puisqu'il s'agit de la médiane m .2 e
• Les trois quartiles partagent l'ensemble des valeurs en quatre sous ensembles de (presque) même effectif.
• On a toujours : Q m Q .1 e 3
Exemples :
Pour l'élève A, on peut choisir : Q dans [x ; x ] = [5 ; 6] et Q dans [x ; x ] = [12 ; 13]1 2 3 3 6 7
Pour l'élève B, on a : Q = x = 5 et Q = x = 9 (pas d'autres choix possibles)1 3 3 7
Pour l'élève C, on a : Q = x = 10 et Q = x = 15 (pas d'autres choix possible)1 3 3 8
Pour l'élève D, on peut choisir : Q = x = 1 et Q = x = 13 (pas d'autre choix possible)1 3 3 9
Statistiques Page 2 G. COSTANTINI http://bacamaths.net/On constate que la détermination des quartiles est différente suivant que l'effectif total N est un multiple de 4
ou non :
• Lorsque l'effectif total N n'est pas un multiple de 4, il n'y a pas de difficulté, les quartiles Q et Q sont les1 3
N 3N
termes de rang immédiatement supérieur à et :
4 4
Q = x Q = x1 3N 3NØ ø Ø ø+1 +1Œ Œœ œ4 4º ß º ß
• Lorsque l'effectif total est un multiple de 4, alors l'usage veut que l'on choisisse pour quartiles Q et Q les1 3
N 3N
termes de rang et de rang . On a donc Q = x et Q = x . Mais tout réel de l'intervalle1 3N 3N4 4
4 4
[ x ; x ] conviendrait également pour Q et tout réel de l'intervalle [x ;x ] conviendrait1N N 3N 3N+1 +1
4 4 4 4
également pour Q .3
Exemple : si N = 29 alors Q = x et Q = x ; si N = 44 alors Q = x et Q = x .1 8 3 22 1 11 3 33
Voici un théorème qui donne des formules qui marchent dans tous les cas !
Théorème 1
*Soient N ˛ et (x ) une famille de réels ordonnés dans l'ordre croissant. Les réels :i 1 i N
Q = x m = x Q = x1 e 3N N 3NØ ø Ø ø Ø ø+1 +1+1Œ œ Œ œ Œ œ4 2 4º ß º ß º ß
définissent toujours des valeurs convenables pour le premier quartile, la médiane et le troisième quartile.
Pour démontrer ce théorème, on aura besoin du petit lemme suivant :
Lemme
Soient A et B des éléments de avec A B. L'ensemble A ; B contient B - A + 1 entiers.
Preuve du lemme :
L'ensemble A ; B contient autant d'entiers que l'ensemble A - A + 1 ; B - A + 1 = 1 ; B - A + 1 qui lui
même en contient B - A + 1.
Démonstration du théorème 1 :
Pour tout réel l, notons E(l) = {i ˛ 1 ; N tels que x l} et F(l) = {i ˛ 1 ; N tels que x l}i i
E(l) est l'ensemble des indices des termes de la famille (x ) qui sont inférieurs à l et F(l) est l'ensemblei 1 i N
des indices des termes de la famille (x ) qui sont supérieurs à l.i 1 i N
Posons : Q = x m = x Q = x1 e 3N N 3NØ ø Ø ø Ø ø+1 +1+1Œ œ Œ œ Œ œº 4 ß º 2 ß º 4 ß
Montrons que m est une valeur convenable pour la médiane : soit i ˛ 1 ; Ne
Statistiques Page 3 G. COSTANTINI http://bacamaths.net/
Ø N Ø Nø øx m Û x x Û 1 i + 1 Û i ˛ 1 ; + 1i e i NØ ø Œ œ Œ œ2 2+1 º ß º ߌ œ2º ß
Ø N ø Ø N ø
Or, dans 1 ; + 1 il y a + 1 entiers.Œ œ Œ œ2 2º ß º ß
NØ ø
Donc Card(E(m )) = + 1e Œ œ2º ß
Ø N N Ø N Nø øOr, + 1, donc : Card(E(m )) eŒ œ Œ œ2 2 2 2º ß º ß
De même :
Ø N Ø Nø øx m Û x x Û N i + 1 Û i ˛ + 1 ; Ni e i NØ ø Œ œ Œ œ2 2+1 º ß º ߌ œ2º ß
Ø N ø Ø N ø
Or, dans + 1 ; N il y a N - entiers.Œ œ Œ œ2 2º ß º ß
NØ ø
Donc Card(F(m )) = N - e Œ œ2º ß
Ø N ø N Ø N ø Ø N ø N Ø N ø N N
Or, + 1 donc - - et en ajoutant N : N - donc Card(F(e )) .mŒ œ Œ œ Œ œ Œ œ2 2 2 2 2 2 2 2º ß º ß º ß º ß
On a donc bien :
au moins 50% des termes de la série ont une valeur inférieure ou égale à me
et
au moins 50% des termes de la série ont une valeur supérieure ou égale à me
Donc m est bien une valeur médiane de la série.e
Montrons que Q est une valeur convenable pour le premier quartile : soit i ˛ 1 ; N1
N NØ ø Ø ø
x Q Û x x Û i + 1 Û i ˛ 1 ; + 1i 1 i Ø N ø Œ œ Œ œ+1 4 4º ß º ߌ œ4º ß
N NØ ø Ø ø
Or, dans 1 ; + 1 il y a + 1 entiers.Œ œ Œ œ4 4º ß º ß
NØ øDonc Card(E(Q )) = + 11 Œ œ4º ß
N N N NØ ø Ø ø
Or, + 1, donc : Card(E(Q )) 1Œ œ Œ œ4 4 4 4º ß º ß
De même :
N N