Escolar Documentos
Profissional Documentos
Cultura Documentos
*
Eléments de statistique :
- Définition :
La statistique est une science d’observation, de classement, de synthèse et
d’interprétation des grandeurs observées.
Notion de base
Population statistique :
On appelle population statistique ou univers statistique, un ensemble d’éléments
sur lesquels porte l’étude statistique envisagée.
- Echantillon :
On appelle échantillon statistique, un sous ensemble prélevé dans la population,
dont il présente un minimum de caractéristiques. Pour des raisons de cout, temps
ou commodité, on est souvent amené à faire l’étude statistique sur une partie
seulement de la population.
- Unité statistique :
On appelle unité statistique ou individu statistique un élément quelconque de la
population.
Exemple :
L’ensemble des factures émises dans le mois constitue la population. Une facture
quelconque de cette population constitue l’individu.
- Caractère statistique :
Un individu donné dans la population peut être étudié suivant un deux ou plusieurs
caractères.
Exemple :
*
Si nous considérons l’ensemble des employés d’une entreprise, un employé peut
être étudié suivant son AGE, SEXE, ANCIENNETE, SALAIRE, MENSUEL,
etc.…
- Tableau Récapitulatif :
*
- L’effectif :
Exemple :
• Variable x étudiée : les étudiants en économie
• Echantillon n = 1000 Etudiants
• Effectif des étudiants en économie ni = 250
• Fréquence fi = ni/n = 250 / 1000 = 0.25
Donc 25% des étudiants études l'économie
APPLICATION 1
On relève la situation familiale de 20 personnes âgées de plus de 40 ans et on
obtient la série suivante :
10 4 8 8 4 8 10 10 10 10
0 10 4 4 8 10 10 4 10 10
T.A.F. : déterminer :
Population, sa taille et l’individu statistique ;
Caractère et sa nature ;
Modalités, leur nombre, l’effectif et la fréquence de chaque modalité.
*
- Cas d’une seule variable :
Le tableau brut se présente sous la forme suivante :
Individu Variable
1 X1
2 X2
3 X3
. .
. .
. .
n Xn
*
• Sa représentation par tableau est alors comme suit :
*
2. Comment calculer les effectifs cumulés ?
Exemple :
Dans un centre de vacances, l'âge des adolescents se répartit de la
façon suivante :
Âge Effectif
[13 ; 14[ 8
[14 ; 15[ 12
[15 ; 16[ 16
[16 ; 17[ 14
*
Dans ce chapitre, on analysera quatre de ces paramètres qui sont : les moyennes,
le mode, la médiane et le quantile.
1. Le mode
Définition :
On appelle Mode d'une série statistique une valeur du caractère dont l'effectif
associé est le plus grand. Dans un nuage de points, le mode est la valeur dont le
point est le plus haut.
*
Xi Effectif ni
10 2
15 3
20 8 Ici « 25 » Mode
25 17
30 13
35 5
40 3
TOTAL
Xi Effectif ni
100 à 110 8
110 à 120 22
La classe modale
120 à 130 38
130 à 140 12
140 à 150 6
TOTAL 86
*
2. médiane
Définition :
La médiane est la mesure de tendance centrale qui indique le centre de la
série de données. En d'autres mots, c'est la valeur qui sépare
une distribution ordonnée en deux groupes qui contiennent le même nombre
de données.
11+15
La médiane de la série est = 13
2
*
2 .2) Détermination de la médiane par
le graphique.
La médiane partage l’histogramme en deux
aires égales à ½.
Elle dépend plus du rang des unités
statistiques observées que des valeurs de la
variable, et se trouve peu affectée par les
variations des termes extrêmes.
Ce que vous pouvez observer sur les deux représentations graphiques
complémentaires.
Prenons un exemple : une distribution statistique a été après un contrôle
radar sur autoroute, on a classé les données ( regroupées en classes ) dans le
tableau suivant :
Vitesse ( km/h ) Nombre de véhicules
[80 ; 100 [ 120
[100 ; 120 [ 90
[120 ; 130 [ 100
[130 ; 140 [ 120
[140 ; 150 [ 40
[150 ; 170 [ 20
[170 ; 190 [ 10
Total 500
Total 500
*
3) moyenne
3 .1) Moyenne Arithmétique.
En général, la moyenne se calcule en faisant la somme de toutes
les données et en la divisant par le nombre de données de la
distribution.
Formule :
*
Dans une équipe sportive, l'âge des 30 athlètes est représenté dans le tableau
suivant.
(7×13)+(8×9)+(9×6)+(10×2)
Moyenne =
30
91+72+54+20
Moyenne =
30
237
Moyenne =
30
Moyenne = 7,9 ans par élève
Finalement, l'âge moyen des élèves de ce groupe est de 7,9 ans. (Ce qui équivaut
à 7 ans et presque 11 mois.)
*
Lorsque les données sont présentées en classes, il faut utiliser le
milieu de chacune d'elles. Par la suite, c'est avec ces nouvelles
valeurs médianes qu'il faudra faire les calculs.
(12,5×44)+(17,5×58)+(22,5×70)+(27,5×81)+(32,5×54)+(37,5×30)
Moyenne =
337
550+1015+1575+2227,5+1755+1125
Moyenne =
337
8247,5
Moyenne =
337
Formule
*
Voici un tableau qui présente les résultats du Hamza El Hamdaoui lors de ces
derniers examens ainsi que leur pondération respective.
Formule
*
Corrigé :
Première Méthode :
4
𝐺 = √22 ∗ 12 ∗ 50 = 6,999
Deuxième Méthode :
4 4
1 1
𝐥𝐨𝐠 (𝑮) = ∑ 𝑓𝑖 𝐿𝑜𝑔 (𝑥𝑖 ) = ∑ 𝑛𝑖 𝐿𝑜𝑔 (𝑥𝑖 ) = [2𝐿𝑜𝑔2 + 𝐿𝑜𝑔12 +
𝐼=1 4 𝐼=1 4
𝐿𝑜𝑔 50]=1,946
D’où G= 𝑒 1,946 = 7
*
3 .3) La moyenne harmonique :
Définition et propriété:
La moyenne harmonique , notée H, d’une distribution {(xi, ni)
1≤ i≤ k} est l’inverse de la moyenne arithmétique de la
𝟏
distribution : {(𝒙𝒊 , 𝒏𝒊) 𝟏 ≤ 𝐢 ≤ 𝐤}
Formule
Corrigé :
4
H= 1 1 1 = 3,625
(2∗ + + )
2 12 50
Formule
*
Corrigé :
1
Q=√ (2 ∗ 4 + 144 + 2500)=25,749
4
4) les Quartiles :
Définition :
Les quartiles permettent de séparer une série statistique en quatre groupes de
même effectif (à une unité près).
• Un quart des valeurs sont inférieures au premier quartile Q1.
• Un quart des valeurs sont supérieures au troisième quartile Q3.
On appelle intervalle interquartile l'intervalle ]Q1; Q3[.
On appelle écart interquartile la différence Q3 – Q1.
- Le premier quartile (noté Q1) : est la valeur d'une série qui est supérieure ou
égale à au moins 25 % des données de la série ordonnée de valeurs statistiques.
Appelons N le nombre des valeurs d'une série, et calculons 0,25*N = N/4.
Lorsque N/4 est entier, la valeur représentant le premier quartile est la 0,25ème
valeur.
Lorsque N/4 est un décimal non entier, on l'arrondit à l'entier supérieur p et alors
la valeur représentant le premier quartile est la p-ième valeur.
*
Exemple 2:
- Le troisième quartile (noté Q3) : est la valeur d'une série qui est
supérieure ou égale à au moins 75 % des données de la série
ordonnée de valeurs statistiques.
Lorsque 3N/4 est un décimal non entier, on l'arrondit à l'entier supérieur p et alors
la valeur représentant le troisième quartile est la p-ième valeur.
Exemple 2:
*
1) Etendue d’une série statistique :
Exemple :
Dans une classe de 25 élèves, on a répertorié le nombre de frères
et sœurs de chaque élève dans un tableau :
Nombre de frères et 0 1 2 3 4
sœurs
Effectifs 2 8 9 5 1
Etendue = 4 – 0 = 4.
L’étendue de cette série statistique est donc de 4.
2) L'intervalle interquartile .
Définition :
L'écart interquartile représente la différence entre Q3 et Q1.
*
3) variance et écart-type .
Définition :
Valeur x1 x2 …. Xp
Effectif n1 n2 …. np
Fréquence n1 f2 …. Fp
𝑛𝑖
Effectif total : N=n1+n2+…+np et fi=
𝑁
Exemples :
*
La taille moyenne est :
15∗8+2∗10+2.5∗25+3∗32+3.5∗19+4∗4+4.5∗2
𝑥̅ = = 2.82
100
1.52 ∗8+22 ∗10+2.52∗25+32 ∗32+3.52 ∗19+42 ∗4+4.52 ∗2
La variance V= − (2.822 )= 0.4426
100
4) COEFFICIENT DE VARIATION .
Définition
Le coefficient de variation (désigné par ) se définit par la relation
suivante :
*
Les 2 distributions (groupées) ayant pratiquement le même
écart-type, on pourrait avoir tendance à penser qu'elles
présentent la même dispersion. Mais, en y regardant de plus
près, on se convainc aisément qu'une perte ou un gain
de dhs n'aura pas le même impact pour le premier
magasin (pour lequel le bénéfice hebdomadaire moyen n'est
que de dhs et pour le second (pour lequel le bénéfice
hebdomadaire moyen s'élève à dhs.
Dans ces conditions, on peut penser recourir à la mesure de
dispersion relative qu'est le coefficient de variation.
*
1) Valeurs globales .
2) Médiale .
*
La courbe de Lorenz est située en dessous de cette diagonale de
référence. Plus la courbe est éloignée de la diagonale, plus la
répartition des revenus est inégalitaire
Exemple :
4)indice de Gini.
Définition
L'indice (ou coefficient) de Gini est un indicateur synthétique
d'inégalités de salaires (de revenus, de niveaux de vie...). Il varie
entre 0 et 1. Il est égal à 0 dans une situation d'égalité parfaite où
tous les salaires, les revenus, les niveaux de vie... seraient
égaux. A l'autre extrême, il est égal à 1 dans une situation la
*
plus inégalitaire possible, celle où tous les salaires (les revenus,
les niveaux de vie...) sauf un seraient nuls. Entre 0 et 1,
l'inégalité est d'autant plus forte que l'indice de Gini est élevé.
L’indice de géni se calcule en faisant le rapport :
Exercice :
Classes Ni
[3000 . 4000[ 22
[4000.5000[ 18
[5000.7000[ 47
[7000.10000[ 13
Total 100
TAF :
Corrigé :
Classes Ni fi fi Ci Xi Ni Xi Ni Xi Ni Xi
Cumulé Cumulé Cumulé%
[3000 . 4000[ 22 0.22 0.22 3500 77000 77000 14
[4000.5000[ 18 0.18 0.40 4500 81000 158000 28.7
[5000.7000[ 47 0.47 0.87 6000 282000 440000 79.9
[7000.10000[ 13 0.13 1 8500 110500 550500 100
Total 100 1 550500
*
1+2+3+4=1/2[(22x14) + (42.7 x18) + (108.6x 47) + (179.9x 13)]
=4259.75
S= 5000-4259.75 = 740.25
*
*
*
*
*
*
*