Você está na página 1de 51

STATISTIQUE DESCRIPTIVE

Mme J.Elalaoui
EMI

Plan squentiel du cours


Sance 1 : Calcul de probabilits et variables
alatoires. Lois usuelles.
Sance 2 : Couples et vecteurs alatoires, loi
des grands nombres et thorme central
limite.
Sance 3 : Statistiques descriptives (srie
simples et doubles ; rgression)
Sance 4 : Echantillonnage, estimation et tests
statistiques.
Sance 5 : Applications et utilisation dEXCEL.
Sance 6 : Evaluation.

La Statistique Descriptive est


l'ensemble des mthodes et
techniques permettant de
prsenter, de dcrire, de rsumer,
des donnes nombreuses et
varies.

Il faut prciser d'abord quel est l'ensemble


tudi, appel population statistique,
dont les lments sont des individus ou
units statistiques.
Chaque individu est dcrit par une ou
plusieurs variables, ou caractres
statistiques.

Chaque variable peut tre, selon le cas :

Quantitative : ses valeurs sont des


nombres exprimant une quantit, sur
lesquels les oprations arithmtiques
(somme, etc...) ont un sens.
La variable peut alors tre discrte ou
continue selon la nature de l'ensemble
des valeurs qu'elle est susceptible de
prendre (valeurs isoles ou intervalle).

Qualitative : ses valeurs sont des


modalits, ou catgories, exprimes sous
forme littrale ou par un codage
numrique sur lequel des oprations
arithmtiques n'ont aucun sens.

Tableau statistique simple entre


Cas discret
Exemple:
Distribution statistique du
personnel dune entreprise
daprs le nombre denfants
charge

Nb denfants
charge xi

Effectifs ni

0
1
2
3
4
5
6
7
8
9
10

1
2
5
10
20
23
25
15
10
5
5

ni = n

121

Effectif :
Nombre d'individus pour lesquels une
variable statistique a pris une valeur
donne. Si, sur 121employs,15 ont 7
enfants charge, on dira que l'effectif n i
correspondant la valeur xi = 7 de la
variable "nombre d'enfants charge est
15 .

Frquence:
Le rapport de leffectif ni correspondant la
valeur xi du caractre par leffectif total est
appele frquence et est not f i .
f i = n i /n

o n = ni

Cas continu
Exemple 2:
Dure dun audit en nombre de
jours sur un chantillon de
40 entreprises

Classe

Effectif

Frquence

Frquence
cumule

[10,15]
[16,20]
[21,25]
[26,30]
[31,35]

8
16
10
4
2

0,2
0,4
0,25
0,1
0,05

0,2
0,6
0,85
0,95
1

Total 40

Classes :
Intervalles de valeurs d'une variable
continue. L'ensemble des classes
forment une partition de l'ensemble des
valeurs possibles de la variable.
Chaque valeur observe de la variable
doit appartenir une classe et une
seule.

Effectif: nombre ni dindividus


appartenant la classe [ei , ei+1 [
EX: 8 entreprises ont une dure
daudit comprise entre 10 et 15
jours.

Amplitude d'une classe (ou


d'un intervalle) :
C'est la longueur de l'intervalle.
L'amplitude de la classe [ei , ei+1
[ est: ei+1- ei

Histogramme

Caractristiques de tendance
centrale
Moyenne: Considrons la srie statistique(xi,ni); la
moyenne mesure la tendance centrale et est dfinie par:

Si la variable statistique est


continue groupe en classes et si
on note xi le centre de la classe
[ei , ei+1 [ ,la moyenne est
donne par:

La mdiane: Elle correspond la valeur

centrale une fois les observations classes


par ordre croissant.
Si nb observations impair alors
mdiane=valeur centrale
Si nb observations pair alors
mdiane=moyenne des 2 valeurs
centrales.

Exemple: cours dune action en une


semaine:
j1
j2
j3
j4
j5
1200
1150 1180 1200 1210
On classe par ordre croissant:
1150
1180 1200 1200 1210

Le mode: valeur de la variable


laquelle correspond leffectif le
plus grand.
Exemple: cours dactions
1200, 1150, 1180, 1200, 1210
Mode= 1200

Percentiles: Ils donnent les informations


sur la manire dont les observations sont
rparties dans lintervalle( entre la plus
petite et la plus grande)
Le pime percentile est une valeur telle
quau moins p% des observations ont une
valeur infrieure ou gale cette valeur et
au moins (1-p)% des observations ont
une valeur suprieure cette valeur.

Calcul du pime percentile:


- Classer les donnes par ordre
croissant
- Calculer lindice i tel que i=(p/100).n
- La position du pime percentile
correspond lentier >i

Quartiles: Les quartiles sont des


percentiles particuliers.
On divise les donnes en 4; les points de
division sont appels quartiles
Q1: 1er quartile = 25me percentile
Q2: 2me quartile = mdiane=50ime
percentile
Q3: 3me quartile= 75ime percentile

Exemple: Les salaires de 12 employs dune


entreprise:
2350 2450 2550 2380 2255 2210 2390
2630 2440 2825 2420 2380 (nb pair
dobservations)
1) Dterminons les 3 quartiles:
a) On classe les donnes:
2210 2250 2350 2380 2380 2390 2420
2440 2450 2550 2630 2825

b) pour Q1: i = (25/100).12 = 3 donc Q1=


(2350+2380)/2= 2365
-pour Q2 : i= (50/100).12 = 6 donc Q2=
(2390+2420)/2= 2405
-pour Q3 : i= (75/100).12 = 9 donc Q3=
(2450+2550)/2= 2500
2) 85me percentile?
i= (85/100). 12 = 10,2 ; on arrondit: i= 11 ce
qui correspond 2630

Dans le cas continu:


Q1, Q2, Q3 correspondent respectivement
des frquences cumules de 0,25 ; 0,5 ;
0,75.
Pour les valeurs intermdiaires, on fait une
interpolation

Exemple
classes

effectifs Effectifs
cumuls

fi

Fi

[1,5 ; 1,6 [

60
280

60
340

0,030
0,140

0,030
0,170

[1,6 ; 1,7 [

900

1240

0,450

0,620

[1,7 ; 1,8 [

600

1840

0,300

0,920

[1,8 ; 1,9 [

140

1980

0,070

0,990

[1,9 ; 2,0 [

14
6

1994
2000

0,007
0,003

0,997
1

[1,4 ; 1,5 [

[2,0 ; 2,1 [

Dterminons par exemple le 3e quartile Q3..


On fait une interpolation entre les classes
[1,6 ; 1,7 [ et [1,7 ; 1,8 [
(0,75 0,620) / (0,920 - 0,620)
= (Q3 1,7) / (1,8 - 1,7)
Do Q3 = 1,7+ 0,1. 0,13/0,3 = 1,74

tendue: plus grande- plus


petite valeur
Pour lexemple sur les salaires
demploys dune entreprise,
Ltendue= 2825-2210= 615

Intervalle interquartile: Q3- Q1


Cet intervalle contient la moiti
centrale des observations

Caractristiques de dispersion
Dispersion :
Un paramtre statistique est dit de
dispersion s'il s'agit d'un nombre cl
rsumant la plus ou moins grande
disparit des observations, leur plus ou
moins grande variabilit de part et d'autre
de la tendance centrale : tendue, carttype sont des paramtres de dispersion

cart type S: mesure lcart entre les


valeurs observes et leur moyenne.
Variance:carr de lcart type

Remarque: La variance
empirique (de lchantillon) diffre
de celle de la population par un
facteur de corrlation et
(S*)2 =nS2/n-1

Moments:
On appelle moment centr
dordre k :
k= fi (xi x)k
o fi = ni/n ; x tant la moyenne

Remarque: - si k= 2 , on
retrouve la variance
- si k= 3, 3 est une
caractristique de dissymtrie
Pour une dissymtrie
gauche,3 >0 et droite 3 <0

Variable qualitative
Elle est reprsente par un
diagramme circulaire appel aussi
camembert.
Les modalits sont reprsentes
par des portions de disque
proportionnelles leur effectif, ou
leur frquence.

Exemple de variable qualitative


Modalits

Effectifs

Clibataire
Mari
Divorc
Veuf

35
40
15
10

Diagramme circulaire

Liaison entre deux variables


On considre deux caractres
X et Y; les valeurs observes
pour X sont : x1,.,xN et pour
Y: y1,.,yN
Exemple: X et Y prix de deux
actifs

Xi

yi

12
15
19
11
14
16
9
13

55
65
88
40
70
66
50
87

Covariance
On dfinit la covariance des deux
variables X et Y par:

Nuage de points:

Rgression linaire simple


Droite des moindres carrs:
La "meilleure droite" est celle qui
minimise la somme S des carrs
des distances verticales entre la
droite et les points
exprimentaux.

Objectif:
Ajuster une droite dont lquation est du
type:
y*= a x +b
On choisit a et b tels que
di2= ( yi yi*)2
i

soit minimale.

Exemple
X

X-Xm

Y-Ym

(X-Xm)(Y-Ym)

(X-Xm)2

100

40

-300

-20,71

6214

90000

200

50

-200

-10,71

2143

40000

300

50

-100

-10,71

1070

10000

400

70

9,29

500

65

100

4,29

429

10000

600

70

200

9,29

1857

40000

700

80

300

19,29

5786

90000

Xm= 400

Ym=60,71

(X-Xm) = (Y-Ym) =0
(X-Xm)(Y-Ym) = 17500
(X-Xm)2 = 280000
a= 17500/280000 = 0,065
b= 60- 0,065. 400 =35,71
y* = 0,065.x + 35,71

Corrlation linaire
Coefficient de corrlation linaire:
Le coefficient r de corrlation linaire
mesure lintensit de la relation linaire
entre les deux variables X et Y.

r= Cov(X,Y)/SXSY
-1 r 1

Remarque:
Si r< 0 , X et Y varient dans le sens
contraire
Si r> 0, X et Y varient dans le mme sens
Si r= 1 , les points sont sur une mme
droite (corrlation linaire parfaite)
Si r= 0 , corrlation linaire nulle.

Exercice:
Le service charg de lorganisation du travail dans une
entreprise a observ le nombre de pices fabriques en
4 heures par chacun des 50 ouvriers dun atelier et a
obtenu les rsultats suivants :
87 80 107 91 83 90 91 93 107 95
85 86 98 104 107 85 109 120 102 83
88 107 87 115 103 89 74 89 86 92
97 118 102 122 97 98 91 108 101 85
100 80 93 89 90 75 93 102 107 107

1)Reprsenter cette srie sous forme dune srie valeurs


isoles, en donnant la prsentation sous forme dun
tableau.
2)Dterminer dans le mme tableau les effectifs, les
frquences, les frquences cumules.
3)Tracer le diagramme en btons et prciser la courbe qui
peut grer la loi du phnomne tudi.
4)Calculer la moyenne, lcart type et la variance de cette
srie et tudier la dispersion de la srie autour de la
moyenne.
5)Regrouper les valeurs du caractre observ par des
classes damplitude 5.
6)Tracer lhistogramme de la srie obtenue.

Você também pode gostar