Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatística Descritiva
1. Introducción á estatística descritiva.
A Estatística é a ciencia que estudia o comportamento dos fenómenos de masas, observando as súas
regularidades. Para iso organiza e analiza información obtida a través de observacións.
Poboación: Conxunto homoxéneo de obxectos que serán estudiados por unha investigación estatística.
Mostra: Subconxunto da poboación do que se teñen datos. Tamaño mostral: nº de elementos da mostra.
(a Estatística emprega os datos das mostras para sacar conclusións sobre a poboación)
Carácter: Cualidade observable común a tódolos elementos da poboación.
Se nunha investigación estatística só estudiamos un carácter dunha poboación, os posibles valores deste
carácter son unha variable estatística unidimensional, que se clasifican es tres tipos:
• Se o carácter é un atributo (non numérico) : variable estatística cualitativa.
Se o carácter toma →Só pode tomar un nº finito de valores: variable estatística cuantitativa discreta.
•
valores numéricos →Pode tomar infinitos valores: variable estatística cuantitativa continua.
EXEMPLO 2: Poboación:Matrimonios que viñeron vivir a Vilagarcía neste ano.(ningún ten máis de 3 fillos)
(var. cuantitativa Mostra: 40 matrimonios escollidos aleatoriamente. (tamaño 40)
discreta) Carácter: estudiarase o nº de fillos (var. cuantitativa con 4 posibles valores: 0, 1, 2, 3)
1
Intervalos de clase: Divisións do intervalo de variación dos valores. (poden ter distintas amplitudes)
Marcas de clase: Punto medio de cada intervalo de clase.
Frecuencias absolutas:Nº de elementos da mostra que teñen o valor en cada intervalo de clase.
frecuencia s absolutas
Frecuencias relativas: tamaño mostral
. Indican o peso de cada intervalo de clase.
Se é unha
variable Frecuencias acumuladas: Son a suma da frecuencia relativa dun intervalo máis as frecuencias
cuantitativa relativas de tódolos intervalos anteriores.
continua Densidades de frecuencia = frecuencia relativa
deben amplitude do int ervalo
escribirse •EIXE Y: As densidades de frecuencia.
•EIXE X: O intervalo de variación dos valores.
Histogramas: •Sobre cada intervalo de clase represéntase un rectángulo con base o intervalo e
altura a densidade de frecuencia.
•A área de cada rectángulo coincidirá coa frec. relativa. A área total será 1.
•EIXE Y: As frecuencias acumuladas.
•EIXE X: O intervalo de variación dos valores.
Polígono de
frecuencias: •Sobre cada intervalo de clase represéntase un rectángulo con base o intervalo e
altura a frecuencia acumulada. (o último rectángulo terá altura 1)
•Únense os puntos medios da base superior de cada rectángulo.
Frec. Frec.
Valores
Absoluta Relativa
EXEMPLO 1
(Se na mostra 6
Home 60 Gráfico de sectores:
había 60 homes e 10
40 mulleres) 4 Mulleres
Muller 40
10
Homes
25
20
Frec. Frec. Frec. Diagrama 15
Valores
Absoluta Relativa Acumulada Barras 10
EXEMPLO 2 20 1 20 1 frec.absolutas
0 20 = = 5
(Se na mostra 40 2 40 2 0
había 20 10 1 30 3 0 1 2 3
matrimonios sen 1 10 = =
40 4 40 4
fillos, 10 cun fillo,
5 con dous e 5 con 5 1 35 7
2 5 = =
tres) 40 8 40 8 Diagrama
1
5 1 40 Barras
3 5 = =1 0,8
40 8 40 frec.acumuladas
0,6
0,4
Intervalos Marca de Frec. Frec. Frec. densidade 0,2
de
de clase clase Absoluta Relativa Acumulada frecuencia 0
2 1 2 1 1 0 H1 i s t o 2g r a m 3a
MD [0,2) 1 2 = =
EXEMPLO 3 20 10 20 10 20
(Se na mostra 4 1 6 3 1 0 ,2
había 2 MD, 4 ins, Ins [2,5) 3.5 4 = =
20 5 20 10 15 0 ,1 5
6 suf, 6 Not e 2
6 3 12 3 3
Sob) Suf [5,7) 6 6 Polígono
= de=frecuencias 0 ,1
20 10 20 5 20
6 3 18 9 3 0 ,0 5
Not [7,9) 81 6 = =
20 10 20 10 20 0
0,8
2 1 20 1
Sob [9,10] 9.50,6 2 = =1 0 1 2 3 4 5 6 7 8 9 10
20 10 20 10
0,4
0,2
0 2
10
0
9
3. Parámetros estatísticos: Medidas de centralización e medidas de dispersión.
Só se poden calcular nas variables estatísticas cuantitativas.
Completan a información que proporcionan as gráficas.
Son números: medidas descritivas de datos.
Aportan obxectividade e precisión ó estudio da distribución dos valores que toma un carácter.
3
• Dan idea da concentración dos valores ó redor das medidas de centralización.
Medidas de dispersión: • Complementan a información dada polas medidas de centralización.
• Veremos rango, desviación media, varianza, desv. típica e coef. de variación.
RANGO:
É a diferencia entre o maior e o menor valor que toma a variable (se é discreta) ou entre a maior e a
menor marca de clase (se é continua).
Canto máis pequeno sexa, máis concentrados estarán os valores.
Ten as mesmas unidades que os valores que toma o carácter.
DESVIACIÓN MEDIA:
Son os valores se a variable é discreta
x1,x2, ... , xn
Son as marcas de clase se a variable é continua Desviación dun valor xi : |xi-m| fi
f1,f2, ... ,fn Son as frecuencias relativas Desviación media:|x1-m|f1+|x2-m|f2 +...+|xn-m| fn
m é a mediana
Canto máis pequena sexa, máis concentrados estarán os valores ó redor da mediana.
Ten as mesmas unidades que os valores que toma o carácter.
VARIANZA: 2
A varianza é a media dunha nova distribución, construída do seguinte xeito:
Distribución orixinal Nova distribución
valores se a variable é discreta
x1,x2, ... , xn (x - X )2, (x2- X )2, ..., (xn- X )2 Son os novos valores
marcas de clase se a variable é continua 1
f1,f2, ... ,fn Son as frecuencias relativas f1,f2, ... ,fn seguen sendo as frecuencias relativas
X é a media A media desta nova distribución é a varianza
2
Logo, = (x1- X ) f1 + (x2- X )2 f2 + ... + (xn- X )2 fn
2
Canto máis pequena sexa, máis concentrados estarán os valores ó redor da media.
Ten como unidades as unidades dos valores ó cadrado.
σ
COEFICIENTE DE VARIACIÓN: =
X
Canto máis pequena sexa, máis concentrados estarán os valores ó redor da media.
Non ten unidades, o que permite comparar a concentración da distribución con outras distribucións.
EXEMPLO 2
4
1 1 3 3 1
Media: 1· +3.5· +6· +8· +9.5 = 5.95 puntos
10 5 10 10 10
DC EB
Por semellanza de triángulos =
AC AB
3
Como EB = 0.5 – = 0.2 ; despexando
10
Mediana: 0.2 · 2.5
EB ·AC
= =1.6666
AB = DC 3 3
−
5 10
Polo tanto Mediana = 5.16666 puntos
EXEMPLO a b
=
3 a e b verifican 1 1 ou sexa 15·a = 10·b
15 10
Moda:
40
Como b = 4–a : a = = 1.6 e Moda = 7.4
25
puntos
Rango:9.5-1 = 8.5 puntos
1 1 3 3 1
Desviación media: |1-5.16| · + |3.5-5.16| · + |6-5.16| · + |8-5.16| · +|9.5-5.16|· = 2.286 puntos
10 5 10 10 10
1 1 3 3 1
Varianza: (1-5.95)2 · + (3.5-5.95)2 · + (6-5.95)2 · + (8-5.95)2 · +(9.5-5.95)2· = 6.1725 puntos2
10 5 10 10 10
Desviación típica: 6.1725 = 2.48445 puntos
Coeficiente de variación: 0.41755
Polo tanto, están máis concentrados os valores ó redor da media no exemplo 3 que no exemplo 2.