Você está na página 1de 5

Tema 7.

Estatística Descritiva
1. Introducción á estatística descritiva.

A Estatística é a ciencia que estudia o comportamento dos fenómenos de masas, observando as súas
regularidades. Para iso organiza e analiza información obtida a través de observacións.

Poboación: Conxunto homoxéneo de obxectos que serán estudiados por unha investigación estatística.
Mostra: Subconxunto da poboación do que se teñen datos. Tamaño mostral: nº de elementos da mostra.
(a Estatística emprega os datos das mostras para sacar conclusións sobre a poboación)
Carácter: Cualidade observable común a tódolos elementos da poboación.

Se nunha investigación estatística só estudiamos un carácter dunha poboación, os posibles valores deste
carácter son unha variable estatística unidimensional, que se clasifican es tres tipos:
• Se o carácter é un atributo (non numérico) : variable estatística cualitativa.
Se o carácter toma →Só pode tomar un nº finito de valores: variable estatística cuantitativa discreta.

valores numéricos →Pode tomar infinitos valores: variable estatística cuantitativa continua.

Poboación: Asistentes a unha obra de teatro.


EXEMPLO 1:
Mostra: 100 persoas escollidas aleatoriamente. (tamaño 100)
(var. cualitativa)
Carácter: estudiarase o seu xénero (var. cualitativa con 2 posibles valores: home, muller)

EXEMPLO 2: Poboación:Matrimonios que viñeron vivir a Vilagarcía neste ano.(ningún ten máis de 3 fillos)
(var. cuantitativa Mostra: 40 matrimonios escollidos aleatoriamente. (tamaño 40)
discreta) Carácter: estudiarase o nº de fillos (var. cuantitativa con 4 posibles valores: 0, 1, 2, 3)

EXEMPLO 3: Poboación: Alumnado dun profesor de Matemáticas I de COU.


(var. cuantitativa Mostra: unha clase con 20 estudiantes. (tamaño 20)
continua) Carácter: estudiarase a nota nun exame (var. cuantitativa con infinitos valores en [0,10]
Trátase de estudiar como se distribúen os valores que pode tomar un carácter

2. Representación dos datos obtidos: Táboas de frecuencia e gráficas.

Valores: Os posibles valores que pode tomar o carácter que estudiamos.


Frecuencias absolutas: Nº de elementos da mostra que alcanzan cada valor.
Se é unha frecuencia s absolutas
variable cualitativa Frecuencias relativas: tamaño mostral
. Indican o peso de cada valor.
deben escribirse
Círculo de área 1 con tantas divisións radiais como valores.
Gráfico de sectores:
A área de cada división será a frecuencia relativa de cada valor.

Valores:Os posibles valores que pode tomar o carácter que estudiamos.(ordenados)


Frecuencias absolutas: Nº de elementos da mostra que alcanzan cada valor.
frecuencia s absolutas
Se é unha Frecuencias relativas: tamaño mostral
. Indican o peso de cada valor.
variable cuantitativa Son a suma da frecuencia relativa dun valor máis as
discreta Frecuencias acumuladas:
frecuencias relativas de tódolos valores anteriores.
deben escribirse
Con frecuencias Sobre cada valor
Diagramas EIXE Y: As frecuencias.
absolutas, relativas represéntase unha barra coa
de barras: EIXE X: Os valores.
ou acumuladas altura da súa frecuencia.

1
Intervalos de clase: Divisións do intervalo de variación dos valores. (poden ter distintas amplitudes)
Marcas de clase: Punto medio de cada intervalo de clase.
Frecuencias absolutas:Nº de elementos da mostra que teñen o valor en cada intervalo de clase.
frecuencia s absolutas
Frecuencias relativas: tamaño mostral
. Indican o peso de cada intervalo de clase.
Se é unha
variable Frecuencias acumuladas: Son a suma da frecuencia relativa dun intervalo máis as frecuencias
cuantitativa relativas de tódolos intervalos anteriores.
continua Densidades de frecuencia = frecuencia relativa
deben amplitude do int ervalo
escribirse •EIXE Y: As densidades de frecuencia.
•EIXE X: O intervalo de variación dos valores.
Histogramas: •Sobre cada intervalo de clase represéntase un rectángulo con base o intervalo e
altura a densidade de frecuencia.
•A área de cada rectángulo coincidirá coa frec. relativa. A área total será 1.
•EIXE Y: As frecuencias acumuladas.
•EIXE X: O intervalo de variación dos valores.
Polígono de
frecuencias: •Sobre cada intervalo de clase represéntase un rectángulo con base o intervalo e
altura a frecuencia acumulada. (o último rectángulo terá altura 1)
•Únense os puntos medios da base superior de cada rectángulo.

Frec. Frec.
Valores
Absoluta Relativa
EXEMPLO 1
(Se na mostra 6
Home 60 Gráfico de sectores:
había 60 homes e 10
40 mulleres) 4 Mulleres
Muller 40
10
Homes

25

20
Frec. Frec. Frec. Diagrama 15
Valores
Absoluta Relativa Acumulada Barras 10
EXEMPLO 2 20 1 20 1 frec.absolutas
0 20 = = 5
(Se na mostra 40 2 40 2 0
había 20 10 1 30 3 0 1 2 3
matrimonios sen 1 10 = =
40 4 40 4
fillos, 10 cun fillo,
5 con dous e 5 con 5 1 35 7
2 5 = =
tres) 40 8 40 8 Diagrama
1
5 1 40 Barras
3 5 = =1 0,8
40 8 40 frec.acumuladas
0,6

0,4
Intervalos Marca de Frec. Frec. Frec. densidade 0,2
de
de clase clase Absoluta Relativa Acumulada frecuencia 0
2 1 2 1 1 0 H1 i s t o 2g r a m 3a
MD [0,2) 1 2 = =
EXEMPLO 3 20 10 20 10 20
(Se na mostra 4 1 6 3 1 0 ,2
había 2 MD, 4 ins, Ins [2,5) 3.5 4 = =
20 5 20 10 15 0 ,1 5
6 suf, 6 Not e 2
6 3 12 3 3
Sob) Suf [5,7) 6 6 Polígono
= de=frecuencias 0 ,1
20 10 20 5 20
6 3 18 9 3 0 ,0 5
Not [7,9) 81 6 = =
20 10 20 10 20 0
0,8
2 1 20 1
Sob [9,10] 9.50,6 2 = =1 0 1 2 3 4 5 6 7 8 9 10
20 10 20 10
0,4
0,2
0 2
10
0

9
3. Parámetros estatísticos: Medidas de centralización e medidas de dispersión.
Só se poden calcular nas variables estatísticas cuantitativas.
Completan a información que proporcionan as gráficas.
Son números: medidas descritivas de datos.
Aportan obxectividade e precisión ó estudio da distribución dos valores que toma un carácter.

• Teñen as mesmas unidades que os valores que toma o carácter.


Medidas de centralización: • Indican a posición ó redor da que se distribúen as observacións.
• Estudiaremos a media, a mediana e a moda.
MEDIA:
- É o centro de gravidade da distribución de valores.
- É o número que fai que se compensen as desviacións respecto dese número. Ou sexa, compénsanse
as diferencias entre os valores da mostra e a media, tendo en conta o peso de cada valor.
Son os valores se a variable é discreta
x1,x2, ... , xn
Cálculo Son as marcas de clase se a variable é continua Media = X = x1 f1 + x2 f2 +...+ xn fn
f1,f2, ... ,fn Son as frecuencias relativas
MEDIANA:
- É o valor do carácter que fai que teñan tanto peso os valores menores ou iguales como os valores
maiores ou iguales que el.
Nas variables discretas:
- É o valor do carácter no que a frecuencia acumulada supera o 0.5.
- Se xusto hai un valor no que a frecuencia acumulada vale 0.5, a mediana será o o valor medio entre
ese valor e o seguinte.
Nas variables continuas:
- Construído o polígono de frecuencias, é a o valor que ten como imaxe 0.5. Pódese obter por
semellanza de triángulos (ver exemplo).
MODA:
- É o valor ou valores do carácter que teñen a maior frecuencia relativa (peso) da distribución.
Nas variables continuas:
- Tómase o intervalo ou intervalos con maior densidade de frecuencia, chamado intervalo modal. A
moda será o punto do intervalo que equilibre as densidades de frecuencia dos intervalos adxacentes:
a b
Ou sexa, no esquema, se d2 é a maior densidade, a moda será o x tal que =
d1 d 3
d2-
d3- b a
d1-

3
• Dan idea da concentración dos valores ó redor das medidas de centralización.
Medidas de dispersión: • Complementan a información dada polas medidas de centralización.
• Veremos rango, desviación media, varianza, desv. típica e coef. de variación.

RANGO:
É a diferencia entre o maior e o menor valor que toma a variable (se é discreta) ou entre a maior e a
menor marca de clase (se é continua).
Canto máis pequeno sexa, máis concentrados estarán os valores.
Ten as mesmas unidades que os valores que toma o carácter.

DESVIACIÓN MEDIA:
Son os valores se a variable é discreta
x1,x2, ... , xn
Son as marcas de clase se a variable é continua Desviación dun valor xi : |xi-m| fi
f1,f2, ... ,fn Son as frecuencias relativas Desviación media:|x1-m|f1+|x2-m|f2 +...+|xn-m| fn
m é a mediana
Canto máis pequena sexa, máis concentrados estarán os valores ó redor da mediana.
Ten as mesmas unidades que os valores que toma o carácter.

VARIANZA:  2
A varianza é a media dunha nova distribución, construída do seguinte xeito:
Distribución orixinal Nova distribución
valores se a variable é discreta
x1,x2, ... , xn (x - X )2, (x2- X )2, ..., (xn- X )2 Son os novos valores
marcas de clase se a variable é continua 1
f1,f2, ... ,fn Son as frecuencias relativas f1,f2, ... ,fn seguen sendo as frecuencias relativas
X é a media A media desta nova distribución é a varianza
2
Logo,  = (x1- X ) f1 + (x2- X )2 f2 + ... + (xn- X )2 fn
2

Canto máis pequena sexa, máis concentrados estarán os valores ó redor da media.
Ten como unidades as unidades dos valores ó cadrado.

DESVIACIÓN TÍPICA:  É a raíz cadrada positiva da varianza.


Canto máis pequena sexa, máis concentrados estarán os valores ó redor da media.
De feito, o peso dos valores que están no intervalo ( X -  , X +) , normalmente supera o 0.6.
Emprégase en vez da varianza porque ten as mesmas unidades que os valores.

σ
COEFICIENTE DE VARIACIÓN: =
X
Canto máis pequena sexa, máis concentrados estarán os valores ó redor da media.
Non ten unidades, o que permite comparar a concentración da distribución con outras distribucións.

EXEMPLO 2

Media: As desviacións respecto a media son:(0-0.865) con peso 0.5;


1 1 1 1 (1-0.865) con peso 0.25; (2-0.865) con peso 0.125 e (3-0.865) con peso 0.125. A
0· +1· + 2· +3· = 0.865 nenos
2 4 8 8 negativa (a 1ª) compensa á suma das positivas.
Mediana: Posto que o valor 0 ten xusto frecuencia acumulada 0.5, será o valor medio entre 0 e 1: 0.5 nenos
Moda: Será o valor 0 nenos.
Rango: 3-0 = 3 nenos
1 1 1 1
Desviación media: |0-0.5| · + |1-0.5| · + |2-0.5| · + |3-0.5| · = 0.875 nenos
2 4 8 8
1 1 1 1
Varianza: (0-0.865)2 · + (1-0.865)2 · + (2-0.865)2 · + (3-0.865)2 · = 1.109475 nenos2
2 4 8 8
Desviación típica: 1.109475 =1.053316192 nenos
Coeficiente de variación: 1.2177068

4
1 1 3 3 1
Media: 1· +3.5· +6· +8· +9.5 = 5.95 puntos
10 5 10 10 10

DC EB
Por semellanza de triángulos =
AC AB
3
Como EB = 0.5 – = 0.2 ; despexando
10
Mediana: 0.2 · 2.5
EB ·AC
= =1.6666
AB = DC 3 3

5 10
Polo tanto Mediana = 5.16666 puntos

EXEMPLO a b
=
3 a e b verifican 1 1 ou sexa 15·a = 10·b
15 10
Moda:
40
Como b = 4–a : a = = 1.6 e Moda = 7.4
25
puntos
Rango:9.5-1 = 8.5 puntos
1 1 3 3 1
Desviación media: |1-5.16| · + |3.5-5.16| · + |6-5.16| · + |8-5.16| · +|9.5-5.16|· = 2.286 puntos
10 5 10 10 10
1 1 3 3 1
Varianza: (1-5.95)2 · + (3.5-5.95)2 · + (6-5.95)2 · + (8-5.95)2 · +(9.5-5.95)2· = 6.1725 puntos2
10 5 10 10 10
Desviación típica: 6.1725 = 2.48445 puntos
Coeficiente de variación: 0.41755

Polo tanto, están máis concentrados os valores ó redor da media no exemplo 3 que no exemplo 2.

Você também pode gostar