Você está na página 1de 11

10

11
11
13
14
14
15 COMO VALIDAR EL SUPUESTO DE
15 NORMALIDAD?
15
15 Mtodos:
16
16 1. Pruebas grficas
16 1.1 Histograma
17 1.2 Q-Q Plot (grfico de probabilidad normal)
17 1.3 Boxplot, Tallo y Hojas
17
18 2. Pruebas de Bondad de Ajuste (prueba
18 estadstica)
18
19
1.1 Histograma
19
19
Adicionalmente, los coeficientes de Asimetra y Curtosis
20 aportan informacin complementaria a la inspeccin visual
20 del histograma.
20
21 Ejercicio 1: Realice uno a uno los pasos para realizar un
21 histograma al siguiente conjunto de datos. Una vez
21 construido anlice el grfico utilizando herramientas de
22 estadstica descriptiva.
22
23
23 Edades de las Personas que Asisten a Cine &%&
23
Muestra de datos
24
26
26
26
27
29
30
30
31
32
32
33
33
34
34
35
35
36
37
37 1
37
39
40
_______________________________________________________________
Recordemos
Un histograma es un resumen grfico de la variacin de un conjunto
de datos. La naturaleza grfica del histograma nos permite ver pautas
que son difciles de observar en una simple tabla numrica. Esta
herramienta se utiliza especialmente en la bsqueda de un modelo
de distribucin de probabilidades para una variable.

Cmo interpretar los histogramas:


Sabemos que los valores varan en todo conjunto de datos. Esta
variacin sigue cierta pauta. El propsito del anlisis de un
histograma es, por un lado, identificar y clasificar la pauta de
variacin, y por otro desarrollar una explicacin razonable y relevante
de la pauta. La explicacin debe basarse en los conocimientos
generales y en la observacin de las situaciones especficas y debe
ser confirmada mediante un anlisis adicional. Las caractersticas de
variacin ms comunes son en la distribucin de los datos es: si hay
forma de campana, simetra, con dos picos, plana, sesgada,
truncada, con un pico aislado, o con un pico en el extremo.

Construccin de un histograma:

PASO 1

Determinar el rango de los datos: RANGO es igual al dato mayor


menos el dato menor;
Rango=Mximo-Mnimo
PASO 2
Obtener en nmero de clases, existen varios criterios para determinar
el nmero de clases ( o barras). Sin embargo ninguno de ellos es
exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de como estn los datos y cuntos sean. Un criterio
usado frecuentemente es que el nmero de clases debe ser

2
aproximadamente a la raz cuadrada del nmero de datos, por
ejemplo, la raz cuadrada de 66 ( nmero de artculos) es 8.12, por lo
que se seleccionan ocho clases.

PASO 3
Establecer la longitud de clase o Incremento: es igual al rango entre
el nmero de clases.

PASO 4
Construir los intervalos de clases: Los intervalos resultan de dividir el
rango de los datos en relacin al resultado del PASO 2 en intervalos
iguales.
PASO 5

3
Graficar el histograma: se hace un grfico de barras, las bases de las
barras son los intervalos de clases y altura son la frecuencia de las
clases. Si se unen los puntos medios de la base

VARIACIONES:

1. En el eje y puede ir las frecuencias absolutas o las relativas o


tambin se puede utilizar una escala de densidad que se
consigue haciendo:

Area (rectgulo) = Base * Altura

Frecuencia Relativa Incremento

Altura (densidad) = Frecuencia Relativa / base

La ventaja es que histogramas construidos en esta forma son


comparables ya que las reas siempre suman 1.

Calculos en Excel:

Frecuen Frec. Frec. Rel. Densida


Intervalo de clase cia Relativa Acum. d
0,1515151 0,15151515 0,027548
10 15,5 10 52 2 21
0,2727272 0,42424242 0,049586
15,5 21 18 73 4 78
0,1363636 0,56060606 0,024793
21 26,5 9 36 1 39
0,1060606 0,66666666 0,019283
26,5 32 7 06 7 75
0,1515151 0,81818181 0,027548
32 37,5 10 52 8 21
0,1060606 0,92424242 0,019283
37,5 43 7 06 4 75
0,0454545 0,008264
43 48,5 3 45 0,96969697 46
0,0303030 0,005509
48,5 54 2 3 1 64
Suma 66

4
NOTA: A MENUDO VEREMOS OTRAS FORMAS DE PRESENTAR UN
HISTOGRAMA

Ejemplos de otros tipos de representaciones grficas:

(a): bases en el eje horizontal, centros en las marcas de clase y


longitudes iguales a los tamaos de los intervalos de clase

(b): reas proporcionales a las frecuencias de clase.

5
Polgonos de frecuencia:
El polgono de frecuencias es una representacin grfica de la
distribucin de frecuencias que resulta esencialmente equivalente al
histograma y se obtiene uniendo mediante segmentos los centros de
las bases superiores de los rectngulos del histograma (es decir, los
puntos de las marcas de clase).

Ojiva:
La misma idea de unir los centros de las bases superiores de los
rectngulos de la distribucin del histograma de frecuencias
acumuladas, da lugar al polgono de frecuencias acumuladas u ojiva.

6
1.2 Realizar un Q-Q plot

Los grficos de probabilidad normal constituyen otra importante


herramienta grfica para comprobar si un conjunto de datos puede
considerarse o no procedente de una distribucin normal. La idea
bsica consiste en enfrentar, en un mismo grfico, los datos que han
sido observados frente a los datos tericos que se obtendran de una
distribucin gaussiana. Si la distribucin de la variable coincide con la
normal, los puntos se concentrarn en torno a una lnea recta, aunque
conviene tener en cuenta que siempre tender a observarse mayor
variabilidad en los extremos.

En los grficos P-P se confrontan las proporciones acumuladas de


una variable con las de una distribucin normal. Los grficos Q-Q se
obtienen de modo anlogo, esta vez representando los cuantiles
respecto a los cuantiles de la distribucin normal.

Adems de permitir valorar la desviacin de la normalidad, los


grficos de probabilidad permiten conocer la causa de esa
desviacin. Una curva en forma de "U" o con alguna curvatura,
significa que la distribucin es asimtrica con respecto a la gaussiana,
mientras que un grfico en forma de "S" significar que la distribucin
tiene colas mayores o menores que la normal, esto es, que existen
pocas o demasiadas observaciones en las colas de la distribucin.

7
Ejercicio: 1. Utilice los datos los datos de las personas que asisten al
cine para ilustrar paso a paso como construir un grfico de este tipo.

Dato Nivel de Para hallar Nvel de probabilidad


Observad Probabilida Cuantil en haga (j-1/2)/n As en el caso de
J o d Z j=1 (1-1/2)/66= 0.0075
1 10 0.0075 -2.42
2 11 0.0227
Para hallar el cuantil en la
3 11 0.0378 distribucin de Z es decir en la
N(0,1) utilice la funcin
65 51 0.9772 DISTR.NORM.ESTAND.INV.
76 54 0.9772 As para el primer cuantil se halla
DISTR.NORM.ESTAND.INV(0.00
75)=-2.42

Luego graficar en Excel Nivel de Probabilidad vs Cuantil en Z (o en


la escala de la variable. Ejemplo: en la escala de la variable Edad,
que sera una normal con media 26.84 y desviacin estndar 11 el
nvel de probabilidad 0.0075 es acumulado por 0.1162, el nvel
0.0227 por 4.83 , etc.)

Q-Q Plot Variable Edad


3

-1

-2

-3

8
Q-Q Plot Variable Edad
60
50
40
30
20
10

Gr

f
i
c
oQ
-
N
o
rm
a
l
d
e
ED
A
0

6
0
5
0
En SPSS slo debe entrar la variable no tabular nada.
o
4
0
m d
ra
p
3
0
rN
as
le
2
0
lo
V
a
1
0
01V
a
lo
02
0rb
s
e
rv
3
0a
d
o
4
05
06
0
1.3 Construir otros grficos como Boxplot o tallo y hojas y
analizar caractersticas como simetra, nmero de modas, sesgos,
vacos en la distribucin, presencia de valores extremos.

2 Realizar una prueba de Bondad de Ajuste (PRUEBAS


ESTADISTICAS)

Muchos de los resultados tericos y prcticos de la estadstica


paramtrica descansan en la distribucin normal. El investigar si una
muestra aleatoria de tamao n proviene de una distribucin normal
resulta de inters, y de hecho existen muchas pruebas estadsticas al
respecto entre las que destacan las siguientes:

9
Prueba de Smirnov Kolmogorov, descansa en los desvos de la
distribucin terica y emprica.

Prueba de Karl Pearson, basada en la distribucin chi cuadrada


y que corresponde a una prueba de bondad de ajuste.

Prueba de Cramer-Von Mises, es til para pequeas muestras y


usa los momentos como criterio.

Prueba de Gram-Charlier, usa la distribucin de mismo nombre


para inferir si la muestra es normal.

Prueba de Jarque y Bera, utiliza un estadstico en prueba que


involucra la curtosis y la asimetra.

Prueba de R.C. Geary, usa los cumulantes muestrales y sus


medias y desviaciones estndar.

Otras, como la de Shapiro- Wilk y aqullas basadas en mtodos


numricos.

Prueba de Bondad de ajuste (chi-cuadrado)

Ejercicio 2: Realice prueba de normalidad a los datos del precio en la


base motos utilizando SPSS .

All debe utilizar la secuencia Analizar, Estadsticos Descriptivos,


Explorar, en el cuadro de dilogo seleccionar la variable y luego al dar
clic en el botn Grficos activar la opcin Grficos con pruebas de
normalidad.

10
Slida de SPSS

Pruebas de normalidad

Kolmogorov-Smirnov(a) Shapiro-Wilk
Estadstico gl Sig. Estadstico gl Sig.
Precio ,192 42 ,000 ,849 42 ,000
a Correccin de la significacin de Lilliefors

11

Você também pode gostar