Você está na página 1de 52

Captulo 1

Estadstica Descriptiva
Dipl.-Math. Natalia Hernandez Vargas
Universidad del Norte

Segundo Semestre 2014

1 / 22

Contenido

En clases anteriores

Medidas estadsticas
Medidas de tendencia central o de centralizaci
on
Medidas de dispersi
on o de variabilidad

2 / 22

Medidas estadsticas

Contenido

Medidas estadsticas
Medidas de tendencia central o de centralizaci
on
Medidas de dispersi
on o de variabilidad

3 / 22

Medidas estadsticas

Medidas de tendencia central o de centralizaci


on

Contenido

Medidas estadsticas
Medidas de tendencia central o de centralizaci
on
Medidas de dispersi
on o de variabilidad

4 / 22

Medidas estadsticas

Medidas de tendencia central o de centralizaci


on

Medidas de tendencia central o de centralizaci


on
Media
Mediana
Moda

5 / 22

Medidas estadsticas

Medidas de dispersi
on o de variabilidad

Contenido

Medidas estadsticas
Medidas de tendencia central o de centralizaci
on
Medidas de dispersi
on o de variabilidad

6 / 22

Medidas estadsticas

Medidas de dispersi
on o de variabilidad

Medidas de dispersi
on o de variabilidad
Varianza
Desviacion estandar (o tpica)
Coeficiente de variaci
on de Pearson
Rango o recorrido
Rango intercuartil

7 / 22

Medidas estadsticas

Medidas de dispersi
on o de variabilidad

Medidas de dispersi
on o de variabilidad
Varianza
Desviacion estandar (o tpica)
Coeficiente de variaci
on de Pearson
Rango o recorrido
Rango intercuartil

7 / 22

Contenido

La clase de hoy

Medidas de colocacion o de posici


on relativa

Diagrama de caja y bigotes

8 / 22

Medidas de colocaci
on o de posici
on relativa

Contenido

Medidas de colocacion o de posici


on relativa

Diagrama de caja y bigotes

9 / 22

Medidas de colocaci
on o de posici
on relativa

Medidas de posici
on relativa
Mediana
Percentiles
Cuartiles

10 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:
Q1 primer cuartil (25-esimo percentil)

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:
Q1 primer cuartil (25-esimo percentil)
Q2 segundo cuartil (50-esimo percentil

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:
Q1 primer cuartil (25-esimo percentil)
Q2 segundo cuartil (50-esimo percentil o mediana)

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:
Q1 primer cuartil (25-esimo percentil)
Q2 segundo cuartil (50-esimo percentil o mediana)
Q3 tercer cuartil

11 / 22

Medidas de colocaci
on o de posici
on relativa

Definition
El p-
esimo (punto) percentil es un valor tal que a lo mas un p % de los
datos tienen dicho o menos de ese valor.
Definition
Los cuartiles son las medidas de posici
on relativa correspondiente a un
conjunto de datos divididos en cuatro partes (iguales) y se definen as:
Q1 primer cuartil (25-esimo percentil)
Q2 segundo cuartil (50-esimo percentil o mediana)
Q3 tercer cuartil (75-esimo percentil)

11 / 22

Medidas de colocaci
on o de posici
on relativa

C
omo calcular los cuartiles de un conjunto de n datos
Ordenar los n datos de menor a mayor.

12 / 22

Medidas de colocaci
on o de posici
on relativa

C
omo calcular los cuartiles de un conjunto de n datos
Ordenar los n datos de menor a mayor.
Calcular un ndice i a traves de la f
ormula i =
cantidad de datos y k = 1, 2, 3.

nk
4 ,

siendo n la

12 / 22

Medidas de colocaci
on o de posici
on relativa

C
omo calcular los cuartiles de un conjunto de n datos
Ordenar los n datos de menor a mayor.
Calcular un ndice i a traves de la f
ormula i =
cantidad de datos y k = 1, 2, 3.

nk
4 ,

siendo n la

El calculo del k-esimo cuartil depende de si i es entero o no:

12 / 22

Medidas de colocaci
on o de posici
on relativa

C
omo calcular los cuartiles de un conjunto de n datos
Ordenar los n datos de menor a mayor.
Calcular un ndice i a traves de la f
ormula i =
cantidad de datos y k = 1, 2, 3.

nk
4 ,

siendo n la

El calculo del k-esimo cuartil depende de si i es entero o no:


i no es entero Se redondea al entero siguiente. Esta aproximacion
indica la posici
on del k-esimo cuartil.

12 / 22

Medidas de colocaci
on o de posici
on relativa

C
omo calcular los cuartiles de un conjunto de n datos
Ordenar los n datos de menor a mayor.
Calcular un ndice i a traves de la f
ormula i =
cantidad de datos y k = 1, 2, 3.

nk
4 ,

siendo n la

El calculo del k-esimo cuartil depende de si i es entero o no:


i no es entero Se redondea al entero siguiente. Esta aproximacion
indica la posici
on del k-esimo cuartil.
i es entero El k-esimo cuartil es el promedio de los valores de los
datos ubicados en las posiciones i y i + 1.

12 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

8.9
12.2

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.
=5
i = 201
4

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.
=5
i = 201
4

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

El c
alculo del k-esimo cuartil depende de si i es entero o no:

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.
=5
i = 201
4

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

El c
alculo del k-esimo cuartil depende de si i es entero o no:
i = 5 es entero El k-esimo cuartil es el promedio de los valores de los datos
ubicados en las posiciones i y i + 1.

13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.
=5
i = 201
4

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

El c
alculo del k-esimo cuartil depende de si i es entero o no:
i = 5 es entero El k-esimo cuartil es el promedio de los valores de los datos
ubicados en las posiciones i y i + 1.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

8.9
12.2

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8
13 / 22

Medidas de colocaci
on o de posici
on relativa

Example
8.9
6.8

10.2
9.5

11.5
11.5

7.8
11.2

10.0
14.9

12.2
7.5

13.5
10.0

14.1
6.0

10.0
15.8

12.2
11.5

Calcule el primer cuartil.


Ordenar los n datos de menor a mayor.
6.0
11.2

6.8
11.5

7.5
11.5

7.8
11.5

Calcular un ndice i dado por i =


cantidad de datos.
=5
i = 201
4

8.9
12.2
nk
,
4

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

donde k es el cuartil en cuesti


on y n la

El c
alculo del k-esimo cuartil depende de si i es entero o no:
i = 5 es entero El k-esimo cuartil es el promedio de los valores de los datos
ubicados en las posiciones i y i + 1.
6.0
11.2
Q1 =

8,9+9,5
2

6.8
11.5

7.5
11.5

7.8
11.5

8.9
12.2

9.5
12.2

10.0
13.5

10.0
14.1

10.0
14.9

10.2
15.8

= 9,2
13 / 22

Diagrama de caja y bigotes

Contenido

Medidas de colocacion o de posici


on relativa

Diagrama de caja y bigotes

14 / 22

Diagrama de caja y bigotes

An
alisis exploratorio de datos
Diagrama de caja y bigotes

15 / 22

Diagrama de caja y bigotes

An
alisis exploratorio de datos
Diagrama de caja y bigotes
Diagramas de cajas m
ultiples (o comparativos)

15 / 22

Diagrama de caja y bigotes

Definition
Un resumen de cinco n
umeros consiste en cinco cantidades que se
emplean para resumir los datos:
Valor mnimo
Primer cuartil Q1
Mediana Q2
Tercer cuartil Q3
Valor maximo.

16 / 22

Diagrama de caja y bigotes

Example
Min
6.0

Q1
9.2

Q2
10.7

Q3
12.2

Max
15.8

17 / 22

Diagrama de caja y bigotes

Example
Min
6.0

Q1
9.2

Q2
10.7

10

Q3
12.2

12

Max
15.8

14

16

Figura : Diagrama de caja y bigotes (Boxplot)


17 / 22

Diagrama de caja y bigotes

Example
Q1
9.2

Q2
10.7

Q3
12.2

Max
15.8

0.6
0.4
0.2
0.0

Frecuencia absoluta

0.8

Min
6.0

10

12

14

16

Figura : Histograma con diagrama de caja y bigotes (Boxplot)


18 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil
Lnea del medio: Mediana o
segundo cuartil

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil
Lnea del medio: Mediana o
segundo cuartil

Bigotes
6

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil
Lnea del medio: Mediana o
segundo cuartil

Bigotes
Bigote izquierdo: Representa
los datos entre
[Q1 1.5 RI , Q1 ]

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil
Lnea del medio: Mediana o
segundo cuartil

Bigotes
Bigote izquierdo: Representa
los datos entre
[Q1 1.5 RI , Q1 ]
Bigote derecho: Representa
los datos entre
[Q3 , Q3 +1.5 RI ]

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

19 / 22

Diagrama de caja y bigotes

Diagrama de caja y de bigotes


Caja
Contiene el 50 % de los datos
Lado izquierdo: Primer cuartil
Lado derecho: Tercer cuartil
Lnea del medio: Mediana o
segundo cuartil

Bigotes
Bigote izquierdo: Representa
los datos entre
[Q1 1.5 RI , Q1 ]
Bigote derecho: Representa
los datos entre
[Q3 , Q3 +1.5 RI ]

10

12

14

16

Figura : Diagrama de caja y bigotes


(Boxplot)

Valores atpicos

19 / 22

Diagrama de caja y bigotes

Valores atpicos

10

15

20

Figura : Diagrama de caja y bigotes con valores atpicos


20 / 22

Diagrama de caja y bigotes

Definition
Todo valor que esta mas alejado del 1.5 RI del cuartil mas cercano se dice
que es atpico.
Un valor atpico es extremo si esta a mas de 3 RI del cuartil mas cercano,
de lo contrario es moderado.

21 / 22

Diagrama de caja y bigotes

Definition
Todo valor que esta mas alejado del 1.5 RI del cuartil mas cercano se dice
que es atpico.
Un valor atpico es extremo si esta a mas de 3 RI del cuartil mas cercano,
de lo contrario es moderado.
Usos de la identificaci
on de valores atpicos
Pueden ser errores de anotaci
on.
En ocaciones se eliminan para un mejor analisis.

21 / 22

Diagrama de caja y bigotes

Diagrama de cajas m
ultiples (o comparativos)

10

15

20

Figura : Diagrama de cajas m


ultiples para dos conjuntos de datos A y B.
22 / 22

Você também pode gostar