Você está na página 1de 33

PEE 16-2

Anlisis de Datos para el Control de Procesos 1

Descripcin de Datos:
Resmenes Numricos
Sesin 2

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 2

PEE 16-2

Medidas de Ubicacin
Media
Mediana
Moda
Percentil
Cuartil

Si la medida es calculada a
partir de los datos de una
muestra se les llama
estadstico muestral
Si la medida es calculada a partir
de los datos de una poblacin se
les llama parmetro poblacional
Un estadstico muestral es un
estimador puntual de su correspondiente
parmetro poblacional

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 3

PEE 16-2

Promedio
1.
2.
3.
4.
5.

Medida de Tendencia Central


La medida ms comn
Acta como un Punto de Balance.
Se afecta por valores extremos.
Frmula
n

X
i 1

Muestra

i 1

Poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 4

Mediana
1. Medida de Tendencia Central.
2. Valor central en una secuencia de datos
ordenada. Percentil 50.
3. No se afecta por valores extremos.
4. Posicin de la Mediana.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 5

Promedio Truncado
El Promedio Truncado se obtiene promediando
luego de eliminar a % de los menores datos y a
% de los mayores datos del conjunto total de
datos.
Es una buena medida de ubicacin o tendencia
central si tenemos datos extremos o muy
grandes o muy pequeos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 6

PEE 16-2

Moda
1.
2.

Medida de Tendencia Central


Valor que ocurre con mayor frecuencia

3.

NO se afecta por valores extremos

4.

Puede que no exista o que exista ms de una

5.

Se puede usar para todo tipo de datos:


numricos y categricos

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 7

Percentil
El p percentil de un conjunto de datos es un valor tal que
por lo menos el p% de las observaciones es menor o
igual a l o el (100-p)% de los valores es mayor que l.
1. Arreglar los datos en forma ascendente.
2. Calcular la posicin i del p percentil.
i = (p/100)n
3. Si i no es un nmero entero, redondear hacia arriba.
El p percentil es el valor de la observacin en la
posicin i.
4. Si i es un entero, el p percentil es el promedio entre
las observaciones de las posiciones i e i+1.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 8

PEE 16-2

Cuartil
1. Medida de Tendencia NO Central
2. Divide los datos ordenados en cuatro partes.
3. Primer Cuartil = 25 Percentil
4. Segundo Cuartil = 50 Percentil = Mediana
5. Tercer Cuartil = 75 Percentil

25%

Min
Q0

25%

Q1

25%

Q2

25%

Q3

Max
Q4

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 9

Medidas de Variabilidad
Rango
Rango Intercuartil
Varianza
Desviacin Estndar
Coeficiente de Variacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 10

Rango
1. Medida de dispersin
2. Diferencia entre la ms grande y la menor
de las observaciones
3. Ignora Cmo se distribuyen los datos

4. Es muy sensible a valores extremos.

7 8 9 10

7 8 9 10

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 11

Rango Intercuartlico
1. Medida de Dispersin
2. Diferencia entre el Tercer y Primer Cuartil
3. Es el rango en que se tiene el 50% central
de los datos.

4. No se afecta por Valores Extremos

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 12

PEE 16-2

Varianza
La varianza es el promedio de las diferencias al
cuadrado de cada observacin con el promedio.
Muestra la variacin alrededor del promedio.
La Varianza se calcula como sigue:

S ( X X )2
n-1
Para la
muestra

s2

S ( X m )2
N

Para la
poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 13

PEE 16-2

Desviacin Estndar
La desviacin estndar de un conjunto de datos
es la raz cuadrada positiva de la varianza.
Esta medida est en las mismas unidades que los
datos, haciendo ms fcil su comparacin con el
promedio.

s=

s2

Para la
muestra

s2

Para la
poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 14

Coeficiente de Variacin
El coeficiente de variacin indica cun grande
es la desviacin estndar en relacin con el
promedio.
Se expresa como un porcentaje.

S (100) %
X

s (100) %
m

Para la
muestra

Para la
poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 15

Forma de distribucin: Asimetra


Una importante medida de la forma de una
distribucin es la asimetra.
La frmula para datos de una muestra es:
n
Coeficiente de Asimetra = (n-1) (n-2)

xi - x
s

La asimetra puede ser fcilmente calculada


utilizando software estadstico.
Usando Excel tenemos la funcin:
+COEFICIENTE.ASIMETRIA(Rango.datos)

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 16

PEE 16-2

Forma de distribucin: Asimetra


Simtrica:
Asimetra es CERO.
La Media es igual a la Mediana.
Frecuencia Relativa

.35

Asimetra = 0

.30

.25
.20
.15
.10
.05
0

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 17

PEE 16-2

Forma de distribucin: Asimetra


Moderada Asimetra a la Izquierda:
Asimetra negativa.
La Media es usualmente menor que la Mediana.
Frecuencia Relativa

.35

Asimetra = - .31

.30

.25
.20
.15
.10
.05
0

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 18

PEE 16-2

Forma de distribucin: Asimetra


Gran Asimetra a la Derecha:
Asimetra positiva (generalmente mayor a 1.0).
La Media es usualmente mayor que la Mediana.
Frecuencia Relativa

.35

Asimetra = 1.25

.30
.25
.20
.15
.10

.05
0
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 19

PEE 16-2

Estadstica Descriptiva
Usando herramientas de Excel

Herramientas

Anlisis
de Datos
Estadstica
Descriptiva
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 20

Valor Z
El valor - Z es generalmente llamado el valor
estandarizado.
Indica el nmero de desviaciones estndar que
un Xi cualquiera se aleja del promedio.

Un dato con valor menor que el promedio tendr


un valor Z menor que cero.
Un dato con valor mayor que el promedio tendr
un valor Z mayor que cero.
Un dato con valor igual al promedio tendr un
valor Z igual a cero.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 21

Regla Emprica
Para datos que se distribuyen en forma de campana:

Aproximadamente el 68% de los datos estarn entre


la media y una desviacin estndar.
Aproximadamente el 95% de los datos estarn entre
la media y dos desviacin estndar.
Casi todos los datos estarn entre la media y tres
desviacin estndar.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 22

PEE 16-2

Curva Normal
99.72%
95.44%
68.26%

m 3s

m 1s
m 2s

m + 1s

m + 3s

m + 2s

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 23

Detectando Outliers
Un outlier es inusualmente muy pequeo o
inusualmente muy grande.
Un dato con un valor Z menor que -3 o mayor
que +3 pueden ser considerados como un outlier.
Puede ser un valor mal registrado. Puede ser un
valor indebidamente incluido en una muestra
(poblacin).
Como tambin puede ser un valor correctamente
registrado y que pertenece a esta muestra
(poblacin).

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 24

Anlisis Exploratorio de Datos


Resumen con Cinco Nmeros
Box Plot

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 25

PEE 16-2

Resumen con Cinco Nmeros

Menor Valor
Primer Cuartil
Mediana
Tercer Cuartil
Mayor Valor

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 26

Box Plot Diagrama de Caja


Se dibuja una caja con sus extremos en el primer y
tercer cuartil.
Se traza una lnea vertical dentro de la caja en la
ubicacin de la mediana.
Se definen lmites (no se dibujan) usando el rango
intercuartlico (IQR).
Lmites interiores se definen a 1.5(IQR) debajo de
Q1 y 1.5(IQR) encima de Q3.
Lmites exteriores se definen a 3(IQR) debajo de
Q1 y 3(IQR) encima de Q3.
Continua
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 27

Box Plot Diagrama de Caja


Se dibuja una lnea punteada a travs de la caja desde
el valor ms pequeo hasta el valor ms grande de los
datos dentro de los lmites internos.
La ubicacin de outliers medios se muestran con el
smbolo * .
La ubicacin de outliers extremos se muestran con el
smbolo o .

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 28

PEE 16-2

Box Plot Diagrama de Caja


Sesgo a la izquierda Simtrica
Q1 Mediana Q3

Q1 Mediana Q3

Sesgo a la derecha
Q1 Mediana Q3

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 29

Box Plot Diagrama de Caja


Es una excelente tcnica grfica para hacer comparaciones
entre dos o ms grupos.

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 30

Medidas de Asociacin
entre dos Variables
Hasta ahora hemos examinado nicamente
mtodos numricos utilizados para resumir los
datos de una sola variable a la vez.
A menudo, un gerente o un tomador de
decisiones est interesado en la relacin entre
dos variables.
Dos medidas descriptivas de la relacin entre
dos variables son la covarianza y el
coeficiente de correlacin.
Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 31

PEE 16-2

Covarianza
La covarianza es una medida de la asociacin
lineal entre dos variables.
Valores positivos indican relacin directa.
Valores negativos indican relacin inversa.

sXY

S(XX)(YY)
n-1

Para la
muestra

sXY

S ( X mX ) ( Y my )
N

Para la
poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

PEE 16-2

Anlisis de Datos para el Control de Procesos 32

Covarianza

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Anlisis de Datos para el Control de Procesos 33

PEE 16-2

Coeficiente de Correlacin
El coeficiente puede tomar valores entre -1 y +1.
Valores cercanos a -1 indican una fuerte relacin
negativa.
Valores cercanos a +1 indican una fuerte relacin
positiva.

rXY

SXY
S X SY

Para la
muestra

rXY

sXY
sX sY

Para la
poblacin

Notas de clase elaboradas por el Prof. Toms Minauro L. Lima, esan, 2016.

Você também pode gostar