Você está na página 1de 32

ESTADISTICA I

KARIN AGUILAR IMITOLA

INFORMACIN GENERAL
EVALUACIONES
I.
Estadstica descriptiva y probabilidad + Trabajo 0.3
II. Variables aleatorias. Distribuciones de probabilidad +
trabajo. 0.35
III. Modelado Estadstico + trabajo 0.35
El peso del previo y del trabajo es igual
BIBLIOGRAFIA
Estadstica para Ingenieros y cientficos. William Navidi,
McGrawHill.
Estadstica y Probabilidad. Montgomery
CONTACTO
aguilarimitola.karin@gmail.com

Casos de xito del Big Data


A qu se debe el boom del Big Data?
Qu relacin tiene el tema del caso con la
estadstica?
Cuales otros casos de xito conoce del manejo
de datos?

ESCALAS DE MEDICIN
Lo que no se puede medir lo que no se puede controlar y lo que no se controla, no
se puede mejorar

MEDICIN: es el proceso de asignar nmeros u otros smbolos a


caractersticas de objetos de acuerdo con ciertas reglas preestablecidas
nmero .
1. nmeros u otros smbolos a caractersticas de objetos de acuerdo con
ciertas reglas preestablecidas
permiten un anlisis estadsticos de los resultados.
2. los n facilitan la comunicacin de reglas de mediciones y resultados.
ESCALAS: Serie de categoras que permite medir las opciones de los
individuos con relacin a un asunto especfico.
Confiabilidad: se refiere a la consistencia interior de la misma con el paso del
tiempo.
Validez: indica la capacidad de la escala para medir las cualidades para las
cuales ha sido construida y no otras parecidas

Escala de
medicin
nominal

Ejemplos
Sexo: masculino, femenino

Categricas
ordinal

Variabl
es

de
intervalo
Numricas

de razn o
relacin

Nivel socioeconmico: Bajo, Medio


y Alto
Temperatura, calificacin de
examen, etc.
Estatura, peso, distancia, etc.

Escala
ESCALA NOMINAL

Nominal

Estas variables consideran categoras que no se pueden ordenar y son


mutuamente excluyentes. Los nmeros que se asignan a objetos o fenmenos
son nombres o clasificaciones, solo son etiquetas.
Los siguientes son ejemplos de variables con este tipo de escala:
DICOTOMICOS (DOS NIVELES):
Fumador (Si /No)
Sexo (Masculino, femenino)
VARIOS NIVELES
Profesin (Ingeniero, Arquitecto, Abogado, etc)
Cuando damos nombres para diferenciar una categora de la otra pero sin establecer
ningn orden entre ellas estamos usando el tipo de medicin nominal.

ESCALA ORDINAL
Permite establecer un orden entre los elementos medidos.Los nmeros ordinales
se emplean para indicar orden de clasificacin. La regla que se utiliza es que los
objetos tienen un determinado orden pero se encuentra a distancias desiguales.
EJEMPLOS
Preferencia a productos de consumo.
Etapa de desarrollo de un ser vivo.
Madurez de una fruta al momento de comprarla.

Nivel de medicin ordinal. Ordene de mayor a menor preferencia hacia los


siguientes sabores de gaseosas de postobon
Uva ____
Naranja _____
Kola ____

ESCALA DE INTERVALO

Una escala de medicin es de intervalo si los datos tienen las propiedades de


los datos ordinales y los intervalos entre observaciones se expresan en
trminosde una unidad de medicin fija. Los datos de intervalo tienen que
ser numricos.
Los siguientes son ejemplos de variables con esta escala:

Ubicacin en una carretera respecto de un punto de referencia.

Sobrepeso respecto de un patrn de comparacin.

ESCALA DE RAZN

Tiene todas las propiedades de las anteriores y adems punto cero absoluto. Con
esta escala podemos clasificar los objetos, ordenarlos y comparar diferencias.
La regla en este caso seala que los objetos pertenecen a la misma categora,
que se encuentra ordenados, a una distancia igual uno de otro y que existe un
cero absoluto.
EJEMPLOS
Temperatura en grados centgrados
Peso en Kg. , estatura en cm.
Consumo
Bilirrubina en suero mg. por litro.
Nmero de leucocitos por mm. cbico.

EJERCICIO ESCALA DE MEDICIN


Un taller cuenta con 20 trabajadores que se dedican al ensamblado de
un cierto equipo electrnico. El administrador del centro necesita realizar
un estudio en el taller, basado en los siguientes aspectos:

1. Nivel cultural de los trabajadores.


2. Cantidad de equipos ensamblados por trabajador en cada jornada
de trabajo.
3. Tiempo, en horas, que invierte cada trabajador para ensamblar uno
de estos equipos.
4. Calidad de equipos ensamblados en una jornada de trabajo.
5. Clasificacin de los trabajadores por turnos de trabajo.
Identifica la variable, describe los valores que puede tomar y
determina cul es la escala de medicin en cada caso.

MUESTREO

Una poblacin representa la coleccin completa de elementos o resultados


de la informacin buscada
Una muestra constituye un subconjunto de una poblacin, que contiene
elementos o resultados que realmente se observan
Una muestra aleatoria simple de tamao n es una muestra elegida por un
mtodo en el que cada coleccin de n elementos de la poblacin tiene la
misma probabilidad de formar la muestra.

EJEMPLO: En una escuela se quiere saber cul es el deporte ms practicado por los alumnos.
Se realiza una encuesta a cinco alumnos de cada curso.

MEDIDAS DE RESUMEN
La media y la varianza de la poblacin son parmetros de posicin y
dispersin.
Valor de resumen, un representante de los datos.
La media se define como la suma de todos los valores ponderados por 1/N; N es
el tamao de la N
poblacin:
2

x
i 1

2 =

i 1

( xi x )
N

N- Tamao de la poblacin

Un resumen numrico de una muestra se llama estadstico


Un resumen numrico de una poblacin se llama parmetro
Con frecuencia los estadsticos se usan para estimar los parmetros

MEDIDAS DE RESUMEN

1.61
2 0.11

PROPORCIN, RAZN Y
CORRELACIN
N

xi

i 1

N
y
x

XY

1 - si tiene la caracterstica
xi
0

se llama razn
XY
XX YY

MEDIDAS DE POSICIN:
Media muestral
Suponga que se tienen los siguientes datos de una muestra.

Se define el siguiente valor llamado media aritmtica

EJEMPLO: Una muestra aleatoria de 5 hombres se elige de entre una gran poblacin de
hombres y se mide su estatura en cm 160, 178, 167, 189, 156. Encuentre la media muestral.

MEDIDAS DE POSICIN:
Media muestral
PROPIEDADES DE LA MEDIA
Todo conjunto de datos de nivel de intervalo y de nivel de razn tiene un valor
medio.
Al evaluar la media se incluyen todos los valores. La media es muy sensible a
valores atpicos
Un conjunto de valores slo tiene una media.
La cantidad de datos a evaluar rara vez afecta la media. Sin embargo, Si a todos
los valores de la variable se les suma un mismo nmero, la media aritmtica
queda aumentada en dicho nmero.
La media es la nica medida de ubicacin donde la suma de las desviaciones de
cada valor con respecto a la media, siempre es cero.
La suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica
7.6 es igual a 0

MEDIDAS DE POSICIN:
Mediana muestral
Suponga que se tienen los siguientes datos de una muestra. Se ordena la muestra en
orden ascendente, sea el orden ( incluyendo los valores repetidos)

si n es impar

x%

si n es par

n 1
valor ordenado
2
n n
= promedio de y
1 valores ordenados
2 2
=

EJEMPLO: Una muestra aleatoria de 5 hombres se elige de entre una gran poblacin de
hombres y se mide su estatura en cm 160, 178, 167, 189, 156. Encuentre la media muestral.

MEDIDAS DE POSICIN:
Mediana muestral
PROPIEDADES DE LA MEDIANA
La mediana es nica para cada conjunto de datos
No se ve afectada por valores muy grandes o muy pequeos, y por lo
tanto es una medida valiosa de tendencia central cuando ocurren.
Puede obtenerse para datos de nivel de razn, de intervalo y ordinal.

MEDIDAS
MODADE
Y RANGO
POSICIN:
Moda
La moda es el valor de la observacin que aparece con ms frecuencia.
EJEMPLO 5: las calificaciones de un examen de diez estudiantes son: 81, 93, 84,
75, 68, 87, 81, 75, 81, 87. Como la calificacin 81 es la que ms ocurre, la moda
es igual 81.

MEDIA GEOMTRICA

La media geomtrica (MG) de un conjunto de n nmeros positivos se define como la raz


n-sima del producto de los n valores. Su frmula es:

MG n ( X 1)( X 2)( X 3)...( Xn)


La media geomtrica se usa para encontrar el promedio de porcentajes, razones, ndices
o tasas de crecimiento.
EJEMPLO
Las tasas de inters de tres bonos son 5%, 7% y
4%.

MG 3 (7)(5)(4) 5,19

CUANTILES
Se define los cuantiles de orden k como los valores de la variable ordenada de menor a
mayor, que la dividen en k partes con la misma frecuencia de observaciones. Por lo tanto
existirn k-1 cuantiles de orden k.
PERCENTILES (Pj)
Son los 99 puntos que dividen la distribucin en 100 partes de 1% de los valores de
la distribucin
CUARTILES (Qj)
Son los tres valores que dividen la distribucin en 4 partes iguales, cada una incluye
el 25% de los valores.
DECILES (Dj)
Son los 9 puntos que dividen la distribucin en 10 partes, en cada una esta incluida
Los
datos
se ordenan
el 10%
de los
valores. en forma creciente y el valor divide el conjunto de datos en dos
partes, en la parte izquierda se encuentra el 25% de los datos, en la parte derecha el 75%
de los datos.

CUANTILES

Procedimiento para encontrar el valor del cuantil j de orden k a partir de


los datos ordenados de menor a mayor, es el siguiente:
1. Encontrar la posicin i del cuantil j-esimo mediante el calculo de nj/k
2. Si nj/k no es un nmero entero, entonces la posicin i es el siguiente
entero ms grande y entonces el valor del cuantil es el dato ordenado
en la posicin de este entero
3. Si nj/k es un entero, entonces la posicin del cuantil ser i = nj/k+0,5 y
as el valor del cuantil es el promedio de las observaciones ordenadas
nj/k y nj/k +1

MEDIDAS DE VARIABILIDAD

Recorrido
Para un conjunto de datos se halla el mayor valor y el menor
valor

x min min
x max max

x1 , x 2 ,..x n
x1 , x 2 ,..x n

R x max x min

MEDIDAS DE DISPERSIN
Desviacin Media

Media aritmtica de los valores absolutos de las desviaciones respecto a la media


aritmtica. Sea las calificaciones de un examen de diez estudiantes son: 3.5, 4.3, 3.8,
3.7, 3.6, 3.8, 3.9, 3.5, 3.5, 3.8. La media es 3.74, por lo tanto, las desviaciones seran:
-0.24, 0.56,0.06l luego se calcula el promedio de las desviaciones en valor absoluto,

DMA( X )

i 1

xi
N

MEDIDAS DE DISPERSIN
Varianza

La varianza poblacional es el promedio de las desviaciones


cuadrticas.
2

d i ( xi ) 2

Se llama desviacin cuadrtica a

La varianza se denota con la letra sigma al cuadrado


N

i 1

( x i )
xi

2
N
N
2

MEDIDAS DE DISPERSIN
Varianza muestral y Desviacin
estndar

1 n
s =
xi x

a varianza muestral estima la varianza de la poblacin.


n 1 i 1
2

Una frmula equivalente, es


1
s =
n 1
2

x
i 1

2
i

nx

La desviacin estndar muestral es la raz cuadrada de la varianza muestral.


La amplitud o rango es la diferencia entre los valores mayor y menor en un
conjunto de datos.

MEDIDAS DE DISPERSIN
Coeficiente de Variacin
El coeficiente de variacin es la razn de la desviacin estndar a la
media aritmtica, expresada como porcentaje.

s
CV (100%)
x

TEOREMA DE CHEBYSHEV
Sea k>1, para cualquier conjunto de datos , la proporcin de los valores que estn

comprendido entre es por lo menos de p=1-1/k^2..

REGLA
EMPIRICA

Para las distribuciones que tienen forma de campana


( x estndar
s, x s )
i) El 68% de los datos caern dentro de una desviacin
( x 2 sestndar
, x 2s)
ii) El 95% de los datos caern dentro de dos desviaciones
iii) El 99,9% de los datos caern dentro de tres desviaciones
( x 3sestndar
, x 3s )

PREGUNTAS DE ANALISIS
1. VERDADERO O FALSO: para cualquier lista de nmeros, la mitaD de ellos estar
debajo de la media.
2. Es la media de la muestra el valor qu mas ocurre con mas frecuencia? Si es as,
explique por qu. Si no, de un ejemplo.
3. Es la media de la muestra siempre igual a uno de los valores de la muestra? Si es
as, explique por qu. Si no, de un ejemplo.
4. Encuentre un tamao de la muestra para la cual la mediana siempre es igual a uno
de los valores de la muestra.
5. En una compaa, cada trabajador recibi un aumento de $50 por semana. Cmo
afecta esto la media de los sueldos? , y la desviacin estndar de los sueldos?

EJERCICIOS DE CLASE

22 23 22 24 26 25 26 25 29 27 25 32 34 34 33 33
36 36 35 39
Calcular la media aritmtica
Calcular la mediana
Calcular la media geomtrica
Calcular la moda
Calcular la varianza
Calcular la desviacin estndar
Calcular el Percentil 25 (P25), Cuartil 3, Decil 1, Percentil
16
Coeficiente de variacin

Se utiliza cierto polmero para los sistemas de evacuacin de los aviones. Es


importante que el polmero sea resistente al proceso de envejecimiento. Se
utilizaron veinte especmenes del polmero en un experimento. Diez se
asignaron aleatoriamente para exponerse a un proceso de envejecimiento
acelerado del lote, el cual implica la exposicin a altas temperaturas durante
10 das. Se hicieron las mediciones de resistencia a la tensin de los
especmenes y se registraron los siguientes datos sobre resistencia a la tensin
en psi.

Sin envejecimiento: 227 222 218 217 225 218 216 229
228 221
Con envejecimiento: 219 214 215 211 209 218 203 204
201 205

a) Elabore la grfica de puntos de los datos.


b) En la grfica que obtuvo parece que el proceso de
envejecimiento tuvo un efecto
en la resistencia a la tensin de este polmero? Explique su
respuesta.
c) Calcule la resistencia a la tensin de la media de la muestra en
las dos muestras.
d ) Calcule la mediana de ambas. Analice la similitud o falta de
similitud entre la media y la mediana de cada grupo.
e) Calcule la varianza de la muestra, as como su desviacin
estndar, en cuanto a la resistencia a la tensin en ambas
muestras.

Você também pode gostar