Trabajo Grupal 1 - Geoestaditisca Avanzada

21/04/2013
METODOS CUANTITATIVOS
Profesora: Sara Arancibia C

2013
Contenidos
• Estadística Descriptiva
• Introducción a Inferencia Estadística
• Distribuciones de Probabilidad
• Una introducción al análisis de correlación y regresión
lineal
1
21/04/2013
ntroducción a la Estadística Descriptiva
¿Qué es la Estadística?
Estadística: Ciencia que trata de la recopilación
recopilación, organización
organización,
presentación, análisis e interpretación de datos numéricos
(estadísticas) con el fin de realizar una toma de decisiones más
efectiva.
¿Quién utiliza la Estadística?
Las técnicas estadísticas se aplican de manera amplia en

mercadotecnia,
d t i contabilidad,
t bilid d control
t l de
d calidad
lid d y en otras
t
actividades; estudios de consumidores; análisis de resultados;
administración de instituciones; la educación; organismos
políticos, médicos; y por otras personas que intervienen en la
toma de decisiones.
ntroducción a la Estadística Descriptiva
Estadística descriptiva: Procedimientos estadísticos que sirven para

organizar
g y resumir conjuntos
j de datos numéricos
Trata la presentación de datos en gráficas o en distribuciones de
frecuencias y diversas tablas estadísticas , y de aplicar medidas de
tendencia central y medidas de dispersión. ( DESCRIBIR
INFORMACIÖN).
Estadística inferencial: Procedimientos estadísticos que sirven para

deducir o inferir algo acerca de un conjunto de datos numéricos
(población), seleccionando un grupo menor de ello ( muestra).
Funciona tomando una muestra de una población y efectuando
estimaciones acerca de una característica de esa población con base
en los resultados de muestreo.
2
21/04/2013
Estadística Descriptiva
Población: Conjunto
j de todos los posibles
p individuos,,
personas,objetos o mediciones de interés científico
Para deducir algo acerca de una población, por lo

general se toma una muestra de dicha población.
Muestra: Una porción, o parte de una población de interés.
Tipos y ejemplos de variables
Datos
Cualitativos o de atributo Cuantitativos o numéricos

(las no numéricas)
Ejemplos:
Tipo de auto
Color de cabello Discretos Continuos
Género
Número de hijos Peso de un embarque
Cantidad de empleados Distancia entre dos
ciudades
3
21/04/2013
Niveles de medición
Nivel de Medición Nominal:
En este nivel se tienen dos o más categorías del ítem o

variable.Las categorías no tienen orden o jerarquía. Lo que
se mide es colocado en una u otra categoría, lo que indica
solamente diferencias respecto a una o mas características.
Por ejemplo la variable sexo de la persona tiene sólo dos

categorías: masculino y femenino.
Ninguna tiene mayor jerarquía que la otra, las categorías

únicamente reflejan diferencias en la variable.
No hay orden de mayor a menor.
Si le asignamos una etiqueta o símbolo a cada categoría, esto identifica

exclusivamente a la categoría.
Por ejemplo;
M=Masculino; F=Femenino
Si usamos números por ejemplo;

1=Masculino
2=Femenino
Los números utilizados en este nivel de medición tienen una función
puramente de clasificación y no se puede manipular aritméticamente.
Otros ejemplos: tipo de escuela a la que asiste ( privada-pública),

afiliación política (Partido A,Partido B, Partido C....), la carrera elegida, la
raza, la ciudad de nacimiento, el canal de televisión preferido.
4
21/04/2013
NOTA: Las categorías son los niveles donde serán

caracterizados las unidades de análisis.
OBS: las categorías se consideran como mutuamente

excluyentes y exhaustivas.
Mutuamente excluyente: Una persona, objeto o medición

se incluye solamente en una categoría.
Exhaustiva: Cada individuo, objeto, o medición debe

aparecer en una categoría.
Nivel de medición ordinal

En este nivel hay
y varias categorías,
g pero además éstas
mantienen un orden de mayor a menor. Las etiquetas o
símbolos de las categorías sí indican jerarquía.
Calificación de estudiantes o personal diverso:
Calificaciones Número de personas

Excelente 6
Muy bien 28
Bien 25
Suficiente 17
Deficiente 0
5
21/04/2013
Nivel de medición por Intervalos

Además del orden o jerarquía entre categorías, se establecen
intervalos iguales en la medición. Las distancias entre categorías
son las mismas a lo largo de toda la escala. Hay intervalo constante,
una unidad de medida.
Ejemplo:
Las puntuaciones en un cierto examen y las calificaciones en

uno de historia o de matemáticas son ejemplos de la escala de
medición de intervalo.
Obs: El cero en la medición, es un cero arbitrario, no es real (se
asigna arbitrariamente a una categoría el valor cero y a partir de
ésta se construye la escala).
Nivel de medición de razón

En este nivel, además de tenerse todas las características
del nivel de intervalos ( intervalos iguales entre las
categorías y aplicación de operaciones aritméticas básicas
y sus derivaciones), el cero es real, es absoluto ( no es
arbitrario). Cero absoluto implica que hay un punto en la
escala donde no existe la propiedad.
Ejemplos de estas mediciones sería la exposición a la

televisión, el número de hijos,
televisión hijos la productividad,
productividad las
ventas de un producto y el ingreso.
6
21/04/2013
Desde luego hay variables que pueden medirse en más

de un nivel, según el propósito de medición. Por ejemplo
la variable “antigüedad en la empresa”
empresa”.
Nivel de medición Categorías

De razón En días ( o a K días)
Ordinal Bastante antigüedad
Regular antigüedad
Poca antigüedad
Es muy importante indicar el nivel de medición de todas las variables e ítems
de la investigación, porque dependiendo de dicho nivel se selecciona uno u
otro tipo de análisis estadístico
( por ejemplo, la prueba estadística para correlacionar dos variables de
intervalo es muy distinta a la prueba para correlacionar dos variables
ordinales).
13
1.-Resumen de datos: distribuciones de frecuencias y

representaciones gráficas
La primera tarea es describir los datos, valores o puntuaciones obtenidas
para cada variable.
¿Cómo pueden describirse estos datos?
Describiendo la distribución de las puntuaciones o

frecuencias
¿Qué es una distribución de frecuencias?
Una distribución de frecuencias es un conjunto de

puntuaciones ordenadas en sus respectivas categorías.
7
21/04/2013
Variable: Cooperación del personal para el proyecto de calidad de la
empresa.
Categorías
g Códigos
g Frecuencia
Si se ha obtenido la cooperación 1 91
No se ha obtenido la cooperación 2 5
No responden 3 26
Total 122
Ingreso familiar ($) Frecuencia
10.000-11.999 12
A veces , las categorías de las 12.000-13.999 14
distribuciones de frecuencias 14.000-15.999 24
son tantas que es necesario 16.000-17.999 15
resumirlas en clases. 18.000-19.999 13
20.000-21.999 7
22.000-23.999 6
24.000-25.999 4
26.000-27.999 3
28.000-29.999 2
Total 100
¿Qué otros elementos contiene una distribución de

frecuencias?
Las distribuciones de frecuencias pueden completarse

agregando las frecuencias relativas y las frecuencias
acumuladas. Las frecuencias relativas son los porcentajes de
casos en cada categoría, y las frecuencias acumuladas son
las que se van acumulando en cada categoría, desde la más
baja hasta la más alta.
Categorías Códigos Frecuencias Frecuencias Frecuencias Frecuencias

absolutas relativas% acumuladas Acumrelativas
Si se ha obtenido la cooperación 1 91 74,6 91 74,6
No se ha obtenido la cooperación 2 5 4,1 96 78,7
No responden 3 26 21,3 122 100
8
21/04/2013
¿Cómo presentar las distribuciones de frecuencia?
Pueden presentarse con los elementos más informativos para el lector y

la verbalización de los resultados o un comentario o en forma de
histograma o gráficas de otro tipo.
Ejemplo: ¿ Se ha obtenido la cooperación del personal para el proyecto

de calidad de la empresa?
Categorías N de organizaciones Porcentajes
Si se ha obtenido la cooperación 91 74,6

No se ha obtenido la cooperación 5 4,1
No responden 26 21 3
21,3
Comentario: Prácticamente tres cuartas partes de las organizaciones si han

obtenido la cooperación del personal. Llama la atención que poco más de una
quinta parte no quiso comprometerse con su respuesta. Las organizaciones que no
han logrado la cooperación del personal mencionaron como factores al ausentismo,
rechazo al cambio.
Representación gráfica de una distribución de frecuencia

Tres diagramas que representan de manera adecuada, una distribución
de frecuencias son el histograma
histograma, el polígono de frecuencias y el
polígono de frecuencias acumuladas.
Un histograma describe una distribución de frecuencias utilizando una

gráfica de barras ( rectángulos verticales adyacentes), en la que la altura de
cada barra es proporcional a la frecuencia de la clase que representa.
Histograma
Motivación hacia el trabajo
40 35 36
33
30 27
20
20
10 8
10
0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9
9
21/04/2013
El polígono de frecuencias consiste en una línea poligonal formada por segmentos

de recta que unen los puntos determinados por la intersección de la vertical del
punto medio de clase, y la horizontal de la frecuencia de clase.
Polígono de frecuencia
40
35 35 36
33
30
27
25
20 20
15
10 10
8
5
0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9
Un polígono de frecuencias acumuladas (ojiva) se utiliza cuando se desea

determinar cuántas observaciones se encuentran por encima o debajo de
ciertos valores.
Polígono de frecuencias acumuladas

180
169
160 161
140 134
120
100 98
80
60 65
40
30
20
10
0
20-24,9 25-29,9 30-34,9 35-39,9 40-44,9 45-49,9 50-54,9
10
21/04/2013
Diagrama de Pareto
Un diagrama de Pareto se asemeja a un histograma, excepto que es una gráfica
de barras de frecuencias de una variable cualitativa
cualitativa.
Los diagramas de Pareto se usan en el control de procesos para tabular las
causas asociadas con variaciones de causas atribuibles en la calidad del
producto. Los diagramas de Pareto permiten que tanto equipos de trabajadores
como gerentes se concentren en las áreas más importantes en las que se
necesitan acciones correctivas.
Ejemplo:
Se encontró que los refrigeradores que no fueron aprobados en la

inspección final en una planta ensambladora de aparatos eléctricos durante
el último mes tenían defectos debidos a las siguientes causas: ensamble,
acabado de laca, fallas eléctricas, abolladuras u otras causas. Realizar un
diagrama de Pareto.
Diagrama de Pareto de : Defectos

40
Po
orcentaje
30 100
20
50
10
Frecuencia
10
7
5 5
0 3 0
Ensamble Laca Abolladu Eléctric Otros
DEFECTO
11
21/04/2013
Tablas de contingencia
Las tablas de frecuencia pueden organizar datos de sólo una
variable a la vez. Si se desea examinar o comparar dos
variables, una tabla de contingencia resulta de mucha
utilidad.
Supongamos que se recolecta información sobre el número

de pasajeros de una línea aérea, también se obtuvieron datos
sobre las edades de los pasajeros y el número de vuelos en
l que se registraron
los i t cada
d año.
ñ Ambas
A b variables
i bl pueden
d
verse en detalle mediante una tabla de contingencia.
Número de vuelos por año

Edad 1-2 3-5 Mayor de 5 Total
Menor de 25 1 (2%) 1 (2%) 2 (4%) 4 (8%)
25-40 2 (4%) 8 (16%) 10 (20%) 20 (40%)
41-65 1 (2%) 6 (12%) 15 (30%) 22 (44%)
66 y más 1 (2%) 2 (4%) 1 (2%) 4 (8%)
Total 5 (10%) 17 (34%) 28 (56%) 50 (100%)
También se podría mostrar la información en cada celda

según
g el género.
g Todas las otras características
relevantes de los pasajeros también podrían
incorporarse en la tabla. Dicho perfil descriptivo podría
ser muy útil en la identificación del pasajero típico y en el
establecimiento de políticas de marketing efectivas.
12
21/04/2013
2.- Descripción de los datos: Medidas de tendencia central

¿Qué es un promedio?
Valor que representa un conjunto de datos
datos.
Señala un centro de los valores.
Una denominación más precisa que promedio es medida de
tendencia central.
Las medidas de tendencia central, que por lo

común se emplean en administración y economía
son :
• la media aritmética
• la mediana
• la moda
• la media geométrica
Media: (Mean) La media ( promedio) es la medida de tendencia central más
utilizada y puede definirse como el promedio aritmético de una distribución.
Es una medida solamente aplicable a mediciones por intervalos o de razón.
Media de una muestra:
X
X
n
donde  X indica la suma de todos las X
n es el número total de valores en la muestra
M di de
Media d una población:
bl ió

X
N
 indica la media poblaciona l.
N es el número total de observacio nes en la población
13
21/04/2013
Ejemplo:
El ingreso anual (en dólares) de una muestra de varios empleados en una

industria son: 42900, 49100,38300 y 56800.
La media muestral es 187100/4=46775.
¿La media obtenida es un dato estadístico o un parámetro?
Estadístico porque es un valor muestral.
Nota:Cualquier
q característica medible de una muestra se llama dato
estadístico. Cualquier característica medible de una población, como la
media, se denomina parámetro.
La Mediana:(Median) es el valor céntrico en un conjunto de valores

ordenados de menor a mayor o de mayor a menor.Una forma fácil de
localizar la posición del elemento medio para datos no agrupados es por
medio
di de:
d
n 1
2
•. Es una medida de tendencia central propia de los niveles de una medición
ordinal, por intervalos y de razón.
•. No es influenciada por valores extremos.
•. 50%de
50%d llas observaciones
b i son mayores que la
l mediana.
di
• No necesita ser uno de los valores del conjunto de datos.
• Es única para un conjunto de observaciones.
14
21/04/2013
Ejemplo:
Supóngase que intenta adquirir una casa en un condominio de la comuna de La

Reina. El agente de ventas le indicó que el precio promedio de las casas
disponibles en este momento es de 4225 UF.
Si tuviera un presupuesto máximo de 2800UF, podría pensar que está fuera de
sus posibilidades. Sin embargo al verificar los precios individuales de las casas
podría cambiar de idea. Los precios son 2300UF, 2600UF, 3500UF y 8500UF.
El precio 8500UF está haciendo que la media se incline hacia arriba, por lo que
es un promedio no representativo. Un precio entre 2600 y 3500 es un promedio
más representativo. En casos como éste la mediana proporciona una medida
más exacta de la tendencia central.
La moda: (mode): Valor de la observación que aparece con más frecuencia.
•La moda es útil en especial al describir los niveles nominal y ordinal de

medición (aunque puede determinarse para todos los niveles de datos)
•Un conjunto de datos puede tener más de una moda
Ejemplo:
Una empresa ha desarrollado cinco lociones para baño. En el diagrama se

muestran los resultados de una investigación de mercado diseñada para
determinar qué loción para baño prefieren los consumidores
consumidores.
15
21/04/2013
Número de entrevistados acerca de lociones

para baño
400 360
Número de respuestas
350
300
250
200 180
150 105
100 70
50
50
0
Cariño Lamoure Extasis Elegancia Nocturna
La mayor cantidad de respuestas favoreció a la llamada Lamoure,

según lo indica la barra más alta. Por tanto tal producto es la moda.
Uso de media, mediana y moda

Datos de la población
La moda puede ser útil como medida descriptiva de un grupo de la
población, aunque sólo si existe una moda claramente perceptible.
La mediana es siempre una medida excelente para representar el nivel típico

de los valores observados, como los índices salariales, de una población.
Esto es así independientemente de la existencia de más de una moda o de
que la distribución de la población sea asimétrica o simétrica.
La media aritmética es excelente como valor representativo de una

población,
bl ió aunque sólo ól sii la
l población
bl ió es claramente
l t simétrica.
i ét i En
E datos
d t no
simétricos, los valores extremos distorsionarán el valor de la media como
valor representativo.
16
21/04/2013
Uso de media, mediana y moda
Datos muestrales
La moda: La moda no es una medida aceptable de posición respecto de
datos muestrales, porque su valor puede variar ampliamente de una
muestra a otra.
La mediana: es mejor que la moda, porque su valor es más estable entre

muestra y muestra.
La media: es la más estable de las tres medidas.
Ejemplo:
Se han recopilado los índices salariales de los 650 empleados por hora de
una empresa manufacturera.
f t L
La medida
did más
á representativa
t ti del
d l índice
í di
salarial típico es la mediana, porque en este caso está implicada una
población y la mediana no se ve relativamente afectada por la posible falta
de simetría de los índices salariales.
Ejemplo:
Una muestra aleatoria de n=100 índices salariales se obtiene en una

compañía con varios miles de empleados por hora El índice salarial más
representativo de estos varios miles de empleados es la media muestral.
Aunque es improbable que la media muestral sea exactamente igual al índice
salarial medio de toda la población, por lo general se hallará mucho más
cerca de la media poblacional que la mediana muestral como estimador del
índice salarial mediano de la población.
17
21/04/2013
Nota: Es mejor usar la mediana que la media como

medida de tendencia central,
central cuando un conjunto de
datos contiene valores extremos. Otra medida que se usa
a veces cuando hay valores extremos es la media
recortada al 5%, que se obtiene eliminando el 5% de los
valores mayores y el 5% de los menores, en un conjunto
de datos, procediendo entonces a calcular el promedio
de los valores restantes.
Media Geométrica
La media ggeométrica (MG)

( ) tiene una amplia aplicación en los negocios
g y en
la economía.
Hay dos usos principales de la MG:
1)Para promediar porcentajes, índices y cifras relativas
2) Para determinar el incremento porcentual promedio en ventas,
producción u otras actividades o series económicas de un periodo a otro.
La media geométrica (MG) de un conjunto de n números positivos se define

como la raíz n-ésima del p
producto de los n números. Proporciona
p una medida
precisa de un cambio porcentual promedio en una serie de números.
MG  n ( X 1 )( X 2 )( X 3).............( X n )
18
21/04/2013
Ejemplo:
Para ilustrar el empleo de la media geométrica en promedios de porcentajes

, supóngase que las utilidades obtenidas por una compañía constructora en
cuatro proyectos fueron de 3, 2 , 4 y 6%, respectivamente. ¿Cuál es la
media geométrica de las ganancias?
MG n (X1)(X2 )(X3)(X4 )

 4 (3)(2)(4)(6)
 4 144
 3,46
La media geométrica 3,46 da una cifra más conservadora para las
utilidades porque no se ve tan afectada por los valores extremos. En
realidad, será igual o menor que la media aritmética.
Ejemplo:
Suponga que usted recibe un 5 por ciento de aumento en su salario este año
y un 15 por ciento de aumento el año próximo.
próximo El incremento porcentual
promedio es 9.886, no 10.0. Empezamos por calcular la media geométrica.
Recuerde, por ejemplo, que un aumento de 5 por ciento en el salario es 105 o
1.05. Lo escribiremos como 1.05.
Esto se puede verificar suponiendo que su salario mensual sea de $3.000 al
empezar y que usted reciba dos aumentos de 5 por ciento y de 15 por ciento.
Aumento 1 = $3.000 (.05) = $150.00
Aumento 2 = $3.150 (.15) = 472.50
Total $622.50
Su aumento total de salario es $622.50. Esto es equivalente a:
$3.000.00 (.09886) = $296.58
$3.296.58 (0.9886) = $325.90
$622.48 que es aproximadamente $622.50
19
21/04/2013
Para determinar el incremento porcentual promedio en ventas,

exportaciones, población u otras series se utiliza la siguiente fórmula:
INCREMENTO PORCENTUAL PROMEDIO

EN EL TIEMPO
Valor al final del periodo

GM  n 1
Valor al principio del periodo
Ejemplo:
La población de Haarlan,
Haarlan Alaska,
Alaska era de dos personas en 1990
1990, en 2000 fue de 22
22.
¿Cuál es la tasa de incremento anual promedio de este periodo?
Solución:
Hay 10 años entre 1990 y 2000 por lo que n = 10. La fórmula (3-6) para la media
geométrica aplicada a este tipo de problema queda:
22
MG  10  1  1.271  1  0.271
2
El valor final es .271. La tasa anual de incremento es 27.1 por ciento. Esto
significa que la tasa de crecimiento en Haarlan es 27.1 por ciento por año[1].
[1
20
21/04/2013
Ejercicio:
El Director ejecutivo de la empresa Airlines desea determinar la tasa de

crecimiento promedio en los ingresos con base en las cifras entregadas
en la tabla: si la tasa de crecimiento promedio es menor que el promedio
industrial del 10% se asumirá una nueva campaña publicitaria .
Determine la tasa de crecimiento promedio.
Año Ingreso Miles de US$ Porcentaje del año anterior

1992 50
1993 55
1994 66
1995 60
1996 78
Media Ponderada
La media ponderada de un conjunto de números denotados por

X1, X2, X3, ...,Xn, con ponderaciones
w1, w2, w3, ...,wn se calcula como sigue:
w1 X 1  w 2 X 2  .....  w n X n
Xw 
w1  w 2  .....  w n
Esto puede abreviarse.
21
21/04/2013
Ejemplo:
Una empresa comercial paga a sus vendedores

$6 50 $7
$6.50, $7.50,
50 u $8
$8.50
50 (dól
(dólares)) por hora.
h
Podría llegarse a la conclusión de que la media de los sueldos (por
hora) es $7.50, obtenida al calcular: (6.50+7.50+8.50)/3. Esto es
cierto sólo si hay el mismo número de vendedores que perciben
$6.50, $7.50, y $8.50.
Sin embargo, supóngase que 14 empleados de ventas ganan $6.50,
a 10 se les paga $7.50,y 2 obtienen $8.50. Para encontrar la media
se debe calcular:
14(6.50)  10(7.50)  2(8.50)

Xw 
14  10  2
La media ponderada de los sueldos por hora es $7.04
3.- Estadísticos de la distribución: Asimetría y curtosis

La asimetría es una estadística necesaria para conocer qué tanto nuestra
distribución se parece a una distribución teórica llamada curva normal.
normal
El sesgo o asimetría ( Skewness) es la carencia de forma simétrica en la

gráfica de un conjunto de datos.
•Si no existe asimetría o sesgo en los datos, son iguales la media, la mediana y
la moda. La mitad de los valores están por encima de estos promedios y la
mitad por debajo de ellos ( asimetría =0).
Media
mediana
Moda
22
21/04/2013
Cuando la asimetría es positiva quiere decir que hay más valores

agrupados hacia la izquierda de la curva ( por debajo de la media).
•La moda es el valor que corresponde al punto más alto

•La media es el mayor de los tres promedios
Moda Media
Mediana
Cuando la asimetría es negativa significa que los valores
tienden a agruparse hacia la derecha de la curva ( por encima
de la media).
•La moda es el valor que corresponde al punto más alto de la distribución.
•La media es el más pequeño de los tres promedios.
Media Moda
Mediana
Nota: Si la distribución es muy asimétrica, la media no sería un promedio

útil. La mediana y la moda son más representativas.
23
21/04/2013
Coeficiente de asimetría
Karl Pearson desarrolló una medida para evaluar el sesgo de unas
distribución denominada coeficiente de asimetría (C
distribución, (C.A)
A)
3(media  mediana)
C. A 
desviación estándar
Ejemplo:
Las duraciones de estadía en el piso de cancerología de un hospital, se

organizaron en una distribución de frecuencias. La duración media fue 28
días, la mediana 25 días y la duración modal 23 días Se calculó la desviación
estándar de 4,2 días
¿Cuál es el coeficiente de asimetría?
El coeficiente de asimetría por lo general se encuentra entre -3 y 3. En

este caso es 2,4 e indica un grado importante de asimetría con sesgo
positivo.
Curtosis;(Kurtosis) mide el grado de agudeza de una distribución.
Cuando la curtosis es cero, significa que
se trata de una curva normal, . Si es
positiva, quiere decir que la curva o
distribución es más levantada. Si es
negativa, quiere decir que la curva es
más plana .
Curva leptocúrtica Curva mesocúrtica
Curva plalticúrtica
Nota: La asimetría y la curtosis requieren mínimo un nivel de medición por intervalos.
24
21/04/2013
4.- Medidas de Posición: Cuantiles

Los cuantiles son valores de la distribución que la dividen en partes iguales, es
d i en intervalos,
decir, i t l que comprendend ell mismo
i número
ú de
d valores.
l Los
L más á
usados son los cuartiles, los deciles y los percentiles.
Percentiles: Son 99 valores que dividen en cien partes iguales el conjunto de

datos ordenados. Ejemplo, el percentil de orden 15 deja por debajo al 15% de las
observaciones, y por encima queda el 85%.
Cuartiles: Son los tres valores que dividen al conjunto de datos ordenados en
cuatro
c atro partes ig
iguales,
ales son un n caso partic
particular
lar de los percentiles
percentiles.
Deciles: son los nueve valores que dividen al conjunto de datos ordenados en
diez partes iguales, son también un caso particular de los percentiles.
La determinación de cuartiles con frecuencia es de utilidad. Por ejemplo

muchas escuelas de posgrados admitirán sólo aquellos estudiantes que
estén en el 25% superior (sobre el tercer cuartil) de los candidatos. Las
empresas, con frecuencia,
f i desean
d señalar
ñ l las
l plantas
l t cuyos deficientes
d fi i t
registros de producción los colocan por debajo del cuartil inferior.
El lugar del P-ésimo percentil se halla:
P
L p  (n  1)
100
Donde Lp es el sitio del percentil deseado en una serie ordenada
n es el número de observaciones.
P es el percentil deseado.
La amplitud intercuartil es la diferencia entre el tercer y primer cuartil.
25
21/04/2013
Diagrama de Caja
(Box-plot)
El diagrama de caja permite

resumir los datos de una
gráfica.
5.- Medidas de dispersión
Con frecuencia es conveniente contar con medidas de dispersión o

de la variabilidad de los valores de los datos.
Por ejemplo, suponga que usted es un agente de compras de una
importante empresa manufacturera, y que con regularidad coloca
pedidos con dos proveedores distintos. Ambos le indican que
necesitan alrededor de 10 días hábiles para surtir sus pedidos.
Después de varios meses de trabajar así encuentra usted que el
promedio de días necesarios para surtir los pedidos es realmente,
unos 10 para cada proveedor. Los histogramas que resumen la
cantidad de días hábiles requeridos para surtir los pedidos se ven en
la figura.
26
21/04/2013
Aunque la cantidad promedio es, más o menos, de 10 en ambos casos

¿tienen éstos el mismo grado de confiabilidad para entregar a tiempo? ¿Qué
proveedor prefiere usted?
Proveedor A
.5 Proveedor B
Frecuencia
relativa .4
.3
.2
.1
9 10 11 7 8 9 10 11 12 13 15
Días hábiles Días hábiles
Examinaremos varias medidas que describirán la dispersión o

variabilidad de los datos; la amplitud total, la varianza, la desviación
estándar, dispersión relativa.
¿Por qué estudiar la dispersión?
1. Al aplicar una medida de dispersión es posible evaluar la confiabilidad

del promedio que se está utilizando.
Una dispersión pequeña indica que los datos se encuentran acumulados
cercanamente, por ejemplo, alrededor de la media aritmética. Por tanto la
media se considera bastante representativa de los datos. Esto es la media
es un promedio confiable.
2. Una medida de dispersión permite apreciar cuán dispersas están dos o
más distribuciones.
27
21/04/2013
Medidas de dispersión
Amplitud
p total ( rango)
g )
Se trata de la diferencia entre los valores mayor y menor de un
conjunto de datos.
Amplitud total= Valor más alto- Valor más bajo
Ejercicio: Los costos anuales de viaje para ejecutivos y gerentes medios

en una empresa se organizaron en distribuciones de frecuencias y se
representaron por medio de polígonos de frecuencias.
1 ¿Cuál
1. C ál es lla media
di aritmética
it éti ded los
l costos
t ded viaje
i j para ejecutivos?
j ti ?¿
Par los gerentes de nivel medio?
2. ¿Cuál es la amplitud total para los ejecutivos?¿ Y para los gerentes de
nivel medio?
3. Compare la dispersión de las dos distribuciones y explique lo que
indica.
Gerencia de nivel medio
Ejecutivos
2000 6000 10000 12000
Nota: Un defecto importante de la amplitud total es que se basa sólo en dos

valores. No toma en consideración todos los datos.
28
21/04/2013
Varianza y desviación estándar

La varianza y la desviación estándar se basan en las desviaciones con
respecto
p a la media.
Varianza:( Variance) Media aritmética de las desviaciones cuadráticas con

respecto a la media.
Varianza poblacional
(X X2  X 
2
  )2 
 2  o bien  2  
 
N N  N 
donde
 2  es el símbolo para la varianza de una población
X es el valor de la observación en la población
 es la media de la población
N es el número total de observaciones en la población
En general es difícil interpretar el significado del valor de una varianza,
porque las unidades en las que se le expresa son valores elevados al
cuadrado. Es más frecuente el uso de la raíz cuadrada.
Desviación estándar:( Standard deviation) Raíz cuadrada de la varianza.
 ( X  )2  X 2    X 
2
  o bien  
 N 
N N  
Una desviación estándar pequeña para un conjunto de valores indica

que éstos se encuentran localizados cerca de la media. Por el contrario,
una desviación estándar grande revela que las observaciones están muy
dispersas con respecto a la media.
29
21/04/2013
Varianza muestral
La fórmula para la varianza muestral utilizada como estimador de la

varianza poblacional es:
( X ) 2
 (X  X) 2 X2 n
s2  o bien s 2 
n 1 n 1
¿Por qué se hizo al denominador esta modificación?

Puede demostrarse que si se hubiera calculado la varianza
muestral utilizando sólo n en el denominador, el resultado
subestimaría la varianza poblacional. Esto es, la varianza muestral
sería un estimador sesgado de la varianza poblacional.
Desviación estándar muestral
La desviación estándar de una muestra se utiliza como un estimador de la

desviación estándar de la población.
(X )2
(X  X )2 X 2

n
s o bien s 
n 1 n 1
30
21/04/2013
Interpretación y usos de la desviación estándar

Por lo común la desviación estándar se emplea p como una medida p para
comparar la dispersión en dos o más conjuntos de observaciones. Por
ejemplo, la desviación estándar de las cantidades quincenales invertidas en
el plan de participación de las utilidades de una empresa se ha calculado
como 7,51 dólares. Supóngase que tal empresa tiene una rama en el sur. Si la
desviación estándar para otro grupo de empleados en el oeste es 10,47
dólares y las medias son aproximadamente iguales, esto indica que las
cantidades invertidas por los empleados del sur no se dispersan tanto como
las de los empleados del oeste (porque 7,51<10,47). Ya que las cantidades
invertidas por los empleados del sur se acumulan a la media, el valor medio
para estos trabajadores es una medida más confiable que la media para el
grupo del oeste.
La desviación estándar se interpreta como cuánto se

desvía- en promedio
desvía promedio- de la media un conjunto de
puntuaciones.
Supóngase que un obtuvo para su muestra una media de

ingreso familiar de $800000 y una desviación estándar de
$100000. La interpretación es que los ingresos familiares
de la muestra se desvían en promedio respecto a la media
en cien mil pesos.
La desviación estándar sólo se utiliza en variables

medidas por intervalos o de razón.
31
21/04/2013
Teorema de Chebyshev
El matemático ruso Chebyshevy desarrolló un teorema q que
permite determinar la proporción mínima de los valores que se
encuentra dentro de un número específico de desviaciones
estándares con respecto a la media.
Por ejemplo, con base en el teorema de Chebyshev, al menos tres
de cada cuatro valores, o 75%, deben encontrarse entre la media
más dos desviaciones estándares y la media menos dos
desviaciones estándares.
Esta relación se aplica sin importar la forma de la distribución.
distribución
Además, al menos ocho de cada nueve valores, o 89,9%, se
encontrarán entre la media más tres desviaciones estándares y la
media menos tres desviaciones. Al menos 24 de 25 valores, o
96%, se encontrarán entre la media y menos cinco desviaciones.
En términos generales, el teorema de Chebyshev establece que; para un
conjunto cualquiera de observaciones (muestra o población), la proporción
mínima de los valores que se encuentran dentro de k desviaciones estándares
desde la media es al menos.
menos
donde k es una constante mayor que 1.

11/ k 2
Ejemplo:
suponga que la cantidad media quincenal depositada por los empleados de
una empresa en el plan de participación de utilidades de la empresa fue $51,04
y se obtuvo una desviación estándar de $7,51. Al menos ¿qué porcentaje de las
contribuciones se encuentran a una distancia de más dos desviaciones
estándares y menos dos desviaciones estándares de la media?
Solución; Aproximadamente 75%, que se obtiene al calcular
1
1  1 / k 2  1  1 / 22  1   0,75
4
32
21/04/2013
El teorema de Chebyshev se refiere a cualquier conjunto de valores; esto es, la
distribución de los valores puede tomar cualquier forma. Sin embargo, para una
curva de distribución simétrica en forma de campana podemos ser más
precisos al explicar la dispersión
dispersión.
Para una curva de distribución simétrica en forma de campana, se puede ser

preciso al explicar la dispersión con respecto a la media.
Regla empírica ( regla normal): Para una distribución de frecuencias simétrica

de campana aproximadamente 68% de las observaciones se encontrará a más y
menos una desviación estándar de la media; aproximadamente 95% de las
observaciones se encontrarán a más y menos dos desviaciones estándares
desde la media; y prácticamente todas las observaciones 99,7% se encontrarán a
más y menos tres desviaciones desde la media.
Curva simétrica de campana, que muestra las relaciones entre

desviación estándar y media.
-3s -2s -1s X 1s 2s 3s
68%
95%
99,7%
33
21/04/2013
Ejemplo:
Se observa que las cuentas de energía eléctrica de una

zona residencial correspondiente al mes de junio tienen una
distribución normal. Si se calcula que la media de estas
cuentas es de $84, con una desviación estándar de $24,
entonces se desprende que aproximadamente 68% de las
cantidades facturadas se encuentran entre $60 y $108.
Asimismo de desprende que aproximadamente 95% de las
cantidades facturadas se hallan entre $36 y $132.
Nota:
El concepto de desviación estándar es muy importante en los negocios y en
la economía. Por ejemplo, en finanzas la desviación estándar se utiliza como
medida
did de
d riesgo
i relacionada
l i d con varias
i oportunidades
t id d de d inversión.
i ió
Mediante el uso de la desviación estándar para medir la variabilidad en las
tasas de rendimiento ofrecidas por diferentes inversiones, el analista
financiero puede medir el nivel de riesgo que tiene cada activo financiero.
Ejercicio: Markus Boggs es gerente de Inversiones S:A. Markus estaba

interesado en las tasas de rendimiento de los últimos cinco años de dos
diferentes fondos mutuos. Fondo mutuo1 mostró, durante un período de
cinco años, tasas de rendimiento del 12, 10, 13, 9 y 11 % mientras que Fondo
mutuo 2 arrojó 13, 12, 14, 10 y 6%. Un cliente se acercó a Boggs y expresó su
interés en uno de estos fondos mutuos ¿ Cual debería escoger Boggs para su
cliente? Ayuda: Una inversión más segura es la que tiene un grado menor de
riesgo (el riesgo se mide por la desv estándar).
34
21/04/2013
Dispersión Relativa
El coeficiente de variación (C.V) es una medida muy útil cuando:
1 L datos
1.-Los d t están tá en unidades
id d diferentes
dif t (como
( dól
dólares y días
dí ded inasistencia).
i i t i )
2.- Los datos están en las mismas unidades, pero las medias muy distantes (
como sucede con los ingresos de los ejecutivos y los ingresos de los empleados
no calificados).
3.- Cuando se desea comparar la variabilidad de dos conjuntos de datos.
Coeficiente de variación: Indica la magnitud relativa de la desviación estándar en

comparación con la media de la distribución, expresada como porcentaje.

Población C .V  . 100

s
Muestra C .V  . 100
X
Ejemplo:
Se va a comparar la variación en los ingresos anuales de ejecutivos con

variación
i ió en los
l ingresos
i d trabajadores
de t b j d no calificados.
lifi d
Para una muestra de ejecutivos,
Para una muestra de trabajadores no  $500000 y s  $50000
X calificados,
Uno se ve tentado a afirmar que hay mayor dispersiónXen  $los
12000 y s  $anuales
ingresos 1200
de los ejecutivos porque $50000>$1200. Sin embargo, las medias están tan
distantes que se necesitan convertir las estadísticas a coeficientes para efectuar
una comparación significativa de la variación en los ingresos anuales.
Para los ejecutivos; CV= 10%

Para los trabajadores no calificados; CV
CV= 10%
No existe diferencia en la dispersión relativa de los dos grupos.
35
21/04/2013
Ejemplo:
Un estudio de las calificaciones obtenidas en un curso interno sobre

principios de administración y los años de servicio de los empleados inscritos
en el curso, dio como resultado estas estadísticas:
la calificación media fue 200; la desviación estándar 20. La media del número
de años de servicio fue 18 años, la desviación estándar de 2,16 años. Compare
la dispersión relativa de las dos distribuciones.
Para las calificaciones: C.V= 10%.

Para los años de servicio: C.V = 12%
6. – Puntuaciones Z ( Medida de localización relativa)
Las puntuaciones “z”z son transformaciones que se pueden hacer

a los valores o puntuaciones obtenidas, con el propósito de
analizar su distancia respecto a la media, en unidades de
desviación estándar.
X X
Z
s
donde X es la puntuación o valor a transformar
X es la media de la distribución
s la desviación estándar de ésta.
Z es la puntuación transformada en unidades de desviación estándar
Una puntuación “Z” nos indica la dirección y grado en que un valor

individual obtenido se aleja de la media, en una escala de unidades de
desviación estándar.
36
21/04/2013
Las puntuaciones Z son el método más comúnmente utilizado

para estandarizar la escala de una variable medida en un nivel
por intervalos.
Ejemplo:
Supongamos que en una distribución de frecuencias obtuvimos una media
de 60 y una desviación estándar de 10, y deseamos comparar a una
puntuación de 50 con el resto de la distribución. Entonces, transformamos
esta puntuación o valor en una puntuación Z. Tenemos que: _
X=50, X=60, s=10
la puntuación Z correspondiente a un valor de 50 es:
Z= (50-60)/10= -1
Podemos decir que el valor 50 está localizado a una desviación estándar

por debajo de la media de la distribución.
( el valor “30” está a tres desviaciones estándar por debajo de la media)
Estandarizar los valores permite comparar puntuaciones de dos

distribuciones diferentes.
Por ejemplo, podemos comparar una distribución obtenida en una preprueba
con otra obtenida en una postprueba (en un contexto experimental).
Supongamos que se trata de un estímulo que incrementa la

productividad.
d ti id d UnU trabajador
t b j d obtuvo
bt en la
l preprueba
b una productividad
d ti id d ded
130 ( la media del grupo fue de 122,5 y la desviación estándar de 10). Y en
la postprueba obtuvo 135
(la media del grupo fue de 140 y la desviación estándar de 9,8).
¿mejoró la productividad del trabajador?
Aparentemente la mejoría no es considerable-
37
21/04/2013
Sin transformar las dos calificaciones en puntuaciones Z no podemos

asegurarlo porque los valores no pertenecen a la misma distribución.
Entonces transformamos ambos valores a puntuaciones Z, los
transformamos a una escala común, donde la comparación es válida.
El valor de 130 en productividad es en términos de unidades de

desviación estándar igual a z= (130-122,5)/10=0,75
y el valor de 135 corresponde a una puntuación
Z =(135-140)/9,8= -0,51
Como podemos observar, en términos absolutos 135 es una mejor

puntuación que 130, pero no en términos relativos ( en relación a
sus respectivas distribuciones).
La variable estandarizada expresa la posición de un elemento en

una distribución dada, tanto en relación a la media como a la
desviación estándar quedando libre de toda ambigüedad.
Ejemplo:
Un alumno obtuvo las siguientes notas:

Historia=5; Francés=4; Matemáticas=4,5; Castellano=6
¿Qué opinión puede dar Ud de estas notas?
Si las compara con la nota 4, que es el promedio de las notas de
1 a 7 y la q
que se exige
g como mínimo para
p aprobar,
p , puede
p
concluir que ese alumno tiene una buena nota en Historia y el
mínimo en Francés.
Pero ¿puede decir si el alumno dentro de su curso es de los
mejores?
38
21/04/2013
Para discernir esto es necesario acudir al promedio y a la
desviación estándar de las notas de esos ramos de todos los
alumnos.
Historia Francés Matemáticas Castellano

Promedio de curso 6,5 4 4,5 5,6
Desviación estándar 1 2 3 2
Var estandarizada Z -1,5 0 0 0,2
Aquí vemos que ha cambiado la faz de las notas,

notas ya que un 5 en Historia
significa que está muy por debajo del resto de sus compañeros, en
cambio el 4 en Francés y el 4,5 en Matemáticas indican que está dentro
del promedio del curso.
La distribución de puntuaciones Z no cambia la forma de la

distribución original, pero si modifica las unidades
originales a unidades de desviación estándar. La
distribución de puntuaciones Z tiene una media 0 y una
desviación estándar 1.
Las puntuaciones Z son un elemento descriptivo

adicional que podemos agregar para analizar nuestros
datos.
39
21/04/2013
Detección de valores atípicos

A veces un conjunto de datos tiene uno o más elementos con
valores demasiado grandes o demasiados pequeños. A los
valores extremos como éstos se les llama valores atípicos.
Un valor atípico puede ser un elemento para el cual se haya
anotado su valor en forma errónea. Si es así, puede corregirse
antes de proseguir el análisis. También, un valor atípico puede
ser uno que por error se incluyó en el conjunto de datos y, en
estos casos, debe eliminarse. Puede ser tan sólo un elemento
poco comúnú que se haya
h anotado
t d en forma
f correcta
t y que síí
pertenece al conjunto de datos.
Los valores estandarizados (valores z) pueden emplearse para

identificar los valores atípicos.
Para identificar valores atípicos se recomienda considerar que
cualquier elemento con un valor z inferior a -3 o superior a 3 sea
tratado como un valor atípico. La exactitud de esos elementos se
podrá revisar después para determinar si pertenecen al conjunto
de datos o no.
OBS: Con los diagramas de caja también se pueden identificar los valores
atípicos, pero no necesariamente los mismos valores que aquellos menores
que 3 o mayores que 3 en los valores z.
z SE puede usar cualquiera de esos
métodos o ambos. Se trata de identificar valores que podrían no pertenecer al
conjunto de datos.
40
21/04/2013
Resumen
Tipo de
variable Estadisticos Gráficos Tabla de frecuencias
Nominal Moda Gráfico de barras Frecuencias absolutas
Diagrama de
sectores Frecuencias relativas
Ordinal Moda Gráfico de barras Frecuencias absolutas
Diagrama de
Mínimo sectores Frecuencias relativas
Diagrama de cajas Frecuencias absolutas
Máximo (box‐plot) acumuladas
Amplitud Frecuencias relativas acumuladas
Mediana
Percentiles
Rango intercuartilico
Medidas de tendencia
Medidas de tendencia
Escala central Histogramas Frecuencias absolutas
Poligonos de
Medidas de dispersión frecuencias Frecuencias relativas
Medidas de forma de la
distribución (Asimetría y Diagrama de cajas Frecuencias absolutas
curtosis) (box‐plot) acumuladas
Medida de localización
relativa Frecuencias relativas acumuladas
* Cuando hay muchos valores no
tiene sentido, se agrupan en
intervalos
Números indices
Un número índice es una cifra relativa (expresada en forma de
porcentaje),
t j ) que representat las
l variaciones
i i medias
di en precio,
i
cantidad o valor, de uno o más ítem en una época dada, respecto
del período base.
Los índices tratan de cuantificar variaciones, y no expresan si los
precios son altos, o si se ha producido mucho. Sólo pretenden
comparar cifras con otras que se consideran como referencia.
Los índices se utilizan entonces, para comparaciones en el

tiempo y en el espacio.
Los índices no miden sino que indican una cierta tendencia.
41
21/04/2013
Indices simples
En muchos casos es preciso expresar las diversas cifras de una serie
anual o mensual en función de una que considera como base.base En este
caso, se trata de índices simples, que representan el porcentaje de
cada cifra de la serie, respecto del valor observado en el período base.
Si se designa por Xo el valor de la observación para el período base y por

Xt el de los restantes períodos, el índice It para el período t queda
expresado por el cuociente de ambas observaciones.
Generalmente se acostumbra expresar los índices en forma porcentual, de

modo que la relación anterior se multiplica por 100.
Xt
I t  100
X0
Energía Eléctrica: Producción total e índice de consumo

eléctrico industrial
Indice de consumo eléctrico
Producción total Base Base Base %
Periodo (Mill de kWh) Prom 1994=100 Prom 1996=100 Prom 1998=100 aumento anual
1994 21.929,10 100,0 97,8 85,5
1995 23.629,80 107,8 105,4 92,1 7,8
1996 22.411,70 102,2 100,0 87,4 -5,2
1997 23.953,50 109,2 106,9 93,4 6,9
1998 25.649,80 117,0 114,4 100,0 7,1
Fuente: Boletín Mensual del Banco Central de Chile (Nov 1999
Para calcular el porcentaje de aumento A entre dos cantidades Xo y Xt

conviene recordar la siguiente relación
X 
A  100 t  1
 X0 
42
21/04/2013
Utilización de los índices

Las actividades económicas precisan de algunos indicadores
que permitan cuantificar en forma sintética el desarrollo de los
acontecimientos. Los organismos estatales o privados han
confeccionado números índices para diferentes fenómenos
económicos. El uso de esos indicadores es variado y depende
en cada oportunidad de su contenido específico.
Las ventas comerciales, los salarios pagados, el ingreso
nacional, los presupuestos fiscales, etc, han sufrido variaciones
por diferentes causas, una de las cuales es el constante
aumento de los precios. Por lo tanto, es necesario eliminar dicho
efecto para obtener series depuradas, que se refieran a valores
reales.
Se precisa entonces, deflactar las series expresadas en

valores monetarios de cada periodo
periodo, con el objeto de
que representen valores monetarios de igual poder
adquisitivo.
Para la deflactación debería utilizarse el índice más
apropiado, el que no siempre existe. Por lo general, se
emplean índices de precios al por mayor o al
consumidor, que pese a no ser siempre estrictamente
aplicables, permiten eliminar en forma relativamente
aceptable, la deformación introducida en la serie por las
variaciones de los precios.
43
21/04/2013
Cálculo del IPC

Los economistas definen inflación como un aumento generalizado
y sostenido en el tiempo del nivel general de precios en la
economía. Es decir, en palabras más simples, hay inflación
cuando existe una tendencia general de los precios a subir.
El Índice de Precios al Consumidor o IPC es el indicador mensual
que mide la inflación en Chile. El IPC del país está compuesto de
una canasta de bienes y servicios y cada uno de ellos tiene una
ponderación distinta de acuerdo con la importancia de éstos en el
presupuestot familiar
f ili ded los
l chilenos.
hil
El IPC es el Índice de Precios al Consumidor e intenta reflejar la

variación de la inflación en un determinado período. El cuadro
señala que el índice de IPC para enero de 1999 era de 99,67
99 67
puntos, partiendo de un índice de 100 en Dic de 1998, lo que
comúnmente se denomina “base 100”.
¿Cuánto ha variado la inflación entre Dic de 1998 y Octubre del

2000. Para calcularlo, ocupamos la siguiente fórmula:
Variación IPC Dic 1998 a Oct 2000 = ((Índice IPC Oct 2000/Índice
IPC Dic 1998) –1) X 100 = 6,46%,
La variación es igual a 6,46%, que equivale a la inflación
acumulada en ese período.
44
21/04/2013
¿Cuánto ha variado la inflación entre Abril del 2000 y Julio

del 2000? Para calcularlo, ocupamos la siguiente fórmula:
Variación IPC Abr 2000 a Julio 2000 = ((Índice IPC Julio

2000/Índice IPC Abr 2000) –1) X 100
=(104,91/104,31 -1)x100=0,5752%
Observe que la inflación acumulada de Mayo, Junio y Julio

no es la suma de las variaciones mensuales (es decir
0 2109+0 2295+0 1336=0 574) sino que algo mayor 0
0,2109+0,2295+0,1336=0,574), 0,5752
5752 %
%.
Por otra parte, también se puede determinar el índice conociendo la

inflación del p
período. Considere la inflación en Enero de 1999,
equivalente a –0,33% y en Feb de 1999 equivalente a 0,07%. Si la
base 100 se define en Dic 1998.
¿ Cuál es el índice de IPC acumulado en Enero y Febrero?
Debemos multiplicar
Base 100x (1+IPC Enero)=100x(1+-0,0033)=99,67=Indice IPC Enero
1999.
Base 100x (1+IPC Enero)x(1+IPC Feb)=

100x(1+-0,0033)x(1+0,0007)=99,74= Indice Feb 1999
45
21/04/2013
Ejercicio:
a) Considere la siguiente serie de valores que representan

ingresos en pesos corrientes ( pesos de dic de cada año).
Dado el índice IPC (base dic 1998=100) calcule el deflactor
IPC base dic1999=100 y luego estime la serie de ingresos en
base dic 1999=100.
b) Resuelva el ejercicio anterior usando alguna forma
equivalente.
Año Ingresos corrientes IPC

( $ dic de cada año) ( dic 1998=100)
1989 116664 37 5093
37,5093
1990 131678 47,7601
1991 258790 56,6713
1992 185600 63,8659
1993 245679 71,6789
1994 456876 78,0909
1995 345721 84,4933
1996 245696 ,
90,0969
1997 234567 95,5428
1998 236458 100
1999 345672 102,31
46
21/04/2013
Notar que el deflactor del IPC base 1999 es igual.
IPCdic añot - IPCdic año1999

Deflactor IPC base dic 99  1 
IPC dic año1999
Lo que equivale a:
IPCdic añot
Deflactor IPC base dic 99 
IPC dic año1999
A B C A/C
Año Ingresos corrientes IPC Deflactor IPC Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100) (base dic 99) ( base dic1999=100)
1989 116664 37 5093
37,5093 0 367
0,367 318212
1990 131678 47,7601 0,467 282076
1991 258790 56,6713 0,554 467200
1992 185600 63,8659 0,624 297322
1993 245679 71,6789 0,701 350667
1994 456876 78,0909 0,763 598571
1995 345721 84,4933 0,826 418622
1996 245696 90,0969 0,881 279001
1997 234567 95,5428 0,934 251181
1998 236458 100 0 977
0,977 241920
1999 345672 102,31 1,000 345672
Valores nominales
VALORES REALES 
Deflactor
47
21/04/2013
b) Formas equivalentes de estimar los ingresos reales en

base dic 1999 son las siguientes:
A B C (A/B)*102,31
Año Ingresos corrientes IPC A/B Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100) ( base dic1999=100)
1989 116664 37,5093 3110,269 318212
1990 131678 47,7601 2757,071 282076
1991 258790 56,6713 4566,509 467200
1992 185600 63,8659 2906,089 297322
1993 245679 71,6789 3427,494 350667
1994 456876 78 0909
78,0909 5850 566
5850,566 598571
1995 345721 84,4933 4091,697 418622
1996 245696 90,0969 2727,019 279001
1997 234567 95,5428 2455,099 251181
1998 236458 100 2364,580 241920
1999 345672 102,31 3378,673 345672
A B C (A/C)*100
Año Ingresos corrientes IPC IPC Ingreso en $ constantes
( $ dic de cada año) ( dic 1998=100)
1998 100) ( dic 1999=100)
1999 100) ( base dic1999=100)
dic1999 100)
1989 116664 37,5093 36,662 318212
1990 131678 47,7601 46,682 282076
1991 258790 56,6713 55,392 467200
1992 185600 63,8659 62,424 297322
1993 245679 71,6789 70,061 350667
1994 456876 78,0909 76,328 598571
1995 345721 84,4933 82,586 418622
1996 245696 90,0969 88,063 279001
1997 234567 ,
95,5428 93,386
, 251181
1998 236458 100 97,742 241920
1999 345672 102,31 100,000 345672
48
21/04/2013
Aplicación. La Unidad de Fomento (UF)
La Unidad de Fomento (UF) es una medida reajustable basada

en la variación del Indice de Precios al Consumidor (IPC).
El Ministerio de Hacienda en su Decreto Supremo

Nº 40 del 2 de enero de 1967, creó la Unidad de Fomento.
El valor de la UF se reajustaba el primer día de cada trimestre según la
variación del IPC del trimestre anterior.
El Decreto Supremo
p Nº 280 del 12 de Mayo
y de 1975 estableció q
que la UF p
pasaría
a reajustarse en forma mensual.
El Decreto Supremo Nº 613 del 14 de julio de 1977 estableció que su

j
valor se reajustaría en forma diaria a partir
p del 1º de Agosto
g de dicho
año.
Mediante el acuerdo del 08-Ene-1990 y según las normas del Banco

Central la UF continúa reajustándose en forma diaria, siendo calculada a
principios de cada mes para el período comprendido entre el día 10 de
dicho mes y el día 9 del mes siguiente, de acuerdo a la tasa promedio
geométrica de la variación del IPC del mes anterior.
49
21/04/2013
Cálculo de la UF
El valor de la UF para cada día se determinará sobre la base del valor

del día anterior, según la siguiente fórmula:
UFdía = UFdía-1 x Rd
Donde:
Rd = Factor de reajuste diario del valor de la Unidad de
Fomento.
d = NNº de días comprendidos en el período para el cual se
calcula el valor diario de la UF.
vIPC-1 = Variación porcentual del IPC registrada en el mes
inmediatamente anterior.
Factor de reajuste diario del valor de la Unidad de Fomento.
1
 vIPC1  d
Rd  1  
 100 
Ejercicio:
Estime el valor de la UF diaria del mes de Marzo del 2008.
50
21/04/2013
Introducción a Inferencia Estadística

Introducción:
Hemos visto que la estadística descriptiva es el proceso de
recolectar,
l t agrupar y presentart datos
d t de
d una manera talt l que
describa fácil y rápidamente dichos datos.
La estadística inferencial involucra la utilización de una

muestra para sacar alguna inferencia o conclusión sobre la
población de la cual hace parte la muestra.
Inferencia estadística es el proceso de reunir datos

obtenidos de una muestra para hacer estimaciones o
probar hipótesis acerca de las características de una
población.

Procedimiento de la estadística inferencial
INFERENCIA
RECOLECCION DE LOS
DE LOS DATOS CALCULO POBLACION
PARAMETROS
EN LA DE
MEDIANTE
MUESTRA ESTADIGRAFOS
TECNICAS
ESTADISTICAS
APROPIADAS
51
21/04/2013

Ejemplo:
Supóngase
p g que
q tenemos datos de los ingresos
g de 1000
familias chilenas. Este grupo de datos puede ser resumido
encontrando el promedio de ingreso por familia y la
dispersión de estos ingresos familiares sobre y bajo el
promedio. Estos datos también pueden ser descritos
construyendo una tabla, un diagrama o gráfico del número
de familias en cada clase de ingresos. Esta es estadística
descriptiva.
Si estas 1000 familias son representativas
representati as de todas las
familias chilenas, podemos entonces estimar y probar
hipótesis sobre el promedio de ingreso familiar en Chile
como un todo. Puesto que estas conclusiones están
sujetas a errores, tendríamos también que indicar la
probabilidad de error. Esto es inferencia estadística.
1.Probabilidad
Debido a que existe una incertidumbre considerable al tomar

decisiones, resulta importante que todos los riesgos
implícitos
p conocidos se evalúen en forma científica.
Ayuda en esta evaluación la teoría probabilística, a la que a menudo se

denomina “ciencia de la incertidumbre”. El empleo de la probabilidad
permite a quien toma decisiones, analizar los riesgos y minimizar el azar
inherente con información limitada
inherente, limitada, por ejemplo
ejemplo, al lanzar un nuevo
producto o aceptar un embarque recién llegado que contenga partes
defectuosas.
52
21/04/2013
Probabilidad
1. -¿Qué es una probabilidad?

Probabilidad: Una medida de la posibilidad de que ocurra
un evento ( o suceso) en el futuro; sólo puede asumir un
valor entre 0 y 1, inclusive.
Experimento: Observación de alguna actividad o la acción de
efectuar una medición.
Resultado: Un acontecimiento final de un experimento.
Evento: Conjunto de uno o más resultados de un experimento.
Probabilidad
Ejemplo:
Experimento:
E i t Tirar
Ti un dado.
d d
Resultados posibles: Caer un 1
Caer un 2
Caer un 3
Caer un 4
Caer un 5
Caer un 6
Eventos p
posibles: Caer un número par
p
Caer un número mayor que 4
Caer un número 3 o menor
53
21/04/2013
Probabilidad
Enfoques de la probabilidad
Enfoque objetivo Enfoque subjetivo
1)Probabilidad clásica o a priori

La posibilidad de que suceda un
evento, asignado por una persona con
2) Concepto de frecuencia relativa
base en cualquier información de que
(probabilidad a posteriori).
disponga.
Probabilidad
Probabilidad clásica
El enfoque clásico o a priori de la probabilidad se basa en la

consideración de que los resultados de un experimento son
igualmente posibles.
Númerode resultadosfavorables
Probabilidad de un evento 
Númerototal de resultadosposibles
Ej
Ejemplo:
l
Una empresa tiene bodegas en cuatro regiones; la II, la

IV, la V y la RM ¿ Cuál es la probabilidad de que la
bodega seleccionada se encuentre en la II Región.
54
21/04/2013
Probabilidad
Concepto de frecuencia relativa

La p
probabilidad de que
q un evento ocurra a largo
g plazo
p se determina
observando en qué fracción de tiempo sucedieron eventos en el pasado
Número de veces que el evento ocurrió en el pasado

Probabilidad de un evento 
Número total de observaciones
Ejemplo: Antes de incluir la cobertura de ciertos tipos de problemas dentales

en sus pólizas de seguro médico para adultos asalariados, una compañía de
seguros desea determinar la probabilidad de ocurrencia de esos problemas,
para poder fijar el precio del seguro. Por lo tanto, un experto en estadística
recolecta datos de 10000 adultos de las categorías de edad adecuadas y
encuentra que 100 personas experimentaron el problema dental particular
durante el año anterior. Así la probabilidad de ocurrencia es 0,01 o 1%
Probabilidad
¿Qué es una variable aleatoria?

Cantidad que es resultado de un experimento aleatorio que,
debido al azar, puede tomar distintos valores.
Variable aleatoria
discreta continua
•Número de empleados ausentes •Ciclo de vida de un componente eléctrico

los Lunes •Duración de pilas alcalinas
•Número de lámparas defectuosas
producidas durante la semana.
55
21/04/2013
Distribuciones de probabilidad
2.- Distribuciones de probabilidad discretas y continuas
Cuando a todos los posibles valores numéricos de una variable aleatoria X se le

asignan valores de probabilidad, mediante un listado o una función matemática,
el resultado es una distribución de probabilidad.
La suma de las probabilidades de todos los resultados numéricos posibles debe
ser igual a 1.
Distribuciones de probabilidad discreta
Distribución de probabilidad discreta; En una variable aleatoria discreta ,

todos los posibles valores numéricos de la variable pueden enlistarse en
una tabla junto con sus respectivas probabilidades.
Distribuciones de probabilidad discreta
Sea X una v.a discreta que toma valores x1,x2,…xn.

Entonces, la función:
f ( x)  P ( X  xi ) para i  1,2,...., n
0 para x  xi
Se denomina la función de densidad de probabilidad discreta (FDP) de

X, donde P(X=xi) significa la probabilidad de que la v.a discreta X tome
el valor de xi.
56
21/04/2013
2. Distribuciones de probabilidad
Ejemplo:
El número de camionetas solicitadas en arriendo a una agencia de

automóviles durante un p
periodo de 50 días se identifica en la tabla.
Demanda diaria dearriendo de camionetas

durante un periodo de 50 días
Demanda posible (X) Número de díaProbabilidad P(X)

3 3 0,06
4 7 0,14
5 12 0,24
6 14 0,28
7 10 0,2
8 4 0,08
,
50 1
Nota:Existen varias distribuciones de probabilidad estándar que pueden servir de

modelo para una amplia variedad de variables aleatorias discretas involucradas en
administración y economía; distribución de probabilidad binomial, y de Poisson.
Distribución de Poisson
Id d por ell matemático

Ideada t áti francés
f é Simeon
Si Poisson
P i (1837),
(1837) la
l
distribución de Poisson mide la probabilidad de un evento aleatorio
sobre algún intervalo de tiempo o espacio.
 xe
P( x) 
x!
Donde
x es el número de veces que ocurre el evento
: Es el número promedio de eventos por unidad de tiempo
e= 2,71828 la base del logaritmo natural.
57
21/04/2013
Distribución de Poisson
Otra forma de definir la distribución de Poisson.

Poisson
El proceso de Poisson consta de eventos independientes

que ocurren aleatoriamente en el tiempo, en los cuales 
es el número promedio de eventos por unidad de tiempo.
La probabilidad de que ocurran exactamente x eventos
durante un intervalo de tiempo T, es:
e λ T ( λ T ) x
P( x) 
x!
Ejemplo:
Supongamos que se está interesado en la probabilidad de

que exactamente 5 clientes lleguen durante la siguiente hora
(o en cualquier hora dada) laboral. La observación simple de
las últimas 80 horas ha demostrado que 800 clientes han
entrado al negocio. Por tanto,  = 10 por hora. Utilizando la
fórmula anterior.
P (5) 
105  2.7182810  0.0378
5!
Por lo tanto, la probabilidad de que exactamente 5 clientes

lleguen durante la siguiente hora es 0,0378.
116
58
21/04/2013
La distribución tiene muchas aplicaciones. Se utiliza

como modelo
d l para describir
d ibi fenómenos
f ó como lal
distribución de errores en captura de datos, el número de
rasaduras y otras imperfecciones en piezas recientemente
pintadas, el número de partes defectuosas en embarques
de salida, el número de clientes en espera de servicio en
un restaurante, o en espera de entrar a una de las
atracciones en una feria, y el número de accidentes en
una carretera durante un periodo de tres meses.
Ejemplo:
Supóngase que las llamadas telefónicas se realizan

aleatoria e independientemente en el tiempo con una
frecuencia promedio de  llamadas por segundo.
a) Hallar la probabilidad de que se haga exactamente una llamada en un
intervalo de 3/  segundos.
La probabilidad de una llamada en T segundos

Es:
P (1)  e  λ T ( λ T )
Cuando T=3/  P (1)  3e 3
b) Determinar la probabilidad de que ocurran menos de tres

llamadas en un intervalo de 1/  segundos.
P ( x  3)  P (0)  P (1)  P ( 2)  5 / 2e
59
21/04/2013
Ejemplos:
P(0)
P ( 0)  e  λ T P(1) P(1)  e  λ T ( λ T )
1
T
1/ 2/
1/ 2/ T
Distribución de Poisson p
para
la probabilidad de cero Distribución
Di t ib ió ded Poisson
P i de
d
eventos en T segundos. una llamada telefónica
realizada una vez en T
segundos.
La Distribución Binomial
Cada ensayo en una distribución binomial termina en sólo uno

de dos resultados mutuamente excluyentes, uno de los cuales
se identifica como un éxito y el otro como un fracaso. La
probabilidad de cada resultado permanece constante de un
ensayo al siguiente.
Podrían citarse muchos ejemplos relacionados con los negocios. Los
sindicatos laborales con frecuencia desean saber cuántos trabajadores: (1)
están interesados en unirse al sindicato; (2) quienes no están interesados.
Los banqueros
q pueden
p hacer encuestas a los expertos
p en economía sobre
si las tasas de interés: (1) aumentarán o (2) no aumentarán.
60
21/04/2013
Propiedades de un experimento binomial
El experimento consiste en una serie de n ensayos idénticos

En cada ensayo hay dos resultados posibles. A uno de estos resultados se
le llama éxito y al otro se le llama fracaso.
La probabilidad de éxito, que se denota p, no cambia de un ensayo a otro.
La probabilidad de fracaso se denota 1-p
Los ensayos son independientes.
Si se conoce la probabilidad de que un ensayo determinado producirá un éxito,

es pos
posible
b e estimar
est a cuá
cuántos
tos é
éxitos
tos habrá
ab á en
e un
u número
ú e o dado de ensayos.
e sayos Por o
ejemplo, si se conoce la probabilidad de que un solo trabajador esté interesado
en unirse al sindicato, entonces puede estimarse la probabilidad de que un
número determinado de trabajadores de la fuerza laboral estaría interesado en
unirse.
La probabilidad que de n número de trabajadores, un número x dado, esté
interesado en unirse al sindicato es:
n!
Px   p x 1  p 
n x
 n C x  p  1  p 
x n x
x ! n  x !
Ejemplo:
Consideremos la siguiente situación: un gerente de crédito de American Express

ha descubierto que p = 10% de los usuarios de tarjeta no paga el monto
completo de la deuda durante un mes dado. Desea determinar la probabilidad
que de n = 20 cuentas seleccionadas de manera aleatoria, x = 5 de las
cuentas no sean pagadas. Esto puede expresarse como:
P X  5 n  20, p  0.10
lo cual se lee como “la probabilidad de cinco éxitos dado que hay 20 ensayos y
la probabilidad de un éxito de cualquier ensayo es del 10%”.
61
21/04/2013
Valor esperado y varianza en la distribución binomial
Cuando la variable aleatoria tiene una distribución binomial para la que se

conoce ell número
ú de
d ensayos n y lal probabilidad
b bilid d de
d éxito
é it p, entonces
t la
l
fórmula para el valor esperado y la varianza se simplifican de la siguiente
forma.
E ( x)    np
Var ( x)   2  np (1  p )
Distribución de probabilidad continua
En una variable aleatoria continua , no pueden enlistarse

todos los posibles valores fraccionarios de la variable,
motivo por el cual las probabilidades que se determinan
por medio de una función matemática son gráficamente
representadas por una función de densidad de
probabilidad o curva de probabilidad. El área entre dos
puntos cualquiera bajo la curva indica la probabilidad de
ocurrencia aleatoria de un valor entre esos dos puntos.
62
21/04/2013
Función de densidad de probabilidad

Sea X una variable aleatoria continua en un espacio muestral S.S
Entonces, se dice que f(x) es la FDP de X si se satisfacen las siguientes
condiciones:
( 1 ) f(x)  0 , para toda x en S

representa el área bajo la
(2)  S
f ( x)dx  1 curva y=p(x) en el plano
xy entre dos puntos
arbitrarios.
(3) Para cualquier x1  x 2 en S,
x2

x1
p(x)dx  P(x1  x  x2 )
Ejemplo:
Considérese la siguiente función de densidad.
1 2
f ( x)  x 0x3
9
Puede verificarse que f(x)0 para toda x en el intervalo 0
a 3 y que:
3 1 2
0 9
x dx  1
Si se desea evaluar la FDP anterior entre 0 y 1, se obtiene:
1 2
1 1
0 9 x dx 
27
63
21/04/2013
Ejemplo:
Distribución de probabilidad continua.
El ciclo de vida de un
f(x) componente eléctrico sigue
una distribución de
probabilidad continua.
1400 1800 2000 2200 2400 2600 X horas

La probabilidad de que un componente aleatoriamente seleccionado
dure entre 2000 y 2400 horas es igual a la proporción del área total bajo
la curva incluida en el área achurada. Esto es , el área total bajo la
función de densidad de probabilidad se define como igual a 1, y la
proporción de esta área incluida entre los dos puntos establecidos
puede determinarse aplicando el método de integración.
Características de las distribuciones de probabilidad
U di
Una distribución
t ib ió ded probabilidad
b bilid d a menudo
d puede
d
resumirse en términos de algunas de sus características,
conocidas como los momentos de la distribución. Dos
de los momentos más ampliamente utilizados son la
media, o valor esperado y la varianza.
64
21/04/2013
Valor esperado de una variable aleatoria discreta

La media o valor esperado; es el valor promedio a largo plazo de la
variable
i bl aleatoria.
l t i La L media
di se denomina
d i también
t bié valor
l esperado,
d o
expectativa, E(X) , de la variable X. Es un promedio ponderado en el que
las ponderaciones son las probabilidades correspondientes de los valores
posibles.
La media de una distribución de probabilidad se calcula por:
E ( X )   xff ( x)
x
donde x significa la suma sobre todos los valores de X y

donde f(x) es la FDP (discreta) de X.
Ejemplo:
Considérese la distribución de probabilidad de la suma de dos números

en el lanzamiento de dos dados
dados.
x 2 3 4 5 6 7 8 9 10 11 12
f(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
1 2 3 1
E( X )  2  3  4  ...  12  7
36 36 36 36
El valor promedio de la suma de los números observada en un

lanzamiento de dos dados es 7.
65
21/04/2013
Valor esperado de una variable aleatoria continua

El valor esperado de una variable aleatoria continua
está definido como:

E( X )   xf ( x)dx

Ejemplo:
Para determinar el valor esperado de la FDP continua dada en el ejemplo

anterior se tiene:
3
1  x4 
3
x2 9
E ( X )   x dx      2.25
0
9 9  4 0 4
Propiedades del valor esperado

Sean a y b constantes y X variable aleatoria.
1. E(b)= b
2. E(aX+b)= aE(X)+b
Si X1, X2,…,Xn son n variables aleatorias

y a1, a2,… aN y b son constantes, entonces:
E ( a1 X 1  a2 X 2  ...  an X n )  a1 E ( X 1 )  a2 E ( X 2 )  ...  an E ( X n )
Si X, Y son variables aleatorias independientes, entonces:
3. E(XY) = E(X)E(Y)
66
21/04/2013
Varianza y desviación estándar

Las fórmulas p
para la varianza de una distribución probabilística
p son:

 2  V ( X )   ( X   ) 2 P( X ) 
V ( X )  E ( X 2 )  E ( X ) 2
La desviación estándar de una distribución de probabilidades
di
discreta
t se determina
d t i tomando
t d la
l raíz
í cuadrada
d d ded la
l varianza.
i
   ( X   ) 2 P( X )
Propiedades de la varianza
Sean a y b constantes y X variable aleatoria:
1. var (X)  σ X2  E(X  μ)2  E(X 2 )  μ 2

2. var (b)  0
3. var (aX  b)  a 2 var (X)
Si X, Y son variables aleatorias independientes, y
a y b constantes, entonces:
4. var (X  Y)  var (X)  var (Y)

var (X  Y)  var (X)  var (Y)
5. var (aX  bY)  a 2 var (X)  b 2 var (Y )
67
21/04/2013
Ejemplo
Cálculo del valor esperado de la demanda de camionetas

Demanda posible Probabilidad Valor ponderado Demanda al cuadrado Cuadrado ponderado
X P(X) XP(X) X2 X 2 P(X )
3 0,06 0,18 9 0,54
4 0,14 0,56 16 2,24
5 0,24 1,20 25 6,00
6 0,28 1,68 36 10,08
7 0,2 1,40 49 9,80
8 0,08 0,64 64 5,12
1 E(X)=5,66 E ( X 2 )  33, 78
EL valor esperado de la variable discreta es 5,66 camionetas. Notese que

puede ser un valor fraccionario, porque representa el valor promedio a largo
plazo, no el valor específico de una observación dada.
La varianza de la demanda de camionetas en arriendo es 1,74 y la

desviación estándar es 1,32
V(X)=33,78-32,04=1,74.
Propiedades de la varianza y covarianza
Sean X , Y dos v a con medias x , Y respectivamente,

v.a respectivamente entonces:
cov ar(X,Y)  E X  μ X Y  μY   E(XY)  μ X μY

cov( X , Y ) cov( X , Y )
 
 X Y
Coeficiente
(var( X ) var(Y ) de correlación
Varianzas de variables correlacionadas

Si X, Y son variables aleatorias
var (X  Y)  var (X)  var(Y )  2 cov( X , Y )

var (X  Y)  var (X)  var (Y)  2 cov( X , Y )
68
21/04/2013
Distribución normal de probabilidad

La distribución normal de probabilidad es una distribución de probabilidad
continua tanto simétrica como mesocúrtica.
mesocúrtica
f(x f (X ) 
1 
e (X )
2 / 2 2 
2 2
) E( X )  
V (X )   2
x
La distribución normal de probabilidad es importante para la inferencia estadística
por tres razones:
1.- Se sabe que las medidas obtenidas en muchos procesos aleatorios siguen esta
distribución.
2.- Las distribuciones normales sirven para aproximar otras distribuciones como la
binomial y de Poisson.
3.- La distribución de la media muestral es normal cuando el tamaño de la muestra es
grande.
Distribución normal estándar

Hablando en sentido general, no existe sólo una distribución probabilística
normal.
l En
E vez de
d esto, hay
h una familia
f ili dde tales
l curvas. Cada
C d distribución
di ib ió
tiene media µ y desviación estándar  diferentes. Por tanto, el número
de distribuciones normales es ilimitado.
Resultaría físicamente imposible proporcionar una tabla de probabilidades
para cada combinación de µ y  .
Puede utilizarse la distribución normal estándar.

µ=0 y =1 .
µ
Primero se convierte la distribución, o lo que se conoce como

estandarización, a una distribución normal estándar utilizando el
llamado valor z, también denominado puntuación z, estadístico z, o
desvío normal z.
69
21/04/2013
Valor z ( o desvío normal z): Diferencia (desviación) entre un valor

seleccionado, denotado por X y la media poblacional, , dividida entre la
desviación estándar de la población, .
X 
z

Donde:
X es el valor de cualquier observación específica
 es la media de la distribución
 es la desviación estándar de la distribución
El valor z mide la distancia entre el valor específico X y la media, en

unidades de desviación estándar.
Conociendo el valor z determinado por la fórmula, se puede obtener el área
( o probabilidad) bajo la curva normal, recurriendo a una tabla.
Ejemplo:
Supóngase que se obtuvo por cálculo z igual a 1.91.¿Cuál es el área bajo la

curva normal entre la media y X?
Descienda por el margen izquierdo de la tabla (área bajo la curva normal)
encabezado por la letra z hasta 1.9. Luego se pasa horizontalmente a la
derecha y se lee el área (probabilidad) bajo el encabezado de la columna
0,01. Resulta 0,4719. Esta es el área bajo la curva normal entre la media y X.
Ejemplo;
¿Cuál es el área bajo la curva normal entre la media y X para los siguientes
valores de z?
Valor calculado de z Área bajo la curva

2,84 0,4977
1,00 0,3413
0,49 0,1879
70
21/04/2013
Ejemplo:
Se sabe que el ciclo de vida de un componente eléctrico sigue una distribución

normal con una media µ=2000 horas y una desviación estándar =200 horas.
La probabilidad de que un componente aleatoriamente seleccionado dure entre
2000 y 2400 horas se determina de la siguiente manera.
f(x)
1400 1800 2000 2200 2400 2600 X horas

-2 -1 0 1 2 3 z
El límite inferior del intervalo se encuentra en la media de la distribución, y

coincide por lo tanto con el valor z=0. El límite superior del intervalo
establecido en términos de un valor z es:
X  2400  2000
z  2
 200
El valor z=2 indica que 2400 hr se halla por encima de la media de 2000 hr en
dos desviaciones estándar:
P(0z2)=0,4772 P(2000X2400)=0,4772
71
21/04/2013
Supongamos que nos interesa la probabilidad de que un componente

aleatoriamente seleccionado dure más de 2200 horas.
Adviertase que, por definición, la proporción total del área a la derecha
d la
de l media
di de
d 2000 es d de 0
0,5.
5 PPor consiguiente,
i i t sii d determinamos
t i la
l
proporción entre la media y 2200, podemos restar este valor de 0,5 para
obtener la probabilidad de las horas X superiores a 2200.
2200 - 2000
z 1
200
Así 2200 hr se halla a una desviación estándar por encima de la media de

2000 hr
P(0z 1)=0,3413
P(z>1)=0,5 - 0,3413=0,1587
Por lo tanto P(X>2200)=0,1587
OBS:Función de distribución acumulativa
La probabilidad P*(x) de que una variable aleatoria x, cuya función de

densidad de probabilidad es p(x) , tome un valor menor que o igual a x0
está dada por:
x0
P * (x 0 )   p ( x)dx

Observe que:
P(  x  b)  P * (b)  P * (a )
P(a
Y por el teorema fundamental del cálculo integral.
dP * ( x)
 p( x)
dx
72
21/04/2013
Distribución uniforme
Una función de distribución de probabilidad p(x) se distribuye
uniformemente sobre un intervalo desde a hasta b si p(x) es constante en
todo el intervalo.
La distribución uniforme con parámetros a y b está definida por la función

de densidad:
1/b para a x a+b

p(x)
0 en otro lugar
p(x)=
1/b
Observar que todos los valores x

de x de a hasta a+b son a a+b
igualmente probables.
Distribución exponencial
La variable aleatoria continua con distribución exponencial se define
como:
 e   x
si x  0
f ( x)  
2 0 si x  0
=2
1
=1
73
21/04/2013
En la distribución exponencial la media o valor esperado

está dado por: 1


1
Y la varianza está dada por: 2 
2
y la desviación estándar es igual a:  
L probabilidad
La b bilid d d
de obtener
bt un valor
l ded la
l variable
i bl aleatoria
l t i exponencial
i l
igual o menor que determinado valor específico x0.
x0
F ( x0 )  P ( x  x0 )   e x dx  1  e  x0
0
Por consiguiente, la probabilidad de que una variable aleatoria con

distribución exponencial asuma un valor mayor o igual a x0 se da por:
2 1  F ( x0 )  e - x 0
1,5
0,5 F(0,5)
( , )
1- F(0,5)
0,5
La distribución exponencial rige los tiempos de espera entre acontecimientos

consecutivos de Poisson.
74
21/04/2013
El parámetro  se toma como el número ( o fracción ) de acontecimientos de
Poisson que ocurren por unidad de tiempo.
( la unidad de tiempo elegida para la exponencial).
Ejemplo:
Una secretaria recibe en promedio 6 llamadas telefónicas por

hora durante una jornada de trabajo ordinaria. Exprese el número
de llamadas por hora como sucesos de Poisson y exprese,
además, el tiempo transcurrido entre 2 llamadas consecutivas que
recibe
(Solución:
medidoen horas) como una distribución exponencial.
=número de llamadas que entran por unidad de tiempo (hora), luego
=6 llamadas por hora. La distribución del flujo de llamadas por horas es
Poisson. Entonces la distribución del tiempo de espera entre dos llamadas
consecutivas es:
f (t )  6e 6t
Propiedades de la distribución exponencial

1. Ausencia de memoria:
1.-
En un proceso de llegada, esta propiedad implica que la probabilidad de que
ocurra una llegada en los minutos siguientes no está influenciada por el
momento en que haya ocurrido la llegada anterior; es decir, el sistema. no
memoriza lo que acaba de suceder. Esta situación surge cuando
1) hay muchos individuos que potencialmente pueden llegar al sistema
2) cada persona decide llegar independiente de los demás
3) cada individuo elige el momento de llegar al azar.
75
21/04/2013
2.- Lapsos de servicio breves
Con una distribución exponencial, son comunes los valores pequeños en el
lapso
p de servicio. En la figura
g se observa la gráfica
g de la probabilidad
p de que
q el
tiempo de servicio S sea igual o menor que t Prob(St) si el tiempo promedio de
servicio es 10, o sea =0,10 y
1/ =10.
Alta probabilidad de lapsos de servicio cortos.
1
0,632
10
Observe que la gráfica asciende con rapidez y luego, lentamente, se acerca al

valor 1. Esto indica una alta probabilidad de que el servicio dure poco tiempo.
P ejemplo,
Por j l cuandod t=10,
t 10 la
l probabilidad
b bilid d de
d que sea St es ded 0,632.
0 632 EEs d
decir,
i
más del 63% de los tiempos de servicio serán menores que el promedio de
servicio.
La implicación práctica de esta circunstancia es que una distribución
exponencial es la mejor para representar distribución de la duración de servicio
en un sistema en el que una gran proporción de tareas duran un lapso muy breve
y sólo una pequeña proporción duran largo tiempo.
76
21/04/2013
3.- Relación con la distribución de Poisson
Si el tiempo
p entre llegadas
g tiene una distribución exponencial
p con parámetro
p ,,
entonces, en un periodo específico de tiempo (digamos T), el número de
llegadas tendrá una distribución de Poisson con parámetros T. Entonces, si X
es el número de llegadas durante el tiempo T, la probabilidad de que X sea igual
a un número dado (digamos n) se obtiene mediante la ecuación.
eλ T (λ T )n
Pr ob( X  n) 
n!
Las dos distribuciones de probabilidad, la distribución discreta de Poisson y la

distribución continua exponencial, son distribuciones complementarias. Se
utilizan en la teoría de colas para representar llegadas o servicios aleatorios.
Ambas se conocen como distribuciones de Markov.
3. Tipos de muestra
Los parámetros de una población frecuentemente se estiman sobre
la base de estadísticas muestrales. Para emplear una estadística
muestral como estimador de un parámetro, la muestra debe ser una
muestra
t aleatoria
l t i ded una población
bl ió
Muestra probabilística
Tipos de muestra
Muestra no probabilística
154
77
21/04/2013
Tipos de muestra
Muestra probabilística: Muestra que se

selecciona de modo que cada integrante de la
población en estudio tenga una probabilidad
conocida ( no igual a cero) de ser incluido en la
muestra
Muestra no probabilística: Métodos en los que

no todos los integrantes tienen probabilidad de
ser incluidos en la muestra
155
Tipos de muestra
•Muestreo aleatorio simple; los elementos de la población tienen la misma

probabilidad de ser seleccionados p
p para la muestra.
•Muestreo aleatorio sistemático; se selecciona un punto aleatorio de inicio y

después se selecciona para la muestra cada k-ésimo elemento.
•Muestreo aleatorio estratificado; la población se divide en varios grupos, o

estratos, y después se selecciona una muestra de cada uno.
.
•Muestreo por conglomerados; la población se divide en unidades primarias y
después se toman muestras de las citadas unidades.
Error de muestreo: Diferencia entre una estadística de muestra y su

parámetro de población correspondiente
156
78
21/04/2013
4. Distribución muestral de medias

La distribución muestral de medias es una distribución probabilistica que consta
de una lista de todas las medias muestrales posibles de un tamaño de muestra
dado de una población y la probabilidad de ocurrencia asociada con cada media
muestral
t l
Ejemplo: Una empresa industrial tiene siete trabajadores de producción

(considerados como la población). El salario de cada empleado se presenta
en la tabla
Trabajador Salario
Javier 7
Saúl 7
Susana 8
Berta 8
Juan 7
Aura 8
Carlos 9
157
Distribución muestral de medias

1.- Cuál es la media de la población
2.- Cuál es la distribución muestral de medias para una muestra de tamaño 2
3.- Cuál es la media de la distribución muestral
Solución:
1.- La media de la población es =7,7143 dólares
2.- Distribución de muestreo de las medias para n=2
media muestral Número de mediasProbabilidad

7 3 0,1429
7,5 9 0,4285
8 6 0,2857
8,5 3 0,1429
Prob
0,40
0,30
0,20
0,10
7 7,5 8 8,5 9 Medias muestrales 158
79
21/04/2013
3.- Se obtuvo la media de la distribución muestral de medias,

sumandod las
l diferentes
dif t mediasdi muestrales
t l y dividiendo
di idi d lal suma
entre el número de las muestras
Suma de todas las medias muestrales 7(3)  7,5(9)  8(6)  8,5(3)

    7,7143
X Número total de muestras 21
Obs: La media de las medias muestrales (7,7143) es igual a la media de la

población
159

Teorema del límite central
En el caso de una población con media  y varianza 2, la distribución muestral de
las medias de todas las muestras posibles de tamaño n generadas a partir de la
población, tendrá una distribución aproximadamente normal (siendo la media de la
distribución muestral igual a  y la varianza igual a 2/n) considerando que el
tamaño de la muestra es bastante grande
Es decir, cuando los parámetros de la población son conocidos, el valor esperado y la

desviación estándar de la distribución (error estándar de la media) de muestreo de la
media son

E( X )   X 
n
El teorema del límite central constituye el fundamento teórico para la inferencia
estadística. Este concepto se refiere a la estimación y las pruebas de hipótesis
160
80
21/04/2013

Ejemplo: En relación con una marca específica de un componente electrónico
para televisores, se sabe que el ciclo medio de vida útil del componente es
µ=9000 horas con una desviación estándar de =500 horas
a) Determine el valor esperado y el error estándar de la distribución de muestreo
de la media dado un tamaño de muestra de n=36
b) Interprete el significado de los valores calculados
Solución

E ( X )    9000 X  
500
 83,3
n 36
b) estos cálculos indican que, a largo plazo, la media de un grupo grande de medias
muestrales, basada cada una de ellas en un tamaño de muestra n=36, será igual a
9000 hr. Además la variabilidad de estas medias muestrales respecto del valor
esperado de 9000 hr se expresa mediante una desviación estándar de 83,3 hr
161
5.Intervalos de confianza
Estimaciones puntuales y de intervalo

Estimación puntual:
Un estimador puntual es el valor numérico de una estadística muestral
empleado para estimar el valor de un parámetro de la población.
Una de las características más importantes de un estimador es que sea
insesgado. Un estimador es insesgado es una estadística muestral cuyo
valor esperado es igual al parámetro por estimar
Estimadores puntuales de uso más frecuente

M di 
Media, X
Diferencia entre las medias de dos poblaciones, 1 2 X1  X 2
Varianza,  2 s2
Desviación estándar, s s
162
81
21/04/2013
Intervalos de confianza
Error muestral e intervalo de confianza
Siempre que se usa una media de muestra para

proporcionar un estimado de punto de una media
poblacional, alguien puede preguntar:¿Qué tan
bueno xes el estimado?. La pregunta ¿que tan
bueno?, es una forma de indagar el error incurrido
cuando se usa el valor de como un estimado
puntual de 
p
Recordemos que Error muestral es :

Error muestral  x  
163
En la práctica no se puede determinar el valor del error
muestral, porque no se conoce la media de la población
. Sin embargo, se puede usar la distribución muestral
x
de para establecer márgenes de probabilidad respecto
al tamaño del error muestral
El teorema del límite central nos permite llegar a la

x de
conclusión de que la distribución muestral se
puede aproximar mediante una distribución normal de
probabilidades con media  y desviación estándar
x  / n
164
82
21/04/2013
Si usamos la tabla de áreas de la distribución
normal estándar de probabilidades, vemos que el
95% de los valores de cualquier variable aleatoria
con distribución normal quedan dentro de una
distancia igual a +- 1,96 desviaciones estándar de la
media. Por consiguiente para x la distribución
muestral de x el 95% de los valores de debe
estar a +- 1,96 desviaciones estándar o menos de .
Si por ejemplo n=100 y =20 entonces la desviación
estándar
tá d ded lal distribución
di t ib ió muestral
t l es 2 y que ell
95% de las medias de muestra deben estar a +-3,92
o menos de la media de la población ( pues +-
1,96*2=+-3,92 ).
165
Por consiguiente podemos hacer la siguiente
aseveración probabilística sobre el error muestral
para el ejemplo; Hay un probabilidad de 0,95
0 95 de que
la media de una muestra origine un error muestral de
3,92 o menos. Esta aseveración probabilistica acerca
del error muestral es una aseveración sobre la
precisión.
Podemos definir un estimado de intervalo para 
restando 3,92 de x y sumando 3,92 más
166
83
21/04/2013
Para interpretar el estimado de intervalo de  o intervalo
de confianza para la media  veamos los valores posibles
de que se p
q
x podrían obtener a ppartir de tres muestras
distintas aleatorias simples, cada una formada por 100
datos.
Supongamos que la primera media de muestra tiene el
valor que vemos indicado en la figura como x1. En este
caso, vemos en la figura que el intervalo formado, al
restar y sumar 3,92 a x1, abarca la media de población .
El intervalo basado en x2 también incluye a la media de
población . Sin embargo, el intervalo basado en la
tercera media de muestra, identificada con x3, no incluye
a la media de población; la razón es que x3 está en una
cola de la distribución, a mayor distancia que 3,92 de 
167
Distribución
muestral de x 95% de todos
los valores de
x
3,92  3,92
 x1 
 x2 
 x3 
168
84
21/04/2013
Como el 95% de las medias de muestra posibles
estará en la región, el 95% de los intervalos
definidos al sumar y restar
x 3 92 a
3,92 abarcarán a
.
En consecuencia, decimos que se tiene un x 95% x  3 , 92

3 , 92 dea confianza
de que el intervalo de confianza definido como
va a incluir la media de población.
Se emplea la letra griega  para indicar el nivel de significación. Para un 95%
de confianza el nivel  será 5%.
 indica la probabilidad de que el error muestral sea mayor que el
correspondiente en la aseveración de precisión.
Hay una probabilidad 1- de que el valor de una media de muestra origine un
error muestral de
z / 2 *  x o menos
169
Luego el intervalo de confianza para la media de

una población n grande (n>30) con  conocida es
z 
x  /2 n
Un intervalo de confianza para la media es un
intervalo estimado construido en relación con la
media muestral por medio del cual puede
especificarse la verosimilitud de que el intervalo
incluya el valor de la media de la población.
Estimación de intervalo: Expresa la amplitud dentro de la cual probablemente
se encuentra un parámetro poblacional
170
85
21/04/2013
El nivel de confianza asociado con un intervalo
de confianza indica el porcentaje de tales
intervalos que a largo plazo incluyen el
parámetro que está siendo estimado.
Se utilizan con frecuencia dos intervalos de confianza para la media

poblacional: el intervalo de confianza de 95% y el intervalo de confianza del
99% , correspondientes a los valores de z de 1.96 y 2.58 respectivamente
¿Cómo interpreta, por ejemplo, un intervalo de confianza de 95%?
Un intervalo de confianza de tal valor significa que aproximadamente 95% de

los intervalos construidos similarmente contendrá el parámetro que se estima.
Si se emplea un nivel de confianza de 99%, entonces se espera que casi 99%
de los intervalos contenga el parámetro a estimar
171
¿Cómo se elabora un intervalo de confianza?
Cuando n30 ;
•Intervalo de confianza de 95%:

•Cuando  conocido

X  z que equivale a X
 1.96
X n
•Cuando la población se distribuye normal y  desconocido
s
X  zs que equivale a X
 1.96
X n
172
86
21/04/2013
Ejemplo:
Durante una semana dada, una muestra aleatoria de 30 empleados
por hora seleccionada de un gran número de empleados de una
empresa
p tiene un salario medio muestral de $180.000,, con una
desviación estándar muestral de $14. Estimamos el salario medio de
todos los empleados por hora de la empresa con una estimación por
intervalo tal como para que podamos tener una confianza de 95% de
que el intervalo incluye el valor de la media de la población de la
siguiente manera

X  1.96s  180.000 1.96(2,56)  174,98 a 185,02
x
De este modo podemos afirmar que el nivel salarial medio de la totalidad de

los empleados es de entre $174,98 y $185,02, con un nivel de confianza de
95% en esta estimación
173
Ejemplo:
En un experimento se trata de seleccionar una muestra aleatoria de 256

administradores o gerentes para el estudio. Un elemento de interés es
su ingreso anual: la media muestral que se calcula es $35420 dólares y
la desviación estándar de la muestra es $2050.
1.- ¿Cuál es el ingreso medio estimado de todos los funcionarios (la

población)?.¿Cuál es la estimación puntual?
2.- ¿Cuál es el intervalo de confianza de 95%?
3.- ¿Qué grado de confianza se está usando?
4.- Interprete los resultados
174
87
21/04/2013
Solución:
1.- La media muestral vale 35.420
2.- El intervalo de confianza está entre 35170 y 35670
s
X  35420 
2050
 1.96  1,96
n 256
3.- La medida de confianza que se obtiene se denomina grado de confianza. En
este caso es 0,95.
4.- Si hubiera tiempo para seleccionar 100 muestras de tamaño 256 de la
población de administradores y calcular las medias muestrales y los intervalos
de confianza, la media poblacional del ingreso anual se encontraría
aproximadamente en 95 de los 100 intervalos de confianza. Un intervalo puede
o no contener a la media poblacional. Aproximadamente 5 de los 100 intervalos
de confianza no contienen a la media poblacional de ingreso anual, .
175
Error estándar de la media
Error estándar de la media: Desviación estándar de la distribución de muestreo de las

medias muestrales
 s
X  o bien sX 
n n
Lógicamente, una estimación de la media poblacional basada en una muestra
grande es más confiable que una estimación realizada con una muestra
pequeña.
ñ En
E otras
t palabras,
l b ell error en la
l estimación
ti ió de
d la
l media
di poblacional
bl i l
disminuye a medida que aumenta el tamaño de la muestra
176
88
21/04/2013
Estimación por intervalo de la media de la población.

Población Tamaño de muestra  conocida  desconocida
Con distribución Grande (n >= 30) X  z x X  ts x

normal
o
X  zs x * *
Pequeño (n < 30) X  z x X  ts x
Sin distribución Grande (n >= 30) X  z x * X  ts x *
normal
o
X  zs x
Pequeño (n < 30) Se usarían por lo general

procedimientos no paramétricos
dirigidos a la mediana.
* Se aplica el teorema central del límite

** z se usa como aproximación de t.
177
Factores que determinan el tamaño de muestra para

una media
1. El nivel de confianza deseado (z)

2. El máximo error de muestreo permisible (E)
3. La variación en la población ( que por lo general
se estima con s)
La fórmula para el tamaño de muestra para una media es
2
 z.s 
n 
 E 
178
89
21/04/2013
Ejemplo. Un analista de un departamento de personal desea estimar el

número medio de horas de capacitación al año para los supervisores de
una división de la compañía con un margen de error inferior a 3 horas y
confianza de 90%. Con base en datos procedentes de otras divisiones, el
analista estima que la desviación estándar de las horas de capacitación es
20 horas.
El tamaño de muestra mínimo requerido es
2 2 2
 z.s   (1.645)(20)   32.9 
n       121
 E   3   3 
179
6. Pruebas de Hipótesis
El propósito del análisis estadístico es reducir el
nivel de incertidumbre en el proceso de toma de
decisiones. Los gerentes pueden tomar mejores
decisiones sólo si tienen suficiente información a
su disposición. La prueba de hipótesis es una
herramienta analítica muy efectiva para obtener
esta valiosa información, bajo una gran variedad
de circunstancias.
Existen muchos ejemplos comunes en los negocios:

•Un embotellador de bebidas suaves debe determinar si el peso promedio
del contenido de sus botellas es 16 onzas (=16)
•Un productor de software de computador desea certificar que la proporción
de sus productos que son defectuosos es menor del 3% ( <0.03)
180
90
21/04/2013
Pruebas de Hipótesis
¿En qué consiste la prueba de hipótesis?
Una hipótesis en el contexto de la estadística inferencial es una proposición

respecto a uno o varios parámetros, y lo que el investigador hace a través de la
prueba de hipótesis es determinar si la hipótesis es consistente con los datos
obtenidos en la muestra.
Si la hipótesis es consistente con los datos, ésta es retenida como un valor
aceptable del parámetro.Si la hipótesis no es consistente con los datos, se
rechaza ésta.
Prueba de hipótesis: Procedimiento basado en la evidencia muestral y en la

teoría de probabilidad que se emplea para determinar si la hipótesis es un
enunciado razonable y no debe rechazarse, o si es irrazonable y debe ser
rechazada
181
Procedimiento para aceptar una hipótesis
A. Plantear la hipótesis nula y la hipótesis alternativa

La hipótesis nula es una afirmación que se realiza acerca del valor del
parámetro de la población. La hipótesis alternativa o de investigación describe
lo que se considerará si se rechaza la hipótesis nula
B. Seleccionar el nivel de significación.El nivel de significación  es la

probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.
L niveles
Los i l de d 0.10,
0 10 0.05
0 05 y 0.01
0 01 son los
l que se usan por lo
l generall
182
91
21/04/2013
C. Decidir acerca del estadístico de prueba.
El valor 2estadístico de prueba es un valor determinado a partir de la

información muestral que se utiliza para aceptar o rechazar la hipótesis
muestral,
nula. Por lo general se utilizan el valor z, t, F,
D. Plantear la regla de decisión. Con base en la distribución muestral,

pueden identificarse un área de aceptación y una de rechazo.
E. Tomar una muestra y adoptar una decisión. Si el valor del

estadístico de prueba calculado queda en el área de aceptación,
no se rechaza Ho y se acepta H1
183
Prueba de hipótesis sobre la media poblacional
Para una prueba de hipótesis sobre la media poblacional si se conoce
la desviación estándar de la población se utiliza la fórmula (para una
muestra grande (n30)).
(n30)) La distribución muestral del estadístico z se
distribuye normalmente
X 
z

n
Si no se conoce se sustituye por la desviación estándar de la muestra.
Si el tamaño de la muestra es pequeño ( menos de 30) se utiliza el

estadístico t de Student
X 
t
s
n
184
92
21/04/2013
Problema:
Suponga que la fábrica Phillips provee de sus luminarias a la Ilustre

Municipalidad de Viña del Mar; la vida media es de 50 días y la desviación
típica es de 10 días, al estar encendidas toda la noche en la misma plaza de
esa ciudad jardín.
Otra fábrica ofreció sus productos a esa misma Municipalidad, con precios
más ventajosos. Se desea saber si las luminarias de esta fábrica son de la
misma calidad o mejor que los de la Phillips. Tenemos entonces una
suposición: las luminarias de la otra fábrica son de la misma calidad o
mejor que los de la fábrica Phillips. Esto lo llamamos la hipótesis nula, o
sea, la suposición que queremos rechazar o no rechazar. Enseguida
vendría la hipótesis alterna, o sea la que habría que aceptar, si rechazamos
la hipótesis nula. Podría ser “la vida media de la luminarias es menor que
la de las antiguas”.
185
Esto se escribe abreviadamente así:

Hipótesis nula Ho:µ50 días
Hipótesis alterna H1: µ<50
Puestas las hipótesis, se procede a hacer la comprobación. Para esto se

efectúa el muestreo de las nuevas luminarias y se elige unas 100 al azar, por
ejemplo. Se calculó el promedio de vida de estas 100 nuevas luminarias y se
obtuvo 45 y una desviación típica de 12 días.
Determine si se acepta o rechaza la hipótesis nula.
186
93
21/04/2013
Consideremos 5% nivel de significancia de la prueba
Definición de región de aceptación y rechazo
Región de rechazo
Región de
aceptación Ho
Escala de z
-1,645 0
Valor crítico
187
s 12 x -  45  50
  1,2 z   4,1
n 100 s/ n 1,2
Como -4,1<-1,645 punto crítico se rechaza la

hipótesis nula y se acepta la hipótesis alterna
Por lo tanto las nuevas luminarias ofrecidas son

de menor calidad que las de Phillips.
188
94
21/04/2013
En el ejemplo dado la hipótesis alterna era unilateral. Se decía que la vida
media de las ampolletas era menor que 50 días. Sin embargo, se puede
presentar una hipótesis alterna bilateral. Sería en el caso de que se hubiera
dicho que la vida de las nuevas ampolletas era distinto de 50 días.
días H1: µ50.
µ50
También podría ser la hipótesis alterna unilateral derecha, cuando se dijese
que el promedio es mayor que. En este caso la región de rechazo estaría a
la derecha.
Región de rechazo
0 025
0,025 Región de rechazo
0,025
Región de aceptación Ho
-1,96 1,96
189
Ejemplo: Un embotellador de bebidas suaves puede asumir, o plantear la
hipótesis que el contenido promedio es de 16 onzas (=16). Esta hipótesis
nula Ho se prueba contra la hipótesis alternativa H1 que establece lo
contrario. Por lo tanto se tendría que.
Ho: =16 H1: 16
Con base en los datos muestrales, la hipótesis nula es rechazada o no

rechazada. Nunca se puede “aceptar” la hipótesis nula como verdadera. El
no rechazo de la hipótesis nula solamente significa que la evidencia muestral
no es lo suficientemente fuerte como para llevar a su rechazo. Incluso si
, no prueba que =16.
=16 Podría ser que =15.8
=15 8 ( o cualquier otro número),
número) y
X de
debido al error 16muestreo la media muestral acaba de igualar al valor de 16
que se plantea como hipótesis.
190
95
21/04/2013
Una analogía es que probar una hipótesis es

como poner una persona en juicio.
j i i El acusadod
se halla o culpable o no culpable. Un veredicto
no culpable simplemente significa que la
evidencia no es lo suficientemente fuerte como
para encontrar culpable al acusado. No significa
que él o ella sea inocente.
La evidencia de culpable debe establecerse más
allá de toda duda razonable. Antes que se
rechace la hipótesis nula, la media muestral
debe diferir significativamente de la media
poblacional planteada como hipótesis.
191
Una vez planteadas las hipótesis;
Ho: =16 H1: 16
se calcula el estadístico de p prueba Z,, y se compara

p con los valores
críticos de Z.
Si el embotellador selecciona una muestra de n=50 botellas con una
media de onzas y una desviación estándar de s=0,866 onzas,
Z es X  16,357
X   0 16.357  16
Z   2.91
s 0.866
n 50
En la figura el nivel de significancia del 5% se divide en dos colas. El 95%

restante se divide por 2 para hallar el área de 0,4750. En la tabla Z esta
área de 0,4750 da los valores críticos de Z de +- 1.96
192
96
21/04/2013
La regla de decisión es “ No se rechaza la hipótesis nula si -1,96Z 1,96.
Se rechaza si Z<-1,96 o Z>1,96
Ho: 
=16
16 H1: 16
0,95
0,4750 0,4750
0,025 0,025
-1,96
1 96 1 96
1,96
193
El paso final de la prueba de hipótesis es donde cae el valor del
estadístico para la muestra y determinar si la hipótesis nula debería
rechazarse o no.
El valor del estadístico para la muestra de 16,357 onzas produce una
Z=2,91>1.96 y cae en la zona de rechazo, cola a la derecha.
Se pueden interpretar estos resultados como “ la hipótesis nula es

rechazada a un nivel de significancia del 5%”. Hay sólo un 2,5% de
probabilidad que Z pueda exceder de 1,96 ( y sólo un 2,5% de
probabilidad q
p , ) si  en realidad es 16 .
que Z<-1,96)
La impresión en SPSS entrega el valor p ( p-Value).
194
97
21/04/2013
Valor p: Es el nivel más bajo de significancia (valor) al cual se puede
rechazar la hipótesis nula.
El valor p para una prueba es la probabilidad de obtener resultados muestrales

al menos tan extremos como los que se obtuvieron dado que la hipótesis nula
es verdadera. Se encuentra de la misma manera que el área de la cola que va
más allá del valor del estadístico para la muestra.
Por ejemplo, supongamos que el señor Martínez es el jefe de personal.
A partir de un breve análisis de los registros de los empleados, Martínez
considera que los empleados tienen un promedio de más de US$31.000 en sus
cuentas de pensiones (>31000). Al tomar como muestra 100 empleados,
Martínez encuentra una media de US$31.366
$ con
s= US$1.894. Se supone que Martínez desea calcular el valor p relacionado con
esta prueba de cola a la derecha..
195
Las hipótesis son
a) Ho: 31.000
H1: >31.000
Z es 1,93
, 0,4732
Valor p =0
=0,0268
0268
b) Si  =0.05 es mayor que 1,93

0,0268 ( por ejemplo 0,05) el
Zona de
valor del estadístico para la
rechazo
muestra Z=1,93 cae en la
zona de rechazo
0,45
=0.05
1,65 1,93
c) Si  es menor que 0,0268
0 0268 (
por ejemplo 0,01) el valor del Zona de
estadístico para la muestra rechazo
Z=1,93 cae en la zona de no
rechazo 0,49
=0.01
1,93 2,33
196
98
21/04/2013
Resumen de las formas para las
hipótesis nula y alternativa
Sea 0 el valor numérico específico que se considera en las hipótesis nula y

alternativa. En general, una prueba de hipótesis referente a los valores de una
media  de población debe asumir una de las tres formas siguientes:
Ho :    0 Ho :    0 Ho :    0
Ha :    0 Ha :    0 Ha :    0
Se debe tener en cuenta que la hipótesis alternativa es lo que trata de
establecer la prueba. Por consiguiente, al preguntar si el usuario busca
evidencia para respaldar que < o, > o o que  o, se contribuirá a
determinar Ha.
197
Tipos de análisis; paramétricos
y no paramétricos
Análisis paramétricos
Para realizar análisis paramétricos debe partirse de los siguientes

supuestos:
1.- La distribución poblacional de la variable dependiente es normal
2.- El nivel de medición de la variable dependiente es por intervalos o razón
3.- Cuando dos o más poblaciones son estudiadas, tienen una varianza
3.
homogénea: las poblaciones en cuestión tienen una dispersión similar en
sus distribuciones
198
99
21/04/2013
Pruebas paramétricas
Las pruebas
L b estadísticas
t dí ti paramétricas
ét i más
á utilizadas
tili d
son:
•Coeficiente de correlación de Pearson y regresión
lineal
•Prueba t
•Prueba de contraste de diferencia de proporciones
•Análisis de varianza unidireccional (ANOVA)
199
Análisis no paramétricos
Para realizar análisis no paramétricos debe partirse de las siguientes

consideraciones:
1.- La mayoría de estos análisis no requieren de supuestos acerca de

la forma de la distribución poblacional. Aceptan distribuciones no
normales
2.- Las variables no necesariamente deben estar medidas en un nivel

por intervalos o de razón, pueden analizar datos nominales u
ordinales. De hecho, si se quieren aplicar análisis no paramétricos a
datos por intervalos o razón, éstos deben ser resumidos a categorías
discretas ( a unas cuantas). Las variables deben ser categóricas.
200
100
21/04/2013
Pruebas no paramétricas
Las pruebas paramétricas más utilizadas son:
1.- La Chi cuadrado o 2

2.- Los coeficientes de correlación e independencia para tabulaciones
cruzadas
3.- Los coeficientes de correlación por rangos ordenados de Spearman y

Kendall
201
¿Qué es la Chi cuadrado?
Definición; Es una prueba estadística para evaluar hipótesis acerca de la relación
entre dos variables categóricas
Se simboliza; 2
Hipótesis a probar: Correlacionales
Variables involucradas: Dos. La prueba Chi cuadrado no considera relaciones

causales
Nivel de medición de las variables: Nominal u ordinal ( o intervalos o razón

reducidas a ordinales)
Procedimiento: La Chi cuadrado se calcula por medio de una tabla de

contingencia o tabulación cruzada.
202
101
21/04/2013
En la tabla de contingencia se anotan las frecuencias
observadas en la muestra de la investigación.
Posteriormente, se calculan las frecuencias esperadas para
cada celda. En esencia,, la Chi cuadrado es una comparación
p
entre la tabla de frecuencias observadas y la denominada tabla
de frecuencias esperadas, la cual constituye la tabla que
esperaríamos encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas.
La chi cuadrada es una prueba que parte del supuesto de “no
relación entre variables” y el investigador evalúa si en su caso
esto es cierto o no, analizando si sus frecuencias observadas
son diferentes de lo que pudiera esperarse en caso de ausencia
de correlación.
203
Prueba de independencia
1 Plantear
1.- Pl t l hipótesis
la hi ót i nula
l y alternativa
lt ti
Ho: La variable de columna es independiente de la variable de renglón
Ha: La variable de columna no es independiente de la variable de renglón
2. Tomar una muestra aleatoria y anotar las frecuencias observadas para cada
celda de la tabla de contingencias
3. Aplicar la ecuación (1) para calcular la frecuencia esperada para cada celda
eij 
Total del renglón i Total de la columna j
Tamaño de la muestra
204
102
21/04/2013
4.-Aplicar la ecuación (2) para calcular un valor de como
2 estadístico
 f ij  eij 2
 2  
i j
eij
f ij  frecuencia observada para la categoría en el renglón i y la columna j

e ij  frecuencia esperada para la categoría en el renglón i y la column j,
basada en la hipótesis de independencia
5.-Regla de rechazo
Rechazar H 0 si  2   2
Siendo  el nivel de significación para la prueba ; si hay n renglones y m
columnas en la tabla, hay (n-1)(m-1) grados de libertad
205
Tabla de frecuencias esperadas
ZONA DEL DISTRITO ELECTORAL
Norte Sur Total
IDENTIFICACION Partido derechista 145,4 134,6 280
POLITICA Partido del centro 244 226 470
Partido izquierdista 150,6 139,4 290
Total 540 500 1040
206
103
21/04/2013
Procedimiento para calcular la chi cuadrado
frec obs - frecesp2
CELDA frec observada frec esperada frecobs
frecobs-frecesp
frecesp  frec obs - frecespp 2 frecesp
Zona Norte/partido derechista 180 145,4 34,6 1197,16 8,23

Zona Norte/partido centro 190 244,4 -54,4 2959,36 12,11
Zona Norte/partido izquierdista 170 150,6 19,4 376,36 2,50
Zona Sur/partido derechista 100 134,6 -34,6 1197,16 8,89
Zona Sur/partido centro 280 226 54 2916 12,90
Zona Sur/partido izquierdista 120 139,4 -19,4 376,36 2,70
47,34
Gl=(3-1)(2-1)=2
Acudimos con los grados de libertad que nos corresponden a la tabla,
eligiendo nuestro nivel de confianza (0,05
(0 05 o 0,01).
0 01) Si nuestro valor
calculado de Ji cuadrada es igual o superior al de la tabla, decimos que las
variables están relacionadas (Ji cuadrada fue significativa).
Dado que  2  47,34   2  5,991 se rechaza Ho  2 resulta significat iva
207
¿Qué son los coeficientes de correlación

por rangos ordenados de Sperman y Kendall?
Los coeficientes rho de Spearman, simbolizado como rs, y tau de Kendall,

simbolizado como t, son medidas de correlación para variables en un nivel de
medición ordinal, de tal modo que los individuos u objetos de la muestra
pueden ordenarse por rangos (jerarquías).
Por ejemplo, supongamos que tenemos las variables “preferencia en el
sabor” y “atractivo del envase”, y pedimos a personas representativas del
mercado q que evalúen conjuntamente
j a 10 refrescos embotellados y los
ordenen del 1 al 10 (donde “1” es la categoría o rango máximo en ambas
variables). Y tuviéramos los siguientes resultados
208
104
21/04/2013
Refresco Variable 1 variable 2
Preferencia en el sabor Atractivo del envase
Coca-Cola 1 2
Fanta 2 5
Sprite 3 1
Bilz 4 3
Pap 5 4
Quatro 6 6
Orange 7 8
Kem Piña 8 7
Pepsi 9 10
Seven-Up 10 9
Para analizar los resultados, utilizaríamos los coeficientes “rs” y “t”.

Ahora bien, debe observarse que todos los sujetos u objetos deben
jerarquizarse por rangos que contienen las propiedades de una escala
ordinal ( se ordenan de mayor a menor). Ambos coeficientes varían de
-1 (correlación negativa perfecta) a 1 (correlación positiva perfecta).
209
Análisis parámetricos
¿Qué es la prueba
¿Q p t para
p muestras independientes?
p
Definición: Es una prueba estadística para evaluar si dos grupos difieren entre si de
manera significativa respecto a sus medias.
Ejemplo:
Ho: No hay diferencia entre el ingreso medio de hombres y mujeres
H1: Hay diferencia entre el ingreso medio de hombres y mujeres
Se simboliza: t
Hipótesis: De diferencia entre dos grupos. La hipótesis de investigación propone

que los grupos difieren significativamente entre sí y la hipótesis nula propone que
los grupos no difieren significativamente
210
105
21/04/2013
Variable: La comparación se realiza sobre una variable. Si hay diferentes
variables, se efectuarán varias pruebas t ( una por cada variable)
Nivel de medición de la variable: Intervalos o razón
Estadístico de prueba; El valor t se obtiene mediante la fórmula
x1  x2
t
2 2
s1 s2

N1 N1
Donde x1 es la media de un grupo, x2 es la media del otro

grupo.
El denominador es el error estándar de la distribución muestral de la
diferencia entre las medias
211
Para saber si el valor t es significativo, se aplica la fórmula y se calculan
los grados de libertad . La prueba t se basa en una distribución muestral o
poblacional de diferencia de medias conocida como la distribución t de
Student.
Esta distribución es identificada por los grados de libertad, los cuales

constituyen el número de maneras en que los datos pueden variar
libremente.
Entre mayor número de grados de libertad se tengan, la distribución t de
Student se acerca más a ser una distribución normal y usualmente, si los
grados de libertad exceden los 120, la distribución normal es utilizada
como una aproximación adecuada de la distribución t de Student.
Los grados de libertad se calculan así
gl  ( N1  N 2 )  2
N1 y N2 son el tamaño de los grupos que se comparan

212
106
21/04/2013
Una vez calculados el valor t y los grados de libertad, se elige el nivel de
significancia y se compara el valor obtenido contra el valor que le
correspondería en la tabla t de Student.
Student Si el valor calculado es igual o
mayor al que aparece en la tabla, se acepta la hipótesis de investigación.
Pero si es menor se acepta la hipótesis nula.
El nivel de confianza 0,05 significa que existe un 95% de confianza de que
los grupos difieren significativamente entre si y 5% posibilidad de error.
Cuanto mayor sea el valor t calculado respecto al valor de la tabla y menor
sea la posibilidad de error, mayor será la certeza en los resultados.
Cuando el valor t se calcula utilizando un paquete estadístico, la
significancia se proporciona como parte de los resultados y ésta debe ser
menor q que 0,05
,
213
Una introducción al análisis

de correlación y regresión lineal
214
107
21/04/2013
Análisis de correlación
Análisis de correlación simple

Análisis de correlación: Grupo de técnicas estadísticas empleado
para medir la intensidad de la relación (correlación) entre dos
variables. Una medida de esta relación es el coeficiente de
correlación.
Diagrama de dispersión: Gráfica que presenta la relación entre
las dos variables de interés.
¿Qué es el coeficiente de correlación de Pearson?

Definición; Es una prueba estadística para analizar la relación entre dos variables
medidas en un nivel por intervalos o de razón.
Se simboliza; r
Hipótesis a probar: Correlacional del tipo “A mayor X, mayor Y”,”A mayor X,

menor Y”, “Altos valores en X están asociados con altos valores en Y”, “Altos
valores en X se asocian con bajos valores de Y”.
Variables involucradas: Dos. La prueba en sí no considera a una como

independiente y a otra como dependiente, ya que no se trata de una prueba que
evalúa causalidad.
108
21/04/2013
Interpretación: El coeficiente r de Pearson puede variar de -1 a 1 donde;
-1= correlación negativa perfecta

-0 9= Correlación negativa muy fuerte
-0,9=
-0,75= Correlación negativa considerable
-0,5= Correlación negativa media
-0,1= Correlación negativa débil
0 = No existe correlación alguna entre las variables
0,1= Correlación positiva débil
0,5= Correlación positiva media
0,75= Correlación positiva considerable
0,9= Correlación positiva muy fuerte
1= Correlación ppositiva perfecta
p
El signo indica la dirección de la correlación y el valor numérico, la magnitud de la

correlación.
Los principales programas de análisis estadístico reportan si el coeficiente

es o no significativo
significativo, de la siguiente manera:
s =0,001 significancia 0,7831 valor de coeficiente
Si s es menor del valor 0,05, se dice que el coeficiente es significativo al

nivel del 0,05 (95% de confianza en que la correlación sea verdadera y 5% de
probabilidad de error). Si s es menor a 0,01, el coeficiente es significativo al
nivel del 0,01 (99% de confianza de que la correlación sea verdadera y 1% de
probabilidad de error).
Por
o otra
ot a parte
pa te p<0,05
p 0,05 qu
quiere
e e dec
decir que e
el coe
coeficiente
c e te es s
significativo
g cat o a al nivel
e
0,05 o la probabilidad de error es menor del 5%.
109
21/04/2013
Consideraciones: Cuando el coeficiente r de Pearson se eleva al cuadrado el

resultado indica el porcentaje de la variación de una variable debido a la variación
de la otra y viceversa.
Por ejemplo:
La correlación entre “productividad” y “asistencia al trabajo” es de 0,80.
r  0,8
r 2  0,64
“La asistencia al trabajo” explica el 64% de la “productividad”

La “productividad” contribuye a o explica el 64% de la variación de “la
asistencia al trabajo”
Ejemplos:
•Hi: “A mayor motivación hacia el trabajo, mayor puntualidad”.

Resultado: r=0,721
s=0,0001
Interpretación:Se acepta la hipótesis de investigación al nivel de 0,01.La
correlación entre la motivación hacia el trabajo y la puntualidad es
considerable.
Hi: A mayor ingreso, mayor motivación hacia el trabajo”

•Hi: trabajo
Resultado: r=0,214
s=0,081
Interpretación: Se acepta la hipótesis nula. El coeficiente no es significativo.
0,081 es mayor que 0,05 ( 0,05 es el nivel mínimo para aceptar la hipótesis.
110
21/04/2013
Uso de la covarianza para la comprensión del coeficiente de

correlación
Otra medida que puede ser útil para expresar la relación entre
dos variables es la covarianza. La covarianza mide el grado en
que dos variables “varían juntas” y es usada por los analistas
financieros para determinar el riesgo total asociado con
inversiones interrelacionadas. Lo mismo que en el caso del
coeficiente de correlación, un signo positivo indica una relación
directa, mientras que un signo negativo indica una relación
inversa.
inversa
La fórmula para las covarianzas es:
cov( x, y ) 
 x  x y
i i y  cov( x, y ) 
 x
i 
  x  yi   y 
n 1 N
muestra población
Mientras que el coeficiente de correlación es una medida de

relación estandarizada cuyo valor sólo puede ir de -1 a 1, la
covarianza
i carece de
d tales
t l valores
l límite
lí it y no es una
medida estandarizada.
La fórmula por la que la covarianza puede convertirse en el
coeficiente de correlación es:
cov( x, y ) cov( x, y )
rxy   xy 
sx s y  x y
muestra población
111
21/04/2013
Cálculo del coeficiente de correlación
•El
El coeficiente de correlación r (mide el grado de asociación lineal entre X y
Y) se estima de acuerdo a la fórmula:
n  XY   X  Y
r
n X  ( X ) 2 n Y 2  ( Y ) 2
2
•El coeficiente de determinación, r al cuadrado , es la proporción de la

variación en Y explicada por X. Puede adoptar cualquier valor entre 0 y 1,
inclusive.
Ejemplo:
Una empresa comercial tiene establecimientos en varias grandes

ciudades. El gerente comercial de ventas planea lanzar al aire un
anuncio comercial por radio en las estaciones locales , al menos dos
veces antes de una venta gigante que empezará el Sábado y terminará el
Domingo. Planea tener las cifras de las ventas de video caseteras del
Sábado y Domingo en sus diferentes locales y parearlas con el número
de veces que apareció el comercial en la radio. El objetivo fundamental
de la investigación es determinar si existe relación entre el número de
veces que se transmitió el anuncio y las ventas de sus productos.
112
21/04/2013
Localización Número de Ventas de Sábado

de la radio transmisiones y Domingo
de anuncio
La Serena 4 15
Valparaiso 2 8
Rancagua 5 21
Curicó 6 24
Puerto Montt 3 17
•1.-¿Cuál es la variable dependiente?

•2.-Trace el diagrama de dispersión
•3.-¿Parece haber alguna relación entre X y Y
•4.-Determine el coeficiente de correlación
•5.-Evalúe la intensidad de la relación entre X y Y
Gráfico de dispersión
30
20
Ventas de sábado y domingo
10
0
1 2 3 4 5 6 7
Número de transmisiones de anuncio
1.- Ventas
3.- Si existe una fuerte correlación positiva
4.- 0,93
5.- 0,93 indica una correlación positiva fuerte entre el número de veces
que sale publicado el anuncio, y las ventas.
113
21/04/2013
Observación: El coeficiente de correlación parcial es la

correlación entre la variable dependiente y una variable
independiente cuando se han eliminado de ambos los
efectos lineales de las otras variables independientes
presentes en el modelo.
La correlación parcial se emplea para controlar el efecto de
una o más variables sobre el coeficiente de correlacion de
Pearson. En la correlación parcial se estudia la relación
entre dos variables eliminando el influjo de una o más
variables de control.
Ejemplo:
En un cierto estudio realizado en un parque de atracciones se halló una
correlación significativa y muy alta entre la temperatura y el número de tazas de
chocolate
h l t caliente
li t servidas
id , r= 0,923
0 923 p<=0,000.
< 0 000 Lo
L cuall es un resultado
lt d muy
extraño, pues implica que cuanto mayor es la temperatura más tazas de chocolate
caliente se consumen. Sin embargo, si se controla la variable número de visitantes
el resultado es muy diferente.
Cuando hace frío, mucha gente, (de la poca gente que va) toma chocolate, pero
cuando hace calor muy poca gente, de la mucha que va toma chocolate caliente.
Es decir, como en verano va mucha gente, por poca gente que tome chocolate
caliente ya es mayor la cantidad que en invierno.
114
21/04/2013
Análisis de regresión lineal
 Análisis de regresión lineal simple

Análisis de regresión lineal múltiple
Fuente:Econometría . Gujarati
229
Análisis de regresión lineal simple
Análisis de regresión con dos variables: Algunas ideas básicas

Concepto de función de regresión poblacional
Significado del término lineal
Especificación estocástica de la FRP
Función de regresión muestral (FRM)
Análisis de regresión con dos variables: problema de estimación.

Método de Mínimos cuadrados ordinarios (MCO)
Modelo clásico: Supuestos detrás del método MCO
Precisión o errores estándar de MCO
Propiedades de los estimadores de MCO
Coeficiente de determinación r2:una medida de bondad de
ajuste
Coeficiente de correlación muestral y propiedades de r
Interpretación de la pendiente
230
115
21/04/2013
Modelo clásico de regresión lineal normal (MCRLN)

Regresión con dos variables: estimación de
intervalos
y pruebas de hipótesis.
Intervalos de confianza
Pruebas t
Aplicación problemas de predicción
Predicción del valor de la media condicional
Predicción de un valor individual
Formas funcionales de los modelos de regresión

Modelo log-lineal
Modelos semilogaritmicos
231
Algunas ideas básicas
El análisis de regresión se relaciona en gran medida con la

estimación y/o predicción de la media (de la población) o valor
promedio de la variable dependiente, con base en los valores
conocidos o fijos de las variables explicativas.
Consideremos los datos de la tabla siguiente, la que

se refiere a la población total de 60 familias de una
comunidad hipotética, así como a su ingreso
semanal (X) y a su gasto de consumo semanal (Y),
dados en dólares.
232
116
21/04/2013

Gastos de consumo familiar semanal Y,$. Ingreso familiar semanal X,$
Y\X 80 100 120 140 160 180 200 220 240 260
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 185
115 162 191
Total 325 462 445 707 678 750 685 1043 777 1211
Medias 65 77 89 101 113 125 137 149 155 173
Tabla 1
Las 60 familias se dividen en 10 grupos de ingresos

(de $80 a $260). Se tienen 10 valores fijos de X y los
correspondientes valores de Y para cada uno de los
valores X; así que hay 10 subpoblaciones Y 233

A estos valores medios se
Se tienen 10 valores medios para lasles denomina valores
10 subpoblaciones de Y.
Y esperados condicionales
condicionales, en
vista de que dependen de
los valores dados a la
variable condicional X. Se
denota por E(Y/X)
Resulta importante distinguir dichos valores
condicionales esperados del valor esperado
incondicional del gasto de consumo semanal, E(Y).
E(Y)=7272/60=121,2
Es incondicional en el sentido de que para obtener esta
cifra se omiten los niveles de ingresos de las diversas
familias
234
117
21/04/2013
¿Cuál es el valor esperado del gasto de consumo

semanal de una familia?
La media incondicional: $121,20
¿Cuál es el valor esperado del gasto de consumo

semanal de una familia cuyo ingreso mensual es,
digamos, $140?
$
La media condicional: $101
Saber el nivel de ingreso nos permite predecir
mejor el valor medio del gasto de consumo
235
Se puede observar en él gráfico de dispersión, al unir las medias

condicionales la recta de regresión poblacional (RRP).
( o regresión de Y sobre X).
El adjetivo
j “poblacional
p “ se debe al hecho de que
q en este ejemplo
j p se consideró
una población de 60 familias.
Gasto de consumo v/s Ingreso
A pesar de la
200
variabilidad del
180
gasto para cada
160
ingreso, en
140
promedio el
120 consumo
Gasto de consumo
100 semanal se
80 incrementa en la
60 misma medida
40 que el ingreso
0 20 40 60 80 100 120 140 160 180 200 220 240 260 280
236
Ingreso semanal
118
21/04/2013
Curva de regresión poblacional
Desde el punto de vista geométrico, una curva de regresión

poblacional es simplemente el lugar geométrico de las medias
condicionales de la variable dependiente para los valores
fijos de la (s) variables explicativa(s).
Es la curva que conecta

l medias
las di ded las
l
subpoblaciones de Y que
corresponden a los
valores del regresor X
237
Concepto de función de regresión poblacional (FRP)
Es claro que cada media condicional E(Y/Xi) es función de Xi,

donde Xi es un valor dado de X.
E(Y/Xi)=f(Xi) (1)
y f(Xi) d
denota
t alguna
l ffunción
ió dde lla variable
i bl explicativa
li ti X X.
¿Qué forma toma la función f(Xi)?

En una situación real no tenemos la totalidad de la población
para efectuar el análisis.
La forma funcional de la FRP es, una pregunta empírica, aunque
en casos específicos la teoría puede tener algo que decir. Por
ejemplo, un economista podría plantear que el gasto de consumo
está relacionado linealmente con el ingreso.
Por tanto, como una primera aproximación podemos suponer

que la FRP es una función lineal de Xi
E (Y / X i )  1   2 X i
238
119
21/04/2013
Ecuación de regresión poblacional FRP
Ecuación de
E (Y / X i )  1   2 X i regresión
(2)
poblacional FRP
Donde 1 y  2son parámetros no conocidos pero fijos que se denominan

coeficientes de regresión.
En el análisis de regresión el interés es estimar la FRP, es decir estimar los

valores de no conocidos con base en las observaciones de Y y X
1 y  2
239
Linealidad en las variables

Se dice que una función Y=f(X) es lineal en X si X aparece
elevado a una potencia o índice de 1 solamente y dicha
variable no está multiplicada ni dividida por alguna otra
variable
E (Y / X i )  1   2 X i
es lineal en Xi.
Geométricamente la curva de regresión es una línea recta
Linealidad en los parámetros

Se dice que una función es lineal en el parámetro, 1 por
ejemplo si 1 aparece elevado a una potencia o índice de 1
solamente y no está multiplicado ni dividido por ningún otro
parámetro.
E (Y / X i )  1   2 X i2 Es lineal en los parámetros pero
no es lineal en la variable X
240
120
21/04/2013
¿Qué podemos decir sobre la relación entre el gasto de

consumo de una familia individual y un nivel dado de ingresos?
Se observa en la figura , que dado el nivel de ingresos de Xi, el
gasto de consumo de una familia individual está agrupado
alrededor del consumo promedio de todas las familias en ese
nivel de Xi, esto es, alrededor de su esperanza condicional. Por
consiguiente, podemos expresar la desviación de un Yi
individual alrededor de su valor esperado de la siguiente
manera: ((3))
ui  Yi  E (Y / X i ) o Y  E (Y / X )  u
i i i
Donde la desviación ui es una variable aleatoria no

observable que toma valores positivos o negativos.
Técnicamente , ui es conocida como perturbación
estocástica o término de error estocástico.
241
Se puede decir que el gasto de una familia individual

individual,
dado su nivel de ingresos, puede ser expresado
como la suma de dos componentes
Yi  E (Y / X i )  ui (4)
La media del gasto Componente aleatorio .

de consumo de Es un sustituto para todas
todas las familias aquellas variables que son
con el mismo nivel omitidas del modelo pero
de ingresos. que colectivamente afectan a
Y 242
121
21/04/2013
Si se supone que E (Y / X i ) es lineal en Xi como en la ec

(2) la ecuación (3) puede escribirse como
Yi  E (Y / X i )  ui  1   2 X i  ui (5)
La ecuación plantea que el gasto de consumo de una familia

está relacionado linealmente con su ingreso, más el término
de perturbación. Así los gastos de consumo individual, dado
X=US$80, pueden ser expresados como
Y1  55  1   2 80  u2
Y2  60  1   2 80  u2
Y3  65  1   2 80  u3
Y4  70  1   2 80  u4
Y5  75  1   2 80   u5
243
Ahora, si se toma el valor esperado de (5), obtenemos

Yi  E (Y / X i )  ui (5)
E (Yi / X i )  E E (Y / X i )  E (ui / X i )
 E (Y/X i )  E (ui / X i )
Puesto que E (Yi / X i ) es lo mismo que E (Y / X i )
Implica que E (ui / X i )  0 (6)
Así, el supuesto de que la recta de regresión pasa a través de las

medias condicionales de Y implica que los valores de la media
condicional de ui son cero.
244
122
21/04/2013
La especificación estocástica
Yi  E (Y / X i )  ui  1   2 X i  ui (7)
Tiene la ventaja que muestra claramente otras variables

además del ingreso, que afectan el gasto de consumo y que un
gasto de consumo de familias individuales no puede ser
explicado
li d en su totalidad
t t lid d solamente
l t por la(s)
l ( ) variable(s)
i bl ( )
incluida(s) en el modelo de regresión.
245
En la práctica lo que se tiene al alcance no es más que una

muestra de valores de Y que corresponden a algunos valores
fijos de X. Por consiguiente la labor ahora es estimar la FRP
con base en información muestral.
muestral
Supóngase que no se conocía la población de la tabla 1 y que
la única información que se tenía era una muestra de valores
de Y seleccionada aleatoriamente para valores dados de X tal
como se presenta en la tabla 2 Y X
70 80
De la muestra de la tabla 2, 65 100
90 120
¿se puede predecir el gasto de 95 140
consumo semanal promedio Y 110 160
para la población 115 180
120 200
correspondiente a los valores de 140 220
X seleccionados? 155 240
150 260
¿Se puede estimar la forma FRP Tabla 2 Primera muestra
246
a partir de la información
muestral?
123
21/04/2013
Consideremos otra muestra tomada de la población de la

tabla 1.
Las rectas de la figura se conocen como rectas de regresión
muestral. En general, se podrían obtener N FRM diferentes
para N muestras diferentes y estas FRM no necesariamente
Y X
son iguales 55 80
88 100
90 120
80 140
118 160
120 180
145 200
135 220
145 240
175 260
Tabla 3 Segunda muestra
247
Ahora, en forma análoga a la FRP en la cual se basa la recta de

regresión poblacional, se puede desarrollar el concepto de
función de regresión muestral.
L contraparte
La t t muestral
t l de
d (1) puede
d escribirse
ibi como
  
Yi  1   2 X i Es la contraparte de

Yi  estimador de E(Y/X) E (Y / X i )  1   2 X i
Donde

1  estimador de 1

 2  estimador de  2
Un estimador, conocido también como estadístico (muestral) es
simplemente una regla, o método que dice cómo estimar el
parámetro poblacional a partir de la información suministrada
por la muestra disponible. Un valor numérico particular obtenido
por el estimador en una aplicación es conocido como estimado.
248
124
21/04/2013

en su forma estocástica
La FRM en su forma estocástica se puede expresar como
  
Yi  1   2 X i   i (8)

Donde  i denota el término residual (muestral)
Conceptualmente es análogo a ui y puede ser considerado
como un estimado de ui
El objetivo principal en el análisis de regresión

es estimar la FRP
Yi  1   2 X i   i
  
Con base en la FRM Y 
i 1   2 X i   i
249
Rectas de regresión muestral y poblacional
Debido a fluctuaciones muestrales el estimado de la FRP

basado en FRM es, en el mejor de los casos, una
aproximación.
250
125
21/04/2013
Rectas de regresión muestral y poblacional
Para X=Xi, se tiene una observación muestral Y=Yi. En términos

de la FRM, la Yi observada puede ser expresada como
 
Yi  Yi  i
Y en términos de la FRP, puede ser expresada como
Yi  E (Y / X i )  i
Dado que la FRM es apenas una aproximación de la FRP, ¿se

puede diseñar un método que haga que esta aproximación
sea lo más ajustada posible?
251
Función de regresión simple: problema de

estimación
La tarea consiste en estimar la función de regresión poblacional (FRP) con

base en la función de regresión muestral (FRM) en la forma más precisa
posible.
Los dos métodos de estimación que suelen utilizarse son:
1) Los mínimos cuadrados ordinarios (MCO)
2) La máxima verosimilitud (MV).
El método de MCO es el que más se emplea en el análisis de regresión por

ser en gran medida más intuitivo y matemáticamente más simple.
252
126
21/04/2013
Método de mínimos cuadrados

ordinarios (MCO)
El método MCO se atribuye a Carl Friedrich Gauss un

matemático alemán. Bajo ciertos supuestos el método tiene
algunas propiedades estadísticas muy atractivas que lo han
convertido en uno de los más eficaces y populares del análisis
de regresión.
  
Primero se estima ui  Yi  1   2 X i (9)
que muestra que los residuos son simplemente las diferencias entre los
valores observados y los estimados de Y.
Ahora, dados n pares de observaciones de Y y X, se está interesado en
determinar la FRM de tal manera que esté lo más cerca posible a la Y
observada.
253
Método de mínimos cuadrados ordinarios (MCO)
Con este fin se puede adoptar el siguiente criterio:

seleccionar la FRM de tal manera que la suma de los
 

residuos :  ui    Yi  Y i 
sea la menor posible.
Este criterio, no es muy bueno
porque a todos los residuos se les
da la misma importancia sin
considerar qué tan cerca o qué tan
dispersas estén las observaciones
individuales de la FRM. Debido a lo
anterior, es muy posible que la
suma algebraica de los residuos

sea pequeña (aun cero) a pesar de
u i
que las están bastante dispersas
alrededor de FRM.
254
127
21/04/2013
Valores ajustados y residuos
255
Se puede evitar este problema si se adopta el criterio de

mínimos cuadrados, el cual establece que la FRM puede
determinarse en forma tal que
2 2

 2 
   

 i   i    i 1 2 X i 
u   Y  Y i    Y     (10)
sea la menor posible. Este método da más peso a los residuos

   
tales comou1 y u 4 que a los residuos u 2 y u 3
El procedimiento
di i t ded MCO genera las
l siguientes
i i t ecuaciones
i
para estimar 1 y 2 donde n es el tamaño de la muestra
256
128
21/04/2013
 
 Yi  n  1   2  X i Ecuaciones
normales
 
 Yi X i   1  X i   2  X i2
Resolviendo las ecuaciones normales simultáneamente se
obtiene
2  
 xi yi   Estimadores de
1  Y -  2 X mínimos
x 2
i
cuadrados
257
Modelo clásico de regresión lineal:

supuestos detrás del método MCO
El modelo de Gauss,, modelo clásico o estándar de

regresión lineal (MCRL) el cual es el cimiento de la mayor
parte de la teoría econométrica, plantea 10 supuestos.
Supuesto 1: Modelo de regresión lineal

El modelo de regresión es lineal en los parámetros
Yi  1   2 X i   i modelo simple
Supuesto 2: Los valores de X son fijos en muestreo

repetido.
Significa que el análisis de regresión es un análisis de
regresión condicional, esto es, condicionado a los
valores dados del (los) regresor X.
258
129
21/04/2013
Supuesto 3: El valor medio de la perturbación ui es igual

a cero.
Dado el valor de X
X, el valor esperado del término
aleatorio de perturbación ui es cero.
E (u i / X i )  0
Nótese que el supuesto

E(ui/Xi)=0 implica que
E (Y / X i )  1   2 X i
259
Supuesto 4: Homocedasticidad o igual varianza de ui.

Dado el valor de X, la varianza de ui es la misma para todas las
observaciones, es decir, las varianzas condicionales de ui son
idénticas
idénticas. var((uii / Xi )   2
Homocedasticidad Heterocedasticidad
260
130
21/04/2013
Supuesto 5: No existe auto correlación entre las

perturbaciones.
Dados dos valores cualquiera de X, Xi y Xj , la correlación
entre dos ui y uj es cero. cov(ui, uj / Xi, X j )0
261
Supuesto 6: La covarianza entre ui y Xi es cero o E(uiXi)=0
cov((uii , X i )  0
Supuesto 7: El número de observaciones n debe ser mayor
que el número de parámetros por estimar.
Supuesto 8: Variabilidad en los valores de X.

No todos los valores de X en una muestra dada deben ser
iguales.
ar( X )  0
var(
Recordar que la varianza muestral de X es
 X 
2
i X
var( X ) 
n 1 262
131
21/04/2013
Supuesto 9: El modelo de regresión está correctamente

especificado.
Supuesto 10:No hay multicolinealidad perfecta.

No hay relaciones perfectamente lineales entre las variables
explicativas.
263
Precisión o errores estándar de los mínimos

cuadrados estimados
Lo que se requiere es alguna medida de “confiabilidad” o

 
 y 
precisión de los estimadores
p
1 2
. En estadística la
precisión de un valor estimado es medida por su error estándar
(ee). Los errores estándar de los MCO estimados pueden
obtenerse de la siguiente manera
 2
  
var( 2 )  ee(  2 )  (11)
x 2
i x 2
i
Nota: El error estándar es la desviación estándar de la

distribución muestral del estimador, y la distribución muestral
es una distribución del conjunto de valores del estimador
obtenidos de todas las muestras posibles de igual tamaño de
una población dada. 264
132
21/04/2013
Precisión o errores estándar de los mínimos

cuadrados estimados
Nota: 2 es estimada mediante la fórmula
 Suma de residuos al

 2  ui2 cuadrado (SRC)
(12)
n2 Número de grados

de libertad

Donde  2 es el estimador de MCO de la verdadera 2
.
El término número de grados de libertad significa el
número total de observaciones n menos el número de
restricciones puestas en ellas.
265
Error estándar de la regresión


  ui2 (13)
n2
Es la desviación estándar de los valores de Y alrededor de la recta de

regresión estimada, la cual es utilizada como una medida resumen de la
bondad del ajuste de dicha recta
266
133
21/04/2013
Propiedades de los estimadores de mínimos cuadrados: Teorema de Gauss-

Markov
Dados los supuestos del modelo de regresión lineal clásica, los

estimativos de mínimos cuadrados poseen propiedades ideales u
ó
óptimas, las cuales se encuentran resumidas en el teorema de Gauss
G
Markov

Un estimador  2 de MCO es el mejor estimador lineal insesgado (MELI)
de 2 si:
1. Es lineal, es decir, una función lineal de una variable aleatoria tal como
la variable dependiente Y en el modelo de regresión.
267
Propiedades de los estimadores de mínimos cuadrados: Teorema de Gauss-

Markov

2. Es insesgado, es decir, su valor promedio o esperado, E ( es
2)
igual al
valor verdadero, 
E ( 2 )   2
3. Tiene varianza mínima entre la clase de todos los estimadores lineales
insesgados; a un estimador insesgado con varianza mínima se le conoce
como estimador eficiente
268
134
21/04/2013
Teorema de Gauss-Markov
En el contexto del análisis de regresión

g se puede
p demostrar
que los estimadores de MCO son MELI
Teorema de Gauss-Markov: Dados los supuestos del modelo clásico

de regresión lineal, los estimadores de mínimos cuadrados, en la
clase de estimadores lineales insesgados, tienen varianza mínima; es
decir son MELI
269
Coeficiente de determinación r2
Una medida de la bondad del ajuste
La cantidad r2 se conoce como coeficiente de determinación

(muestral) y es la medida más frecuente utilizada de la bondad del
ajuste de una recta de regresión.
Mide la proporción o el porcentaje de la variación total en Y explicada por

el modelo de regresión
270
135
21/04/2013
Para calcular r2 , para cada i se escribe:
 
y i  yi   i
Elevando la expresión al cuadrado en ambos
lados y sumando sobre la muestra, se obtiene
(14)
puesto que  yˆi uˆi  0 y yˆ i  ˆ2 xi
271
Las diversas sumas de cuadrados que aparecen en la expresión

anterior pueden describirse de la manera siguiente
 yi   Yi  Y 
2 2
(STC)
variación total de los valores reales de y con respecto a su media

muestral, los cuales pueden ser llamados suma total de
cuadrados (STC)
 2
 2
 
 yˆ 2   Yˆ  Yˆ   Yˆ  Y  ˆ 2  x 2
i i
(SEC)
2 i
variación de los valores Y estimados alrededor de su media Yˆ  Y 

que apropiadamente puede llamarse la suma de los cuadrados
debida a la regresión [es decir, debida a la(s) variable(s)
explicativa(s)], o explicada por ésta, o simplemente la suma
explicada de cuadrados (SEC). 272
136
21/04/2013
la variación residual o no
 uˆ i
2 (SRC) explicada de los valores de Y
alrededor de la recta de
Así, (14) es
regresión, o simplemente la
suma de residuos al cuadrado
STC = SEC + SRC (SRC).
273
muestra que la variación total

en los valores Y observados STC = SEC + SRC
alrededor del valor de su
media puede ser dividida en
dos partes, una atribuible a la
recta de regresión y la otra a
fuerzas aleatorias, puesto que
no todas las observaciones Y
caen sobre la recta ajustada.
Ahora dividiendo por la STS
en ambos lados,
lados se obtiene
2
 
Ahora, se define r2 como  Y i  Y 
   SEC
r 
2

 Yi  Y STC
2

274
137
21/04/2013
O en forma alterna
2
u
Coeficiente de
i SRC (15) determinación
r  1
2
 1
 Y  STC
2
i Y
La cantidad r2 así definida se conoce como el coeficiente

de determinación (muestral) y es la medida más
frecuentemente utilizada de la bondad del ajuste de una
recta
t dde regresión
ió
r2 mide la proporción o el porcentaje de la variación total
en Y explicada por el modelo de regresión.
275
Coeficiente de correlación muestral
Una cantidad estrechamente relacionada con r 2 pero

conceptualmente muy diferente de ésta es el coeficiente de
correlación el cual
correlación, cual, es una medida del grado de asociación
entre dos variables. Puede ser calculado a partir de

r r2
O a partir de su definición
r
xy  i i n  xi y i   x  y 
i i
 x  y 
i
2
i
2
n  x i
2
  x  n  y   y  
i
2
i
2
i
2
(16)
276
138
21/04/2013
Propiedades de r
Puede tener signo positivo o negativo, dependiendo del signo

del término en el numerador de (16), el cual mide la covariación
muestral de dos variables.
Cae entre los límites de -1 y 1
Es simétrico por naturaleza; es decir, el coeficiente de
correlación entre X y Y (rxy) es el mismo que entre Y y X (ryx).
 Es independiente del origen y de la escala
 Si X y Y son estadísticamente independientes, el coeficiente
de correlación entre ellos es cero; ppero si r = O, esto no
significa que las dos variables sean independientes. En otras
palabras, una correlación igual a cero no necesariamente
implica independencia.
Es una medida de asociación lineal o dependencia lineal
solamente; su uso en la descripción de relaciones no lineales 277
no tiene significado.
Coeficiente de
correlación muestral
278
139
21/04/2013
Interpretación de la pendiente:
Puesto que el coeficiente de la pendiente es simplemente la tasa

de cambio, se mide en las unidades de la siguientes proporción
unidades de la variable dependiente (Y)

unidades de la variable explicativa (X)
La interpretación del coeficiente de la pendiente 2 es que si X

cambia en una unidad , la Y cambia en promedio en 2 unidades
279
Ejemplo; Gasto de consumo familiar e ingreso familiar
Considerando una muestra de una población donde X

representa ingreso familiar por semana e Y gastos de
consumo familiar por semana, se obtienen los siguientes
cálculos  
1  24,4545 se( 1 )  6,4138
 
Y X
 2  0,5091 se(  2 )  0,0357
70 80
65 100
90 120 r 2  0,9621 r  0,9809
95 140
110 160
115 180
120 200
140 220
Por tanto la línea de regresión estimada es
155 240 
150 260 Yi  24,4545  0,5091X i
280
140
21/04/2013
Resultados en SPSS
Resumen del modelo
R cuadrado Error típ. de la

Modelo R R cuadrado corregida estimación
1 ,981a ,962 ,957 6,493
a. Variables predictoras: (Constante), X
Coeficientesa
Coeficientes
Coeficientes no estandarizad
estandarizados os
Modelo B Error típ. Beta t Sig.
1 (Constante) 24,455 6,414 3,813 ,005
X ,509 ,036 ,981 14,243 ,000
a. Variable dependiente: Y
281
Interpretación:
El valor de   0,5091 que mide la pendiente de la línea, muestra

1
que dentro del rango de la muestra de X comprendido entre $80
y $260 semanales, a medida que X aumenta, digamos en $1, el
aumento estimado en el promedio de gastos de consumo
semanales es de aproximadamente 51 centavos.   24,45 El valor de

1
, el cual corresponde a la intersección de la línea, indica el nivel
promedio de los gastos de consumo semanales cuando el
ingreso semanal es cero.cero No obstante,
obstante esta es una
interpretación mecánica de la intersección. En el análisis de
regresión esta interpretación literal del intercepto no es siempre
significativa, aunque en el ejemplo que estamos considerando
se puede argumentar que una familia sin ingreso alguno( ya sea
por desempleo, despido, etc.) puede mantener algún nivel
mínimo de gastos de consumo, ya sea tomando dinero prestado282
o utilizando sus ahorros.
141
21/04/2013
Sin embargo en general, se debe apelar al sentido común

para interpretar la intersección puesto que es muy común
que el rango que ha tomado la muestra de valores de X no
haya incluido el valor cero como uno de los valores
observados.
Quizá sea mejor interpretar la intersección como el efecto
medio o promedio que tienen todas las variables omitidas del
modelo de regresión sobre el valor de Y. El valor de 0,9621
para r cuadrado significa que cerca del 96% de la variación
en los gastos de consumo semanales se explica por la
variable ingreso; puesto que r cuadrado puede tener un valor
máximo de 1 solamente, el r cuadrado observado sugiere
que la línea de regresión muestral se ajusta muy bien a la
información. El coeficiente de correlación de 0,9809 muestra
que las dos variables, gastos de consumo e ingreso, están
muy positivamente correlacionadas. 283
Ejemplo: Salario y educación
De la población de trabajadores en 1976, sea y = sala, en la que

sala se mide, en dólares por hora. Así, para una persona
cualquiera, si sala = 6.75, el salario por hora es de 6.75 dólares.
Sea x = educ los años de escolaridad; por ejemplo, educ = 12
corresponde a la educación preparatoria completa. Puesto que
el salario promedio de la muestra es de 5.90 dólares, el índice
de precios al consumidor indica que esta suma es equivalente
a 16.64 dólares de 1997.
Con los datos de SALA 1.RAW, en los que n = 526 individuos,
obtenemos la siguiente línea de regresión de MCO (o función
de regresión muestra!):
saˆ la   0.90  0.54 educ.
284
142
21/04/2013
Ejemplo: Salario y educación
Debemos interpretar con cuidado la ecuación. La

intercepción -0.90 significa literalmente que una persona
sin instrucción recibe un salario pronosticado de -90
90
centavos de dólar por hora, lo que, desde luego, es una
tontería. Resulta que ningún miembro de la muestra tiene
menos de ocho años de educación, lo que explica el
pronóstico descabellado de una escolaridad de 0 años.
Para una persona con ocho años de escolaridad, el salario
pronosticado es
saˆla
l = -0.90 + 0.54(8) = 3.42, o 3.42 dólares por hora
(en dólares de 1976).
La estimación de la pendiente implica que un año más
de educación aumenta el salario promedio en 54
centavos de dólar por hora.
285
El supuesto de normalidad:
El modelo clásico de regresión lineal normal
Recordemos q que con los supuestos

p vistos anteriormente los

estimadores de MCO  ,  ,  2
 
satisfacían diferentes
1 2
propiedades estadísticas muy deseables, tales como
insesgamiento y varianza mínima . Si nuestro objetivo es
únicamente la estimación puntual el método de MCO será
suficiente, sin embargo la estimación puntual es sólo la
formulación de un aspecto
p de la inferencia estadística.
Nuestro interés no consiste solamente en estimar la función

muestral de regresión (FRM), sino también en utilizarla para
obtener inferencias respecto a la función de regresión
poblacional (FRP). 286
143
21/04/2013
El supuesto de normalidad: El modelo clásico de regresión lineal normal
La regresión
L ió lineal
li l normall clásica
lá i supone que
cada ui, está normalmente distribuida con
Media : E(ui )  0
E ui  E (ui )  E (ui2 )   2
2
Varianza :
Cov(ui , u j ) :  
E ui  E (ui ) u j  E (u j )   E (ui u j )  0 i  j
Estos supuestos pueden expresarse en forma más compacta como
ui ~ N(0,  2 )
287
El supuesto de normalidad
La regresión lineal normal clásica supone que la

distribución probabílistica de ui es normal.
Consideremos el ejemplo consumo e ingreso.


Yi  24,4545  0,5091X i
Obtuvimos que la PMC estimada es de 0,5091,
correspondiente a una sola estimación puntual de la PMC
de la poblacional desconocida.
¿Qué tan confiable es esta estimación?.
Debido a fluctuaciones muestrales,
muestrales es posible que una
sola estimación difiera del valor verdadero, aunque en un
muestreo repetido se espera que su valor medio sea igual
al valor verdadero

E ( 2 )   2
288
144
21/04/2013
Estimación de intervalos
Ahora, en estadística, la confiabilidad de un estimador puntual se

mide por su error estándar. Por consiguiente, en lugar de
depender de un solo estimador puntual, se puede construir un
intervalos alrededor del estimador puntual, por ejemplo, dentro
de dos o tres errores estándar a cada lado del estimador puntual,
tal que este intervalo tenga, digamos, 95% de probabilidad de
incluir el verdadero valor del parámetro. Esta es la idea básica
de la estimación de intervalos.
289
Estimación de intervalos
Consideremos el ejemplo hipotético consumo-ingreso. La

ecuación
ió 
Yi  24,4545  0,5091X i
muestra que la propensión marginal a consumir (PMC) estimada

es 0,5091, la cual constituye una única estimación (puntual) de la
PMC poblacional desconocida 2 que es un (punto) estimado de
la población desconocida PMC 2 .
¿Qué tan confiable es esta estimación?

Debido a las fluctuaciones muestrales, es probable que una sola
estimación difiera del valor verdadero, aunque en un muestreo

repetido se espera que el valor de su media sea igual al valor
E ( 2 )   2
verdadero (Nota: )
290
145
21/04/2013
Ahora, en estadística, la confiabilidad de un estimador puntual

se mide por su error estándar. Por consiguiente, en lugar de
depender de un solo estimador puntual, se puede construir un
i t
intervalo
l alrededor
l d d del
d l estimador
ti d puntual,
t l por ejemplo,
j l dentro
d t de d
dos o tres errores estándar a cada lado del estimador puntual, tal
que este intervalo tenga, digamos, 95% de probabilidad de
incluir el verdadero valor del parámetro. Ésta es, a grandes
rasgos, la idea básica de la estimación de intervalos.
Para ser más específico, supóngase que se desea encontrar qué

tan" cerca" está por ejemplo,
 de 
2 2
Con este fin, tratamos de encontrar dos números positivos,  y

, este último situado entre 0 y 1, tal que la probabilidad de que
  aleatorio

 contenga el verdadero 2 sea 1
 2 -  , 2 -  
el intervalo
 
- .
291
Simbólicamente
  

Pr   2 -    2   2     1  
 
Tal intervalo, si existe, se conoce como intervalo de
confianza;
a 1 -  se le denomina coeficiente de confianza; y  (0 <  <
1) se conoce como el nivel de significancia.
Los puntos extremos del intervalo de confianza se conocen
 
 2 -  de confianza (también denominados
como límites  2  valores
críticos) siendo
críticos), el límite de confianza inferior y
el límite de confianza superior.
Obsérvese que en la práctica  y 1 -  son expresados
frecuentemente en forma porcentual como 100 y 100(1 -
)%.
292
146
21/04/2013
Intervalos de confianza para los coeficientes de regresión 1 y

2
Intervalo de confianza de 100(1-) por ciento para 

 

 - t /2 se(  )
Al regresar a nuestro ejemplo ilustrativo de consumo e

ingreso encontramos que
 
 2  0,5091 se(  2 )  0,0357
Si suponemos que que  =5%, es decir un coeficiente de

confianza del 95% entonces la tabla t muestra que para 8 gl,
t 0,025  2.306
el t crítico es
293

2
Al sustituir esos valores se obtiene que el intervalo de

confianza del 95% para 2 es el siguiente:
0,4268   2  0,5914
La interpretación de este intervalo de confianza es: dado un

coeficiente de confianza del 95%, a largo plazo, en 95 de cada
cien casos, intervalos como (0,4268 ; 0,5914) contendrán el
verdadero 2 .
Como se advirtió antes, obsérvese que no se puede decir que la
probabilidad de que el intervalo específico (0,4268 ; 0,5914)
contenga el verdadero 2 . de 95% porque este intervalo es ahora
fijo y no aleatorio;por consiguiente 2 se encontrará o no dentro
de él.
294
147
21/04/2013

2
Para el ejemplo consumo-ingreso, el intervalo de confianza

para 1 al 95% es:
9,6643  1  39,2448
Utilizando
 

 - t /2 se(  )
Se tiene
24,4545 - 2,306(6,41 38)
Se debe ser cauteloso al interpretar el intervalo de confianza

( 9,6643; 39,2448). A largo plazo, en 95 de cada 100 casos,
intervalos como ( 9,6643; 39,2448) contendrán el verdadero 1; la
probabilidad de que este intervalo fijo incluya el verdadero 1 es 1 o
0
295
Prueba de hipótesis. Prueba t
La idea fundamental detrás de las pruebas de significancia

consiste en utilizar un estadístico de prueba ( estimador).
Bajo el supuesto de normalidad la variable

1  1
t 

se(  1 )
sigue la distribución t con N-2 grados de libertad. Si el valor

verdadero de 1 se especifica en la hipótesis nula, el valor t
puede calcularse fácilmente a partir de la muestra disponible,
pudiendo servir por tanto como estadístico de prueba
296
148
21/04/2013
Consideremos nuevamente el ejemplo de

consumo -ingreso.

Sabemos que

1  0,5091 se(( 1 )  0,0357
Si Ho: 1=0,3 y H1: 10,3
0,5091  0,3
t  5,86
0,0357
Si   5%, , , gl  8 entonces t 0 , 025  2.306
luego el t calculado es mayor al t de tabla y por lo tanto se rechaza la hipótesis nula
El procedimiento
di i t anterior
t i se denomina
d i prueba b t.
t En
E ell
lenguaje de pruebas de significancia, se dice que un
estadístico es estadísticamente significativo si el valor del
estadístico de prueba se encuentra en la región crítica. En
nuestro ejemplo, el estadístico t es significativo y
procedemos a rechazar la hipótesis nula.
297
Aplicación problema de predicción
Con base en los datos muestrales, se obtuvo la

siguiente regresión muestral.

Yi  24,4545  0,5091X i
Donde Ŷt es el estimador del verdaderoE (Y i )
correspondiente a X dada. ¿Qué uso se puede dar a esta
regresión histórica? Uno es “predecir” o “pronosticar” el
gasto de consumo futuro Y correspondiente a algún nivel
dado de ingreso X.
Ahora hay dos clases de predicciones:
Ahora,
1) la predicción del valor de la media condicional de Y
correspondiente a un valor escogido X, por ejemplo, que es
X0
el punto sobre la recta de regresión poblacional misma, y
2) predicción de un valor individual Y correspondiente a .
Se llamarán estas dos predicciones de predicción media y 298
la predicción individual.
149
21/04/2013

Supóngase que Xo = 100 y se desea predecir
E(Y
( I Xo = 100).
) Ahora, puede
p demostrarse que
q la regresión
g
histórica Y  24,4545  0,5091X
i i
proporciona la estimación
   puntual de esta predicción media de
la siguiente forma: Y0   1   2 X 0
 24.4545  0.5091(100)  75.3645

Donde Y0 = estimador de E(Y I Xo).
Xo) Puede demostrarse que
este predictor puntual es el mejor estimador lineal e insesgado
(MELI). 
Y0
Puesto que es un estimador, es probable que éste sea
diferente de su verdadero valor. La diferencia entre los dos
valores dará alguna idea sobre el error de predicción o de 299
pronóstico.
se demuestra que en la ecuación  

Y0   1   2 X 0

Y0 está normalmente distribuida con media 1   2 X 0 y con
1 X  X 
una varianza
i dada
d d por la
l siguiente
i i t fórmula:
fó  l  2

var(Y0 )   2   0 2 
n
 x
i


Al reemplazar 2 desconocida por su estimador insesgado
se cumple que la variable 
Y 0  1   2 X 0 
t 
ee(Y 0 )
sigue una distribución t con n - 2 g de l. La distribución t
puede
d ser utilizada
tili d por consiguiente
i i t para construir t i
intervalos de confianza para el verdadero E(Yo I Xo) y
para hacer pruebas de hipótesis acerca de tal valor de la
manera usual, a saber,
   
  1   2 X 0  - t / 2 ee(Y 0 )
 
300
150
21/04/2013
Para los datos del ejemplo

  1 100  1702 
var(Y0 )  42.159    10.4759
10 33000 

y ee(Y0 )  3.2366
Por consiguiente, el intervalo de confianza al 95% para el

verdadero E (Y / X 0 )  1   2 X 0
es 67.9010  E (Y / X  100)  82.8381
Por tanto, dada X0 =100, en muestreo repetido, en 95 de cada

100 intervalos como el anterior estará incluido el verdadero
valor medio; la mejor estimación del verdadero valor medio es,
por supuesto, la estimación puntual 75.3645
301
Predicción individual
Si nuestro interés está en predecir un valor individual Y, Y0

correspondiente a un valor dado X, digamos X0, entonces el
mejor estimador
  lineal
 insesgado de Y0 está dado también por
Y0   1   2 X 0 (17)
 24.4545  0.5091(100)  75.3645
Pero su varianza es la siguiente
  
 1 X X
var(Y0  Y 0 )  E (Y0  Y 0 ) 2   2 1   0 2
 
2
(18)
 n
  xi 

Puede demostrarse además que Y0 también sigue una
distribución normal

con media y varianza dadas por (17) y (18),

respectivamente.2 Sustituyendo  2desconocida por se
cumple que 
Y0  Y0
t  también sigue una distribución t
ee(Y0  Y0 )
302
151
21/04/2013
Por consiguiente, la distribución t puede utilizarse para hacer

inferencia sobre la verdadera Yo. Al continuar con nuestro
ejemplo consumo
consumo-ingreso,
ingreso, se ve que la predicción puntual de

Yo es 75.3645, igual
Y0 a y su varianza es 52.6349. Por
consiguiente, el intervalo de confianza al 95% para Yo
correspondiente a Xo =100 es
(58.6345  Y0 / X 0  100)  92.0945)
Comparando este intervalo con

67.9010  E (Y / X  100)  82.8381
Se ve que el intervalo de confianza para el Y0 individual es

más amplio que el intervalo para el valor medio de Y0
303
Intervalos de confianza para Y media y para valores individuales de Y
304
152
21/04/2013
Formas funcionales de los modelos

de regresión
Consideremos algunos modelos de regresión que pueden ser no lineales en

l variables
las i bl pero que son lineales
li l en los
l parámetros
á t o que pueden
d serIo
I
mediante transformaciones apropiadas de las variables.
En particular, consideremos los modelos de regresión:

1. El modelo log-lineal
2. Modelos semilogarítmicos
305
Cómo medir la elasticidad: Modelo Log-Lineal
Considérese el siguiente modelo, conocido como el

modelo de regresión exponencial:
Yi  1 X i 2 e i
El cual puede ser expresado alternativamente
ln Yi  ln β1  β2 ln X i  μi
Si escribimos como
ln Yi    β2 ln X i  μi
Donde   y β2
 ln β1 este modelo es lineal en los parámetros
y lineal en los logaritmos de las variables Y y X y puede ser
estimado por regresión MCO
306
153
21/04/2013
Cómo medir la elasticidad: Modelo Log-Lineal
Una característica importante del modelo log-Iog, que lo ha hecho muy

popular en el trabajo empírico, es que el coeficiente de la pendiente 2
mide la elasticidad de Y con respecto a X, es decir, el cambio porcentual en
Y ante un pequeño cambio porcentual en X dado. Así, si Yrepresenta la
cantidad demandada de un bien y X su precio unitario, 2 mide la
elasticidad-precio de la demanda, un parámetro de gran interés en
economía.
307
Modelo de elasticidad constante
Si la relación entre la cantidad demandada y el precio es

como se muestra en la figura (a ) la transformación doble-
Iog presentada en la figura ( b) dará entonces la estimación
de la elasticidad-precio (-2 ) lnY
ntidad demandada
Y  2 i
Yi  1 X i e
d demandada
ln Y  ln β1  β2 ln X i
Cantidad
ln de can
lnX
Precio X Ln del Precio
308
154
21/04/2013
Ejemplo
Gasto en bienes duraderos respecto al gasto de consumo personal total
Consideremos datos sobre el gasto de consumo personal

total (GCPERT), el gasto en bienes duraderos (GASBD), el
gasto en bienes perecederos (GASBPER) y el gasto en
servicios (GASERV), todos medidos en millones de dólares de
1992.
(tabla 6.3-Anexo 1)
Su póngase que se desea calcular la elasticidad del gasto en

bienes durables respecto al gasto de consumo personal total.
Al graficar el logaritmo del gasto en bienes durables en
comparación con el logaritmo del gasto de consumo personal
total, se observará que la relación entre las dos variables es
lineal. Por tanto, el modelo del doble logaritmo podría resultar
adecuado. Los resultados de la regresión son: 309
In GASBD = -9.6971 + 1.9056 In GCPERT,

ee = (0.4341) (0.0514)
t = (-22.3370)* (37.0962)* r² = 0.9849
donde * indica que el valor p es extremadamente pequeño.
Todos estos resultados muestran que la elasticidad de GASBD

respecto a GCPERT es de casi 1.90, lo que sugiere que si el
gasto personal total aumenta 1 %, en promedio, el gasto en
bienes duraderos se incrementa casi 1.90%. En consecuencia,
el g
gasto en bienes duraderos es muyy sensible a los cambios en
el gasto de consumo personal. Ésta es una razón por la que los
productores de bienes duraderos siguen muy de cerca los
cambios en el ingreso personal y el gasto de consumo
personal.
310
155
21/04/2013
Ejemplo: Salario y ventas
Podemos estimar un modelo de elasticidad constante que

relacione el salario del director ejecutivo con las ventas de la
empresa. Sea vtas las ventas anuales de la compañía, medidas
en millones de dólares.
dólares Un modelo de elasticidad constante es
ln sala    0   1 ln vtas   u
en el que es la elasticidad de sala en relación con vtas. Este
modelo se encuentra entre los de regresión simple, al definir la
variable dependiente como y = log(sala) y la independiente
como
x = log(vtas). La estimación de esta ecuación mediante MCO da
l saˆla
ln l   4.822  0.257
2 lnl vtas 
n  209, R 2  0.211.
El coeficiente de ln(vtas) es la elasticidad estimada de sala
con respecto a vtas. Implica que un incremento de uno por
ciento en las ventas de la compañía aumenta el salario del
director ejecutivo en alrededor de 0.257 por ciento, que es la
interpretación usual de elasticidad. 311
Ejemplo de regresiones lineales:
El gerente de ventas de una compañía se está preparando para una reunión

de ventas, y le gustaría mostrar al grupo de vendedores la forma como se
relaciona el número de llamadas a clientes con el valor anual de pedidos que
se reciben. De sus registros recolectó la siguiente información muestral para
el últimoNúmero
año. de llamadas Pedidos (miles de dólares) Número de llamadas Pedidos (miles de dólares)
5 4,8 2 2,2
4 6,1 4 7,1
6 12,3 4 8,7
7 13,7 8 13,7
8 15,7 1 2,3
1 2,2 3 4,6
3 7,3 9 16,7
4 5,8 3 6,1
1 1,9 4 7,5
3 6,7 8 15,1
A partir de estos datos muestrales:

a) Realice un gráfico de dispersión.
b) Determine el coeficiente de correlación.
c) Desarrolle una ecuación de regresión para predecir el valor de pedidos a
partir del número de llamadas.
d) Cuál es el valor de pronóstico de pedidos si se realizan cinco llamadas?
156
21/04/2013
Solución
p
18
16
14
12
s de dólares)
10
6
Pedidos (miles
0
0 2 4 6 8 10
Número de llamadas
313
Coeficiente de correlación r = 0,956

b) Nivel de significancia s = 0,000
La correlación es significante al nivel 0,01
c) 
Y  a  bX
Número de pedidos  0,105  1,85 (llamadas )
d) 
Y  a  bX
Número de pedidos  0,105  1,85 (5)  9,145
Notar que el coeficiente de determinación es 0,915, indicando que

aproximadamente 91,5% de la variación en los pedidos se explica por los
números de llamadas.
157
21/04/2013
Ejemplo:
¿Cuál es la relación entre la cantidad gastada por semana en alimentos y el

tamaño de una familia? ¿Las familias grandes gastan más en alimentos?
Una muestra de 10 familias en una ciudad reveló los siguientes tamaños de
familia e importes en dinero gastados en alimentos, en cierto periodo.
Tamaño Cantidad gastada

de la familia en alimentos
3 99
6 104
a) Determine la ecuación de regresión. 5 151
b)) Obtenga
g el error estándar de la 6 129
estimación. 6 142
c) Estime la cantidad de dinero que una 3 111
4 74
familia de cuatro personas gastará en
4 91
alimentos.
5 119
3 91
Solución:
a) 
Y  a  bX
Cantidad gastada  60.4  11,3 (tamaño)

b)
S Y,X 
 (Y  Y )  3467,2
 20,818
n2 8
c) Cantidad gastada = 60,4+11,3 (4)=105,6
Obs: En este ejemplo el coeficiente de correlación es r=0,589 y s=0,037. La

correlación es significativa al nivel 0,05.
158
21/04/2013
Consideraciones de base para la regresión lineal
1 Para cada valor de X existe un grupo de valores de Y

1. Y, y estos
valores se distribuyen en forma normal.
2. Las medias de estas distribuciones normales de valores Y se
encuentran todas en la línea de regresión.
3. Las desviaciones estándares de dichas distribuciones normales
son iguales.
4. Los valores Y son estadísticamente independientes. Esto
significa que al seleccionar una muestra, los valores Y
seleccionados para un valor de X específico no dependen de los
valores Y para cualquier otro valor X.
Análisis de correlación y regresión lineal
Representación gráfica de las consideraciones básicas

de la regresión
Cada una de estas distribuciones
1. Es normal
2. Tiene la misma desviación
Y estándar estimada por S y x
Una desviación
} estándar
Una desviación
}estándar
Recta de
regresión Las tres medias quedan
en la recta de regresión
X
X1 X2 X3
159

Trabajo Grupal 1 - Geoestaditisca Avanzada

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Trabajo Grupal 1 - Geoestaditisca Avanzada

Enviado por

Direitos autorais:

Formatos disponíveis

21/04/2013

Profesora: Sara Arancibia C

ntroducción a la Estadística Descriptiva

¿Quién utiliza la Estadística?

Las técnicas estadísticas se aplican de manera amplia en

ntroducción a la Estadística Descriptiva

Estadística descriptiva: Procedimientos estadísticos que sirven para

Estadística inferencial: Procedimientos estadísticos que sirven para

Para deducir algo acerca de una población, por lo

Muestra: Una porción, o parte de una población de interés.

Tipos y ejemplos de variables

Cualitativos o de atributo Cuantitativos o numéricos

Nivel de Medición Nominal:

En este nivel se tienen dos o más categorías del ítem o

Por ejemplo la variable sexo de la persona tiene sólo dos

Ninguna tiene mayor jerarquía que la otra, las categorías

Si le asignamos una etiqueta o símbolo a cada categoría, esto identifica

Si usamos números por ejemplo;

Otros ejemplos: tipo de escuela a la que asiste ( privada-pública),

NOTA: Las categorías son los niveles donde serán

OBS: las categorías se consideran como mutuamente

Mutuamente excluyente: Una persona, objeto o medición

Exhaustiva: Cada individuo, objeto, o medición debe

Nivel de medición ordinal

Calificación de estudiantes o personal diverso:

Calificaciones Número de personas

Nivel de medición por Intervalos

Las puntuaciones en un cierto examen y las calificaciones en

Nivel de medición de razón

Ejemplos de estas mediciones sería la exposición a la

Desde luego hay variables que pueden medirse en más

Nivel de medición Categorías

1.-Resumen de datos: distribuciones de frecuencias y

¿Cómo pueden describirse estos datos?

Describiendo la distribución de las puntuaciones o

Una distribución de frecuencias es un conjunto de

¿Qué otros elementos contiene una distribución de

Las distribuciones de frecuencias pueden completarse

Categorías Códigos Frecuencias Frecuencias Frecuencias Frecuencias

Pueden presentarse con los elementos más informativos para el lector y

Ejemplo: ¿ Se ha obtenido la cooperación del personal para el proyecto

Si se ha obtenido la cooperación 91 74,6

Comentario: Prácticamente tres cuartas partes de las organizaciones si han

Representación gráfica de una distribución de frecuencia

Un histograma describe una distribución de frecuencias utilizando una

El polígono de frecuencias consiste en una línea poligonal formada por segmentos

Un polígono de frecuencias acumuladas (ojiva) se utiliza cuando se desea

Polígono de frecuencias acumuladas

Se encontró que los refrigeradores que no fueron aprobados en la

Diagrama de Pareto de : Defectos

Supongamos que se recolecta información sobre el número

Número de vuelos por año

También se podría mostrar la información en cada celda

2.- Descripción de los datos: Medidas de tendencia central

Las medidas de tendencia central, que por lo

Media de una muestra:

El ingreso anual (en dólares) de una muestra de varios empleados en una

La Mediana:(Median) es el valor céntrico en un conjunto de valores

Supóngase que intenta adquirir una casa en un condominio de la comuna de La

La moda: (mode): Valor de la observación que aparece con más frecuencia.

•La moda es útil en especial al describir los niveles nominal y ordinal de

Una empresa ha desarrollado cinco lociones para baño. En el diagrama se

Número de entrevistados acerca de lociones