Você está na página 1de 16

2017

Curso de: INFERENCIA ESTADÍSTICA

UNIDAD 4: ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Autor: Sergio Samuel Nieves Vanegas

UNIVERSIDAD AUTÓNOMA DEL CARIBE | Barranquilla, Colombia |2017


Contenido Unidad 4

4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA ...........................................................3


4.1. CONCEPTOS BÁSICOS ..................................................................................................4
4.1.1. Propiedades de lo Estimadores ....................................................................................4
4.1.2. Estimación por Intervalos de Confianza ........................................................................4
4.2. INTERVALO DE CONFIANZA PARA MEDIAS ................................................................6
4.3. INTERVALO DE CONFIANZA PARA PROPORCIONES .................................................9
4.4. INTERVALO DE CONFIANZA PARA DOS POBLACIONES .......................................... 11
4.5. INTERVALO DE CONFIANZA PARA DIFERENCIAS DE MEDIAS ................................ 11
4.6. INTERVALO DE CONFIANZA PARA DIFERENCIAS DE PROPORCIONES................. 13
Unidad 4

4. ESTIMACIÓN POR INTERVALOS DE CONFIANZA

Generalmente cuando se trabaja con un conjunto de datos se desea obtener la mayor

información de los mismos, pero en ocasiones esa información está sobrevalorada o no

es del todo confiable, es aquí donde juega un papel importante la estimación, estimar es

conocer los verdaderos valores de un parámetro, por ejemplo las opiniones de un grupo

de consumidores sobre cierto producto, la proporción de piezas defectuosas producidas

por cierta máquina, el porcentaje de accidentes laborales en una empresa, los salarios

medios de los egresados de una universidad, todos estos ejemplos permiten conocer las

característica puntuales que se desean estudiar y la estimación a través de ciertos

métodos conducen a esas inferencias.

Los intervalos de confianza es uno de los métodos empleaos para estimar valores

poblaciones, los cuales permiten establecer unos límites inferior y superior donde se

encuentran dichos valores con un grado o nivel de confianza, lo que conduce a tener un

grado de certeza de que los valores calculados siempre estén dentro de esos rangos,

con base en los mismos principios de su obtención.

Finalmente es importante tener presente que la estimación en los negocios es

fundamental para la toma de decisiones, puesto pone de manifiesto el análisis puntual

de las características a estudiar y genera la mejor aproximación de los resultados de toda

una población, con base en el estudio de una muestra representativa, lo cual garantiza

conclusiones coherentes y basadas en análisis exhaustivos y serios.


4.1. CONCEPTOS BÁSICOS

Estimar es conocer los verdaderos valores de un parámetro, a partir de un estadístico


Estimador: Es una medida representativa de la muestra
Parámetro: Es una medida que caracteriza a la población y se emplea para estimar o
conocer el parámetro.
Inferencia Estadística: Es el procedimiento que permite establecer generalizaciones
de una población a partir de una muestra representativa

4.1.1. Propiedades de lo Estimadores

Todo estimador es deseable que cumpla con las siguientes propiedades.

1. Insesgadez: Es cuando el estimador es igual al parámetro


2. Consistencia: A medida que el tamaño de la muestra aumenta el estimador se
hace igual al parámetro
3. Eficiencia: si se tiene varios estimadores de una población, el estimador con
menor varianza será el más eficiente
4. Suficiencia: Cuando no depende del parámetro que se dese estimar, es decir
que se aprovecha toda la información muestral que este aporta.

4.1.2. Estimación por Intervalos de Confianza

Un intervalo de confianza (I.C) es método de estimación que permite encontrar los


verdaderos valores de un parámetro

(𝜃̂𝑖 < 𝜃 < 𝜃̂𝑓 ) = (1 − 𝛼)100%

Donde:

𝜃̂𝑖 : Límite inferior

𝜃̂𝑠 : Límite superior


(1 − 𝛼): Nivel de confianza

𝛼 : Nivel de significancia

𝜃 : Parámetro

Nivel de confianza (N.C): es la máxima probabilidad de encontrar los verdaderos

valores del parámetro, cuando no lo asignan, se debe asumir que es del 95%, los

valores más usuales son: 90%; 95%; 98% y 99%.

Para cada nivel de confianza existe un valor de 𝑍𝜎 (solo cuando se trabaja con la
2

distribución normal Z), el cual se encuentra en la tabla de distribución normal, cabe

resaltar que estos valores son constantes para cada nivel de confianza.

En la siguiente tabla se muestran los valores de 𝑍𝜎 para cada nivel de confianza


2

NIVEL DE CONFIANZA VALOR DE 𝒁𝝈 RESULTADO


𝟐

90% 1.645 Poco significativo

95% 1.96 Significativo

98% 2.33

99% 2.575 Altamente significativo

Cabe resaltar que estos valores no se emplean cuando la distribución seleccionada

es la distribución T Student, esto valores deben buscarse en la tabla T

Error de estimación: es la diferencia entre el estimador y el parámetro, el error de

estimación NO es lo que resta del N.C del 100%.


4.2. INTERVALO DE CONFIANZA PARA MEDIAS

En este caso se establecen los valores en que se encuentra la media poblacional de un

conjunto de datos, se debe tener presente las características de la población, tamaño de

la muestra, varianza poblacional y distribución empleada para seleccionar correctamente

la fórmula ideal a cada situación, de esta forma se calcula el intervalo deseado.

Ejemplos:

1. Los salarios de los empleados de la empresa Acme están distribuidos

normalmente con una desviación de 150 mil pesos, se selecciona una muestra de

25 empleados , cuyo salario medio es de 850 mil pesos , se desea construir un

intervalo de confianza para estimar el salario medio poblacional con el fin de

realizar una revisión a los incentivos económicos.

Solución:

Este es claramente un intervalo de confianza para medias, la población es normal, la

varianza poblacional es conocida (se conoce σ), el tamaño de la muestra es 25 (muestra

pequeñas), para este caso no importa el tamaño muestral, puesto la fórmula a emplear

es la número 1, en la tabla 1.

Datos:

𝑥̅ = 850

σ= 150

n= 25

N.C: como no lo establece el problema se asume que es del 95%

𝑍𝜎 = 1.96
2
La fórmula a emplear es:

𝜎 𝜎
(𝑥̅ − 𝑍𝜎 ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝜎 ) = (1 − 𝛼)100%
2 √𝑛 2 √𝑛

Reemplazando se obtiene que:

150 150
(850 − 1.96 ≤ 𝜇 ≤ 850 + 1.96 ) = 95%
√25 √25

(850 − 58.8 ≤ 𝜇 ≤ 850 + 58.8) = 95%

(791.2 ≤ 𝜇 ≤ 908.8) = 95%

Esto indica que los ingresos mensuales de todos los empleados de la empresa Acme

oscilan o se encuentran entre $791200 y $908800 con un nivel de confianza del 95%.

El error estándar es:


𝜎
𝑒 = 𝑍𝜎
2 √𝑛

150
= 1.96
√25

𝑒 = 58.8

El error estándar está en las mismas unidades de los datos originales, es así como el

error estándar es de $58.800.

2. Los siguientes datos corresponden al número de quejas y/o reclamos que recibe

cierta compañía de telecomunicaciones en un mes cualquiera, la gerencia desea

estimar un intervalo de confianza para conocer el número de quejas que recoge


la empresa, para de esta forma establecer políticas respecto a dichos reclamos,

suponga que los datos son normales, con un nivel de confianza del 99%.

5 4 3 5 4 1
10 8 4 3 6 4
2 5 4 6 8 4
2 3 7 8 9 4
5 6 4 8 9 10

Solución:

Este es claramente un intervalo de confianza para medias, la población es normal, la

varianza poblacional es desconocida el tamaño de la muestra es 25 (muestra pequeñas),

para este caso no importa el tamaño muestral, puesto la fórmula a emplear es la número

1, en la tabla 1.

Datos:

𝑥̅ = 5.37

s= 2.46

n= 30

N.C: 99%

𝑍𝜎 = 2.575
2

La fórmula a emplear es:

𝑠 𝑠
(𝑥̅ − 𝑍𝜎 ≤ 𝜇 ≤ 𝑥̅ + 𝑍𝜎 ) = (1 − 𝛼)100%
2 √ 𝑛 2 √𝑛

Reemplazando se obtiene que:

2.46 2.46
(5.37 − 2.575 ≤ 𝜇 ≤ 5.37 + 2.575 ) = 99%
√30 √30

(5.37 − 1.15 ≤ 𝜇 ≤ 5.37 + 1.15) = 99%


(4.22 ≤ 𝜇 ≤ 6.52) = 99%

Esto indica que el número de quejas que recibe la empresa de telecomunicaciones oscila

entre 4 y 7 quejas aproximadamente, con un nivel de confianza del 99%. De esta forma

la empresa puede trazar políticas y directrices para dar solución oportuna a todas estas

quejas.

4.3. INTERVALO DE CONFIANZA PARA PROPORCIONES

Como se analizó en las distribuciones muestrales de proporción, se debe tener presente

que muchas veces se estudia solo una característica de la muestra o la población, por lo

tanto los intervalos para proporción son ideales para determinar los límites en que se

encuentra dicha característica.

Ejemplo:

1. La división de nuevos productos de cierto banco desean impulsar las

transacciones y demás productos tradicionales del banco a través de las nuevas

tecnologías de la información, por medio de su respectiva aplicación, por lo tanto

desea estimar un intervalo donde se muestre el porcentaje de clientes que utilizan

estos medios no tradicionales, para de esta forma impulsar más este servicio a

todos su clientes, para ello seleccionó una muestra de 1000 clientes , encontrando

que 400 de ellos utilizan la app del banco para sus transacciones.

Solución:
Este es claramente un intervalo de confianza para proporciones, puesto se debe

analizar una característica de la población, la cual es en este caso el porcentaje de

clientes que utilizan la app del banco para sus transacciones comerciales. La fórmula

a emplear es la 2 de la tabla 2.

Datos:

400
𝑝̂ = = 0.4
1000

𝑞̂ = 0.6

n= 100

N.C: 95%

𝑍𝜎 = 1.96
2

La fórmula a emplear es:

𝑝̂𝑞̂ 𝑝̂𝑞̂
(𝑝̂ − 𝑍𝜎 √ 𝑛 ≤ 𝑃 ≤ 𝑝̂ + 𝑍𝜎 √ 𝑛 ) = (1 − 𝛼)100%
2 2

Reemplazando se tiene que:

(0.4)(0.6) (0.4)(0.6)
(0.40 − 1.96√ ≤ 𝑃 ≤ 0.40 + 1.96√ ) = 95%
1000 1000

(0.40 − 0.015≤ 𝑃 ≤ 0.40 + 0.015) = 95%

(0.3845 ≤ 𝑃 ≤ 0.415 ) = 95%


Por lo tanto el I.C muestra que la proporción de todos los clientes del banco que

utilizan canales no tradicionales (app), para realizar sus diferentes transacciones

oscila entre el 38.45% al 41.5%, con un nivel de confianza del 95%, lo que permite a

la división de nuevos productos trazar estrategias para incentivar el uso de estos

nuevos medios bancarios.

4.4. INTERVALO DE CONFIANZA PARA DOS POBLACIONES

Cuando se trabaja con dos poblaciones se desea comparar si existen o no diferencias

entre dichas poblaciones, y el intervalo de diferencias de medias es útil para las mismas,

por ejemplo si se desea saber si existe alguna diferencia entre los métodos contables de

dos compañías, si existe alguna diferencia entre la productividad de los turnos diurnos y

nocturnos, o si hay alguna diferencia entre los salarios de hombres y mujeres, o

porcentajes de clientes con mora y no mora, porcentaje de accidentes de acuerdo al

género, proporción de estudiantes con mejor desempeño de acuerdo a su jornada etc.

Para establecer si existe diferencias entre las dos poblaciones al construir el intervalo se

debe tener presente si éste contiene al cero no existe diferencias entre las dos

poblaciones.

4.5. INTERVALO DE CONFIANZA PARA DIFERENCIAS DE MEDIAS

Ejemplo:

1. Los siguientes datos muestran los salarios medios de hombre y mujeres de una

compañía financiera con estudio de postgrados, la gerencia de talento humano

desea conocer si existe alguna diferencia en cuanto al salario (millones de pesos)


debido al género, o si por el contrario no incide este aspecto, sino su desarrollo

profesional.

GÉNERO ̅
𝒙 n s

HOMBRES 2500 30 180

MUJERES 2300 35 150

Solución:

Este es claramente un intervalo de confianza para la diferencia de medias, la población

es no normal o desconocida, las varianzas poblacionales son desconocidas y no son

iguales, los tamaños muestrales mayor o igual a 30 (muestras grandes), por lo tanto la

fórmula a emplear es la número 2, en la tabla 3.

Datos:

HOMBRES MUJERES

𝑥̅ 1 =2500 𝑥̅ 2 =2300

𝑠1 = 180 𝑠2 = 150

𝑛1 =30 𝑛2 =35

N.C: 95%

𝑍𝜎 = 1.96
2

La fórmula a emplear es:

𝑠1 𝑠2 𝑠1 𝑠2
((𝑥̅ 1 − 𝑥̅ 2 ) − 𝑍𝜎 √ + ≤ 𝜇1 − 𝜇2 ≤ (𝑥̅ 1 − 𝑥̅ 2 ) + 𝑍𝜎 √ + ) = (1 − 𝛼)100%
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Reemplazando:
180 150 180 150
((2500 − 2300) − 1.96 √ + ≤ 𝜇1 − 𝜇2 ≤ (2500 − 2300) + 1.96 √ + ) = 95%
30 35 30 35

(200 − 6.2860 ≤ 𝜇1 − 𝜇2 ≤ 200 − 6.2860) = 95%

(193.71 ≤ 𝜇1 − 𝜇2 ≤ 206.29 ) = 95%

Como el intervalo no contiene al cero, se puede afirmar que si existe diferencias entre los salarios

medios de los hombres y las mujeres de esta empresa a un nivel de confianza del 95%, por lo tanto

la gerencia de talento humano puede tomar medidas al respecto.

4.6. INTERVALO DE CONFIANZA PARA DIFERENCIAS DE PROPORCIONES

Ejemplo1.
Cierta empresa de seguros realiza un estudio para desechar la creencia de que la

proporción de accidentes vehiculares tiene una mayor incidencia en el género femenino,

para ello de acuerdo a sus registros se encontró que de 500 hombres, 300 habían sufrido

algún tipo de accidente automovilístico, y de las 400 mujeres 200 presentaron accidentes

en auto. La empresa desea determinar si existe alguna diferencia al respecto, a un N.C

del 90%.

Solución:

Este problema es un intervalo de confianza para la diferencia de proporciones, donde se

evidencia la característica a evaluar, que en este caso es nivel de accidentalidad por

género la fórmula a emplear es la número 1, en la tabla 4.


Datos:

HOMBRES MUJERES

300 200
𝑝̂1 = 500 = 0.6 𝑝̂ 2 = 400 = 0.5

𝑞̂1 = 0.4 𝑞̂2 = 0.5

𝑛1 =500 𝑛2 =400

N.C: 95%

𝑍𝜎 = 1.96
2

La fórmula a emplear es:

𝑝̂1 𝑞̂1 𝑝̂ 2 𝑞̂2 𝑝̂1 𝑞̂1 𝑝̂ 2 𝑞̂2


((𝑝̂1 − 𝑝̂2 ) − 𝑍𝜎 √ + ≤ 𝑃1 − 𝑃2 ≤ (𝑝̂1 − 𝑝̂2 ) + 𝑍𝜎 √ + ) = (1 − ∞)100%
2 𝑛1 𝑛2 2 𝑛1 𝑛2

Reemplazando se tiene que:

(0.6)(0.4) (0.5)(0.5) (0.6)(0.4) (0.5)(0.5)


((0.6 − 0.4) − 1.96 √ + ≤ 𝑃1 − 𝑃2 ≤ (0.6 − 0.4) + 1.96 √ + ) = 95%
500 400 500 400

(0.2 − 0.0651 ≤ 𝑃1 − 𝑃2 ≤ 0.2 + 0.0651) = 95%

(0.1348 ≤ 𝑃1 − 𝑃2 ≤ 0.2651) = 95%


El intervalo de confianza no contiene al cero, por lo tanto se puede concluir que si existe

evidencia entre la proporción de accidentes de hombres y mujeres con un nivel de

confianza del 95%, esta diferencia está entre el 13.48% y el 26.51%, por lo tanto la

aseguradora puede tomar consideraciones a la hora de las pólizas de seguro, evidentemente

hay que agregar que existen mayor número de conductores hombres, lo cual también debe

tenerse presente para dicho análisis

TABLA 1. Intervalos de confianza para medias poblacional de una población

Tabla 2. Intervalo de confianza para proporción de una población

Tablas Tomadas de: Humberto LLinás Solano


TABLA 3. Intervalos de confianza para la diferencias de medias poblacionales

Tabla 4. Intervalo de confianza para la diferencias de proporciones

Tablas Tomadas de: Humberto LLinás Solano