Você está na página 1de 18

Estimación de Parámetros

Es el procedimiento utilizado para conocer las características de un parámetro


poblacional, a partir del conocimiento de la muestra.

Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de


un valor de un parámetro de la población; pero también necesitamos precisar un:

- Intervalo de confianza

Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de
confianza específico.

- Nivel de confianza

Probabilidad de que el parámetro a estimar se encuentre en el intervalo de


confianza.

- Error de estimación admisible

Que estará relacionado con el radio del intervalo de confianza.

Distribución T

En probabilidad y estadística, la distribución t es una distribución de


probabilidad que surge del problema de estimar la media de una población normalmente
distribuida cuando el tamaño de la muestra es pequeño.

Aparece de manera natural al realizar la prueba t de Student para la


determinación de las diferencias entre dos medias muestrales y para la construcción
del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir de los
datos de una muestra.

Intervalo de Confianza para La Media

El intervalo de confianza, para la media de una población, con un nivel de


confianza de 1- α, siendo X la media de una muestra de tamaño n y σ la desviación típica
de la población, es:
El error máximo de estimación es:

Cuanto mayor sea el tamaño de la muestra, n, menor es el error.

Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error.

Tamaño de la muestra

Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra.

Si disminuimos el error, tenemos que aumentar el tamaño de la muestra.

Intervalo de Confianza para la Diferencia de Medias De Distribuciones


Normales Independientes.

Caso de varianza desconocida y común

Supondremos la existencia de dos poblaciones sobre las que una variable


determinada sigue una distribución Normal con idéntica varianza en las dos. Sobre la
población 1, la variable sigue una distribución N(µ1, σ) y, sobre la población 2, sigue una
distribución N(µ2, σ). Igualmente supondremos que disponemos de dos muestras aleatorias
independientes, una para cada población, de tamaños muestrales n1 y n2 respectivamente.

El objetivo es construir un intervalo de confianza, con nivel de


confianza (1 − α) · 100 %, para la diferencia de medias

µ1 − µ2

El método se basa en la construcción de una nueva variable D, definida como


la diferencia de las medias muestrales para cada población
Esta variable, bajo la hipótesis de independencia de las muestras, sigue una
distribución Normal de esperanza

µ1 − µ2

y de varianza

La estimación conjunta, a partir de las dos muestras, de la varianza común


viene dada por la expresión

y, utilizando la propiedad de que la variable

sigue una distribución χ2 con n1 + n2 − 2 grados de libertad, podemos construir un


estadístico pivote que siga una distribución t de Student y que nos proporciona la fórmula
siguiente para el intervalo de confianza para la diferencia de medias:

Donde tα/2 es el valor de una distribución t de Student con n1 + n2 − 2 grados


de libertad que deja a su derecha una probabilidad de α/2.

Intervalo de Confianza para la Varianza De Una Distribución Normal

Dada una variable aleatoria con distribución Normal N(μ; σ), el objetivo es la
construcción de un intervalo de confianza para el parámetro σ, basado en una muestra de
tamaño n de la variable.

A partir del estadístico


la fórmula para el intervalo de confianza, con nivel de confianza 1 − α es la
siguiente

Donde χ2α/2 es el valor de una distribución ji-cuadrado con n − 1 grados de


libertad que deja a su derecha una probabilidad de α/2.

Por ejemplo, dados los datos siguientes:

Distribución poblacional: Normal

Tamaño de muestra: 10

Confianza deseada para el intervalo: 95 %

Varianza muestral corregida: 38,5

Un intervalo de confianza al 95 % para la varianza de la distribución viene


dado por:

que resulta, finalmente

Hipótesis Estadísticas

Un test estadístico es un procedimiento para, a partir de una muestra aleatoria


y significativa, extraer conclusiones que permitan aceptar o rechazar una hipótesis
previamente emitida sobre el valor de un parámetro desconocido de una población.
Prueba De Hipótesis y Significancia

Es un procedimiento estadístico que permite aceptar o rechazar una


afirmación hecha con respecto a un fenómeno o suceso. El procedimiento consta de seis (6)
pasos

Se les denomina así a los supuestos (hipótesis) realizados con respecto a un


parámetro o estadístico (media, proporción, entre otros).

En este paso se definen dos tipos de hipótesis:

 Ho: Hipótesis nula

 H1: Hipótesis alterna (de la cual se sospecha pudiera ser cierta, es planteada
por el investigador)

Planteamiento con una variable

Este tipo de desarrollo va de la forma: "¿Se podría afirmar que


el promedio de tiempo que se demora una persona en vestirse es de 10 minutos?".

En el cual se desea averiguar de una variable si la cantidad inducida es


correcta o falsa.

Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres


casos:

CASO I CASO II CASO III


*Ho: U = 10 *Ho: U = 10 min *Ho: U = 10 min
min *H1: U > 10 min *H1: U < 10 min
*H1: U ≠ 10 min
El tiempo El tiempo El tiempo promedio
promedio que se promedio que se demora que se demora una
demora una una persona en vestirse persona en vestirse
persona en es más o superior a 10 es menoso inferior a 10
vestirse no es minutos minutos
igualo es diferente a
10 minutos

Planteamiento con dos variables o por comparación


Este tipo de desarrollo va de la forma: "¿Se podría afirmar que las
ganancias de las empresas medianas han crecido este año con respecto al año anterior?".

En el cual se compara un valor predefinido con respecto a


una suposición entre una variable con otra variable para determinar si esta es correcta o
falsa.

Dependiendo de cómo se plantee la incógnita, se pueden distinguir tres casos:

CASO I CASO II CASO III


*Ho: U1 = *Ho: U1 = U2 *Ho: U1 = U2
U2 *H1: U1 > U2 *H1: U1 < U2
*H1: U1 ≠ U2
Las Las ganancias de Las ganancias de las
ganancias de las las empresas medianas en empresas medianas en este
empresas este año año
medianas en este son más o superiores al son menoso inferiores al
año no son año anterior año anterior
iguales o son
diferentes al año
anterior

Nivel de significancia (α)

Se le conoce así al error máximo adoptado al momento de rechazar la


hipótesis nula (Ho) cuando es verdadera.

Dependiendo del tipo de significación que se da al estudio, hay tres grados:

 α = 0.01 → Muy significativo

 α = 0.05 → Significativo

 α = 0.10 → Poco significativo

Tipos de Hipótesis

Hipótesis Nula

Son el reverso de las hipótesis de investigación. También constituyen


proposiciones acerca de la relación entre variables, solo que sirven para refutar o negar algo
lo que afirma la hipótesis de investigación. Las hipótesis nulas se simbolizan así: Ho

Hipótesis Alternativas

Son posibilidades alternas ante las hipótesis de investigación y nula, ofrecen


otra descripción o explicación distintas a las que proporcionan estos tipos de hipótesis.

Hipótesis Direccional

Estás hipótesis centran su investigación en determinados resultados


esperados. Por ejemplo:

Los ratones blancos que se crucen con ratones negros, seguramente nacerán
pequeños ratos combinados y algunos otros de color blanco o negro únicamente.

Hipótesis No Direccional

Ciertas afirmaciones de hipótesis transmiten una relación entre las variables


que el investigador compara, pero no especifica la naturaleza exacta de esta relación. Esta
forma de hipótesis es utilizada en los estudios en donde no hay una suficiente investigación
en el pasado sobre la cual basar una predicción. Continuando con el mismo ejemplo, una
hipótesis no direccional se leería: "el desempeño académico de los estudiantes de
preparatoria está relacionado con su participación en las actividades extracurriculares".

Niveles de Significación: La probabilidad máxima con la que en el ensayo de una


hipótesis se puede cometer un error del tipo I, se llama nivel de significación del ensayo.
Esta probabilidad se denota frecuentemente por; generalmente se fija antes de la
extracción de las muestras, de modo que los resultados obtenidos no influyen en la
investigación.

Tipos de Errores.

1. Del Tipo 1: La hipótesis es rechazada cuando debería ser aceptada. Se rechaza H0


cuando debería ser aceptada, se le conoce como nivel de significación y se denota
como.

2. Del Tipo 2: Cuando se acepta una hipótesis que debería ser rechazada. Se le denota
como.

 Por Ejemplo si se elige un nivel de significación del 0,05 o 5% al diseñar un


ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 que
se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con
un 95% de confianza de que se toma la decisión adecuada. En tal caso se
dice que la hipótesis ha sido rechazada al nivel de significación del 0,05, lo
que significa que se puede cometer error con una probabilidad de 0,05.

Ensayo de Una Cola: Cuando la investigación está interesada solamente en los


valores extremos a un solo lado de la media, es decir, en una cola de la distribución.

Ensayo de Dos Colas: Cuando la investigación toma los valores extremos a ambos
lados de la media, es decir, las dos colas de la distribución.

Por ejemplo:

Nivel de Significación 0,1 0,01 0,002

Valores críticos de z
1,28 ó  2,33 ó 2,88 ó
para ensayos de una
1,28 2,33 2,88
cola.

Valores críticos de z
1,645 y 2,58 y 3,08 y
para ensayos de dos
1,645 2,58 3,08
colas.
Prueba de Hipótesis para la Media de una Población:

Si se conoce la desviación estándar de la población, la distribución de muestre


adecuada es la distribución normal, si la población que se muestra es normal, la distribución
de muestreo será normal en el caso de todos los tamaños de la muestra, y el valor
estadístico de prueba a utilizar es:

Si la población no es normal, o si se desconoce su forma, se emplea la ecuación


anterior solamente para tamaños de muestra iguales o mayores a 30, es decir, para n30.

Cuando la población es finita y el tamaño de la muestra n constituye más del 5% del


tamaño de la población N, es decir:

En este caso se debe usar el factor finito de corrección para modificar las
desviaciones estándar, por lo tanto se aplican las siguientes ecuaciones conocida y
desconocida, respectivamente:

Ejemplo:

Según experiencias pasadas, se sabe que en una compañía el retardo promedio por
mes de sus obreros es de 64 minutos con una desviación estándar de 8 minutos. El gerente
de la compañía considera que éste promedio ha aumentado sensiblemente en los últimos
meses, por lo cual ordena efectuar la investigación correspondiente. Para tal fin, se toma
una muestra aleatoria de n=64 obreros y se encuentra que la misma presenta una media de x
 68 minutos. Se pide comprobar si el gerente tiene o no la razón con un nivel de
significación de 0.05.

Solución
Observemos que las medias muestrales se distribuirán normalmente, según el
numeral 2 de ésta página. Siguiendo los pasos planteados en la página anterior tenemos:

1) Hipótesis nula e hipótesis alternativa: Ho:   64 minutos (que refleja el


no cambio) y Ha:   64 minutos (que refleja el cambio).
2) Nivel de significación:  =0.05. Éste valor lo sugiere el presente
problema, pero en la práctica es el investigador quien lo fija de acuerdo a
sus necesidades.
3) Formular la regla de decisión: Como podemos observar en el numeral 3
de la página 218, la prueba es unilateral a la derecha, por lo cual el valor
de z1 correspondiente, según el gráfico de la página 218, es de 1.64 de
acuerdo con la tabla de distribución normal. Por lo tanto, la regla de
decisión será la siguiente: “Se rechaza la hipótesis nula si el valor de Z
calculado es: Z> 1.64.
68−64
4) Cálculo del estadístico sobre el cual se tomará la decisión: 𝑧 = 8 =
√64
4.0
5) Tomar la decisión: Como 4.0 que es el valor de Z calculado, es mayor
que el valor de Z según el criterio de decisión, entonces 4.0 se encuentra
en la zona de rechazo, por lo cual debemos rechazar la hipótesis nula de
que el promedio de retardos sigue siendo de 64 minutos. Por lo tanto, el
gerente tiene la razón con un nivel de significación del 5%.

Prueba de Hipótesis para la Diferencia de Medias.

Las pruebas de dos muestras se utilizan para decidir si las medias de dos
poblaciones son iguales. Se requieren dos muestras independientes, una de cada una de las
dos poblaciones.

La hipótesis nula puede establecer que las dos poblaciones tienen medias iguales:
H0: 1 = 2.

Las alternativas pueden ser alguna de las siguientes:

H1: 1 ≠ 2 H1: 1  2 H1: 1  2

Cuando se conocen las desviaciones estándar de la población 1 y 2, el valor


estadístico de prueba es el siguiente:

𝑋1 − 𝑋2
𝑡𝑝𝑟𝑢𝑒𝑏𝑎 =

12 22
𝑛1 + 𝑛2
Cuando los tamaños de las dos muestras no son iguales, y su suma es menor de 30,
la fórmula para el valor estadístico de prueba se convierte en:

La media de las calificaciones de dos muestras de 15 estudiantes de primer semestre


en la asignatura de Estadística de la universidad UTN resulta ser de 7 y 8,5. Se sabe que la
desviación típica de las calificaciones en esta asignatura fue en el pasado de 1,5.

Prueba de Hipótesis para la Varianza de una Población.

En una prueba de hipótesis para la varianza poblacional se emplean el valor hipotético de la


varianza poblacional σ2 y la varianza muestral s2 para calcular el valor estadístico de prueba
X2. Si la población tiene una distribución normal, el estadístico de prueba es el siguiente:
(𝑛 − 1)𝑠 2
𝑥2 =
20

Una vez calculado el estadístico de prueba X2, para determinar si se acepta o se rechaza la
hipótesis nula se encuentra el valor crítico y se realiza la comparación.

Ejemplo: La St. Louis Metro Bus Company de Estados Unidos, desea dar una imagen de
confiabilidad haciendo que sus conductores sean puntuales en los horarios de llegada a las
paradas. La empresa desea que haya poca variabilidad en dichos tiempos. En términos de la
varianza de los tiempos de llegada de las paradas, la empresa desea que la varianza sea de 4
minutos o menos. Esta prueba de hipótesis se realiza con un nivel de significancia de α =
0.05.

Asuma que en una muestra aleatoria de 24 llegadas a cierta parada en una intersección en el
centro de la ciudad, la varianza muestral encontrada es s2=4.9

o Paso 1: Formular las hipótesis

 H0: σ2 ≤ 4

 Ha: σ2 > 4

o Paso 2: Nivel de significancia de α = 0.05, como la prueba es de una sola cola (la
del lado derecho), se considera una distribución X2.

o Paso 3: Obtenemos el valor critico X2c utilizando la tabla de valores de esta


distribución:

 Grados de libertad = n-1= 24 – 1 = 23 (renglones de tabla).

 Probabilidad: nivel de significancia α = 0.05 (columnas de tabla).

 Buscando estos valores en la tabla tenemos que X2c = 35.172.

o Paso 4: Calcular el estadístico de prueba X2p

2
(𝑛 − 1)𝑠 2 (24 − 1)(4.9)
𝑥 = = = 28.18
20 4

Si el estadístico de prueba es menor que el valor crítico, se rechaza H0, de manera contraria
se acepta. Por lo tanto para esta prueba, tenemos que: 28.18 < 35.172, se rechaza H0

o Paso 5: Se concluye que existe evidencia suficiente para rechazar H0, en tal caso
habrá que tomar medidas para reducir la varianza poblacional.
UNIVERSIDAD DE ORIENTE

NUCLEO DE ANZOÁTEGUI

FACULTAD DE CIENCIAS De LA SALUD

CÁTEDRA: ESTADISTICA

Sección: 01

Profesor: Alumna:

Jean Paul González Gutierrez Viera, Barbara C.I:27.334.306

Barcelona, 29 de noviembre de 2017.


Instrucción

Antes de comenzar con los contenidos específicos de la estimación es conveniente


recordar cuál es la situación habitual con la que nos encontramos en un proceso de
inferencia. Nuestro interés se centra en el estudio de una característica determinada de una
población. Dicha característica puede denotarse por una variable aleatoria X definida sobre
la población y con función de densidad f(x). Si conocemos f(x) tendremos caracterizada a
la variable aleatoria X y el problema queda resuelto. Sin embargo, la mayoría de las veces
no ocurre eso. En principio, es habitual disponer solo de cierta información a priori sobre el
comportamiento de la variable aleatoria X (dicha información, normalmente proviene de las
conclusiones de un estudio previo de esa variable realizado sobre la misma población u otra
diferente). La función f(x) puede ser totalmente desconocida o bien conocida solamente en
su forma, es decir, sabemos qué tipo de distribución es pero nos falta especificarla porque
desconocemos el valor de uno o más parámetros de la misma. Por ejemplo podemos
conocer que la variable aleatoria X sólo puede tomar dos valores, éxito o fracaso, y que
además la probabilidad de éxito es muy baja.

Según esta información podemos suponer que X se distribuye como una Poisson. No
obstante, nos falta información para poder definir esa distribución (función de densidad de
la variable aleatoria X) puesto que desconocemos el valor de su media.

El objetivo de la inferencia estadística es resolver este problema. Para ello se han de seguir
los siguientes pasos:

1. Obtención de la muestra.

2. Cálculo del estadístico que nos interese (utilizando la información muestral).

3. Utilización del estadístico calculado en el apartado previo como estimador del parámetro
poblacional que desconocemos. De lo anterior se deduce que un estimador no es más que
una función de los datos muéstrales que se utiliza como valor de un parámetro poblacional.

O dicho de otra manera, un estimador no es más que un estadístico asociado a un valor


poblacional. Por ejemplo, podríamos decir que la media muestral es el estimador de la
media poblacional. Cuando se establece una relación entre este estadístico y un parámetro,
en este caso concreto la media poblacional, el primero se convierte en estimador del
segundo. El interrogante que surge a continuación es porqué la media muestral es un
estimador de la media poblacional, o más concretamente, ¿qué propiedades tiene el
estadístico media muestral para ser considerado un buen estimador de la media
poblacional?. En el presente tema nos centraremos en el estudio de los siguientes aspectos:
A. Tipos de estimación. Distinguiendo entre estimación Estimación , procedimiento
mediante el cual se estima el valor del parámetro poblacional basándose en los datos
muestrales mediante el uso de un estádistico, y estimación por intervalos, en el cual para
realizar la estimación del parámetro poblacional se determina un intervalo en el que de
forma probable se encuentra el valor del parámetro. Dicho intervalo recibirá el nombre de
intervalo de confianza. B. Propiedades que debemos exigir a un estimador puntual. C.
Métodos disponibles para la construcción de estimadores puntuales. D. Métodos
disponibles para la estimación de intervalos de confianza de un parámetro poblacional. E.
Determinación del tamaño de la muestra para que la estimación presente una determinada
precisión.
Bibliografía

 https://www.vitutor.com/estadistica/inferencia/contrastes_3.html

 http://www.hrc.es/bioest/Introducion_est.html

 https://prezi.com/cety-mfvo-wn/hipotesis-nulas-alternativas-y-estadisticas/

 http://www.monografias.com/trabajos99/tipo-hipotesis/tipo-hipotesis.shtml

 https://www.uv.es/ceaces/pdf/intervalos.pdf

 http://www4.ujaen.es/~dmontoro/Metodos/Temas/Tema6.pdf

 http://ocw.uv.es/ciencias-de-la-salud/estadistica-estadistica-inferencial-en-
psicologia/tema_3.pdf
Conclusiones
Analizando el estimador de la media muestral se concluye que para las
distribuciones continuas y discretas los dos métodos de estimación trabajados proporcionan
las mismas medidas descriptivas con una precisión de tres dígitos como lo son: la media, la
varianza, el error promedio de estimación, coeficiente de kurtosis, coeficiente de asimetría,
mínimo y máximo valor observados de los estimadores, límite superior e inferior de los
intervalos de confianza al 95% para la media poblacional, longitud promedio de los
intervalos de confianza y sesgo de estimación, sin embargo para tamaños muestrales
menores a 30 la longitud promedio de los intervalos de confianza es menor al utilizar el
método de estimación Jacknife frente al método convencional de estimación para la media
poblacional.

2. Al utilizar el estimador de máxima verosimilitud para la varianza tanto


para distribuciones continuas como para distribuciones discretas en la mayoría de los casos,
la estimación Jacknife proporciona valores de mayor magnitud para la varianza, error de
estimación promedio, longitud promedio de los intervalos de confianza al 95%, y sesgo de
estimación; y a medida que aumenta el tamaño muestral todas las medidas descriptivas
para la distribución de los estimadores son similares en magnitud al utilizar los dos
métodos de estimación. Con la distribución discreta Poisson para λ>7, el sesgo de
estimación se reduce en la mayoría de los casos mediante la estimación Jacknife frente a la
estimación convencional.

3. El estimador insesgado para la varianza obtenido con los métodos de


estimación trabajados proporcionan con tres dígitos de precisión las mismas medidas
descriptivas para los estimadores, tanto para distribuciones discretas como para
distribuciones continuas, al igual que en el caso del estimador para la media, la longitud de
los intervalos de confianza para tamaños muestrales menores a 30 es menor mediante la
estimación Jacknife frente a la estimación convencional.

4. El estimador insesgado de la varianza y el estimador de la media


poblacional que también es insesgado para distintos valores de los parámetros
poblacionales en distribuciones continuas y discretas, mediante el método de estimación
Jacknife y el método de estimación convencional presentan la misma situación, es decir,
proporcionan los mismos valores para los estimadores y por tanto las mismas medidas
descriptivas, a excepción de la longitud promedio de los intervalos de confianza al 95%
para tamaños muestrales menores a 30, que logra reducirse mediante el método de
estimación Jacknife frente al método de estimación convencional.

5. Con el estimador de la mediana poblacional obtenida para distribuciones


continuas como son la Beta y Uniforme y para distintos valores de los parámetros
poblacionales de las mismas, podemos concluir que para tamaños muestrales impares el
método de estimación Jacknife obtiene valores del estimador que no se encuentran en los
dominios de las funciones de densidad respectivas. Sin embargo para tamaños muestrales
pares el método de estimación Jacknife y el método de estimación convencional
proporcionan las medidas descriptivas coincidentes con tres dígitos de precisión, además
para tamaños muestrales menores a 30 se logra reducir la longitud promedio de los
intervalos de confianza al 95%. Para la distribución Normal se concluye que el método
Jacknife funciona, puesto que, la función de densidad Normal está definida en el intervalo
(-∞, +∞).

6. Para el primer estadístico de orden para distintos valores de los


parámetros poblaciones de las distribuciones Uniforme y Exponencial el método de
estimación Jacknife no funciona puesto que obtiene valores de los estimadores que no se
encuentran en los dominios de las funciones de densidad. En la distribución Beta para el
parámetro poblacional ν>20 y ω>0 el método de estimación Jacknife logra reducir el error
promedio de estimación y el sesgo de estimación.

7. El primer estadístico de orden mediante el método de estimación


Jacknife para distintos valores de los parámetros poblacionales de la distribución
Hipergeométrica proporciona valores para los estimadores que no se encuentran en el
dominio de la función de probabilidad. Con la distribución Poisson el método de
estimación Jacknife para λ>20 funciona y además logra reducir el sesgo de estimación y el
error de estimación promedio. Analizando la distribución Binomial el método de
estimación Jacknife funciona para p>0.7 además logra reducir el sesgo de estimación y
error de estimación promedio. En cuanto a la distribución Binomial Negativa el método de
estimación Jacknife funciona para r>50 y p<0.7, logra reducir el sesgo de estimación, error
promedio de estimación y la longitud promedio de los intervalos de confianza al 95%.

Você também pode gostar