Você está na página 1de 15

1.

1 INTRODUCCIN A
LA ESTADSTICA INFERENCIAL

Una introduccin a la Estadstica Inferencial
El arte de obtener con confianza conclusiones sobre el modo de proceder del fenmeno que se
estudia es el objeto de las diferentes tcnicas existentes de Inferencia Estadstica. La estadstica
inferencial o inductiva plantea y resuelve el problema de establecer previsiones y conclusiones
generales sobre una poblacin a partir de los resultados obtenidos de una muestra. Los modelos
estadsticos actan como puente entre lo observado (muestra) y lo desconocido (poblacin). Su
construccin y estudio estn basados en el clculo de probabilidades.
Podemos concluir entonces que la Inferencia Estadstica es la metodologa tendente a hacer
descripciones, predicciones, comparaciones y generalizaciones de una poblacin estadstica a
partir de la informacin contenida en una muestra. Utiliza resultados obtenidos mediante la
Estadstica Descriptiva y se apoya fuertemente en el clculo de probabilidades.
1.2 Muestreo: Introduccin al muestreo y tipos de muestreo.
Muestra:
La muestra es una parte de la poblacin, que es representativa de la misma. Entonces
una muestra es una parte o un subconjunto de una poblacin seleccionado con la
finalidad de analizar y obtener propiedades de esta
Muestreo: es el procedimiento mediante el cual se obtiene una muestra
Algunas razones que justifican el uso del muestreo son:
1) naturaleza destructiva del proceso de investigacin
2) imposibilidad de revisar todos los elementos de la poblacin.
3) Costo: al obtener los datos de una pequea porcin del total.
4) tiempo: al considerar solo una parte del total, su recoleccin y resumen se har con
mayor rapidez.
5) precisin: las posibilidades de usar personal mas capacitado y supervisar
cuidadosamente el trabajo de campo y el procesamiento de la informacin
Seleccionar una muestra adecuada:
Para seleccionar una muestra se deben tomar en cuenta algunas consideraciones elegir
el tamao de la muestra, lo cual depende no solo de la cantidad de informacin que se
quiere conseguir, y el grado de certeza deseada, sino tambin del costo del muestreo y la
seleccin de los elementos que la constituyen . Cualquiera sea el mtodo elegido, el
requisito mas importante es que la muestra obtenida proporciona una imagen tan real
como sea posible de aquella poblacin que se ha sometido al muestreo.
Ya visto esto, este es otra definicin del Muestreo:
Proceso de medicin de la informacin en solo una parte de la poblacin estadstica. Se
define como el proceso de seleccionar un nmero de observaciones de un grupo
Tipos de muestreo
Existen dos mtodos para seleccionar muestra de poblaciones
Muestreo no aleatorio:
Es prctica comn seleccionar una muestra en forma intencional. De acuerdo a opiniones
o criterios personales, fundamentalmente con el objeto de obtener informacin sin mucho
costo.
Ejemplo: si estamos estudiando el numero de personas que practican ftbol en una
determinada regin del pas, tenemos que buscar especficamente a una persona que
practique ftbol, es decir el proceso de elegir a quien se le aplica la encuesta no es
aleatorio, a diferencia de que se pregunte que opina de la seleccin de ftbol de
Venezuela, que la forma de elegir al encuestado si es aleatorio.
Para ser no aleatorio tiene que cumplir con estas caractersticas:
1) la muestra consiste en los elementos que estn mas a la mano.
2) se seleccionan un grupo de unidades tipo.
3) La muestra esta compuesta por voluntarios.
4) La muestra es restringidas a la parte de la poblacin que es fcilmente accesible.
Muestreo aleatorio:
En el cual todos los elementos de la poblacin tienen la oportunidad de ser escogidos
para la muestra. Este procedimiento da a cada elemento de la poblacin una probabilidad
de ser seleccionado. Dentro de este tipo se encuentran:
a) muestreo aleatorio simple:
Permite que cada muestra posible pueda ser elegida con la misma probabilidad. Por su
parte cada elemento de la poblacin tiene la misma oportunidad igual de ser incluido en la
muestra.
b) muestreo sistemtico:
En algunos casos la manera ms prctica de realizar un muestreo consiste en
seleccionar, un primer elemento al azar y luego ir escogiendo cada x-trmino de una lista,
o dejar pasar a x- individuos y preguntar al que sigue y as sucesivamente. Aunque un
muestreo sistemtico puede no ser aleatorio de acuerdo con la definicin, a menudo es
razonable tratar las muestras sistemticas como si fueran aleatorias.
El riesgo de los muestreos sistemticos es el de las periodicidades ocultas. Supongamos
que queremos testear el funcionamiento de una mquina, para lo cul vamos a
seleccionar una de cada 15 piezas producidas. Si ocurriera la desgracia de que
justamente 1 de cada 15 piezas fuese defectuosa y el error de la mquina fuera
defectuoso peridicamente, tendramos dos posibles resultados muestrales:
- Que falla siempre
- Que no falla nunca.

c) Muestreo estratificado
1.-Si tenemos informacin a cerca de una poblacin (es decir de su composicin) y esta
es importante para nuestra investigacin, podemos mejorar el muestreo aleatorio por
medio de la estratificacin. Este es un procedimiento que consiste en estratificar o dividir
la poblacin en un numero de subpoblaciones o estratos. Y seleccionamos de cada
estrato una muestra aleatoria.
Este procedimiento se conoce como muestreo aleatorio (simple) estratificado.

Supongamos una poblacin de tamao N que se divide en k estratos cuyos tamaos son:
N
1
, N
2
, .....,N
k
(N
1
+N
2
+.....+N
k
=N) Para obtener una distribucin proporcional hemos de
tener en cuenta que :
1
1
2
2
n
N
n
N
n
N
n
N
k
k
. . . . . . .
de donde se obtiene que
i
i
n
N
N
n

para
y=1,2,3,4,.... k donde n= tamao de la muestra.

Esta seria una distribucin proporcional, pero hay otras formas de distribuir porciones de
una muestra entre los distintos estratos, que seran:
- Distribucin ptima.
- Estratificacin cruzada.
- Muestreo por cuotas.

2.-Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se
suponen homogneos respecto a caracterstica a estudiar. A cada uno de estos estratos
se le asignara una cuota que determinara el nmero de miembros del mismo que
compondrn la muestra. Dentro de cada estrato el muestreo se realizara mediante m.a.s.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los
estratos, existen dos tcnicas de muestreo estratificado:
Asignacin proporcional: el tamao de cada estrato en la muestra es proporcional a su
tamao en la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que tengan
ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado
las opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos
grupos, puede haber cierta homogeneidad. As, si la poblacin est compuesta de un 55%
de mujeres y un 45% de hombres, se tomara una muestra que contenga tambin esa
misma proporcin.
d) Muestreo por conglomerados:
Por algunas razones naturales, los elementos mustrales se encuentran formando
grupos, como por ejemplo, las personas que viven en colonias de una ciudad, lo
elementos de una caja de una lnea de produccin, los clubes de personas, las reas
arboladas de un terreno, etc.
Como el objetivo del muestreo es levantar la mayor cantidad de informacin al menor
costo, en este tipo de casos lo ms econmico el encuestar a un elemento muestral y a
todos sus vecinos, as se ahorran los costos de un traslado del encuestador.
A este modelo de muestreo se llama Por conglomerados, ya que una vez seleccionado
un elemento para la muestra, se incluyen tambin a todos los elementos que estn
alrededor de l.
A diferencia del muestreo estratificado, este muestreo no requiere que los elementos
tengan caractersticas homogneas.
1.3 Teorema del lmite central
El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables
independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la
suma de ellas se distribuye segn una distribucin normal.
Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si lanzamos la
moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se
distribuye segn una distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables continuas.
Los parmetros de la distribucin normal son:
Media: n * m (media de la variable individual multiplicada por el nmero de variables
independientes)
Varianza: n * s2 (varianza de la variable individual multiplicada por el nmero de variables
individuales)
Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada
lanzamiento es una variable independiente que se distribuye segn el modelo de Bernouilli, con
media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60 caras.
La variable suma de estas 100 variables independientes se distribuye, por tanto, segn una
distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable normal tipificada
equivalente:
(*) 5 es la raiz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salga ms de 60 caras es tan slo del
2,28%
1.4 Distribuciones fundamentales para el muestreo
Concepto de distribucin de muestreo
La comprensin del concepto de la distribucin de muestreo es fundamental para el correcto
entendimiento de la inferencia estadstica.
Una distribucin de la poblacin es la distribucin de la totalidad de las medidas individuales de
una poblacin, en tanto que una distribucin muestral es la distribucin de los valores individuales
incluidos en una muestra.
En contraste con estas distribuciones de medidas individuales, una distribucin de muestreo se
refiere a la distribucin de los diferentes valores que una estadstica muestral, o estimador, podra
adoptar en muchas muestras del mismo tamao.
As, aunque por lo general disponemos nicamente de una muestra aleatoria o subgrupo racional,
reconocemos que la estadstica muestral particular que determinamos, como la media o mediana
de la muestra, no es exactamente igual al respectivo parmetro de la poblacin.
Ms an, el valor de una estadstica muestral variar de una muestra a otra, a causa de la
variabilidad del muestreo aleatorio, o error de muestreo. sta es la idea en la que se apoya el
concepto de que toda estadstica muestral es de hecho un tipo de variable cuya distribucin de
valores est representada por una distribucin de muestreo.
Distribucin muestral de medias
Una distribucin muestral de medias o una distribucin en el muestreo de la media se define
como el conjunto de todas las medias que se pueden calcular en todas las muestras posibles que
se pueden extraer, con o sin reemplazo, de una determinada poblacin. Para detectar las
relaciones a que nos hemos referido, partiremos de un ejemplo con una poblacin pequea.
Media
Es el promedio aritmtico de las medias del conjunto de datos; ya sea de la poblacin o de la
muestra.

Tambin habremos de referirnos a la media como el valor esperado de X, y se denotar con E (X).
Varianza
Es el promedio de la suma de los cuadrados de las desviaciones. Se entiende por desviacin la
diferencia de una media respecto a la media

Como puede verse, la varianza es una medida de dispersin. Indica, en promedio, qu tan alejados
estn los datos respecto de la media.
Desviacin tpica o estndar
Es la raz cuadrada de la varianza.

Por simplicidad, en las expresiones anteriores se acostumbra suprimir el subndice i, as como los
lmites de las sumatorias:

Objetivo:
Obtener por medio de los estadgrafos (media y varianza) los parmetros poblacionales para poder
determinarla distribucin que presentan los aos de las monedas de 10 centavos
Hiptesis: Haciendo un muestro en la poblacin de monedas de 10C, decimos que la medias
poblacionales del ao de fabricacin se distribuirn de manera normal

1.4.2 Distribucin Muestral de Diferencia de Medias
Suponga que se tienen dos poblaciones distintas, la primera con media
1
y desviacin
estndar
1
, y la segunda con media
2
y desviacin estndar
2.
Ms an, se elige una
muestra aleatoria de tamao n
1
de la primera poblacin y una muestra independiente aleatoria de
tamao n
2
de la segunda poblacin; se calcula la media muestral para cada muestra y la diferencia
entre dichas medias. La coleccin de todas esas diferencias se llama distribucin muestral de las
diferencias entre medias o ladistribucin muestral del estadstico
1.4.3 Distribucin Muestral de Diferencia de Proporciones
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse
utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las
de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una
reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin
de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en
posiciones gerenciales.
Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la
mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal
para tamaos de muestra grande (n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y n
2
q
2
5). Entonces p
1
y p
2
tienen
distribuciones muestrales aproximadamente normales, as que su diferencia p
1
-p
2
tambin tiene
una distribucin muestral aproximadamente normal.

Cuando se estudi a la distribucin muestral de proporciones se comprob que y
que , por lo que no es difcil deducir que y
que .
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de
proporciones es:



La distribucin es aproximadamente normal para n
1
30 y n
2
30. Si las poblaciones son
normales, entonces la distribucin muestral de medias es normal sin importar los tamaos de las
muestras.
En ejercicios anteriores se haba demostrado que y que , por lo que no es difcil
deducir que y que .
La frmula que se utilizar para el calculo de probabilidad del estadstico de diferencia de medias
es:


1.4.4 Distribucin muestral de la diferencia de proporciones
Una proporcin poblacional se define como =X/N, donde X es el nmero de elementos en la
poblacin que poseen cierta caracterstica y N es el total de elementos de la poblacin.
Una proporcin muestral se define como p = x/n, donde x es el nmero de elementos en la
muestra que poseen cierta caracterstica y n es el total de elementos de la muestra.
Cuando se desea estimar una proporcin, el tamao de la muestra siempre debe ser grande, es
decir, n 30.
Si la muestra se obtiene con reemplazo, x tiene distribucin binomial y debido a que la muestra es
grande, por el teorema central del lmite se aproxima a una distribucin normal; por consiguiente:

Debido a que se desconoce la proporcin poblacional, se utiliza la proporcin muestral para
estimar la varianza, por lo tanto:



1.4.5 Distribucin t-Student
Condiciones:
Se utiliza en muestras pequeas de 30 o menos elementos.
La desviacin estndar de la poblacin no se conoce.
Caractersticas:
La distribucin t-Student es menor en la media y ms alta en los extremos que una distribucin
normal.
Tiene mayor parte de su rea en los extremos que la distribucin normal.



Existe una distribucin t para cada tamao de la muestra, por lo que Existe una distribucin para
cada uno de los grados de libertad.
Los grados de libertad son el nmero de valores elegidos libremente.
Para un conjunto de datos de una muestra, con distribucin t-Student los grados de libertad se
calculan de la siguiente manera:
G.L. = n 1
Ejemplo:
Se tiene una muestra de 7 elementos con una media de 16.
Media= a+b+c+d+e+f+g =16
7
G.L.= n 1 =7-1= 6
El supuesto fundamental es que la poblacin tiene distribucin normal con media y varianza
. De esta poblacin se obtiene una muestra aleatoria de tamao n.
1.4.6 Distribucin muestral de la varianza
La varianza de la muestra se define como:

Si se multiplica por n/ se obtiene:
(1.1)
La expresin (1.1) es similar a:

que tiene distribucin chi-cuadrado con n grados de libertad. La nica diferencia es que en el uno
interviene la media muestral (x) y en el otro la media poblacional ( ). Por lo tanto, la pregunta es
si la expresin (1.1) tambin tiene distribucin chi-cuadrado con n grados de libertad.
que tiene distribucin chi-cuadrado con n grados de libertad. La nica diferencia es que en el uno
interviene la media muestral (x) y en el otro la media poblacional ( ). Por lo tanto, la pregunta es
si la expresin (1.1) tambin tiene distribucin chi-cuadrado con n grados de libertad.
Recordemos que una variable aleatoria con distribucin normal estndar, elevada al cuadrado,
tiene distribucion chi-cuadrado y sus grados de libertad dependen del nmero de observaciones.
Si una variable aleatoria X tiene distribucin normal, N( , ), por el teorema central del lmite:

Para hacer la demostracin partimos de la expresin (1.2), a la que se le resta y se le suma la
media muestral:


Desarrollando el binomio y aplicando propiedades de la suma se obtiene:


Por propiedades de la media:




Despejando:



Por lo tanto,


Es decir que la sustitucin de la media poblacional por la media muestral reduce en 1 los grados de
libertad de la chi-cuadrado. Lo anterior nos indica que cada vez que se reemplaza un parmetro
por un estimador, se reduce en 1 los grados de libertad de la distribucin chi-cuadrado.
Si se utiliza la varianza corregida,


Lo anterior se debe a que la varianza corregida se define como:


En caso de ser iguales se trabaja con el 3 y si son diferentes se trabaja con el caso 4 de los casos
especiales.
1.4.7 DISTRIBUCIN MUESTRAL DE LA RELACIN DE VARIANZAS.

Você também pode gostar