Você está na página 1de 11

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin INTRODUCCION La Estadstica es mucho ms que slo nmeros apilados y grficas bonitas.

Es una ciencia con tanta antigedad como la escritura, y es por s misma auxiliar de todas las dems ciencias. Los mercados, la medicina, la ingeniera, los gobiernos, etc. Se nombran entre los ms destacados clientes de sta. La Estadstica que conocemos hoy en da debe gran parte de su realizacin a los trabajos matemticos de aquellos hombres que desarrollaron la teora de las probabilidades, con la cual se adhiri a la Estadstica a las ciencias formales. En este breve material se expone los conceptos, la historia, la divisin as como algunos errores bsicos cometidos al momento de analizar datos Estadsticos.

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin MUESTREO ALEATORIO Es el procedimiento probabilstico de seleccin de muestras ms sencillo y conocido, no obstante, en la prctica es difcil de realizar debido a que requiere de un marco muestral y en muchos casos no es posible obtenerlo. Puede ser til cuando las poblaciones son pequeas y por lo tanto, se cuenta con listados. Cuando las poblaciones son grandes, se prefiere el muestreo en etapas. Se utiliza ampliamente en los estudios experimentales, adems, de ser un procedimiento bsico como componente de mtodos ms complejos (muestreo estratificado y en etapas). Se caracteriza por que otorga la misma probabilidad de ser elegidos a todos los elementos de la poblacin. Para l calculo muestral, se requiere de: El tamao poblacional, si sta es finita, del error admisible y de la estimacin de la varianza.

DISTRIBUCION DE MUESTREO En estadstica, la distribucin muestral es lo que resulta de considerar todas las muestras posibles que pueden ser tomadas de una poblacin. Su estudio permite calcular la probabilidad que se tiene, dada una sola muestra, de acercarse al parmetro de la poblacin. Mediante la distribucin muestral se puede estimar el error para un tamao de muestra dado. TEOREMA CENTRAL DE LIMITE El Teorema Central del Lmite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribucin (cualquiera que ste sea), la suma de ellas se distribuye segn una distribucin normal.

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye segn una distribucin normal. Este teorema se aplica tanto a suma de variables discretas como de variables continuas.

ESTIMACION PUNTUAL Y DE INTERVALOS Estimacin puntual Consiste en la estimacin del valor del parmetro mediante un slo valor, obtenido de una frmula determinada. Por ejemplo, si se pretende estimar la talla media de un determinado grupo de individuos, puede extraerse una muestra y ofrecer como estimacin puntual la talla media de los individuos. Lo ms importante de un estimador, es que sea un estimador eficiente. Es decir, que sea insesgado(ausencia de sesgos) y estable en el muestreo o eficiente (varianza mnima) Estimacin puntual Sea X una variable poblacional con

distribucin F , siendo desconocido. El problema de estimacin puntual consiste en, seleccionada una muestra X1, ..., Xn, encontrar el estadstico T(X1, ..., Xn) que mejor estime el parmetro . Una vez observada o realizada la muestra, con valores x1, ..., xn, se obtiene la estimacin puntual de , T(x1, ..., xn) = . Vemos a continuacin dos mtodos para obtener la estimacin puntual de un parmetro: mtodo de los momentos y mtodo de mxima verosimilitud. 107108 Captulo 7. Estimacin puntual y por Intervalos de Con anza 7.2.1. Mtodos de estimacin puntual Mtodo de los momentos: consiste en igualar momentos poblacionales a momentos muestrales. Deberemos

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin tener tantas igualdades como parmetros a estimar. Momento poblacional de orden r r = E(Xr ) Momento muestral de orden r ar = Xn i=1 Xr i n Mtodo de mxima verosimilitud: consiste en tomar como valor del parmetro aquel que maximice la probabilidad de que ocurra la muestra observada. Si X1, ..., Xn es una muestra seleccionada de una poblacin con distribucin F o densidad f(x), la probabilidad de que ocurra una realizacin x1, ..., xn viene dada por: L(x1, ..., xn) = Yn i=1 f(xi ) A L(x1, ..., xn) se le llama funcin de verosimilitud.(credibilidad de la muestra observada). Buscamos entonces el valor de que maximice la funcin de verosimilud, y al valor obtenido se le llama estimacin por mxima verosimilitud de . Nota: si la variable X es discreta, en lugar de f (xi ) consideramos la funcin masa de probabilidad p(xi ). Ejemplo 7.1: Sea X N(, ), con desconocido. Seleccionada una m.a.s. X1, ..., Xn, con realizacin x1, ..., xn, estimamos el parmetro por ambos mtodos. Segn el mtodo de los momentos: E(X) = Xn i=1 Xi n = X, y al ser = E(X) se obtiene que = x. Por el mtodo de mxima verosimilitud: L(x1, ..., xn) = Yn i=1 f(xi ) = = Yn i=1 1 2 e (xi) 2 2 Estimacin por Intervalos de conanza 109 y maximizamos en tal funcin; en este caso resulta ms fcil maximizar su logaritmo: lnL(x1, ..., xn) = 1 2 2 Xn i=1 (xi ) 2 n ln( 2) lnL(x1, ..., xn) = 1 2 Xn i=1 (xi ) = n x n 2 = 0 = Estimacin por intervalos Consiste en la obtencin de un intervalo dentro del cual estar el valor del parmetro estimado con una cierta probabilidad. El intervalo se contruye a partir de una muestra, entonces, para cada muestra se tendr un intervalo distinto. Llamaremos a al error que se permite al dar el intervalo y el nivel de confianza ser 1- . Un

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin intervalo tiene un nivel de confianza 1- cuando el 100(1- )% de los intervalos que se construyen para el parmetro lo contienen. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIN

En la realidad, normalmente no se conoce cmo es una poblacin ( se conoce

, pero no se conoce ). Sin embargo, se

puede estudiar una muestra de esa poblacin y del conocimiento de la muestra sacar conclusiones sobre la poblacin. Si de una poblacin se conoce su desviacin tpica

y buscamos un

intervalo en el que est la media con un nivel de confianza del

(1 ) %, el intervalo es:
X z siempre que la poblacin de partida sea Normal , X z n n 2 2

o el tamao de la muestra n 30. Error mximo admisible: Error = z


2

Ejemplo: Si conocemos que la desviacin tpica para la altura de las chicas de 18 aos en Aragn es 10 cm. Supongamos que hemos tomado una muestra de 100 chicas sale que la altura media de la muestra: X =170. a) Hallar los intervalos de confianza para la altura media de las chicas de 18 aos en Aragn para un nivel de confianza del 90%, 95% y 99% y el error mximo en cada caso:

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin Nivel de conf.del 90%: (168,355 , 171,645)
Error = 1,645 10 100 (170 10 100 1,645

, 170 +

10 100

1,645)

= 1,645
10 100 1,96 , 170 + 10 100 1,96) = (168,04,

Nivel de conf.del 95%: 171,96)


Error =1,96

(170

10 100

= 1,96

Nivel de conf.del 99%: (167,425 , 172,575)


Error = 2,575 10 100

(170

10 100

2,575

, 170 +

10 100

2,575)

= 2,575

b) Para un nivel de confianza del 95% Cul debe ser el tamao de la muestra para que el error mximo admisible sea menor que 1 cm.?
10 n

Error = 1,96
n > 384,16

<1,

despejado n queda: 19,6<

n > (19,6) 2

es decir, el tamao de la muestra debe ser 385 o ms. HIPOTESIS ESTADISTICA, NULA Y ALTERNA

Los contrastes de hiptesis o de significacin permiten verificar la veracidad de alguna hiptesis establecida acerca de una poblacin, determinando si los valores difieren significativamente de los esperados por la hiptesis, o si las diferencias observadas se deben al azar.

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin Una hiptesis estadstica es una suposicin que se plantea respecto a un problema o a una poblacin, con el fin de rechazarla o no. En los contrastes de hiptesis se distinguen dos hiptesis estadsticas: la hiptesis nula designada por H0, conocida tambin como hiptesis de no diferencia, que es la que se establece en principio con el nico propsito de rechazarla o "anularla"; y una segunda, la hiptesis de investigacin o alterna, Ha, que es complementaria de la primera. Cuando se habla de contrastar una hiptesis nula contra una alterna, esto siempre se hace suponiendo que la nula es verdadera. En general la forma de las hiptesis nula y alterna es: H0: parmetro poblacional = ( , ) valor

supuesto Ha: parmetro poblacional ( > , < ) valor supuesto REGLA DE DECISION, ERRORES TIPO I Y II El procedimiento de contrastar una hiptesis nula contra una alterna sobre la base de informacin obtenida de la muestra conduce a dos tipos de errores posibles, debido a fluctuaciones al azar en el muestreo. Si la hiptesis nula es en realidad verdadera, pero los datos de la muestra son incompatibles con ella y se rechaza, se comete un Error Tipo I. Por otro lado, si la hiptesis nula es falsa y los datos de la muestra conllevan a no rechazarla, se comete un Error Tipo II. En el cuadro siguiente se resumen estos tipos de errores: Decisiones Eventos No rechazar Rechazar H0 H0 V H0 no error Error Tipo I

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin (confianza) Error Tipo II P(E.T.II) = P(E.T.I) = no error (potencia)

H0 F

Las probabilidades de cometer errores Tipo I y II se pueden considerar como los riesgos de decisiones incorrectas. La probabilidad de cometer un error Tipo I (de rechazar una hiptesis nula dado que sta es verdadera) se llama nivel de significacin y se denota por (alfa). La probabilidad de cometer un error Tipo II (de no rechazar una hiptesis nula dado que sta es falsa) no tiene nombre en particular, pero se denota por (beta). La probabilidad de no rechazar una hiptesis nula verdadera es la confianza, 1 , con la cual se trabaj para hacer estimaciones por intervalo. Cuando se rechaza una hiptesis nula falsa se ha tomado una decisin correcta y la probabilidad de hacerlo se denomina potencia o poder de la prueba y es 1 . En smbolos esto se expresa de la siguiente manera: P(E.T.I) = P(Rechazar H0H0 V) = P(No rechazar H0H0 V) = Confianza = 1 P(E.T.II)=P(No rechazar H0H0 F) = P(Rechazar H0H0 F) = Potencia = 1 NIVEL DE SIGNIFICACION El nivel de significancia lo fija el investigador, y en la prctica se usa el 1%, el 5% o el 10%. CONTRASTE DE HIPOTESIS Un procedimiento de contraste ideal debera tener = 0 y = 0. Sin embargo, en la prctica, una vez fijado n esto no es posible, por lo que se debe procurar que tanto como sean lo ms pequeos posible.

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin Los pasos a seguir en un contraste de hiptesis son: 1.- Describir las caractersticas de la poblacin acerca de la cual se va a probar la hiptesis (establecer si se cumplen los supuestos del contraste). 2.- Formular las hiptesis nula y alterna (H0 y Ha). 3.- Escoger un nivel de significacin o probabilidad de Error Tipo I, . 4.- Seleccionar el estadstico de contraste cuya distribucin muestral sea conocida en el supuesto de que H 0 sea verdadera, pero sin hacer clculos todava 5.- Determinar la regin crtica o de rechazo, misma que depende del tipo de hiptesis, de la probabilidad del Error Tipo I y del estadstico de contraste. 6.- Calcular el estadstico de contraste. 7.- Tomar una decisin de rechazar H0 o no rechazarla. 8.- Dar una conclusin al problema.

Estos pasos se ilustran en los siguientes captulos 10 y 11 sobre estimaciones y contrastes de hiptesis para una y dos muestras y en el captulo 14 sobre regresin.

CONCLUSIN

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin Hoy en da es imposible pensar en instituciones que manejan cierto volmenes de datos e informaciones y que no utilicen sus herramientas para verificacin, planeacin y seguimiento de polticas, estudios de factibilidades, etc. Las Estadstica, por otro lado, si no se sabe manejar con cautela puede generar resultados falaces que podran a su vez llevar a la toma de decisiones erradas. Por consiguiente se recomienda un estudio pleno y cientfico de la materia a fin de que quien utilice sus servicios pueda hacerlo de manera objetiva y con resultados satisfactorios.

BIBLIOGRAFIA

Estadstica II Unidad IV Muestreo Aleatorio - Poblacin CANAVOS GEORGE. "Probabilidad y Estadstica". Edit. Mc. Graw Hill.1988 CHOU, Ya-Lun. "Anlisis Estadstico". Edit. . Interamericana. Segunda Edicin. 1990 CRAMER, Harold. "Teora de probabilidades y aplicaciones". Edit. Aguilar.1992

Você também pode gostar