Você está na página 1de 26

Estadstica Aplicada

Ingeniera En Industrias Alimentarias IAM-0511 2 Teora de la Estimacin


2.1 Introduccin a la Teora de la Estimacin 2.2 Propiedades de los Estimadores 2.3 Estimacin Puntual 2.4 Estimacin por Intervalos 2.4.1 Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida 2.4.2 Intervalos de Confianza para Proporciones 2.4.3 Intervalos de Confianza para una Varianza 2.5 Determinacin del tamao de una muestra para medias, y Proporciones

En este documento se encuentra el temario y material desarrollado.

2 Teora de la Estimacin
2.1 Introduccin a la Teora de la Estimacin

ESTIMACION
El objetivo principal de la estadstica inferencial es la estimacin, esto es que mediante el estudio de una muestra de una poblacin se quiere generalizar las conclusiones al total de la misma. Como vimos en la seccin anterior, los estadsticos varan mucho dentro de sus distribuciones muestrales, y mientras menor sea el error estndar de un estadstico, ms cercanos sern unos de otros sus valores. Existen dos tipos de estimaciones para parmetros; puntuales y por intervalo. Una estimacin puntual es un nico valor estadstico y se usa para estimar un parmetro. El estadstico usado se denomina estimador. Una estimacin por intervalo es un rango, generalmente de ancho finito, que se espera que contenga el parmetro.

2.2 Propiedades de los Estimadores

Propiedades de un Buen Estimador Insesgado.- Se dice que un estimador puntual es un estimador insesgado de si , para todo valor posible de . En otras palabras, un estimador insesgado es aquel para el cual la media de la distribucin muestral es el parmetro estimado. Si se usa la media muestral para estimar la media poblacional insesgado. , se sabe que la , por lo tanto la media es un estimador

Eficiente o con varianza mnima.- Suponga que 1 y 2 son dos estimadores insesgados de . Entonces, aun cuando la distribucin de cada estimador est centrada en el valor verdadero de , las dispersiones de las distribuciones alrededor del valor verdadero pueden ser diferentes. Entre todos los estimadores de que son insesgados, seleccione al que tenga varianza mnima. El resultante recibe el nombre de estimador insesgado con varianza mnima (MVUE, minimum variance unbiased estimator) de . En otras palabras, la eficiencia se refiere al tamao de error estndar de la estadstica. Si comparamos dos estadsticas de una muestra del mismo tamao y tratamos de decidir cual de ellas es un estimador mas eficiente, escogeramos la estadstica que tuviera el menor error estndar, o la menor desviacin estndar de la distribucin de muestreo. Tiene sentido pensar que un estimador con un error estndar menor tendr una mayor oportunidad de producir una estimacin mas cercana al parmetro de poblacin que se esta considerando.

Como se puede observar las dos distribuciones tienen un mismo valor en el parmetro slo que la distribucin muestral de medias tiene una menor varianza, por lo que la media se convierte en un estimador eficiente e insesgado. Coherencia.- Una estadstica es un estimador coherente de un parmetro de poblacin, si al aumentar el tamao de la muestra se tiene casi la certeza de que el valor de la estadstica se aproxima bastante al valor del parmetro de la poblacin. Si un estimador es coherente se vuelve mas confiable si tenemos tamaos de muestras mas grandes.

Suficiencia.- Un estimador es suficiente si utiliza una cantidad de la informacin contenida de la muestra que ningn otro estimador podra extraer informacin adicional de la muestra sobre el parmetro de la poblacin que se esta estimando. Es decir se pretende que al extraer la muestra el estadstico calculado contenga toda la informacin de esa muestra. Por ejemplo, cuando se calcula la media de la muestra, se necesitan todos los datos. Cuando se calcula la mediana de una muestra slo se utiliza a un dato o a dos. Esto es solo el dato o los datos del centro son los que van a representar la muestra. Con esto se deduce que si utilizamos a todos los datos de la muestra como es en el caso de la media, la varianza, desviacin estndar, etc; se tendr un estimador suficiente. 2.3 Estimacin Puntual Estimacin Puntual La inferencia estadstica est casi siempre concentrada en obtener algn tipo de conclusin acerca de uno o ms parmetros (caractersticas poblacionales). Para hacerlo, se requiere que un investigador obtenga datos muestrales de cada una de las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en los valores calculados de varias cantidades muestrales . Po ejemplo, representamos con (parmetro) el verdadero promedio de resistencia a la ruptura de conexiones de alambres utilizados para unir obleas de semiconductores. Podra tomarse una muestra aleatoria de 10 conexiones para determinar la resistencia a la ruptura de cada una, y la media muestral de la resistencia a la ruptura se poda emplear para sacar una conclusin acerca del valor de . De forma similar, si es la varianza de la distribucin de resistencia a la ruptura, el valor de la varianza muestral s 2 se podra utilizar pra inferir algo acerca de . Cuando se analizan conceptos generales y mtodos de inferencia es conveniente tener un smbolo genrico para el parmetro de inters. Se utilizar la letra griega para este propsito. El objetivo de la estimacin puntual es seleccionar slo un nmero, basados en datos de la muestra, que represente el valor ms razonable de . Una muestra aleatoria de 3 bateras para calculadora podra presentar duraciones observadas en horas de x1=5.0, x2=6.4 y x3=5.9. El valor calculado de la duracin media muestral es = 5.77, y es razonable considerar 5.77 como el valor ms adecuado de . Una estimacin puntual de un parmetro es un slo nmero que se puede considerar como el valor ms razonable de . La estimacin puntual se obtiene al seleccionar una estadstica apropiada y calcular su valor a partir de datos de la muestra dada. La estadstica seleccionada se llama estimador puntual de . El smbolo (theta sombrero) suele utilizarse para representar el estimador de y

la estimacin puntual resultante de una muestra dada. Entonces

se lee como

"el estimador puntual de

es la media muestral

". El

enunciado "la estimacin

puntual de es 5.77" se puede escribir en forma abreviada . Ejemplo: En el futuro habr cada vez ms inters en desarrollar aleaciones de Mg de bajo costo, para varios procesos de fundicin. En consecuencia, es importante contar con mtodos prcticos para determinar varias propiedades mecnicas de esas aleaciones. Examine la siguiente muestra de mediciones del mdulo de elasticidad obtenidos de un proceso de fundicin a presin: 44.2 43.9 44.7 44.2 44.0 43.8 44.6 43.1 Suponga que esas observaciones son el resultado de una muestra aleatoria. Se desea estimar la varianza poblacional muestral: . Un estimador natural es la varianza

En el mejor de los casos, se encontrar un estimador

para el cual

siempre.

Sin embargo, es una funcin de las Xi muestrales, por lo que en s misma una variable aleatoria. + error de estimacin entonces el estimador preciso sera uno que produzca slo pequeas diferencias de estimacin, de modo que los valores estimados se acerquen al valor verdadero.

2.4 Estimacin por Intervalos Estimacin por Intervalos Un estimado puntual, por ser un slo nmero, no proporciona por s mismo informacin alguna sobre la precisin y confiabilidad de la estimacin. Por ejemplo, imagine que se usa el estadstico para calcular un estimado puntual de la resistencia real a la ruptura de toallas de papel de cierta marca, y suponga que = 9322.7. Debido a la variabilidad de la muestra, nunca se tendr el caso de que = . El estimado puntual nada dice sobre lo cercano que esta de . Una alternativa para reportar un solo valor del parmetro que se est estimando es calcular e informar todo un intervalo de valores factibles, un estimado de intervalo o intervalo de confianza (IC). Un intervalo de confianza se calcula siempre seleccionando primero un nivel de confianza, que es una medida de el grado de fiabilidad en el intervalo. Un intervalo de confianza con un nivel de confianza de 95% de la resistencia real promedio a la ruptura podra tener un lmite inferior de 9162.5 y uno superior de 9482.9. Entonces, en un nivel de confianza de 95%, es posible tener cualquier valor de entre 9162.5 y 9482.9. Un nivel de confianza de 95% implica que 95% de todas las muestras dara lugar a un intervalo que incluye o cualquier otro parmetro que se est estimando, y slo 5% de las muestras

producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos creer que el valor del parmetro que se estima est dentro del intervalo. Una interpretacin correcta de la "confianza de 95%" radica en la interpretacin frecuente de probabilidad a largo plazo: decir que un evento A tiene una probabilidad de 0.95, es decir que si el experimento donde A est definido re realiza una y otra vez, a largo plazo A ocurrir 95% de las veces. Para este caso el 95% de los intervalos de confianza calculados contendrn a .

Esta es una construccin repetida de intervalos de confianza de 95% y se puede observar que de los 11 intervalos calculados slo el tercero y el ltimo no contienen el valor de . De acuerdo con esta interpretacin, el nivel de confianza de 95% no es tanto un enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que sucedera si se tuvieran que construir un gran nmero de intervalos semejantes. Encontrar z a partir de un nivel de confianza Existen varias tablas en las cuales podemos encontrar el valor de z, segn sea el rea proporcionada por la misma. En esta seccin se realizar un ejemplo para encontrar el valor de z utilizando tres tablas diferentes. Ejemplo: Encuentre el valor de z para un nivel de confianza del 95%. Solucin 1: Se utilizar la tabla que tiene el rea bajo la curva de hasta z. Si lo vemos grficamente sera:

El nivel de confianza bilateral est dividido en partes iguales bajo la curva:

En base a la tabla que se esta utilizando, se tendr que buscar el rea de 0.975, ya que cada extremo o cola de la curva tiene un valor de 0.025.

Por lo que el valor de z es de 1.96. Solucin 2: Si se utiliza una tabla en donde el rea bajo la curva es de 0 a z:

En este caso slo se tendr que buscar adentro de la tabla el rea de 0.475 y el resultado del valor de z ser el mismo, para este ejemplo 1.96. Solucin 3: Para la tabla en donde el rea bajo la curva va desde z hasta :

Se busca el valor de 0.025 para encontrar z de 1.96. Independientemente del valor del Nivel de Confianza este ser el procedimiento a seguir para localizar a z. En el caso de que no se encuentre el valor exacto se tendr que interpolar.

2.4.1 Intervalos de Confianza para la Media con varianza conocida y con Varianza desconocida Estimacin de la media con conocida. Es conocido de nosotros durante este curso, que en base a la distribucin muestral de medias que se gener en el tema anterior, la formula para el calculo

de probabilidad es la siguiente: . Como en este caso no conocemos el parmetro y lo queremos estimar por medio de la media de la muestra, slo se despejar de la formula anterior, quedando lo siguiente:

De esta formula se puede observar que tanto el tamao de la muestra como el valor de z se conocern. Z se puede obtener de la tabla de la distribucin normal a partir del nivel de confianza establecido. Pero en ocasiones se desconoce por lo que en esos casos lo correcto es utilizar otra distribucin llamada "t" de student si la poblacin de donde provienen los datos es normal. Para el caso de tamaos de muestra grande se puede utilizar una estimacin puntual de la desviacin estndar, es decir igualar la desviacin estndar de la muestra a la de la poblacin (s= ). Ejemplos: 1. Se encuentra que la concentracin promedio de zinc que se saca del agua a partir de una muestra de mediciones de zinc en 36 sitios diferentes es de 2.6 gramos por mililitro. Encuentre los intervalos de confianza de 95% y 99% para la concentracin media de zinc en el ro. Suponga que la desviacin estndar de la poblacin es 0.3. Solucin: La estimacin puntual de es = 2.6. El valor de z para un nivel de confianza del 95% es 1.96, por lo tanto:

Para un nivel de confianza de 99% el valor de z es de 2.575 por lo que el intervalo ser ms amplio:

El intervalo de confianza proporciona una estimacin de la presicin de nuestra estimacin puntual. Si es realmente el valor central de intervalo, entonces estima sin error. La mayor parte de las veces, sin embargo, no ser exactamente igual a y la estimacin puntual es errnea. La magnitud de este error ser el valor absoluto de la diferencia entre y , y podemos tener el nivel de confianza de que esta diferencia no exceder

. Como se puede observar en los resultados del ejercicio se tiene un error de estimacin mayor cuando el nivel de confianza es del 99% y ms pequeo cuando se reduce a un nivel de confianza del 95%. 2. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente distribuida de forma normal con una desviacin estndar de 40 horas. Si una muestra de 30 focos tiene una duracin promedio de 780 horas, encuentre un intervalos de confianza de 96% para la media de la poblacin de todos los focos que produce esta empresa. Solucin:

Con un nivel de confianza del 96% se sabe que la duracin media de los focos que produce la empresa est entre 765 y 795 horas. 3. La prueba de corte sesgado es el procedimiento ms aceptado para evaluar la calidad de una unin entre un material de reparacin y su sustrato de concreto. El artculo "Testing the Bond Between Repair Materials and Concrete Substrate" informa que, en cierta investigacin, se obtuvo una resistencia promedio muestral de 17.17 N/mm 2, con una muestra de 48 observaciones de resistencia al corte, y la desviacin estndar muestral fue 3.28 N/mm2. Utilice un nivel de confianza inferior del 95% para estimar la media real de la resistencia al corte. Solucin: En este ejercicio se nos presentan dos situaciones diferentes a los ejercicios anteriores. La primera que desconoce la desviacin estndar de la poblacin y la segunda que nos piden un intervalo de confianza unilateral. El primer caso ya se haba comentado y se solucionar utilizando la desviacin estndar de la muestra como estimacin puntual de sigma.

Para el intervalo de confianza unilateral, se cargar el rea bajo la curva hacia un solo lado como sigue:

Esto quiere decir que con un nivel de confianza de 95%, el valor de la media est en el intervalo (16.39, ). Estimacin de la Diferencia entre dos Medias 2 2 Si se tienen dos poblaciones con medias 1 y 2 y varianzas 1 y 2 , respectivamente, un estimador puntual de la diferencia entre 1 y 2 est dado por la estadstica . Por tanto. Para obtener una estimacin puntual de 12, se seleccionan dos muestras aleatorias independientes, una de cada poblacin, de tamao n1 y n2, se calcula la diferencia , de las medias muestrales. Recordando a la distribucin muestral de diferencia de medias:

Al despejar de esta ecuacin

se tiene:

En el caso en que se desconozcan las varianzas de la poblacin y los tamaos de muestra sean mayores a 30 se podr utilizar la varianza de la muestra como una estimacin puntual. Ejemplos: 1. Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galn de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las dems condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galn y el promedio para el motor B es 42 millas por galn. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estndar poblacionales son 6 y 8 para los motores A y B respectivamente. Solucin: Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor. En este caso ser la media del motor B menos la media del motor A. El valor de z para un nivel de confianza del 96% es de 2.05.

3.43< B- A<8.57 La interpretacin de este ejemplo sera que con un nivel de confianza del 96% la diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galn a favor del motor B. Esto quiere decir que el motor B da mas rendimiento promedio que el motor A, ya que los dos valores del intervalo son positivos. 2. Una compaa de taxis trata de decidir si comprar neumticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36,300 kilmetros y para la marca B 38,100 kilmetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviacin estndar de 5000 kilmetros para la marca A y 6100 kilmetros para la marca B. Solucin:

-2662.68< Grficamente:

<6262.67

Como el intervalo contiene el valor "cero", no hay razn para creer que el promedio de duracin del neumtico de la marca B es mayor al de la marca A, pues el cero nos est indicando que pueden tener la misma duracin promedio.

2.4.2 Intervalos de Confianza para Proporciones Estimacin de una Proporcin Un estimador puntual de la proporcin P en un experimento binomial est dado por la estadstica P=X/N, donde x representa el nmero de xitos en n pruebas. Por tanto, la proporcin de la muestra p =x/n se utilizar como estimador puntual del parmetro P.

Si no se espera que la proporcin P desconocida est demasiado cerca de 0 de 1, se puede establecer un intervalo de confianza para P al considerar la distribucin muestral de proporciones.

Al despejar P de esta ecuacin nos queda:

En este despeje podemos observar que se necesita el valor del parmetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporcin de la muestra p siempre y cuando el tamao de muestra no sea pequeo.

Cuando n es pequea y la proporcin desconocida P se considera cercana a 0 a 1, el procedimiento del intervalo de confianza que se establece aqu no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np nq sea mayor o igual a 5. El error de estimacin ser la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no exceder . Ejemplos: 1. Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la funcin elctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o ms pruebas. Encuentre un intervalo de confianza de 90% para la proporcin de los reproductores de discos compactos de la poblacin que no pasan todas las pruebas. Solucin: n=500 p = 15/500 = 0.03 z(0.90) = 1.645

0.0237<P<0.0376 Se sabe con un nivel de confianza del 90% que la proporcin de discos defectuosos que no pasan la prueba en esa poblacin esta entre 0.0237 y 0.0376. 2. En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20 defectuosas. Si la proporcin p de pilas defectuosas en esa muestra se usa para estimar P, que vendr a ser la proporcin verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast Company, encuentre el mximo error de estimacin tal que se pueda tener un 95% de confianza en que P dista menos de de p.

Solucin: p=x/n = 20/400=0.05 z(0.95)=1.96

Si p=0.05 se usa para estimar P, podemos tener un 95% de confianza en que P dista menos de 0.021 de p. En otras palabras, si p=0.05 se usa para estimar P, el error mximo de estimacin ser aproximadamente 0.021 con un nivel de confianza del 95%. Para calcular el intervalo de confianza se tendra: Esto da por resultado dos valores, (0.029, 0.071). Con un nivel de confianza del 95% se sabe que la proporcin de pilas defectuosas de esta compaa est entre 0.029 y 0.071. Si se requiere un menor error con un mismo nivel de confianza slo se necesita aumentar el tamao de la muestra. 3. En un estudio de 300 accidentes de automvil en una ciudad especfica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporcin de todos los accidentes automovilsticos que en esa ciudad tienen consecuencias fatales. Solucin: P= 60/300 = 0.20 Z(0.90) = 1.645

0.162<P<0.238 Estimacin de la Diferencia de dos Proporciones

En la seccin anterior se vio el tema de la generacin de las distribuciones muestrales, en donde se tena el valor de los parmetros, se seleccionaban dos muestras y podamos calcular la probabilidad del comportamiento de los estadsticos. Para este caso en particular se utilizar la distribucin muestral de diferencia de proporciones para la estimacin de las misma. Recordando la formula:

Despejando P1-P2 de esta ecuacin:

Aqu se tiene el mismo caso que en la estimacin de una proporcin, ya que al hacer el despeje nos queda las dos proporciones poblacionales y es precisamente lo que queremos estimar, por lo que se utilizarn las proporciones de la muestra como estimadores puntuales:

Ejemplos: 1. Se considera cierto cambio en un proceso de fabricacin de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si ste tiene como resultado una mejora. Si se encuentra que 75 de 1500 artculos del procedimiento actual son defectuosos y 80 de 2000 artculos del procedimiento nuevo tambin lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fraccin de defectuosos entre el proceso actual y el nuevo. Solucin: Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aqu, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.

-0.0017<P1-P2<0.0217 Como el intervalo contiene el valor de cero, no hay razn para creer que el nuevo procedimiento producir una disminucin significativa en la proporcin de artculos defectuosos comparado con el mtodo existente. 2. Un artculo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones importantes entre recin nacidos con madres fumadoras de marihuana y de madres que no la fumaban:
Usuaria Tamao Muestral Nmero de disfunciones Proporcin muestral 1246 42 0.0337 No Usuaria 11178 294 0.0263

Encuentre el intervalo de confianza del 99% para la diferencia de proporciones. Solucin: Representemos P1 la proporcin de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P 2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.

-0.0064<P1-P2<0.0212 Este intervalo es bastante angosto, lo cual sugiere que P 1-P2 ha sido estimado de manera precisa. 2.4.3 Intervalos de Confianza para una Varianza

Intervalo de confianza para la varianza


Para estimar un intervalo de confianza para la varianza, nos ayudaremos de la siguiente propiedad de la distribucin :

Consideremos dos cuantiles de esta distribucin que nos dejen una probabilidad ``zona central'' de la distribucin (cf. figura 8.7):

en la

Figura: Cuantiles de la distribucin

Entonces un intervalo de confianza al nivel para la varianza de una distribucin gaussiana (cuyos parmetros desconocemos) lo obtenemos teniendo en cuenta que existe una probabilidad de que:

Por tanto el intervalo que buscamos es

Ejemplo
En un ejemplo anterior se estudiaba la altura de los individuos de una ciudad, obtenindose en una muestra de tamao 25 los siguientes valores:

Calcular un intervalo de confianza con individuos de la ciudad. Solucin: Para estimar un intervalo de confianza para resulta til es:

para la varianza

de la altura de los

(varianza poblacional) el estadstico que nos

Entonces el intervalo de confianza que buscamos lo obtenemos mediante (cf. figura 8.8) Figura: Percentiles del 2,5% y del 97,5% para la
distribucin .

Por tanto, para el valor poblacional de la desviacin tpica tenemos que

con una confianza del 95%, que por supuesto contiene a las estimaciones puntuales y calculados sobre la muestra.

INTERVALO DE CONFIANZA PARA EL COCIENTE DE VARIANZAS EN POBLACIONES NORMALES Las circunstancias especficas para la construccin de este intervalo son las siguientes:

Intervalo para el cociente de dos varianzas poblacionales Realizamos dos muestras aleatorias simples de tamaos n y m De dichas muestras se extraen las varianza muestrales Conocemos que las poblaciones 1 y 2 para cuya razn de varianzas queremos construir el intervalo son Normales. Lgicamente prefijamos un nivel de confianza de 1- . Conocemos segn vimos cuando estudiamos las distribuciones muestrales de normales que : por el lema de Fisher - Cochran :

para las dos poblaciones que tenemos se dar . y : ntese que el tamao muestral de la muestra de 1 es n y la de 2 es m dado que nos interesa la razn de varianzas y en aplicacin de la expresin de la F de Snedecor:

tendremos

arreglando el Cociente

dado que nos interesa el cociente inverso

tendramos que:

donde esta incluida la razn de varianzas para la cual queremos crear un intervalo .

Si hemos establecido un nivel de confianza de 1- el intervalo para una F(m-1)(n-1) vendra dado por las constantes L1 y L2 , adoptndose el criterio simplificador , prximo al de mayor longitud , de considerar:

de manera que

y por otra parte : una vez determinados los valores de L1 y

L2 tendramos el intervalo

despejando la razn que nos interesa tendramos :

Evidentemente si plantemos medir la diferencia entre las varianzas , cuanto ms prximo se la razn a la unidad menor diferencia habr entre las varianzas y lgicamente cuando la razn entre estas difiera mucho de 1 ,la diferencia entre varianzas ser mas ostensible.

2.5 Determinacin del tamao de una muestra para medias, y Proporciones TAMAO DE LA MUESTRA A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la

varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo del tamao muestral delimitemos estos factores.

Para calcular el tamao de una muestra hay que tomar en cuenta tres factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la poblacin total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalizacin. 3. El nivel de variabilidad que se calcula para comprobar la hiptesis. La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero tambin implica estudiar a la totalidad de los casos de la poblacin. Para evitar un costo muy alto para el estudio o debido a que en ocasiones llega a ser prcticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menor. Comnmente en las investigaciones sociales se busca un 95%. El error o porcentaje de error equivale a elegir una probabilidad de aceptar una hiptesis que sea falsa como si fuera verdadera, o la inversa: rechazar a hiptesis verdadera por considerarla falsa. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamao que la poblacin, por lo que conviene correr un cierto riesgo de equivocarse. Comnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error. La variabilidad es la probabilidad (o porcentaje) con el que se acept y se rechaz la hiptesis que se quiere investigar en alguna investigacin anterior o en un ensayo previo a la investigacin actual. El porcentaje con que se acept tal hiptesis se denomina variabilidad positiva y el porcentaje con el que se rechaz se la hiptesis es la variabilidad negativa El muestreo es el proceso de tomar una proporcin o parte de un universo de elementos, con la finalidad de analizar en dichos elementos, caractersticas sujetas a estudio o fenmenos factibles de observacin y en base al anlisis de la muestra o proporcin tomada obtener conclusiones que se refieran no slo a la muestra sino a todo el universo. Para fines estadsticos, el universo puede considerarse finito o infinito. Se considera finito si el nmero de elementos que lo constituyen es menor a 500,000 e infinito si es igual o mayor a este nmero. Siempre que hagamos la eleccin de una muestra, debemos tener cuidado de que sta rena las siguientes caractersticas: Que sea suficiente: es decir que la cantidad de elementos seleccionados sea el que se requiere para que el nivel de confiabilidad sea el que se ha establecido previamente. Que sea representativa: esto quiere decir que los elementos seleccionados debern presentar caractersticas similares a las de la poblacin o universo. Al utilizar muestras en lugar de universos tenemos grandes ventajas, algunas de las ms importantes son: El costo se reduce, pues los gastos sern nicamente los ocasionados por una parte del universo (muestra tomada) y no por la totalidad de l. Si la muestra es representativa, las deducciones resultantes sobre el universo sern confiables.

Como solamente se estudia una parte del universo, la informacin obtenida se realiza en menor tiempo.

Cmo obtener el tamao de la muestra a utilizar?


Una de las preguntas planteadas con mayor frecuencia al iniciar una investigacin y difcil de contestar, sobre todo por falta de informacin del problema, es: cuntas observaciones se deben obtener para que el tamao de la muestra sea realmente representativo del universo estadstico? En este sentido -la decisin del tamao de la muestra de una poblacin -, es necesario considerar que las muestras varan en su composicin de una a otra. La magnitud de la variacin depende del tamao de la muestra y de la variabilidad original de la poblacin. As, el tamao de la muestra queda determinada por el grado de precisin que se desea obtener y por variabilidad inicial de la poblacin. La respuesta a la pregunta planteada se puede considerar tomando como base lo siguientes: 1. Determinar el nivel de confianza con el cual vamos a trabajar y buscamos el valor de z asociado a dicho nivel de confianza, un nivel de confianza igual o mayor al 92% es aceptable estadsticamente. 2. Evaluar la probabilidad a favor de que suceda un evento o situacin esperada (esta probabilidad se le denomina p). 3. Evaluar la probabilidad en contra de que suceda en un evento o situacin esperada (a esta probabilidad se le denomina q= 1 p). 4. Determinar el error (e) mximo para el nivel de precisin que vayamos a permitir en los resultados (error mximo de estimacin), comnmente se trabaja con errores de estimacin entre el 2% y el 6%, ya que la validez de la informacin se reduce demasiado para valores mayores del 6%. Determinamos el tamao de la poblacin o universo. 5.- Se elige la frmula a utilizar para calcular el tamao de la muestra; dependiendo de si la poblacin o universo sujeto a estudio se va a considerar infinito infinito. (Una poblacin o universo se considera infinito si el nmero de elementos de los que consta es igual o mayor a 500,000 y es considerado finito si el nmero de elementos es menor a esta cantidad). Diferentes niveles de confianza utilizados en la prctica
Nivel de Confianza Valores de Z 99.73% 3.00 99% 2.58 98% 2.33 96% 2.05 95.45% 2.00 95% 1.96 90% 1.645 80% 1.28 68.27% 1.00 50% 0.6745

El tamao de la muestra: Al realizar un muestreo probabilstica nos debemos preguntar Cul es el nmero mnimo de unidades de anlisis ( personas, organizaciones, capitulo de telenovelas, etc), que se necesitan para conformar una muestra ( n) que me asegure un error estndar menor que 0.01 ( fijado por el muestrista o investigador), dado que la poblacin N es aproximadamente de tantos elementos. En el tamao de una muestra de una poblacin tenemos que tener presente adems si es conocida o no la varianza poblacional. Para determinar el tamao de muestra necesario para estimar con un error mximo permisible d prefijado y conocida la varianza poblacional ( 2 ) podemos utilizar la formula:
Z1 2 n = d
2

que se obtiene de reconocer que la expresin d =

(1) es el error estndar o error mximo prefijado y est dado por

precisin de la estimacin, por lo que podemos inferir adems que P{ x < d } = 1 . Ejemplo 1.2 Se desea estimar el peso promedio de los sacos que son llenados por un nuevo instrumento en una industria. Se conoce que el peso de un saco que se llena con este instrumento es una variable aleatoria con distribucin normal. Si se supone que la desviacin tpica del peso es de 0,5 kg. Determine el tamao de muestra aleatoria necesaria para determinar una probabilidad igual a 0,95 de que el estimado y el parmetro se diferencien modularmente en menos de 0,1 kg. Solucin:
Z1 2 n = d 1 2 = 0,975

Z1 para el nivel de confianza 1 y constituye una medida de la


2

d = 0,1 = 0,5

1 = 0,95

( 0,5)(1,96) 2 = 96,4 = 0,1

Z1 2 = 1,96
Evidentemente un tamao de muestra no puede ser fraccionario por lo que se debe aproximar por exceso. El tamao de muestra sera de 97. Si la varianza de la poblacin es desconocida, que es lo que mas frecuente se ve en la prctica el tratamiento ser diferente, no es posible encontrar una frmula cuando la varianza poblacional es desconocida por lo que para ello aconsejamos utilizar el siguiente procedimientoPrimeramente, se toma una pequea muestra, que se le llama muestra piloto, con ella se estima la varianza poblacional ( 2 ) y con este valor se evala en la formula (1), sustituyendo ( 2 ) por su estimacin ( s 2 ). El valor de n obtenido ser aproximadamente el valor necesario, nuevamente con ese valor de n se extrae una muestra de este tamao de la poblacin se le determina la varianza a esa muestra, como una segunda estimacin de ( 2 ) y se aplica de nuevo la formula (1), tomando la muestra con el n obtenido como muestra piloto para la siguiente iteracin, se llegar a cumplir con las restricciones prefijadas. Se puede plantear esta afirmacin ya que la s 2

de 2 tiende a estabilizarse a medida que aumenta n alrededor de la 2 por lo que llegar el momento en que se encuentre el tamao de muestra conveniente, sin embargo, en la prctica es mucho ms sencillo pues, a lo sumo con tres iteraciones se obtiene el tamao de muestra deseado, este procedimiento para obtener el tamao de muestra deseado se puede realizar utilizando en Microsoft Excel en la opcin anlisis de datos las opciones estadstica descriptiva para ir hallando la varianza de cada una de las muestras y la opcin muestra para ir determinado las muestras pilotos. Para obtener el tamao de la muestra utilizando este mtodo recomendamos la utilizacin de un paquete de computo como por ejemplo el Microsoft Excel, aplicando las opciones muestra y estadstica descriptiva. Para determinar el tamao de la muestra cuando los datos son cualitativos es decir para el anlisis de fenmenos sociales o cuando se utilizan escalas nominales para verificar la ausencia o presencia del fenmeno a estudiar, se recomienda la utilizacin de la siguiente formula:

n=
siendo n' =

n' 1 + n' N

(2)

s2

2 es la varianza de la poblacin respecto a determinadas variables.

sabiendo que:

s 2 es la varianza de la muestra, la cual podr determinarse en trminos de probabilidad como s 2 = p (1 p ) se es error estandar que est dado por la diferencia entre ( x ) la media poblacional y la media muestral. ( se ) 2 es el error estandar al cuadrado, que nos servir para determinar 2 , por lo que
Ejemplo 1.3 De una poblacin de 1 176 adolescentes de una ciudad X se desea conocer la aceptacin por los programas humorsticos televisivos y para ello se desea tomar una muestra por lo que se necesita saber la cantidad de adolescentes que deben entrevistar para tener una informacin adecuada con error estandar menor de 0.015 al 90 % de confiabilidad. Solucin: = 1 176 N se = 0,015 2 = ( se) 2 = (0,015) 2 = 0.000225
s 2 = p (1 p ) = 0,9(1 0,9) = 0,09

2 = ( se ) 2 es la varianza poblacional.

por lo que n' =

s2

n=

n' 400 = = 298 n ' 400 1+ N 1+ 1176

0,09 = 400 0,000225

Es decir para realizar la investigacin se necesita una muestra de al menos 298 adolescentes.

Clculo del tamao de la muestra A la hora de determinar el tamao que debe alcanzar una muestra hay que tomar en cuenta varios factores: el tipo de muestreo, el parmetro a estimar, el error muestral admisible, la varianza poblacional y el nivel de confianza. Por ello antes de presentar algunos casos sencillos de clculo del tamao muestral delimitemos estos factores. Parmetro. Son las medidas o datos que se obtienen sobre la poblacin. Estadstico. Los datos o medidas que se obtienen sobre una muestra y por lo tanto una estimacin de los parmetros. Error Muestral, de estimacin o standard. Es la diferencia entre un estadstico y su parmetro correspondiente. Es una medida de la variabilidad de las estimaciones de muestras repetidas en torno al valor de la poblacin, nos da una nocin clara de hasta dnde y con qu probabilidad una estimacin basada en una muestra se aleja del valor que se hubiera obtenido por medio de un censo completo. Siempre se comete un error, pero la naturaleza de la investigacin nos indicar hasta qu medida podemos cometerlo (los resultados se someten a error muestral e intervalos de confianza que varan muestra a muestra). Vara segn se calcule al principio o al final. Un estadstico ser ms preciso en cuanto y tanto su error es ms pequeo. Podramos decir que es la desviacin de la distribucin muestral de un estadstico y su fiabilidad. Nivel de Confianza. Probabilidad de que la estimacin efectuada se ajuste a la realidad. Cualquier informacin que queremos recoger est distribuida segn una ley de probabilidad (Gauss o Student), as llamamos nivel de confianza a la

probabilidad de que el intervalo construido en torno a un estadstico capte el verdadero valor del parmetro. Varianza Poblacional. Cuando una poblacin es ms homognea la varianza es menor y el nmero de entrevistas necesarias para construir un modelo reducido del universo, o de la poblacin, ser ms pequeo. Generalmente es un valor desconocido y hay que estimarlo a partir de datos de estudios previos.
Tamao de muestra para estimar la media de la poblacin Veamos los pasos necesarios para determinar el tamao de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error mximo que estamos dispuestos a admitir en nuestra estimacin. As pues los pasos a seguir son:

Veamos los pasos necesarios para determinar el tamao de una muestra empleando el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error mximo que estamos dispuestos a admitir en nuestra estimacin. As pues los pasos a seguir son: 1.- Obtener el tamao muestral imaginando que N>

Donde: : z correspondiente al nivel de confianza elegido : varianza poblacional e: error mximo 2.- Comprobar si se cumple

Si esta condicin se cumple el proceso termina aqu, y ese es el tamao adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamao de la muestra segn la siguie n te frmula:

Veamos un ejemplo: La Consejera de Trabajo planea un estudio con el inters de conocer el promedio de horas semanales trabajadas por las mujeres del servicio domstico. La muestra ser extrada de una poblacin de 10000 mujeres que

figuran en los registros de la Seguridad Social y de las cuales se conoce a travs de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error mximo de 0,1, cul debe ser el tamao muestral que Empleemos?. Buscamos en las tablas de la curva normal el valor de el nivel de confianza elegido: = arriba. 1. que corresponde con

1.96 y seguimos los pasos propuestos

2.- Comprobamos que no se cumple, pues en este caso 10000 < 3706 (3706 - 1); 10000 < 13730730 3.-

Tamao de muestra para estimar la proporcin de la poblacin

Para calcular el tamao de muestra para la estimacin de proporciones poblaciones hemos de tener en cuenta los mismos factores que en el caso de la media. La frmula que nos permitir determinar el tamao muestral es la siguiente:

donde : z correspondiente al nivel de confianza elegido P: proporcin de una categora de la variable e: error mximo N: tamao de la poblacin Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporcin de mujeres que trabajan diariamente 10 horas o ms. De un estudio piloto se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error mximo 0.02.

TAMAO DE LA MUESTRA PARA ESTIMAR LA MEDIA CON MUESTREO SIMPLE ALEATORIO

Para estimar la media poblacional utilizando una variable aleatoria continua se utiliza la siguiente relacin:
n=
2 N .S 2 Z 2 2 N .d 2 + S 2 Z 2

de donde:

n = tamao de la muestra.
N = tamao de la poblacin.
Z 2 = variable estandarizada de distribucin normal.

S = varianza de la muestra.

d(e) = precisin del muestreo.

= Nivel de significancia.
Generalmente es necesario hacer un premuestreo de 30 elementos, con el objetivo de hacer una primera estimacin de S. Ejemplo: En un lote de frascos para medicina, con una poblacin de 8000 unidades, se desea estimar la media de la capacidad en centmetros cbicos de los mismos. A travs de un premuestreo de tamao 35 se ha estimado que la desviacin estndar es de 2 centmetros cbicos. Si queremos tener una precisin 0.25 cms 3, y un nivel de significancia del 5%. De que tamao debe de ser la muestra? DATOS: S = 2 cms3; N = 8000; d = 0.25 cms3; = 0.05 (5%)
Z 2 = 1.96
2 N .S 2 Z 2

n=

Nd + S

2 Z 2

8000( 2 ) 2 ( 1.96 ) 2 8000( 0.25 ) +( 2 ) ( 1.96 )


2 2 2

122931.2 = 239 515.37

Frascos.

Solo faltara muestrear 204 frascos, pues los datos de los 35 frascos del premuestreo siguen siendo vlidos. TAMAO DE LA MUESTRA PARA ESTIMAR PROPORCIONES CON MUESTREO SIMPLE ALEATORIO

En bastantes ocasiones, la variable bajo estudio es de tipo binomial, en ese caso para calcular el tamao de muestra bajo el muestreo simple aleatorio, se hara de la siguiente manera:
n=
2 N . p .q .Z 2 2 N .d 2 + p .q .Z 2

De donde: p = probabilidad de xito. q = probabilidad de fracaso. d = precisin expresada en porcentaje. En este caso para la estimacin de la varianza, tenemos dos opciones: a) hacer un premuestreo. b) asumir varianza mxima. Ejemplo: En una investigacin, se desea determinar en que proporcin los nios de una regin toman leche en el desayuno. Si se sabe que existen 1.500 nios y deseamos tener una precisin del 10 %, con un nivel de significancia del 5 % . De que tamao debe de ser la muestra? DATOS: N = 1500; d = 10 % = 0.1; = 5 % p = 0.5 y q = 0.5 (asumiendo varianza mxima). Z/2 = 1.96
n=
2 N . p .q .Z 2

N .d

2 + p .q .Z 2

1500( 0.5 )( 0.5 )( 1.96 )2 1500( 0.1 ) +( 0.5 )( 0.5 ) / 1.96 )


2 2

1440.6 = 90 15,96

Se deben de muestrear 90 nios.

Você também pode gostar