Você está na página 1de 9

El problema de la estimacin de la media de la poblacin

Parmetros de la muestra
Consideremos una poblacin, con una distribucin normal respecto de una
variable aleatoria; extraemos una muestra por alguno de los procedimientos del
epgrafe anterior.
Para la variable aleatoria que estamos considerando podemos calcular la media y
la desviacin tpica en la muestra, que en general sern distintas a las
correspondientes de la poblacin :

Si la muestra tiene n individuos y los valores concretos que toma la variable


aleatoria X son : x1 , x2 , ...,xn , los parmetros que se calculan en la muestra son :
La media muestral :

La varianza muestral y la desviacin tpica muestral :

La cuasivarianza muestral y la cuasidesviacin tpica muestral :

Consideremos una poblacin, con una variable aleatoria X que se distribuye


normalmente, y donde conocemos que la desviacin tpica es ; slo
desconocemos la media de la poblacin, .
Tomamos muestras de tamao n y calculamos la media muestral para cada
muestra :

El valor que toma la media muestral depender de la muestra seleccionada, como


la toma de la muestra es aleatoria, la media muestral es una variable aleatoria ;
como cada valor que toma esta variable aleatoria, depende de la suma
de nvalores, por el Teorema Central del Lmite, sabemos que adems se
distribuye normalmente.

Estimacin puntual de la media


Hemos visto como las medias de las muestras se distribuyen normalmente en
torno a la media de la poblacin, con una desviacin tpica que disminuye cuando
aumenta el tamao de la muestra.
Por tener estas cualidades, se dice que la media muestral
es centrada y consistente para estimar la media de la poblacin, es decir es un
buen estimador puntual para conocer la media de una poblacin, en el caso de
que sta se desconozca.
La media muestral nos da una buena aproximacin de la media de la poblacin,
cuando sta se desconoce; pero no da ninguna otra informacin, nada acerca de si
la aproximacin ha sido buena o si por el contrario ha sido mala, ni de los
porcentajes o probabilidades de que sea buena o mala.

Este inconveniente lo evitamos utilizando la estimacin de la media por


intervalos de confianza.
Estimacin de la media de la poblacin por intervalos de confianza
Sabemos como se distribuyen las medias muestrales, slo desconocemos la
media de la poblacin. Si supiramos la media de la poblacin, podramos
calcular un intervalo, alrededor de la media, tal que con una probabilidad dada,
las medias de las muestras estuvieran dentro de ese intervalo.
Por ejemplo, supongamos que queremos que la probabilidad de que la media de
una muestra est dentro del intervalo a calcular, sea de 0,95; slo tenemos que
tipificar y mediante la tabla de la distribucin normal estndar, calcular t para
= 1-0,95=0,05

Como no conocemos la media de la poblacin, , la sustituimos por la media de


la muestra, con lo cual el intervalo ser diferente para cada muestra, pero, con
probabilidad 1- , la media de la poblacin, estar dentro del intervalo as
calculado.

As, basndonos en la media de la muestra, damos un intervalo en el que


podemos suponer que se encuentra la media de la poblacin con una confianza
del 1-.
Intervalo de confianza para la media de la poblacin
El intervalo de confianza, para la media de una poblacin, con un nivel de confianza de 1 , siendo X la media de una muestra de tamao n y la desviacin tpica de la poblacin,
es:

Error mximo
El error maximo en la estimacin, que se comete con una confianza del 1-, es:

De las variables que intervienen en la estimacin, error mximo, confianza y


tamao de la muestra N, siempre podremos fijar dos y calcular la tercera, por
tanto en ocasiones, fijamos el error mximo, la confianza y calculamos el tamao
de la muestra:
Tamao de la muestra

Observacin
Estamos suponiendo que la desviacin tpica de la poblacin es conocida, pero es
raro que no se conozca la media y se conozca la desviacin tpica; lo normal, ser
que no se conozca ni la media ni la desviacin tpica de la poblacin.
La varianza de la muestra no es un estimador centrado de la varianza de la
poblacin, y sin embargo, la cuasivarianza de la muestra, s es un estimador
centrado de la varianza de la poblacin; por tanto, es mejor estimador de la
varianza de la poblacin, la cuasivarianza de la muestra.
Como :

Para valores grandes de n es prcticamente igual, tomar como estimador de la


varianza de la poblacion, la varianza o la cuasivarianza de la muestra; pero, para
valores pequeos de n (en la prctica se considera pequeo n 30), es mejor
estimar la varianza de la poblacin, mediante la cuasivarianza.
Un ejemplo sencillo, para los que, como Santo Toms, necesitan ver para c
Contrastes ortogonales:Un contraste en estadstica es una combinacin lineal de las medias de
lostratamientos definida por la suma de productos de las medias de tratamientopor un coeficiente.
Estos coeficientes deben cumplir con la caracterstica deque su suma es igual a cero, de tal
manera que para algunas medias suscoeficientes asociados son positivos y para otras
son negativos. Las reglas deasignacin de los coeficientes va a depender de la tendencia que se
deseeencontrar o de la comparacin de medias que se desee hacer. Cada contrastetendr
asociado un grado de libertad, debido a que la comparacin que se llevaa cabo es entre dos
grupos de tratamientos, lo que llevan el signo positivocontra los que llevan el signo negativo. De
esta manera el numero de posiblescontrastes ortogonales en un conjunto de datos corresponde
exactamente a losgrados de libertad para los tratamientos.Dos contrastes sern ortogonales si la
suma de los productos de suscorrespondientes coeficientes es igual a cero. Esto implica que la
covarianzaentre los dos contrastes es igual a cero, y por lo tanto los contrastes van a
ser independientes. En este sentido la ortogonalidad implica independencia. Sitodos los contrastes
formulados son ortogonales entre si, entonces esto llevaraa que la suma de cuadrados acumulada
en todos los contrastes ortogonalescorresponda exactamente a la suma de cuadrados de los
tratamientos. Lasuma de cuadrados asociada a un contraste se calcula por el cuadrado de
lacombinacin lineal de las medias multiplicada por el numero de repeticiones ydividida por la suma

de los cuadrados de los coeficientes de la combinacinlineal. Esta suma de cuadraos siempre lleva
asociada un solo grado delibertad.Si se aplican contrastes no ortogonales,
entonces existir covarianza entreellos y esto implica que la informacin contenida en ellos esta
relacionada enun cierto grado, con lo cual se considera que la informacin contenida en losdatos
esta siendo sobreutilizada. Esto se va a reflejar en el hecho de que elacumulado de la suma de
cuadrados de los contrastes no ortogonales nocerrara a la suma de cuadrados de los
tratamientos

Captulo 3
Comparaciones mltiples
3.1. Introduccin
En este captulo explicaremos algunas tcnicas para analizar con mayor detalle los
datos de un experimento, con posterioridad a la realizacin del Anlisis de la Varianza.
Si
dicho anlisis confirma la existencia de diferencias significativas entre los tratamientos,
es
conveniente investigar qu medias son distintas. Para ello, emplearemos diversas
tcnicas
cuyo objeto es identificar qu tratamientos son estadsticamente diferentes y en
cunto
oscila el valor de esas diferencias. Consideraremos su aplicacin nicamente al modelo
de
efectos fijos.
El uso de estas tcnicas, en algunos casos, est supeditado al resultado del anlisis de
la varianza; en otros casos, las tcnicas pueden emplearse directamente sin haber
realizado
previamente dicho anlisis. Este conjunto de tcnicas se engloba bajo la denominacin
de
contrastes para comparaciones mltiples ya que su objetivo fundamental es comparar
entre
s medias de tratamientos o grupos de ellas.
En primer lugar estudiamos un procedimiento intuitivo y cualitativo basado en la
representacin
grfica de los datos del experimento1
. Depus del mtodo grfico consideramos
la tcnica de comparacin por parejas introducida por Fisher en 1935. Dicha tcnica,
denominada
mtodo de la diferencia mnima significativa o mtodo LSD (Least Significant

Difference), se basa en la construccin de tests de hiptesis para la diferencia de


cualquier
par de medias.
Cuando el nmero posibles de comparaciones es elevado, la aplicacin reiterada de
este procedimiento, para un nivel de significacin dado, puede conducir a un nmero
grande de rechazos de la hiptesis nula aunque no existan diferencias reales. El intento
de
1En cierto sentido, el mtodo grfico ya fu comentado en el captulo anterior al dar la
interpretacin
de algunas salidas grficas de S
.
DISEO DE BLOQUES COMPLETOS AL AZAR : DBCA
Conocido como diseo de doble va, se aplica cuando el material es
heterogneo. las unidades experimentales homogneas se agrupan
formando grupos homogneos llamados bloques.
Tratamientos A, B, C, D, E
Bloque I : B A E C D
Bloque II : C B D E A

Bloque III: B E A D C
Bloque IV: D C A E B
Las fuente de variacin para el anlisis estadstico son:

Fuentes Grados de libertad


Tratamiento (t-1) = 4
Bloques (r-1) = 3
Error (t-1)(r-1)=12
Caractersticas:
1. Las unidades experimentales son heterogneas.
2. Las unidades homogneas estn agrupadas formando los bloques.
3. En cada bloque se tiene un numero de unidades igual al numero de
tratamientos (bloques completos)
4. Los tratamientos estn distribuidos al azar en cada bloque.

5. El numero de repeticiones es igual al numero de bloques. F.de Mendiburu


2
MODELO
Cada observacin del experimento es

Você também pode gostar