Escolar Documentos
Profissional Documentos
Cultura Documentos
Unidad Muestral o de Muestreo (UM): Cada uno de los elementos que constituyen a una poblacin: Un rbol o una parcela. La poblacin de rboles tiene 10 UM, N = 10 La poblacin de parcelas tiene 16 UM, N = 16 Variable: Una caracterstica que tienen las unidades muestrales. En rboles: altura, dimetro, volumen, estar vivo. En parcelas: altura promedio de los rboles, dimetro promedio de los rboles, proporcin de rboles vivos, cantidad de biomasa (area y subterrnea) en toda la vegetacin.
DEFINICIONES BSICAS Medicin: Determinacin del valor de una variable en una UM (Dasometra). Dato: El registro de una medicin. Tpicamente hay un dato por cada UM. Censo: Medicin de una variable en todas las unidades muestrales de una poblacin. Generalmente se consideran varias, pero las estudiamos de una por una, el muestreo es Univariado, Un censo genera otra poblacin: Poblacin: El conjunto de datos de una variable de todas las UM.
DEFINICIONES BSICAS Funcin: Un conjunto de tres cosas, dos conjuntos y una regla de asociacin que vincula a un elemento del primer conjunto con uno y slo uno de los elementos del segundo conjunto. Cada chango a su mecate, conjuntos: Changos y Mecates Nunca falta un roto para un descosido: Descosidos y Rotos - Ya med la altura del rbol, antale 14.5 m
Segundo conjunto Regla de asociacin
Conjuntos: rboles que tienen altura y unidades de longitud. Regla de asociacin: medicin
Primer conjunto
Son de inters las poblaciones de valores, como la altura, el volumen, la supervivencia, la cantidad de carbono, las existencias reales. Son parmetros: Los valores que estn al principio, en medio de todos o al final, una vez que se han ordenado crecientemente La suma de todos los valores El promedio de todos los valores La suma de los valores elevados al cuadrado Lo que en promedio se aleja cada dato de un valor de referencia Cualquier otra funcin que se proponga
Media:
y
i =1
Moda: El valor que se repite ms veces. Mediana: El valor que est en medio de todos despus de ordenarlos de menor a mayor.
Varianza:
=
2 N
( y )
i i =1
N
i
y
i =1
DEFINICIONES BSICAS
Midiendo la altura promedio de los rboles UM: parcela Evaluando vivo UM: rbol Evaluando proporcin de vivo UM: parcela
Poblacin original: predio
4 3 5 2 5 4 3 6 3 5 6 7
Poblacin de la variable altura, N = 12
V M V M V V M V M V V V
Poblacin de la variable vivo (atributo) 8/12=0.67 N = 12
Al promediar valores promedio por parcela (sitio), como en este caso altura promedio y proporcin de vivo, siempre deben ponderarse por el nmero de datos que generan ese promedio, de otra forma se producen resultados incorrectos
Una muestra es un subconjunto (pedazo) de una poblacin, por ser a su vez un conjunto, tambin podemos definir funciones, que ahora llamamos estimadores (en vez de parmetros) para evitar confusiones
Media muestral:
y=
y
i =1
Varianza muestral:
S =
2
( y y)
i i =1
n 1
Moda muestral: El valor que se repite ms veces en los datos de la muestra. Mediana muestral: El valor que est en medio de todos los datos de la muestra, despus de ordenarlos de menor a mayor.
Desconcierta que en sta el denominador es (n-1) cuando uno esperara que fuera solamente (n). El motivo es que de esta manera resulta un estimador insesgado, lo que se discutir ms adelante.
Media muestral: y =
y
i =1
y
i =1
Media de la poblacin
Varianza muestral:
S =
2
( y y)
i i =1
n 1
2 =
( yi ) 2
i =1
Varianza de la poblacin
V e c e s
0 1 2 3 4
Vamos a hacer muestreo con reemplazo, con muestras de tamao dos, es decir, muestras que incluyen dos unidades muestrales (n = 2)
La frecuencia con que se presentan los valores de la media genera esta grfica
La media de las medias es la media de la poblacin! El promedio de las var con n-1 es la varianza de la poblacin! La varianza poblacional ente los valores de la media es (2/n)=(1.25/2)=0.625! Aparecieron nmeros que antes no haba, ahora con decimales! Ahora las frecuencias de los valores de la media tienen una grfica que se parece a la normal!
media muestral es un estimador insesgado de la media de la poblacin () varianza muestral, con el denominador n-1, es un estimador insesgado de 2, que es la varianza poblacional.
La varianza poblacional ente los valores de la media es (2/n)=(1.25/2)=0.625!: la El promedio de las var con n-1 es la varianza de la poblacin!: la
Aparecieron nmeros que antes no haba, ahora con decimales! Y Ahora las frecuencias de los valores de la media tienen una grfica que se parece a la normal!: la media tiende a distribuirse como la normal
Inferencias:
La media se distribuye como la normal Los estadsticos
Y yS
Son estimadores insesgados (buenos) de los parmetros m y s2 Estos parmetros definen a una distribucin normal (que tiene una ecuacin que no queremos ver) Por lo tanto, ya tengo completamente conocida (estimada) la distribucin de que se trata.
una muestra!
Pero como ya conozco la distribucin de la media (normal), si obtengo una muestra al azar, de su grfica de distribucin puedo leer:
5 4 3 2 1 0 1 1.5 2 2.5 3 3.5 4 1 2 3 4 3 2 1 V e c e s
Cul es la probabilidad de que el promedio de los datos de esa muestra sea mayor que la media verdadera?: 6/16 Menor o igual que la media verdadera?: 10/16 Menor O mayor que la media verdadera algn nmero de veces la desviacin estndar (la raz cuadrada de la varianza)?: Pues quien sabe, pero para eso hay TABLAS!
Si conociera 2, podra tener a la normal, pero como no la tengo en un caso real, slo puedo aproximarme a una distribucin que se llama t de Student.
Menor O mayor que la media verdadera algn nmero de veces la desviacin estndar (la raz cuadrada de la varianza)?: Todava no lo se, pero para esta grfica existen TABLAS! Pero NTESE que la forma de la curva depende de los grados de libertad (df), que son n-1, o sea que depende del tamao de la muestra. Se designa con alfa () a algn rea referida dentro de esa curva, por ejemplo el 0.5 (50%), el 0.05 (5%) y puede estar ubicada en un extremo o repartida en ambos.
df 2 3 4 5 6 7 8 9 10
0.1 2.92 2.3534 2.1318 2.015 1.9432 1.8946 1.8595 1.8331 1.8125
0.05 4.3027 3.1824 2.7765 2.5706 2.4469 2.3646 2.306 2.2622 2.2281
0.025 6.2054 4.1765 3.4954 3.1634 2.9687 2.8412 2.7515 2.685 2.6338
0.01 9.925 5.8408 4.6041 4.0321 3.7074 3.4995 3.3554 3.2498 3.1693
Esta tabla es de dos colas, as que si quiero el alfa en ambos extremos, se debe leer el alfa directamente en la primera fila. Por ejemplo, para alfa=5%=0.05, el valor de t que deja en las dos colas el 5% (2.5% en cada una), con 10 grados de libertad, es 2.2281. Pero Excel lo hace tambin
y
i=1
Estimador de la media
2 Sy =
( y y)
i i =1
y ts y
Intervalo de estimacin, se debe interpretar que con un (1) de probabilidad la media verdadera estar incluida en ese intervalo.
Varianza de la variable
Varianza de la media. Se ha introducido el llamado Factor de Correccin por Poblacin Finita
n 1
2 sy N n 2 sy = n N
2 sy N n Estimador del error de ts y = t s = t N muestreo n En ocasiones se usa un 2 en lugar de t, porque para un alfa de 0.05 (que es usual) y para muestras (n) no muy pequeas, el valor de t es cercano a 2. 2 y
yi
i=1
2 Sy =
( y y)
i i =1
n 1
2 s y N n Varianza de la media. La media tambin tiene varianza, 2 sy = n N porque puede haber muchas medias, tantas como
2 sy N n 2 ts y = t s y = t N n
y ts y
Intervalo de estimacin, se debe interpretar que con un (1-) de probabilidad la media verdadera estar incluida en ese intervalo.
NOCIONES BSICAS: MUESTREO SIMPLE ALEATORIO Al requerir una precisin determinada, se requiere que el error de estimacin sea de cierto tamao (B):
2 sy N n 2 ts y = t s y = t =B N n
2 sy N n t =B N n
S
2 y
2 y
1 N
n =
t2S B
y
i =1
n
n
a =p n
2
2 Sy =
( y y)
i i =1
n 1
y
i=1
2 i
n 1
a a2 n n n2 n 1
npq pq n 1
Varianza de la variable
2 sy N n 2 sp = N n
2 sy N n 2 ts p = t s p = t N n
p ts p