Você está na página 1de 6

La Estadística inferencial

DEFINICIÓN
 Estadística Inferencial
Estadística inferencial
(o Estadística Analítica):
Es la que se ocupa de obtener
conclusiones sobre las poblaciones a
partir de la información recogida en las
muestras.

J.F. Casanova Estadística inferencial 2

La Estadística inferencial La Estadística inferencial


Características (1) Características (2)
 Extrapolación, generalización  Se considera la más realista y válida
 Muestra conocida para el intercambio de información
 Población desconocida entre investigadores o para su
 Conclusiones no absolutamente seguras, publicación
sino con cierto nivel de confianza o  Depende del tipo de muestreo
probabilidad de error, así como un  En adelante supondremos muestreo
margen de error. aleatorio simple
 Tiene en cuenta el efecto del “azar”
J.F. Casanova Estadística inferencial 3 J.F. Casanova Estadística inferencial 4

La Estadística inferencial La Estadística inferencial


Partes de la Estadística inferencial
 Estimación de parámetros
 Estimación de parámetros  Consiste en buscar los valores más
probables de un parámetro en la población
(por ejemplo, la media).
 Contraste de hipótesis
 Como la población es desconocida, no se
puede dar un valor totalmente seguro, sino
un intervalo en el que probablemente se
hallará, llamado Intervalo de confianza.

J.F. Casanova Estadística inferencial 5 J.F. Casanova Estadística inferencial 6

1
La Estadística inferencial La Estadística inferencial

 Estimación de parámetros  Contraste de hipótesis


 El Intervalo de confianza irá acompañado  Consiste en decidir si una afirmación es

de la probabilidad de que el parámetro esté cierta o no en la población, siempre en


en él (Nivel de confianza), o bien, su términos probabilísticos.
complementaria (Probabilidad de error).  Tipos de contrastes más frecuentes:
 Dentro del Intervalo de confianza uno de • Comparación de Muestras
los valores se considera como Estimación • Asociación entre Variables
óptima.

J.F. Casanova Estadística inferencial 7 J.F. Casanova Estadística inferencial 8

Estimación de parámetros
La Estadística inferencial
 Relación entre Estimación de parámetros y  CONCEPTOS Y OBJETIVOS
Contraste de hipótesis
 PROCEDIMIENTOS DE CÁLCULO
 Frecuentemente un mismo problema puede

resolverse por las dos técnicas. Ejemplo:  Muestras grandes


• Las medias de dos muestras pueden  Estimación de la media
compararse mediante una estimación  Estimación de la proporción
de su diferencia.
 Muestras pequeñas
• La asociación entre dos variables
puede analizarse estimando un  Estimación de la media
parámetro que mida dicha asociación.  Estimación de la proporción
J.F. Casanova Estadística inferencial 9 J.F. Casanova Estadística inferencial 10

Estimación de parámetros Estimación de parámetros


 ¿Qué supondríamos sobre valores desconocidos  ¿Cómo respondemos a la pregunta de cuál es el
basándonos en los que conocemos? valor de un parámetro?
 Vamos a empezar usando el “Sentido común”. (Por ejemplo, para la media)
 Ejemplo: estimación de la media de la  Estadística Descriptiva: un solo número.
población.  Estadística Inferencial: tres números.
 El valor será parecido al de la muestra.  estimación óptima

 Cuanto mayor sea la muestra, más seguro es  error de estimación


que se parezca su media a la de la población.  nivel de confianza
 Tan probable es que el valor poblacional sea (o probabilidad de error)
superior como inferior al de la muestra.
J.F. Casanova Estadística inferencial 11 J.F. Casanova Estadística inferencial 12

2
Estimación de parámetros Estimación de parámetros
 ¿Cómo respondemos a la pregunta de cuál es el  Ejemplo de Intervalo de Confianza
valor de un parámetro?
 Esos tres números generan el Intervalo de

Confianza.
 Es un intervalo en el que tenemos cierto nivel

de seguridad (“nivel de confianza”) de que esté


incluido el valor real de la población. 2’5% 95% 2’5%
 Sus límites superior e inferior se obtienen

usualmente sumando y restando al valor de la


L. I. Estimación L. S.
estimación óptima el error de estimación.
óptima
J.F. Casanova Estadística inferencial 13 J.F. Casanova Estadística inferencial 14

Estimación de parámetros Estimación de parámetros


 Obtención del Intervalo de Confianza. Cálculo del Intervalo de Confianza
 Lo habitual es tomar uno centrado: La  La distribución del parámetro depende:
probabilidad de que el parámetro tome un valor
 Del tipo de parámetro
superior a él es la misma que la de que sea
 De la distribución de los datos.
inferior (áreas iguales en los extremos
externos).  Para muestras grandes, el cálculo puede
simplificarse.
 Veremos cómo estimar medias y proporciones

J.F. Casanova Estadística inferencial 15 J.F. Casanova Estadística inferencial 16

Estimación con muestras grandes Estimación con muestras grandes


Cálculo del Intervalo de Confianza Cálculo del Intervalo de Confianza
 Recordemos que el “Sentido común” nos decía:  Eso está demostrado matemáticamente:
 El valor será parecido al de la muestra: más Teorema Central del Límite
probables los valores próximos a la media
(Ley de los Grandes Números)
muestral que los alejados de ella.
 “La distribución de las medias obtenidas al
 Es igual de probable que el valor de la
repetir infinitas veces un experimento con
población sea mayor o menor que el de la
muestras del mismo tamaño es
muestra.
aproximadamente una Curva de Gauss, si el
 Por tanto la distribución de probabilidad del tamaño muestral es suficientemente grande.”
parámetro tenderá a ser simétrica y acampanada.
J.F. Casanova Estadística inferencial 17 J.F. Casanova Estadística inferencial 18

3
Estimación con muestras grandes Estimación con muestras grandes
Estimación de la media Estimación de la media
 Cuando n ≥ 30, al repetir el experimento, las
medias obtenidas siguen aproximadamente una  De ahí se puede deducir que la distribución de los
distribución Normal valores probables de la media de la población es
 cuya media es la de la población aproximadamente la Normal, centrada en la media
 y cuya desviación típica es el llamado “error muestral y que tiene como desviación típica el
estándar de la media”, σ error estándar de la media.
sx  P
n
donde P es la desviación típica de la población.

J.F. Casanova Estadística inferencial 19 J.F. Casanova Estadística inferencial 20

Estimación con muestras grandes Estimación con muestras grandes


Estimación de la media Estimación de la media
 Pero la desviación típica de la población, P,  Una vez que sabemos cuál es la distribución de
usualmente es desconocida. probabilidad, podemos seleccionar los límites
 Como estimación de la desviación típica de la (inferior y superior) del Intervalo de confianza que
población se usa habitualmente la llamada cuasi abarquen la probabilidad correspondiente al Nivel
desviación típica de la muestra (S), que se calcula de confianza que queremos utilizar.
igual que la desviación típica, pero poniendo en el
denominador n-1 en lugar de n.

J.F. Casanova Estadística inferencial 21 J.F. Casanova Estadística inferencial 22

Estimación con muestras grandes Estimación con muestras grandes


Estimación de la media Detalles sobre la Estimación de parámetros
 Obtención de un Intervalo de confianza centrado,  Para el Nivel de confianza del 99%, se sustituye el
al Nivel de confianza del 95% (el más habitual) en 1’96 por el 2’58.
la distribución Normal:  Para el del 99’9%, se sustituye por el 3’29.
 Se toman como extremos los puntos cuya distancia de  Como el error estándar es inversamente
la media sea 1’96 veces la desviación típica
proporcional al cuadrado del tamaño muestral:
 Estos límites pueden expresarse así:
 Doble de precisión
[ x  1'96 s x , x  1'96 s x ]
 Cuatro veces más individuos
x  1'96 s x (La precisión estadística es cara).
J.F. Casanova Estadística inferencial 23 J.F. Casanova Estadística inferencial 24

4
Estimación con muestras grandes Estimación con muestras grandes
Ejemplo Ejemplo
 En un grupo de 100 insuficientes hepáticos  error estándar de la media:
aleatoriamente escogidos se midió el S 60
urobilinógeno expulsado al día en la orina, sx   6
encontrándose una media de 450 g y una cuasi n 100
desviación típica de 60 g.  intervalo de confianza al 99%:
 Se desea saber con seguridad del 99% entre qué I.C. (99%) : x  2'58 s x  450  2'58·6
límites se halla el valor medio para todos los
afectados por dicha enfermedad. I.C. (99%) : 450  15'5 = (434'5, 465'5)

J.F. Casanova Estadística inferencial 25 J.F. Casanova Estadística inferencial 26

Estimación con muestras grandes Estimación con muestras pequeñas


Estimación de la media
Estimación de la proporción 1) Datos que proceden de una distribución Normal
 Cuando n ≥ 100, al repetir el experimento, las  Cuando los datos siguen una distribución Normal,
proporciones obtenidas siguen aproximadamente las medias en el muestreo siguen la distribución t
una distribución Normal de Student.
 centrada en la proporción de la muestra, p
 Su forma es también simétrica y acampanada y
 y cuyo error estándar es: depende de la media, la desviación típica y,
p·(1 - p) además, de un nuevo parámetro, llamado número
sp  de grados de libertad, (g.l.)
n
 El número de grados de libertad en este caso es
n - 1.
J.F. Casanova Estadística inferencial 27 J.F. Casanova Estadística inferencial 28

Estimación con muestras pequeñas Estimación con muestras pequeñas


Estimación de la media Tablas de la t de Student
1) Datos que proceden de una distribución Normal
 Para calcular un intervalo de confianza, en vez de
multiplicar el error estándar por los valores de la
curva normal, lo haremos por el valor que
aparezca en las tablas de la t de Student.
 Al crecer el número de grados de libertad (por
tanto, el tamaño de la muestra), la t de Student se
aproxima a la distribución Normal.

J.F. Casanova Estadística inferencial 29 30

5
Estimación con muestras pequeñas Estimación con muestras pequeñas
Estimación de la media
Ejemplo 2) Datos que NO proceden de una distribución Normal
 Grupo de 9 individuos, con media de 91 y una  Si la distribución de los datos es próxima a la
cuasi desviación típica de 12 Normal, se puede usar este mismo método (el de la
 Intervalo de confianza al 95%: t de Student).
 Si no es próxima a la Normal, aplicar una
S 12
sx   4 g.l.  8 transformación de los datos (cambio de variable)
n 9 para lograr una que sí se aproxime.
I.C. (95%) : x  t s x  91  2'306·4  Si no se puede aplicar ninguna de estas dos
soluciones, no se calcula el Intervalo de Confianza.
I.C. (95%) : 91  9'22 = (81'78, 100'22)
J.F. Casanova Estadística inferencial 31 J.F. Casanova Estadística inferencial 32

Estimación con muestras pequeñas


Estimación de la proporción
 Cuando n < 100, la aproximación a la Normal no
es válida: Se requiere utilizar la distribución real,
que este caso es la Binomial.
 Para obtener los Intervalos de confianza sin tener
que hacer cálculos extensos, se pueden emplear
tablas que dependen de n y de p.

J.F. Casanova Estadística inferencial 33

Você também pode gostar