Você está na página 1de 19

1

UNIVERSIDAD POLITÉCNICA DEL CENTRO

Distribución t de Student

Asignatura:
Geoestadística y Procesos Estocásticos

Profesor:
Dr. José Luis Escudero Jiménez

Alumnos:
Jesús Daniel Alamilla Torres - 001927
Alejandro de Jesús Ancona Cerino - 001935
Isaac Hernández Jiménez - 001885
Jorge Luis Madrigal Díaz - 002015
Yessenia Ramos Molina - 002054

Carrera y grupo:
Geofísica Petrolera G2-8-201801

Centro, Tabasco 23 de enero del 2018


2

Tabla de contenido

Contenido p.

Introducción ............................................................................................................. 3

Desarrollo ................................................................................................................ 4

Distribución t de Student ...................................................................................... 4

Propiedades de la distribución t de student ...................................................... 4

Los grados de libertad ...................................................................................... 5

Uso de la tabla de distribución t ........................................................................... 6

Notación ........................................................................................................... 7

Ejemplos .......................................................................................................... 7

Intervalo de confianza .......................................................................................... 9

Fórmula del intervalo de confianza................................................................... 9

Ejemplo .......................................................................................................... 10

Prueba de hipótesis ........................................................................................... 12

Fórmula .......................................................................................................... 12

Hipótesis nula e hipótesis alternativa ............................................................. 12

Ejemplo en una cola ....................................................................................... 13

Ejemplo en dos colas ..................................................................................... 15

Conclusión............................................................................................................. 18

Bibliografía ............................................................................................................ 19
3

Introducción

Dentro del campo de estudio de la Estadística existe una rama llamada


Estadística Inferencial, la cual se encarga de elaborar inferencias y determinar
propiedades de una población a partir de evidencia muestral.
La Estadística Inferencial se vale de ciertos elementos para poder realizar
sus actividades, algunos de estos elementos son los estadísticos y las distribuciones
de probabilidad.
Cuando se desea realizar una inferencia acerca de la media de la población
μ pero desconocemos el valor de la desviación estándar σ de la misma, una muestra
proporciona dos valores importantes; y s. Como resultado, el estadístico z
(utilizado para una distribución normal estandarizada) se sustituirá con un
estadístico que explica el uso de un error estándar estimado. Este nuevo estadístico
se conoce como estadístico t de Student y tiene una distribución de probabilidad
determinada.
A continuación se le presenta los fundamentos de la distribución t de Student,
el uso de su tabla de distribución y se menciona como establecer intervalos de
confianza para estimar la media poblacional, asimismo, se menciona como realizar
una prueba de hipótesis en una y dos colas utilizando el estadístico t*.
4

Desarrollo

Distribución t de Student

En Probabilidad y Estadística, la distribución t o distribución t de Student es


una distribución de probabilidad que surge del problema de estimar la media de una
población normalmente distribuida cuando el tamaño de la muestra es pequeño
(n<30), o bien, cuando desconocemos el valor de la desviación estándar
poblacional.
En 1908, William S. Gosset (figura 1), un empleado de
cervecería irlandés, publicó un ensayo acerca de esta
distribución t bajo el seudónimo “Student”. Para deducir la
distribución t, Gosset supuso que las muestras se tomaron
de poblaciones normalmente distribuidas.
Actualmente la mayoría de las inferencias del mundo
real acerca de la media poblacional se realizan con el
estadístico t de Student, ya que es muy difícil conocer el valor Figura 1. William S. Gosset.

de la desviación estándar de una población.

Propiedades de la distribución t de Student

Cada distribución de probabilidad tiene sus particularidades, la distribución t


de Student (figura 2) tiene las siguientes propiedades:

1. t se distribuye con una media de cero.


2. t se distribuye simétricamente en torno a su media.
3. t se distribuye de modo que forma una familia de distribuciones, una
distribución separada para cada número diferente de grados de libertad.
4. La distribución t se aproxima a la distribución normal estándar conforme
aumenta el número de grados de libertad.
5. t se distribuye con una varianza mayor que 1, pero, conforme los grados de
libertad aumentan, la varianza tiende a 1.
5

6. t se distribuye de modo que es menos picuda en la media y más gruesa en


las colas que la distribución normal.

Figura 2. Distribución t con diferente número de elementos en la muestra.

Los grados de libertad

Los grados de libertad son un factor fundamental para la distribución t pero


¿qué son? ¿De dónde provienen? A continuación se habla sobre ello. El número de
grados de libertad asociados con s2 es el divisor (n - 1) usado para calcular la
varianza muestral s2, esto es, gl = n – 1.

Es importante señalar que la suma de las desviaciones, ∑(x – ), debe ser


cero. A partir de una muestra de tamaño n, sólo las primeras n – 1 de tales
desviaciones tienen libertad de valor. Esto es: el último, o n-ésimo, valor de (x – )
debe hacer la suma de las n desviaciones totales exactamente cero.
Por lo tanto, la varianza promedia n – 1 valores de desviación al cuadrado no
relacionados y a este número, n – 1, se le nombró “grados de libertad”.
6

Uso de la tabla de distribución t

La tabla de distribución t (figura 3) es una tabla que muestra los distintos


valores que adopta t, los cuales se encuentran asociados a una probabilidad
acumulada. Para encontrar el valor de t, se necesitan conocer dos valores de
identificación:

1. gl, el número de grados de libertad (que identifican la distribución de interés).


2. α, el nivel de significación expresado en decimales.

Figura 3. Tabla de distribución t.


7

Notación

t(gl,α) (se lee “t de gl, α”), es el símbolo


para el valor de t con gl grados de libertad y
una área de α en la cola derecha (nivel de
significación), como se muestra en la figura 4.
Figura 4. Distribución con t en la cola derecha.

Para los valores de t a la izquierda de


la media, se puede usar una de dos
notaciones. El valor t que se muestra en la
figura 5 podría llamarse t(gl,0.95), porque el
área a la derecha de él es 0.95, o podría
identificarse como –t(gl,0.05)
Figura 5. Distribución con t en la cola izquierda.

Ejemplos

t a la derecha de la media

Encuentra el valor de t(10,0.05)


(observe la figura 6).

Solución Figura 6. Distribución con t a la derecha.

gl = 10
α = 0.05

Ubicamos la
intersección de los valores
anteriores en nuestra tabla
(figura 7). Por lo tanto
tenemos que t(10, 0.05) =
1.812.
Figura 7. Tabla de distribución t con gl = 10 y α = 0.05.
8

t a la izquierda de la media

Encuentra el valor de -t(15,0.05)


(observe la figura 8).

Solución
Figura 8. Distribución con t a la izquierda.

gl = 15
α = 0.05

Ubicamos la
intersección de los valores
anteriores en nuestra tabla
como se muestra en la figura
9. Por lo tanto tenemos que
-t(15, 0.05) = 1.753.

Figura 9. Tabla de distribución t con gl = 15 y α = 0.05.

Valores que acotan un porcentaje


medio

Encuentra los valores de la distribución


t que acotan el 0.90 medio del área bajo la
curva para la distribución con gl = 17 (observe
Figura 10. Distribución con t acotando un
la figura 10). porcentaje medio.

Solución

gl = 17
α = 0.10, por lo tanto α/2 = 0.05

Ubicamos los valores anteriores en nuestra tabla como se muestra en la


figura 11. Por lo tanto tenemos que t(17,0.05) = 1.740 y -t(17,0.05) = -1.740.
9

Figura 11. Tabla de distribución t con gl = 17 y α = 0.05.

Intervalo de confianza

Se llama intervalo de confianza a un par de números entre los cuales se


estima que estará cierto valor desconocido con una determinada probabilidad de
acierto.

Fórmula del intervalo de confianza

Cuando se desea estimar la media poblacional se utiliza la siguiente fórmula


para crear un intervalo de confianza.

= media de la muestra
t(gl,α/2) = valor de t
s = desviación estándar de la muestra
n = número de elementos en la muestra
μ = media poblacional
10

Ejemplo

Se toma una muestra aleatoria de 20 pesos de bebés nacidos en Northside


Hospital. Para la muestra se encontraron una media ( ) de 6.87 lb y una desviación
estándar (s) de 1.76 lb. Estima, con 95% de confianza, el peso medio de todos los
bebés nacidos en este hospital.

Solución
Paso 1. Describe el parámetro poblacional de interés.
μ, el peso medio de los recién nacidos en Northside Hospital

Paso 2 Criterios del intervalo de confianza:


a. Identifica la distribución de probabilidad y la fórmula a usar:
Se desconoce el valor de la desviación estándar poblacional, σ. Se usará la
distribución t de Student y la fórmula del intervalo de confianza.

b. Determina el nivel de significancia α:


α = 1-n.c = 1-0.95 = 0.05.

Paso 3. Recolecta la información muestral


n = 20
x = 6.87
s = 1.76
α = 0.05

Paso 4. Calcular los valores a usar en la fórmula de intervalo de confianza y


en la tabla de distribución t

a. Determinar α y gl para hallar t en la tabla


α = 0.05, pero cuando trabajamos con intervalos de confianza tenemos dos
colas en la distribución, por tanto dividimos α entre 2, α/2 = 0.025.
11

n = 20, por tanto calculamos los grados de libertad: gl = n-1 = 20-1 = 19.

t(19, 0.025) = 2.093


-t(19, 0.025) = - 2.093

b. Encuentra el error máximo de estimación.

E = t(gl,α/2)(s/√n):
E = t(19, 0.025)(s/√n) = (2.093)(1.76/√20) = (2.093)(0.3935) = 0.8236
E = 0.8236

c. Encuentra los límites de confianza inferior y superior.

LIC = – E = 6.87 – 0.8236 = 6.0464


LSC = + E = 6.87 + 0.8236 = 7.6936

Paso 5. Establecer el intervalo de confianza

Intervalo de confianza para la media poblacional:

6.0464 ≤ μ ≤ 7.6936

Esto es: con 95% de confianza se estima que el peso medio de los bebés
nacidos en el Northside Hospital está entre 6.0464 y 7.6936 lb.
12

Prueba de hipótesis

Una prueba de hipótesis es una regla que especifica si se puede aceptar o


rechazar una afirmación acerca de una población dependiendo de la evidencia
proporcionada por una muestra de datos.

Fórmula

El estadístico t* se usa para completar una prueba de hipótesis acerca de la


media poblacional μ. Tiene como fórmula:

x = media de la muestra
μ = media poblacional hipotética
s = desviación estándar de la muestra
n = número de elementos en la muestra

Hipótesis nula e hipótesis alternativa

Hipótesis nula H0: es la hipótesis que se pone a prueba, la que se pretende


rechazar.

Hipótesis alternativa H1: es la hipótesis que se acepta cuando la nula es


rechazada.
13

Ejemplo en una cola

La prueba de hipótesis que se da en una cola es aquella que se da en


situaciones donde el estadístico t* es "menor que" o "mayor que".

La APA quiere demostrar que el nivel medio de monóxido de carbono en el


aire del centro de la ciudad de Rochester es peligrosamente elevado, mayor a 4.9
partes por millón. ¿Una muestra aleatoria de 22 lecturas (resultados muestrales:
= 5.1 y s = 1.17) presentan suficiente evidencia para apoyar la afirmación de la APA?
Usa α = 0.05.

Solución

Paso 1. La preparación.

a. Describe el parámetro poblacional de interés.


μ, el nivel medio de monóxido de carbono en el aire en el centro de
Rochester.

b. Enuncia la hipótesis nula (H0) y la hipótesis alternativa (H1).


H0: μ ≤ 4.9
H1: μ > 4.9

Paso 2. Criterios de la prueba de hipótesis.

a. Identifica la distribución de probabilidad y el estadístico de prueba a usar.


Se desconoce σ; por tanto, se usará la distribución t con gl = n – 1 = 21 y el
estadístico de prueba es t*.

b. Determina el nivel de significancia α


α = 0.05
14

Paso 3. Recolectar la evidencia muestral.

n = 22
= 5.1
s = 1.17
μ = 4.9

Paso 4. Calcular el valor del estadístico de prueba.

t* = ( -μ) / (s/√n): t* = (5.1 – 4.9) / (1.17 / √22) = 0.20 / 0.2494 = 0.8018

Paso 5. La distribución de probabilidad

a. Determina la región crítica y el o los valores críticos.


La región crítica es la cola derecha, porque H1 expresa preocupación por los
valores relacionados con “mayor que”.
Valor crítico: t(21,0.05) = 1.721.

b. Determina si el estadístico de prueba


está o no en la región crítica. (Observe la
figura 12).
t* (0.80) no está en la región crítica, la
cual está en azul oscuro.

Figura 12.
Paso 6. Los resultados.

Enuncia la conclusión:

Con un nivel de significancia de 0.05 la APA no puede demostrar que el nivel


medio de monóxido de carbono es mayor que 4.9.
H0: μ ≤ 4.9 no se rechaza.
15

Ejemplo en dos colas

La prueba de hipótesis que se da en dos colas es aquella que se da en


situaciones donde el estadístico t* es "igual a" o "diferente a".

En un popular test de autoimagen, la calificación media para ejecutivos se


espera que sea 65. A una muestra aleatoria de 28 ejecutivos en la ciudad de Atlanta
se les aplica el test. Logran una calificación media de 62.1 y sus calificaciones tienen
una desviación estándar de 5.83. ¿Los ejecutivos que aplicaron el test califican
diferente, en promedio, de lo que se espera en el nivel de significancia 0.02?

Solución

Paso 1. La preparación.

a. Describe el parámetro poblacional de interés.


μ, la calificación media del test de autoimagen para todas los ejecutivos de
la ciudad de Atlanta.

b. Enuncia la hipótesis nula (H0) y la hipótesis alternativa (H1).


H0: μ = 65 (la media es 65)
H1: μ ≠ 65 (la media no es 65)

Paso 2. Criterios de la prueba de hipótesis.

a. Identifica la distribución de probabilidad y el estadístico de prueba a usar.


Se desconoce σ; por tanto, se usará la distribución t con gl = n – 1 = 27 y el
estadístico de prueba es t*, se utilizará la fórmula de cálculo de t*.
16

b. Determina el nivel de significancia α


α = 0.02 (dado en el problema) pero como es un problema con dos colas,
dividimos entre 2. α/2 = 0.01.

Paso 3. Recolectar la evidencia muestral.

n = 28
= 62.1
s = 5.83
μ = 65

Paso 4. Calcular el valor del estadístico de prueba.

t* = ( -μ) / (s/√n): t* = (62.1 – 65) / (5.83 / √28) = -2.9 / 1.1017 = -2.6322

Paso 5. La distribución de probabilidad.

a. Determina la región crítica y el o los valores críticos.


La región crítica es ambas colas, porque H1 expresa preocupación por
valores relacionados con “diferente de”. t(27,0.01) = 2.473 y -t(27,0.01) = -
2.473.

Paso 5. La distribución de probabilidad.

b. Determina si el estadístico de prueba


está o no en la región crítica. (Observe la
figura 13).
t* (-2.63) está en la región crítica, la cual
está en azul oscuro.
Figura 13.
17

Paso 6. Los resultados.

Enuncia la conclusión.
Con un nivel de significancia de 0.02 se tiene evidencia de que los ejecutivos
de la ciudad de Atlanta califican, en promedio, significativamente diferente a
65.
H0: μ = 65 (la media es 65) se rechaza.
H1: μ ≠ 65 (la media no es 65) se da por cierta.
18

Conclusión

Como se pudo observar en el desarrollo del trabajo, la distribución t, más allá


de modelar una distribución de probabilidad con un error estándar estimado, es una
distribución que tiene mucha importancia para la resolución de problemas que
involucran la estimación de la media poblacional cuando se desconoce la desviación
estándar de la población, condición que es muy usual.
Mediante el uso de tablas y el apoyo de las fórmulas correspondientes se
pueden establecer intervalos de confianza para la estimación de la media
poblacional y asimismo, se puede realizar prueba de hipótesis de una manera rápida
y simple.
Finalmente, lo que podemos agregar es que este tipo de distribución de
probabilidad debe de ser más difundida ya que tiene una gran utilidad para la
realización de inferencia estadística.
19

Bibliografía

Johnson, R. & Kuby, P. (2012). Estadística Elemental (11va ed.). México:


Cengage Learning.

Você também pode gostar