Você está na página 1de 113

1

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

ESTADISTICA
Introduccin
El trabajo del experto estadstico no consiste ya slo en reunir y tabular
los datos, sino sobre todo el proceso de interpretacin de esa informacin.
El desarrollo de la teora de la probabilidad ha aumentado el alcance de
las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden
aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden utilizar para analizar datos
estadsticas.
La probabilidad es til para comprobar la fiabilidad de las inferencias
estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico.
En Qumica, incluye tareas tan diversas como calcular el promedio aritmtico
de la cantidad de slidos suspendidos en muestras de agua, determinar
cuntos compuestos de tres elementos pueden elaborarse con cinco
sustancias, comparar dos mtodos de determinacin del porcentaje
de calcio, el crecimiento del nmero de bacterias segn das de inoculacin.
Definicin:
La estadstica se define como una rama de las matemticas que trata de la
recopilacin, el anlisis, la interpretacin y la representacin de una gran
cantidad de datos numricos.
Estadstica Descriptiva : Es el conjunto de procedimientos utilizados
para organizar resumir y presentar grupos de datos numricos
Estadstica Inferencial: Es el conjunto de mtodos utilizados para
obtener conclusiones relativas a una poblacin, basndose en el
conocimiento de las caractersticas de una muestra.
La poblacin es el conjunto de datos que es el centro de nuestro inters y el
subconjunto de ah seleccionado representa una muestra.
La estadstica es un elemento decisivo en el incremento de la calidad, ya que
las tcnicas estadsticas pueden emplearse para describir y comprender los
elementos de la variabilidad.
Qu es la variabilidad? Es el resultado de cambios en las condiciones bajo las
que se hacen las observaciones. El muestreo tambin puede ser causa de
variabilidad.
El campo de la estadstica y la probabilidad consiste de mtodos tanto para
describir y modelar la variabilidad, como para tomar decisiones en presencia
de esta.
En la estadstica inferencial lo que se desea es tomar decisiones acerca de una
poblacin en particular.

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Escalas de Medicin
Escala Nominal
El trmino nivel nominal es normalmente usado para referirse a datos que
solamente pueden clasificarse en categoras. Sin embargo, no hay mediciones
y no hay escalas involucradas, solo hay conteo. En este tipo de nivel de
medicin el orden en que estn acomodadas la categoras es totalmente
arbitrario.

2. Escala Ordinal
Este tipo de nivel de medicin tiene caractersticas similares al nivel nominal
con la diferencia de que en el nivel ordinal las categoras indican que unas son
ms que las otras.

3. Escala cuantitativa intervalo


En este nivel de medicin, las categoras estn definidas por intervalos de
valores, y estn acomodadas en orden a la magnitud de los valores. El tamao
de los intervalos es el mismo.

4. Escala cuantitativa Racional

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

En este nivel al igual que en el nivel intervalo, las categoras son del mismo
tamao. La diferencia es que este nivel tiene un punto cero significativo y el
valor de los categoras es en relacin a ese punto.

Clasificacin de las variables


Variable cualitativa: Cuando la variable estudiada es no numrica.
Ejemplo: Lugar de nacimiento, religin, color de ojos.
Variable Cuantitativa: Cuando la variable estudiada puede expresarse
en forma numrica.
Ejemplo: El saldo de una cuenta bancaria, la duracin de una batera.
Variables Discretas: Cada una de las variables puede valer solo un
nmero entero por ejemplo 1, 2, 3, etc.
Ejemplo: Nmero de cuartos en una casa, nmero de carros en el
estacionamiento, nmero
de estudiantes en la clase de estadstica.
Variables Continuas: Las variables continuas pueden asumir todos los
valores dentro de un rango especfico.
Ejemplo: Presin del aire en una llanta, el tiempo que se toma en viajar
de Puebla a Mxico. Las variables continuas resultan de medir algo, y
lgicamente dependen de la exactitud del instrumento de medicin.
Reglas generales para construccin de distribuciones de frecuencia
1) Determinar el nmero mayor y el menor en los datos sueltos con el fin
de especificar el rango (diferencia entre ambos).
2) Dividir el rango el rango en un nmero adecuado de intervalos de clase
del mismo tamao.
3) Determinar el nmero de observaciones que corresponden a cada
intervalo de clase; es decir, hallar la frecuencia de clase.
Los histogramas y los polgonos de frecuencia son dos representaciones
grficas de las distribuciones de frecuencia. Un histograma se construye a
partir de la distribucin de frecuencias
representado sobre cada intervalo, un rectngulo que tiene a este segmento
como base. El criterio para calcular la altura de cada rectngulo es el de
mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de
cada intervalo y su rea. Los histogramas, son grficas de barras verticales,
construidos sobre los lmites reales de cada clase.
Ejemplo

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Por ejemplo, los siguientes datos son los tiempos de ignicin de ciertos
materiales expuestos al fuego, dados a la ms cercana centsima de segundo:
2,58 5,50 6,75 2,65 7,60 6,25 3,78 4,90 5,21 2,51 6,20 5,92 5,84
7,86 8,79 4,79 3,90 3,75 3,49 4,04 3,87 6,90 4,72 9,45 7,41 2,45
3,24 5,15 3,81 2,50 1,52 4,56 8,80 4,71 5,92 5,33 3,10 6,77
9,20 6,43 1,38 2,46 7,40 6,25 9,64 8,64 6,43 5,62 1,20 1,58
Solucin:
Suponga, que se tiene inters de construir cinco clases. Con el arreglo
ordenado de los tiempos se determina que la observacin ms grande es de
9,65 y la ms pequea, de 1,20. Por tanto, la amplitud o rango se calcula
como:
Rango=9.64-1.20=8.44
y se tiene la aproximacin del tamao del intervalo de clase , dividiendo el
rango entre el nmero de intervalos que nos piden as obtenemos el
Intervalo de clase=8.44/5=1.688 se aproxima a 1.69
Tiempos
Frecuencia
de ignicin
relativa
1,20 2,88
20
2,89 4,57
18
4,58 6,26
32
6,27 7,95
18
7,96 9,64
12

Conteo
Porcentaje
Absoluta
%
//// //// //

Frecuencia
(fi)
10

0.20

0.18

//// //// /
//// //// //// ////
//// //// /
//// //

16

0.32
9
6

0.18
0.12

Con esta tabla, se pueden calcular los porcentajes por clase al multiplicar por
100 cada frecuencia relativa. Un 32% de los materiales fueron consumidos por
el fuego entre 4,58 y 6,26 centsima de segundo.

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

tiempo de ignicin

Ejemplo 2
En la tabla que sigue se registran los pesos de 40 estudiantes hombres de una
universidad, con precisin de una libra. Construya una distribucin de
frecuencias.
164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126
138 176 163 119 154 165 146 173 142 147 135 153 140 135 161 145 135
142 150 156 145 128 138
Solucin
El mayor peso es de 176lb y el menor es de 119lb.
Por lo que el rango es 176-119=57lb
Si se usan 5 intervalos de clase, su tamao ser de 57/12=4.75 aproxima 5

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

frecuencia
9
8
7
6
5
4
3
2
1
0

frecuencia

Distribucin de frecuencias relativas


La frecuencia relativa de una clase es su frecuencia dividida entre la frecuencia
total de todas las clases es 1 es decir 100%.
Por ejemplo la frecuencia relativa de la clase 133-137 es 4/40=.1%.
La suma de todas las frecuencias relativas de las clases es 1 es decir 100%.
Distribucin de frecuencia acumulada
La frecuencia total de todos los valores menores que la frontera de clase
superior de un intervalo de clase dado se conoce como frecuencia acumulada
hasta ese intervalo de clase inclusive.
Por ejemplo la frecuencia acumulada, incluyendo hasta el intervalo de clase
133-137 es 1+2+2+4=9 lo que significa que 9 estudiantes tienen el peso
menor de 137.5
Distribucin de frecuencia relativa acumulada
La frecuencia relativa acumulada es la frecuencia acumulada dividida entre la
frecuencia total. As la frecuencia relativa acumulada de peso menor que 137lb
Es 9/100=0.09% lo que significa que 9% de los estudiantes pesa menos de
137.5lb.

La tabla siguiente muestra la distribucin de frecuencia de los salarios


semanales de 65 empleados
salario

Nmero de empleados

Frecuencia relativa(%)

$250.00-$259.99

12.3

$269.00-$268.99

10

15.4

$270.00-$279.99

16

24.6

$280.00-$289.99

14

21.5

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

$290.00-$299.99

10

15.4

$300.00-$309.99

7.7

$310.00-$319.99

3.1

Total 65

Total 100%

30
25
20
15
10
5
0

Construya para la distribucin de frecuencia anterior una distribucin de


frecuencia acumuladas y una distribucin de frecuencias relativas acumuladas.

Dist. De frec. Relativas acumuladas


120
100
80
60
40
20
0

Dist. De frec. Relativas


acumuladas

Medidas de localizacin
Se buscan nmeros que describan la distribucin de frecuencia para cualquier
conjunto de mediciones. Se concentrar la obtencin en dos tipos de nmeros
descriptivos, las medidas de tendencia central y las medidas de dispersin o
variacin.
Una caracterstica importante de un conjunto de nmeros es su
localizacin o su tendencia central, el promedio es un valor tpico o
representativo de un conjunto de datos, tales valores suelen ubicarse en el
centro del conjunto de datos

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Media aritmtica
Mediana
Moda
Media muestral
Es un conjunto de n valores, es el resultado de la suma de todos ellos divididos
entre n.

Donde x1,x2,xn, son las observaciones de la muestra y n es el tamao de la


muestra.
La media de la muestra y la media de la poblacin
Las medidas caractersticas de una muestra son llamadas estadsticos y las
medidas caractersticas de una poblacin se denominan parmetros. La media
de la poblacin se calculan de la misma manera que la media de la muestra,
que calculamos arriba, pero tiene diferente notacin:

N
nmero de elementos de la poblacin
La media aritmtica de datos no agrupados:
Si los nmeros datos x1 ,x2, xn ocurren f1,f2,,fn veces respectivamente (es
decir , con frecuencias f1,f2,,fn )

La media aritmtica es
Ejemplo: si 5, 8,6 y 2 ocurren con frecuencia 3,2, 4 y 1, en ese orden, su media
aritmtica es:

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

La mediana
Cuando una serie de datos contiene uno o dos valores muy grandes o muy
pequeos, la media aritmtica no es representativa. El valor central en tales
problemas puede ser mejor descrito usando una medida de tendencia central
llamada mediana.
La mediana es el punto medio de los valores de una serie de datos despus de
haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que
la mediana como posteriores en el arreglo de datos.
Ejemplo:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la
mediana de las observaciones muestreadas?
85.4
85.4
85.3---
84.9
84.0
Se define

como la mediana poblacional; esto es, la mitad de la poblacin se

encuentra por debajo de la


, mientras que la otra mitad est por encima de
este valor.
La mediana para datos agrupados
Cuando los datos se encuentran agrupados en una distribucin de frecuencia
no conocemos los datos originales, por lo tanto es necesario estimar la
mediana mediante los siguientes pasos:
1. Calcular el valor n / 2
2. Localizar el intervalo de clase donde se encuentra la mediana (intervalo
mediano). Esto se hace encontrando el primer intervalo de clase donde la
frecuencia acumulada es igual o mayor que
n / 2.
3. Aplicando la siguiente frmula con los valores del intervalo mediano:

Donde: LSR frontera superior real de la clase de la mediana


N: nmero de datos
fA: suma de las frecuencias de las clases hasta el intervalo de clase de la
mediana.
fmediana: es la frecuencia de la clase de la mediana

10

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

C: es el tamao del intervalo de la clase de la mediana


Ejemplo:
Calcular mediana de la siguiente distribucin de frecuencia del nmero de
meses de duracin de una muestra de 40 bateras para coche.
duracin de las bateras (meses)
Nmero de bateras
15 - 19

20 - 24

25 - 29

30 - 34

15

35 - 39

10

40 - 44

45 - 49

1.- n/2=40/2=20
2.- el intervalo mediano es:
LI

LS

LSR

FA

15

19

19.5

17

20

24

24.5

22

25

29

29.5

27

30

34

34.5

32

15

22

35

39

39.5

37

10

32

40

44

44.5

42

37

45

49

49.5

47

40

N=

40

3.- Aplicar la frmula con los datos del intervalo mediano

11

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

intervalo
mediano

Moda
La moda es la observacin que se presenta con mayor frecuencia en la
muestra.
Es decir, el valor ms frecuente. La moda puede no existir e incluso no ser
nica.
Si los datos son simtricos y hay una sola moda entonces la media la mediana
y
la
moda
coinciden.
Generalmente
se
encuentra
que
la
moda<mediana<media si la distribucin est sesgada a la derecha, mientras
que la media<mediana<moda si la distribucin est sesgada a la izquierda.

La moda de un conjunto de nmeros es el valor que ocurre con mayor


frecuencia
Ejemplo 1: El conjunto 2,2,5,7,9,9,9,10,10,11,12 y 18 tiene moda 9
Ejem2: El conjunto 3,5,8,10,1,15 y 16 carece de moda
Ejem3: El conjunto 2,3,4,4,4,5,5,7,7,7 y 9 cuenta con dos modas 4 y 7 y se le
conoce como bimodal.
La distribucin con una sola moda se llama unimodal.
La moda para datos agrupados
Para datos agrupados en una distribucin de frecuencia, la moda puede ser
estimada por la marca de clase del intervalo que contenga la frecuencia de
clase ms grande. Si hay dos intervalos contiguos con frecuencia mxima la
moda ser la media aritmtica de las dos marcas de clase. Si hay dos o ms
intervalos no contiguos con frecuencia de clase mxima habr dos o ms
modas que sers las marcas de clase de dichos intervalos
Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia:

12

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

No hay
moda

En general, preferimos la media primero porque se utiliza ms adelante con


mucho ms frecuencia y segundo porque es ms estable que la mediana y la
moda, es decir de una muestra a otra vara menos que la mediana o la moda
de valores calculados en la poblacin.
Elegiremos la mediana como
medida de tendencia central cuando la
distribucin sea muy sesgada, cuando tenga valores muy extremos ya que en
estos casos la media se desplaza hacia las puntuaciones extremas y no as la
mediana.
Ejemplos: en la serie 2, 3, 5, 6,8, 8 y 19 la media es7.28 y la mediana es 6, si el
19 fuera un error tipogrfico y fuera 9 en lugar de 19 pues la media seria 5.85
y la mediana seria 6 o en caso de tener una variable ordinal tambin
elegiramos la mediana como medida de tendencia central y por ltimo en caso
de tener una distribucin de frecuencias con intervalos de clase abiertos, por
ejemplo a la variable sueldo mensual no podemos saber el punto medio del
intervalo menos de 50,000 o ms de 500000 y no podemos calcular la mediana
y tendramos que recurrir a la moda.
Percentiles y Cuartiles
Sabemos que la mediana de la muestra la divide en dos partes iguales.
Cuando se divide un conjunto ordenado de datos en cuatro partes iguales, los
puntos de divisin se conocen como cuartiles.
Ejemplo: A continuacin se presentan 20 observaciones en orden del tiempo de
falla, en horas, de un material aislante elctrico:
204
1176

228
1296

252
1392

300
1488

324
1512

444
2520

624
720
2856 3192

Ntese que la mediana es

13

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

816
3528

912
3710

De modo que

se define a q1 como la media de las

observaciones

De manera similar el tercer cuartil


Cuando el conjunto ordenado de datos se divide en cien partes iguales, los
puntos de divisin reciben el nombre de percentiles.
Definicin: el 100k-esimo percentil Pk es un valor tal, que al menos el 100k%
de las observaciones estn en el valor o por debajo de l, y al menos el 100(1k)% estn en el valor o por encima de l.
Ntese que el primer cuartil q1=P0.25, el tercel cuartil q3=p0.75, y que la
mediana es p0.50. El procedimiento para encontrar el valor de cualquier
percentil pk a partir de datos clasificados, es el siguiente:
1) Encontrar el nmero de la posicin i del percentil mediante el clculo de
nk. Si nk no es entero, entonces i es el siguiente entero ms grande. Si
nk es entero entonces i es igual a nk+.5
2) si i es entero, cuentese desde la observacin ms pequea hasta hallar
el i-simo valor. Si i no es entero, entonces contiene una fraccin igual a
un medio, con lo que el valor de pK es el promedio de las observaciones
ordenadas nk y (nk+1)
Ejemplo
Se desea encontrar los percentiles 10 y 88 de los datos del ejemplo anterior.
Primero queremos calcular p0.10, nk=20(.10)=2 es un entero, el nmero de la
posicin es i=2+.5, el cual es el promedio de las observaciones segunda y
tercera. Por tanto, el percentil 10 es p.010=(228+252)/2=240. El percentil 88
se encuentra de manera similar. Puesto que ahora k=0.88, nk=20(0.88)=17.6,
que no es entero, y el nmero de la posicin es i=18. Por tanto, el percentil 88
es la observacin ordenada nmero 18, esto es p.88=3192
Ejercicio
Los datos siguientes representan la temperatura del fluido de descarga de
una planta para el tratamiento de aguas negras durante varios das
consecutivos
43 47 51 48 52 50 46 49 45 52 46 51
44 49 46 51 49 45 44 50 48 50 49 50
a)Calcule la media muestral y la mediana
b) Calcule la varianza muestral y la desviacin estndar muestral
c) Encuentre los percentiles 5 y 95 de la temperatura

14

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

****

Cuartiles
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos
ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los
datos.
Q2 coincide con la mediana.

Clculo de los cuartiles


1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresin


Nmero impar de datos
2, 5, 3, 6, 7, 4, 9

Nmero par de datos


2, 5, 3, 4, 6, 7, 1, 9

Clculo de los cuartiles para datos agrupados

15

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

En primer lugar buscamos la clase donde se encuentra


las frecuencias acumuladas.

Ejercicio de cuartiles
Calcular los cuartiles de la distribucin de la tabla:
fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer cuartil

Clculo del segundo cuartil

16

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

, en la tabla de

Clculo del tercer cuartil

Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
D5 coincide con la mediana.

Clculo de los deciles

En primer lugar buscamos la clase donde se encuentra


las frecuencias acumuladas.

Ejercicio de deciles
Calcular los deciles de la distribucin de la tabla:

17

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

, en la tabla de

fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Clculo del primer decil

Clculo del segundo decil

Clculo del tercer decil

18

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Clculo del cuarto decil

Clculo del quinto decil

Clculo del sexto decil

Clculo del sptimo decil

Clculo del octavo decil

19

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Clculo del noveno decil

Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
P50 coincide con la mediana.

Clculo de los percentiles

En primer lugar buscamos la clase donde se encuentra


de las frecuencias acumuladas.

Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribucin de la tabla:
fi

Fi

[50, 60)

[60, 70)

10

18

[70, 80)

16

34

[80, 90)

14

48

20

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

, en la tabla

[90, 100)

10

58

[100, 110)

63

[110, 120)

65

65

Percentil 35

Percentil 60

MEDIDAS DE DISPERSIN O VARIABILIDAD


El rango
La varianza
La desviacin estndar
El coeficiente de variacin
el rango da aproximadamente tanta informacin acerca de la variabilidad de
las observaciones como otras medidas de variabilidad, la medida de dispersin
ms importante es la varianza de la muestra.
Rango para datos agrupados
Para estimar el rango de una distribucin de frecuencia se resta el lmite
inferior del intervalo de clase ms chico del lmite superior del intervalo de
clase ms grande
21 Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ejemplo:
Una muestra de las edades del pblico de un concierto se encuentra distribuida
de la siguiente manera:
Rango = mayor lmite superior - menor lmite inferior = 49 - 15 = 34
Edades

Nmero de personas

15 - 19

20 - 24

25 - 29

30 - 34

15

35 - 39

10

40 - 44

45 - 49

Varianza
Si
es una muestra de n observaciones, la varianza de la
muestra es:
Varianza de una muestra
Desviacin estndar de la
muestra

Las frmula de la varianza de una poblacin es ligeramente diferente.


Varianza de la poblacin
poblacin

22

Desviacin estndar de la

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

La varianza y la desviacin estndar sirven para cuantificar la variabilidad de


una muestra midiendo su dispersin alrededor de la media.
Sin embargo si trabajamos con la raz cuadrada de la varianza esto nos dar
una medida de dispersin expresada en la mismas unidades que la variable
original y esto es sacar la desviacin estndar.
Por ejemplo: Considere los datos de resistencia al estallamiento obtenidos de
dos muestras de 6 botellas cada una :
Muestra 1 :

230 250 245 258 265 240

Muestra 2:

190 228 305 240 265 260

L a media de ambas muestras es 248. Sin embargo observe que la dispersin


de la muestra es 2 es mucho mayor que la de la muestra 1
Calcule la varianza de la muestra de la resistencia al estallamiento para la
segunda muestra.

190

36100

228

51984

305

93025

240

57600

265

70225

260

67600

Suma=1488

23

Suma=376534

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Si calculamos la varianza a la muestra 1 vemos que


este
resultado es considerablemente ms pequeo que el de la muestra 2.
Ejemplo 2
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de
la lnea de produccin son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. Cul es la
varianza y la desviacin estndar de las observaciones muestreadas?
X
85.4

7293.16

85.3

7276.09

84.9

7208.01

85.4

7293.16

84.0

7056.00

La varianza es

24

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

La desviacin estndar e
El coeficiente de variacin
El coeficiente de variacin es una medida de variabilidad relativa, tal que
expresa la magnitud de la desviacin estndar como un porcentaje de la
media. Se expresa como porcentaje en vez de las mismas unidades que los
datos. La frmula de clculo es,

El coeficiente de variacin se utiliza para comparar variabilidad entre dos o


ms variables que se miden en diferentes unidades o cuya media es muy
diferente.. Por ejemplo, las siguientes cifras son las horas de estudio de 10
alumnos para presentar un examen de Qumica General 1 y las calificaciones
que obtuvieron:
Horas de estudio: 7 5 10 12 10 6 18 15 4 9
Calificacin:

60 44 80 75 70 65 90 90 35 65

Sustancia

S2

Horas de estudio

9,6

Calificacin

67,4

19,8222
323,156

CV

4,4522

46,4%

17,9765

26,7%

Un error sera comparar la variabilidad absoluta usando la varianza o la


desviacin estndar entre las variables, tal que estn medidas en diferentes
unidades, con lo cual, podra concluirse que las calificaciones tienen mayor
variabilidad. Se podra decir que entre los alumnos existe una mayor
variabilidad con respecto a las horas de estudio en relacin a las calificaciones
obtenidas en el examen de Qumica General 1.
Medidas de Simetra:
Las medidas de la asimetra, al igual que la curtosis, van a ser medidas de la
forma de la distribucin, es frecuente que los valores de una distribucin
tiendan a ser similares a ambos lados de las medidas de centralizacin. La

25

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

simetra es importante para saber si los valores de la variable se concentran en


una determinada zona del recorrido de la variable.

As<0
As>0

As=0

Asimetra negativa
Asimetra positiva a la derecha

Simtrica

Para medir la asimetra se puede realizar atendiendo bsicamente a dos


criterios:
Comparando la Media y la Moda.
Comparando los valores de la variable con la media.
Comparando la Media y la Moda:
Si la diferencia
es positiva, diremos que hay asimetra positiva o a la
derecha, en el caso de que sea negativa diremos que hay asimetra negativa o
a la izquierda. No obstante, esta medida es poco operativa al no ser una
medida relativa, ya que esta influida por la unidad en que se mida la variable,
por lo que se define el coeficiente de Asimetra como:

26

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Esta medida es muy fcil de calcular, pero menos precisa que el coeficiente de
asimetra de Pearson. El coeficiente de asimetra de Pearson, se basa en la
comparacin con la media de todos los valores de la variable, as que es una
medida que se basar en las diferencias,
como
vimos en el caso de la dispersin si medimos la media de esas desviaciones
sera nulas, si las elevamos al cuadrado, seran siempre positivas por lo que
tampoco serviran, por lo tanto precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por
lo tanto
relativa, dividimos por el cubo de su desviacin tpica. Con lo que resulta la
siguiente expresin:

donde
es la marca de clase
N es el nmero total de datos
n es el nmero total de marcas de clase
f es la frecuencia de cada marca de clase
Medida de puntamiento, Curtosis:
La curtosis es una medida del puntamiento, que nos indicar si la distribucin
es muy puntada o poco puntada
Curtsis negativa
Curtosis positiva
Platicrtica
Leptocrtica

27

Curtosis nula
Mesocrtica

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Como podemos observar, el coeficiente de curtosis nos


mide el grado puntamiento de la distribucin. Este coeficiente lo vamos a
denotar por K y se calcula segn la siguiente expresin:

PROBABILIDAD
Introduccin
La Probabilidad pertenecen a la rama de la matemtica que estudia ciertos
experimentos llamados aleatorios, o sea regidos por el azar, en que se conocen
todos los resultados posibles, pero no es posible tener certeza de cul ser en
particular el resultado del experimento. Por ejemplo, experimentos aleatorios
cotidianos son el lanzamiento de una moneda, el lanzamiento de un dado,
extraccin de una carta de un mazo de naipes. Ms adelante se ver que
debemos distinguir entre los conceptos de probabilidades matemticas o
clsicas de las probabilidades experimentales o estadsticas.
Experimento Aleatorio: experimento que puede ser repetido bajo "las
mismas condiciones", del que puede establecerse el conjunto de sus posibles
resultados, pero no predecir un resultado concreto.

28

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Espacio muestral: Es elconjunto de posibles resultados de un experimento


aleatorio. ( y se denota por
)
Punto muestral: elemento del espacio muestral.
Suceso o Evento: cualquier subconjunto del espacio muestral y lo denotamos
por E

Ejemplo: Lanzar un dado, su espacio muestral es:

Eventos

La probabilidad clsica se define como el nmero de resultados favorables a A,


dividido entre el nmero total de posibles resultados del experimento aleatorio,
o sea:
P[A] =Nmero de casos favorables A/Nmero de casos posibles
Una desventaja importante del concepto clsico de probabilidad es su limitada
aplicacin, ya que hay muchas situaciones en que las posibilidades que se
presentan no pueden considerarse igualmente probables.
Los elementos bsicos de la teora de probabilidad son los resultados del
proceso o fenmeno en estudio. Cada posible resultado de un experimento se
llama evento.
Cada vez que un espacio muestral est formado por N posibles resultados
igualmente probables, la probabilidad de cada uno de ellos ser 1/N.
Probabilidades como conjuntos
1) : espacio muestral o conjunto de todos los resultados posibles.
2)

3
4)

al

menos

:ambos

uno

de

los

eventos

eventos

ocurre.

ocurren

Ac : el evento A no ocurre
Axiomas de Probabilidad

Axioma 1
La probabilidad de que ocurra un evento A cualquiera se encuentra entre cero
y uno.
0 < P(E) < 1
Axioma 2

29

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

La probabilidad de que ocurra el espacio muestral es 1. (un evento seguro)


P(
)=1
La probabilidad de un evento imposible es cero
Axioma 3
Si A y B son eventos mutuamente excluyentes, es decir que no tienen
elementos en comn, entonces:
P(A U B) = P(A) + P(B)
Si se tienen n eventos mutuamente excluyentes A 1, A2, A3,.....An,
entonces:
P(
) = P(A 1) + P(A2) + ... + P(An)
La probabilidad de que alguno de dos eventos pertenecientes a un mismo
espacio muestral se determina mediante la siguiente ecuacin.

La probabilidad del suceso contrario de A, deber ser P(A)=1-P(A c)


La probabilidad de que un evento dado ocurra pero no ocurra otro dado

Ejemplo 1: una mujer portadora de hemofilia tiene 3 hijos Cul es el espacio


muestral apropiado para estudiar la posible hemofilia de estos?
Opcin a: Cada hijo puede padecer hemofilia (s) o no (n), por tanto
W1={sss, ssn, sns, nss, snn, nsn, nns, nnn}
Donde, por ejemplo, 'sns' significa el primero y el tercero la padecen y el
segundo no.
Hay que asegurarse que no se olvida ninguno.
En este espacio muestral, el suceso "dos hijos padecen hemofilia" se
representa
como A1={ssn, sns, nss} y el suceso "los dos primeros no la padecen" como
A2={nns, nnn}
Ejemplo: Si el experimento es lanzar un dado una vez, el espacio muestral es:
S = { 1, 2, 3, 4, 5, 6 }
Si el evento A es cae un nmero par A = { 2, 4, 6 }
Si el evento B es cae un nmero menor de 3 B = { 1, 2 }
Cul ser la probabilidad de que suceda alguno de estos dos eventos?
Solucin:
Primero identificamos que es lo que queremos, "la probabilidad de que sea par
o menor de tres",es decir, P( A U B ). Ya que identificamos lo que queremos ,

30

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

ahora debemos saber lo que conocemos la probabilidad de A y la probabilidad


de B es: P(A)=3/6=.50 y P(B)=2/6=.33
Para aplicar este teorema es necesario conocer la probabilidad
de la interseccin de estos dos eventos
entonces P(
)=.16
si se quiere conocer la probabilidad de la unin, o de manera inversa, conocer
la probabilidad de la unin para calcular la probabilidad de la interseccin.
En este caso queremos saber la unin, entonces es necesario conocer la
interseccin, que es " nmero par y menor de 3". Si aplicamos la regla de
adicin: P( A U B ) = P( A ) + P( B ) P( A B )
P( A U B ) = 0.50 + 0.33 0.16 = 0.67
Ejemplo: En el experimento de lanzar un dado y registrar que cara es la de
arriba, si el suceso B=es menor que 3 es: P(B)=2/6=0.33

Cul es la probabilidad de que no sea ni par ni menor de tres?


En este caso estamos hablando del complemento de la unin de los sucesos A
y B, es decir

Sabemos que

Entonces

Ejercicios
1.- Si la P(A)= 0.3, P(B)=0.2 y
Determine
2.- Cada pregunta de un examen tiene dos respuestas alternativas de las que
solo
Una es correcta. Un alumno contesta al azar un examen de este tipo con 3
preguntas.
a)

Construya un espacio muestral adecuado a esta experiencia

b)
Calcule P(B) ,
, P(C) y
A:El alumno contesta correctamente la primera pregunta
B: El alumno contesta correctamente dos de las 3 preguntas

31

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

siendo

C:El alumno contesta correctamente las 3 preguntas


3.- Un experimento consiste en lanzar una moneda (perfecta) y un dado
(perfecto)
Suponga que los resultados de la moneda son guila o sol. Considere los sig.
eventos
A: Observar un guila y un nmero mayor o igual a 3
B: Observar un nmero par
Determine P(A), P(B),
y

Eventos Independientes
Se refiere a dos o ms eventos que podran presentarse al mismo tiempo.
Si la ocurrencia de uno no afecta la probabilidad que suceda otro evento
cualquiera, se dice que son eventos estadsticamente independientes.

Ejemplo:
Al lanzar un dado tres veces, segn las probabilidades, es conveniente
apostar a favor o en contra de obtener al menos una vez el 2? "Al menos una
vez el 2" quiere decir "alguna vez se obtiene el 2".Llamando A={alguna vez se
obtiene el 2}, su complemento es A c={ninguna vez se obtiene el 2}
P(Ac)=P(no sale 2 en 1er lanzam.) P(no sale 2 en 2 lanzam.)P(no sale 2 en
3er lanzam.)=(5/6)(5/6)(5/6) =125/216 =0,58.
Luego, como P(A)+P(Ac)=1
P(A)=1-0,58=0.42=42%. Por lo tanto, no conviene apostar a favor.
Probabilidad condicional
La dependencia estadstica existe cuando la probabilidad de un evento
depende o est asociada a la ocurrencia de otros eventos. La probabilidad
conjunta en condiciones de dependencia estadstica:

Ejemplo: En una tmbola hay dos bolitas blancas y tres bolitas negras, cul es
la probabilidad de sacar una blanca y despus una negra?
a) Si hay reposicin, esto es, despus de sacar la primera bolita, sta se
devuelve a la tmbola.
b) Si no hay reposicin, esto es, despus de sacar la primera bolita, sta no se
devuelve a la tmbola.
Solucin:

32

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

a)

En este caso los eventos son


independientes ya que al reponer la bolita la ocurrencia de un evento no afecta al
otro.
Sean los eventos A: "sacar una bolita blanca" y B: "sacar una bolita negra",
entonces, usando

b)

Si no hay reposicin, los eventos son dependientes ya que


la bolita no es repuesta a la tmbola, por lo que ocupamos
=2/53/4=3/10

Ejercicios:
Repita el problema anterior, pero ahora la pregunta es cul es la probabilidad
de sacar una blanca y una negra? (note que ahora no importa el orden).
a) Si hay reposicin, esto es, despus de sacar la primera bolita, sta se
devuelve a la tmbola
b) Si no hay reposicin, esto es, despus de sacar la primera bolita, sta
no se devuelve a la tmbola.
2.- Para obtener licencia para conducir, es necesario aprobar tanto el examen
terico como el prctico. Se sabe que la prob. que un alumno apruebe la parte
terica es 0,68, la de que apruebe la parte prctica es 0,72 y la de que haya
aprobado alguna de las dos partes es 0,82. Si se elige un alumno al azar, cul
es la prob. de que apruebe el examen para obtener licencia?

Teorema de Bayes

Si
cuales uno debe de ocurrir, es

decir

33

son n eventos mutuamente excluyentes, de los

, entonces

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Tcnicas de Conteo
Regla de producto para pares ordenados
Si el primer elemento y objeto de un par ordenado se puede seleccionar en n 1
formas, y por cada una de las n 1 formas se puede seleccionar el segundo
elemento del par en n2 formas, entonces el nmero de pares es n 1n 2.
Ejemplo: El propietario de una casa desea efectuar algunas remodelaciones y
requiere los servicios de un contratista plomero y un contratista electricista.
Si hay 12 plomeros y 9 electricistas en la zona. De cuantas formas se puede
seleccionar los contratistas? N1=12 y n2=9 asi que el producto es N=(12)
(9)=108 formas posibles de escoger los dos tipos de contratistas.
Permutaciones
Para calcular las probabilidades de varios eventos es necesario contar el
nmero de resultados posibles de un experimento.
Una permutacin es un arreglo en un orden particular, de los objetos que
forman un conjunto. Por ejemplo considere las diferentes formas en que
pueden situarse las letra a,b y c.
Para la primera posicin puede elegirse una de las 3 letras para la segunda
cualquiera de las 2 restantes y para la tercera la letra que qued.
As que existe 3x2x1=6 maneras en que pueden arreglarse tres letras y estos
Areglos son:
abc, acb, bac, bca, cab, cba.
En general el nmero de permutaciones de n objetos diferentes es:
n(n-1)(n-2)(2)(1)=n!
El nmero de permutaciones de n objetos si se toma r a la vez es:

Ejemplo En muchos estados de la Unin Americana, las placas de los


automviles , se identifican por tres letras y tres nmeros. Cul es el nmero
total si ninguna letra de placas puede usarse ms de una ocasin en la misma
placa? Cul es el nmero total sin esta restriccin?
Solucin
Con la restriccin, el nmero total de permutaciones que puede obtenerse con
Las 26 letras tomadas 3 a la vez es: P(26,3)=26!/23!=26x25x24x23!/23!
=15600
Combinaciones
Una combinacin de los objetos de un conjunto es una seleccin de estos sin
importar el orden. Se entender por el nmero de combinaciones de r objetos

34

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

tomados de un conjunto que contiene n de estos, al nmero total de


selecciones distintas en la que cada una de estas tiene r objetos.
La diferencia entre una permutacin y una combinacin es que la primera se
centra en contar todas las posibles selecciones y todos los arreglos de stas.
Mientras que la segunda solo recae e contar el nmero de selecciones
diferentes
Puede obtenerse el nmero de combinaciones de n objetos tomando r a la vez
denotado por

Ejemplo: Supngase que van a enviarse cinco jueces federales a cierto


Estado . El jefe del senado estatal enva al presidente una lista que contiene los
nombres de diez hombres y cuatro mujeres. Si el presidente decide que de los
cinco jueces tres deben de ser hombres y dos mujeres de cuntas maneras
puede lograrse lo anterior empleando a los candidatos de la lista?
El nmero de maneras distintas en que pueden seleccionarse tres hombres
entre diez es:

As el nmero de maneras en que pueden


seleccionarse dos mujeres de entre 4 es:

Nota: En una permutacin, el orden de los objetos de cada posible resultado es


diferente. Si el orden de los objetos no es importante, cada uno de estos
resultados se denomina combinacin. Por ejemplo, si se quiere formar un
equipo de trabajo formado por 2 personas seleccionadas de un grupo de tres
(A, B y C). Si en el equipo hay dos funciones diferentes, entonces si importa el
orden, los resultados sern permutaciones. Por el contrario si en el equipo no

35

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

hay funciones definidas, entonces no importa el orden y los resultados sern


combinaciones. Los resultados en ambos casos son los siguientes:
Permutaciones: AB, AC, BA, CA, BC, CB
Combinaciones: AB, AC, BC
Combinaciones: Es el nmero de formas de seleccionar r objetos de un grupo
de n objetos sin importar el orden.
Ejercicios
1.-Tres componentes electrnicos - un transistor, un capacitor, y un diodo sern ensamblados en una tablilla de una televisin. Los componentes pueden
ser ensamblados en cualquier orden. De cuantas diferentes maneras pueden
ser ensamblados los tres componentes?
2.- En una compaa se quiere establecer un cdigo de colores para identificar
cada una de las 42 partes de un producto. Se quiere marcar con 3 colores de
un total de 7 cada una de las partes, de tal suerte que cada una tenga una
combinacin de 3 colores diferentes.
Definicin: Una variable aleatoria Y se dice discreta si solamente puede tomar
un conjunto numerable de valores.
El nmero de bacterias por unidad de rea en el estudio de control de frmacos
respecto al crecimiento bacteriano e una variable aleatoria discreta.
Por qu estudiar la teora de la probabilidad? Necesitamos la probabilidad de
una muestra observada para hacer inferencias acerca de una poblacin.
Dado que cierto tipos de variables aleatorias ocurren con mucha frecuencia en
la prctica, es til disponer de las posibilidades para cada valor de una variable
aleatoria. Este conjunto de posibilidades se llama distribucin de probabilidad.
Se utilizan maysculas para denotar variables aleatorias y minsculas para
denotar valores particulares que puede tomar una variable aleatoria.
Distribuciones de Probabilidad
Distribuciones aleatorias discretas
hipergeomtrica, de Poisson)

(Binomial, geomtrica,

Distribuciones aleatorias continuas


(Uniforme, Exponencial,
Normal, t de Student, Ji-cuadrada y F)
Puede concebirse una distribucin de probabilidad como una distribucin
terica
de frecuencia. Una distribucin terica de frecuencia es una
distribucin de probabilidad que describe cmo se espera que varen los
resultados del experimento
Definicin. Sea S un espacio muestral sobre el que se encuentra definida una
funcin de probabilidad. Sea X una funcin de valor real definida sobre S, de
manera que transforma los resultados de S en puntos sobre la recta de los
reales. Se dice entonces que X es una variable aleatoria.

36

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Estas dos funciones se usan para predecir el comportamiento de las variables


aleatorias y se denominan funcin de densidad y funcin de distribucin
acumulativa
Definicin. Sea X una variable aleatoria discreta. Se llamar a p(x)=P(X=x)
funcin de probabilidad de la variable aleatoria X, si satisface las siguientes
propiedades:
1.-

2.Definicin: (densidad discreta) Sea X una variable aleatoria discreta. La


funcin f de densidad dada por f(x)=P(X=x)
Condiciones necesarias y suficientes para que una funcin sea una
densidad discreta
1.-

2.Definicin. La funcin de distribucin acumulativa de la variable aleatoria X es


la probabilidad de que X sea menor o igual a un valor especfico de x y est
dada por:

En general, la funcin de distribucin acumulativa F(X) de una variable


aleatoria discreta es una funcin no decreciente de los valores de X, de tal
manera que
1.-

2.-

3.Adems, puede
aleatorias de valor entero se tiene que
4.-

37

establecerse

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

que

para

variables

5.Ejemplo: Considrese la variable aleatoria Y, el nmero de clulas expuestas


a linfocitos que contiene antgeno en presencia de poli etilenglicol para
obtener la primera fusin se sabe que bajo estas condiciones la probabilidad
de que se fusione una clula dada es de . Es razonable suponer que las
clulas se comportan en forma independiente. Los valores posibles de Y son
{1,2,3,}. La probabilidad de que la primera clula se fusione es . En otras
palabras:
P[Y=1]=f(1)=1/2
La probabilidad de que la primera clula no se fusione proporciona un valor de
2 para Y, es:
P[Y=2]=f(2)=P[la primera clula no se fusione]P[la segunda clula si se
fusione]=(1/2)(1/2)=1/4

En forma similar P[Y=3]=f(3)=(1/2)(1/2)(1/2)=1/8 es posible


identificar una expresin de forma de la densidad.
En este caso:
y=1,2,3,
en cualquier otro caso
Esta es una densidad porque cumple 1) y 2) una vez que se sabe que la
funcin es una densidad, puede usarse para responder
preguntas
concernientes al comportamiento de Y
Tabla
y
1
2
3
4
5
6
7
f(y)
Ejemplo
Cul es la probabilidad de que sea necesaria la exposicin de cuatro o ms
clulas
a linfocitos portadores de antgeno en presencia de de poli etilenglicol para
obtener
la primera fusin? En otras palabras Cul es el valor de la densidad de Y es la
del ejemplo anterior y encontraremos la probabilidad buscada de la siguiente
manera:

= 1-(P[Y=1]+P[Y=2]+P[Y=3])=
1-(f(1)+f(2)+f(3))=1-(1/2+1/41/8)=
7/8=1/8

38

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

=1-

Distribuciones aleatorias discretas


Distribucin de probabilidad binomial
Existen muchos problemas aplicados en los que interesa la probabilidad de que
un evento ocurra x veces en n ensayos. En otras palabras, se est interesado
en lograr x aciertos y n-x fracasos en n ensayos.
Una variable discreta tiene distribucin binomial cuando cumple con las
siguientes condiciones:
1. El experimento consta de n ensayos o pruebas idnticas.
2. Cada ensayo puede tener uno de dos resultados. Un resultado se llama
xito, y al otro, fracaso.
3. La probabilidad de un xito en un ensayo es igual a p y permanece
constante de una a otro ensayo. La probabilidad de un fracaso es q = 1-p.
4. Los ensayos son estadsticamente independientes.
5. Interesa conocer x, el nmero de xitos observados en n pruebas.
La frmula de la distribucin binomial es:

y=0,1,2,,n
Ejemplo1.
Un agente qumico produce la decoloracin del 5% de los rollos de papel
producido por cierta compaa. Cul es probabilidad de que en una muestra
aleatoria de 7 rollos de papel, 1 rollo presente decoloracin debido al agente
qumico?.
Solucin
Este problema se puede considerar como un problema de distribucin binomial
para el cual n=7 y p=0,05. Por medio de la frmula la probabilidad de 1 rollo
decolorado est dada por,

Por lo tanto, hay una probabilidad de 0,257 de que de los 7 rollos de papel
ocurra que uno presente decoracin debido al agente qumico.
Ejemplo 2
La experiencia ha demostrado que el 30% de todas las personas afectadas por
cierta enfermedad, se recupera. Una compaa farmacutica desarroll una
nueva vacuna. Se seleccionaron al azar 10personas con la enfermedad en
cuestin y se les administr la vacuna; poco despus 9 se recuperaron.
Supngase que la vacuna es absolutamente eficaz. Cul es la probabilidad de
que al menos 9 de 10 personas se recuperen?

39

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Solucin
Sea y el nmero de personas que se recuperen. Si la vacuna no funciona la
probabilidad de que la persona se recupere es p=0.3. Si el nmero de pruebas
es n=10, la probabilidad de que exactamente 9 personas se recuperen es:

De manera similar la probabilidad de que 10 personas se recuperen es:

Entonces
Ejercicios
La probabilidad de que un enfermo se recupere de un padecimiento gstrico es
0.8 . Supngase que 20 personas han contrado tal afeccin.
a) Cul es la probabilidad de que sobrevivan exactamente 14?
b) cul es la probabilidad de que al menos 10 sobrevivan?
c) cul es la probabilidad de que al menos 14, pero no ms de 18 sobrevivan?
d) cul es la probabilidad de que a lo ms 18 sobrevivan?
Distribucin Binomial Negativa
Una distribucin binomial negativa puede considerarse como lo inverso de la
distribucin binomial.
Propiedades binomiales negativas
1) El experimento consta de una secuencia de ensayos independientes.
2) Cada ensayo puede resultar en un xito S o o fracaso F (cada ensayo
con probabilidad p de xito).
3) Los ensayos se observan hasta obtener exactamente r xitos, donde el
experimentador fija el valor de r.
4) La variable aleatoria X es el nmero de ensayos necesarios para lograr
los r xitos.
Definicin :
Se afirma que una variable aleatoria X tiene distribucin binomial negativa, con
parmetros p y r, si su densidad f est dada por:

40

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

r=1,2,3,
x=r,r+1,r+2
Ejemplo: Las fibras de algodn usadas en los propulsores de cohetes son
sometidas a un proceso de nitracin, el cual permite que las fibras de algodn
entren en solucin. Este proceso tiene efectividad de 90% en cuanto a que el
material producido pueda conformarse segn se requiera en una etapa anterior
al proceso, con probabilidad de 0.9. Cul es la probabilidad de que se
produzca exactamente 20 lotes para obtener el tercer lote defectuoso?
Solucin
En este caso el xito es la obtencin de un lote defectuoso por lo que p=0.1 y
r=3. La probabilidad de que X=20 est dada por

Distribucin de probabilidad geomtrica


La variable aleatoria que tiene distribucin geomtrica se define para un
experimento que es muy similar al experimento binomial. Tambin se refiere a
pruebas idnticas e independientes, y cada una puede tener dos resultados,
xito o fracaso. La probabilidad de tener existo es p . Sin embargo la variable
aleatoria geomtrica Y es el nmero de prueba en la cual ocurre el primer
xito, en lugar del nmero de xitos que ocurren en n pruebas.
El espacio muestral S para el experimento contiene el siguiente conjunto
infinito
Contable de puntos muestrales.
E1: S
E2:FS
E3:FFS
E4:FFFS
.
.
Ek:FFFFS.
De modo que p(y)=P(Ey)=P(FFFFFS)

De modo que la distribucin de probabilidad geomtrica


y=1,2,3,
Ejemplo

41

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Supongamos que la probabilidad de que falle un motor durante cualquier


periodo de una hora es p=0.02. Encuentre la probabilidad de que dicho motor
funcione bien durante dos horas.
Solucin
Sea Y el nmero de intervalos de una hora hasta la primera falla, entonces

P(de que funcione bien en dos hora)=

P(de que funcione bien en dos hora)=


Un explorador de petrleo perforar una serie de pozos en cierta rea para
encontrar un pozo productivo. La probabilidad de que tenga xito en una
prueba es 0.2.

a) Cul es la probabilidad de que el primer pozo productivo sea el tercer pozo


perforado?
b) Cul es la probabilidad de que el explorador no vaya a encontrar un pozo
productivo si solamente puede perforarse a lo ms 10 pozos
Distribucin de probabilidad hipergeomtrica
Supngase que una poblacin contiene un nmero finito N de elementos, cada
uno de los cuales tiene una de dos caractersticas. De esta manera r elementos
podran ser rojos y b=N-r negros. Se selecciona una muestra aleatoria de n
elementos de la poblacin y la variable aleatoria de inters es Y, el nmero de
elementos en la muestra. Esta variable aleatoria tiene una distribucin de
probabilidad hipergeomtrica.

El nmero total de puntos muestrales de S ser entonces igual


al nmero de formas de seleccionar un subconjunto de n elementos de una
poblacin de N elementos, o
. La probabilidad para un punto muestral
de S es igual a

para todos

42

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ya que un muestreo aleatorio implica que todos los puntos muestrales son
equiprobables.
El nmero total de puntos muestrales en el evento numrico Y=y sera el
nmero de puntos muestrales de S que contienen y elementos rojos y (n-y)
elementos Negros.
Distribucin de probabilidad hipergeomtrica

y entero 0,1,2,,n

Ejemplo:
Se seleccionan 10 personas para un trabajo de un grupo de 20 ingenieros con
doctorado. Cul es l probabilidad de que el grupo de los 10 ingenieros
seleccionados incluya a los cinco mejores del grupo de20?
Solucin:
En este ejemplo N=20, n=10 y r=5. Es decir , hay solamente 5 del conjunto de
los mejores ingenieros y buscamos la probabilidad de que Y=5, siendo Y el
nmero de los mejores ingenieros entre los 10 seleccionados.

Ejercicio
En un almacn se tienen 10 impresoras, de las cuales cuatro son defectuosas.
Una compaa selecciona 5 de las mquinas al azar, suponiendo que todas
funcionan bien. Cul es la probabilidad de que las 5 mquinas sean no
defectuosas?

43

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Distribucin de probabilidad de Poisson


La distribucin de Poisson representa la probabilidad de que un evento aislado
(o variable aleatoria discreta) ocurra un nmero especfico de veces en un
intervalo de tiempo, espacio o distancia, dado un promedio por unidad de
medida.
Un rasgo caracterstico de esta distribucin es el hecho de que la ocurrencia de
un evento puede ser cuantificada; no as su no-ocurrencia, dada su falta de
significado en trminos fsicos. De este modo, no puede medirse el nmero
total de eventos n, en consecuencia, no es posible aplicar con precisin la
distribucin binomial.
Definicin: Se dice que una variable aleatoria X tiene distribucin de Poisson
con parmetros k si su densidad f est dada por:

Pasos en la solucin de un problema de Poisson:


1.-Determinar la unidad de medicin bsica que se usa
2.-Determinar el nmero promedio de casos del evento por unidad. Este
nmero se denota con
3.-Determinar la magnitud o el tamao del periodo de observacin. Se denota
por s.
4.-La variable aleatoria X, el nmero de ocurrencias del evento en el
intervalo de
tamao s corresponde a una distribucin de Poisson, con
parmetro
Ejemplo1. Supngase que partculas radiactivas dan en cierto blanco a una
tasa promedio de 3 partculas por minuto. Cul es la probabilidad de que 2
partculas den en el blanco durante un minuto cualquiera?.
Solucin:
Aplicando la frmula, se puede calcular la probabilidad de exactamente dos
partculas:

44

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ejemplo2:
El nmero de glbulos blancos de un individuo sano puede promediar apenas
6000 clulas por milmetro cbico de sangre. A fin de identificar la deficiencia
de glbulos blancos se toma una gota de 0.001 milmetros cbicos de sangre y
se cuenta el nmero de glbulos blancos, X. Cuntos glbulos blancos se
esperaran en una persona sana ? Si se identificaron cuando mucho 2, es ello
un signo de deficiencia de glbulos blancos?
Solucin:
El evento discreto de inters es la presencia de glbulos
blancos, y el intervalo continuo, la gota de sangre, sea la unidad de medicin el
milmetro cbico entonces s=0.001 y
Cuan frecuente es que haya cuando mucho dos? Es decir

Ejemplo:
Cierto tipo de rboles tiene retoos dispersos de manera aleatoria sobre un
rea extensa, con una densidad promedio de retoos de aproximadamente
cinco por yarda cuadrada. Encuentre la probabilidad
de que un
guardabosques, al escoger al azar 10 porciones de una yarda cuadrada en esa
rea, no encuentre retoo alguno en ninguna de las porciones.
Solucin.
Si la distribucin de un retoo es realmente aleatoria, entonces el nmero
de retoos por regin Y se puede representar por una variable aleatoria de
Poisson con
(la densidad promedio es de cinco por yarda cuadrada)
Entonces

Esperanza Matemtica
Un concepto general es la esperanza matemtica o el valor esperado, lo que se
requiere es el valor promedio terico a largo plazo de X.
Definicin: Sea Y una variable aleatoria discreta con funcin de probabilidad
P(y). Entonces, el valor esperado de Y, E(Y), est definido por

45

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Si p(y) es una caracterizacin exacta de la distribucin de frecuencias


de la poblacin, entonces
que es la media de la poblacin

Definicin Sea g(y) una funcin de una variable aleatoria


discreta Y, que tiene una funcin de probabilidad
p(y). Entonces el valor
esperado de g(y) es:

Definicin: La varianza de una variable aleatoria Y est definida como el valor


esperado de

La desviacin estndar de Y es la raz cuadrada positiva de V(Y)


Ejemplo
Encuentre la media, la varianza y la desviacin estndar de la variable
aleatoria Y, cuya distribucin de probabilidad se da en la siguiente tabla

Tabla
y

P(y)

1/8

3/8

1/4

46

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Toda variable aleatoria se relaciona con constantes y parmetros que son


descriptivos. Se consideran 3 parmetros a saber, la media, la varianza y la
desviacin estndar.
Distribucin de probabilidad para variables aleatorias continas
El tipo de variable aleatoria que toma cualquier valor en un intervalo se llama
continua.
Por ejemplo la produccin de antibitico en un proceso de
fermentacin es una variable aleatoria continua.
Funcin de densidad de probabilidad

Definicin: Sea X una va continua. Entonces, la


distribucin de probabilidad o funcin de densidad de probabilidad de
X es una funcin f(x) tal que para cualesquiera dos nmeros a y b, con

Esto es, la probabilidad de que X tome un valor en el intervalo [a,b] es el rea


bajo la grfica de la funcin de densidad.
Para que f(x) sea una pdf legtima, debe satisfacer las siguientes dos
condiciones
1.-

para toda x

2.rea bajo toda la grfica de f(x)


Funcin de distribucin acumulada

47

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Def: la funcin de distribucin acumulada F(x) para


una va X continua est definida para todo nmero x por

Uso de f(x) para calcular probabilidades como lo indica la figura

y cdf F(x).

Proposicin: Sea X una va continua con pdf f(x)


Entonces para cualquier nmero a,

y para cualquiera dos nmeros a y b, tal que a<b,

Vea las siguientes figuras

Definicin: El valor esperado o valor medio de una va X continua con pdf f(x)
es

Definicin: La varianza de una va X


continua con pdf f(x) y valor medio esperado

48

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Proposicin:

La desviacin estndar de X es
Distribucin de probabilidad uniforme

Def: Se dice que X es una va continua tiene una


distribucin uniforme en el intervalo [A,B] si la pdf de X es:

Ejemplo:

Si
f(x)=0 en otro caso. Si queremos

entonces

recuerde que

As que

Distribucin Gamma Exponencial


La distribucin gamma es una familia de variables aleatorias llamadas
funciones exponenciales

49

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Definicin: (Funcin Ji cuadrada). La funcin

, definida por :

Definicin:(Distribucin gamma). Se dice que una


v.a. X con densidad:

Tiene distribucin gamma con parmetros

Si
la densidad asume la forma de una variable aleatoria
exponencial .

Densidad Exponencial

Ejemplo:
Algunas cepas paramecios producen y secretan partculas asesinas, que
causan al contacto la muerte de un individuo sensible. Todos los paramecios
incapaces de producir dichas partculas son sensibles. El nmero medio de
partculas asesinas emitido por un paramecio asesino es de cada 5 horas. En la
observacin de estos paramecios, Cul es la probabilidad de que se deban
esperarse cando mucho 4 horas antes de que se emita la primera partcula?

Solucin
Tiene una distribucin exponencial con
y la probabilidad

50

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

. As que

que nos interesa es:

Distribucin Ji-cuadrada y F
Definicin: (Distribucin Ji-cuadrada). Sea X una variable aleatoria
gamma con
y
, donde
es un entero positivo. Se
afirma que X tiene una distribucin Ji-cuadrada con
grados de libertad.
Esta variable se denota por

La distribucin F de probabilidad tiene dos parmetros,


representados por
y
se llaman nmero de grados de libertad del
numerador y nmero de grados de libertad del denominador.
Si
son variables aleatorias ji cuadrada independiente con
y
grados de libertad respectivamente, entonces se puede demostrar que la
variable aleatoria

Distribucin Normal
Def: Se dice que una va X continua tiene una distribucin normal con
parmetros

donde

si la pdf de X es:

Distribucin Normal Estndar

La distribucin con valores


de distribucin normal estndar.

51

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

recibe el nombre

La cdf de X es
sealamos como

La cual

Teorema del lmite central

Si
es una muestra aleatoria de tamao n
tomada de una poblacin (finita o infinita) con media
y varianza finita
y si
es la media muestral, entonces la forma lmite de la distribucin de

Cuando

, es la distribucin normal estndar.

Para cambiar de una distribucin normal no estndar a estndar

Si X tiene una distribucin normal con media


estndar

Entonces
Tiene una distribucin normal estndar. As

52

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

y desviacin

Ejemplo 1. Suponga que el tiempo medio de reaccin de una sustancia es de


30 segundos y la desviacin estndar de 4 segundos. Cul es la probabilidad
de que en cierto experimento, la reaccin se produzca en menos de 25
segundos?.
Solucin:

La probabilidad que la reaccin se produzca en menos de 25 segundos es


0,10565.
Ejemplo 2. Una analista qumico realiza un gran nmero de medidas de una
solucin con absorbancia media de 0,435 y una desviacin estndar de 0,005.
Qu porcentaje de las lecturas se estima fuera del intervalo 0,425 y 0,445?.
Solucin
Los clculos dan

As pues, el porcentaje de lecturas fuera de intervalo 0,425 y 0,445 es 4,55%.


Simplemente, se calcula restando 1-0,9545. Grficamente, el porcentaje fuera
del intervalo es,

Distribucin t de Student
El hecho fue reconocido por W. S. Gosset, un qumico irlands que en 1908
public, bajo el pseudnimo de Student, un trabajo titulado El error probable

53

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

de una medida. En parte por consideraciones tericas y, en parte, por el uso


de muestras aleatorias, obtuvo la distribucin terica del promedio de tamaos
de muestra pequeas (n30), ajustada a una distribucin normal.
La distribucin de Student tiene propiedades parecidas a N(0,1):
Es de media cero, y simtrica con respecto a la misma;
Es algo ms dispersa que la normal, pero la varianza decrece hasta 1 cuando
el nmero de grados de libertad aumenta
Para un tamao de muestra grande se puede aproximar la distribucin de
Student por la normal.

Estimacin
Definicin: Un estadstico es una funcin de las variables aleatorias que se
pueden observar en una muestra y de las constantes conocidas. Los
estadsticos se utilizan para hacer inferencias (estimaciones o decisiones) con
respecto a parmetros poblacionales conocidos.
Un estadstico es en si una variable aleatoria, por consiguiente deduciremos su
distribucin de probabilidad, que llamaremos distribucin muestral.
Hay dos tipos de estimacin; puntual y por intervalo. Una estimacin
puntual utiliza un solo valor de la muestra para estimar el parmetro de la
poblacin de estudio. Por ejemplo, la media de la muestra
es una
estimacin puntual de la media de la poblacin. La variancia s2 de la muestra
es una estimacin puntual de la variancia 2 de la poblacin.
Consistencia
Cuando el tamao de la muestra crece, el valor estimado se aproxima al
parmetro desconocido.
Insesgado

54

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Un estimador es insesgado cuando su esperanza matemtica coincide con el


valor del parmetro poblacional. A efectos de esta aplicacin un estimador ser
insesgado cuando al repetirse el proceso de muestreo, mediante
reiteraciones1, un nmero suficiente de veces la diferencia entre el valor medio
de estas reiteraciones y el valor objetivo poblacional converja a cero.
Se dice que un estimador
de un parmetro es insesgado si:

Definicin: El sesgo B de estimador puntual

est dado por

Eficiencia
Al estimador, al ser v.a., no puede exigrsele que para una muestra
cualquiera se obtenga como estimacin el valor exacto del parmetro. Sin
embargo, se puede esperar que su dispersin con respecto al valor central
(varianza) sea tan pequea como sea posible.
Entonces dado
y
de un mismo parmetro
es ms eficientes
que
si:

Una distribucin muestral es la distribucin de todos los posibles valores del


estadstico de la muestra, que se pueden obtener de la poblacin para un
determinado tamao de muestra.
Estimadores puntuales

55

Para , el estimador es =
Para

, la media muestral.

, el estimador es

, la varianza muestral.

Para p, el estimador es
la proporcin muestral
donde x es el nmero de objetos en una muestra aleatoria de tamao n
que pertenece a la clase de inters.

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Para
, el estimador es
diferencia entre las medias

, la

muestrales de dos muestras aleatorias independientes.


Para
, el estimador es
la diferencia entre las
proporciones
de las dos muestras, calculadas a partir de dos muestras aleatorias
independientes.

Definicin: La definicin de muestreo de probabilidad de una estadstica


recibe el nombre de distribucin de muestreo.

La distribucin de muestreo de
normal

la media

muestral tiene una distribucin

y varianza

Ejemplo: Una compaa electrnica fabrica resistores que tienen una


resistencia promedio de
y una desviacin estndar de
. La distribucin de la
resistencia es normal. Encuentre la probabilidad de que al tomar una muestra
de n=25 resistores, la resistencia promedio de estos ser menor que
Solucin
Sabemos que la distribucin de muestreo

es normal con media

y desviacin estndar

56

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Estandarizando el punto

se tienen que

y por lo tanto
Definicin: El error estndar de una estadstica es la desviacin estndar de
su distribucin de muestreo. Si el error estndar involucra parmetros
desconocidos cuyos valores pueden estimarse, la sustitucin de estas
estimaciones en el error estndar da como resultado un error estimado.
Es decir el error estndar da alguna idea sobre la precisin de la
estimacin por ejemplo si se utiliza
como estimador puntual de la media
el error estndar mide cuan preciso
estima a
Ejemplo
Un artculo publicado e el Journal describe un nuevo mtodo para medir la
conductividad trmica del hierro Armo, Al utilizar una temperatura de 100F y
una potencia de entrada de 550 W, se obtienen las diez mediciones siguientes
de conductividad trmica (Btu/hr-ft-F)
41.60 41.48 42.34 41.95 41.86
42.18 41.72 42.26 41.81 42.04

Una estimacin puntual de la conductividad trmica promedio a


100F y 550W es la media muestral

El error estdar de la muestra es


Ntese que se ha obtenido un error alrededor de 0.2% de la media muestral, lo
que implica que se ha obtenido una estimacin puntual relativamente precisa
de la conductividad trmica.

Las combinaciones lineales de variables aleatorias


normales independientes siguen una distribucin normal puede afirmarse que
es normal con media

y varianza

57

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

As que si se tienen dos poblaciones independientes con medias ,


y
y varianzas
,
y
son las medias muestrales
de dos muestras aleatorias independientes de tamao

de estas poblaciones, entonces la distribucin de


muestreo

es aproximadamente normal estndar.


Ejemplo:
La vida eficaz de un componente utilizado en la turbina de una aeronave
es una v.a. con media 5000 hras. Y desviacin estndar de 40 horas. La
distribucin de la vida eficaz es muy prxima a una distribucin normal. El
fabricante de la turbina introduce una mejora en el proceso de fabricacin de
este ccomponente, que aumenta el tiempo de vida til promedio a 5050 hras y
disminuye la desviacin estndar a 30 horas. Supngase que se toma del
proceso antinuguo n=16 componentes y una muestra aleatoria del proceso
mejorado de n =25 componentes. cul es la probabilidad de que la diferencia
entre las dos medias muestrales
sea al menos
25 horas?

Solucin
Para

con media

Para

y desviacin estndar

con media

estndar

As que

58

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

desviacin

Teorema: Sean
aleatoria de tamao n de una distribucin normal con media
. Entonces

tiene una distribucin normal con media

una muestra
y varianza

con n grados de libertad.

Teorema: Sea
muestra aleatoria de una distribucin normal con media
y varianza

tiene una distribucin


tambin variables
aleatorias independientes.

una

. Entonces

con (n-1) grados de libertad.

son

Como ejemplo de una v.a. que sigue una distibucin ji-cuadrada,


supngase que
es una muestra de una poblacin normal con
media
y varianza
. La funcin de la varianza

muestral es

est distribuida como

Si
es el promedio de las n observaciones que contiene una muestra
aleatoria, entonces la distribucin de Z es una normal estndar. Supngase que
la varianza de la poblacin es desconocida. Qu sucede con la distribucin si
se reemplaza
por S?
Def: Sea Z una variable aleatoria normal estndar y sea
variable aleatoria Ji-cuadrada con v grados de libertad. Entonces si
son independientes

59

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

una
Z y

Se dice que tiene una distribucin t con v grados de libertad.


Haciendo algunos operaciones y tomando que
y
tiene que

entonces se

tiene una distribucin t con n-1 grados de libertad.


Ejemplo:
Al fabricante de un agente propulsor utilizado en sistemas de
escape de emergencia de aeronaves, le gustara afirmar que su producto tiene
una tasa promedio de combustin de 40 in por minuto. Para investigar esta
afirmacin, el fabricante prueba 25 granos de propulsor seleccionados al azar,
y si el valor calculado de T cae entre
y
, entonces queda
satisfecho. A que conclusin debe llegar el fabricante si tiene una muestra con
una media de
in/min y una desviacin estndar s=0.75in/min?
Supngase que la tasa de combustin tiene una distribucin normal.
Solucin
de modo que t tendr
que caer entre -1.711 y 1.711 para que el fabricante quede satisfecho, pero si
sacamos t obtenemos que
que es un
valor que excede por mucho a 1.711.

Definicin: Sea
y
variables aleatorias ji-cuadrada con v 1
y v2 grados de libertad, respectivamente. Entonces si
y
son
independientes

Se dice que tiene una distribucin F con v 1 grados de libertad del numerador
y v2 grados de libertad en el denominador.
Teorema del lmite central

60

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Sean
variables aleatorias independientes y distribuidas idnticamente con
y
Definimos
donde

Entonces la funcin de distribucin


de distribucin normal estndar cuando

converge a una funcin

El teorema del lmite central establece que, al hacerse ms


grande la muestra, la distribucin de muestreo de las medias de la muestra
tiende hacia la distribucin normal, con media aritmtica y desviacin
estndar
es (a este valor se le conoce como error estndar de la
distribucin muestral). Esta distribucin muestral tender hacia la
normalidad,sin importar la forma de la distribucin de la poblacin de la que se
extrajeron los elementos de la muestra.
Hay otro mtodo para hacer una estimacin mucho ms precisa, la estimacin
por intervalos de confianza.
Al procedimiento de encontrar un intervalo de valores dentro del cual se espera
que se encuentre un parmetro poblacional es conocido como estimacin por
intervalos de confianza.
El nivel de confianza es la probabilidad de que el parmetro poblacional se
encuentre dentro del intervalo. Los niveles de confianza ms ampliamente
usados son 0.95 y 0.99, sin embargo puede usarse cualquier probabilidad
cercana a 1.
Para entender mejor el concepto de intervalo de confianza vamos a suponer
que seleccionamos 100 muestras de una poblacin y calculamos la media de
las muestras e intervalos de confianza del 95% para cada muestra.
Descubriremos que cerca de 95 de los 100 intervalos de confianza contienen la
media poblacional.
Pasos para construir un intervalo de confianza.
1. Establecer el nivel de confianza.
2. Determinar el valor de la variable aleatoria estndar.
3. Calcular los estadsticos de la muestra.
4. Calcular el error estndar.
5. Calcular el error mximo de estimacin.
6. Determinar los lmites del intervalo de confianza e interpretar.
Intervalos de confianza
La estimacin por intervalo de confianza consiste en determinar un posible
rango de valores o intervalo, en los que pueda precisarse con una

61

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

determinada probabilidad que el valor de un parmetro se encuentra dentro


de esos lmites.
A la probabilidad de acertar al decir que el parmetro estaba contenido en
dicho intervalo se la denomina nivel de confianza.
Intervalos de confianza del 95% para la media de una poblacin media
verdadera =20

Intervalos de confianza para una distribucin normal

Intervalo de confianza para la media con varianza conocida

Si
es la media muestral de una muestra aleatoria de tamao
n de una poblacin con varianza conocida
, un intervalo de confianza
para
del
por ciento est dada por

62

Intervalo
desconocida

de

confianza

para

la

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

media

con

varianza

Si
y s son la media y la desviacin estndar de una muestra
aleatoria tomada de una distribucin normal con varianza
desconocida ,
entonces un intervalo de confianza del
por ciento est dada por

Ejemplo
Considrese los datos de conductividad trmica ara el hierro Armco del
ejemplo anterior. Supngase que se desea encontrar un intervalo de confianza
del 95% para conductividad trmica promedio de este material, y que se sabe
que la desviacin estndar de la conductividad trmica a 100F y 550W es
Btu/hr-ft-F. Si se sabe que la conductividad trmica
Est distribuida de manera normal.
Solucin

Ejemplo 2
Un artculo publicado en el Journal of Testing and Evaluation presenta las
siguientes 20 mediciones del tiempo de combustin residual ( en segn dos )
de especmenes tratados de ropa de dormir para nios:
9.85 9.93 9.75 9.77 9.67 9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88 9.95 9.95 9.93 9.92 9.89
Solucin
La media y la desviacin muestrales son:
As que los lmites de confianza del 95% inferior y superior son:

63

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Por consiguiente
Por lo tanto, se tiene una confianza del 95% de que el tiempo de combustin
residual promedio se encuentra entre 9.8073 y 9.8977
Tamao de la muestra

Si
se utiliza como estimacin de
,
entonces puede tenerse una confianza de
por ciento de que el
error
no ser mayor que una cantidad especfica E cuando el tamao
de la muestra sea

Ejemplo: Supngase que se desea el error en la estimacin


de la conductividad trmica promedio del hierro Armco sea menos que
0.05Btu/hr-ft-0F con una confianza del 95%. Puesto que
y
, as que el tamao requerido de la muestra
es

Ejercicios
1.-Un ingeniero civil analiza la resistencia a la
comprensin del concreto. La resistencia est distribuida aproximadamente de
manera normal, con una varianza
. Al tomar una
muestra aleatoria de 12 especmenes, se tiene que

a) Construya un intervalo de confianza bilateral del 95% para la resistencia


a la compresin promedio.
b) Construya un intervalo de confianza bilateral del 99% para la resistencia
a la compresin promedio. Compare el ancho de este intervalo con el
ancho del intervalo encontrado en el inciso a)
2.-Supngase que en el ejercicio anterior se desea estimar la resistencia a la
compresin con un error menor que 15psi para un nivel de confianza del 99%.
Qu tamao de muestra debe emplearse para este fin?

64

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

3.-Los resultados siguientes representan las calificaciones de una muestra


aleatoria de
las calificaciones de estudiantes en el primer examen de
estadstica elemental.
Elaborar un intervalo de confianza del 95% para estimar la media poblacional.
23

60

79

32

57

74

52

70

82

36

80

77

81

95

41

65

92

85

55

76

52

10

64

75

78

25

80

98

81

67

41

71

83

54

64

72

88

62

74

43

60

78

89

76

84

48

84

90

15

79

34

67

17

82

69

74

63

80

85

61

Ejemplo:
Un articulo publicado en el journal presenta las siguientes 20 mediciones del
tiempo de combustible residual (en segundos) de especmenes tratados de
ropa de dormir para nios
9.85 9.93 9.75 9.77 9.67
9.87 9.67 9.94 9.85 9.75
9.83 9.92 9.74 9.99 9.88
9.95 9.95 9.93 9.92 9.89
Se desea encontrar un intervalo de confianza del 95% para el tiempo de
combustible residual promedio
Intervalos de confianza para la diferencia de medias

Intervalo de confianza
varianzas conocidas

Si
independientes
conocidas

n1
y

y
y

para

la

diferencia

de

medias,

son las medias de dos muestras aleatorias


n2
tomadas de poblaciones que tienen varianzas
respectivamente, entonces un

intervalo
de confianza de

por ciento para

es:

donde
es el punto crtico superior que corresponde al porcentaje
de la distribucin normal estndar.

65

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ejemplo:
Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases
de largueros de aluminio utilizados en la fabricacin de alas de aeroplanos
comerciales . De la experiencia pasada con el proceso de fabricacin
delargueros y del procedimiento de prueba, se supone que las desviaciones
estndar de las resistencias a la tensin son conocidas. Los datos obtenidos
aparecen en la tabla
Clase
larguero

del

Tamao de
muestra

la

Media
muestral
de la resistencia

Desviacin
estndar
(kg/mm2)

10

87.6

1.0

12

74.5

1.5

Seleccin del tamao de la muestra


Si se conocen (al menos aproximadamente) las desviaciones estndar
y los tamaos
de
las
dos
muestras
son
iguales
entonces puede determinarse el tamao de la muestra de modo que se tenga
una confianza de
por ciento n que el error en la estimacin de
por
sea menos que E. El tamao requerido para la muestra

de cada poblacin.

HASTA AK SE QUEDARON

66

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Intervalo de confianza para la diferencia de medias, varianzas


desconocidas pero iguales
Es decir tenemos los mismos datos que en el caso anterior con la
diferencia de que ahora nos dan
y
as que ahora tendramos el siguiente intervalo

Donde
el estimador combinado de

es

la
desviacin
estndar
comn
de
la
poblacin
y
es el punto crtico superior que corresponde al porcentaje
de la
distribucin t con
grados de libertad.
Ejemplo
Un artculo publicado en el Hazardus Waste (Vol. 6 1989) dio a conocer
Resultados de un anlisis del peso de calcio en cemento
estndar y en cemento contaminado por plomo. Los niveles bajos de calcio
indican que el mecanismo de hidratacin del cemento queda bloqueado y esto
permite que el agua ataque varias partes de una estructura de cemento. Al
tomar 10 muestras de cemento estndar se encontr que el precio promedio
de calcio es
, con una desviacin estndar
, los
resultados obtenidos con 15 muestras de cemento contaminado con plomo
fueron
y
.
Supngase que el porcentaje de calcio est distribuido de manera
normal. Encuntrese un intervalo del 95% para la diferencia de
de los dos tipos de cementos.

67

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Intervalo de confianza para la diferencia de medias, varianzas


desconocidas pero desiguales

Si
,
,
y
muestras aleatorias de tamao

son las medias y las varianzas de dos

y
, respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas desconocidas y desiguales, entonces
un intervalo de confianza aproximado del

por ciento
para la diferencia entre medias

Donde
superior que corresponde

al porcentaje

es

es el punto crtico

de la distribucin t con v grados de libertad.

Ejercicio
Se piensa que la concentracin del ingrediente activo de un detergente lquido
para ropa, es afectada por el tipo de catalizador utilizado en el proceso de
fabricacin. Se sabe que la desviacin estndar de la concentracin activa es
de 3g/l, sin importar el tipo de catalizador utilizado. Se realizan 10
observaciones con cada catalizador, y se obtienen los datos siguientes:
Catalizador 1
57.9 66.2 65.4 65.4 65.2 62.6 67.6 63.7 67.2 71.0
Catalizador 2
66.4 71.7 70.3 69.3 64.8 69.6 68.6 69.4 65.3 68.8

68

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Suponga que la concentracin activa est distribuida normalmente, y que la


varianza de la concentracin activa de ambos tipos de catalizador
es
desconocida
a) Encuentre un intervalo de confianza del 95% para la diferencia entre las
medias de las concentraciones activas, suponiendo que ambas varianzas
son iguales
b)Encuentre un intervalo de confianza del 95% para la diferencia entre las
concentraciones activas promedio, suponiendo que las varianzas no son
iguales. Compare este intervalo con el del a). Cun diferentes son los
intervalos?

Intervalos
distribucin normal

de

confianza

para

la

varianza

de

una

S
i
es una muestra aleatoria de tamao n
tomada de una poblacin normal y si
es un estimador puntual razonable
de
. Se sabe que si la poblacin es normal, la distribucin de muestreo
es

es ji-cuadrada con n-1 grados de libertad. Para desarrollar el intervalo de


confianza se nota que

Por lo que el intervalo de confianza para la varianza


quedara de la siguiente forma

69

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Donde
y
son los puntos crticos superior e
inferior que corresponden al porcentaje
de la distribucin ji-cuadrada
con n-1 grados de libertad
Respectivamente.

Ejemplo
Un fabricante de detergente lquido est interesado en la uniformidad de
detergente lquido est interesado en la uniformidad de la mquina utilizada
para rellenar botellas. De manera especfica, es deseable que la desviacin
estndar
del proceso de llenado sea menor que 0.5
onzas de lquido; de otro modo, existe un porcentaje mayor del
deseable de botellas con un contenido menor de detergente. Supngase que la
distribucin del volumen de llenado es aproximadamente normal. Al tomar una
muestra aleatoria de 20 botellas, se obtiene una varianzamuestral de
(onzas de fluido). Encuentre el intervalo de con-

fianza del 95%

Intervalo de confianza para una proporcin

70

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Sabemos que
es un estimado puntual de la
proporcin de la poblacin, note que n y p son parmetros de una distribucin
binomial, y se sabe que la distribucin de muestreo de
es
aproximadamente normal con media p y varianza p(1-p)/n . Por lo tanto la
distribucin de

As que para construir el intervalo de confianza para p

Por lo que el intervalo de confianza es:

donde

es el punto crtico que corresponde al porcentaje

Ejemplo

71

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

En una muestra aleatoria de 85 soportes para el cigeal de


un motor de automvil, 10 tienen un terminado que es ms rugoso de lo que
las especificaciones permiten. Por consiguiente, una estimacin puntual de la
proporcin de soportes en la poblacin que excede la especificacin de
rugosidad es
. Puede calcularse un intervalo de
confianza bilateral del 95% para p.

Solucin

Por lo que el intervalo de confianza para la proporcin queda

Seleccin del tamao de la muestra


Puesto que
como

es el estimador de p, puede definirse el error de estimar p por

as que el tamao apropiado de la muestra es:

Ejemplo: Considrese la situacin


del ejemplo anterior Cun grande debe de ser la muestra si desea tener una

72

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

confianza del 95% de que el error al utilizar


requerido de la muestra es

por p, se tiene que el tamao

Intervalo de confianza para la diferencia de dos proporciones

Sean
el nmero de observaciones de la primera
muestra que pertenece a la clase de inters y
el nmero de observaciones
en la segunda muestra de la poblacin. Entonces ests son
y
son v.a.
binomiales independientes con parmetros
y
. Ahora
bien
y
son estimador es independientes de
y
respectivamente. De modo que la estadstica es

Esto implica que

De modo que para encontrar el intervalo de confianza


aproximado de
por ciento para

Prueba de hiptesis

73

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Def: Una prueba de hiptesis estadstica es una proposicin sobre los


parmetros de una o ms poblaciones.

La proposicin
La proposicin

se conoce como hiptesis nula.


se conoce como hiptesis alternativa.

Una prueba de cualquier hiptesis tal como

Recibe el nombre del prueba bilateral.

En algunas ocasiones lo que se desea es formular una


hiptesis alternativa unilateral es decir:
O

Nota: la hiptesis siempre son proposiciones sobre la poblacin , no


proposiciones sobre la muestra. Por lo general, el valor del parmetro dela
poblacin especificado en la hiptesis nula e puede determinar de la
experiencia pasada o del conocimiento del proceso, o incluso de pruebas o
experimentos previos entonces el objetivo de la prueba de hiptesis es
determinar si ha cambiado el valor del parmetro.
Def: El error de tipo I se define como el rechazo de la hiptesis nula
cuando esta es verdadera.
Def: El error tipo II se define como la aceptacin de la hiptesis nula cuando
esta es falsa.
La probabilidad de cometer un erro tipo I se denota como

74

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Decisin
Aceptar H
Rechazar H

H es verdadera
no hay error
Error tipo I

H es falsa
error tipo II
No hay error

Mtodo de prueba de hiptesis


1.- Formulacin de la prueba de hiptesis nula y alternativa.
2.- Determinar el valor observado del estadstico de prueba.
3.-Determinacin del valor crtico del estadstico de prueba
4.-Comparacin del valor observado del estadstico de prueba con el valor
crtico
Prueba de hiptesis sobre la media, varianza conocida

75

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

En consecuencia, H debe rechazarse si

bien
o

Por otra parte, H no puede rechazarse si

Regiones crticas para la prueba de hiptesis bilateral

Regiones crticas para la prueba de hiptesis bilateral

Ejemplo

Los sistemas de escape de emergencia para


tripulaciones de aeronaves son impulsados por un combustible slido. Una de
las caractersticas importantes de este producto es la rapidez de combustin.
Las especificaciones requieren que la rapidez promedio de combustin sea
50cm/s. Se sabe que la desviacin estndar es
. El
experimentador decide especificar un nivel de confianza de
.
Selecciona una muestra aleatoria de n=25 y obtiene una rapidez promedio
muestral de combustin de
. A que conclusin debe llegar?
Solucin

1.-El parmetro de inters es

, la rapidez promedio de

combustin
2.-

76

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

3.4.- La estadstica de prueba es

5.-Rechazar H si z>1.96 o si z<-1.96.


6.- Dado que z=3.25>1.96, se rechaza H:
con un nivel de
significancia de 0.05. Se concluye que con base en una muestra de 25
mediciones, la rapidez promedio de combustin es diferente de 50cm/s. De
hecho, existe una evidencia fuerte que la rapidez promedio de combustin es
mayor que 50cm/s

De manera similar Supngase que se especifica la hiptesis

La regin crtica debe colocarse en la cola superior de la distribucin


normal estndar y el rechazo de H se har cuando el valor calculado de z sea
muy grande. Esto es, H ser rechazada si
.

De manera similar, para probar

Se calcula la estadstica de prueba Z y se rechaza H si el valor de Z


es muy pequeo es decir
H ser rechazada si

77

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ejemplo
Un investigador desea contrastar la hiptesis que el lmite de concentracin del
istopo radiactivo estroncio 90 en la leche es de 5 por litro. Para tal efecto,
selecciona aleatoriamente una muestra de lecheras. La hiptesis nula
considera el lmite de referencia =5, contra la hiptesis alternativa que es
mayor a 5.
Para verificar si las especificaciones se cumplan en cierta regin del

pas, fueron seleccionadas aleatoriamente 40 lecheras,


encontrndose una media aritmtica de 5,4 y una desviacin estndar de la
muestra de 0,493 por litro. Existe una diferencia en la concentracin
promedio con el lmite tolerable?. Realizar la prueba con un nivel de confianza
del 90%.

El valor terico de la distribucin normal al nivel significancia establecido de


0,10, resulta aproximadamente 1,64. Dado que 5,13 es mayor a 1,64, entonces
la decisin sera rechazar la hiptesis nula H.

78

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

La conclusin a que se llegara al nivel de confianza del 90% es que la


concentracin del istopo radiactivo estroncio 90 en todas las lecheras es
significativamente mayor al lmite tolerable.
Prueba de hiptesis para una media con varianzas desconocida

Prueba de hiptesis alternativa bilateral

Se rechaza H si

Prueba de hiptesis alternativa unilateral

Se rechaza H si

Otra alternativa unilateral


Se rechaza H si

79

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Dado que el valor terico determinado con la tabla t de Student para un rea
de 0,025 en cada cola de la distribucin con 4 grados de libertad es 2,7764,
entonces se rechaza H ya que t=3.34>2.77

Prueba de hiptesis sobre las medias de dos distribuciones normales,


varianzas conocidas

80

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Se desea probar

Para ello se tiene la distribucin del siguiente estadstico


de prueba calculado bajo el supuesto que las poblaciones (o variables
consideradas en cada poblacin) tienen aproximadamente una distribucin
normal y las variancias poblacionales son conocidas

81

Se desea probar
Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

82

Se desea probar

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Prueba de hiptesis sobre las medias de dos distribuciones


normales, varianzas desconocidas
Caso 1:

Supngase que se tienen dos poblaciones normales independientes


con medias desconocidas, varianzas desconocidas pero iguales.
Se desea probar

Se calcula el estadstico de prueba

83

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Donde

Por lo que se rechaza H si

De manera similar se tratan las alternativas unilaterales


Para probar

Se rechaza H si
Para probar

Se rechaza H si
Ejemplo

Se analizan dos catalizadores para


determinar la forma en afectan el rendimiento promedio de un proceso
qumico. De manera especfica, el catalizador 1es el que se est empleando en
este momento, pero el catalizador tambin es aceptable. Debido a que el
catalizador 2 es ms econmico, este puede adoptarse siempre y cuando no
cambie el rendimiento del proceso. Se hace una prueba en una prueba planta
piloto y se obtiene que
,
y
,
promedio? Utilice

84

Existe alguna diferencia entre los rendimientos

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Prueba de hiptesis sobre las medias de dos distribuciones


normales, varianzas desconocidas
Caso 1:

Supngase que se tienen dos poblaciones normales independientes


con medias desconocidas, varianzas desconocidas pero iguales.
Se desea probar

Se calcula el estadstico de prueba

Tiene una distribucin t con grados de libertad dados


por

Por lo que se rechaza H si

De manera similar se tratan las alternativas unilaterales


Para probar

Se rechaza H si

85

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Para probar

Se rechaza H si
Ejemplo

Un fabricante de monitores prueba dos diseos de microcircuitos para


determinar si producen un flujo de corriente equivalente. El departamento de
ingeniera ha obtenido los datos siguientes:

Diseo 1:
Diseo 2:

n=15

n=10

Con
, se desea determinar si existe alguna
diferencia significativa en el flujo de corriente promedio entre los dos diseos,
supongamos que
Solucin

Los parmetros de inters son los flujos de corriente promedio de los


circuitos diseos y

=0.10

86

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

El estadstico de prueba es

Puesto -1.746<0.18<1.746 no es posible rechazar H con el nivel de


significancia de 0.10. Esto es no hay evidencia fuerte que indique que el flujo
de corriente promedio de los dos diseos sea diferente.
Prueba de hiptesis para la diferencia de medias pareadas
El procedimiento consiste en tomar dos observaciones de un mismo sujeto, en
condiciones homogneas. Un ejemplo de observaciones pareadas consiste en
considerar a un conjunto de n personas a las que se le aplica un tratamiento
mdico y se mide por ejemplo el nivel de insulina en la sangre antes (X) y
despus del mismo (Y).

No es posible considerar a X e Y como variables independientes ya


que va a existir una dependencia clara entre las dos variables. Cuando se
quiere contrastar el que los pacientes han experimentado o no una mejora con
el tratamiento, simblicamente di es la diferencia entre las observaciones
antes y despus del tratamiento.

87

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Suponga que la v.a. que define la diferencia entre el antes y despus del
tratamiento es una v.a. que se distribuye normalmente, pero cuyas media y
varianza son desconocidas.

Luego se contrasta la hiptesis de que el tratamiento ha producido


cierto efecto , es decir

, utilizando la media observada de las diferencias


pareadas resultantes.

88

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Debe rechazarse H si el valor calculado del estadstico


o
. Las alternativas unilaterales se tratan igual que en el caso usual de la prueba
de t.

Se desea determinar si existe diferencia en los anlisis de los laboratorios.


En este caso, =0, donde las hiptesis nula y alternativa pueden expresarse
como sigue:

Para estos datos, el promedio de las diferencias es,

La variancia de la diferencia es:

89

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

de modo que,

Y
El valor terico de la distribucin t, con 8 grados de libertad y un nivel de
significancia del 5% es 2,306. Dado que -2,33 < -2,306, se rechaza H.
Entonces, se concluye que existe una diferencia en las mediciones entre los
laboratorios, a un nivel de confianza del 95%.
Prueba de hiptesis sobre la varianza

Supngase que se desea probar la hiptesis de que la varianza


de una poblacin normal es igual a un valor especfico por ejemplo
.
Para probar

se utiliza el estadstico de prueba

90

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Donde
Se rechaza H si

es la varianza muestral
o

De manera similar se tratan las alternativas unilaterales

Para probar

Se rechaza H si

Para probar

Se rechaza H si
Ejemplo

Considrese el ejemplo anterior de la mquina de llenado de


botellas que se tom una muestra de 20 botellas y con una varianza muestral
de
. Si la varianza del volumen de llenado es mayor a 0.01,
entonces existe una proporcin inaceptable de botellas que sern llenadas con
una cantidad menor de lquido. Existe evidencia en los datos muestrales que
suefiera que el fabricante tiene un problema con el llenado de las botellas?
Utilcese
Solucin

91

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Prueba de hiptesis para una proporcin

Considrese la prueba

Se calcula el estadstico de prueba

Y se rechaza H si

Las regiones crticas para las hiptesis alternativas unilaterales se construyen


de la manera usual.

Ejemplo.
Una compaa farmacutica afirma que un antibitico tiene 80% de
efectividad. Se somete a prueba una muestra aleatoria de 50 casos de estudio
y se obtiene una proporcin de 75,7%. Presentan los datos suficiente
evidencia para refutar la afirmacin de la compaa?. Para este problema, si se
selecciona un nivel de significacin de 0,05.
Las hiptesis nula y alternativa para este problema se pueden expresar
como sigue:

Con los datos se tiene que

92

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Al 95% de confianza el valor terico Z es -1,645; por tanto, la hiptesis nula no


se rechazara porque el estadstico de prueba(-0,76) no ha cado en la regin
de rechazo, o simplemente comparando los valores absolutos, se observa que
1,645 es mayor 0,76. Se llegara a la conclusin de que no hay suficiente
evidencia para refutar la afirmacin de la compaa.

Prueba de hiptesis sobre dos proporciones

Sean
el nmero de observaciones de la primera muestra
que pertenece a la clase de inters y
el nmero de
observaciones en la segunda muestra de la poblacin. De modo que los
estimadores de las proporciones poblacionales
y
tienen distribuciones aproximadamente normales. Ahora bien, si la hiptesis
nula H:p=p es verdadera, entonces al utilizar el hecho de que p=p=p, la
v.a.

tiene una distribucin N(0,1) aproximadamente. Un estimador del


parmetro comn p es

El estadstico de prueba es:

93

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Entonces se rechaza H si

Ejemplo. Una planta de energa elctrica operada con carbn ha


considerado dos sistemas diferentes para reducir la contaminacin del aire. El
primer sistema redujo la emisin de contaminantes a niveles de 68% del
tiempo, segn se determin de 200 muestras de aire. El segundo sistema, a
niveles de 76% de las veces, segn qued determinado en 250 muestras de
aire. Pruebe la hiptesis de que no hay diferencia entre los sistemas, aun nivel
de confianza de 97,5%?.
Las hiptesis nula y alternativa para este problema son:

Para los datos en uso:

El valor terico de la prueba con dos colas segn la distribucin normal


estndar para una confianza del 97,5% es 2,24. Resulta que -1,876 >-2,24,
por tanto, se toma la decisin de no rechazar H0. La conclusin es que no hay
pruebas de diferencias entre los sistemas en la reduccin de la contaminacin
del aire, a un nivel de confianza del 95%.

Ejercicio
Se evalan dos tipos diferentes de soluciones para pulir, para su posible uso
en una operacin de pulido en la fabricacin de lentes intraoculares utilizados
en el ojo humano despus de una ciruga de cataratas. Se pulen 300 lentes con
la primera solucin y de estos, 253 no presentaron defectos inducidos por el
pulido. Despus se pulen otros 300 lentes con la segunda solucin, de los
cuales 196 resultan satisfactorios. existe alguna razn para creer que las dos
soluciones para pulir son diferentes? Utilcese =0.01

94

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Regresin lineal simple y correlacin


El anlisis de regresin es una tcnica estadstica para el modelado y la
investigacin de la relacin entre dos o ms variables. Por ejemplo, en un
proceso qumico, supngase que el rendimiento del producto est relacionado
con la temperatura de operacin del proceso. El anlisis de regresin puede
emplearse para construir un modelo que permita predecir el rendimiento para
una temperatura dada. Este modelo tambin puede utilizaras para la
optimizacin del proceso, tal como hallar la temperatura que maximiza el
rendimiento, o para fines de control.
Supngase que la verdadera relacin entre Y y x es una lnea recta y que la
observacin Y en cada nivel x es una v.a. es el valor esperado de Y para cada
valor de x.

donde la ordenada al origen


y la pendiente
son coeficientes
desconocidos de la regresin. Se supone que cada observacin Y puede
describirse por el modelo

Y=+ x+

Donde es un error aleatorio con media 0 y varianza


. Supngase que se tiene n pares de observaciones
La siguiente figura contiene una representacin grfica de la dispersin de los
datos observados y un candidato para la recta de regresin.

Las estimaciones de y deben dar como resultado una lnea que se ajuste
mejor a los datos. El cientfico alemn Karl Gauss propuso estimar los
95 Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

parmetros y de modo que se minimice la suma de los cuadrados de las


desviaciones verticales de la figura.
Este criterio para estimar los coeficientes de regresin se conoce como el
mtodo de mnimo cuadrados.

As que las n observaciones de la muestra como


i=1,2,n.

Y la suma de los cuadrados de las desviaciones de


las observaciones con respecto a la recta de regresin es:

Despus de simplificar las ecuaciones anteriores se obtiene

96

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Las estimaciones de mnimos cuadrados


de la ordenada al origen y la pendiente del modelo de regresin lineal simple
son:

.(*)

Donde

Por lo tanto la lnea de regresin estimada o ajustada es:

Ntese que cada par de observaciones satisface la relacin

i=1,2,n

Donde
error en el ajuste del

recibe el nombre de residuo. El residuo describe el

modelo en la i-sima observacin

Renombrando el numerador y denominar de la ecuacin *


tenemos

97

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Ejemplo
En el siguiente ejemplo y es la pureza del del oxgeno producido en proceso de
destilacin qumico, y x es el porcentaje de hidrocarburos presentes en el
condensador principal de la unidad de destilacin.

Nmero de
observacin

Nivel de hidrocarburo
x (%)

Pureza (%)

0.99

90.1

1.02

89.05

1.15

91.43

1.29

93.74

1.46

96.73

1.36

94.45

.87

87.59

1.23

91.77

1.55

99.42

10

1.40

93.65

11

1.19

93.54

98

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

12

1.15

92.52

13

0.98

90.56

14

1.01

89.54

15

1.11

89.85

16

1.20

90.39

17

1.26

93.25

18

1.32

93.41

19

1.43

94.98

20

0.95

87.33

Solucin
n=20,

99

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

: el cambio promedio de la pureza de hidrocarburo es de 14.97%


cuando el nivel de hidrocarburo se incrementa en una unidad (1%)
105
100
f(x) = 14.95x + 74.28

95
90

Linear ()

85
80
0.8

0.9

1.1

1.2

1.3

1.4

1.5

1.6

Ejercicio
Un investigador tiene inters de estudiar la elasticidad de cierto plstico(en
grados) como una funcin de la temperatura(F) a la que
se produce. Se preparan diez piezas de plstico utilizando distintas
temperaturas y los valores observados de la elasticidad fueron:

Hacer el diagrama de dispersin y encontrar la ecuacin de la recta

10
0

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

El error estndar de la estimacin puede


calcularse por

: es la interseccin de la recta
: es el coeficiente de regresin
n: es el tamao de la muestra

Def: En regresin lineal simple, el error estndar estimada dela


pendiente es:

Y el error estndar de la ordenada al origen es


Donde

10
1

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Prueba de hiptesis en la regresin lineal simple


Para probar hiptesis sobre la pendiente y la ordenada al origen del modelo de
regresin, debe hacerse la hiptesis adicional de que componente de error en
el modelo, tiene una distribucin normal. Supngase que se desea probar la
hiptesis de que la pendiente es igual a una constante, por ejemplo,

La hiptesis apropiada son:

La estadstica que se utiliza es:

Sigue una distribucin t con n-2 grados de libertad.


Puede rechazarse H si

De manera similar para probar la prueba de hiptesis para la


ordenada al origen.

10
2

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Se utiliza

Se rechaza H si

La hiptesis nula plantea que la pendiente de la recta es cero contra la


hiptesis alternativa que es diferente. Simblicamente se denota como,
H0:=0
(no hay relacin lineal)
H1:0
(si hay relacin lineal)
La hiptesis nula implica que no existe ninguna relacin lineal entre las
variables. La hiptesis alternativa es que existe una relacin lineal, positiva o
negativa. Podramos decir, que cuando no se rechaza, entonces indica que la
variable independiente no aporta informacin para predecir la variabilidad de Y.
Para realizar la prueba se utiliza una estadstica t con n-2 grados de libertad

Intervalo de confianza alrededor dela respuesta media

Un intervalo de confianza alrededor de la respuesta media


del 100(1-) por ciento para el valor de x=x,
est dado por
Donde
ajustado.

10
3

se calcula a partir del modelo de regresin

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Prediccin de nuevas observaciones

Una aplicacin importante de un modelo de regresin es la


prediccin de observaciones nuevas y futuras de Y. Si x es el valor del regresor
de inters, entonces

Es el estimador puntual del valor nuevo o futuro de la respuesta Y.

El intervalo de
confianza para una prediccin para una observacin futura de 100(1-) por
ciento y en el valor de x, est dada por

El valor de

se calcula a partir del modelo de regresin

Anlisis de correlacin lineal


En las anteriores secciones fueron estudiados los aspectos bsicos
de la identificacin de la naturaleza de una relacin lineal ajustada a un
conjunto de datos para dos variables. As pues, es necesario definir una medida
de la relacin entre ellas, y que no est afectada por los cambios de unidad de
medida.

10
4

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

El coeficiente de correlacin lineal posee las siguientes propiedades:


Es invariante para transformaciones lineales (cambio de origen y escala) de
las variables.
Slo toma valores comprendidos entre 1 y 1,
Carece de unidades de medida (adimensional).
Cuando |r| est prximo a uno, existe una relacin lineal muy
fuerte entre las variables.
Cuando r0, puede afirmarse que no existe relacin lineal entre
ambas variables.

Tablas

10
5

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

10
6

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

10
7

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

10
8

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

10
9

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

11
0

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

11
1

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

11
2

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

11
3

Apuntes de Estadstica
Profesora Homaira Athenea Ramrez Gutirrez

Você também pode gostar