Você está na página 1de 46

3.3.

2 Grficas Circulares
Este tipo de grfica se usa cuando se quiere tener una idea de la contribucin de cada
valor de la variable al total. Aunque es usada ms para variables cualitativas, tambin
podra usarse para variables cuantitativas discretas siempre que la variable no asuma
muchos valores distintos.
Para obtener grficas circulares se usa la opcin Pie Chart del men Graph. Las
ventanas de dilogo de Pie Chart que se muestran en la Figura 3.14 son para la variable
IDENTIFICACION DE VARIABLES, POBLACION, MUESTRA, TIPO DE VARIABLE:
En la tienda PQR dedicada a la venta de computadoras se desea hacer un estudio acerca del nmero de unidades vendidas
23 20 24 36 21 34 22 18 17 17
29 30 26 37 28 15 21 32 40 35
20 32 16 31 33 19 30 32 18 42
a) Identificar : poblacin, muestra, unidad estadstica, variable y tipo de variable.
Poblacin : Cinco aos = 60 meses.
Muestra : 30 meses.
Unidad Estadstica : un mes.
Variable : Nmero de computadoras vendidas.
Tipo de Variable : Cuantitativa - Discreta.
durante los ltimos cinco aos, con tal motivo se tom la informacin correspondiente a cierto nmero de meses de dicho periodo.
MANUAL DE ESTADISTICA INFERENCIAL
programa del Ejemplo 3.1 La grfica permitir ver como se distribuyen los estudiantes de
la clase segn el programa acadmico.
En Chart Raw Data se coloca la variable de la que se quiere hacer el pie chart.
La ventanita de Chart values from table se usa slo en el caso que en una columna estn
las categoras de la variable y en la otra la frecuencia con que se repite cada categora. En
la Figura 3.15 se presenta la grfica de crculo para la variable programa.
Existen formas de modificar la grfica de crculo para enfatizar ciertas ideas. Por ejemplo,
se puede resaltar uno o varios pedazos (slices) mediante el uso de Explode slice. Esta opcin se
logra seleccionando el pedazo(s) que se quiere(n) explotar. Luego, se oprime el botn izquierdo
del ratn y se selecciona Edit Pie. La ventana de dilogo que se obtiene se muestra en la Figura
3.16. En esta ventana, se puede tambin modificar el color del pedazo. Si se selecciona la grfica
completa antes de ir a Edit Pie, hay la posibilidad de combinar pedazos que contribuyan con un
porcentaje muy bajo al total o de colocar el nombre asociada a cada categora en la grfica.
En la Figura 3.16 b, se muestra la grfica de la variable programa modificada segn se ha descrito
anteriormente.

Figura 3.18. Ventanas de dilogo para obtener grficas circulares
Figura 3.19. Grfica circular para mostrar la distribucin de estudiantes por programa
(a) (b)
Figura 3.20. Ventana de dilogo para modificar la grfica de la figura 3.19.
Ejemplo 3.3. La siguiente tabla muestra el nmero de restaurants americanos de comidas
rpidas en Puerto Rico a julio de 1997 (Nuevo Da, 31 de Agosto de 1997).
Nombre Nmero
Burger King 113
McDonalds 97
Taco Maker 63
Kentucky Fried Chicken 58
Pizza Hut 51
Churchs 46
Dominos 30
Wendys 24
Taco Bell 22
Ponderosa 21
Little Ceasers 20
Otros 45
Hacer un Pie-Chart que muestre qu parte del mercado representa cada franquicia.
Enfatizar la franquicia que tiene la mayor parte del mercado y la que tiene la menor parte.
En este caso se elige Chart values from table, y en el espacio de Categorical variable se
coloca el nombre de las columnas que contiene el nombre de los restaurantes y en el
rectngulo al lado de Summary Variables se coloca la columna que contiene el nmero
de restaurantes de cada tipo. Eligiendo Labels, puede indicar el ttulo que tendr la
grfica y las etiquetas de los pedazos. Al oprimir ok, se obtiene la siguiente grfica:
Figura 3.21. Grfica circular para los datos del ejemplo 3.3
3.4 Grfica de tallo y hojas (Stem-and-Leaf )
La grfica de tallo y hojas es una grfica usada para datos cuantitativos. Es la
grfica ms bsica de un conjunto de tcnicas conocido con el nombre de Anlisis
Exploratorio de Datos (EDA) introducida por John Tukey a mediados de los aos 70.
La idea es considerar los primeros dgitos del dato como una rama del tallo (stem) y el
ltimo dgito como una hoja (leaf) de dicha rama. Las ramas son ordenadas en forma
creciente.
Ejemplo 3.4. Los siguientes datos representan pesos de una muestra de 15 varones
adultos.
165 178 185 169 152 180 175 189 195 200 183 191 197 208 179
Hacer su grfica de Stem-and Leaf.
Solucin:
En este caso las ramas la forman los primeros dos dgitos de los datos, y las hojas sern
dadas por los ltimos dgitos de los datos. Luego el stem-and leaf ser de la siguiente
manera:
15 2
16 59
17 598
18 0935
19 517
20 08

Interpretacin: El uso del stem-and-leaf es exactamente igual al del Histograma, la
nica diferencia est en que del stem-and-leaf se pueden recuperar los datos
muestrales, pero de un histograma no se puede hacer. En este ejemplo el stem-and-
leaf es asimtrico a la izquierda, no tiene mucha variabilidad ni outliers.
La unidad de la hoja de un stem-and-leaf representa la posicin del dgito de la hoja en
la escala decimal. En el ejemplo anterior el dgito de las hojas est en las unidades luego la
unidad de la hoja ser 1.0. Si los datos fueran de promedios acadmicos: 3.17, 3.23, 2.98
entonces, la unidad de la hoja ser .01.
Para recuperar los datos de la muestra se juntan las ramas y las hojas del stem-and-
leaf y se multiplica por la unidad de la hoja.
Hay varias maneras de obtener un stem-and-leaf en MINITAB. La primera es elegir
la opcin stem-and-leaf del men Graph, la segunda es elegir la opcin Character
Graph del men Graph y luego stem-and-leaf del listado que aparece. Finalmente,
tambin se puede elegir la opcin EDA del men Stat y luego Stem-and-Leaf del
submen de EDA.

La ventana de dilogo para obtener el stem-and-leaf de los datos de promedio
acadmico gpa del ejemplo 3.1 es como sigue:
Figura 3.22. Ventana de dilogo para obtener el stem-and-leaf de la variable gpa
La opcin By variable se usa cuando se quiere comparar stem-and-leaf de dos o ms
grupos y aqui se escribe la variable que clasifica en grupos.
Si se elige la opcin Trim outliers en la ventana de dilogo del stem-and-leaf se puede
detectar los "outliers". La opcin Increment permite ajustar el nmero de ramas del
stem. En la ventana session aparecer el stem-and-leaf de la variable gpa que se
muestra a continuacin.
La unidad de la hoja 0.1 indica la posicin de una hoja en la escala decimal. O sea
3 | 6 significa 3.6.
En el ejemplo anterior se han hecho uso de 5 subramas para cada rama principal. Se
pueden usar 2 5 subramas por cada rama principal. Si se usa dos subramas, entonces la
primera subrama contiene las hojas del 0 al 4 y la segunda las hojas del 5 al 9. En el caso
de 5 subramas, entonces la primera contiene las hojas 0 y 1, la segunda las hojas 2 y 3 y
as sucesivamente hasta la quinta que contiene las hojas 8 y 9.
Stem-and-Leaf Display: gpa
Stem-and-leaf of gpa N = 28
Leaf Unit = 0.10
1 2 1
4 2 233
5 2 5
7 2 77
9 2 88
(7) 3 0001111
12 3 233
9 3 455
6 3 66666
1 3 8
Figura 3.23: Ventana de sesin para una grfica de caracteres de tallo y hoja para la variable GPA
Frecuentemente, los programas estadsticos como MINITAB, redondean los datos
antes de hacer el stem-and-leaf. Por ejemplo si la muestra contiene los datos,
93 135 178 245 267 342 307, stos pueden ser redondeados a 90 130 170 240 340 300 y
luego el stem-and-leaf tendra las ramas 0,1,2 y 3 con unidad de hoja igual a 10.
Ejemplo 3.5 El impuesto por cajetilla de cigarrillos en Puerto Rico es de 83 centavos.
Los siquientes datos muestran los impuestos en los 50 estados de los Estados Unidos
(Nuevo Dia, 4 de Sept. de 1997)
Estado tax Estado tax
Virg 0.025 DakS 0.330
Kent 0.030 Flor 0.339
CarN 0.050 Nebr 0.340
CarS 0.070 Neva 0.350
Georg 0.120 Iowa 0.360
Wyom 0.120 Mary 0.360
Tenn 0.130 Cali 0.370
Indi 0.155 Maine 0.370
Alab 0.165 Oreg 0.380
Misso 0.170 NewJ 0.400
WestV 0.170 Texas 0.410
Missi 0.180 Wisco 0.440
Mont 0.180 Illin 0.440
Colo 0.200 DakN 0.440
Lousi 0.200 Verm 0.440
NMexi 0.210 Minn 0.480
Oklah 0.230 Conn 0.500
Delaw 0.240 NewY 0.560
Kans 0.240 Ariz 0.580
Ohio 0.240 Hawa 0.600
NHans 0.250 RhodI 0.610
Utah 0.265 WasDC 0.650
Idaho 0.280 Michi 0.750
Alask 0.290 Massa 0.760
Penn 0.310 Washi 0.825
Arka 0.315
Hacer un stem-and-leaf de los datos.
Solucin: Usaremos la opcin Trim de Stem-and-Leaf para detectar outliers.
Stem-and-Leaf Display: tax
Stem-and-leaf of tax N = 51
Leaf Unit = 0.010
2 0 23
4 0 57
7 1 223
13 1 567788
20 2 0013444
24 2 5689
(5) 3 11334
22 3 566778
16 4 014444
10 4 8
9 5 0
8 5 68
6 6 01
4 6 5
3 7
3 7 56
HI 82
Interpretacin: El stem-and-leaf indica mucha variabilidad y asimetra hacia la
derecha. Adems, el estado de Washington representa un outlier superior. La unidad
de la hoja es .01, o sea 3 7 representa 0.37. Se han usado dos subramas por cada
rama principal
UNIF Administracin de Negocios Internacionales
Estadstica

GRFICOS ESTADSTICOS

Un grfico o diagrama es un dibujo complementario a una tabla o cuadro, que permite
observar las tendencias de un fenmeno en estudio y facilita el anlisis estadstico de las
variables all relacionadas.
Un grfico, al igual que un cuadro o una tabla, debe constar de:
Ttulo adecuado: El cual debe ser claro y conciso, que responda a las preguntas: qu
relaciona, cundo y dnde se hicieron las observaciones?
El cuerpo: o grfico en s, cuya eleccin debe considerar el o los tipos variables a relacionar
y el diseo artstico del grfico.
Notas de pie de grfico: Donde se otorgan los crditos a las fuentes respectivas.

TIPOS DE GRFICOS:
1.- Diagrama Circular: (Pie, Torta, Pastel)
Se usa para representar variables cualitativas en porcentajes o cifras absolutas.
EJEMPLO 1: cuando se tienen todos los datos por extensin.

Se realiz una encuesta en hogares del distrito de Pueblo Libre, seleccionados al
azar, acerca de la credibilidad de los noticieros, los resultados obtenidos fueron:
1: Peridico 2: Televisin 3: Radio

1 2 3 2 3 3 1 3 2 3
2 3 2 3 2 1 3 2 3 2
3 2 3 1 3 2 2 3 1 3
2 3 1 3 2 3 2 3 3 1

Digitar los datos en la columna C1.

Ingresar como:

Convertir en:




Graph Pie Chart




UNIF Administracin de Negocios Internacionales
Estadstica




Clic en Labels


Clic en Slice Labels



Clic en OK

Clic en Pie Options



Si se elige la opcin Default las porciones del Pie aparecern en orden alfabtico.
Si por el contrario, se elige la opcin Increasing volume las porciones aparecern de menor
a mayor, y con la opcin Decreasing volumen las porciones se mostrarn de mayor a
menor.

ngulo de inicio: 90. El primer corte se realiza en 90 y luego las porciones se muestran en
sentido horario.

UNIF Administracin de Negocios Internacionales
Estadstica

Al hacer clic en OK y luego en OK, aparecer el grfico:

Peridico
Radio
Televisn
Category
Televisn
14; 35,0%
Radio
19; 47,5%
Peridico
7; 17,5%
Grfico N 1
Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros
Fuente: datos ficticios


En este grfico se puede cambiar el color de fondo as como tambin el color de las
porciones del Pie Chart.

Para cambiar el color del fondo:

1. Doble clic en el fondo gris.

2. Elegir la opcin Custom.

Clic en la flecha de Background y elegir el
color deseado.


3. El color del fondo ha cambiado.
Peridico
Radio
Televisn
Category
Televisn
14; 35,0%
Radio
19; 47,5%
Peridico
7; 17,5%
Grfico N 1
Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros
Fuente: datos ficticios


4. Clic en la porcin roja y luego clic en la
misma porcin. Luego doble clic en
dicha porcin y elegir el tipo de relleno y
el color de fondo.




UNIF Administracin de Negocios Internacionales
Estadstica

5. Clic en Explode



Esta opcin permite extraer dicha porcin.
6. Al hacer clic en OK.

Peridico
Radio
Televisn
Category
Televisn
14; 35,0%
Radio
19; 47,5%
Peridico
7; 17,5%
Grfico N 1
Hogares de Pueblo Libre clasificados segn credibilidad de los noticieros
Fuente: datos ficticios


7. Repetir el paso 4. para las porciones
verde y azul.




8. Finalmente el grfico es:



Haciendo doble clic en el texto, se puede cambiar el color, el tamao y la fuente.



Observa que en la esquina superior izquierda del grfico aparece una cruz verde.

Ahora, en la columna C1 agrega el dato peridico y luego observa que la cruz verde ha
cambiado a un botn amarillo; esto indica que ha habido un cambio en los datos.



UNIF Administracin de Negocios Internacionales
Estadstica

Antes de ingresar el dato adicional:


Despus de ingresar el dato adicional:



Para actualizar el grfico, se procede as: click sobre el fondo blanco.

Editor Update Update Graph Now

Entonces, aparece nuevamente la cruz verde; esto significa que el grfico ha sido
actualizado con el nuevo dato.


EJEMPLO 2: cuando se tienen los datos en una Tabla.

Grado de
Instruccin
Porcentaje
Primaria 7.69
Secundaria 30.77
Superior 61.54

Digitar los datos de la tabla en la hoja de trabajo.



Graph Pie Chart



A continuacin se realizan todos los pasos del Ejemplo 1.






Ejemplos del Suplemento 1 con Minitab
Prueba t
La prueba t se puede realizar utilizando Minitab con la secuencia Stat>Basic
Statistics>1-sample t


HERRAMIENTAS PARA ANLISIS - ESTADSTICA INFERENCIAL
Ocho pasos para el desarrollo de una investigacin
O11

Ejemplos del Suplemento 1 con Minitab
Con el ejemplo presentado, llene la informacin en la seccin de Summarized Data

Seleccione la hiptesis que quiere verificar.
En el botn que dice Options aparece la informacin del intervalo de confianza a
seleccionar (el default es 95%) y el tipo de hiptesis que quiere realizar (el default es
not equal)

Ocho pasos para el desarrollo de una investigacin
O12

Ejemplos del Suplemento 1 con Minitab

En el Session Window va a tener un resultado como el siguiente:
One-Sample T

Test of mu = 28000 vs not = 28000


N Mean StDev SE Mean 95% CI T P
15 30000 6000 1549 (26677, 33323) 1.29 0.218


Donde la t estadstica es 1.29 y el P-value o la probabilidad es de 0.218


Ocho pasos para el desarrollo de una investigacin
O13

Ejemplos del Suplemento 1 con Minitab
Prueba Z
La prueba t se puede realizar utilizando Minitab con la secuencia Stat>Basic
Statistics>1-sample Z


Pruebas de hiptesis de una poblacin
Referirse a los materiales sobre Pruebas de hiptesis para la teora de estas pruebas
MinitabPruebaHiptesis.doc InterConfPruHipo1P.xls Pruebas Hipotesis 2 pob1.xls
Las pruebas de hiptesis permiten probar una afirmacin o rechazarla en relacin
a parmetros de la poblacin que pueden ser la media, varianza y proporcin con
nivel de confianza que normalmente es del 95% (con 5% de probabilidad de error).
Para las pruebas se toman muestras de las poblaciones y en base a la informacin
que proporcionen se infiere sobre el comportamiento del parmetro en la poblacin.
Caso 1. Prueba de una media poblacional cuando se conoce la varianza de la poblacin (en base a datos histricos)
La empresa ROSATEL piensa que el promedio de sus ventas son de s/.28 000 al mes. Selecciona n=35 meses y encuentra
una media X=30,000, Desviacin estndar s=6800. A un error del 5% Utilizando la prueba Z qu se puede concluir?

Prueba Z


Ejemplos del Suplemento 1 con Minitab
Con el ejemplo presentado, llene la informacin en la seccin de Summarized Data

Seleccione la hiptesis que quiere verificar.
En el botn que dice Options aparece la informacin del intervalo de confianza a
seleccionar (el default es 95%) y el tipo de hiptesis que quiere realizar (el default es
not equal)

Ocho pasos para el desarrollo de una investigacin
O15

Ejemplos del Suplemento 1 con Minitab
En el Session Window va a tener un resultado como este:
One-Sample Z

Test of mu = 28000 vs not = 28000
The assumed standard deviation = 6800


N Mean SE Mean 95% CI Z P
35 30000 1149 (27747, 32253) 1.74 0.082

Donde la Z estadstica es 1.74 y el valor P es de 0.082

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 1
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
CONTRASTES DE HIPTESIS DE 1 POBLACIN


ESQUEMA DE CONTENIDOS ________________________

























Definicin
Ejemplo de
clculo
Distribucin
Normal

Caso prctico con
Minitab

P - VALOR
Ejemplo de
clculo
Distribucin
t-student
Explicacin
grfica

CH- 1
POBLACIN
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 3
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
CONCEPTOS FUNDAMENTALES___________________________________


Concepto de contraste de hiptesis

Podemos definir un contraste de hiptesis como un procedimiento que se basa en lo
observado en las muestras y en la teora de la probabilidad para determinar si la hiptesis es
un enunciado razonable.


Contraste de hiptesis de una poblacin

Un contraste de hiptesis es un proceso estadstico que permite elegir una hiptesis de
trabajo de entre dos posibles y antagnicas. El contraste comienza con la formulacin de dos
hiptesis sobre el valor de algn parmetro poblacional, siendo ambas incompatibles (si una
es cierta, la otra necesariamente ha de ser falsa). Supondremos cierta una de ellas, a la cual
llamaremos hiptesis nula H
0
, y trataremos de determinar hasta qu grado las
observaciones registradas son coherentes con H
0
. Slo en caso de que haya fuertes indicios
de incompatibilidad entre el supuesto de que H
0
sea cierta y los datos obtenidos
empricamente, descartaremos H
0
como hiptesis de trabajo y en su lugar tomaremos como
cierta la hiptesis alternativa H
1
. Dos ejemplos de contrastes de hiptesis seran:



5 , 2 :
) ( 5 , 2 :
) (
0 :
0 :
) (
1
0
1
0

>
=

H
H
ii
H
H
i

Contraste Bilateral () Contraste Unilateral (>)


En el siguiente esquema se representan las cuatro combinaciones posibles (en funcin de la
decisin que tomemos y de la certeza o no de la hiptesis nula) de todo contraste de
hiptesis:


Hiptesis Nula H
0
Decisin tomada
Verdadera Falsa

No descartar H
0

Decisin correcta de tipo A
Probabilidad 1-


Error de tipo II
Probabilidad

Descartar H
0

Error de tipo I
Probabilidad


Decisin correcta de tipo B
Probabilidad 1-

Tendremos una decisin correcta de tipo A cuando hayamos optado por no descartar la
hiptesis nula y resulte que sta es cierta. Por su parte, una decisin correcta de tipo B
ocurrir cuando hayamos decidido descartar la hiptesis nula y resulte que sta era falsa.
Hablaremos de error de tipo I cuando hayamos descartado la hiptesis nula siendo sta
cierta (error que se considera como muy grave). Finalmente, acontecer un error de tipo II
cuando hayamos optado por no descartar la hiptesis nula y resulte que sta es falsa.

Dado que descartaremos o no la hiptesis nula a partir de muestras obtenidas (es decir, no
dispondremos de informacin completa sobre la poblacin), no ser posible garantizar que la
decisin tomada sea la correcta.

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 4
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Lo que s podremos hacer es controlar la probabilidad de cometer un error. Ahora bien, cul
de ellos? En un contraste de hiptesis lo interesante es rechazar la hiptesis nula. Por lo tanto
el riesgo que estoy dispuesto a asumir de equivocarme al rechazar la H
0
, error de tipo I, es
el que queremos controlar. Fijmonos que a error de tipo I ms pequeo ms seguridad al
rechazar la hiptesis nula. Ahora bien, al empequeecer el error de tipo I estamos
javascript:sendmail()aumentando el error de tipo II, puesto que cuanta ms probabilidad de
aceptar H
0
ms posibilidades de que aceptemos casos donde se cumpla H
1
(error de tipo II).
Usualmente el error de tipo I se fija en 0,01, 0,05 0,10.

Fijado el error de tipo I para empequeecer el error de tipo II debemos aumentar el tamao de
muestra. Ahora bien, aumentar el nmero de muestra no siempre es posible ya sea por falta
de presupuesto o tiempo, por inviabilidad,

Llamaremos potencia del contraste a la probabilidad de rechazar la hiptesis nula siendo
sta falsa. Fijmonos que, a mayor potencia, mejor contraste, puesto que podremos aceptar
la hiptesis alternativa con poca probabilidad de que sea falsa.

Denotaremos por el nivel de significacin o probabilidad de cometer un error de tipo I, y
por la probabilidad de cometer un error de tipo II. Con lo cual, la potencia es de 1 - . Como
ya hemos indicado usualmente se fija en 0,01, 0,05 o 0,10.

Notamos otra vez que , , y el tamao muestral n estn interrelacionados, de forma que si
hacemos disminuir cualquiera de ellos alguno de los dos restantes habr de aumentar. As,
p.e., si queremos tomar un menor deberemos aceptar que aumente o bien incrementar el
tamao de la muestra n .

Finalmente, llamaremos estadstico de contraste a una v.a. calculada a partir de las
observaciones muestrales, la cual se usa conjuntamente con un criterio de decisin
(establecido a priori) para determinar si hemos de descartar o no la hiptesis nula.


Concepto de p-valor.

Definimos el p-valor como la probabilidad de que, suponiendo cierta H
0
, el estadstico de
contraste tome un valor al menos tan extremo como el que se obtiene a partir de las
observaciones muestrales, i.e., el p-valor es el rea de la cola de la distribucin (o colas si el
test es bilateral) definida a partir del estadstico de contraste:

1. El p-valor slo puede calcularse una vez tomada la muestra, obtenindose niveles crticos
distintos para cada muestra.
2. El p-valor puede interpretarse como un nivel mnimo de significacin en el sentido de que
niveles de significacin , iguales o superiores al p - valor llevarn a rechazar la hiptesis
nula.
Por tanto, cuanto menor sea el p - valor mayor es el grado de incompatibilidad de la muestra
con H
0
, lo que lleva a rechazar H
0
.
3. El clculo del p-valor no proporciona de modo sistemtico una decisin entre H
0
y H
1
.

Esta forma de abordar los tests, nos permite una visin ms amplia, por cuanto nos da
informacin de para qu niveles de significacin puede rechazarse la hiptesis nula, y para
cuales no se puede.

Para lo que sigue, tendremos en cuenta la siguiente propiedad:

Supuesto: X se distribuye segn una normal.
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 6
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)


Ejemplo utilizando la tabla de la normal.

Un banco quiere analizar si las comisiones que cobra a sus clientes por operaciones en el
mercado burstil difieren significativamente de las que cobra la competencia, cuya media es de
12 euros mensuales con una desviacin estndar de 4,3 euros.
Este banco toma una muestra de 64 operaciones burstiles y observa que la comisin promedio
es de 13,6 euros.
Contrastar, al nivel de significacin del 5%, que este banco no difiere significativamente en el
cobro de las comisiones por operaciones en la Bolsa con respecto a la competencia.

Sea X = Comisiones que se cobran por operaciones en el mercado burstil
Tenemos: ) 3 , 4 , ( X

Queremos contrastar:


12 :
12 :
: 1
0

H
H



Es decir, queremos contrastar si es 12 euros como la competencia o si por el contrario es
distinto de esta cantidad.
Calculamos el estadstico de contraste,
98 , 2
5375 , 0
6 , 1
64
3 , 4
12 6 , 13
0 0 *
= =

=
n
X X
Z
H
X
H



Como es un contraste de dos extremos, ahora tenemos que calcular el p-valor correspondiente a
z*=2,98, es decir el rea que hay por debajo de z=-2,98 ms el rea que hay por encima de z=
2,98, i.e., el rea en las dos colas.
Si observamos la tabla de la distribucin normal estndar, podemos comprobar que el rea que
hay a la izquierda de z=-2,98 es 0,0014 y el rea que hay a la derecha de 2,98 es tambin 1-
0,9986=0,0014 por lo que el p-valor= 2*0,0014=0,0028
Como el p-valor es menor que el nivel de significacin, rechazaremos la hiptesis nula a un nivel
de significacin del 5%.
Por lo tanto existe evidencia estadstica de que la comisin promedio que cobra este banco
difiere significativamente de la competencia.

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 7
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Uso del p-valor en los contrastes sobre con desconocida

Dada una poblacin X (que sigue una distribucin cualquiera), con media y desviacin
estndar desconocidas, se trata de contrastar alguno de los tres tests siguientes:


:
:
0 1
0 0

=


H
H
o bien
:
:
0 1
0 0

<
=


H
H
o bien
:
:
0 1
0 0

>
=


H
H


Estadstico de contraste: ) 1 ( *

= n Student t
n
s
x
t



Criterio de decisin: Descartaremos H
0
si p-valor (normalmente = 0,05).


Ejemplo utilizando la tabla de la t-student

La directora del departamento de personal de una importante corporacin est reclutando un
gran nmero de empleados para un puesto en el extranjero. Durante el proceso de seleccin,
la administracin le pregunta cmo van las cosas, y ella responde que cree que la puntuacin
promedio en la prueba de aptitudes ser de aproximadamente 90 puntos. Cuando la
administracin revisa 19 de los resultados de la prueba compilados, encuentra que la
puntuacin media es 83,24 y la desviacin estndar de esta puntuacin es 11. Si la
administracin desea probar la hiptesis 90 :
0
= H vs 90 :
a
H al nivel de significacin
del 10%, Cul es el valor del estadstico de contraste y su p-valor?

90 :
0
= H
90 :
a
H


Suponemos que la poblacin de resultados de todos los candidatos sigue una distribucin
normal . ) ; ( N X y entonces la distribucin muestral de cada media muestral de cada
muestra de cada poblacin seguir tambin una normal :

|
|
.
|

\
|

n
S
N X ;

Como no se conocen las desviaciones estndar de las dos poblaciones, tendremos que
utilizar la distribucin de la t-student como distribucin del estadstico de contraste .

) 1 (
0 0

= n student t
n
X X
t
H
X
H




Si calculamos el estadstico t de contraste nos queda:

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 8
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
6747 , 2
19
11
90 25 , 83

0 0
=

=
n
X X
t
H
X
H



Como los grados de libertad son 18, entonces como tenemos un contraste de dos colas, es
decir en la hiptesis alternativa aparece el distinto, es decir 90 :
0
= H 90 :
1
H ;
entonces el p-valor de t = -2,6747 ser la probabilidad de estar por encima de 2,6747 ms la
probabilidad de estar por debajo de t =-2,6747. Cuando no aparece en la tabla de la t-student
el valor exacto del estadstico del cual se quiere calcular su p-valor, se toma como referencia
el valor ms cercano, en este caso t=-2,5524. Por tanto el p-valor = P(t>2,5524)+P(t<-
2,5524)=0,01+0,01=2*0,01=0,02, porque a la derecha de 2,5524 hay la misma probabilidad
que a la izquierda de -2,5524 As que el p-valor de t=-2,6747 ser menor a 0,02 porque a
mayor valor del estadstico menor rea por encima como se puede ver en la tabla.
Cuando los grados de libertad no aparezcan en la tabla de la t-student, se toma los grados de
libertad ms cercanos al cual se quiere tener en cuenta.

Si el contraste hubiese sido de una cola, bien por la derecha o bien por la izquierda,
90 :
1
> H 90 :
1
< H , entonces el pvalor del estadstico (supongamos que el
estadstico es t = 2,6747) si el contraste es de cola derecha, es decir (mayor que), sera la
probabilidad de estar por encima de t = 2,5524 que sera 0,01, por lo que el p-valor de t=
2,6747 sera menor que 0,01.

Si es por la cola izquierda (es decir menor que), el p-valor del estadstico (supongamos que el
estadstico vale t= -2,6747) sera la probabilidad de estar por debajo de t = -2,5524 que sera
0,01, por lo que el p-valor de t= - 2,6747 sera menor que 0,01.

Uso del p-valor en los contrastes sobre la prob. de xito p en una binomial

Supongamos que una poblacin X se distribuye segn una binomial con probabilidad de xito
p desconocida. A fin de estimar dicho parmetro, tomamos una muestra de tamao n y
definimos la probabilidad muestral de xito como: p = n xitos observados / n . Se tratar
de contrastar alguno de los tres tests siguientes:


:
:
0 1
0 0

=
p p H
p p H
o bien
:
:
0 1
0 0

<
=
p p H
p p H
o bien
:
:
0 1
0 0

>
=
p p H
p p H



Supuesto 1: La distribucin de X es aproximadamente normal.
Recordemos que si n 20 , n*p 5 , y n*(1-p) 5 , entonces ( ) ) 1 ( , p np np N X .

Supuesto 2: Las n observaciones que constituyen la muestra han sido seleccionadas de
forma aleatoria e independiente de una poblacin que no ha cambiado durante el muestreo.
Estadstico de contraste: ) 1 , 0 (
) 1 (
* N
n
p p
p p
z


=

Criterio de decisin: Descartaremos H
0
si p-valor (normalmente = 0,05).
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 9
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Ejemplo utilizando la tabla de la normal

Un portal e-business sabe que el 60% de todos sus visitantes a la web estn interesados en
adquirir sus productos pero son reacios al comercio electrnico y no realizan finalmente la
compra va Internet. Sin embargo, en la direccin del portal se piensa que en el ltimo ao, el
porcentaje de gente que est dispuesta a comprar por Internet ha aumentado y eso se debe
reflejar en sus resultados empresariales. Contrastar al nivel de significacin del 2% si en el
ltimo ao se ha reducido el porcentaje de gente que no est dispuesta a comprar por
Internet, si para ello se tom una muestra de 500 visitantes para conocer su opinin y se
observ que el 55% no estaba dispuesto a realizar compras va on-line.

6 , 0 :
6 , 0 :
:
0
<
=
p H
p H
A


La distribucin del nmero de visitantes del portal que no estn dispuestos a comprar
va internet se va a aproximar a una normal debido a que n*p = 500*0,6 = 300 5.

Calculamos el estadstico de control estandarizado:

27 , 2
500
) 6 , 0 1 ( 6 , 0
6 , 0 55 , 0
) 1 (
* =


=
n
p p
p p
z

Como es un contraste de un extremo, por la izquierda, ahora tenemos que calcular el p-valor
correspondiente a z*=-2,27 es decir el rea que hay bajo la curva a la izquierda de -2,27 en la
tabla de la normal. Entonces si vamos a la tabla de la normal, podemos ver que el rea que
hay por debajo de z = -2,27 es 0,0116.
Como el p-valor = 0,0116 es menor que el nivel de significacin que es 0,02(2%), entonces
rechazaremos la hiptesis nula a un nivel de significacin del 2%..

En conclusin existe evidencia estadstica que la proporcin de visitantes al portal que estn
dispuestos a comprar a travs de Internet ha aumentado o dicho de otra manera que el
porcentaje de visitantes que son reacios a comprar va on-line ha disminuido.

Casos hipotticos:
1. Si el contraste hubiese sido unilateral por la derecha, es decir 6 , 0 > p y z= 2,27,
tendramos que tener en cuenta el reas que hay por encima de z=-2,27,, es decir 1-rea
por debajo de z=2,27, es decir 0116 , 0 9884 , 0 1 ) 27 , 2 ( 1 = = < Z P
Como el p-valor=0,0116 es menor que el nivel de significacin que es 0,02(2%), entonces
rechazaremos la hiptesis nula a un nivel de significacin del 2%.
En conclusin existe evidencia estadstica que la proporcin de visitantes al portal que estn
dispuestos a comprar a travs de Internet ha disminuido o dicho de otra manera que el
porcentaje de visitantes que son reacios a comprar va on-line ha aumentado.

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 10
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
2. Si el contraste hubiese sido bilateral, es decir en la alternativa hubiese aparecido 6 , 0 p y
z = 2,27 el p-valor sera igual a la suma del rea por encima de z=2,27 ms el rea por
debajo de z = -2,27, es decir 0,0116 dos veces, p-valor = 2*0,0116=0,0232.
Como el p-valor=0,0232 es mayor que el nivel de significacin que es 0,02(2%), entonces
no rechazaremos la hiptesis nula a un nivel de significacin del 2%.
En conclusin existe evidencia estadstica que el porcentaje de visitantes que son reacios a
comprar va on-line es del 60%.





0
0,0
0,1
0,2
0,3
0,4
Valores de la v.a. Z
F
u
n
c
i

n

d
e

d
e
n
s
i
d
a
d

(
f
.
d
.
p
.
)
P-valor cuando el contraste es bilateral
/z*/ = 2,27 -/z*/= - 2,27
p-valor: suma de ambas
reas = 0,0232
0,0116 0,0116
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 11
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
CASOS PRCTICOS CON SOFTWARE___________________________________


1. Una multinacional desea analizar el sueldo neto por ao de sus empleados en las empresas
situadas en Espaa. Para ello se tom una muestra de 40 directivos y se obtuvo el salario bruto
anual de cada uno. En los ltimos aos se haba estimado que el salario medio anual de los
trabajadores en Espaa era de 18.000 euros, con una desviacin estndar de 2.600 euros.

Salarios brutos medios anuales en miles de euros.
18,2630
13,2104
17,8783
15,2542
20,7617
15,1401
19,.8144
16,9471
20,3956
18,8842
20,6542
16,648
22,4938
23,5305
14,9760
22,3734
18,4742
18,9199
18,2433
19,1553
18,2460
20,2367
20,3570
18,2373
18,5457
14,7056
16,8871
16,1106
17,2399
16,5339
17,5765
14,6103
19,2611
16,6708
21,1429
18,8906
17,5592
20,8730
16,6488
12,8947

a) El jefe de personal considera que el sueldo medio anual debe ser menor que 18.000
euros y quiere contrastar, con un nivel de significacin del 0.05, la hiptesis oficial
de que el tiempo medio es de 18.000 euros frente a la hiptesis de que dicha media
es menor.
El contraste de hiptesis que estableceremos ser H
0
: =18 vs. H
1
: <18
Seleccionamos Stat > Basic Statistics > 1-Sample Z:

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 12
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Z-Test

Test of mu = 18.000 vs mu < 18.000

The assumed sigma = 2.60

Variable N Mean StDev SE Mean Z P
C1 40 18.129 2.474 0.411 0.31 0.62

Dado que el p-valor obtenido 0.62 > 0.05, no descartaremos la hiptesis nula, esto significa
que parece razonable considerar que el salario medio bruto anual sea de es de 18.000 euros.


b) Igualmente, realiza el mismo contraste que en el apartado a), pero suponiendo sta
vez que no conoces la desviacin estndar.
Anlogamente, seleccionamos Stat > Basic Statistics > 1-Sample t, obteniendo los siguientes
resultados:


T-Test of the Mean

Test of mu = 18.000 vs mu < 18.000

Variable N Mean StDev SE Mean T P
C1 40 18.129 2.474 0.391 0.33 0.63

Por tanto, observamos que el p-valor 0.63 > 0.05, lo cual nos indica que no rechazaremos la
hiptesis nula, es decir, asumiremos como posible la opcin de que el salario bruto medio
anual sea 18.000 euros, ya que no tenemos indicios suficientes para rechazar esta
posibilidad.
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 13
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

2. El Dpto. de Marketing de una empresa europea quiere analizar la eficacia de su fuerza de ventas.
Para ello tom una muestra de 150 comerciales repartidos por sus varias delegaciones en Europa
y se obtuvo en euros lo que cada comercial ha facturado en los ltimos seis meses. Se ha
comprobado que, hasta ahora, que el volumen facturado por la fuerza de ventas hasta ahora
segua una distribucin aproximadamente normal de media 165.000 y desviacin tpica de
45.000 .



a) Realizar un contraste de hiptesis bilateral sobre la media de la poblacin para un nivel
de significacin =0,05.

Tomamos como hiptesis nula H
0
: = 165000, siendo la hiptesis alternativa H
1
:
165000

Copiamos los datos en una hoja de Minitab y seleccionamos Stat > Basic Statistics > 1-
Sample Z :

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 14
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

Z-Test

Test of mu = 165000 vs mu not = 165000
The assumed sigma = 45000

Variable N Mean StDev SE Mean Z P
Precio 150 153775 41611 3674 -3.06 0.0023

Observar que el p-valor obtenido es de 0,0023 < 0,05. Esto indica que deberamos
rechazar la hiptesis nula.
Por tanto, concluiremos que hay indicios suficientes para pensar que la facturacin
obtenida por la fuerza de ventas ha variado.


b) Realizar un contraste similar al anterior suponiendo que esta vez no conocemos la
desviacin estndar .

En este caso, tenemos que utilizar la distribucin t-Student, en lugar de la normal debido a
que la desviacin estndar es desconocida.

Seleccionamos Stat > Basic Statistics > 1-Sample t:


Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 15
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

T-Test of the Mean

Test of mu = 165000 vs mu not = 165000

Variable N Mean StDev SE Mean T P
Precio 150 153775 41611 3398 -3.30 0.0012

Observar que el p-valor obtenido 0,0012 sigue siendo inferior a 0,05, lo que nos lleva
nuevamente a rechazar la hiptesis nula.
Por ello, podemos concluir que efectivamente la facturacin obtenida por la fuerza de
ventas ha variado.




3. Supongamos que trabajamos para un candidato a la alcalda de nuestra ciudad y nos
encontramos en plena campaa electoral. Nuestro candidato estima que tiene el apoyo del
55% de los votantes. Sin embargo, acaban de llegar a nuestra oficina los datos de una
encuesta reciente en la que slo 86 de 200 potenciales votantes (seleccionados de forma
aleatoria) optan por nuestra opcin. Nos interesa contrastar, a un nivel de significacin del
0,05, las hiptesis H
0
: p = 0,55 vs. H
1
: p < 0,55 .

Observar que se verifican los supuestos. En particular, el supuesto de normalidad se
verifica dado que n = 200 > 20, np = 200*0,55 > 5, y n(1-p) = 200*0,45 > 5.

Realicemos el contraste:

Seleccionamos: Stat > Basic Statistics > 1 Proportion :





















Entramos en el men Options y rellenamos los campos como se muestra en la imagen
siguiente:
Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 16
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
















Test and Confidence Interval for One Proportion

Test of p = 0,55 vs p < 0,55

Sample X N Sample p 95,0 % CI Z-Value P-Value
1 86 200 0,430000 (0,361387; 0,498613) -3,41 0,000

A raz del resultado obtenido ( p-valor = 0,000 < 0,05 ), concluimos que deberemos descartar la
hiptesis nula, i.e., los datos obtenidos en la ltima encuesta sobre intencin de voto sugieren
que el porcentaje de votantes que apoyan nuestra candidatura es inferior al 55%.

De hecho, a partir de las observaciones, podemos afirmar con un nivel de confianza del 95% que
el porcentaje de votos favorables se sita entre un 36% y un 50%.

Contrastes de hiptesis de 1 poblacin
Proyecto e-Math 18
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
TABLA DE LA t-STUDENT_____________________________________________

DF 0,400 0,250 0,150 0,100 0,050 0,025 0,010 0,005
1 0,3249 1,0000 1,9626 3,0777 6,3137 12,7062 31,8210 63,6559
2 0,2887 0,8165 1,3862 1,8856 2,9200 4,3027 6,9645 9,9250
3 0,2767 0,7649 1,2498 1,6377 2,3534 3,1824 4,5407 5,8408
4 0,2707 0,7407 1,1896 1,5332 2,1318 2,7765 3,7469 4,6041
5 0,2672 0,7267 1,1558 1,4759 2,0150 2,5706 3,3649 4,0321
6 0,2648 0,7176 1,1342 1,4398 1,9432 2,4469 3,1427 3,7074
7 0,2632 0,7111 1,1192 1,4149 1,8946 2,3646 2,9979 3,4995
8 0,2619 0,7064 1,1081 1,3968 1,8595 2,3060 2,8965 3,3554
9 0,2610 0,7027 1,0997 1,3830 1,8331 2,2622 2,8214 3,2498
10 0,2602 0,6998 1,0931 1,3722 1,8125 2,2281 2,7638 3,1693
11 0,2596 0,6974 1,0877 1,3634 1,7959 2,2010 2,7181 3,1058
12 0,2590 0,6955 1,0832 1,3562 1,7823 2,1788 2,6810 3,0545
13 0,2586 0,6938 1,0795 1,3502 1,7709 2,1604 2,6503 3,0123
14 0,2582 0,6924 1,0763 1,3450 1,7613 2,1448 2,6245 2,9768
15 0,2579 0,6912 1,0735 1,3406 1,7531 2,1315 2,6025 2,9467
16 0,2576 0,6901 1,0711 1,3368 1,7459 2,1199 2,5835 2,9208
17 0,2573 0,6892 1,0690 1,3334 1,7396 2,1098 2,5669 2,8982
18 0,2571 0,6884 1,0672 1,3304 1,7341 2,1009 2,5524 2,8784
19 0,2569 0,6876 1,0655 1,3277 1,7291 2,0930 2,5395 2,8609
20 0,2567 0,6870 1,0640 1,3253 1,7247 2,0860 2,5280 2,8453
21 0,2566 0,6864 1,0627 1,3232 1,7207 2,0796 2,5176 2,8314
22 0,2564 0,6858 1,0614 1,3212 1,7171 2,0739 2,5083 2,8188
23 0,2563 0,6853 1,0603 1,3195 1,7139 2,0687 2,4999 2,8073
24 0,2562 0,6848 1,0593 1,3178 1,7109 2,0639 2,4922 2,7970
25 0,2561 0,6844 1,0584 1,3163 1,7081 2,0595 2,4851 2,7874
26 0,2560 0,6840 1,0575 1,3150 1,7056 2,0555 2,4786 2,7787
27 0,2559 0,6837 1,0567 1,3137 1,7033 2,0518 2,4727 2,7707
28 0,2558 0,6834 1,0560 1,3125 1,7011 2,0484 2,4671 2,7633
29 0,2557 0,6830 1,0553 1,3114 1,6991 2,0452 2,4620 2,7564
30 0,2556 0,6828 1,0547 1,3104 1,6973 2,0423 2,4573 2,7500
35 0,2553 0,6816 1,0520 1,3062 1,6896 2,0301 2,4377 2,7238
40 0,2550 0,6807 1,0500 1,3031 1,6839 2,0211 2,4233 2,7045
45 0,2549 0,6800 1,0485 1,3007 1,6794 2,0141 2,4121 2,6896
50 0,2547 0,6794 1,0473 1,2987 1,6759 2,0086 2,4033 2,6778
60 0,2545 0,6786 1,0455 1,2958 1,6706 2,0003 2,3901 2,6603
70 0,2543 0,6780 1,0442 1,2938 1,6669 1,9944 2,3808 2,6479
80 0,2542 0,6776 1,0432 1,2922 1,6641 1,9901 2,3739 2,6387
90 0,2541 0,6772 1,0424 1,2910 1,6620 1,9867 2,3685 2,6316
100 0,2540 0,6770 1,0418 1,2901 1,6602 1,9840 2,3642 2,6259
120 0,2539 0,6765 1,0409 1,2886 1,6576 1,9799 2,3578 2,6174
150 0,2538 0,6761 1,0400 1,2872 1,6551 1,9759 2,3515 2,6090
200 0,2537 0,6757 1,0391 1,2858 1,6525 1,9719 2,3451 2,6006
300 0,2536 0,6753 1,0382 1,2844 1,6499 1,9679 2,3388 2,5923
1E+09 0,2533 0,6745 1,0364 1,2816 1,6449 1,9600 2,3263 2,5758
VALORES DE P
Esta tabla nos da los valores de a
tales que P[ t(df) a ] = p

donde t(df) sigue una distribucin t-Student
con df grados de libertad

a
Modelos de probabilidad
Proyecto e-Math 1
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
MODELOS DE PROBABILIDAD



MAPA CONCEPTUAL ________________________






































MODELOS DE
PROBABILIDAD
VARIABLES ALEATORIAS
V.A.DISCRETAS
V.A. CONTINUAS
DISTRIBUCIN DE
PROBABILIDAD
MEDIA, VARIANZA Y
DESV. ESTNDAR DE
UNA DISTR. PROB
LA DISTRIBUCIN BINOMIAL
CASOS PRCTICOS CON
MINITAB
LA DISTRIBUCIN DE POISON
LA DISTRIBUCIN NORMAL
Modelos de probabilidad
Proyecto e-Math 3
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

CONCEPTOS FUNDAMENTALES ______________________________

Definicin de variable aleatoria (v.a.): Corresponde al valor resultante de un
determinado experimento.

Por ejemplo, si contamos el nmero de empleados ausentes en un determinado turno de
trabajo, el resultado podra ser 0, 1, 2, ...., este nmero de ausencias es la variable aleatoria.

Distinguiremos entre variables aleatorias discretas y continuas.

Diremos que una variable aleatoria es discreta cuando slo puede tomar un nmero contable
de valores. Estos valores no necesariamente han de ser enteros, pero s han de tener valores
claramente definidos.
Seran v.a. discretas, p.e., X1 = n de hermanos de cada uno de nuestros amigos, o X2 =
nota, con una cifra decimal, obtenida en un examen por cada alumno de un aula.


Por el contrario, una v.a. continua es aquella que puede tomar cualquier valor dentro de un
intervalo real.
Seran v.a. continuas, p.e., X
3
= altura, en cm., de los jugadores de un equipo de baloncesto
(1.9, 1.92, 1.923,...), o X
4
= distancia entre dos ciudades.


Definicin de distribucin de probabilidad: Es aquella que permite calcular todos los
resultados probables de ocurrir de un experimento determinado, as como la probabilidad de
ocurrencias de estos resultados. [2]

Las caractersticas ms importantes a tener en cuenta en una distribucin de probabilidad
son:

- La probabilidad de un resultado especfico est entre cero y uno.
- La suma de las probabilidades de todos los resultados mutuamente
excluyentes es 1.


Definicin de funcin de distribucin de probabilidad: La funcin de probabilidad de
una variable aleatoria es la probabilidad acumulada hasta un valor determinado de la
variable. Dada una variable aleatoria X, diremos que F(a) es la funcin de distribucin tal
que:
F(a) = P(Xa)

La funcin de distribucin de probabilidad cumple 0 F(x) 1.


En el caso de las variables discretas la funcin de probabilidad se asocia con la funcin de
probabilidad, funcin que da la probabilidad de cada posible valor que toma la variable.

En el caso de las continuas como estas pueden tomar infinitos valores en un intervalo su
funcin de probabilidad viene definida como la probabilidad a intervalos de valores. De
hecho, la probabilidad de que la variable tome un determinado valor es nula. Las variables
aleatorias continuas se caracterizan por una funcin denominada funcin de densidad.

Definicin de funcin de probabilidad para una variable aleatoria discreta: Dada
una variable aleatoria discreta X, diremos que f(x
i
) es la funcin de probabilidad que asocia
a cada valor x
i
de la variable su probabilidad, i.e., f(x
i
) = P(X=x
i
).

Modelos de probabilidad
Proyecto e-Math 4
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
De este modo: F(a) = P(Xa) es igual a la suma de todos los P(X=xi) tales que xi son
menores que a.


Definicin de funcin de densidad para una variable aleatoria continua: Dada
una variable aleatoria continua X la funcin de densidad f(x) asociada a una variable
aleatoria continua X caracteriza la funcin de distribucin de probabilidad de X donde:


= =
a
dx x f a X P a F ) ( ) ( ) (

La media, la varianza y la desviacin estndar.
Como sabemos, la media nos da informacin acerca de la tendencia central de los datos y la
varianza describe la dispersin de stos.

A la media de la distribucin la denotaremos por , y a la desviacin estndar por .

La media es el valor promedio ponderado en el que los valores posibles de la variable
aleatoria se ponderan segn las probabilidades correspondientes de ocurrencia, tambin se
denomina valor esperado E(X).
Para una variable aleatoria discreta:
[ ]

= = ) ( ) ( x xP X E
donde P(x) es la probabilidad de valores posibles de la variable aleatoria x. Es decir, se
multiplica cada valor de x por la probabilidad de que ocurra, y luego se suman estos
productos.
Para una variable aleatoria continua:
[ ]

+

= = dx x f x X E ) (

La varianza describir la dispersin de la distribucin.
Para una variable aleatoria discreta:

[ ]

= ) ( ) (
2 2
x P x
Para una variable aleatoria continua:

+

= dx x f x ) (
2 2

bviamente, la desviacin estndar la calcularemos al extraer la raz cuadrada de la
varianza.




La distribucin Binomial.
Consideremos una variable aleatoria X que da el nmero de xitos que aparecen al repetir n
veces de forma independiente un experimento en idnticas condiciones. En esta situacin
diremos que X sigue una distribucin Binomial.

Ejemplos:
X= nmero de huevos defectuosos en un paquete de 12.
Y= nmero de 2 al tirar 10 veces un dado.

Las caractersticas principales de este modelo de distribucin son:

1. Repetir n pruebas independientes unas de otras.
Modelos de probabilidad
Proyecto e-Math 5
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)

2. Para cada una de las pruebas slo pueden darse dos resultados: xito o fracaso

3. La probabilidad de xito en cada prueba es de p.

En tales condiciones, diremos que la v.a. X = n de xitos en las n pruebas sigue una
distribucin Binomial de parmetros n y p, y lo escribiremos como X B(n,p) .

Observamos que la v.a. X slo puede tomar los valores 0, 1, 2, 3, , n siendo por tanto una
v.a. discreta.

As pues, las funciones de probabilidad y de distribucin de una distribucin binomial son
las siguientes:

x n x
p p
x
n
x X P x f

= = = ) 1 ( ) ( ) ( para x=0,1,2,3.n
donde
)! ( !
!
x n x
n
x
n

=
= = =
n
i
i X P x X P x F
0
) ( ) ( ) (


De la misma manera, la media y la desviacin estndar de una distribucin binomial son:

p n* = , ) 1 ( * * p p n =

La distribucin de Bernoulli es un caso particular de la binomial cuando n=1 .


Veamos unos ejemplos que muestran cmo aplicar la distribucin Binomial:


Ejemplos:

1. Una empresa industrial que fabrica componentes mecnicos para aviones dispone de
dos distribuidores por Europa, uno situado en Francia y otro en Alemania. Ambos
tienen el 20% de posibilidades de cerrar un pedido con un consorcio industrial de
farbicacin de aviones.

Si el distribuidor francs contacta con 5 consorcios:

a) Cul es la probabilidad de que el distribuidor francs consiga a lo sumo 2 acuerdos
de distribucin?

Sea X=Nmero de acuerdos de distribucin del distribuidor francs a 5 consorcios

p = probabilidad de xito = P(cerrar un acuerdo) = 0,2
n = nmero de clientes = 5

X sigue una distribucin Binomial, X B(5 , 0,2)


Nuestro objetivo es calcular P(X < = 2).

P(X<=2) = P(X=2)+P(X=1)+P(X=0)=0,94208
Modelos de probabilidad
Proyecto e-Math 6
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)


Por su parte,
32768 . 0 ) 2 . 0 1 ( 2 . 0
)! 0 5 ( ! 0
! 5
) 0 (
5 0
=

= = X P

4096 , 0 ) 2 . 0 1 ( 2 . 0
)! 1 5 ( ! 1
! 5
) 1 (
4 1
=

= = X P

2048 . 0 ) 2 . 0 1 ( 2 . 0
)! 2 5 ( ! 2
! 5
) 2 (
3 2
=

= = X P

Por lo tanto la probabilidad de que el distribuidor francs cierre a lo sumo dos
acuerdos es igual a 0,94208

b) Cul sera el nmero medio esperado de acuerdos que conseguira cerrar el
distribuidor francs?

Para calcular cual ser el nmero medio esperado de acuerdos de distribucin
ms probable que cierre el distribuidor calculamos la media de una distribucin
binomial que nos da el nmero medio de xitos, en este caso sera, n*p= 5*0,2=1.
Por lo tanto el nmero medio esperado de acuerdos logrados por el distribuidor
francs ser de 1.

2. El presidente de una compaa planea contactar con otras 18 compaas en busca
de nuevos socios para su negocio. Sus analistas han estimado que la probabilidad de
que una firma contactada al azar acepte incorporarse como socio es de 0,6. Cul es
la probabilidad de que acabe reclutando 5 o ms socios de entre las 18 compaas
contactadas? Cul es el nmero medio esperado de socios que se incorporarn al
proyecto?


Sabemos que X B(18, 0.6). Nos piden hallar P(X>=5).

P(X>=5) = 1-P(X<5)=1- P(X=4)-P(X=3)-P(X=2)-P(X=1)-P(X=0)= 1-0,00127=0,9987
Ya que, 0000000687 . 0 ) 6 . 0 1 ( 6 . 0
)! 0 18 ( ! 0
! 18
) 0 (
18 0
=

= = X P
00000185 . 0 ) 6 . 0 1 ( 6 . 0
)! 1 18 ( ! 1
! 18
) 1 (
17 1
=

= = X P

0000236 . 0 ) 6 . 0 1 ( 6 . 0
)! 2 18 ( ! 2
! 18
) 2 (
16 2
=

= = X P

000189 . 0 ) 6 . 0 1 ( 6 . 0
)! 3 18 ( ! 3
! 18
) 3 (
15 3
=

= = X P

00106 . 0 ) 6 . 0 1 ( 6 . 0
)! 4 18 ( ! 4
! 18
) 4 (
14 4
=

= = X P

Por tanto, P(X>=5) = 0.9987128, as pues la probabilidad de que se incorporen al
proyecto ms de cinco socios es de 0,9987.

Modelos de probabilidad
Proyecto e-Math 7
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Para calcular cual ser el nmero de socios medio esperado que se incorpore al
proyecto calculamos la media de una distribucin Binomial que nos da el nmero
medio de xitos, en este caso sera, n*p= 18*0,6=10,8 que redondeando sera 11.
Por tanto, el nmero medio esperado de socios que se incorporen al proyecto
ser de 11.


Ejemplos con Minitab:

1. Supongamos que X es una variable aleatoria (v.a.) que sigue una distribucin
binomial de parmetros n = 4 y p = 0,85.


Veamos cmo podemos calcular la funcin de probabilidad de esta v.a.:

En primer lugar, en la columna C1 colocaremos los posibles valores que esta v.a.
puede tomar, i.e., 0, 1, 2, 3 y 4.

Seleccionamos Calc > Probability Distributions > Binomial y completamos los
campos como se indica en la imagen inferior:





Probability Density Function

Binomial with n = 4 and p = 0,850000

x P( X = x)
0,00 0,0005
1,00 0,0115
2,00 0,0975
3,00 0,3685
4,00 0,5220

Anlogamente, el siguiente ejemplo nos muestra cmo calcular la funcin de distribucin:

2. Supongamos que X sigue una distribucin Binomial de n=20 y cuya probabilidad de
xito es 0.3333, es decir X B(20 , 0,3333).

Modelos de probabilidad
Proyecto e-Math 8
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Queremos calcular la probabilidad de que X tome un valor menor o igual a 11, i.e.,
P(X<=11):

Seleccionamos Calc > Probability Distributions > Binomial y completamos los
campos como se indica en la imagen inferior:



El resultado es el siguiente:

Cumulative Distribution Function

Binomial with n = 20 and p = 0,333300

x P( X <= x)
11,00 0,9870

Por tanto, P(X<=11)=0.9870

Veamos un ejemplo de cmo aplicar la funcin de distribucin inversa:


3. Sea X B(5,0,4). En esta ocasin, queremos saber cul ser el valor c de X tal que
P(Xc) = 0,913 :

Seleccionar Calc > Probability Distributions > Binomial y completamos los campos
como se indica en la imagen inferior:

Modelos de probabilidad
Proyecto e-Math 9
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)


El output que obtenemos nos dice que c = 3 es el valor que deja a su izquierda el
91,3% de la distribucin de X .

Inverse Cumulative Distribution Function

Binomial with n = 5 and p = 0,400000

x P( X <= x) x P( X <= x)
3 0,9130 4 0,9898

Por ltimo, aplicaremos todo lo anterior a un caso real:

4. La compaa area Viajar ofrece, entre otros, 10 vuelos diarios de Barcelona a
Madrid. Se ha estudiado, que la probabilidad de que alguno de ellos se retrase es de
0.25.
Cul es la probabilidad de que hoy no haya ningn vuelo que se retrase? y la
probabilidad de que no se retrasen ms de dos vuelos?

Sea X = nmero de vuelos retrasados y sabemos que XB(10,0.25)

Para calcular cul es la probabilidad de que no haya ningn vuelo que se retrase,
seleccionamos Calc > Probability Distributions > Binomial.

El resultado es el siguiente:

Probability Density Function

Binomial with n = 10 and p = 0.250000

x P( X = x)
0.00 0.0563


Por tanto, P(X=0) = 0.056, es decir, la probabilidad de que hoy no se retrase ninguno
de los 10 vuelos es muy baja, aprox. 0.056

Ahora, para calcular la probabilidad de que no se retrasen ms de dos vuelos, es
decir, P(X<=2), seleccionaremos Calc > Probability Distributions > Binomial, y
activaremos la opcin de Cumulative Probability, obteniendo el siguiente resultado:


Modelos de probabilidad
Proyecto e-Math 10
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
Cumulative Distribution Function

Binomial with n = 10 and p = 0.250000

x P( X <= x)
2.00 0.5256


Por tanto, la probabilidad de que menos de 2 vuelos se retrasen es de
aproximadamente el 0.53.


La distribucin normal
La distribucin normal es la distribucin de probabilidad continua ms importante. Multitud de
variables aleatorias continuas siguen una distribucin normal o aproximadamente normal.
Una de sus caractersticas ms importantes es que cualquier distribucin de probabilidad,
tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones.

La distribucin de probabilidad normal y la curva normal que la representa, tienen las
siguientes caractersticas:

- La curva normal tiene forma de campana y un solo pico en el centro de la distribucin. De
esta manera, la media aritmtica, la mediana y la moda de la distribucin son iguales y se
localizan en el pico. As, la mitad del rea bajo la curva se encuentra a la derecha de este
punto central y la otra mitad est a la izquierda de dicho punto.

- La distribucin de probabilidad normal es simtrica alrededor de su media.
- La curva normal desciende suavemente en ambas direcciones a partir del valor central.
Es asinttica, lo que quiere decir que la curva se acerca cada vez ms al eje X pero
jams llega a tocarlo. Es decir, las colas de la curva se extienden de manera indefinida
en ambas direcciones.


Para indicar que una variable aleatoria (v.a.) sigue una distribucin normal de media y
desviacin estndar usaremos la expresin: X N(,).
La curva normal es simtrica
colas
media=mediana=moda
Modelos de probabilidad
Proyecto e-Math 12
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)
La probabilidad de que una variable aleatoria (v.a.) X tome un valor determinado entre dos
nmeros reales a y b coincide con el rea encerrada por la funcin

2
) (
2
2
1

=
x
e
x f
(funcin de densidad de probabilidad) entre los puntos a y b, es decir :
P(aXb) =

b
a
dx x f ) (

Como hemos comentado anteriormente, observar que:

- La distribucin normal es simtrica respecto de su media .
- El rea total encerrada por f(x) vale 1, i.e.:

+

= + < < = 1 ) ( ) ( X P dx x f .
- Al ser X v.a. continua, P(X=a) =

a
a
dx x f ) ( = 0 , aR P(Xa) = P(X<a) .



La distribucin normal estndar:

Se observ que no existe una sola distribucin de probabilidad normal, sino una familia de
ellas. Como sabemos, cada una de las distribuciones puede tener una media () o una
desviacin estndar distinta (). Por tanto, el nmero de distribuciones normales es ilimitado
y sera imposible proporcionar una tabla de probabilidades para cada combinacin de y.

Para resolver este problema, se utiliza un solo miembro de la familia de distribuciones
normales, aquella cuya media es 0 y desviacin estndar 1 que es la que se conoce como
distribucin estndar normal, de forma que todas las distribuciones normales pueden
convertirse a la estndar, restando la media de cada observacin y dividiendo por la
desviacin estndar.

Primero, convertiremos la distribucin real en una distribucin normal estndar utilizando un
valor llamado Z, o estadstico Z que ser la distancia entre un valor seleccionado, designado
X, y la media , dividida por la desviacin estndar .

Formalmente, si X N(,) , entonces la v.a.


=
X
Z se distribuye segn una normal
de media 0 y desviacin estndar 1, i.e.: Z N(0,1) , que es la distribucin llamada normal
estndar o tipificada.

De esta manera, un valor Z mide la distancia entre un valor especificado de X y la media
aritmtica, en las unidades de la desviacin estndar. Al determinar el valor Z utilizando la
2
0,0
0,1
0,2
0,3
0,4
Valores de la v.a. X
F
u
n
c
i

n

d
e

d
e
n
s
i
d
a
d

(
f
.
d
.
p
.
)
Normal(2,1)
a b
Modelos de probabilidad
13
expresin anterior, es posible encontrar el rea de probabilidad bajo cualquier curva normal
haciendo referencia a la distribucin normal estndar en las tablas correspondientes.

As pues, para averiguar el rea encerrada bajo la curva utilizaremos la tabla que
encontraremos al final de este apartado. Dicha tabla nos proporciona la probabilidad de que
la v.a. normal estndar Z tome un valor situado a la izquierda de un nmero c, i.e.: P(Z<c). En
otras palabras, esta tabla nos da el valor del rea encerrada por f(x) entre - y c.

Ejemplo con minitab:
Segn viene publicado en una prestigiosa revista de economa, el salario semanal medio de
los profesores universitarios europeos es de 406,15 . Se estima adems que la desviacin
estndar de dichos salarios es de 55,50 . Supongamos ahora que pretendemos tomar una
muestra aleatoria de 100 profesores para estudiar sus salarios. Calcular las siguientes
probabilidades referentes a la media de dicha muestra:

1. La probabilidad de que la media de la muestra sea menor de 400 .
En primer lugar, observar lo siguiente: como n = 100 >> 30, por el Teorema Central del
Lmite tendremos que la distribucin de las medias muestrales X se podr aproximar
por una normal con media 406,15 y desviacin estndar 5,50.

Hemos de hallar ) 400 ( < X P :
Seleccionamos: Calc > Probability Distributions > Normal :

Modelos de probabilidad
Proyecto e-Math 16
Financiado por la Secretara de Estado de Educacin y Universidades (MECD)



Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,55000

x P( X <= x)
400,0000 0,1339

Por lo tanto existe una probabilidad del 13;39 % de que el salario medio se menor de
400.


2. La probabilidad de que la media de la muestra est entre 400 y 410 .

Sabemos que ) 400 ( ) 410 ( ) 410 400 ( < < = < < X P X P X P . La segunda de stas
probabilidades ya la hemos calculado en el apartado anterior.

Para calcular la primera se razona anlogamente, obteniendo que:


Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,55000

x P( X <= x)
410,0000 0,7561

Por tanto, tendremos: 0,6222 ) 400 ( ) 410 ( ) 410 400 ( = < < = < < X P X P X P

3. La probabilidad de que la media de la muestra sea mayor de 415 .

En este caso, ) 415 ( 1 ) 415 ( < = > X P X P . Hemos de calcular pues esta ltima
probabilidad, lo cual haremos de forma anloga a los apartados anteriores.

Obtendremos lo siguiente:


Cumulative Distribution Function

Modelos de probabilidad
Normal with mean = 406,150 and standard deviation = 5,55000

x P( X <= x)
415,0000 0,9446

Por consiguiente, 0,0554 ) 415 ( 1 ) 415 ( = < = > X P X P

4. Hallar el valor del salario medio c tal que 95 , 0 ) ( = < c X P .

Seleccionamos nuevamente: Calc > Probability Distributions > Normal , pero ahora
elegiremos la opcin Inverse Cumulative Probability , con lo que obtendremos :


Inverse Cumulative Distribution Function

Normal with mean = 406,150 and standard deviation = 5,55000

P( X <= x) x
0,9500 415,2789

Você também pode gostar