Você está na página 1de 50

UNIVERSIDAD TCNICA DE AMBATO

GUIA DEL MODULO ESTADISTICA

Ing. M.B.A William Fabin Teneda Llerena


1

UTA

Ing. M.B.A William Teneda

CAPITULO I ESTADIGRAFOS DE POSICION Y ESTADIGRAFOS DE DISPERSION

I.1 Objetivos Diferenciar entre los estadgrafos de posicin y los estadgrafos de dispersin. Demostrar el inters en la aplicacin de los estadgrafos. Comprender como se desarrollan y se aplica las medidas de tendencia central [estadgrafos de posicin] y los estadgrafos de dispersin.

I.2 Marco Terico

I.2.1 DISTRIBUCIN DE FRECUENCIAS La distribucin de frecuencias es un mtodo para organizar y resumir datos. Con este mtodo los datos que componen una serie se clasifican y ordenan indicndose el nmero de veces que se repite el valor.

ELABORACIN DE UNA TABLA DE FRECUENCIAS Variable Discreta.- es necesario familiarizarse con algunos smbolos. n N Xi ni hi Ni Hi = = = = = = = tamao muestra tamao poblacin identificacin de cada valor observado frecuencia absoluta frecuencia relativa frecuencia absoluta acumulada frecuencia relativa acumulada 2

UTA

Ing. M.B.A William Teneda

Yi y i m

= = =

indican los valores que toman las variables marca de clase nmero de valores que toma la variable Yi. Tambin se

considera el nmero de intervalos o marcas de clase en la variable.

Ejercicio. Supongamos una poblacin constituida por 200 cajas y se desea examinarlas, determinndose el nmero de piezas defectuosas que contiene cada caja. Por diferentes razones se desea que la investigacin no sea exhaustiva, es decir seleccionar una muestra de tamao 20, correspondiendo a una investigacin parcial. N = 200 n = 20

El resultado de esta encuesta, se anota a continuacin, siendo X1 la primera caja examinada y 3 el nmero de piezas defectuosas encontradas en esa caja.
x 1= 3 x 2= 2 X3= 0 x 4= 2 x 5= 3 x 6= 3 x 7= 1 X8= 1 x 9= 0 x 10= 1 x 11= 3 x 12= 3 X13= 4 x 14= 4 x 15= 3 x 16= 2 x 17= 4 X18= 2 x 19= 4 x 20= 2

Yi 0 1 2 3 4

ni 2 3 5 6 4 20

hi 0,10 0,15 0,25 0,30 0,20 1

Ni 2 5 10 16 20 ----

Hi 0,10 0,25 0,50 0,80 1,00 ----

Variable contnua.- debemos conocer m c = = nmero de intervalos amplitud del ancho del intervalo 3

UTA

Ing. M.B.A William Teneda

Histograma, usado para variables continuas. En el eje OX se sealan los extremos de los intervalos. Se construyen unos rectngulos de base la amplitud del intervalo y de altura la frecuencia absoluta. Polgono de frecuencias, se obtiene uniendo los puntos medios de los segmentos superiores de los rectngulos del diagrama. Grfico de sectores, es el resultado de dividir un crculo en sectores circulares de ngulos proporcionales a las frecuencias absolutas de cada valor de la variable. Para calcular los grados de cada sector se divide la frecuencia entre el nmero de datos y se multiplica por 360.Se utiliza para variable discreta y continua.

1.2.2. MEDIDAS DE TENDENCIA CENTRAL [ESTADGRAFOS DE POSICIN] Estas medidas tienden a ubicarse en el centro del conjunto. Proporcionan un valor simple y representativo, que resume un gran volumen de informacin. 1. Media Aritmtica 2. Mediana 3. Moda 4. Media Geomtrica 5. Media Armnica 6. Media Cuadrtica 7. Media Cbica 8. Cuartiles, Deciles y Percentiles

1. Media Artimtica 4

UTA

Ing. M.B.A William Teneda

La media aritmtica se puede calcular para datos agrupados y no agrupados.

La media aritmtica de un conjunto de valores x1 , x2, x3,............xn se obtiene sumando todos los valores y dividiendo por el nmero de datos n.

XI= 1,26 X2=1,75 X3= 1,64 X4= 1,45 X5= 1,38

X= Exi n x= x1+x2+x3+x4+x5 n x= 1,25+1,75+1,64+1,45+1,38 = 7,47 = 1,44 5 5

Y1 y2 24 46 68 8 10 10 12

ni 1 3 7 2 4 Eni= 17

yi 3 5 7 9 11

yini 3 15 49 18 44 Exiyi= 129

Ni 1 4 11 13 17

X= Exini nT X= 129 = 1,58 17

2. Mediana

UTA

Ing. M.B.A William Teneda

De un conjunto ordenado de datos es aquel valor tal que la mitad de los datos son iguales o inferiores a l y la otra mitad son iguales o superiores. Si el nmero de datos es pequeo los ordenamos y cogemos el valor central.

Caso 1: Cuando el nmero de datos es impar: Si los valores son 4,6,4,5,7,3,9. Los ordenamos 3,4,4,5,6,7,9, cmo son 7 datos cogemos el dato que ocupa el lugar 4 que es 5.

Caso 2: Cuando el nmero de datos es impar: Si los valores son 4,6,5,7,3,9. Los ordenamos 3,4,5,6,7,9, cmo son 6 datos cogemos los datos que ocupan el lugar 3 que es 5 y el lugar 4 que es 6. la mediana es la media de los dos nmeros es este caso 5,5 =(5+6)/2

ejercicios de mediana Y1 y2 24 46 68 8 10 10 12 ni 1 3 7 2 4 yi 3 5 7 9 11 yini 3 15 49 18 44 Ni 1 4 11 13 17

me = yj-1+c ( (n/2) Nj -1 Nj me = 6+2 ( 3.5 +4 ) 11 me = 6 + 2 + 4.5 11 me = 6.81

3. Moda La moda de un conjunto de datos es el dato que tiene mayor frecuencia. El intervalo modal es el de mayor frecuencia absoluta. Cuando tratamos con datos agrupados antes de definir la moda, se ha de definir el intervalo modal.

UTA

Ing. M.B.A William Teneda

La moda, cuando los datos estn agrupados, es un punto que divide al intervalo modal en dos partes de la forma p y c-p, siendo c la amplitud del intervalo, que verifiquen

que: Siendo la frecuencia absoluta del intervalo modal las frecuencias absolutas de los intervalos anterior y posterior, respectivamente, al intervalo modal.

ejercicios de moda Y1 y2 24 46 8 10 10 12 68 ni 1 3 7 2 4 Yi 3 5 7 9 11 yini 3 15 49 18 44 Ni 1 4 11 13 17

md = yj-1+c (

(nj+1) )

nj+1+nj-1 md = 6+2 ( 2 ) 2+8 md = 6 + 4 5 md = 6.8 4. Media Geomtrica

Es considerada como una medida de posicin simbolizada por Mo y su resultado al ser calculado debe estar comprendido entre la media armnica y la aritmtica.

UTA

Ing. M.B.A William Teneda

Sea una distribucin de frecuencias (x , n ). La media geomtrica, que denotaremos por G. se define como la raz N-sima del producto de los N valores de la distribucin.

Si los datos estn agrupados en intervalos, la expresin de la media geomtrica, es la misma, pero utilizando la marca de clase (Xi). El empleo ms frecuente de la media geomtrica es el de promediar variables tales como porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas. Ventajas e inconvenientes: En su clculo intervienen todos los valores de la distribucin. Los valores extremos tienen menor influencia que en la media aritmtica. Es nica. Su clculo es ms complicado que el de la media aritmtica.

Adems, cuando la variable toma al menos un x = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las races de ndice par de nmeros negativos. 5. Media Armnica

Se utiliza como una medida de tendencia central para conjunto que consisten en caja de cambios. La media armnica, que representaremos por H, se define como sigue:

UTA

Ing. M.B.A William Teneda

Es la inversa de la media aritmtica de las inversas de los valores de la variable, responde a la siguiente expresin:

H=

n n = ni n1 n 2 n 3 x x + x + x + .... i 1 21 3

Obsrvese que la inversa de la media armnica es la media aritmtica de los inversos de los valores de la variable. No es aconsejable en distribuciones de variables con valores pequeos. Se suele utilizar para promediar variables tales como productividades, velocidades, tiempos, rendimientos, cambios, etc. Ventajas e inconvenientes: cero. Es nica. Relacin entre las medias: En su clculo intervienen todos los valores de la distribucin. Su clculo no tiene sentido cuando algn valor de la variable toma valor

ejercicio de media armnica

X1=0,15 X2=0,18 X3=0,17

M-1 =

n E(/xi)

(1/0,15)+(1/0,18)+(1/0,17)

M-1= 0,165 M-1 = n E(/Yi) M-1= 162,866 9 = Q 10 0,0614 G

UTA

Ing. M.B.A William Teneda

6. Media Cuadrtica

La media cuadrtica es igual a la raz cuadrada de la suma de los cuadrados de los valores dividida entre el nmero de datos: Esta media como medida de asociacin tiene aplicaciones tanto en ciencias biolgicas como en medicina. A veces la variable toma valores positivos y negativos, como ocurre, por ejemplo, en los errores de medida. En tal caso se puede estar interesado en obtener un promedio que no recoja los efectos del signo. Este problema se resuelve, mediante la denominada media cuadrtica. Consiste en elevar al cuadrado todas las observaciones (as los signos negativos desaparecen), en obtener despus su media aritmtica y en extraer, finalmente, la raz cuadrada de dicha media para volver a la unidad de medida original. ejercicio de media cuadrtica m2 = Eyi2*ni = 1020 = 7,4 n yi 2 4 6 8 10 ni 2 3 5 6 4 1020 20 Yi*ni 4 12 30 48 40 Yi2*ni 8 48 180 384 400

7. Media Cbica

La media cbica es una medida derivada de la media aritmtica y consiste en obtener el valor del lado que tiene el cubo media de un conjunto de n cubos.

UTA

10

Ing. M.B.A William Teneda

ejercicio de media cubica X1= 5 X2=6 X3=10 X4=12 X5=7 8. Cuartiles, Deciles y Percentiles m3= 8,80 m3 = 53+63+103+123+73 5

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos Ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.

Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.

I.2.3

ESTADIGRAFOS DE DISPERSION

Se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas. 1. Varianza 2. Desviacin Tpica 3. Desviacin Media

UTA

11

Ing. M.B.A William Teneda

1. Varianza Varianza: Es la media de los cuadrados de las desviaciones de los datos respecto a la media. 2. Desviacin Tpica

Desviacin Tpica: Es la raz cuadrada de la varianza. Se calcula aplicando esta frmula.

3. Desviacin Media

Desviacin media de un conjunto de datos es la media aritmtica de los valores absolutos de las desviaciones respecto a la media.

UTA

12

Ing. M.B.A William Teneda

I.3 Trminos y Conceptos claves Variable.- una variable es una cantidad sujeta a variacin existen 2 tipos de variables; las cuantitativas y cualitativas. Dentro de las variables cuantitativas podemos distinguir las variables discretas y las variables continuas. a) Variables Discretas .- valores enteros b) Variables Continuas.- valores fraccionables Tablas Y Graficas.- la presencia de datos en una investigacin se las puede representar de varias formas que pueden ser: textuales, cuadros o tablas y grficas.

I.4 Preguntas y Problemas i. Las notas de una estudiante han sido 85, 76, 93, 82 y 96. Calcular los

estadgrafos de posicin y de dispersin. ii. Un conjunto de nmeros contiene 6 seises, 7 sietes, 8 ochos, 9 nueves y 10 dieces. Calcular los estadgrafos de posicin y de dispersin. iii. Tres profesores de economa dieron notas medias en sus cursos, con 32, 25 y 17 estudiantes de 79, 74 y 82 puntos, respectivamente. Hallar la puntuacin media de los tres cursos.

I.5 Bibliografa Complementaria Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin. Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980. Primera Edicin Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill. Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

Estadstica. Editorial: 2007 Pearson Education De Mexico Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981 McgrawHill Latinoamericana Editores S.A De C.V. Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

Hill/Interamericana Editores S.A De C.V. Edicon 2006.

UTA

13

Ing. M.B.A William Teneda

Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial: Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin. Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias. Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007. Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica. Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990

UTA

14

Ing. M.B.A William Teneda

CAPITULO II REGRESION Y CORRELACION

2.1Objetivos
Emplear adecuadamente los diferentes tipos de regresiones. Dominar la utilizacin de las regresiones.

2.2Marco Terico

REGRESIONES La regresin es una tcnica estadstica utilizada para simular la relacin existente entre dos o ms variables. Por lo tanto se puede emplear para construir un modelo que permita predecir el comportamiento de una variable dada.

La regresin es muy utilizada para interpretar situaciones reales, pero comnmente se hace de mala forma, por lo cual es necesario realizar una seleccin adecuada de las variables que van a construir las ecuaciones de la regresin, ya que tomar variables que no tengan relacin en la prctica, nos arrojar un modelo carente de sentido, es decir ilgico. Segn sea la dispersin de los datos (nube de puntos) en el plano cartesiano, pueden darse alguna de las siguientes relaciones, Lineal, Logartmica, Exponencial, Cuadrtica, entre otras.

Regresin Lineal

El objetivo de la tcnica de regresin es establecer la relacin estadstica que existe entre la variable dependiente (Y) y una o ms variables independientes (X1, X2, Xn). Para poder realizar esto, se postula una relacin funcional entre las variables. Que en la prctica es la relacin lineal: = b0 + b1x1 + bnxn donde los coeficientes b0 y b1, bn, son los parmetros que definen la variacin promedio de y, para cada valor de x.. 15

UTA

Ing. M.B.A William Teneda

El anlisis de regresin se utiliza para fines de prediccin. Y el anlisis de correlacin se utiliza para medir la fuerza de la asociacin entre las variables cuantitativas.

- El parmetro b0, conocido como la ordenada en el origen, nos indica cunto es Y cuando X = 0. El parmetro b1, conocido como la pendiente, nos indica cunto aumenta Y por cada aumento en X. - La tcnica consiste en obtener estimaciones de estos coeficientes a partir de una muestra de observaciones sobre las variables Y y X.

REGRESIN POLINOMIAL En situaciones donde la relacin funcional entre la respuesta Y y la variable independiente x no se puede aproximar de manera adecuada mediante una relacin lineal, es, algunas veces, posible obtener un ajuste razonable considerando una relacin polinomial. Es decir, podemos ajustar el conjunto de datos a una relacin funcional de la forma: Y = Bo + Box + B2x2 + Brxr + e Donde B0, B1,, Br son coeficientes de regresin que tienen que estimarse. Si los datos constan de los n pares (.xi, Yi), i= 1,..,n, entonces los estimadores de mnimos cuadrados de, B0,.....,Br llammoslos BO,..., Br son aquellos valores que minimizan

Para determinar estos valores, obtenemos las derivadas parciales de la suma de cuadrados anterior, respecto a BO ,... B r , y luego, igualamos a cero con el objetivo de determinar los valores minimizantes. Al hacer esto y reordenando despus las ecuaciones resultantes, obtenemos que los estimadores de mnimos cuadrados, BO,BI,Br satisfacen el conjunto de r + 1 ecuaciones lineales, llamadas ecuaciones normales.

UTA

16

Ing. M.B.A William Teneda

Al ajustar una funcin polinomial a un conjunto de pares de datos, con frecuencia es posible determinar el grado necesario del polinomio mediante un estudio del diagrama de dispersin. Que queremos enfatizar que siempre se debe usar el menor grado posible que parezca describir los datos adecuadamente. (As, por ejemplo, aunque normalmente es posible encontrar un polinomio de grado n que pase por todos los n pares (x i , Y i ), i=1,,n, sera difcil tener mucha Resulta muy arriesgado, an ms que en el caso de la regresin lineal, usar un polinomio ajustado para predecir el valor de una respuesta a un nivel de entrada x0 que este lejos de los niveles de entrada xi, i=1,,n usados para encontrar el polinomio de ajuste. (El polinomio de ajuste puede ser vlido slo en una regin alrededor de las xi, i=1,,n y no incluir a x0). confianza en tal ajuste.)

Regresin Lineal Mltiple

Muchas aplicaciones del anlisis de regresin involucran situaciones donde se tiene ms de una variable de regresin. Un modelo de regresin que contiene ms de un regresor recibe el nombre de modelo de regresin mltiple

Como ejemplo, supngase que la vida eficaz de una herramienta de corte depende de la velocidad de corte y del ngulo de la herramienta. Un modelo de regresin mltiple que puede describir esta relacin es el siguiente

= + 11 + 22 +

UTA

17

Ing. M.B.A William Teneda

FORMULAS PARA EL CALCULO DE REGRESIONES 1. REGRESION LINEAL: = 0 + 1 1 = ( )( ) 2 ( ) 2


= 0 + 1

0 =
2

= 0 + 1 2

= 0 + 1

1 0 + 1 ( ) 2 = 1 ( 2 ) ( ) 2 x

2. REGRESION LOGARITMICA: = 0 + 1 1 = 0 = =
2 ( ) ( )( ) 2 ( ) 2

1 0 +1 ( ) ( ) 2 1 ( 2 ) ( ) 2

() = 0 + 1 2

= 0 + 1

= 0 + 1

UTA

18

Ing. M.B.A William Teneda

3. REGRESION EXPONENCIAL: = 0 + 1 1 =
( )( )( ) 2 ( ) 2

y =

1 0 + 1 () ( ) 2 = 1 ( 2 ) ( ) 2
2

0 =

= 0 + 1

() = 0 + 1 2

= 0 + 1

4. REGRESION POTENCIAL: = 0 + 1 1 =
( )( )( ) 2 ( ) 2

y =

1 0 + 1 () ( ) 2 = 1 ( 2 ) ( ) 2
2

0 =

= 0 + 1

()() = 0 + 1 2 5. REGRESION CUADRATICA: = 0 + 1 + 2 2 1) = 0 + 1 + 2 2 2) = 0 + 1 2 + 2 3 3) 2 = 0 2 + 1 3 + 2 4

= 0 + 1

1 0 + 1 + 2 2 ( ) 2 = 1 ( 2 ) ( ) 2
2

UTA

19

Ing. M.B.A William Teneda

6. REGRESION CUBICA: = 0 + 1 + 2 2 + 3 3 1) 2) 3) 4)

1 0 + 1 + 2 2 + 3 3 ( ) 2 = 1 ( 2 ) ( ) 2
2

= 0 + 1 + 2 2 + 3 3 = 0 + 1 2 + 2 3 + 3 4 2 = 0 2 + 1 3 + 2 4 + 3 5 3 = 0 3 + 1 4 + 2 5 + 3 6

7. REGRESION MULTIPLE: 1) = 0 + 1 1 + 2 2 2) 1 = 0 1 + 1 1 2 + 2 1 2 3) 2 = 0 2 + 1 1 2 + 2 2 2
2

1 0 + 1 + 2 2 ( ) 2 = 1 ( 2 ) ( ) 2

2.3Trminos y Conceptos claves Interpretacin de los Coeficientes de Regresin: :

Interpretacin del intercepto

Indica el valor promedio de la variable de respuesta Y cuando X es cero. Si se tiene certeza de que la variable predictoria X no puede asumir el valor 0, interpretacin no tiene sentido. Interpretacin de la pendiente : entonces la

Indica el cambio promedio en la variable de respuesta Y cuando X se incrementa en una unidad. Anlisis de Residuales y el valor estimado por

Un residual es la diferencia entre el valor observado la lnea de regresin ,

El residual puede ser considerado como el error aleatorio observado. 20

UTA

Ing. M.B.A William Teneda

2.4 Problemas Se desea desarrollar un modelo de regresin polinmica para predecir la temperatura ambiente para la calefaccin domstica durante el mes de enero en funcin del consumo de combustible ambiente.

Observacin

Temperatura Ambiente (Diaria Promedio) [F]

Consumo Mensual De Petrleo Para Calefaccin [Galones]

Cantidad De Aislamiento En El tico [Pulgadas]

1 2 3 4 5 6 7

40 27 40 73 64 34 9

27,5 36,4 16,4 4,1 9,4 23,1 36,7

3 3 10 6 6 6 6

Regresin Cbica

X1 27,5 36,4 16,4 4,1 9,4 23,1 36,7 153,6

Y 40 27 40 73 64 34 9 287

X1Y 1100 982,8 656 299,3 601,6 785,4 330,3 4755,4

X 1Y 30250 35773,92 10758,4 1227,13 5655,04 18142,74 12122,01 113929,24

X 1Y 831875 1302171 176437,8 5031,233 53157,38 419097,3 444877,8 3232647

1600 729 1600 5329 4096 1156 81 14591

UTA

21

Ing. M.B.A William Teneda

2 1

3 1

4 1

5 1

6 1

756,25 1324,96 268,96 16,81 88,36 533,61 1346,89

20796,875 571914,063 15727636,72 48228,544 1755519 63900891,66

432510009,8 2325992456 19456426,97 4750,104241 689869,7811 151939915,1 2443410217 5374003645

4410,944 72339,4816 1186367,498 68,921 830,584 282,5761 1158,56201

7807,4896 73390,40224

12326,391 284739,632 6577485,502 49430,863 1814112,67 66577935,07

4335,84 136093,122 4506714,92 154044865,4

Frmulas

n x1 x12 3 x1

x x x x

1 2 1 3 1 4 1

x x x x

2 1 3 1 4 1 5 1

x x x x

3 1 4 1 5 1 6 1

bo Y b1 XY = b2 X 12Y 3 X Y 1 b3

7 153,6 4335,84 136093,122 bo 287 b1 153,6 4335,84 136093,122 4506714,916 4755,4 = 4335,84 113929,24 136093,122 4506714,916 154044865,4 b2 3232647,12 136093,122 4506714,916 154044865,4 5374003645 b3

- 0,00091455 5,80046665 - 1,16835825 0,060961796 - 1,16835825 0,26642294 - 0,014638191 0,000225763 0,0609618 - 0,01463819 0,000830688 - 1,30796E - 05 - 0,00091455 0,00022576 - 1,30796E - 05 2,08942E - 07

287 bo 4755,4 = b1 113929,24 b 2 3232647,12 b3

Matriz

Inversa
UTA 22 Ing. M.B.A William Teneda

bo = 97,6351505 670896 b1 = -6,2768708 7294009 b2 = 0,24366935 6379108 b3 = -0,0035918 7902272251

Ecuacin Cbica

Y = b3 X 3 + b2 X 2 + b1 X + bo

Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635

Coeficiente De Determinacin Y De Correlacin

1 bo Y + b1 XY + b 2 X 2Y + b3 X 3Y ( Y ) 2 n R2 = 1 (Y 2 ) n ( Y ) 2
R2 = 2555,04367612773 2824

R 2 = 0,904760508543815

R = 0,951188997278572
Grfica:

Temperatura Promedio Diaria [F]

80 60 40 20 0 0 20 30 40 23 Consumo De Combustible [Galones] Ing. M.B.A William Teneda 10

UTA

Qu temperatura debera tener el ambiente si el consumo de tuviera 35 galones para el modelo utilizado en el literal anterior?

Y = -0,0036X3 + 0,2437X2 - 6,2769X+ 97,635 Y= 22,4378184793661 F

Regresin Cuadrtica

X1 27,5 36,4 16,4 4,1 9,4 23,1 36,7 153,6

Y 40 27 40 73 64 34 9 287

X1Y 1100 982,8 656 299,3 601,6 785,4 330,3 4755,4

X 1Y 30250 35773,92 10758,4 1227,13 5655,04 18142,74 12122,01 113929,24

2 1

3 1

4 1

1600 729 1600 5329 4096 1156 81 14591

756,25 1324,96 268,96 16,81 88,36 533,61 1346,89

20796,875 571914,063 48228,544 1755519

4410,944 72339,4816 68,921 830,584 282,5761 7807,4896

12326,391 284739,632 49430,863 1814112,67

4335,84 136093,122 4506714,92

Formulas

n x1 x12

x x x x x x
1 2 1 3 1

2 1 3 1 4 1

bo Y b1 = X Y 1 2 b2 X 1 Y

UTA

153,6 4335,84 bo 7 153,6 4335,84 136093,122 b1 24 4335,84 136093,122 4506714,92 b2

287 = 4755,4 113929,24

Ing. M.B.A William Teneda

Matriz Inversa

1,797420717 - 0,18017899 0,00371175 - 0,180178993 0,02248413 - 0,00050563 0,003711749 - 0,00050563 1,192E - 05


bo = 81,913266575305 b1 = -2,39581632991347 b 2 = 0,0188209256447591
Ecuacin Cuadrtica

287 bo 4755,4 = b1 113929,24 b2

Y = b 2 X 2 + b1X + bo
Y = 0,0188X 2 - 2,3958X + 81,913

Coeficiente De Determinacin Y De Correlacin

1 bo Y + b1 XY + b2 X 2Y ( Y ) 2 n R2 = 1 (Y 2 ) n ( Y ) 2

R2 =

2493,29628664595 2824

R 2 = 0,882895285639502

R = 0,939625077166154
Temperatura Promedio Diaria [F]

Grafico:

80 60 40 20 0 0 10

UTA

25
20

30Ing. M.B.A 40 William Teneda

Consumo De Combustible [Galones]

El conocido urbanista siente que hay una relacin entre una segunda variable independiente la cantidad de aislamiento. Establezca la regresin mltiple y analice los datos

Regresin Mltiple
X1 27,5 36,4 16,4 4,1 9,4 23,1 36,7 153,6 X2 3 3 10 6 6 6 6 40 Y 40 27 40 73 64 34 9 287 X1X2 82,5 109,2 164 24,6 56,4 138,6 220,2 795,5 X1Y 1100 982,8 656 299,3 601,6 785,4 330,3 4755,4 X2Y 120 81 400 438 384 204 54 1681 X
2 1

2 2

756,25 1324,96 268,96 16,81 88,36 533,61 1346,89 4335,84

9 9 100 36 36 36 36 262

Frmulas 1. b1

+ b2 X 2 = Y nbo

( X 1 ) 2 X1 X 2 X1 Y 2 2. b1 X 1 + b 2 X 1 X 2 = X 1Y n n n

X1 X 2 ( X 2 ) 2 X 2 Y 2 3. b1 X 1 X 2 = X 2Y + b 2 X 21 n n n

1. 153,6b1 + 40b 2 = 287 - 7bo

2. b1[965,417143] + b 2[- 82,2142857] = -1542,2

3. b1[- 82,2142857] + b 2[33,4285714] = 41 26

UTA

Ing. M.B.A William Teneda

2.

b1 - 0,08515934 b 2 = -1,59744418

3. b1 + 0,40660295 b 2 = 0,49869679

0,32144361b 2 = -1,0987474

b 2 = -3,41816526 b1 = -1,88853288 bo = 101,97218


Ecuacin Mltiple

Y = bo b1X1 + b2X2 Y = 101,9721 1,8885X1 -3,41816X2

Coeficiente De Determinacin Y De Correlacin

1 bo Y + b1 X 1Y + b 2 X 2Y ( Y ) 2 n R2 = 1 2 2 (Y ) n ( Y )

R2 =

2772,35063 2824

R 2 = 0,98171056

R = 0,99081308

UTA

27

Ing. M.B.A William Teneda

2.5 Bibliografa Complementaria Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin. Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980. Primera Edicin Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill. Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

Estadstica. Editorial: 2007 Pearson Education De Mexico Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981 McgrawHill Latinoamericana Editores S.A De C.V. Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

Hill/Interamericana Editores S.A De C.V. Edicon 2006. Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial: Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin. Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias. Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007. Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica. Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990. Estadistica de Inferencia. Hctor Anbal Saltos.

UTA

28

Ing. M.B.A William Teneda

CAPITULO III INTRODUCCION A LAS PROBABILIDADES 3.1 Objetivos


Aplicar las probabilidades en ejercicios prcticos Dominar el empleo de la Distribucin normal, Binomial y Poisson . Explicar y predecir procesos reales que se presentan en la naturaleza y la tecnologa con la ayuda de la estadstica para resolver problemas inherentes a la ingeniera civil y mecnica.

3.2 Marco Terico


PROBABILIDAD

Probabilidad de un suceso es el nmero al que tiende la frecuencia relativa asociada al suceso a medida que el nmero de veces que se realiza el experimento crece.

P(X) =

NUMERO DE EXITOS NUMERO DE SUCESO POSIBLES

TABLA DE CONTINGENCIA El procedimiento Tablas de contingencia crea tablas de clasificacin doble y mltiple y, adems, proporciona una serie de pruebas y medidas de asociacin para las tablas de doble clasificacin. La estructura de la tabla y el hecho de que las categoras estn ordenadas o no determinan las pruebas o medidas que se utilizaban. Los estadsticos de tablas de contingencia y las medidas de asociacin slo se calculan para las tablas de doble clasificacin. Si especifica una fila, una columna y un factor de capa (variable de control), el procedimiento Tablas de contingencia crea un panel de medidas y estadsticos asociados para cada valor del factor de capa (o una combinacin de valores para dos o ms variables de control). Por ejemplo, si sexo es un factor de capa para una tabla de casado (s, no) en funcin de vida (vida emocionante, rutinaria o aburrida), los resultados para una tabla de doble clasificacin para las mujeres se UTA 29 Ing. M.B.A William Teneda

calculan de forma independiente de los resultados de los hombres y se imprimen en paneles uno detrs del otro. ANALISIS COMBINATORIO Combinacin

Los coeficientes binomiales o combinaciones son una serie de nmeros estudiados en combinatoria que indican el nmero de formas en que se pueden extraer subconjuntos a partir de un conjunto dado. Sin embargo, dependiendo del enfoque que tenga la exposicin, se suelen usar otras definiciones equivalentes. Ejercicios De Combinacin En una clase de 35 alumnos se quiere elegir un comit formado por tres alumnos. Cuntos comits diferentes se pueden formar? C 335 = 35*34*33 3*2*1 A una reunin asisten 10 personas y se intercambian saludos entre todos. Cuntos saludos se han intercambiado? C 210 = Permutacin En matemticas, dado un conjunto finito con todos sus elementos diferentes, llamamos permutacin a cada una de las posibles ordenaciones de los elementos de dicho conjunto. Por ejemplo, en el conjunto {1,2,3}, cada ordenacin posible de sus elementos, sin repetirlos, es una permutacin. Existe un total de 6 permutaciones para estos elementos: "1,2,3", "1,3,2", "2,1,3", "2,3,1", "3,1,2" y "3,2,1". La nocin de permutacin suele aparecer en dos contextos:

= 6545

10*9 2

= 45

Como nocin fundamental de combinatoria, centrndonos en el problema de su recuento. En teora de grupos, al definir nociones de simetra. 30

UTA

Ing. M.B.A William Teneda

Ejercicios De Permutaciones Cuntos nmeros de 5 cifras diferentes se puede formar con los dgitos: 1, 2, 3, 4, 5.? m=5 n=5

P5= 5! = 5*4*2*3*1 = 120 Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; cuntos nmeros de nueve cifras se pueden formar? m=9 a=3 b=4 c=2 a+b+c=9 S entran todos los elementos. S importa el orden. S se repiten los elementos.

ESPACIO MUESTRAL Y SUCESOS Experimentos, espacios mustrales y sucesos La teora de las probabilidades trata formalmente de experimentos y de sus resultados donde el trmino experimento se usa en el sentido ms general. Se denomina espacio muestral la coleccin de todos los posibles resultados de un experimento. Los elementos del conjunto S de este espacio se denominan puntos muestrales, cada uno de ellos asociado con uno y slo un resultado distinto. La precisin para distinguir resultados es cosa de criterio y depender en la prctica de la utilizacin que se har del modelo. Ejemplo. Un experimento consiste en lanzar una moneda y despus lanzarla una segunda vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez. Para listar los elementos del espacio muestral que proporcione la mayor informacin, construimos el diagrama de rbol de la figura 2.1. Las diversas trayectorias a lo largo de las ramas del rbol dan los distintos puntos mustrales. Al comenzar con la rama superior izquierda y movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesivos de la moneda. Asimismo, el punto muestral T3 indica la posibilidad.

UTA

31

Ing. M.B.A William Teneda

VALOR ESPERADO O ESPERANZA

Si P es la probabilidad de xito de un suceso en un solo ensayo, el numero esperado o esperanza de ese suceso en N ensayos, estar dado por el producto de N y la probabilidad de xito P.

E = n.p(x)
Ejemplo. En el lanzamiento 900 veces de dos dados, Cul es la esperanza de que la suma de sus caras de un valor menor de 6.? Probabilidad de xito de un solo ensayo. (1,1) (1,2) (2,1) (2,2) (2,3) (3,2) (3,1) (1,3) (4,1) (4,4) p(x): 10/36 E=np=900*(10/36)=9000/36= 250 La esperanza o valor esperado es de que 250 de los 900 lanzamientos, la suma de sus caras sea menor de 6 n=900

DISTRIBUCION BINOMIAL

Procesos de Bernoulli: Un proceso de Bernoulli es una serie de n experimentos aleatorios que verifican: Cada experimento tiene dos resultados posibles, que se llaman xito y fracaso. La probabilidad p de xito es la misma en cada experimento, y esta probabilidad no se ve afectada por el conocimiento de los resultados anteriores. La probabilidad q de fracaso viene dada por q = 1 - p. UTA 32 Ing. M.B.A William Teneda

Ejemplos : Una moneda lanzada al aire 15 veces. Los dos resultados posibles son cara y cruz. La probabilidad de cara en un lanzamiento es 1/2 Se pregunta a 200 alumnos de de un Instituto de Enseanza Secundaria si estudian Francs. Los dos resultados posibles son s y no. Si se considera xito la respuesta s, la probabilidad p de xito indica la proporcin de estudiantes del Instituto que responden s (estudian francs, pues suponemos que no mienten). Tirar un dado de seis caras 10 veces y considerar que el resultado de una tirada, es que salga un nmero par o un nmero impar. Los resultados posibles en este caso son par e impar. El espacio muestral, cada uno de los sucesos y la probabilidad de que ocurran, en un proceso de Bernoulli, aparecen muy ntidamente cuando se construye un rbol de probabilidades del proceso. Por ejemplo vamos a construir el rbol de probabilidades de un proceso de Bernoulli de tres experimentos:

El espacio muestral del proceso est formado por cada uno de los caminos del rbol de probabilidades. La probabilidad de un camino, por ejemplo, del camino : EFE es :

Si en un proceso de Bernouilli asignamos el valor 1 al xito y 0 al fracaso y consideramos el valor Sj , suma de todos los valores de un resultado concreto (un camino) con j xitos ; la probabilidad que corresponde a cada valor de la variable Sj es : UTA 33 Ing. M.B.A William Teneda

Ejercicios De Distribucin Binomial La probabilidad de xito de una determinada vacuna es 0,72. Calcula la probabilidad a) b) de a que una vez sufra sufran administrada la la a 15 pacientes: enfermedad enfermedad

Ninguno Todos

c) Dos de ellos contraigan la enfermedad Solucin : Se trata de una distribucin binomial de parmetros B(15, 0'72)

DISTRIBUCIN DE POISSON En teora de probabilidad y estadstica, la distribucin de Poisson es una distribucin de probabilidad discreta. Expresa la probabilidad de un nmero k de eventos ocurriendo en un tiempo fijo si estos eventos ocurren con una tasa media conocida, y son independientes del tiempo desde el ltimo evento. La distribucin fue descubierta por Simon-Denis Poisson (17811840) que public, junto con su teora de probabilidad, en 1838 en su trabajo Recherches 34

UTA

Ing. M.B.A William Teneda

sur la probabilit des jugements en matires criminelles et matire civile ("Investigacin sobre la probabilidad de los juicios en materias criminales y civiles"). El trabajo estaba enfocado en ciertas variables aleatorias N que cuentan, entre otras cosas, un nmero de ocurrencias discretas (muchas veces llamadas "arribos") que tienen lugar durante un intervalo de tiempo de duracin determinada. Si el nmero esperado de ocurrencias en este intervalo es , entonces la probabilidad de que haya exactamente k ocurrencias (siendo k un entero no negativo, k = 0, 1, 2, ...) es igual a:

dnde

e es el base del logaritmo natural (e = 2.71828...), k! es el factorial de k, k es el nmero de ocurrencias de un evento, es un nmero real positivo, equivalente al nmero esperado de ocurrencias durante un intervalo dado. Por ejemplo, si los eventos ocurren de media cada 4 minutos, y se est interesado en el nmero de eventos ocurriendo en un intervalo de 10 minutos, se usara como modelo una distribucin de Poisson con = 2.5. Ejercicios De Distribucin De Poisson

1.

Si un banco recibe en promedio 6 cheques sin fondo por da, cules

son las probabilidades de que reciba, a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos? Solucin: a) x = variable que nos define el nmero de cheques sin fondo que llegan al

banco en un da cualquiera = 0, 1, 2, 3, ....., etc, etc. l = 6 cheques sin fondo por da e = 2.718

UTA

35

Ing. M.B.A William Teneda

b) x= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das consecutivos = 0, 1, 2, 3, ......, etc., etc. l = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos Nota: l siempre debe de estar en funcin de x siempre o dicho de otra forma, debe hablar de lo mismo que x.

2.

En la inspeccin de hojalata producida por un proceso electroltico

continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfeccin en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando ms una imperfeccin en 15 minutos. Solucin: a) x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc. l = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata

b)

x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc. l = 0.2 x 5 =1 imperfeccin en promedio por cada 5 minutos en la hojalata UTA 36 Ing. M.B.A William Teneda

=1-(0.367918+0.367918) = 0.26416 c) x = variable que nos define el nmero de imperfecciones en la hojalata

por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc. l = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata

= 0.0498026 + 0.149408 = 0.1992106 .

DISTRIBUCIN NORMAL

La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y .

Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, tal y como se muestra en la Figura 2, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en 37

UTA

Ing. M.B.A William Teneda

torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: 1. Tiene una nica moda, que coincide con su media y su mediana. 2. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El

rea total bajo la curva es, por tanto, igual a 1. 3. Es simtrica con respecto a su media . Segn esto, para

este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. 4. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( Cuanto mayor sea densidad. 5. El rea bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor . 6. La forma de la campana de Gauss depende de los parmetros y (Figura 3). La media indica la posicin de la comprendido en el intervalo ).

, ms aplanada ser la curva de la

la campana, de modo que para diferentes valores de

grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de ,

ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica,

UTA

38

Ing. M.B.A William Teneda

por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.

Ejemplo 1: Utilizando la tabla del rea bajo la curva normal, plantearemos algunos problemas que servirn de modelo. a.- para Z = 1.5 y Z = -.1.4 Z = 1.5 la tabla da : 0.4332 Z = 1.4 la tabla da : 0.4192

P(-1.4 < Z < 1.5) = 0.4332+0.4192 = 0.8524 P = 85.24%

b.- si se plantea P( Z < 1.5 corresponden al siguiente grfico: 0.5000+0.4232 = 0.9332 = 93.32%

UTA

39

Ing. M.B.A William Teneda

c.- otro problema seria P(Z > 1.5) = ? 0.5000-0.4332 = 0.0668 = 6.68%

DISTRIBUCIONES t DE STUDENT El lector sabe cmo hacer deducciones acerca de la mayora de la poblacin si cabe suponer que la distribucin muestral de las medias es normal. Sin embargo, cabe preguntarse qu puede hacerse si se desconoce y n es pequea, de modo que no puede hacerse esta suposicin de normalidad. Contestaremos a esta pregunta en el presente captulo. Se encontrar una familia de distribuciones t(una distinta para cada valor de n), pero no se toma, porque pronto se descubrir que, conforme n aumenta, la distribucin t correspondiente se asemeja mucho a la distribucin normal, e incluso cuando n es pequea, se aplica una distribucin tefe la misma manera en que se hace con una distribucin normal. Se aprender cundo utilizar puntuaciones i y cundo utilizar puntuaciones z y cmo emplear puntuaciones t, para una media de la poblacin y para diferencias en las medias de dos poblaciones. Por ltimo, se descubrir cmo tratar puntuaciones apareadas en muestras que no son independientes. Caractersticas De Las Distribuciones t Las distribuciones t de Student tienen las siguientes caractersticas: 1. No hay slo una distribucin t sino una distribucin distinta para cada valor den. Hay una curva normal estndar, y un cuadro de una pgina puede dar reas debajo de esta curva para la mayor parte de los valores de z que nos 40

UTA

Ing. M.B.A William Teneda

interesan. Hay toda una familia de curvas t "estndar". Si se formara un cuadro para las reas debajo de la curva t para cada n (equivalente al cuadro para las reas debajo de la curva normal estndar), se necesitara todo un volumen. Los cuadros t sern muy abreviados. 2. Cada curva t es simtrica a los lados de 0. E-lo significa que la mitad derecha de la curva t tiene este aspecto

Y la mitad izquierda es una imagen en espejo; la curva entera tendr este aspecto:

A causa de lo anterior, la media de toda distribucin f es 0. 3. El punto ms alto de la curva ocurre cuando t = 0. 4. Al aumentar n, la curva t se acerca cada vez ms a la curva normal. Es fcil advertir lo anterior considerando algunas grficas superpuestas:

Si n es de 30, o ms, la distribucin t y la distribucin normal estndar estn lo suficientemente cercanas de modo que las reas abajo de esta ltima pueden utilizarse como aproximacin a las reas debajo de la primera. Esta cercana 41

UTA

Ing. M.B.A William Teneda

de las curvas f y z para valores altos de n es lo que justifica el empleo de la ecuacin s/Vn como aproximacin de x cuando n es grande y se desconoce

5. Cada distribucin t es una distribucin de probabilidad; esto es: el rea debajo de toda la curva es una, y la probabilidad de que una puntuacin t est entre a y b es igual a rea debajo de la curva entre las lneas t = a y t = b. CUANDO SE USA UNA DISTRIBUCIN t? La distribucin t se usa en las siguientes circunstancias: a) La poblacin tiene distribucin normal y, b) Se desconoce o- (pero se conoce s o puede calcularse) y c) n 30. Si la poblacin no tiene distribucin normal, se cometer un error. Qu tan grande es el error? Depende de qu tan lejos est la poblacin de la distribucin normal. Si es casi normal, el error ser pequeo. Si est muy lejos de ser normal, la distribucin t es casi intil. En la prctica, el problema es que a menudo se desconoce si la poblacin sigue o no una curva normal.

GRADOS DE LIBERTAD Cmo se usa una distribucin t? Antes de continuar, debemos desviarnos un momento para explicar los grados de libertad. Imaginemos tres nios que juegan un juego muy sencillo; a saber: tres cartas estn marcadas, 0, 10 y 20 respectivamente. Se barajan las cartas y cada nio por turno toma una. Jaime es impulsivo y toma una carta en primer lugar; tiene 10 puntos. Mara elige en seguida y obtiene 0. Toms toma la ltima carta y debe tener 20 puntos. Sin embargo, si Jaime sac la carta 0 y Mara la carta 20, Toms sacar la carta 10. El punto es que, una vez que dos nios han elegido su carta, la tercera est fija. Dos de los nios eligieron libremente: hay dos grados de libertad.

UTA

42

Ing. M.B.A William Teneda

Sin puntuaciones tienen media X, n -1 puede elegirse libremente y la ltima es regida; hay n -1 grados de libertad. Para encontrar un intervalo de confianza o poner a prueba una hiptesis acerca de la media valindose de la distribucin f para una muestra de dimensin n, el nmero de grado de libertad es n - 1. La letra D se utiliza para denotar el nmero de grados de libertad. D=n-1 DISTRIBUCION JI CUADRADO En primer lugar, conzcase la letra griega x (ji); no hay equivalente en castellano, pero fonticamente corresponde a ji. La veremos nicamente en la forma x2 y nos referiremos a distribuciones de ji cuadrada o pruebas de ji cuadrada. Se han conocido varias familias de distribuciones de probabilidad; a saber: distribuciones binomial, normal y. Ahora se conocer otra familia de distribuciones de probabilidad; al igual que con las distribuciones t, habr una distribucin x2 diferente para cada nmero de grados de libertad. Antes de conocer a fondo una distribucin x2 veamos un problema en el cual se necesita.

Ejemplo 1. Estudios efectuados en 1950 comprobaron que, entre todos los varones con 30 aos de edad, 20 por 100 haban cursado la escuela superior, 50 por 100 tenan certificado de escuela secundaria pero no de escuela superior, y 30 por 100 no haban llegado a la escuela secundaria. La distribucin de la poblacin actual es semejante? Se efecta un estudio de 1 000 varones tomados aleatoriamente de quienes hoy tienen 30 aos de edad, y se descubre que 250 se han graduado en colegio superior, 520 en escuela secundaria y 230 no han terminado la secundaria. Hgase una prueba a nivel de significacin de .01. H: No hay cambio en la distribucin entre 1950 y la actualidad. (Advirtase que Ho es un supuesto no acerca de la media ola proporcin de una poblacin, sino acerca de la distribucin global de una poblacin.) H1: La poblacin actual (esto es: todos los varones que en la actualidad tienen 30 aos de edad) posee distribucin distinta que la poblacin en 1950. Sea Ola letra 0, no el nmero 0 abreviatura de frecuencia Observada (en ~a actualidad) y E denote frecuencia Esperada. Si no hay cambio en la distribucin entre 1950, y la actualidad, los datos proporcionados pueden 43

UTA

Ing. M.B.A William Teneda

presentarse de la manera siguiente: O Graduados de colegio superior Graduados de escuela secundaria No graduados de escuela secundaria Total de graduados 250 520 230 1000 E 200 500 300 100

En 1950, 20 por 100 tenan estudios superiores. En consecuencia, caba esperar que en una muestra de 1 000,20 por 100 200 varones fuesen graduados de colegio superior, 50 por 100 500 varones hubiesen terminado la escuela secundaria, y 30 por 100 300 no hubiesen terminado la secundaria. Advirtase que comenzamos escalando la columna E de modo que la suma sea igual a la de la columna 0. Es inadecuado expresar la columna O en nmeros de varones (total 1 000) y la columna E en porcentajes o proporciones (total 1006 1, respectivamente). Las dos columnas deben sumar el nmero total de cifras en la muestra. Ahora debe hacerse una decisin de eleccin: qu debe utilizarse como requisito para aceptar o rechazar H(OE) describe la diferencia entre las dos distribuciones? Pero (0 E) = 0E = n n=0. 0, como se muestra en la columna OE que sigue, 50+20-70 = 0.

O Graduados superior Graduados de secundaria No graduados de secundaria Total de graduados de escuela 250 520 230 1000

O-E

(O

200 500 200 1000

50 20 -70 0

2500 400 4900

E)2

(O E)2 /E 12.5 8 16.3 29.6

7800

Recuerda que al explicar medidas de variabilidad consideramos

ltimo

result que(X) siempre es igual a 0? Despus ensayamos (x-)2 y por


(x )2 n

(x x) n

pero

la varianza.

En consecuencia, en este caso podemos advertir si (0-E)2 manifiesta la diferencia entre las dos distribuciones. (0-E)2 = O nicamente si hay ajuste UTA 44 Ing. M.B.A William Teneda

perfecto entre las frecuencias observada y esperada, y puede ser muy grande si no concuerdan. En lugar de limitarnos a usar (0-E)2 empleamos (0-E)2/E. El motivo de lo anterior es que una partida grande en la columna (0-E) 2es ms perturbadora si proviene de una categora con frecuencia esperada o calculada pequea que si la frecuencia esperada es grande, de manera que en el primer caso presenta mayor ponderacin. Una anotacin de 2500 en la columna (0-E)2 se convierte en 12.5 si la frecuencia esperada E es 200, pero ser slo 5.0 si la frecuencia esperada es 500, y 2.5 si la frecuencia esperada o calculada en la categora es 1 000. Ahora definiremos x2:

x2 =

(0E)2 E

3.3 Trmino y Conceptos claves


Definicin: El conjunto de todos los resultados posibles de un experimento estadstico se llama espacio muestral y se representa con el smbolo S. HIPOTESIS ESTADSTICAS Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la poblacin implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas. Son, en general, enunciados acerca de las

distribuciones de probabilidad de las poblaciones. Hiptesis nula En muchos casos formulamos una hiptesis estadstica con el nico propsito de rechazarla o invalidarla. As, si queremos decidir si una moneda est trucada, formulamos la hiptesis de que la moneda es buena (o sea, p = 0.5, donde p es la probabilidad de cara). Anlogamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea, que cualquier diferencia observada se debe

UTA

45

Ing. M.B.A William Teneda

simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se denotan Ho Hiptesis alternativa Toda hiptesis que difiera de una dada se llamar una hiptesis alternativa. Por ejemplo, si una hiptesis es p = 0.5, hiptesis alternativas podran ser p = 0.7, p 0.5 o p > 0.5. Una hiptesis denotar por H1. alternativa a la hiptesis nula se

ERRORES DE TIPO I Y DE TIPO II Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha cometido un error Tipo I. Por otra parte, si aceptamos una hiptesis que debiera ser rechazada, diremos que se ha cometido un error de Tipo II. En ambos casos, se ha producido un juicio errneo. Para que las reglas de decisin (o contrastes de hiptesis) sean buenas, deben disearse de modo que minimicen los errores de la decisin. Y no es una cuestin sencilla, porque para cualquier tamao de la muestra, un intento de disminuir un tipo de error suele ir acompaado de un crecimiento del otro tipo. En la prctica, un tipo de error puede ser ms grave que el otro, y dbil alcanzarse un compromiso que disminuya el error ms grave. La nica forma de disminuir ambos al la vez es aumentar el tamao de la muestra, que no siempre es posible.

Tipos de errores Definicin.- El rechazo de la hiptesis nula cuando es verdadero se llama error de tipo 1 Definicin.-No rechazarla hiptesis nula cuando es falsa se llama error de tipo 2

UTA

46

Ing. M.B.A William Teneda

Cmo sabremos si est cometiendo un error de tipo I o de tipo II? Examinar la lgica de la influencia estadstica. Cmo saber si hemos rechazado o no una hiptesis nula

equivocadamente? Coleccionar muestras y extraemos inferencias de las mismas nica y exclusivamente. No hay manera entonces de saber qu experimentos proporcionan resultados adecuados y cules no? La respuesta es si. Si tuviramos que repetir el experimento y obtener resultados parecidos tendramos mayor confianza de no estar cometiendo un error de tipo I

3.4 Preguntas y Problemas Claves


1. Defina cada uno de los conceptos de la seccin "trminos importantes".

2. Supongamos que se cumplen los supuestos fundamentales de la prueba t. Cules son las caractersticas de la distribucin muestral de t?

3. Explique lo que significa grados de libertad. Proponga un ejemplo.

4. Cules son los supuestos fundamentales para el uso apropiado de la prueba t?

5. Analice las semejanzas y las diferencias entre las pruebas z y t.

6. Explique brevemente por qu la prueba z es ms poderosa que la prueba t.

UTA

47

Ing. M.B.A William Teneda

7. Cul de las siguientes afirmaciones es ms correcta desde el punto de vista tcnico? 1) Tenemos el 95% de confianza de que la media de la poblacin se encuentra en el intervalo 80-90, o bien, 8. 2) tenemos el 95% de confianza de que el intervalo 80-90 contiene la media de la poblacin. Explique.

9. Explique por qu gl = N - 1 cuando se utiliza la prueba t con una sola muestra.

10. Si el coeficiente de correlacin de una muestra tiene un valor diferente de cero (por ejemplo, r = 0.45), esto significa automticamente que la correlacin en la poblacin tambin es diferente de cero. Es correcta esta afirmacin? Explique.

11. Con el mismo conjunto de datos mustrales, el intervalo de confianza de 99% para la media poblacional es mayor o menor que el intervalo de confianza de 95% ? Le parece a usted lgico? Explique.

12. Un conjunto muestral de 30 datos tiene una media de 82 y una desviacin estndar de 12. Podemos rechazar la hiptesis de que se trata de una muestra aleatoria, extrada de una poblacin normal con = 85? Utilice = 0.012colas Para tomar su decisin, otra

__

13. Es razonable considerar una muestra con N = 22, X

obt

= 42 y s = 9 como una Utilice =

muestra aleatoria extrada de una poblacin normal con =38?


__

0.05

1 cola

para tomar su decisin. Suponga que X

obt

est en la direccin

correcta, otra

14. En cada una de las siguientes muestras aleatorias, determine los intervalos de confianza de 95 y el 99% para la media poblacional:
__

i. ii.

X
__

obt

= 25, s = 6, N = 15 = 120, s = 8, N = 30 48

obt

UTA

Ing. M.B.A William Teneda

__

iii.

obt

= 30.6, s = 5.5, N = 24

iv. Vuelva a resolver la parte a con N = 30. Qu ocurre con el intervalo de confianza cuando N crece? Otra

15. Supongamos que se desconoce la desviacin estndar poblacional del problema 21 del captulo 12, pgina 291. Utilice de nuevo = 0.052 Colas, Qu podra concluir con respecto a la tcnica de la estudiante? Explique la diferencia entre la conclusin del problema 21 y la de este problema, clnica, salud.

16. si una variable aleatoria tiene distribucin normal estndar, calcula la probabilidad de que tome un valor: (a) menor que 1.50; (c) mayor que -1.175; (b) mayor que 2.16;

17. escriba el valor de z si la probabilidad de que una variable aleatoria de distribucin normal estndar tome un valor: (a) menor que z es 0.9911; (c) mayor que z es 0.6443; e) entre z y z es 0.9298 (b) mayor que z es 0.1093; (d) menor que z es 0.0217

18. una variable aleatoria tiene una distribucin normal con = 62.4hallar

su

desviacin estndar si la probabilidad de que tome un valor mayor que 79.2 es verifica que z0.005=2.575 z0.025=1.96

3.5 Bibliografa Complementaria


Robert Pagano. Estadstica Para Las Ciencias Del Comportamiento 7 Edicin. Editorial Thomson. Impreso En Litograf Nueva poca. Enero 2006, Mxico Df

UTA

49

Ing. M.B.A William Teneda

Estadstica De Gilbert. Editorial Interamericana Impreso En Mxico 1980. Primera Edicin Estadstica De Schaum. Segunda Edicin. Editorial Mcgraw Hill. Ronald E. Walpole, Raymond H. Myers. Probabilidad Y

Estadstica. Editorial: 2007 Pearson Education De Mexico Jack R. Benjamin. Probabilidad Y Estadistica. Editorial: 1981 McgrawHill Latinoamericana Editores S.A De C.V. Probabilidad Y Estadistica. William Navidi. Editorial: Mcgraw

Hill/Interamericana Editores S.A De C.V. Edicon 2006. Probabilidad Y Estadistica. Autor: J. Susan Milton Y Jesse C. Arnold. Editorial: Mcgraw Hill/Interamericana Editores S.A De C.V. Octava Edicin. Ronald E.; Raymond H. Probabilidad Y Estadstica Para Ingeniera Y Ciencias. Editorial: Pearson Educacin Printed In Mxico. Ao: Octava Edicin 2007. Ciro Matnez Bencardino. Estadstica Bsica, Probabilidad Y Estadstica. Editorial: Ecoe Ediciones. Quinta Edicin ,Agosto De 1990. Estadistica de Inferencia. Hctor Anbal Saltos.

UTA

50

Ing. M.B.A William Teneda

Você também pode gostar