Você está na página 1de 886

Estadstica aplicada a los

negocios y la economa

Estadstica aplicada a los

negocios y la economa
Decimotercera edicin

Douglas A. Lind
Coastal Carolina University and University of Toledo

William G. Marchal
The University of Toledo

Samuel A. Wathen
Coastal Carolina University

Revisin tcnica
Ofelia Vizcano Daz Departamento de Matemticas Instituto Tecnolgico y de Estudios Superiores de Monterrey, Campus Ciudad de Mxico Enrique Cuevas Rodrguez Centro Universitario de Ciencias Econmico Administrativas (CUCEA) Universidad de Guadalajara Gilberto Prieto Morn Divisin de Estudios de Posgrado Facultad de Contadura y Administracin Universidad Nacional Autnoma de Mxico Margarita Orozco Gmez Instituto Tecnolgico y de Estudios Superiores de Monterrey, Campus Guadalajara

MXICO AUCKLAND BOGOT BUENOS AIRES CARACAS GUATEMALA LISBOA LONDRES MADRID MILN MONTREAL NUEVA DELHI NUEVA YORK SAN FRANCISCO SAN JUAN SAN LUIS SANTIAGO SO PAULO SIDNEY SINGAPUR TORONTO

Director Higher Education: Miguel ngel Toledo Castellanos Director editorial: Ricardo A. del Bosque Alayn Editor sponsor: Jess Mares Chacn Editora de desarrollo: Marcela Rocha Martnez Supervisor de produccin: Zeferino Garca Garca Traduccin de: Jorge Yescas y Javier Len Crdenas ESTADSTICA APLICADA A LOS NEGOCIOS Y LA ECONOMA Decimotercera edicin Prohibida la reproduccin total o parcial de esta obra, por cualquier medio, sin la autorizacin escrita del editor.

DERECHOS RESERVADOS 2008 respecto a la tercera edicin en espaol por McGRAW-HILL/INTERAMERICANA EDITORES, S. A. de C. V. A Subsidiary of The McGraw-Hill Companies, Inc. Prolongacin Paseo de la Reforma 1015, Torre A, Pisos 16 y 17, Colonia Desarrollo Santa Fe, Delegacin lvaro Obregn C. P. 01376, Mxico, D. F. Miembro de la Cmara Nacional de la Industria Editorial Mexicana, Reg. Nm. 736 ISBN 13: 978-970-10-6674-4 ISBN 10: 970-10-6674-X (ISBN: 970-10-4834-2 de la edicin anterior) Traducido de la decimotercera edicin en ingls de la obra Statistical Techniques in Business and Economics by Douglas A. Lind, William G. Marchal, and Samuel A. Wathen Copyright 2008 by McGraw-Hill/Irwin. All rights reserved. 007-303022-8 0123456789 Impreso en Mxico 09765432108 Printed in Mexico

Para Jane, mi esposa y mejor amiga; y para nuestros hijos, sus esposas y nuestros nietos: Mike y Sue (Steve y Courtney), Steve y Kathryn (Kennedy) y Mark y Sarah (Jared, Drew y Nate). Douglas A. Lind

Para Elizabeth y William, los miembros ms recientes de nuestra familia. William G. Marchal

A mi maravillosa familia: Isaac, Hannah y Barb. Samuel A. Wathen

Prefacio
El objetivo de Estadstica aplicada a los negocios y la economa es proporcionar a los estudiantes de administracin, marketing, nanzas, contabilidad, economa y otros campos de la administracin de negocios un estudio introductorio de las diversas aplicaciones de la estadstica descriptiva y de la estadstica inferencial. Aunque nos concentramos en las aplicaciones a los negocios, tambin incluimos problemas y ejemplos orientados al estudiante que no requieren cursos anteriores. La primera edicin de esta obra se public en 1967. En esa poca la localizacin de datos relevantes relacionados con los negocios resultaba difcil. Eso ha cambiado, ahora no constituye un problema. La cantidad de artculos que compra en la tienda de comestibles queda registrada automticamente en la caja. Las compaas telefnicas registran el tiempo y la distancia de nuestras llamadas, y el nmero de la persona a la que llamamos. Las compaas de tarjetas de crdito conservan informacin sobre la cantidad, tiempo, fecha y suma de nuestras compras. Los dispositivos mdicos monitorean automticamente nuestro ritmo cardiaco, presin sangunea y temperatura. Una gran cantidad de informacin de negocios se registra y presenta en forma casi instantnea. CNN, USA Today y MSNBC, por ejemplo, cuentan con sitios web donde es posible revisar precios de almacn en menos de veinte minutos. Hoy da se requiere habilidad para manejar grandes volmenes de informacin. Primero necesitamos ser consumidores crticos de la informacin que otros presentan. Segundo, necesitamos ser capaces de reducir grandes cantidades de informacin en forma concisa y signicativa para hacer interpretaciones, juicios y tomar decisiones efectivas. Todos los estudiantes cuentan con calculadoras o computadoras personales, o tienen acceso a stas en un laboratorio de la universidad. Dichas computadoras incluyen software de estadstica, como Microsoft Excel y MINITAB. En una seccin especial, al nal de cada captulo, aparecen los comandos necesarios para obtener resultados del software. Dentro de los captulos incluimos pantallas con los datos capturados de tal manera que el estudiante se familiarice con la naturaleza de los resultados. Como consecuencia de la disponibilidad de computadoras y software, no es necesario entretenerse en los clculos. Hemos sustituido muchos ejemplos que requieren clculos con problemas de interpretacin para ayudar al estudiante a entender e interpretar los resultados estadsticos. Adems, hemos puesto mayor enfoque en la naturaleza conceptual de los estadsticos. Al hacer estos cambios, presentamos, tanto como sea posible, los conceptos fundamentales, con ejemplos que los sustentan. La decimotercera edicin de Estadstica aplicada a los negocios y la economa es resultado de la colaboracin de diversas personas: estudiantes, colegas, revisores y del personal de McGraw-Hill/Irwin. A todos les agradecemos. Deseamos expresar nuestra sincera gratitud a los participantes del grupo de reconocimiento y enfoque, y a los siguientes revisores: Revisores Sung K. Ahn Washington State University-Pullman Pamela A. Boger Ohio University-Athens Giorgio Canarella California State University-Los ngeles Anne Davey Northeastern State University Nirmal Devi Embry Riddle Aeronautical University Clifford B. Hawley West Virginia University Lloyd R. Jaisingh Morehead State University John D. McGinnis Pennsylvania State-Altoona Mary Ruth J. McRae Appalachian State University Jackie Miller Ohio State University Elizabeth J.T. Murff Eastern Washington University

vii

viii

Prefacio

Ren Ordoez Southern Oregon University Joseph Petry University of Illinois en Urbana, Champaign Michael Racer University of Memphis Darrel Radson Drexel University Christopher W. Rogers Miami Dade College Stephen Hays Russell Weber State University Martin Sabo Community College of Denver Amar Sahay Salt Lake Community College y University of Utah Nina Sarkar Queensborough Community College

Gary Smith Florida State University Stanley D. Stephenson Texas State University, San Marcos Lawrence Tatum Baruch College Daniel Tschopp Daeman College Jesus M. Valencia Slippery Rock University Joseph Van Matre University of Alabama en Birmingham Kathleen Whitcomb University of South Carolina Blake Whitten University of Iowa Oliver Yu San Jose State University

Participantes del grupo de reconocimiento y enfoque Nawar Al-Shara American University Charles H. Apigian Middle Tennessee State University Nagraj Balakrishnan Clemson University Philip Boudreaux University of Louisiana at Lafayette Nancy Brooks University of Vermont Qidong Cao Winthrop University Margaret M. Capen East Carolina University Robert Carver Stonehill College Jan E. Christopher Delaware State University James Cochran Louisiana Tech University Farideh Dehkordi-Vakil Western Illinois University Brandt Deppa Winona State University Bernard Dickman Hofstra University Casey DiRienzo Elon University Erick M. Elder University of Arkansas at Little Rock Nicholas R. Farnum California State University, Fullerton K. Renee Fister Murray State University Gary Franko Siena College Maurice Gilbert Troy State University Deborah J. Gougeon University of Scranton Christine Guenther Pacic University Charles F. Harrington University of Southern Indiana Craig Heinicke Baldwin-Wallace College Geoge Hilton Pacic Union College Cindy L. Hinz St. Bonaventure University Johnny C. Ho Columbus State University

Prefacio

ix
Timothy J. Schibik University of Southern Indiana Carlton Scott University of California, Irvine Samuel L. Seaman Baylor University Scott J. Seipel Middle Tennessee State University Sankara N. Sethuraman Augusta State University Daniel G. Shimshak University of Massachusetts, Boston Robert K. Smidt California State Polytechnic University William Stein Texas A&M University Robert E. Stevens University of Louisiana en Monroe Debra Stiver University of Nevada, Reno Ron Stunda Birmingham-Southern College Edward Sullivan Lebanon Valley College Dharma Thiruvaiyaru Augusta State University Daniel Tschopp Daemen College Bulent Uyar University of Northern Iowa Lee J. Van Scyoc University of Wisconsin-Oshkosh Stuart H. Warnock Tarleton State University Mark H. Witkowski University of Texas en San Antonio William F. Younkin University of Miami Shuo Zhang State University of New York, Fredonia Zhiwei Zhu University of Louisiana en Lafayette

Shaoming Huang Lewis-Clark State College J. Morgan Jones University of North Carolina en Chapel Hill Michael Kazlow Pace University John Lawrence California State University, Fullerton Sheila M. Lawrence Rutgers the State University of New Jersey Jae Lee State University of New York en New Paltz Rosa Lemel Kean University Robert Lemke Lake Forest College Francis P. Mathur California State Polytechnic University, Pomona Ralph D. May Southwestern Oklahoma State University Richard N. McGrath Bowling Green State University Larry T. McRae Appalachian State University Dragan Miljkovic Southwest Missouri State University John M. Miller Sam Houston State University Cameron Montgomery Delta State University Broderick Oluyede Georgia Southern University Andrew Paizis Queens College Andrew L.H. Parkes University of Northern Iowa Paul Paschke Oregon State University Srikant Raghavan Lawrence Technology University Surekha K.B. Rao Indiana University Northwest

Sus sugerencias y un repaso cuidadoso de la edicin anterior y del original de esta edicin contribuyeron a mejorar el texto. En especial estamos agradecidos con las siguientes personas. El doctor Leonard Presby, de la William Paterson University; Julia Norton, de la California State University; Hayward y Christopher Rogers, del Miami Dade Collage, revisaron el original y las prue-

Prefacio

bas para vericar la precisin de los ejercicios. La profesora Kathleen Whitcom, de la University of South Carolina, prepar la gua de estudio. El doctor Samuel Wathen, de la Coastal Carolina University, elabor el banco de pruebas. El profesor Ren Ordoez, de la Southern Oregon University, prepar la presentacin de PowerPoint. La seora Dense Heban y los autores elaboraron el manual del profesor. Tambin deseamos agradecer al personal de McGraw-Hill/Irwin, entre ellos a Richard T. Hercher, Jr., editor ejecutivo; a Christina Sanders, editora de desarrollo; Zanca Basu, gerente de marketing; James Labeots, gerente de proyecto, y a quienes no conocemos personalmente y que hicieron valiosas contribuciones.

Sumario
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Qu es la estadstica? 1 Descripcin de datos: tablas de frecuencias, distribuciones de frecuencias y su representacin grfica 20 Descripcin de datos: medidas numricas Estudio de los conceptos de la probabilidad Distribuciones discretas de probabilidad Distribuciones de probabilidad continua Estimacin e intervalos de confianza Pruebas de hiptesis de una muestra Pruebas de hiptesis para dos muestras Anlisis de la varianza 406 457 511
Seccin de repaso

55 98
Seccin de repaso

Descripcin de datos: presentacin y anlisis de datos 138 180 222 260 293 330 368

Seccin de repaso

Mtodos de muestreo y teorema de lmite central

Seccin de repaso

Seccin de repaso

Regresin lineal y correlacin Nmeros ndice 569

Anlisis de correlacin y regresin mltiple Series de tiempo y proyeccin 601

Seccin de repaso

Mtodos no paramtricos: aplicaciones de ji cuadrada Mtodos no paramtricos: anlisis de datos ordenados Control estadstico del proceso y administracin de calidad 710 Introduccin a la teora de decisiones MegaStat para Excel Visual Statistics 2.2 Crditos de fotografas ndice 849 761 765 770 848 743

646 670
Seccin de repaso

Apndices, tablas, conjuntos de datos, soluciones

xi

Contenido
Captulo
Histograma 35 37

1 Qu es la estadstica?
Introduccin 2 Qu se entiende por estadstica? Tipos de estadstica 6 Estadstica descriptiva 6 Estadstica inferencial 6 Tipo de variables 8 9 Niveles de medicin 4

1
2

Polgono de frecuencias Ejercicios 39

Por qu se debe estudiar estadstica?

Distribuciones de frecuencia acumulativas 41 Ejercicios 43 44 45 51 Resumen del captulo Ejercicios del captulo ejercicios.com 50 52

Ejercicios de la base de datos Comandos de software

Datos de nivel nominal 10 Datos de nivel ordinal 11 Datos de nivel de intervalo 12 Datos de nivel de razn 12 Ejercicios 14 tica y estadstica 14 14 16 18 Aplicaciones de la computadora

Respuestas a las autoevaluaciones 53

Captulo

3 Descripcin de datos:
medidas numricas
Introduccin 56 57 58 La media poblacional Media de una muestra Ejercicios 60 61 62 62 65 66

Resumen del captulo, Ejercicios del captulo ejercicios.com, Ejercicios de la base de datos Respuestas a las autoevaluaciones 19

55

Propiedades de la media aritmtica 59

Captulo

2 Descripcin de datos:

Media ponderada Ejercicios Mediana Moda 64

tablas de frecuencias, distribuciones de frecuencias y su representacin grfica


Introduccin 21 Construccin de una tabla de frecuencias Frecuencias relativas de clase 22 Representacin grfica de datos cualitativos 23 Ejercicios 27

20
22

Ejercicios

Solucin con software

Posiciones relativas de la media, la mediana y la moda 67 Ejercicios Ejercicios 69 69 71 71 73 73 76 Media geomtrica

Construccin de distribuciones de frecuencias: datos cuantitativos 28 Intervalos de clase y puntos medios de clase Ejemplo con asistencia de software Distribucin de frecuencias relativas Ejercicios 33 Representacin grfica de una distribucin de frecuencias 35 32 33 32

Por qu estudiar la dispersin? Medidas de dispersin Ejercicios Ejercicios 75 78 80 Rango, Desviacin media

Varianza y desviacin estndar Solucin con software

xii

Contenido

xiii
Captulo
81

Ejercicios 81 Interpretacin y usos de la desviacin estndar Teorema de Chebyshev La regla emprica Ejercicios 83 La media y la desviacin estndar de datos agrupados 84 Media aritmtica 84 Desviacin estndar 85 Ejercicios 87 tica e informe de resultados Resumen del captulo ejercicios.com 94 88 90 88 82 81

5 Estudio de los conceptos


de la probabilidad
139 140 142

138

Introduccin

Qu es la probabilidad?

Enfoques para asignar probabilidades Probabilidad clsica 142 Probabilidad emprica 143 Probabilidad subjetiva 144 Ejercicios 146 Algunas reglas para calcular probabilidades 147 Reglas de la adicin Ejercicios 152 153 156 147

Clave de pronunciacin, Ejercicios del captulo Ejercicios de la base de datos, Comandos de software 95 Respuestas a las autoevaluaciones 96

Reglas de la multiplicacin Tablas de contingencias Diagramas de rbol Ejercicios Ejercicios 160 161 165 164 Teorema de Bayes Principios de conteo 158

Captulo

4 Descripcin de datos: presentacin


y anlisis de datos
Introduccin 99 99 100 106 107 Diagramas de puntos Ejercicios 105 Otras medidas de dispersin Ejercicios 109 Diagramas de caja Ejercicios 112 Sesgo 113 Ejercicios 117 Descripcin de la relacin entre dos variables Ejercicios 121 Resumen del captulo 122 123 Clave de pronunciacin, Ejercicios del captulo ejercicios.com, Ejercicios de la base de datos 128 Comandos de software 129 131 Respuestas a las autoevaluaciones Repaso de los captulos 1-4 Glosario Ejercicios 132 133 132 118 110 Cuartiles, deciles y percentiles Grficas de tallo y hojas

98

Frmula de la multiplicacin 165 Frmula de las permutaciones 166 Frmula de las combinaciones 168 Ejercicios 170 170 171 172 Resumen del captulo Clave de pronunciacin Ejercicios del captulo

ejercicios.com, Ejercicios de la base de datos 176 Comandos de software 177 178 Respuestas a las autoevaluaciones

Captulo

6 Distribuciones discretas
de probabilidad
181

180

Introduccin

Qu es una distribucin de probabilidad? 181 Variables aleatorias 183 184 Variable aleatoria discreta, Variable aleatoria continua

Media, varianza y desviacin estndar de una distribucin de probabilidad 185 Media, Varianza y desviacin estndar 185

Casos 136

xiv
Ejercicios 187

Contenido

Distribucin de probabilidad binomial 189 Cmo se calcula una probabilidad binomial? Tablas de probabilidad binomial 192 Ejercicios 196 Distribuciones de probabilidad binomial acumulada 197 Ejercicios 198 Distribucin de probabilidad hipergeomtrica 199 Ejercicios 202 Distribucin de probabilidad de Poisson Ejercicios 208 Covarianza (opcional) Ejercicios 212 Resumen del captulo Ejercicios del captulo 212 213 208 203 190

Ejercicio de la base de datos, Comandos de software 251 Respuestas a las autoevaluaciones 252 Repaso de los captulos 5 a 7 Glosario Ejercicios Casos 253 255 257 253

Captulo

8 Mtodos de muestreo y teorema


del lmite central
Introduccin 261 261 Mtodos de muestreo

260

Ejercicios de la base de datos, Comandos de software 219 Respuestas a las autoevaluaciones 221

Razones para muestrear 261 Muestreo aleatorio simple 262 Muestreo aleatorio sistemtico 265 Muestreo aleatorio estratificado 265 Muestreo por conglomerados 266 Ejercicios 267 269 270 Error de muestreo Ejercicios Ejercicios 273 274 280

Captulo

7 Distribuciones de probabilidad
continua
Introduccin

Distribucin muestral de la media Teorema del lmite central

222
223

La familia de distribuciones de probabilidad uniforme 223 Ejercicios 226 La familia de distribuciones de probabilidad normal 227 Distribucin de probabilidad normal estndar 229 Aplicaciones de la distribucin normal estndar 231 Regla emprica 231 Ejercicios 233 Determinacin de reas bajo la curva normal 233 Ejercicios 236 Ejercicios 239 Ejercicios 241 Aproximacin de la distribucin normal a la binomial 242 Factor de correccin de continuidad 242 Cmo aplicar el factor de correccin 244 Ejercicios 245 Resumen del captulo Ejercicios del captulo 246 247

Uso de la distribucin muestral de las medias 281 Ejercicios 284 284 Resumen del captulo

Clave de pronunciacin, Ejercicios del captulo 285 ejercicios.com, Ejercicios de la base de datos Comandos de software 291 Respuestas a las autoevaluaciones 292 290

Captulo

9 Estimacin e intervalos
de confianza
Introduccin

293

294

Estimadores puntuales e intervalos de confianza de una media 294 Desviacin estndar de la poblacin conocida () 294 Simulacin por computadora 299 Ejercicios 301 Desviacin estndar poblacional desconocida 302

Contenido

xv
Ejercicios 309 312 Error tipo II Ejercicios 356 356 359 359 360 361

Ejercicios 308 Intervalo de confianza de una proporcin Ejercicios 312 Factor de correccin para una poblacin finita Ejercicios 314 Eleccin del tamao adecuado de una muestra 315 Ejercicios 317 Resumen del captulo Ejercicios del captulo ejercicios.com 322 318 319

Resumen del captulo Clave de pronunciacin Ejercicios del captulo

ejercicios.com, Ejercicios de la base de datos 365 Comandos de software 366 367 Respuestas a las autoevaluaciones

Ejercicios de la base de datos, Comandos de software 323 Respuestas a las autoevaluaciones Repaso de los captulos 8 y 9 Glosario Ejercicios Caso 329 326 327 326 325

Captulo

11 Pruebas de hiptesis para


dos muestras
Introduccin 369

368

Pruebas de hiptesis para dos muestras: Muestras independientes 369 Ejercicios 374 Prueba de proporciones de dos muestras 375 Ejercicios 378 Comparacin de medias poblacionales con desviaciones estndares desconocidas (la prueba t conjunta) 379 Ejercicios 384 385 Comparacin de medias poblacionales con desviaciones estndares desiguales Ejercicios 388 Pruebas de hiptesis de dos muestras: Muestras dependientes 388 334 Comparacin de muestras dependientes e independientes 392 Ejercicios 394 395 396 397 403 405 Resumen del captulo Clave de pronunciacin 337 Ejercicios del captulo ejercicios.com 402 404

Captulo

10 Pruebas de hiptesis
de una muestra
Introduccin 331 331

330

Qu es una hiptesis?

Qu es la prueba de hiptesis? 332 Procedimiento de cinco pasos para probar una hiptesis 332 Paso 1: Se establece la hiptesis nula (H0) y la hiptesis alternativa (H1) 333 Paso 2: Se selecciona un nivel de significancia Paso 3: Se selecciona el estadstico de prueba 335 Paso 4: Se formula la regla de decisin 335 Paso 5: Se toma una decisin 336 Pruebas de significancia de una y dos colas

Pruebas para la media de una poblacin: Se conoce la desviacin estndar poblacional 338 Prueba de dos colas Prueba de una cola Ejercicios 344 Prueba de la media poblacional: Desviacin estndar de la poblacin desconocida 345 Ejercicios 349 Solucin con software Ejercicios 352 Pruebas relacionadas con proporciones 353 350 338 342 342

Ejercicios de la base de datos Comandos de software

Respuestas a las autoevaluaciones

Valor-p en la prueba de hiptesis

Captulo

12 Anlisis de la varianza
Introduccin 407 407 La distribucin F Comparacin de dos varianzas poblacionales 408

406

xvi
Ejercicios 412

Contenido

Ejercicios

485

Suposiciones en el anlisis de la varianza (ANOVA) 412 La prueba ANOVA Ejercicios 421 Inferencias sobre pares de medias de tratamiento 422 Ejercicios 425 Anlisis de la varianza de dos vas Ejercicios 430 ANOVA de dos vas con interaccin Grficas de interaccin 432 Prueba de hiptesis para detectar interaccin 433 Ejercicios 436 Resumen del captulo 438 Clave de pronunciacin, Ejercicios del captulo 439 ejercicios.com 447 Ejercicios de la base de datos, Comandos de software 448 Respuestas a las autoevaluaciones 450 Repaso de los captulos 10 al 12 Glosario 451 Ejercicios 452 Casos 456 451 431 426 414

Ms sobre el coeficiente de determinacin 486 Ejercicios 488 Relaciones entre el coeficiente de correlacin, el coeficiente de determinacin y el error estndar de estimacin 489 Transformacin de datos Ejercicios Ejercicios 494 494 497 497 Covarianza (opcional) Resumen del captulo 491

Clave de pronunciacin, Ejercicios del captulo 499 ejercicios.com, Ejercicios de la base de datos 507 Comandos de software 508 510 Respuestas a las autoevaluaciones

Captulo

14 Anlisis de correlacin y regresin


mltiple
Ejercicios

511
512 512

Introduccin

Anlisis de regresin mltiple 516

La ecuacin ajusta bien los datos? 518 Error estndar de estimacin mltiple 518 Tabla ANOVA 520 Coeficiente de determinacin mltiple 521 Coeficiente ajustado de determinacin 522 Ejercicios 458 460 465 523 Inferencias en la regresin lineal mltiple 523 Prueba global: prueba del modelo de regresin mltiple 524 Evaluacin de los coeficientes de regresin individuales 526 Ejercicios 529 Evaluacin de las suposiciones de la regresin mltiple 530 Relacin lineal 531 La variacin en los residuos es igual para valores 532 grandes y pequeos de Y Distribucin de los residuos 533 Multicolinealidad 533 Observaciones independientes 535 Variables independientes cualitativas 536 Regresin por pasos 538 541 Modelos de regresin con interaccin

Captulo

13 Regresin lineal y correlacin


Introduccin 458 Qu es el anlisis de correlacin? Coeficiente de correlacin Correlacin y causa Ejercicios 466 Prueba de la importancia del coeficiente de correlacin 467 Ejercicios 469 Anlisis de regresin 470 Principio de los mnimos cuadrados 470 Trazo de la recta de regresin 473 Ejercicios 475 Error estndar de estimacin Ejercicios 482 Intervalos de confianza e intervalos de prediccin 482 477 480 Suposiciones de la regresin lineal 465 El coeficiente de determinacin

457

Contenido

xvii
Captulo

Ejercicios 543 Resumen del captulo 545 Clave de pronunciacin, Ejercicios del captulo 547 ejercicios.com, Ejercicios de la base de datos Comandos de software 563 564 565 Respuestas a las autoevaluaciones Repaso de los captulos 13 y 14 Glosario Ejercicios 565 566 561

16 Series de tiempo
y proyeccin
Introduccin

601
602

602 602 604 605 605 609

Componentes de una serie de tiempo Tendencia secular Variacin cclica Variacin irregular Promedio mvil Ejercicios 611 612 606 Variacin estacional

Casos 568

Promedio mvil ponderado Tendencia lineal

Captulo

15 Nmeros ndice
Introduccin 570 Nmeros ndice simples

569
570 573 573

Mtodo de los mnimos cuadrados Ejercicios Ejercicios 615 616 618 618 Tendencias no lineales Variacin estacional Ejercicios 624 624

613

Por qu convertir datos en ndices? Elaboracin de nmeros ndice Ejercicios 575 ndices no ponderados 575 Promedio simple de los ndices de precios 575 ndice agregado simple 576 ndices ponderados 577 ndice de precios de Laspeyres 577 ndice de precios de Paasche 578 ndice ideal de Fisher 580 Ejercicios 580 ndice de valores Ejercicios 582 ndices para fines especiales 583 581

Determinacin de un ndice estacional Datos desestacionalizados

619

Uso de datos desestacionalizados para proyeccin 625 Ejercicios Ejercicios 628 628 633 633 634 El estadstico de Durbin-Watson Resumen del captulo Ejercicios del captulo

ejercicios.com, Ejercicios de la base de datos, Comandos de software 641 Respuestas a las autoevaluaciones Repaso de los captulos 15 y 16 Glosario Ejercicios 644 644 642 643

ndice de Precios al Consumidor 584 ndice de Precios al Productor 585 Promedio Industrial Dow Jones (DJIA) 585 ndice S&P 500 586 Ejercicios 587 ndice de Precios al Consumidor 588

Captulo

Casos especiales del ndice de Precios al Consumidor 588 Cambio de la base Ejercicios 593 Resumen del captulo Ejercicios del captulo ejercicios.com 598 599 600 Comandos de software 594 595 591

17 Mtodos no paramtricos:
Introduccin 647

aplicaciones de ji cuadrada
Prueba de bondad de ajuste: frecuencias esperadas iguales 647 Ejercicios 652 Prueba de bondad de ajuste: frecuencias esperadas desiguales 653 Limitaciones de ji cuadrada 655

646

Respuestas a las autoevaluaciones

xviii
Ejercicios 657

Contenido

Captulo
658

Anlisis de tablas de contingencia Ejercicios 662

19 Control estadstico del


Introduccin 711 713 714

Resumen del captulo, Clave de pronunciacin, Ejercicios del captulo 663 ejercicios.com 666 667 668 Ejercicios de la base de datos Comandos de software

proceso y administracin 710 de calidad


Una breve historia del control de calidad 711

Six Sigma

Respuestas a las autoevaluaciones 669

Causas de variacin

Diagramas de diagnstico

715 717

Captulo

18 Mtodos no paramtricos:
Introduccin 671 671 La prueba de los signos Ejercicios 675

Diagramas de Pareto 715 Diagramas de esqueleto de pez

anlisis de datos ordenados

670

Ejercicios

718

Objetivo y tipos de diagramas de control de calidad 718 Diagramas de control para variables Diagramas de rangos 722 719

Uso de la aproximacin normal a la binomial Ejercicios 678 Prueba de hiptesis acerca de una mediana Ejercicios 679

676 678

Situaciones en control y fuera de control 723 Ejercicios 725 726 726 Diagramas de control de atributos

Prueba de rangos con signo de Wilcoxon para muestras dependientes 680 Ejercicios 683 Prueba de Wilcoxon de la suma de rangos para muestras independientes 685 Ejercicios 688 Prueba de Kruskal-Wallis: anlisis de la varianza por rangos 688 Ejercicios 692 Correlacin por orden de rango Ejercicios 696 Resumen del captulo 698 Clave de pronunciacin, Ejercicios del captulo 699 ejercicios.com, Ejercicios de la base de datos 702 Comandos de software 703 Respuestas a las autoevaluaciones 704 Repaso de los captulos 17 y 18 Glosario 706 Ejercicios 707 Casos 708 706 693 Prueba de la significancia para rs 695

Diagrama del porcentaje defectuoso Diagrama de lneas c 729 Ejercicios Ejercicios 731 732 735 735 736 737 740 Muestreo de aceptacin Resumen del captulo Clave de pronunciacin Ejercicios del captulo Comandos de software

Respuestas a las autoevaluaciones 742

Captulo

20 Introduccin a la teora
de decisiones
Introduccin 744 744

743

Elementos de una decisin

Un caso que comprende la toma de decisiones en condiciones de incertidumbre 745 Tabla de pagos 745 Pagos esperados 746 Ejercicios 747 Prdida de oportunidad Ejercicios 749 Prdida de oportunidad esperada 749 748

Contenido

xix

Ejercicios 750 Estrategias mx-mn, mx-mx y mn-mx de arrepentimiento 750 Valor de la informacin perfecta Anlisis de sensibilidad Ejercicios 753 rboles de decisin Resumen del captulo Ejercicios del captulo 754 755 756 752 751

MegaStat para Excel, Visual Statistics2.2 Apndices

761

765 771

Apndice A: Conjuntos de datos Apndice B: Tablas 774

Apndice C: Respuestas a los ejercicios impares de cada captulo 802 Crditos de fotografas ndice 849 848

Respuesta para autoevaluaciones 760

Qu es la estadstica?

1
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Comprender la razn por la que estudia estadstica. 2. Explicar los conceptos de estadstica descriptiva y estadstica inferencial. 3. Distinguir entre una variable cualitativa y una variable cuantitativa. 4. Describir la diferencia entre una variable discreta y una variable continua. 5. Distinguir entre los niveles de medicin nominal, ordinal, de intervalo y de razn.

Usted se encuentra comprando un nuevo reproductor de msica MP3, como el iPod de Apple. Los fabricantes indican la cantidad de canciones que almacena la memoria. Sin embargo, a usted le gustara almacenar los musicales de Broadway, que duran ms, por lo que le gustara calcular cuntos musicales caben en su reproductor MP3. Recogera informacin utilizando una muestra de una poblacin? Por qu razn? (vase ejercicio 8d ) y objetivo 2).

Captulo 1

Introduccin
Hace ms de cien aos, H. G. Wells, escritor e historiador ingls, dijo que algn da el razonamiento cuantitativo sera tan importante para la gran mayora de los ciudadanos como la capacidad de leer. No mencion el rea de los negocios, ya que la Revolucin Industrial apenas iniciaba. No obstante, Wells tena razn. Si bien la experiencia en los negocios, cierta habilidad para hacer pronsticos razonados y la intuicin constituyen atributos fundamentales en los gerentes con xito, los problemas que en la actualidad se presentan en los negocios tienden a ser demasiado complejos como para tomar decisiones slo a partir de estos criterios. Una de las herramientas utilizadas para tomar decisiones es la estadstica. De la estadstica no slo se sirve la gente dedicada a los negocios; en nuestra vida cotidiana tambin aplicamos conceptos estadsticos. Por ejemplo, para comenzar el da, abra la regadera y deje correr el agua unos segundos. Enseguida moje su mano para percatarse si la temperatura es adecuada o decidir si abre ms la llave del agua caliente o la del agua fra. Ahora suponga que est en una tienda comercial y quiere comprar una pizza congelada. Dos marcas tienen un puesto de promocin, y cada una le ofrece una pequea rebanada. Despus de probar, decide cul comprar. En ambos ejemplos, usted toma la decisin y elige lo que har, a partir de una muestra. Las empresas enfrentan situaciones similares. Por ejemplo, Kellogg Company debe garantizar que la cantidad promedio de Raisin Bran en una caja de 25.5 gramos cumpla con la cantidad especicada en la etiqueta. Para hacerlo ja un peso objetivo un poco ms alto que la cantidad que dice en la etiqueta. Las cajas se pesan despus de llenarse. La bscula indica la distribucin de los pesos del contenido por hora, as como la cantidad de cajas desechadas por no cumplir con las especicaciones de la etiqueta en el transcurso de dicha hora. El Departamento de Control de Calidad tambin selecciona de forma aleatoria muestras de la lnea de produccin y verica la calidad del producto y el peso de la caja. Si es signicativa la diferencia entre el peso promedio del producto y el peso objetivo o el porcentaje de cajas desechadas es muy alto, el proceso se ajusta. Alan Greenspan, ex presidente del Departamento de la Reserva Federal de Estados Unidos, conoce y entiende la importancia de las herramientas y tcnicas estadsticas para proporcionar informacin precisa y oportuna que sirva para hacer declaraciones pblicas con la fuerza de movilizar mercados burstiles globales e inuir en la poltica. Al hablar frente al National Skills Summit, el doctor Greenspan dijo: A los trabajadores se les debe preparar no slo con conocimientos tcnicos, sino tambin con la capacidad de crear, analizar y transformar la informacin, as como de relacionarse adecuadamente con otras personas. Es decir, deben ser capaces de separar los hechos de las opiniones y enseguida organizarlos en su forma ms conveniente para analizar la informacin. Como estudiante de administracin o de economa, requerir conocimientos bsicos y habilidad para organizar, analizar y transformar datos, as como para presentar la informacin. En esta obra, aprender las tcnicas y mtodos estadsticos bsicos que mejorarn su destreza para tomar buenas decisiones personales y de naturaleza administrativa.

Por qu se debe estudiar estadstica?


Si revisa el plan de estudios de la universidad, se dar cuenta de que varios programas universitarios incluyen la estadstica. Por qu razn? Cules son las diferencias entre los cursos de estadstica que se imparten en la Facultad de Ingeniera, los Departamentos de Psicologa o Sociologa en la Escuela de Artes Liberales y la Facultad de Administracin? La diferencia principal consiste en los ejemplos que se utilizan. El contenido del curso es el mismo. En la Facultad de Administracin el inters son cuestiones como las utilidades, las horas de trabajo y los salarios. A los psiclogos les importan los resultados de las pruebas, y a los ingenieros la cantidad de unidades que fabrica determinada mquina. No obstante, en los tres casos, el inters se centra en el valor tpico y la variacin que experimentan los datos. Tambin existe una diferencia en el nivel de

Qu es la estadstica?

Ejemplos de por qu se estudia la estadstica

los clculos matemticos requeridos. Un curso de estadstica para ingenieros incluye el clculo. Los cursos de estadstica en las facultades de administracin y pedagoga, por lo general, se imparten desde el punto de vista de las aplicaciones. Si usted ya estudi lgebra en la escuela secundaria, manejar adecuadamente la matemtica que se emplea en el texto. Entonces, por qu se requiere la estadstica en muchas empresas importantes? La primera razn consiste en que la informacin numrica prolifera por todas partes. Revise los peridicos (USA Today), revistas de noticias (Time, Newsweek, U.S. News y World Report), revistas de negocios (BusinessWeek, Forbes), revistas de inters general (People), revistas para mujeres (Ladies, Home Journal o Elle) o revistas deportivas (Sports Illustrated, ESPN The Magazine), y quedar abrumado con la cantidad de informacin numrica que contienen. He aqu algunos ejemplos:  En 2003 el ingreso familiar tpico en Estados Unidos era de $43 318. En el caso de las familias del noreste el ingreso tpico era de $46 742; en la regin central de Estados Unidos de $44 732; en el sur era de $39 823 y en la regin occidental de $46 820. La informacin ms reciente se puede localizar en la pgina http://www. census.gov/hhes/income.  En julio de 2005, Boeing inform la entrega de 155 aeronaves para el periodo del 1 de enero de 2005 al 30 de junio de 2005. Esto represent un total de 113 naves Boeing 737 entregadas durante el periodo, y Southwest Airlines fue el comprador ms importante con 22 aeronaves adquiridas. Verique la informacin ms reciente en la pgina de Boeing www.boeing.com, escriba orders and deliveries (rdenes y entregas) en el recuadro de bsqueda y, de la lista de posibles sitios de la red, seleccione el que ofrezca la informacin ms reciente de rdenes y entregas. A la izquierda de esta pgina aparece una lista del mapa de ubicacin de las rdenes, del cual puede elegir Current Year Deliveries.  USA Today (www.usatoday.com) imprime instantneas, que son el resultado de encuestas llevadas a cabo por diversas agencias de investigacin, fundaciones y por el gobierno federal. Por ejemplo, muchos preeren el correo electrnico en lugar del correo postal. Sin embargo, de acuerdo con una encuesta reciente, el Servicio Postal de Estados Unidos informa que 67% de los adultos sealan que el correo ordinario resulta ms personal que el correo electrnico; 56% indica que les causa placer recibir el correo normal y 55% espera con ansias abrir el correo. Una segunda razn para inscribirse en un curso de estadstica estriba en que las tcnicas estadsticas se emplean para tomar decisiones que afectan la vida diaria. Es decir que stas inuyen en su bienestar. He aqu algunos ejemplos:  Las compaas de seguros utilizan el anlisis estadstico para establecer tarifas de seguros de casas, automviles, de vida y de servicio mdico. Las tablas disponibles contienen clculos aproximados de que a una mujer de 20 aos de edad le queden 60.25 aos de vida; a una mujer de 87 aos le queden 4.56 aos de vida y a un hombre de 50 aos 27.85. Las primas de seguros de vida se establecen con base en estos clculos de expectativas de vida. Estas tablas se encuentran disponibles en www.ssa.gov/OACT/STATS/table4cb.html (este sitio acepta maysculas).  La Agencia de Proteccin del Ambiente est interesada en la calidad del agua del lago Erie, entre otros. Con periodicidad toma muestras de agua para determinar el nivel de contaminacin y mantener la norma de calidad.  Los investigadores mdicos estudian los ndices de curacin de enfermedades mediante la utilizacin de diferentes frmacos y diversos tratamientos. Por ejemplo, cul es el efecto que resulta de operar cierto tipo de lesin de rodilla o de aplicar terapia fsica? Si se ingiere una aspirina cada da, se reduce el riesgo de un ataque al corazn? Una tercera razn para inscribirse radica en que el conocimiento de sus mtodos facilita la comprensin de la forma en que se toman decisiones y proporciona un entendimiento ms claro de cmo le afectan.

Captulo 1

Sin importar el empleo que haya elegido, usted encarar la necesidad de tomar decisiones en las que saber hacer un anlisis de datos resultar de utilidad. Con el n de tomar una decisin informada, ser necesario llevar a cabo lo siguiente: 1. Determinar si existe informacin adecuada o si requiere informacin adicional. 2.  Reunir informacin adicional, si se necesita, de manera que no se obtengan resultados errneos. 3. Resumir los datos de manera til e informativa. 4. Analizar la informacin disponible. 5.  Obtener conclusiones y hacer inferencias al mismo tiempo que se evala el riesgo de tomar una decisin incorrecta. Los mtodos estadsticos expuestos en la obra le proporcionarn un esquema del proceso de toma de decisiones. En suma, existen por lo menos tres razones para estudiar estadstica: 1. Los datos proliferan por todas partes: 2. Las tcnicas estadsticas se emplean en la toma de decisiones que inuyen en su vida: 3. Sin importar la carrera que elija, tomar decisiones profesionales que incluyan datos. Una comprensin de los mtodos estadsticos permite tomar decisiones con mayor ecacia.

Estadstica en accin
Centre su atencin en el ttulo Estadstica en accin. Lea con cuidado para obtener una idea de la amplia gama de aplicaciones de la estadstica en la administracin, economa, enfermera, cumplimiento de la ley, deportes y otras disciplinas. En 2005, Forbes public una lista de los estadounidenses ms ricos. William Gates, fundador de Microsoft Corporation, es el hombre ms rico. Su fortuna se calcula en 46 500 millones de dlares (www.forbes.com). En 2005 las cuatro compaas estadounidenses con mayores ingresos fueron ExxonMobil, General Motors, Ford y Chevron (www.industryweek.com). En Estados Unidos un tpico estudiante graduado de la escuela secundaria gana 1.2 millones de dlares en el transcurso de su vida; un tpico graduado universitario gana dos 2.1 millones de dlares y un tpico posgraduado gana 2.5 millones de dlares (usgovinfo.about.com/ library/weekly(aa072602a. htm).

Qu se entiende por estadstica?


Cul es la denicin de estadstica? Nos topamos con ella en el lenguaje cotidiano. En realidad, posee dos signicados: en su acepcin ms comn, la estadstica se reere a informacin numrica. Algunos ejemplos son el sueldo inicial de los graduados de universidad, el nmero de muertes provocadas por el alcoholismo el ao pasado, el cambio en el promedio industrial Dow Jones de ayer a hoy y la cantidad de cuadrangulares conectados por los Chicago Cubs durante la temporada 2005. En estos ejemplos las estadsticas reeren un valor o un porcentaje. Otros ejemplos incluyen:  El automvil tpico en Estados Unidos viaja 17 858 kilmetros al ao; el autobs, 15 049 kilmetros al ao y el camin, 22 433 kilmetros al ao. En Canad, la informacin correspondiente es de 16 687 kilmetros en el caso de los automviles; de 31 895 en el caso de los autobuses y de 11 264.60 en el caso de los camiones. El tiempo promedio de espera para asesora tcnica es de 17 minutos.  La longitud promedio del ciclo econmico de negocios desde 1945 es de 61 meses. Todos stos constituyen ejemplos de estadsticas. Una coleccin de informacin numrica recibe el nombre de estadsticas. A menudo la informacin estadstica se presenta en forma grca, la cual es til porque capta la atencin del lector e incluye una gran cantidad de informacin. Por ejemplo, la grca 1.1 muestra el volumen y las acciones de Frito-Lay respecto de las principales categoras de papas fritas y botanas en los supermercados de Estados Unidos. Es suciente un vistazo para descubrir que se vendieron cerca de 800 millones de libras de papas fritas y que Frito-Lay vendi 64% del total. Observe, asimismo, que FritoLay posee 82% del mercado de frituras de maz. Como ver, la estadstica tiene un signicado mucho ms amplio que la simple recoleccin y publicacin de informacin numrica. Atienda a la siguiente denicin de estadstica:

ESTADSTICA Ciencia que recoge, organiza, presenta, analiza e interpreta datos con el fin de propiciar la toma de decisiones ms eficaz. Como lo sugiere la denicin, el primer paso en el estudio de un problema consiste en recoger datos relevantes. stos deben organizarse de alguna forma y, tal vez, representarse en una grca, como la grca 1.1. Slo despus de haber organizado los

Qu es la estadstica?

Papas fritas Frituras de tortilla Pretzel 26% Botanas Frituras de maz 0 56% 82% 100 200 300

64% 75%

Frito-Lay Resto de la industria

400

500

600

700

800

Millones de libras

GRFICA 1.1 Volumen y acciones de Frito-Lay en las principales categoras de botanas


en los supermercados de Estados Unidos

datos es posible analizarlos e interpretarlos. He aqu algunos ejemplos de la necesidad de recoger datos.  Los analistas dedicados a la investigacin que trabajan para Merrill Lynch evalan muchas facetas de determinadas acciones antes de hacer una recomendacin de compra o venta. Recogen los datos de ventas anteriores de la compaa y calculan futuras ganancias. Antes de hacer recomendaciones, tambin consideran otros factores, como la demanda mundial prevista de los productos de la compaa, la fuerza de la competencia y el efecto del nuevo contrato con la administracin sindical.  El departamento de marketing de Colgate-Palmolive Co., fabricante de productos de limpieza, tiene la responsabilidad de hacer recomendaciones sobre la posible rentabilidad de un grupo de jabones faciales recin creados, con aromas frutales, como uva, naranja y pia. Antes de tomar la ltima decisin, los promotores de mercado examinarn el producto en diversos mercados. Es decir, los anunciarn y vendern en Topeka, Kansas y Tampa, Florida. A partir de los resultados de esta prueba de marketing en estas dos regiones, Colgate-Palmolive decidir si vende o no los jabones en todo el pas.  El Gobierno est interesado en la situacin actual y en el pronstico de las tendencias econmicas. Por lo que lleva a cabo una gran cantidad de encuestas para determinar la conanza del consumidor y el punto de vista de los administradores en lo que se reere a ventas y produccin para los siguientes doce meses. Los ndices, como el ndice de precios al consumidor (IPC), se elaboran cada mes para calcular la inacin. La informacin acerca de las ventas en tiendas departamentales, programas de vivienda, volumen de acciones y produccin industrial son slo algunos de los cientos de factores que se toman en cuenta al establecer la base de las proyecciones. Los bancos emplean estas proyecciones para determinar su tasa principal de prstamos, y el Departamento de la Reserva Federal las emplea para tomar decisiones sobre el nivel de control que aplicar al suministro de dinero.  Los administradores deben tomar decisiones referentes a la calidad de sus productos o servicios. Por ejemplo, los consumidores se comunican con las compaas de software para solicitar asesora tcnica cuando no pueden resolver algn problema. El tiempo que un consumidor debe esperar para que un asesor tcnico conteste la llamada constituye una medida de la calidad del servicio que se le brinda. Una compaa de software podra establecer un minuto como objetivo del tiempo representativo de respuesta. Entonces la compaa recabara y analizara los datos relativos al tiempo de respuesta. Diere el tiempo representativo de respuesta cierto da de la semana o parte de un da? Si los tiempos de respuesta se estn creciendo, los administradores podran tomar la decisin de aumentar la cantidad de asesores tcnicos a ciertas horas del da o de la semana.

Captulo 1

Tipos de estadstica
Por lo general, el estudio de la estadstica se divide en dos categoras: la estadstica descriptiva y la estadstica inferencial.

Estadstica descriptiva
Es la ciencia que recoge, organiza, presenta, analiza datos. Esta parte de la estadstica recibe el nombre de estadstica descriptiva. ESTADSTICA DESCRIPTIVA Mtodo para organizar, resumir y presentar datos de manera informativa. Por ejemplo, el gobierno de Estados Unidos informa que en 1960, la poblacin de este pas fue de 179 323 000; en 1970, de de 203 302 000; en 1980, de 226 542 000; en 1990, de 248 709 000 y en 2000 de 265 000 000. Esta informacin representa una estadstica descriptiva. Se trata de estadstica descriptiva si calcula el crecimiento porcentual de una dcada a otra. Sin embargo, no sera de naturaleza descriptiva si utilizara estos datos para calcular la poblacin de Estados Unidos en el ao 2010 o el crecimiento porcentual de 2000 a 2010. Por qu? Dichas estadsticas no se estn utilizando para hacer un resumen de poblaciones del pasado, sino para calcular poblaciones en el futuro. Los siguientes son ejemplos de estadstica descriptiva.  Hay un total de casi 68 859 kilmetros de carreteras interestatales en Estados Unidos. El sistema interestatal representa apenas 1% del total de carreteras de la nacin, aunque alberga a ms de 20% del trnsito. La ms larga es la autopista I-90, que va de Boston a Seattle, una distancia de 4 957.32 kilmetros. La ms corta es la I-878, localizada en Nueva York, cuya longitud es de 1.12 kilmetros. Alaska no cuenta con carreteras interestatales; Texas posee la mayor cantidad de kilmetros interestatales, 3 232, y Nueva York tiene la mayor parte de las rutas interestatales, 28 en total.  De acuerdo con la Agencia de Estadstica Laboral, en enero de 2006 el salario promedio por hora de los obreros era de $17.73. Revise la informacin reciente sobre salarios y productividad de los trabajadores estadounidenses en la pgina de la Agencia de Estadstica Laboral localizada en http://www.bls.gov./home.htm, seleccione Average Hourly Earnings. Una masa de datos desorganizados como el censo de poblacin, los salarios semanales de miles de programadores de computadoras y las respuestas de 2000 votantes registrados para elegir presidente de Estados Unidos resulta de poca utilidad. No obstante, las tcnicas de la estadstica descriptiva permiten organizar esta clase de datos y darles signicado. Los datos se ordenan en una distribucin de frecuencia (en el captulo 2 se estudia este procedimiento). Se emplean diversas clases de grficas para describir datos; en el captulo 4 tambin se incluyen diversas formas bsicas de grcas. Las medidas especcas de localizacin central, como la media, describen el valor central de un grupo de datos numricos. Para describir la proximidad de un conjunto de datos en torno al promedio se emplean diversas medidas estadsticas. Estas medidas de tendencia central y dispersin se estudian en el captulo 3.

Estadstica inferencial
El segundo tipo es la estadstica inferencial, tambin denominada inferencia estadstica. El principal inters respecto de la estadstica inferencial tiene que ver con encontrar algo relacionado con la poblacin a partir de una muestra de dicha poblacin. Por ejemplo, una encuesta reciente mostr que solamente 46% de los estudiantes del ltimo grado de secundaria podan resolver problemas que incluyeran fracciones, decimales y porcentajes. Adems, slo 77% de los estudiantes de ltimo ao de secundaria pudo sumar correctamente el costo de una ensalada, una hamburguesa, unas papas fritas y un refresco de cola, que guraban en el men de un restaurante. Ya que stas son

Qu es la estadstica?

inferencias relacionadas con una poblacin (todos los estudiantes de ltimo grado de secundaria), basadas en datos de la muestra, se trata de estadstica inferencial. Se podra considerar a la estadstica inferencial como la mejor conjetura que es posible obtener del valor de una poblacin sobre la base de la informacin de la muestra. ESTADSTICA INFERENCIAL Mtodos empleados para determinar una propiedad de una poblacin con base en la informacin de una muestra. Preste atencin a las palabras poblacin y muestra en la denicin de estadstica inferencial. Con frecuencia hacen referencia a la poblacin que vive en Estados Unidos o a la poblacin de 1 310 millones de habitantes de China. No obstante, en estadstica, la palabra poblacin posee un signicado ms amplio. Una poblacin puede constar de individuos como los estudiantes matriculados de la Universidad Estatal de Utah, los estudiantes de Contabilidad 201 o los presidentes de las compaas de Fortune 500. Tambin puede consistir en objetos, tales como las llantas Cobra G/T producidas en Cooper Tire and Rubber Company en la planta de Findlay, Ohio; las cuentas por cobrar al nalizar octubre por Lorrange Plastics, Inc.; o los reclamos de seguro de automvil archivados durante el primer trimestre de 2006 en la Ocina Regional del Noreste de State Farm Insurance. Las medidas de inters podran ser los resultados en el primer examen de los estudiantes de Contabilidad 201, el desgaste de la banda de rodamiento de las llantas Cooper, el monto en dlares de las notas por cobrar de Lorrange Plastics o la cantidad de reclamos de seguro de automvil en State Farm. De esta manera, desde una perspectiva estadstica una poblacin no siempre tiene que ver con personas. POBLACIN Conjunto de individuos u objetos de inters o medidas obtenidas a partir de todos los individuos u objetos de inters. Con el objeto de inferir algo sobre una poblacin, lo comn es que tome una muestra de la poblacin. MUESTRA Porcin o parte de la poblacin de inters.
Razones por las que se toman muestras

Por qu tomar una muestra en lugar de estudiar a cada miembro de la poblacin? Una muestra de votantes registrados se hace necesaria en virtud de los costos prohibitivos de ponerse en contacto con millones de electores antes de una eleccin. Las pruebas en el trigo acerca de la humedad que lo destruye, hacen imprescindible la toma de una muestra. Si los catadores de vino probaran todo el vino, no quedara una gota para vender. En la prctica resulta imposible que unos cuantos bilogos marinos capturen y rastreen a todas las focas en el ocano. (stas y otras razones para tomar muestras se estudian en el captulo 8.) La toma de muestras para aprender algo sobre una poblacin es de uso frecuente en administracin, agricultura, poltica y acciones de gobierno, segn lo muestran los siguientes ejemplos:  Las cadenas de televisin hacen un monitoreo continuo de la popularidad de sus programas contratando a Nielsen y a otras organizaciones con el n de que stas tomen muestras sobre las preferencias de los teleespectadores. Por ejemplo, en una muestra de 800 personas que ven el televisor a la hora de mayor audiencia, 320, o 40%, seal que vio CSI (Crime Scene Investigation) la semana pasada. Estos ndices de audiencia se emplean para establecer tarifas de publicidad o para suspender programas.  Gamous and Associates, una rma de contadores pblicos, realiza una auditora a Pronto Printing Company. Para comenzar, la rma contable elige una muestra aleatoria de 100 facturas y verica la exactitud de cada factura. Por lo menos hay un error en cinco facturas; por consiguiente, la rma de contadores calcula que 5% de la poblacin de facturas contiene un error por lo menos.  Una muestra aleatoria de 1 260 graduados de marketing de escuelas que imparten la carrera en cuatro aos mostr que su sueldo inicial promedio era de $42 694. Por

Captulo 1

tanto, se estima que el sueldo inicial promedio de todos los graduados de contabilidad de instituciones que imparten la carrera en cuatro aos es de $42 694. La relacin entre una muestra y una poblacin se presenta abajo. Por ejemplo, desea calcular los kilmetros promedio por litro de los vehculos SUV (sport utility vehicles). Se eligen seis SUV de la poblacin. Se emplea la cantidad promedio de KPL (kilmetros por litro) de los seis para calcular la cantidad de KPL en el caso de la poblacin.
Poblacin Todos los elementos Muestra Elementos elegidos entre la poblacin

Le recomendamos que realice el ejercicio de autoevaluacin.

Enseguida aparece un ejercicio de autoevaluacin. Estos ejercicios se encuentran intercalados en cada captulo. Someten a prueba su comprensin del material precedente. La respuesta y mtodo de solucin aparecen al nal del captulo. La respuesta a la siguiente autoevaluacin se encuentra en la pgina 19. El lector debe intentar resolverlos y despus comparar su respuesta.

Autoevaluacin 1.1

Las respuestas se localizan al final del captulo. La empresa de publicidad con sede en Atlanta, Brandon and Associates, solicit a una muestra de 1 960 consumidores que probaran un platillo con pollo recin elaborado por Boston Market. De las 1 960 personas de la muestra, 1176 dijeron que compraran el alimento si se comercializaba. a)  Qu podra informar Brandon and Associates a Boston Market respecto de la aceptacin en la poblacin del platillo de pollo? b)  Es un ejemplo de estadstica descriptiva o estadstica inferencial? Explique su respuesta.

Tipos de variables
Variable cualitativa

Variable cuantitativa

Existen dos tipos bsicos de variables: 1) cualitativas y 2) cuantitativas (vase grca 1.2). Cuando la caracterstica que se estudia es de naturaleza no numrica, recibe el nombre de variable cualitativa o atributo. Algunos ejemplos de variables cualitativas son el gnero, la liacin religiosa, tipo de automvil que se posee, estado de nacimiento y color de ojos. Cuando los datos son de naturaleza cualitativa, importa la cantidad o proporcin que caen dentro de cada categora. Por ejemplo, qu porcentaje de la poblacin tiene ojos azules? Cuntos catlicos o cuntos protestantes hay en Estados Unidos? Qu porcentaje del total de automviles vendidos el mes pasado eran SUV? Los datos cualitativos se resumen en tablas o grcas de barras (captulo 2). Cuado la variable que se estudia aparece en forma numrica, la variable se denomina variable cuantitativa. Ejemplos de variables cuantitativas son el saldo en su cuenta de cheques, las edades de los presidentes de la compaa, la vida de la batera de un automvil aproximadamente 42 meses y el nmero de hijos que hay en una familia.

Qu es la estadstica?

Las variables cuantitativas pueden ser discretas o continuas. Las variables discretas adoptan slo ciertos valores y existen vacos entre ellos. Ejemplos de variables discretas son el nmero de camas en una casa (1, 2, 3, 4, etc.); el nmero de automviles que en una hora usan la Salida 25, carretera I-4, en Florida, cerca del Walt Disney World (326, 421, etc.) y el nmero de estudiantes en cada seccin de un curso de estadstica (25 en la seccin A, 42 en la seccin B y 18 en la seccin C). Aqu se cuenta, por ejemplo, el nmero de automviles que arriban a la Salida 25, carretera I-4, y el nmero de estudiantes de estadstica en cada seccin. Observe que en una casa hay 3 o 4 camas, pero no 3.56. Por consiguiente, existe un vaco entre los valores posibles. Las variables discretas son el resultado de una relacin numrica. Las observaciones de una variable continua toman cualquier valor dentro de un intervalo especco. Ejemplos de variables continuas son la presin del aire en una llanta y el peso de un cargamento de tomates. Otros ejemplos son la cantidad de cereal con pasas que contiene una caja y la duracin de los vuelos de Orlando a San Diego. El promedio de puntos al graduarse (PPG) constituye una variable continua. Podra expresar el PPG de determinado estudiante como 3.2576952. Se acostumbra redondear a 3 lugares decimales (3.258). Por lo general las variables continuas son el resultado de mediciones.

Tipos de variables

Cualitativa

Cuantitativa

Marca de PC Estado civil Color de cabello

Discreta

Continua

Hijos en una familia Tiros en un hoyo de golf Aparatos de televisin que se poseen

Monto del impuesto sobre la renta Peso de un estudiante Precipitacin anual en Tampa, Florida

GRFICA 1.2 Resumen de los tipos de variables

Niveles de medicin
Los datos se clasican por niveles de medicin. El nivel de medicin de los datos rige los clculos que se llevan a cabo con el n de resumir y presentar los datos. Tambin determina las pruebas estadsticas que se deben realizar. Por ejemplo, en una bolsa de M&M hay lunetas de seis diferentes colores. Suponga que asigna el 1 al caf, el 2 al amarillo, el 3 al azul, el 4 al naranja, el 5 al verde y el 6 al rojo. Sume la cantidad de lunetas que hay en una bolsa, la divide entre el nmero de lunetas e informa que el color promedio es 3.56. Signica que el color promedio es azul o anaranjado? Desde luego que no. Otro ejemplo, en la pista de una escuela secundaria hay ocho competidores para la carrera de 400 metros. Para indicar el orden en que llegan a la meta dice que la media es de 4.5. Qu revela este promedio? Nada! En ambos casos, no se emple adecuadamente el nivel de medicin.

10

Captulo 1

De hecho, existen cuatro niveles de medicin: nominal, ordinal, de intervalo y de razn. La medicin ms baja, o ms primaria, corresponde al nivel nominal. La ms alta, o el nivel que proporciona la mayor informacin relacionada con la observacin, es la medicin de razn.

Datos de nivel nominal


En el caso del nivel nominal de medicin, las observaciones acerca de una variable cualitativa slo se clasican y cuentan. No existe una forma particular para ordenar las etiquetas. La clasicacin de los seis colores de las lunetas de chocolate de leche M&M constituye un ejemplo del nivel nominal de medicin. Simplemente se clasican las lunetas por color. No existe un orden natural. Es decir, no presenta primero las lunetas cafs, las anaranjadas o las de cualquier color. El gnero representa otro ejemplo del nivel nominal de medicin. Suponga que hace un conteo de los estudiantes que entran a un partido de futbol con credencial e informa cuntos son hombres y cuntas mujeres. Podra presentar primero a los hombres o a las mujeres. Para el nivel nominal, la medicin consiste en contar. La tabla 1.1 muestra un anlisis de las fuentes de suministro mundial de petrleo. La variable de inters se reere al pas o regin. Se trata de una variable de nivel nominal porque registra la informacin de acuerdo con la fuente de suministro del petrleo y no existe orden natural. No se confunda por el hecho de que la variable se resume informando la cantidad de barriles producidos por da. TablA 1.1 Suministro mundial de petrleo para 2004
Fuente OPEP OCDE (incluyendo a Estados Unidos)* Rusia China Otra Millones de barriles diarios 32.91 22.76 11.33 3.62 12.35 82.97 Porcentaje 39.7 27.4 13.7 4.4 14.9 100.1

Estadstica en accin
Dnde tiene sus orgenes la estadstica? En 1662 John Graunt public el artculo Natural and Political Observations Made upon Bills of Mortality. Las observaciones del autor eran el resultado de un estudio y anlisis de una publicacin religiosa semanal llamada Bill of Mortality, la cual inclua nacimientos, bautizos y muertes junto con sus causas. Graunt se dio cuenta de que Bills of Mortality representaba apenas una fraccin de los nacimientos y muertes en Londres. Sin embargo, utiliz los datos para llegar a conclusiones relativas al impacto de las enfermedades, como la peste, en la poblacin. Su lgica constituye un ejemplo de inferencia estadstica. Su anlisis e interpretacin de los datos marcan el inicio de la estadstica.

*El promedio diario en Estados Unidos es de 8.69 millones de barriles, o 10.5% del total.

La tabla 1.1 muestra el rasgo esencial de la escala nominal de medicin: no existe un orden particular en las categoras. Con el n de procesar datos referentes a la produccin de petrleo, al gnero, al empleo por industria, etc., a menudo las categoras se codican con los nmeros 1, 2, 3,

Qu es la estadstica?

11

etctera: el 1 representa a la OPEP; el 2, a la OCDE, por ejemplo. Esto facilita el clculo con la ayuda de la computadora. Sin embargo, aunque ha asignado nmeros a las diversas categoras, esto no le autoriza a realizar operaciones con los nmeros. Por ejemplo, 1 + 2 no es igual a 3, es decir que OPEP + OCDE no es igual a Rusia. En resumen, los datos de nivel nominal poseen las siguientes propiedades: 1. Las categoras de datos se encuentran representadas por etiquetas o nombres. 2.  Aun cuando las etiquetas se codiquen con nmeros, las categoras de datos no tienen ningn orden lgico.

Datos de nivel ordinal


El nivel inmediato superior de datos es el nivel ordinal. La tabla 1.2 contiene las calicaciones que los alumnos del profesor James Bruner le otorgaron despus de un curso de introduccin a las nanzas. Cada estudiante de la clase respondi la pregunta: En trminos generales, cmo calicas al profesor del curso? La calicacin variable ilustra el uso de la escala ordinal de medicin. Una calicacin es ms alta o mejor, que la siguiente: superior es mejor que bueno, bueno es mejor que promedio, etc. Sin embargo, no es posible distinguir la magnitud de las diferencias entre los grupos. La diferencia entre superior y bueno es la misma que entre malo e inferior? No es posible armarlo. Si sustituye 5 por superior y 4 por bueno, concluir que la calicacin superior es mejor que la calicacin bueno, pero si aade una calicacin de superior y una de bueno no espere que el resultado tenga signicado. Adems, no debe concluir que la calicacin de bueno (calicacin de 4) sea necesariamente dos veces ms alta que malo (calicacin de 2). Slo tendr claro que la calicacin bueno es mejor que la calicacin malo; no en qu grado es mejor calicacin.

TablA 1.2 Calificaciones a un profesor de finanzas


Calificacin Superior Bueno Promedio Malo Inferior Frecuencia 6 28 25 12 3

Otro ejemplo de datos de nivel ordinal es el Homeland Security Advisory System. El Departamento de Seguridad Nacional publica informacin relativa al riesgo de que las autoridades federal, estatal y local, as como los estadounidenses, sean vctimas de ataques terroristas. A la izquierda aparecen los primeros cinco niveles de riesgo, que van del ms bajo al ms alto y se incluye una descripcin y cdigos de colores. ste es un ejemplo de la escala ordinal, ya que conoce el orden o los grados de los niveles de riesgo el naranja es superior al amarillo, aunque la diferencia en cuanto a riesgo no es necesariamente la misma. En otras palabras, la diferencia en cuanto al nivel de riesgo entre el amarillo y el naranja no es la misma que la existente entre el verde y el azul. Consulte los niveles actuales de riesgo y conozca ms sobre los diversos niveles en la siguiente direccin: www.whitehouse.gov/homelad. En resumen, las propiedades del nivel ordinal de los datos son las siguientes: 1. Las clasicaciones de los datos se encuentran representadas por conjuntos de etiquetas o nombres (alto, medio, bajo), las cuales tienen valores relativos. 2. En consecuencia, los valores relativos de los datos se pueden clasicar u ordenar.

12

Captulo 1

Datos de nivel de intervalo


El nivel de intervalo de medicin es el nivel inmediato superior. Incluye todas las caractersticas del nivel ordinal, pero, adems, la diferencia entre valores constituye una magnitud constante. Un ejemplo de nivel de intervalo de medicin es la temperatura. Suponga que las temperaturas altas durante tres das consecutivos de invierno en Boston son de 28, 31 y 20 grados Fahrenheit. Estas temperaturas se clasican fcilmente, aunque, adems, es posible determinar la diferencia entre ellas, gracias a que un grado Fahrenheit representa una unidad de medicin constante. Diferencias iguales entre dos temperaturas son las mismas, sin importar su posicin en la escala. Es decir, la diferencia entre 10 y 15 grados Fahrenheit es de 5; la diferencia entre 50 y 55 grados tambin es de 5. Es importante destacar que 0 es un punto ms en la escala. No representa la ausencia de estado. Cero grados Fahrenheit no representa la ausencia de calor, sino sencillamente el hecho de que hace fro. De hecho, 0 grados Fahrenheit equivale aproximadamente a 18 grados en la escala Celsius. Otro ejemplo de escala de intervalo de medicin consiste en las tallas de ropa para dama. Enseguida se muestran datos referentes a diversas medidas de una prenda de una mujer caucsica tpica.
Talla 8 10 12 14 16 18 20 22 24 26 28 Busto (pulgadas) Cintura (pulgadas) Cadera (pulgadas) 32 34 36 38 40 42 44 46 48 50 52 24 26 28 30 32 34 36 38 40 42 44 35 37 39 41 43 45 47 49 51 53 55

Por qu razn la talla es una medicin de intervalo? Observe que conforme la talla cambia 2 unidades (de la talla 10 a la 12, o de la talla 24 a la 26), cada medida aumenta 2 pulgadas. En otras palabras, los intervalos son los mismos. No existe un punto cero natural que represente una talla. Una prenda talla cero no est hecha de cero material. Ms bien, se trata de una prenda con 24 pulgadas de busto, 16 pulgadas de cintura y 27 de cadera. Adems, las razones no tienen signicado alguno. Si divide una talla 28 entre una talla 14, no obtiene la misma respuesta que si divide una talla 20 entre una 10. Ninguna razn es igual a dos, como sugerira el nmero de talla. En resumen, si las distancias entre los nmeros tienen sentido, aunque las razones no, entonces tiene una escala de intervalo de medicin. Las propiedades de los datos de nivel de intervalo son las siguientes: 1.  Las clasicaciones de datos se ordenan de acuerdo con el grado que posea de la caracterstica en cuestin. 2.  Diferencias iguales en la caracterstica representan diferencias iguales en las mediciones.

Datos de nivel de razn


Todos los datos cuantitativos son registrados en el nivel de razn de la medicin. El nivel de razn es el ms alto. Posee todas las caractersticas del nivel de intervalo, aunque, adems, el punto 0 tiene sentido y la razn entre dos nmeros es signicativa. Ejemplos de la escala de razn de medicin incluyen salarios, unidades de produccin, peso, cambios en los precios de las acciones, la distancia entre sucursales y la altura. El dinero ilustra bien el caso. Si tiene cero dlares, entonces no tiene dinero. El peso constituye otro ejemplo. Si el cuadrante de la escala de un dispositivo correctamente calibrado se ubica en 0, entonces hay una ausencia total de peso. La razn entre dos

Qu es la estadstica?

13

nmeros tambin resulta signicativa. Si Jim gana $40 000 anuales vendiendo seguros y Rob gana $80 000 al ao vendiendo automviles, entonces Rob gana el doble de lo que gana Jim. La tabla 1.3 ilustra el uso de la escala de razn de medicin, muestra los ingresos de cuatro parejas de padre e hijo. TablA 1.3 Combinaciones de ingresos de padre e hijo
Nombre Lahey Nale Rho Steele Padre $80 000 90 000 60 000 75 000 Hijo $ 40 000 30 000 120 000 130 000

Observe que Lahey, padre, gana el doble de lo que gana su hijo. En la familia de Rho, el hijo percibe el doble de ingresos que su padre. En resumen, las propiedades de los datos de nivel de intervalo son las siguientes: 1.  Las clasicaciones de datos se ordenan de acuerdo con la cantidad de caractersticas que poseen. 2.  Diferencias iguales en la caracterstica representan diferencias iguales en los nmeros asignados a las clasicaciones. 3.  El punto cero representa la ausencia de caractersticas y la razn entre dos nmeros es signicativa. La grca 1.3 resume las principales caractersticas de los diversos niveles de medicin.
Niveles de medicin

Nominal

Ordinal

Intervalo

Razn

Los datos slo se clasican

Los datos se ordenan

Diferencia signicativa entre valores

Punto 0 signicativo y razn entre valores

Nmeros de camiseta de los jugadores de futbol Marca de automvil

Su nmero de lista en clase Posicin de los equipos dentro de los diez grandes

Temperatura Talla

Nmero de pacientes atendidos Nmero de llamadas de ventas realizadas Distancia a clase

GRFICA 1.3 Resumen de las caractersticas de los niveles de medicin

Autoevaluacin 1.2

Cul es el nivel de medicin que reflejan los siguientes datos? a)  La edad de cada persona en una muestra de 50 adultos que escuchan una de las 1 230 estaciones de radio que transmiten entrevistas en Estados Unidos es:

35 30 47 44 35

29 36 37 39 37

41 41 41 35 38

34 39 27 35 43

44 44 33 41 40

46 39 33 42 48

42 43 39 37 42

42 43 38 42 31

37 44 43 38 51

47 40 22 43 34

b)  En una encuesta de 200 propietarios de automviles de lujo, 100 eran de California, 50 de Nueva York, 30 de Illinois y 20 de Ohio.

14

Captulo 1

Ejercicios
Al nal del libro se encuentran las respuestas a los ejercicios impares. Cul es el nivel de medicin de cada una de las siguientes variables? a) Coecientes intelectuales de los estudiantes. b) La distancia que viajan los estudiantes para llegar a clases. c) Las calicaciones de los estudiantes en el primer examen de estadstica. d) Una clasicacin de estudiantes por fecha de nacimiento. e) Una clasicacin de estudiantes que cursan primero, segundo, tercero o ltimo grado. f ) Nmero de horas que los alumnos estudian a la semana. Cul es el nivel de medicin de los siguientes artculos relacionados con el negocio de los peridicos? a) El nmero de peridicos vendidos todos los domingos durante 2006. b) Los diferentes departamentos, como edicin, publicidad, deportes, etctera. c) Un resumen del nmero de peridicos vendidos por condado. d) Cantidad de aos que cada empleado ha laborado en el peridico.  Localice en la ltima edicin de USA Today o en el peridico de la localidad ejemplos de cada 3. nivel de medicin. Redacte un breve resumen de lo que descubra. 4. En los siguientes casos determine si el grupo representa una muestra o una poblacin. a) Los participantes en el estudio de un nuevo frmaco contra el colesterol. b)  Los conductores que recibieron una multa por exceso de velocidad en la ciudad de Kansas el ltimo mes. c) Beneciarios del programa de asistencia social en Cook County (Chicago), Illinois. d) Las 30 acciones que forman parte del promedio industrial Dow Jones. 1.  2.

tica y estadstica
Al seguir de cerca los sucesos de Enron, Tyco, HealthSouth, WorldCom y otros desastres relacionados con empresas, los estudiantes de administracin necesitan comprender que estos acontecimientos se debieron a la interpretacin equivocada de los datos administrativos y nancieros. En cada caso, el personal comunic a los inversionistas informacin nanciera que indicaba que las compaas se estaban desempeando mucho mejor de lo que era la realidad. Cuando se present la informacin verdadera, las compaas tenan un valor muy inferior al que se anunciaba. El resultado fue que muchos inversionistas perdieron todo o casi todo el dinero que invirtieron en estas compaas. El artculo Statistics and Ethics: Some Advice for Young Statisticians, que apareci en The American Statistician 57, nm. 1 (2003) (www.amstat.org/profession), proporciona orientacin al respecto. Los autores aconsejan la prctica de la estadstica con integridad y honestidad, e instan a hacer lo correcto cuando se recoja, organice, resuma, analice e interprete informacin numrica. La contribucin real de la estadstica a la sociedad es de naturaleza moral. Los analistas nancieros necesitan proporcionar informacin que reeje el verdadero desempeo de una compaa, de tal manera que no desorienten a los inversionistas. La informacin relativa a defectos de un producto que puede ser daino debe ser analizada y darse a conocer con integridad y honestidad. Los autores del artculo de The American Statistician indicaron, adems, que cuando se practique la estadstica, es necesario mantener un punto de vista independiente y con principios. Conforme el lector avance, atender a cuestiones ticas relacionadas con la recopilacin, anlisis, presentacin e interpretacin de informacin estadstica. Es de esperarse, asimismo, que conforme el lector aprenda ms estadstica, se convierta en un consumidor crtico. Por ejemplo, pondr en tela de juicio un informe basado en datos que no representan elmente a la poblacin, otro que no contenga estadsticas relevantes, uno que incluya una eleccin incorrecta de medidas estadsticas o una presentacin de datos tendenciosa en un intento deliberado por desorientar o tergiversar los hechos.

Aplicaciones de la computadora
En la actualidad las computadoras estn disponibles en la mayora de las escuelas de formacin profesional y universidades. Las hojas de clculo, como Microsoft Excel, y los paquetes de software de estadstica, como MINITAB, se encuentran disponibles en la mayora de los laboratorios de computadoras. El paquete Microsoft Excel viene incluido con muchas computadoras domsticas. En el texto se emplea tanto Excel como MINITAB

Qu es la estadstica?

15

para las aplicaciones. Tambin se utiliza un complemento de Excel llamado MegaStat, que proporciona a Excel la capacidad para generar informes estadsticos adicionales. El siguiente ejemplo muestra la aplicacin de las computadoras en el anlisis estadstico. En los captulos 2, 3 y 4 aparecen los mtodos para resumir y describir datos. Un ejemplo utilizado en dichos captulos se reere al precio, expresado en miles de dlares, de 80 vehculos vendidos el mes pasado en Whitner Autoplex. La siguiente presentacin de Excel revela, entre otras cosas: 1) Ochenta vehculos se vendieron el mes pasado. 2) El precio medio (promedio) de venta fue de $23 218. 3) Los precios de venta iban de un mnimo de $15 546 a un mximo de $35 925.

La siguiente pgina se toma del sistema MINITAB, contiene mucha de la misma informacin.

Si hubiera empleado una calculadora para llegar a estas medidas y otras que se necesitan para analizar plenamente los precios de venta, hubiera requerido horas de clculos. Adems, la posibilidad de cometer un error aritmtico es alta cuando se maneja una gran cantidad de valores. Por otra parte, los paquetes de software de estadstica y las hojas de clculo proporcionan informacin exacta en segundos.

16

Captulo 1

Segn el criterio de su instructor y dependiendo del sistema de software disponible, instamos al lector a utilizar un paquete de computadora para resolver los ejercicios en los Ejercicios de la base de datos. Le evitar tediosos clculos y le permitir concentrarse en el anlisis de datos.

Resumen del captulo


I.  La estadstica es la ciencia que recoge, organiza, presenta, analiza e interpreta datos con el n de facilitar la toma de decisiones ms ecaces. II. Existen dos clases de estadstica. A.  La estadstica descriptiva que consiste en un conjunto de procedimientos para organizar y resumir datos. B.  La estadstica inferencial implica tomar una muestra de una poblacin y llevar a cabo clculos relativos a sta sobre la base de los resultados de la muestra. 1.  Una poblacin es un conjunto de individuos u objetos de inters o las medidas obtenidas de todos los individuos u objetos de inters. 2. Una muestra es una parte de la poblacin. III. Existen dos tipos de variables. A. Una variable cualitativa es de naturaleza no numrica. 1.  Por lo comn lo que interesa es el nmero o porcentaje de observaciones en cada categora. 2. Los datos cualitativos se renen en grcas y diagramas de barras. B. Existen dos tipos de variables cuantitativas, que se presentan de forma numrica. 1. Las variables discretas toman ciertos valores, y existen vacos entre stos. 2. Una variable continua adopta cualquier valor dentro de un intervalo especco. IV. Existen cuatro niveles de medicin. A.  En el caso del nivel nominal, los datos se distribuyen en categoras sin un orden particular. B.  El nivel ordinal de medicin supone que una clasicacin se encuentra en un nivel superior a otra. C.  El nivel de medicin de intervalo posee la caracterstica de clasicacin correspondiente al nivel ordinal de medicin, adems de que la distancia entre valores es constante. D.  El nivel de medicin de razn cuenta con todas las caractersticas del nivel de intervalo, adems de que existe un punto 0 y que la razn entre dos valores resulta signicativa.

Ejercicios del captulo


5.  Explique la diferencia entre variables cualitativas y cuantitativas. Proporcione un ejemplo de variable cuantitativa y de variable cualitativa. 6. Explique la diferencia entre muestra y poblacin. 7.  Explique la diferencia entre variable discreta y continua. Proporcione un ejemplo de cada una que no aparezca en el texto. 8.  En los siguientes problemas indique si recogera informacin utilizando una muestra o una poblacin y por qu lo hara. a)  Estadstica 201 es un curso que se imparte en la universidad. El profesor A. Verage ha enseado a cerca de 1 500 estudiantes los pasados cinco aos. Usted quiere conocer el grado promedio de los estudiantes que toman el curso. b)  Usted necesita dar a conocer la rentabilidad de la compaa lder en Fortune 500 durante los pasados diez aos. c)  Usted espera graduarse y conseguir su primer empleo como vendedor en una de las cinco principales compaas farmacuticas. Al hacer planes para sus entrevistas, necesitar conocer la misin de la empresa, rentabilidad, productos y mercados. d)  Usted se encuentra comprando un nuevo reproductor de msica MP3, como el iPod de Apple. El fabricante anuncia la cantidad de pistas que almacena la memoria. Considere que los anunciantes toman en cuenta piezas de msica popular cortas para calcular la cantidad de pistas que pueden almacenarse. Sin embargo, usted preere las melodas de Broadway, que son ms largas. Usted desea calcular cuntas melodas de Broadway podr guardar en su reproductor MP3. 9.  Ubique las variables en las siguientes tablas de clasicacin. Resuma en cada tabla sus observaciones y evale si los resultados son verdaderos. Por ejemplo, el salario se presenta como una variable cuantitativa continua. Tambin es una variable de escala de razn.

Qu es la estadstica?

17

a) Salario b) Gnero c) Volumen de ventas de reproductores MP3 d) Preferencia por los refrescos e) Temperatura f ) Resultados del salvation attitude test (SAT)* g) Lugar que ocupa un estudiante en clase h) Calicaciones de un profesor de nanzas i) Cantidad de computadoras domsticas Variable discreta Variable continua

Cualitativa Cuantitativa Discreta

a) Salario

Continua

Nominal Ordinal Intervalo Razn

a) Salario

10.  A partir de los datos de publicaciones como Statistical Abstract of the United States, The World Almanac, Forbes o del peridico local, proporcione ejemplos de los niveles de medicin nominal, ordinal, de intervalo y de razn. 11.  Struthers Wells Corporation emplea a ms de 10 000 empleados administrativos en sus ocinas de ventas y fabricacin en Estados Unidos, Europa y Asia. Una muestra de 300 de esos empleados revel que 120 aceptaran una transferencia fuera de Estados Unidos. Con la base de estos hallazgos, redacte un breve memorando dirigido a la seora Wanda Carter, vicepresidenta de Recursos Humanos, relacionado con lo empleados administrativos de la rma y su disposicin para que se les reubique. 12.  AVX Stereo Equipment, Inc., recin inaugur una poltica de devolucin de artculos sin complicaciones. Una muestra de 500 clientes que recin haban devuelto artculos mostr que 400 pensaban que la poltica era justa, 32 pensaban que requera mucho tiempo llevar a cabo la transaccin y el resto no opin. De acuerdo con dicha informacin, haga una inferencia sobre la reaccin del consumidor a la nueva poltica. 13.  La siguiente tabla contiene el nmero de automviles y camiones de carga ligera vendidos por los fabricantes de automviles Big Three en junio de 2004 y junio de 2005. Compaa Chrysler Group Ford GM 2005 220 032 284 971 551 141 Unidades 2004 209 252 281 850 375 141

a)  Compare el total de ventas de los dos meses. Qu concluye? Ha habido un incremento en las ventas? b)  Compare el porcentaje de mercado de Big Three que posee cada compaa. Creci el mercado o GM gan ventas a las otras compaas? Cite evidencias. 14.  La siguiente grca describe las utilidades en millones de dlares de ExxonMobil en el periodo que va de 2000 a 2004.
*N. del E.: El SAT es un examen propuesto por E.D. Hirsch, quien argumentaba que de nada servan las tcnicas pedaggicas en voga si los estudiantes no contaban con un bagage de conocimientos que fundamentaran su aprendizaje.

18

Captulo 1

Redacte un breve informe con un anlisis de las utilidades de ExxonMobil durante dicho periodo. Se incrementaron las utilidades o disminuyeron?

ejercicios.com
En los siguientes ejercicios se hace uso de la World Wide Web, una fuente de informacin rica y en crecimiento. Debido a la naturaleza cambiante y de la continua revisin de los sitios web, es posible que se encuentren diferentes mens y que las direcciones exactas, o URL, cambien. Cuando visite una pgina, hay que prepararse para buscar el vnculo. 15.  Suponga que recin abri una cuenta en Ameritrade, Inc., un corredor de bolsa en lnea. Usted decide comprar acciones, ya sea de Johnson & Jonson (una compaa farmacutica) o de PepsiCo (empresa matriz de Pepsi y Frito-Lay). Si desea hacer una comparacin entre las dos compaas, visite la pgina http://nance.yahoo.com y, en el espacio que dice Get Quotes, escriba las letras JNJ y PEP, que son los respectivos smbolos de las compaas. Haga clic en Go para obtener informacin reciente sobre el precio de venta de las dos acciones. A la derecha de esta informacin, d clic en More y enseguida en Analyst Opinion. Aqu hay informacin de unos analistas accionarios que evaluaron las acciones. Los corredores de bolsa calican la accin con 1, si se trata de una buena compra, y con 5 si se trata de una buena venta. Qu nivel de medicin corresponde a esta informacin? Qu acciones se recomiendan?

Ejercicios de la base de datos


16. Regrese a los datos de Real Estate que aparecen en el texto, que incluyen informacin sobre  casas vendidas en la zona de Denver, Colorado, el ao pasado. Considere las siguientes variables: precio de venta, nmero de recmaras, ubicacin y distancia al centro de la ciudad. a) De las variables, cules son cualitativas y cules cuantitativas? b) Determine el nivel de medicin de cada una de las variables. 17.  Consulte los datos Baseball 2005, que contienen informacin de los treinta equipos de las Ligas Mayores de Bisbol para la temporada 2005. Considere las siguientes variables: nmero de victorias, salario del equipo, asistencia durante la temporada, si el equipo jug los partidos como antrin sobre csped, pasto sinttico o supercie articial, as como el nmero de carreras anotadas. a) Cules de estas variables son cuantitativas y cules cualitativas? b) Determine el nivel de medicin de cada una de las variables. 18.  Vaya a los datos Wage, que incluyen informacin de los salarios anuales de una muestra de 100 trabajadores. Tambin incluye variables sobre la industria, aos de educacin y gnero de cada trabajador. a) Cules de las doce variables son cuantitativas y cules cualitativas? b) Determine el nivel de medicin de cada variable.

Qu es la estadstica?

19

9. Consulte los datos CIA, que incluyen informacin demogrca y econmica sobre 46 pases. 1 a) Qu variables son cuantitativas y cules cualitativas? b) Determine el nivel de medicin de cada variable.

Captulo 1 Respuestas a las autoevaluaciones


1.1 a)  Sobre la base de la muestra de 1 960 consumidores, estimamos que, si lo comercializa, 60% de los consumidores comprar el platillo de pollo (1 176/1 960) 100 = 60%. b)  Estadstica inferencial, ya que se emple una muestra para llegar a una conclusin relativa a la reaccin de los consumidores de la poblacin en caso de que se comercializara el platillo de pollo. 1.2 a)  La edad es una variable de escala de razn. Una persona de 40 aos tiene el doble de edad que una de 20. b)  Escala nominal. Podra ordenar indistintamente los estados.

2
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Organizar los datos cualitativos en una tabla de frecuencias. 2. Representar una tabla de frecuencias como una grfica de barras o una grfica de pastel. 3. Organizar datos cuantitativos en una distribucin de frecuencias. 4. Representar una distribucin de frecuencias de datos cuantitativos por medio de histogramas, polgonos de frecuencia y polgonos de frecuencias acumuladas.

Descripcin de datos:
Tablas de frecuencias, distribuciones de frecuencias y su representacin grfica

Merrill Lynch recin concluy el estudio de una cartera de inversiones en lnea para una muestra de clientes. Elabore un histograma con los datos de los 70 participantes en el estudio (vase ejercicio 39 y objetivo 4).

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

21

Introduccin
En Estados Unidos el altamente competitivo negocio de la venta de automviles de menudeo ha tenido un cambio signicativo durante los pasados cinco aos, debido, en parte, a la fusin de numerosos grupos de concesionarios de propiedad pblica. Por tradicin, una familia local posea y manejaba la concesionaria de la comunidad, que pudo haber incluido a uno o dos fabricantes, como Pontiac y GMC Trucks o Chrysler y la popular lnea Jeep. Sin embargo, recin compaas hbilmente administradas y bien nanciadas han adquirido las concesionarias locales en extensas regiones de ese pas. Al adquirirlas, estos grupos traen consigo sus prcticas de venta acostumbradas, plataformas tecnolgicas comunes de software y hardware y tcnicas de presentacin de informes administrativos. El objetivo consiste en proporcionar al consumidor una mejor experiencia de compra mientras se incrementa la rentabilidad de la concesionaria ms grande. En muchos casos, adems de cosechar los benecios nancieros de la venta de la concesionaria, se pide a la familia que contine dirigiendo la concesionaria. Hoy es comn que estas megaconcesionarias empleen alrededor de diez mil personas, que generen varios miles de millones de dlares en ventas anuales, que posean ms de cien franquicias y se coticen en la Bolsa de Valores de Nueva York o NASDAQ. La fusin no se ha dado sin desafos. Con la adquisicin de concesionarias por todo el pas, AutoUSA, una de las nuevas megaconcesionarias, ahora vende las econmicas marcas de importacin Kia y Hyundai, la lnea de alta calidad de sedanes BMW y Mercedes Benz y una lnea completa de automviles y camiones Ford y Chevrolet. La seora Kathryn Ball es miembro del equipo de alta gerencia de AutoUSA. Es responsable de rastrear y analizar los precios de venta de los vehculos en AutoUSA. A ella le gustara resumir los precios de venta de los vehculos en tablas y grcas que pueda revisar cada mes. A partir de estas tablas y grcas desea conocer cul es el precio de venta tpico, as como el precio ms bajo y el ms alto. Adems, est interesada en describir el perl demogrco de los compradores. Qu edades tienen? Cuntos vehculos poseen? Desean comprar o rentar un vehculo? Whitner Autoplex, ubicada en Raytown, Missouri, es una de las concesionarias de AutoUSA. Whitner Autoplex incluye las franquicias Pontiac, GMC y Buick, as como una tienda de BMW. General Motors se encuentra trabajando activamente con su grupo de concesionarias con el n de combinar en un solo lugar varias de sus franquicias, como Chevrolet, Pontiac o Cadillac. La combinacin de franquicias mejora el trco en piso y una concesionaria tiene productos que ofrecer para cualquier perl demogrco. BMW, con su marca e imagen de primera, quiere dejar de llamar concesionarias a sus lugares de distribucin y llamarlas, ms bien, tiendas. En lugar de ofrecer la tradicional experiencia de una concesionaria de automviles, BMW pretende parecerse ms a Nordstrom, una tienda de venta al menudeo de ropa na en Estados Unidos. Como en el caso de Nordstrom, BMW desea ofrecer a sus clientes un mejor servicio, magncos productos y una experiencia de compra personalizada nica. La seora Ball decidi recopilar datos de tres variables en Whitner Autoplex: el precio de venta (miles de dlares), la edad del comprador y el tipo de automvil (el domstico, codicado con el 1, o el de importacin, codicado con el 0). En la hoja de Excel adjunta aparece una parte del conjunto de datos. El conjunto completo de datos se encuentra disponible en el CD del alumno (incluido en el texto), en el sitio web de McGraw-Hill y en el apndice A.5, localizado al nal del libro.

22

Captulo 2

Construccin de una tabla de frecuencias


Recuerde que, en el captulo 1, al grupo de tcnicas utilizadas para describir un conjunto de datos se les denomin estadstica descriptiva. En otras palabras, la estadstica descriptiva se encarga de organizar datos con el n de mostrar la distribucin general de stos y el lugar en donde tienden a concentrarse, adems de sealar valores de datos poco usuales o extremos. El primer procedimiento a estudiar para organizar y resumir un conjunto de datos es una tabla de frecuencias. TABLA DE FRECUENCIAS Agrupacin de datos cualitativos en clases mutuamente excluyentes que muestra el nmero de observaciones en cada clase. En el captulo 1 se distingue entre variables cualitativas y cuantitativas. Para recordar, una variable cualitativa es de naturaleza no numrica; es decir, que la informacin es clasicable en distintas categoras. No hay un orden particular en estas categoras. Ejemplos de datos cualitativos incluyen la aliacin poltica (demcrata, conservador, independiente), el lugar de nacimiento (Alabama... Wyoming) y el mtodo de pago al comprar en Barnes and Noble (efectivo, cheque o cargo a tarjeta de crdito). Por otra parte, las variables cuantitativas son de ndole numrica. Ejemplos de datos cuantitativos relacionados con estudiantes universitarios incluyen el precio de los libros de texto, edad y horas que pasan estudiando a la semana. En los datos de Whitner Autoplex, la seora Ball observ tres variables para cada escala de vehculo: el precio de venta, la edad del comprador y el tipo de automvil. El precio de venta y la edad son variables cuantitativas, pero el tipo de vehculo es una medida cualitativa con dos valores, el domstico y el de importacin. Suponga que la seora Ball desea resumir las ventas del mes pasado empleando el tipo de vehculo. Para resumir los datos cualitativos, clasique los vehculos en domsticos (cdigo 1) y de importacin (cdigo 0), y cuente el nmero en cada clase. Emplee el tipo de vehculo para elaborar una tabla de frecuencias con dos clases mutuamente excluyentes (distintivas). Esto signica que un vehculo no puede pertenecer a ambas clases. El vehculo es domstico o de importacin y jams ser tanto domstico como de importacin. La tabla 2.1 es la tabla de frecuencias. El nmero de observaciones en cada clase recibe el nombre de frecuencia de clase. En este caso, la frecuencia de clase de los vehculos domsticos vendidos es de 50.

TablA 2.1 Tabla de frecuencias de los vehculos vendidos en Whitner Autoplex el mes pasado
Tipo de automvil Domstico De importacin Nmero de automviles 50 30

Frecuencias relativas de clase


Es posible convertir las frecuencias de clase en frecuencias relativas de clase para mostrar la fraccin del nmero total de observaciones en cada clase. As, una frecuencia relativa capta la relacin entre la totalidad de elementos de una clase y el nmero total de observaciones. En el ejemplo de la venta de vehculos, busca conocer el porcentaje de automviles domsticos o de importacin del total de automviles vendidos. Para convertir una distribucin de frecuencias en una distribucin relativa de frecuencias, cada una de las frecuencias de clase se divide entre el total de observaciones. Por ejemplo, 0.625, que se obtiene al dividir 50 entre 80, es la fraccin de vehculos domsticos vendidos el mes pasado. La distribucin de frecuencias relativas aparece en la tabla 2.2.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

23

Tabla de frecuencias relativas de vehculos vendidos por tipo de vehculo TablA 2.2  en Whitner Autoplex el mes pasado
Tipo de vehculo Domstico De importacin Total

Cantidad vendida 50 30 80

Frecuencia relativa 0.625 0.375 1.000

Representacin grfica de datos cualitativos


El instrumento ms comn para representar una variable cualitativa en forma grca es la grfica de barras. En la mayora de los casos, el eje horizontal muestra la variable de inters y el eje vertical la cantidad, nmero o fraccin de cada uno de los posibles resultados. Una caracterstica distintiva de la grca de barras es que existe una distancia o espacio entre las barras. Es decir que, como la variable de inters es de naturaleza cualitativa, las barras no son adyacentes. Por consiguiente, una grca de barras es una representacin grca de una tabla de frecuencias mediante una serie de rectngulos de anchura uniforme, cuya altura corresponde a la frecuencia de clase. GRFICA DE BARRAS Aqu las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de clase son proporcionales a las alturas de las barras. Utilice los datos de Whitner Autoplex como ejemplo (grca 2.1). La variable de inters es el tipo de vehculo y la cantidad de cada tipo de vehculos vendidos es la frecuencia de clase. Represente el tipo de vehculo (domstico o de importacin) sobre el eje horizontal y la cantidad de cada artculo sobre el eje vertical. La altura de las barras, o rectngulos, corresponde a la cantidad de vehculos vendidos de cada tipo. As, en el caso de la cantidad de vehculos de importacin vendidos, la altura de la barra es de 30. El orden del tipo de vehculo, sea domstico o de importacin, representado en el eje X no tiene importancia, ya que los valores del tipo de automvil son de naturaleza cualitativa.
60

Cantidad vendida (Frecuencia de clase)

50 40 30 20 10 0 De importacin Domstico

Tipo de automvil (Variable de inters)

GRFICA 2.1 Vehculos vendidos por tipo el mes pasado en Whitner Autoplex Otra clase de grca de utilidad para describir informacin cualitativa es la grfica de pastel. GRFICA DE PASTEL Grfica que muestra la parte o porcentaje que representa cada clase del total de nmeros de frecuencia

24

Captulo 2

Se explican los detalles de construccin de una grca de pastel empleando la informacin de la tabla 2.3, la cual muestra una cada en los gastos de la lotera del estado de Ohio en 2004.

TablA 2.3 Gastos de la lotera del estado de Ohio


Utilizacin del dinero de las ventas Premios Gastos en educacin Bonos/Comisiones Gastos de operacin Total Cantidad (millones de dlares) 1 276.0 648.1 132.8 97.7 2 154.6 Porcentaje o parte 59 30 6 5 100

El primer paso para elaborar una grca de pastel consiste en registrar los porcentajes 0, 5, 10, 15, etc., uniformemente alrededor de la circunferencia de un crculo (vase grca 2.2). Para indicar la parte de 59% destinada a premios, trace una lnea del centro del crculo al 0, y otra lnea del centro del crculo al 59%. El rea de esta rebanada representa lo que se recaud y se destin a premios. Enseguida sume 59% de gastos en premios al 30% de gastos en educacin; el resultado es 89%. Trace una lnea del centro del crculo al 89%; de esta manera el rea entre 59% y 89% seala los gastos en educacin. A continuacin, sume 6% en bonos y comisiones, lo cual da un total de 95%. Trace una lnea del centro del crculo a 95%; as, la rebanada entre 89% y 95% representa los pagos en bonos y comisiones. El restante 5% corresponde a gastos de operacin.

Bonos/ Comisiones 89%

Gastos de operacin 95% 0%

75%

Educacin

Premios

25%

59%

50%

GRFICA 2.2 Grfica de pastel de los gastos de la lotera del estado de Ohio en 2004

Ya que cada rebanada de pastel representa la porcin relativa de cada componente, es posible compararlas con facilidad: El gasto ms cuantioso de la lotera de Ohio se canaliza en premios. Cerca de una tercera parte de los fondos recaudados se transeren a educacin. Los gastos de operacin apenas corresponden a 5% de los fondos recaudados.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

25

El sistema de Excel crear una grca de pastel. La siguiente grca contiene la informacin de la tabla 2.3.

Ejemplo

SkiLodges.com realiza una prueba de mercado de su nuevo sitio web y le interesa saber con qu facilidad se navega en su diseo de pgina web. Selecciona al azar 200 usuarios frecuentes de internet y les pide que lleven a cabo una tarea de investigacin en la pgina web. A cada individuo le solicita que calique la relativa facilidad para navegar como mala, buena, excelente o sobresaliente. Los resultados aparecen en la siguiente tabla:
Sobresaliente Excelente Buena Mala 102 58 30 10

1. Qu tipo de escala de medicin se emplea para facilitar la navegacin? 2. Elabore una grca de barras con los resultados de la encuesta. 3. Construya una grca de pastel con los resultados de la encuesta. Los datos se miden de acuerdo con una escala ordinal. Es decir, que la escala se grada en conformidad con la facilidad relativa y abarca de malo a sobresaliente. Adems, el intervalo entre cada calicacin se desconoce, as que resulta imposible, por ejemplo, concluir que una buena calicacin representa el doble de una mala calicacin. Es posible usar una grca de barras para representar los datos. La escala vertical muestra la frecuencia relativa y la horizontal los valores relativos a la facilidad de medida de navegacin.

Solucin

26

Captulo 2

Facilidad de navegacin: grca de barras 60 50 Frecuencia relativa % 40 30 20 10 0 Mala Buena Excelente Sobresaliente

Tambin se emplea una grca de pastel para representar estos datos. La grca de pastel hace hincapi en que ms de la mitad de los encuestados calicaron de sobresaliente la relativa facilidad para utilizar el sitio web.

Facilidad de navegacin: grca de pastel Mala 5%

Buena 15% Sobresaliente 51%

Excelente 29%

Autoevaluacin 2.1

Las respuestas se encuentran al final del captulo. DeCenzo Specialty Food and Beverage Company sirve una bebida de cola con un sabor adicional, Cola-Plus, muy popular entre sus clientes. La compaa se encuentra interesada en la preferencia de los consumidores por Cola-Plus en comparacin con Coca-Cola, Pepsi y una bebida de lima-limn. Se pidi a 100 consumidores elegidos de forma aleatoria que degustaran una prueba y eligieran la bebida que ms les gustaba. Los resultados aparecen en la siguiente tabla:

Bebida Cola-Plus Coca-Cola Pepsi Lima-limn Total

Nmero 40 25 20 15 100

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

27

a)  Son los datos de naturaleza cuantitativa o cualitativa? Por qu razn? b)  Qu nombre recibe la tabla? Qu muestra la tabla? c)  Disee una grfica de barras para describir la informacin. d)  Dibuje una grfica de pastel utilizando las frecuencias relativas.

Ejercicios
Las respuestas a los ejercicios impares se encuentran al nal del libro.  Consulte el peridico local, USA Today o internet y localice dos ejemplos de variables cualita1. tivas.  En un estudio de mercado, se pidi a 100 consumidores que seleccionaran el mejor repro2. ductor musical digital entre iPod, iRiver y Magic Star MP3. Con la nalidad de resumir las respuestas de los consumidores en una tabla de frecuencias, cuntas clases tendra la tabla de frecuencias?  Se pregunt a un total de 1 000 residentes de Minnesota qu estacin del ao preferan. Los 3. resultados fueron que a 100 les gustaba ms el invierno; a 300, la primavera; a 400, el verano y a 200, el otoo. Si se resumieran los datos en una tabla de frecuencias, cuntas clases seran necesarias? Cules seran las frecuencias relativas de cada clase?  Se pregunt a dos mil viajeros de negocios frecuentes de Midwestern qu ciudad de la regin 4. central de Estados Unidos preferan: Indianpolis, San Luis, Chicago o Milwaukee. A 100 les gustaba ms Indianpolis; a 450, San Luis; a 1 300, Chicago y el resto prefera Milwakee. Elabore una tabla de frecuencias y una tabla de frecuencias relativas para resumir esta informacin.  Wellstone, Inc., produce y comercializa fundas de reposicin para telfonos celulares en una 5. variedad de colores. A la compaa le gustara circunscribir sus planes de produccin a cinco diferentes colores: blanco brillante, negro metlico, lima magntico, naranja tangerina y rojo fusin. La compaa mont un quiosco en el Mall of America por varias horas y pregunt, a gente elegida de forma aleatoria, qu color de funda era su favorito. Los resultados fueron los siguientes:

Blanco brillante Negro metlico Lima magntico Naranja tangerina Rojo fusin

130 104 325 455 286

a) Qu nombre recibe la tabla? b) Elabore una grca de barras para la tabla. c) Dibuje una grca de pastel. d )  Si Wellstone, Inc., tiene planes de producir un milln de fundas para telfono celular, cuntas de cada color debera producir? 6. Un pequeo negocio de consultora investiga el desempeo de diversas compaas. Las ven  tas del cuarto trimestre del ao pasado (en miles de dlares) de las compaas seleccionadas fueron las siguientes:

Compaa Hoden Building Products J & R Printing, Inc. Long Bay Concrete Construction Mancell Electric and Plumbing Maxwell Heating and Air Conditioning Mizelle Roofing & Sheet Metals

Ventas del cuarto trimestre (miles de dlares) $ 1 645.2 4 757.0 8 913.0 627.1 24 612.0 191.9

La consultora desea incluir una grca en su informe, para comparar las ventas de seis compaas. Utilice una grca de barras para comparar las ventas del cuarto trimestre de estas empresas y redacte un breve informe que resuma la grca de barras.

28

Captulo 2

Construccin de distribuciones de frecuencias: datos cuantitativos


En el captulo 1 y en ste se ha distinguido entre datos cualitativos y cuantitativos. En la seccin anterior aparece un resumen de la variable cualitativa el tipo de vehculo mediante una tabla de frecuencias una tabla de frecuencias relativas, una grca de barras y una grca de pastel utilizando los datos de Whitner Autoplex. Los datos de Whitner Autoplex tambin incluyen variables cuantitativas: el precio de venta y la edad del comprador. Suponga que la seora Ball desea resumir las ventas del ltimo mes utilizando el precio de venta; entonces describir el precio de venta por medio de una distribucin de frecuencias. DISTRIBUCIN DE FRECUENCIAS Agrupacin de datos en clases mutuamente excluyentes, que muestra el nmero de observaciones que hay en cada clase. Cmo crear una distribucin de frecuencias? El primer paso consiste en acomodar los datos en una tabla que muestre las clases y el nmero de observaciones que hay en cada clase. Los pasos para construir una distribucin de frecuencias se entienden mejor con un ejemplo. Recuerde que el objetivo es construir tablas, diagramas y grcas que revelen rpidamente la concentracin y distribucin de los datos.

Ejemplo

Regrese a la situacin en que la seora Kathryn Ball de AutoUSA desea tablas, diagramas y grcas para mostrar el precio tpico de venta en diversas concesionarias. La tabla 2.4 contiene exclusivamente el precio de 80 vehculos vendidos el mes pasado en Whitner Autoplex. Cul es el precio tpico de venta? Cul es el precio de venta ms alto? Cul es el precio de venta ms bajo? Alrededor de qu valor tienden a acumularse los precios de venta? TablA 2.4 Precios de vehculos vendidos el mes pasado en Whitner Autoplex
Ms bajo $23 197 18 021 20 047 19 873 20 004 20 203 24 052 20 356 20 962 21 740 24 220 21 556 $23 372 28 683 24 285 25 251 17 357 23 765 25 799 21 442 22 845 22 374 30 655 21 639 $20 454 30 872 24 324 25 277 20 155 25 783 15 794 21 722 26 285 24 571 22 442 24 296 $23 591 19 587 24 609 28 034 19 688 26 661 18 263 19 331 27 896 25 449 17 891 $26 651 23 169 28 670 24 533 23 657 32 277 35 925 22 817 29 076 28 337 20 818 $27 453 35 851 15 546 27 443 26 613 20 642 17 399 19 766 32 492 20 642 26 237 Ms alto $17 266 19 251 15 935 19 889 20 895 21 981 17 968 20 633 18 890 23 613 20 445

Solucin

Se llama datos en bruto o datos no agrupados a la informacin desorganizada de la tabla 2.4. Con un poco de paciencia, encuentre el precio de venta ms bajo ($15 546) y el precio de venta ms alto ($35 925), pero eso es todo. Resulta difcil determinar un precio de venta representativo. Tambin se complica la visualizacin del punto donde los precios tienden a acumularse. Los datos en bruto se interpretan con mayor facilidad si se organizan como una distribucin de frecuencias. Paso 1: Defina el nmero de clases. El objetivo consiste en emplear sucientes  agrupamientos o clases, de manera tal que se perciba la forma de la distribucin. Aqu se necesita criterio. Una gran cantidad de clases o muy pocas podran no permitir ver la forma fundamental del conjunto de datos. En el ejemplo del precio de venta del vehculo, tres clases no daran mucha informacin sobre el patrn de los datos (vea tabla 2.5). Una receta til para determinar la cantidad de clases (k) es la regla de 2 a la k. Esta gua sugiere que se elija el menor nmero (k) para el

Pasos para organizar datos como distribucin de frecuencias.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

29

TablA 2.5 Ejemplo de una cantidad muy pequea de clases


Precio de venta del vehculo ($) De 15 000 a 24 000 De 24 000 a 33 000 De 33 000 a 42 000 Nmero de vehculos 48 30 2 80

Estadstica en accin
En 1788, James Madison, John Jay y Alexander Hamilton publicaron annimamente una serie de ensayos titulados The Federalist. Estos documentos constituan un intento para convencer a la gente de Nueva York de que debera ratificarse la Constitucin. En el transcurso de la historia, se lleg a conocer a los autores de estos documentos, aunque doce permanecieron en el anonimato. A travs del anlisis estadstico y, en particular, del estudio de la frecuencia con la que se utilizan varias palabras, ahora podemos concluir que James Madison es el probable autor de los doce documentos. De hecho, la evidencia estadstica de que Madison es el autor es abrumadora.

Total

nmero de clases de tal manera que 2k (en palabras, dos elevado a la k-sima potencia) sea mayor que el nmero de observaciones (n). En el ejemplo de Whitner Autoplex, se haban vendido 80 vehculos. De esta manera, n = 80. Si supone que k = 6, lo cual signica que utilizar seis clases, entonces 26 = 64, algo menos que 80. De ah que 6 no represente sucientes clases. Si k = 7, entonces 27 = 128, que es mayor que 80. Por tanto, el nmero de clases que se recomienda es de 7. Paso 2: Determine el intervalo o ancho de clase. El intervalo o ancho de cla  se debera ser el mismo para todas las clases. Todas las clases juntas deben cubrir por lo menos la distancia del valor ms bajo al ms alto de los datos. Expresado esto en una frmula sera: i H L k

en la que i es el intervalo de clase; H, el mximo valor observado; L, el mnimo valor observado y k, el nmero de clases. En el caso de Whitner Autoplex, el valor ms bajo es $15 546 y el ms alto, $35 925. Si necesitamos 7 clases, el intervalo debera ser por lo menos ($35 925 $15 546)/7 = $2 911. En la prctica, este tamao de intervalo normalmente se redondea a una cifra conveniente, tal como un mltiplo de 10 o 100. En este caso, el valor de $3 000 podra emplearse sin inconvenientes. Los intervalos de clase desiguales originan problemas en el momento de representar grcamente la distribucin y en la realizacin de algunos clculos, como ver en captulos posteriores. Sin embargo, los intervalos de clase desiguales resultan necesarios en ciertos casos para evitar una gran cantidad de clases vacas, o casi vacas. Es el caso de la tabla 2.6. Internal Revenue Service en Estados Unidos utiliz intervalos de clase de TablA 2.6  Ingreso bruto ajustado para personas que presentan declaraciones del impuesto
sobre la renta
Ingreso bruto ajustado Ingreso bruto no ajustado $ 1 a $ 5 000 5 000 a 10 000 10 000 a 15 000 15 000 a 20 000 20 000 a 25 000 25 000 a 30 000 30 000 a 40 000 40 000 a 50 000 50 000 a 75 000 75 000 a 100 000 100 000 a 200 000 200 000 a 500 000 500 000 a 1 000 000 1 000 000 a 2 000 000 2 000 000 a 10 000 000 10 000 000 o ms Nmero de declaraciones (en miles) 178.2 1 204.6 2 595.5 3 142.0 3 191.7 2 501.4 1 901.6 2 502.3 1 426.8 1 476.3 338.8 223.3 55.2 12.0 5.1 3.4 0.6

30

Captulo 2

diferente tamao para informar el ingreso bruto ajustado sobre declaraciones de impuestos. De haber utilizado intervalos del mismo tamao, de $1 000, se habran requerido ms de 1 000 clases para representar todos los impuestos. Una distribucin de frecuencias de 1 000 clases sera difcil de interpretar. En este caso la distribucin resulta fcil de entender a pesar de las clases desiguales. Observe que en esta tabla en particular, el nmero de declaraciones de impuestos sobre la renta o frecuencias se presenta en miles de unidades. Esto tambin facilita la comprensin de la informacin. Paso 3:  Establezca los lmites de cada clase. Esto es importante para que sea posible incluir cada observacin en una sola categora. Esto signica que debe evitar la superposicin de lmites de clase confusos. Por ejemplo, clases como $1 300-$1 400 y $1 400-$1 500 no deberan emplearse porque no resulta claro si el valor de $1 400 pertenece a la primera o a la segunda clase. Las clases como $1 300-$1 400 y $1 500-$1 600 se emplean con frecuencia, aunque tambin pueden resultar confusas sin la convencin general adicional de redondear todos los datos de $1 450 o por arriba de esta cantidad a la segunda clase y los datos por debajo de $1 400 a la primera clase. En este libro se emplea el formato de $1 300 hasta $1 400 y de $1 400 hasta $1 500 y as sucesivamente. Con este formato resulta claro que $1 399 pertenece a la primera clase y $1 400 a la segunda. Al redondear el intervalo de clase hacia arriba con el n de obtener un tamao conveniente de clase, se cubre un rango ms amplio que el necesario. Por ejemplo, 7 clases de $3 000 de amplitud en el caso de Whitner Autoplex dan como resultado un rango de 7($3 000) = $21 000. El rango real es de $20 379, calculado mediante la operacin $35 925 $15 546. Al comparar este valor con $21 000, hay un excedente de $621. Como slo necesita abarcar la distancia (H L), resulta natural poner cantidades aproximadamente iguales del excedente en cada una de las dos colas. Por supuesto, tambin se deberan elegir lmites convenientes de clase. Una directriz consiste en convertir el lmite inferior de la primera clase en un mltiplo del intervalo de clase. A veces esto no es posible, pero el lmite inferior por lo menos debe redondearse. Ahora bien, stas son las clases que podra utilizar para estos datos:
$15 000 18 000 21 000 24 000 27 000 30 000 33 000 a a a a a a a 18 000 21 000 24 000 27 000 30 000 33 000 36 000

Paso 4: Anote los precios de venta de los vehculos en las clases. Para  comenzar, el precio de venta del primer vehculo en la tabla 2.4 es de $23 197. ste se anota en la clase de $21 000 a $24 000. El segundo precio de venta de la primera columna de la tabla 2.4 es $18 021. El que se anota en la clase de $18 000 a $21 000. Los dems precios de venta se cuadran de forma similar. Cuando todos los pecios de venta se hayan registrado, la tabla tendr la siguiente apariencia:
Clase $15 000 $18 000 $21 000 $24 000 $27 000 $30 000 $33 000 a a a a a a a $18 000 $21 000 $24 000 $27 000 $30 000 $33 000 $36 000 Cuenta |||| ||| |||| |||| |||| |||| ||| |||| |||| |||| || |||| |||| |||| ||| |||| ||| |||| ||

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

31

Paso 5:  Cuente el nmero de elementos de cada clase. El nmero de elementos que hay en cada clase recibe el nombre de frecuencia de clase. En la clase de $15 000 a $18 000 hay 8 observaciones, y en la clase de $18 000 a $21 000 hay 23 observaciones. Por tanto, la frecuencia de clase de la primera clase es de 8, y la frecuencia de clase en la segunda es de 23. Hay un total de 80 observaciones o frecuencias en todo el conjunto de datos. Con frecuencia resulta til expresar los datos en millares o en unidades ms convenientes, no con los datos reales. Por ejemplo, la tabla 2.7 contiene los precios de venta de vehculos en miles de dlares, no en dlares. TablA 2.7 Distribucin de frecuencias de precios de ventas en Whitner Autoplex del mes pasado
Precios de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36 Frecuencia 8 23 17 18 8 4 2 80

Total

Ahora que ha organizado los datos en una distribucin de frecuencias, resuma el patrn de los precios de venta de los vehculos en el lote de AutoUSA de Whitner Autoplex en Raytown, Missouri. Observe lo siguiente: 1.  Los precios de venta abarcan alrededor de $15 000 a aproximadamente $36 000. 2.  Los precios de venta se concentran entre $18 000 y $27 000. Un total de 58, o 72.5%, de los vehculos vendidos caen dentro de este rango. 3.  La mxima concentracin, o frecuencia ms alta, se encuentra en la clase que va de $18 000 a $21 000. La mitad de la clase se ubica en $19 500. De manera que $19 500 representa un precio tpico de venta. Si se le presenta esta informacin a la seora Ball, se le da una claro panorama de la distribucin de los precios de venta del mes pasado. Admita que la disposicin de la informacin sobre la venta de precios en una distribucin de frecuencias da como resultado la prdida de informacin detallada. Es decir que al organizar los datos en una distribucin de frecuencias, no es posible ubicar con exactitud precios de venta como $23 197 o $26 237. Tampoco puede decir que el precio de venta real del vehculo menos caro era de $15 546 y el del ms caro de $35 925. Sin embargo, el lmite inferior de la primera clase y el lmite superior de la clase ms grande comunican esencialmente el mismo signicado. Lo ms probable es que la seora Ball llegar a la misma conclusin si conoce que el precio ms bajo es de aproximadamente $15 000 que si sabe que el precio exacto es de $15 546. Las ventajas de condensar los datos de forma ms entendible y organizada compensa por mucho esta desventaja.

Autoevaluacin 2.2

Las comisiones que obtuvieron los once miembros del personal de ventas de Master Chemical Company durante el primer trimestre del ao pasado son las siguientes:

$1 650 $1 475 $1 510 $1 670 $1 595 $1 760 $1 540 $1 495 $1 590 $1 625 $1 510
a) Cmo se denomina a valores de $1 650 y $1 475? b)  Designe a las cantidades que van de $1 400 a $1 500 como la primera clase; a las que van de $1 500 a $1 600, como la segunda clase y as en lo sucesivo, y organice las comisiones trimestrales como distribucin de frecuencias. c)  Cmo se denominan los nmeros de la columna derecha de la distribucin de frecuencias que cre?

32

Captulo 2

d)  Describa la distribucin de las comisiones trimestrales sobre la base de la distribucin de frecuencias. Cul es la concentracin ms grande de comisiones adquiridas? Cul es la menor y cul la mayor? Cul es la tpica cantidad ganada?

Intervalos de clase y puntos medios de clase


Con frecuencia aparecern otros dos trminos: punto medio de clase e intervalo de clase. El punto medio se encuentra a la mitad, entre los lmites inferiores de dos clases consecutivas. ste se calcula sumando los lmites inferiores de clases consecutivas y dividiendo el resultado entre dos. En el caso de la tabla 2.7, el lmite de clase inferior de la primera clase es de $15 000 y el siguiente lmite de $18 000. El punto medio de clase es $16 500, que se calcula mediante la operacin ($15 000 + $18 000)/2. El punto medio de $16 500 representa mejor, o es tpico de, el precio de venta de los vehculos que pertenecen a dicha clase. Para determinar el intervalo de clase, se resta el lmite inferior de la clase del lmite inferior de la siguiente clase. El intervalo de clase de los datos del precio de venta del vehculo es de $3 000, que se determina sustrayendo el lmite inferior de la primera clase, $15 000, del lmite inferior de la siguiente clase; es decir, $18 000 $15 000 = $3 000. Tambin se puede determinar el intervalo de clase calculando la diferencia entre puntos medios consecutivos. El punto medio de la primera clase es $16 500 y el punto medio de la segunda clase es $19 500. La diferencia es $3 000.

Ejemplo con asistencia de software


Como se indic en el captulo 1, existen diversos paquetes de software que permiten llevar a cabo clculos estadsticos. A lo largo del libro aparecen los resultados de Microsoft Excel; MegaStat, que es un complemento de Microsoft Excel y de MINITAB. Los comandos que se necesitan para generar los resultados aparecen en la seccin Comandos de software al nal del captulo. La siguiente pantalla constituye una distribucin de frecuencias, generada por MegaStat, la cual muestra los precios de 80 vehculos vendidos el mes pasado en el lote de Whitner Autoplex, ubicado en Raytown, Missouri. La forma de la salida de datos es algo diferente que la de la distribucin de frecuencias de la tabla 2.7, aunque las conclusiones generales son las mismas.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

33

Autoevaluacin 2.3

Barry Bonds, jugador de los Gigantes de San Francisco, estableci una nueva marca de cuadrangulares en una sola temporada al conectar 73 durante la temporada 2001. En el ms largo, la bola recorri 488 pies y en el ms corto, 320 pies. Usted necesita construir una distribucin de frecuencias de las longitudes de estos cuadrangulares. a) Cuntas clases requerir? b) Qu intervalo de clase sugiere? c) Qu clases reales sugiere?

Distribucin de frecuencias relativas


Una distribucin de frecuencias relativas convierte la frecuencia en un porcentaje

Quiz resulte conveniente convertir frecuencias de clase en frecuencias relativas de clase, igual que con los datos cualitativos, con el n de mostrar la fraccin del total de observaciones que hay en cada clase. En el ejemplo de la venta de vehculos, podra interesarle saber qu porcentaje de los precios de vehculos se encuentra en la clase que va de $21 000 a $24 000. En otro estudio, tal vez importe saber qu porcentaje de los empleados tom de 5 a 10 das libres el ao pasado. Para convertir una frecuencia de distribuciones en una distribucin relativa, cada una de las clases de frecuencias se divide entre el nmero total de observaciones. En el caso de la distribucin de precios de venta de vehculos (tabla 2.7, en la que el precio de venta se expresa en miles de dlares), la frecuencia relativa para la clase de $15 000 a $18 000 es de 0.10, que se determina dividiendo 8 entre 80. Es decir que el precio de 10% de los vehculos vendidos en Whitner Autoplex se encuentra entre $15 000 y $18 000. Las frecuencias relativas del resto de las clases aparecen en la tabla 2.8. TablA 2.8  Distribucin de frecuencias relativas de los precios de los vehculos vendidos
el mes pasado en Whitner Autoplex
Precio de venta (miles de dlares) Frecuencia 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36 8 23 17 18 8 4 2 80 Frecuencia relativa 0.1000 0.2875 0.2125 0.2250 0.1000 0.0500 0.0250 1.0000

Clculo 8/80 23/80 17/80 18/80 8/80 4/80 2/80

Total

Autoevaluacin 2.4

Consulte la tabla 2.8, la cual muestra la distribucin de frecuencias relativas de los vehculos vendidos el mes pasado en Whitner Autoplex. a) Cuntos vehculos se vendieron a un precio de entre $18 000 y $21 000? b) Qu porcentaje de vehculos se vendi a un precio de entre $18 000 y $21 000? c) Qu porcentaje de vehculos se vendi en $30 000 o ms?

Ejercicios
7.  Un conjunto de datos constan de 38 observaciones. Cuntas clases recomendara para la distribucin de frecuencias? 8.  Un conjunto de datos consta de 45 observaciones entre $0 y $29. Qu tamao recomendara usted para el intervalo de clase? 9.  Un conjunto de datos consta de 230 observaciones entre $235 y $567. Qu intervalo de clase recomendara?

34

Captulo 2

10.  Un conjunto de datos contiene 53 observaciones. El valor ms bajo es 42 y el ms alto 129. Los datos se van a organizar en una distribucin de frecuencias. a) Cuntas clases sugerira? b) Qu cantidad sugerira como lmite inferior de la primera clase? 11.  Wachesaw Manufacturing, Inc., produjo la siguiente cantidad de unidades los pasados 16 das. 27 26 27 28 27 26 28 28 27 31 25 30 25 26 28 26

La informacin se va a organizar en una distribucin de frecuencias. a) Cuntas clases recomendara? b) Qu intervalo de clase sugerira? c) Qu lmite inferior recomendara para la primera clase? d )  Organice la informacin en una distribucin de frecuencias y determine la distribucin de frecuencias relativas. e) Comente la forma de la distribucin. 12.  Quick Change Oil Company cuenta con varios talleres en el rea metropolitana de Seattle. Las cantidades diarias de cambios de aceite que se realizaron en el taller de Oak Street los pasados 20 das son las siguientes: 65 70 98 62 55 66 62 80 79 94 59 79 51 63 90 73 72 71 56 85

Los datos se van a organizar en una distribucin de frecuencias. a) Cuntas clases recomendara usted? b) Qu intervalo de clase sugerira? c) Qu lmite inferior recomendara para la primera clase? d ) Organice el nmero de cambios de aceite como distribucin de frecuencias. e)  Haga comentarios sobre la forma de la distribucin de frecuencias. Determine, asimismo, la distribucin de frecuencias relativas. 13.  El gerente de BiLo SUpermarket en Mt. Pleasant, Rhode Island, reuni la siguiente informacin sobre la cantidad de veces que un cliente visita la tienda durante un mes. Las respuestas de 51 clientes fueron las siguientes: 5 1 8 1 3 14 4 10 3 1 7 8 1 2 6 9 4 4 5 2 4 4 9 12 5 4 11 6 5 3 4 6 12 2 3 4 6 5 7 6 3 6 6 4 5 7 5 15 1 6 1

a)  Comience a partir de 0 como lmite inferior de la primera clase, utilice un intervalo de clase de 3 y organice los datos en una distribucin de frecuencias. b) Describa la distribucin. Dnde tienden a acumularse los datos? c) Convierta la distribucin en una distribucin de frecuencias relativas. 14.  La divisin de servicios alimenticios de Cedar River Amusement Park, Inc., estudia la cantidad que gastan al da en alimento y bebida las familias que visitan el parque de diversiones. Una muestra de 40 familias que visit el parque ayer revela que stas gastan las siguientes cantidades: $77 $18 $63 $84 $38 $54 $50 $59 $54 $56 $36 $26 $50 $34 $44 41 58 58 53 51 62 43 52 53 63 62 62 65 61 52 60 60 45 66 83 71 63 58 61 71 a)  Organice los datos como distribucin de frecuencias utilizando siete clases y el 15 como lmite inferior de la primera clase. Qu intervalo de clase eligi? b) Dnde tienden a acumularse los datos? c) Describa la distribucin. d ) Determine la distribucin de frecuencias relativas.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

35

Representacin grfica de una distribucin de frecuencias


A menudo gerentes de ventas, analistas de bolsa, administradores de hospitales y otros ejecutivos ocupados necesitan una vista rpida de las tendencias de las ventas, los precios de las acciones o costos de hospitalizacin. A menudo estas tendencias se describen por medio de tablas y grcas. Tres grcas que sern de utilidad para representar grcamente una distribucin de frecuencias son el histograma, el polgono de frecuencias y el polgono de frecuencias acumuladas.

Histograma
Un histograma de una distribucin de frecuencias basadas en datos cuantitativos se asemeja mucho a la grca de barras, que muestra la distribucin de datos cualitativos. Las clases se sealan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de las barras. Ahora bien, existe una importante diferencia como consecuencia de la naturaleza de los datos. Por lo general, los datos cuantitativos se miden con escalas continuas, no discretas. Por consiguiente, el eje horizontal representa todos los valores posibles y las barras se colocan de forma adyacente para que muestren la naturaleza continua de los datos. HISTOGRAMA Grfica en la que las clases se sealan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de las barras, stas se dibujan de manera adyacente. Resuma los precios de venta una variable continua de los 80 vehculos vendidos el mes pasado en Whitner Autoplex mediante una distribucin de frecuencias. Construya un histograma para ilustrar esta distribucin de frecuencias.

Ejemplo

Enseguida aparece la distribucin de frecuencias.


Precios de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36

Frecuencia 8 23 17 18 8 4 2 80

Total

Construya un histograma. Qu conclusiones obtiene de la informacin que se presenta en el histograma?

Solucin

Las frecuencias de clase se colocan en una escala ubicada en el eje vertical (eje Y) y a lo largo del eje horizontal ya sean los lmites de clase o los puntos medios de clase. Para ilustrar la construccin del histograma, las primeras tres clases aparecen en la grca 2.3.

36

Captulo 2

Cantidad de vehculos (frecuencia de clase)

30 20 10 15 8

23 17

18

21

24

Precio de venta (miles de dlares)

GRFICA 2.3 Construccin de un histograma Observe que en la grca 2.3 hay ocho vehculos en la clase de $15 000 a $18 000. Por consiguiente, la altura de la columna para dicha clase es 8. Hay 23 vehculos en la clase que va de $18 000 a $21 000. Por consiguiente, es lgico que la altura de dicha columna sea 23. La altura de la barra representa el nmero de observaciones en la clase. Este procedimiento se aplica en el caso de todas las clases. El histograma completo aparece en la gura 2.4. Advierta que no hay espacio entre las barras. sta es una caracterstica del histograma. Debido a que la variable marcada en el eje horizontal es cuantitativa y pertenece a la escala de medicin de intervalo o, en este caso, de razn. En las grcas de barras descritas antes, las barras verticales se encuentran separadas.
40

Cantidad de vehculos

30 20 10 15 8 18

23 17 18 8 21 24 27 30 Precio de venta (miles de dlares)

4 33

2 36

GRFICA 2.4 Histograma de precios de venta de 80 vehculos en Whitner Autoplex A partir del histograma de la grca 2.4, es posible concluir lo siguiente: 1.  El precio de venta ms bajo es de alrededor de $15 000, y el ms alto de aproximadamente $36 000; 2.  La frecuencia de clase ms grande va de $18 000 a $21 000. Dentro de este margen se venden un total de 23 de los 80 vehculos; 3.  Cincuenta y ocho vehculos, o 72.5%, tenan un precio de venta entre $18 000 y $27 000. Por consiguiente, el histograma proporciona una representacin visual de una distribucin de frecuencias de fcil interpretacin. Tambin cabe sealar que de haber empleado una distribucin de frecuencias relativas en lugar de las frecuencias reales, las conclusiones y la forma del histograma hubieran sido las mismas. Es decir, si hubiera empleado las frecuencias relativas de la tabla 2.8, el histograma obtenido tendra la misma forma que la grca 2.4. La nica diferencia consiste en que el eje vertical representara el porcentaje de vehculos en lugar de la cantidad de vehculos.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

37

Para generar el histograma de los datos de ventas de vehculos de Whitner Autoplex sirve el sistema Microsoft Excel (que aparece en la pgina 28). Advierta que los puntos medios de clase se emplean como etiquetas para las clases. Los comandos del software para crear este resultado se incluyen en la seccin Comandos de software, que aparece al nal del captulo.

Polgono de fecuencias
En un polgono de frecuencias, los puntos medios de clase se unen por medio de un segmento de recta.

Un polgono de frecuencias tambin muestra la forma que tiene una distribucin y es similar a un histograma. Consiste en segmentos de recta que conectan los puntos formados por las intersecciones de los puntos medios de clase y las frecuencias de clase. En la grca 2.5 se ilustra la construccin de un polgono de frecuencias. Se emplearon los precios de los vehculos vendidos el mes pasado en Whitner Autoplex. El punto medio de cada clase se indica en una escala en el eje X y las frecuencias de clase en el eje Y. Recuerde que el punto medio de clase es el valor localizado en el centro de una clase y representa los valores tpicos de dicha clase. La frecuencia de clase es el nmero de observaciones que hay en una clase particular. Los precios de venta de los vehculos en Whitner Autoplex son los siguientes:

Precios de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36

Punto medio 16.5 19.5 22.5 25.5 28.5 31.5 34.5

Frecuencia 8 23 17 18 8 4 2 80

Total

38

Captulo 2

Estadstica en accin
A Florence Nightingale se le conoce como la fundadora de la profesin de enfermera. Sin embargo, tambin salv muchas vidas con la ayuda del anlisis estadstico. Cuando se encontraba en condiciones poco higinicas o en un hospital sin suficientes provisiones, mejoraba las condiciones y, enseguida, empleaba los datos estadsticos para documentar las mejoras. De esta manera convenci a otros de la necesidad de una reforma mdica, en particular en el rea de salubridad. Dise grficas originales para demostrar que, durante la guerra de Crimea, murieron ms soldados a causa de las condiciones insalubres que los muertos en combate. La grfica contigua, creada por Nightingale, es una grfica de rea polar, la cual muestra los porcentajes mensuales de las causas de muerte desde abril de 1854 hasta marzo de 1855.

Muertes por heridas en el campo de batalla Muertes por otras causas Muertes por enfermedad Abril de 1854 a marzo de 1855
Mayo Bulgaria Junio

Julio

Agosto

Septiembre

Abril de 1854 Crimea Octubre Marzo de 1855

Noviembre

Frecuencia Diciembre

Enero de 1855

Como se seal antes, la clase que va de $15 000 a $18 000 se encuentra representada por el punto medio $16 500. Para construir un polgono de frecuencias, hay que desplazarse horizontalmente sobre la grca al punto medio, $16.5, y enseguida verticalmente al 8, la frecuencia de clase, donde se coloca un punto. Los valores de X y de Y de este punto reciben el nombre de coordenadas. Las coordenadas del siguiente punto son X = $19.5 y Y = 23. El proceso contina para todas las clases. Posteriormente los puntos se conectan en orden. Es decir que el punto que representa la clase ms baja se une al que representa la segunda clase y as en lo sucesivo. En la grca 2.5, note que para completar el polgono de frecuencias, se aaden los puntos medios de $13.5 y $37.5 para anclar el polgono en la frecuencia cero. Estos dos valores, $13.5 y $37.5 se dedujeron restando el intervalo de clase $3.0 al punto medio ms bajo ($16.5) y sumando $3.0 al punto medio ms alto ($34.5) en la distribucin de frecuencias.
40 Frecuencias 30 20 10 13.5 16.5 19.5 22.5 25.5 28.5 31.5 34.5 37.5 40.5

Precio de venta (miles de dlares)

GRFICA 2.5 Polgono de frecuencias de los precios de venta de 80 vehculos en Whitner Autoplex Tanto el histograma como el polgono de frecuencias permiten tener una vista rpida de las principales caractersticas de lo datos (mximos, mnimos, puntos de concentracin, etc.). Aunque las dos representaciones tienen un propsito similar, el histograma posee la ventaja de que describe cada clase como un rectngulo, en el que la barra de altura de ste representa el nmero de elementos que hay en cada clase. El polgono de frecuencias, en cambio, tiene una ventaja con respecto al histograma. Tambin permite comparar directamente dos o ms distribuciones de frecuencias. Suponga que la seora Ball de AutoUSA desea comparar el lote de Whitner Autoplex, ubicado en Raytown, Missouri, con un lote similar, el de Fowler Auto Mall, ubicado en Grayling, Michigan. Para

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

39

hacerlo, se construyen dos polgonos de frecuencias, uno sobre el otro, como lo muestra la grca 2.6. A partir de la grca resulta evidente que el precio de venta tpico de los vehculos es ms alto en Fowler Auto Mall.
40

Frecuencias

30 20 10 13.5 16.5 19.5 22.5 25.5 28.5 31.5 34.5

Fowler Auto Mall Whitner Autoplex

37.5

40.5

Precio de venta (miles de dlares)

GRFICA 2.6 Distribucin de precios de venta de vehculos en Whitner Autoplex y Fowler Auto
Mall

El nmero total de frecuencias en las dos concesionarias es aproximadamente el mismo, as que es posible llevar a cabo una comparacin directa. Si la diferencia en el nmero total de frecuencias es mucho mayor, convertir las frecuencias en frecuencias relativas y representar enseguida las dos distribuciones permitira obtener una comparacin ms clara.

Autoevaluacin 2.5

Las importaciones anuales de un grupo proveedores en electrnica aparece en la siguiente distribucin de frecuencias.

Importaciones (millones de dlares)

Nmero de proveedores

2 a 5 6 5 a 8 13 8 a 11 20 11 a 14 10 14 a 17 1
a) Represente las importaciones por medio de un histograma. b) Muestre las importaciones por medio de un polgono de frecuencias relativas. c)  Resuma las facetas importantes de la distribucin (como clases, incluyendo las frecuencias ms alta y ms baja).

Ejercicios
15.  Mollys Candle Shop tiene diversas tiendas de venta de menudeo en las reas costeras de Carolina del Norte y Carolina del Sur. Muchos de los clientes de Mollys han solicitado que les enve sus compras. La siguiente grca muestra el nmero de paquetes enviados por da durante los pasados 100 das.

30

28 23 13 5 5 10 15 20 25 Nmero de paquetes 18 10 3 30 35

Frecuencia

20 10 0

a) Qu nombre recibe la grca? b) Cul es el nmero total de frecuencias? c) Cul es el intervalo de clase?

40

Captulo 2

d) Cul es la frecuencia de clase para la clase de 10 a 15? e) Cul es la frecuencia relativa de la clase de 10 a 15? f) Cul es el punto medio de la clase de 10 a 15? g) En cuntos das se enviaron 25 o ms paquetes? 16.  La siguiente grca muestra el nmero de pacientes admitidos diariamente en el Memorial Hospital por la sala de urgencias.

Frecuencia

30 20 10 0 2 4 6 8 Nmero de pacientes 10 12

a) Cul es el punto medio de la clase que va de 2 a 4? b) Cuntos das se admiti de 2 a 4 pacientes? c) Aproximadamente cuntos das fueron estudiados? d) Cul es el intervalo de clase? e) Qu nombre recibe esta grca? 17.  La siguiente distribucin de frecuencias muestra el nmero de millas de viajero frecuente, expresado en miles de millas, de empleados de Brumley Statistical Consulting, Inc., durante el primer trimestre de 2007. Millas de viajero frecuente (miles) 0 a 3 3 a 6 6 a 9 9 a 12 12 a 15 Total Nmero de empleados 5 12 23 8 2 50

a) Cuntos empleados se estudiaron? b) Cul es el punto medio de la primera clase? c) Construya un histograma. d)  Dibuje un polgono de frecuencias. Cules son las coordenadas de la marca correspondiente a la primera clase? e) Construya un polgono de frecuencias. f) Interprete las millas de viajero frecuente acumuladas utilizando las dos grcas. 18. Ecommerce.com, un minorista grande de internet, estudia el tiempo de entrega (el tiempo que  transcurre desde que se hace un pedido hasta que se entrega) en una muestra de pedidos recientes. Los tiempos de espera se expresan en das. Tiempo de espera (das) 0 a 5 5 a 10 10 a 15 15 a 20 20 a 25 Total Frecuencia 6 7 12 8 7 40

a) Cuntos pedidos se estudiaron? b) Cul es el punto medio de la primera clase? c)  Cules son las coordenadas de la primera clase en un polgono de frecuencias? d) Trace un histograma. e) Dibuje un polgono de frecuencias. f) Interprete los tiempos de espera utilizando las dos grcas.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

41

Distribuciones de frecuencia acumulativas


Considere de nuevo la distribucin de los precios de venta de vehculos en Whitner Autoplex. El inters radica en la cantidad de vehculos vendidos en menos de $21 000, o en el valor debajo del cual se vendi 40% de los vehculos. Estas cantidades se aproximan elaborando una distribucin de frecuencias acumulativas con representacin grca de un polgono de frecuencias acumulativas.

Ejemplo

La distribucin de frecuencias de los precios de venta de los vehculos en Whitner Autoplex se repite de la tabla 2.7.
Precio de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36 Frecuencia 8 23 17 18 8 4 2 80

Total

Construya un polgono de frecuencias acumulativas. En menos de qu cantidad se vendi 50% de los vehculos? En menos de qu cantidad se vendieron veinticinco vehculos?

Solucin

Como su nombre lo indica, una distribucin de frecuencias acumulativas y un polgono de frecuencias acumulativas implican frecuencias acumulativas. Para construir una distribucin de frecuencias acumulativas, consulte la tabla anterior y observe que se vendieron ocho vehculos en menos de $18 000. Esos 8 vehculos, ms 23 de la siguiente clase, que dan un total de 31, se vendieron en menos de $21 000. La frecuencia acumulativa de la siguiente clase superior es de 48, calculada mediante la operacin 8 + 23 + 17. Este proceso se repite en el caso de todas las clases. Todos los vehculos se vendieron en menos de 36 000 (vea la tabla 2.9). Para trazar una distribucin de frecuencias acumulativas, se ubica el lmite superior de cada clase en una escala a lo largo del eje X y las correspondientes frecuencias acumulativas, a lo largo del eje Y. Para incluir informacin adicional, grade el eje vertical a la izquierda en unidades y el eje vertical a la derecha en porcentajes. En el ejemplo de Whitner Autoplex, el eje vertical localizado a la izquierda se grada desde 0 hasta 80 y a la derecha de 0% a 100%. El valor de 50% corresponde a 40 vehculos vendidos.

42

Captulo 2

TablA 2.9  Distribucin de frecuencias acumulativas para el precio de venta de vehculos


Precio de venta (miles de dlares) Frecuencia 15 a 18 18 a 21 21 a 24 24 a 27 27 a 30 30 a 33 33 a 36 Total 8 23 17 18 8 4 2 80 Frecuencia acumulativa 8 31 48 66 74 78 80 Clculo 8 + 23 8 + 23 + 17 8 + 23 + 17 + 18

Para comenzar el trazo, 8 vehculos se vendieron en menos de $18 000, as que la primera marca se coloca en X = 18 y Y = 8. Las coordenadas de la siguiente marca son: X = 21 y Y = 31. Se dibuja el resto de los puntos y enseguida se conectan para formar la grca que sigue.

80 70 60 50 40 30 20 10 15 18 21 24 27 30 33 Precio de venta (miles de dlares)

100

75

50

25

36

Distribucin de frecuencias acumulativas del precio de venta de vehculos GRFICA 2.7

Para determinar el precio de venta debajo del cual se vendi la mitad de los vehculos, trace una lnea horizontal en la marca de 50%, ubicada en el eje vertical de la derecha, hasta el polgono; enseguida baje al eje X y lea el precio de venta. El valor sobre el eje X es aproximadamente de 22.5, as que 50% de los vehculos se vendieron en menos de $22 500. Para determinar el precio debajo del cual se vendieron 25 de los vehculos, localice el valor de 25 en el eje vertical de la derecha. Enseguida trace una lnea horizontal a partir del valor de 25 al polgono y entonces baje al eje X y lea el precio. Este es de aproximadamente 20.5, as que 25 de los vehculos se vendieron en menos de $20 500. Tambin es posible hacer aproximaciones del porcentaje de vehculos vendidos en menos de cierta cantidad. Por ejemplo, suponga que desea calcular el porcentaje de vehculos vendidos en menos de $28 500. Comience localizando el valor de 28.5 en el eje X, desplcese por la vertical hasta el polgono y enseguida por la horizontal hasta el eje vertical de la derecha. El valor es de aproximadamente 87%, as que 87% de los vehculos se vendieron en menos de $28 500.

Porcentaje de vehculos vendidos

Nmero de vehculos vendidos

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

43

Autoevaluacin 2.6

Una muestra de salarios por hora de 15 empleados de Home Depot, ubicada en Brunswick, Georgia, se organiz en la siguiente tabla:

Salarios por hora $ 8 a $10 10 a 12 12 a 14 14 a 16

Nmero de empleados 3 7 4 1

a) Qu nombre recibe la tabla? b)  Elabore una distribucin de frecuencias acumulativas y represente la distribucin en un polgono de frecuencias acumulativas. c)  De acuerdo con el polgono de frecuencias acumulativas, cuntos empleados ganan $11.00 o menos la hora? La mitad de los empleados ganan ms? Cuatro empleados ganan menos?

Ejercicios
 La siguiente grca muestra los salarios por hora de una muestra de soldadores en la zona de 19. Atlanta, Georgia.

40
Frecuencia

100
Porcentaje Porcentaje

30 20 10 0 5 10 15 20 Salario por hora 25

75 50 25 30

 20.

a) A cuntos soldadores se estudi? b) Cul es el intervalo de clase? c) Aproximadamente cuntos soldadores ganan menos de $10.00 la hora? d) Cerca de 75% de los soldadores ganan menos de qu cantidad? e) Diez de los soldadores estudiados ganan menos de qu cantidad? f) Qu porcentaje de soldadores gana menos de $20.00 la hora? La siguiente grca muestra los precios de venta (miles de dlares) de casas vendidas en la zona de Billings, Montana.

200
Frecuencia

100 75 50 25 0 50 100 150 200 250 Precio de venta (miles de dlares) 300 350

150 100 50

44

Captulo 2

 21.

a) Cuntas casas se estudiaron? b) Cul es el intervalo de clase? c) En menos de qu cantidad se vendieron 100 casas? d) En menos de qu cantidad se vendi aproximadamente 75% de las casas? e)  Aproxime el nmero de casas vendidas en la clase que va de $150 000 a $200 000. f ) Qu cantidad de casas se venden en menos de $225 000? Se repite la distribucin de frecuencias del ejercicio 17, que representa el nmero de millas de viajero frecuente acumuladas por empleados de Brumley Statistical Consulting Company.

Millas de viajero frecuente (miles) 0 3 6 9 12 a a a a a 3 6 9 12 15

Frecuencia 5 12 23 8 2 50

Total

a) Cuntos empleados acumularon menos de 3 000 millas? b) Convierta la distribucin en una distribucin de frecuencias acumulativas. c)  Represente la distribucin acumulativa en forma de polgono de frecuencias acumulativas. d)  De acuerdo con el polgono de frecuencias, cuntas millas acumul 75% de los empleados? 22. La distribucin de frecuencias de los tiempos de espera en Ecommerce.com, en el ejercicio  18, se repite a continuacin.

Tiempo de espera (das) 0 5 10 15 20 a a a a a 5 10 15 20 25

Frecuencia 6 7 12 8 7 40

Total

a)  Cuntos pedidos se despacharon en menos de 10 das? En menos de 15 das? b)  Convierta la distribucin de frecuencias en una distribucin de frecuencias acumulativas. c) Disee un polgono de frecuencias acumulativas. d) En menos de cuntos das se despach alrededor de 60% de los pedidos?

Resumen del captulo


I.  Una tabla de frecuencias es una agrupacin de datos cualitativos en clases mutuamente excluyentes, que muestra el nmero de observaciones que hay en cada clase. II.  Una tabla de frecuencias relativas muestra la fraccin del nmero de frecuencias en cada clase. III. Una grca de barras es una representacin de una tabla de frecuencias. IV.  Una grca de pastel muestra la parte que cada diferente clase representa del nmero total de frecuencias. V.  Una distribucin de frecuencias es una agrupacin de datos en clases mutuamente excluyentes que muestra el nmero de observaciones que hay en cada clase. A. Los pasos para construir una distribucin de frecuencias son los siguientes: 1. Decidir el nmero de clases. 2. Determinar el intervalo de clase. 3. Establecer los lmites de cada clase. 4. Anotar los datos en bruto de las clases. 5. Enumerar el nmero de elementos en cada clase.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

45

VI.  VII. 

B. La frecuencia de clase es el nmero de observaciones que hay en cada clase. El intervalo de clase es la diferencia entre los lmites de dos clases consecutivas. C. D. El punto medio de clase representa la mitad entre los lmites de clases consecutivas. Una distribucin de frecuencias relativas muestra el porcentaje de observaciones de cada clase. Existen tres mtodos para hacer una representacin grca de una distribucin de frecuencias.  Un histograma representa en forma de rectngulo el nmero de frecuencias en cada claA. se.  Un polgono de frecuencias consiste en segmentos de recta que unen los puntos formados B. por la interseccin del punto medio de clase con la frecuencia de clase.  Una distribucin de frecuencias acumulativas muestra el nmero o porcentaje de observaC. ciones por debajo de valores dados.

Ejercicios del captulo


23.  Describa las similitudes y diferencias de las variables cualitativa y cuantitativa. Asegrese de incluir lo siguiente: a) Cul es el nivel de medicin que se requiere para cada tipo de variable? b) Ambos tipos sirven para describir muestras y poblaciones? 24.  Describa las similitudes y diferencias de una tabla de frecuencias y una distribucin de frecuencias. Asegrese de incluir cul requiere datos cualitativos y cul datos cuantitativos. 25.  Alexandra Damonte construir un nuevo centro vacacional en Myrtle Beach, Carolina del Sur. Debe decidir la manera de disear el centro vacacional sobre la base del tipo de actividades que ofrecer el centro vacacional a sus clientes. Una encuesta reciente de 300 posibles clientes mostr los siguientes resultados relacionados con las preferencias de los consumidores en lo que se reere a actividades recreativas:

Les gustan las actividades planeadas 63 No les gustan las actividades planeadas 135 No estn seguros 78 No responden 24

a) Qu nombre recibe la tabla? b) Disee una grca de barras para representar los resultados de la encuesta. c) Trace una grca de pastel para los resultados de la encuesta. d)  Si usted se est preparando para presentar los resultados a la seora Damonte como parte de un informe, qu grca preferira mostrar? Por qu? 26.  Speedy Swift es un servicio de reparto de mercanca que atiende el rea metropolitana ms grande de Atlanta, Georgia. Para conservar la lealtad del consumidor, uno de los objetivos de desempeo de Speedy Swift es la entrega a tiempo. Con el n de supervisar su desempeo, cada entrega se mide de acuerdo con la siguiente escala: anticipada (mercanca entregada antes del tiempo prescrito); a tiempo (mercanca entregada cinco minutos dentro del tiempo prescrito); tarde (mercanca entregada ms de cinco minutos despus del tiempo prescrito); extraviada (mercanca no entregada). El objetivo de Speedy Swift consiste en entregar 99% de la mercanca en forma anticipada o a tiempo. Otro objetivo es jams perder un paquete. Speedy recogi los siguientes datos del desempeo del mes pasado:

A tiempo Anticipada Anticipada Anticipada A tiempo A tiempo Anticipada A tiempo A tiempo A tiempo

A tiempo A tiempo A tiempo A tiempo Tarde Tarde Anticipada A tiempo Anticipada A tiempo

Anticipada A tiempo Anticipada A tiempo Tarde Anticipada A tiempo Anticipada A tiempo A tiempo

Tarde Anticipada A tiempo Tarde A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo

A tiempo A tiempo A tiempo Anticipada A tiempo Anticipada Tarde Anticipada A tiempo A tiempo

A tiempo A tiempo A tiempo Anticipada A tiempo A tiempo Anticipada A tiempo Tarde Anticipada

A tiempo A tiempo Anticipada A tiempo A tiempo Extraviada Extraviada Anticipada A tiempo Anticipada

A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo Anticipada A tiempo

Tarde A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo Tarde A tiempo A tiempo

A tiempo A tiempo A tiempo Anticipada A tiempo A tiempo A tiempo A tiempo A tiempo A tiempo

46

Captulo 2

a)  Qu escala se emple para medir el desempeo del reparto? Qu clase de variable es el desempeo del reparto? b) Construya una tabla de frecuencias para el desempeo de reparto para el mes pasado. c) Construya una tabla de frecuencias relativas para el desempeo del mes pasado. d) Dibuje una grca de barras de la tabla de frecuencias para el desempeo del mes pasado. e) Construya una grca de pastel del desempeo del reparto a tiempo para el mes pasado. f)  Analice los resmenes de datos y redacte una evaluacin del desempeo del reparto del mes pasado en relacin con los objetivos de desempeo de Speedy. Escriba una recomendacin general para un anlisis posterior. 27.  Un conjunto de datos incluye 83 observaciones. Cuntas clases recomendara para una distribucin de frecuencias? 28.  Un conjunto de datos consta de 145 observaciones que van de 56 a 490. Qu tamao de intervalo de clase recomendara? 29.  A continuacin se muestra el nmero de minutos que le lleva a un grupo de ejecutivos viajar en automvil de su casa al trabajo.

28 31

25 26

48 21

37 32

41 25

19 31

32 43

26 35

16 42

23 38

23 33

29 28

36

30. 

a) Cuntas clases recomendara? b) Cuntos intervalos de clase sugerira? c) Qu intervalo de clase sugerira como el lmite inferior de la primera clase? d) Organice los datos en una distribucin de frecuencias. e) Haga comentarios sobre la forma de la distribucin de frecuencias. Los siguientes datos proporcionan las cantidades semanales que gasta en abarrotes una muestra de casas.

$271 279 192 116 429

$363 205 181 100 294

$159 279 321 151 570

$ 76 266 309 240 342

$227 199 246 474 279

$337 177 278 297 235

$295 162 50 170 434

$319 232 41 188 123

$250 303 335 320 325

a) Cuntas clases recomendara? b) Qu intervalo de clase sugerira? c) Cul recomendara como lmite inferior de la primera clase? d) Organice los datos en una distribucin de frecuencias. 31.  El siguiente histograma muestra los resultados en el primer examen de una clase de estadstica.

25 20 15 10 5 0

21 14 3 12 6

Frecuencia
32. 

50 60 70 80 90 100 Resultado

a) Cuntos estudiantes presentaron el examen? b) Cul es el intervalo de clase? c) Cul es el punto medio de la primera clase? d) Cuntos estudiantes obtuvieron un resultado inferior a 70? La siguiente grca resume el precio de venta de casas vendidas el mes pasado en la zona de Sarasota, Florida.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

47

250 200 150 100 50 0 50 100 150 200 250 300 Precio de venta (miles de dlares)

100 50 25 350

Frecuencia

33. 

a) Qu nombre recibe la grca? b) Cuntas casas se vendieron el mes pasado? c) Cul es el intervalo de clase? d) En menos de qu cantidad se vendi 75% de las casas? e) En menos de qu cantidad se vendieron 175 casas? Una cadena de tiendas deportivas que satisface las necesidades de los esquiadores principiantes, con matriz en Aspen, Colorado, planea llevar a cabo un estudio sobre la cantidad de dinero que un esquiador principiante gasta en su compra inicial de equipo y provisiones. Con base en estas cantidades, desea analizar la posibilidad de ofrecer equipo, como un par de botas y un par de esqus, para inducir a los clientes a comprar ms. Una muestra de los comprobantes de la caja registradora revel las siguientes compras iniciales:

$140 86 139 161 175

$ 82 125 149 135 127

$265 235 132 172 149

$168 212 105 220 126

$ 90 171 162 229 121

$114 149 126 129 118

$172 156 216 87 172

$230 162 195 128 126

Porcentaje

75

$142 118 127 126

a)  Sugiera un intervalo de clase. Utilice seis clases y tome $70 como lmite inferior de la primera clase. b) Cul sera el mejor intervalo de clase? c) Organice los datos en una distribucin de frecuencias utilizando lmite inferior de $80. d) Interprete sus hallazgos. 34.  Las siguientes son las cantidades de accionistas de un grupo selecto de compaas grandes (en miles):

Compaa Southwest Airlines General Public Utilities Occidental Petroleum Middle South Utilities DaimlerChrysler Standard Oil of California Bethlehem Steel Long Island Lighting RCA Greyhound Corporation Pacific Gas & Electric Niagara Mohawk Power E. I. du Pont de Nemours Westinghouse Electric Union Carbide BankAmerica Northeast Utilities

Cantidad de accionistas (miles) Compaa 144 Standard Oil (Indiana) 177 Home Depot 266 Detroit Edison 133 Eastman Kodak 209 Dow Chemical 264 Pennsylvania Power 160 American Electric Power 143 Ohio Edison 246 Transamerica Corporation 151 Columbia Gas System 239 International Telephone & 204 Telegraph 204 Union Electric 195 Virginia Electric and Power 176 Public Service Electric & Gas 175 Consumers Power 200

Cantidad de accionistas (miles) 173 195 220 251 137 150 262 158 162 165 223 158 162 225 161

48

Captulo 2

 Las cantidades de accionistas se organizarn en una distribucin de frecuencias y se disearn varias grcas para representar la distribucin. a) Utilizando siete clases y un lmite inferior de 130, construya una distribucin de frecuencias. b) Represente la distribucin como polgono de frecuencias. c) Dibuje la distribucin en un polgono de frecuencias acumulativas. d)  De acuerdo con el polgono, cuntos accionistas tienen tres de las cuatro (75%), o menos, compaas? e)  Redacte un breve anlisis relacionado con el nmero de accionistas con base en la distribucin de frecuencias y las grcas. 35.  Una encuesta reciente mostr que el estadounidense tpico que posee automvil gasta $2 950 anuales en gastos de operacin. En seguida aparece un desglose detallado de los gastos en artculos. Disee una grca adecuada para representar los datos y resumir sus hallazgos en un breve informe.

Artculo que genera el gasto Gasolina Intereses de crdito del automvil Reparaciones Seguro y licencia Depreciacin Total

Gasto $ 603 279 930 646 492 $2 950

36.  Midland National Bank seleccion una muestra de 40 cuentas de cheques de estudiantes. Enseguida aparecen sus saldos de n de mes.

$404 87 703 968

$ 74 234 125 712

$234 68 350 503

$149 489 440 489

$279 57 37 327

$215 185 252 608

$123 141 27 358

$ 55 758 521 425

$ 43 72 302 303

$321 863 127 203

a)  Organice los datos en una distribucin de frecuencias utilizando $100 como intervalo de clase y $0 como punto de partida. b) Elabore un polgono de frecuencias acumulativas. c)  El banco considera a cualquier estudiante con un saldo nal de $400 o ms como un cliente preferido. Calcule el porcentaje de clientes preferidos. d)  El banco tambin est haciendo un cargo por servicio de 10% a los saldos nales ms bajos. Qu cantidad recomendara como punto lmite entre los que pagan un cargo por servicio y los que no lo hacen? 37.  En 2005, los residentes de Carolina del Sur ganaron un total de $69 500 millones de dlares en 2005 por concepto de ingreso bruto ajustado. Setenta y tres por ciento del total fue de sueldos y salarios; 11% de dividendos, intereses y utilidades sobre capital; 8% a fondos para el retiro y pensiones sujetas a impuestos; 3% a pensiones de ingresos por negocio; 2% de seguridad social y el 3% restante a otras fuentes. Genere una grca de pastel que describa el desglose del ingreso bruto ajustado. Redacte un prrafo que resuma la informacin. 38.  Un estudio reciente de tecnologas domsticas inform el nmero de horas de uso semanal de las computadoras personales en una muestra de 60 personas. Se excluyeron del estudio personas que laboraban fuera del hogar y empleaban la computadora como parte de su trabajo.

9.3 6.3 4.3 5.4 2.0 4.5

5.3 2.1 9.7 4.8 6.7 9.3

6.3 8.8 2.7 0.4 7.7 5.2 2.1 10.1 1.1 6.7 7.9 4.6

6.5 3.7 1.7 1.3 2.2 4.3

0.6 3.3 8.5 5.6 2.6 4.5

5.2 1.1 4.2 2.4 9.8 9.2

6.6 2.7 5.5 2.4 6.4 8.5

9.3 6.7 5.1 4.7 4.9 6.0

4.3 6.5 5.6 1.7 5.2 8.1

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

49

a)  Organice los datos en una distribucin de frecuencias. Cuntas clases sugerira? Qu valor sugerira para un intervalo de clase? b) Elabore un histograma. Interprete el resultado que obtuvo. 39.  Merrill Lynch recin concluy un estudio relacionado con el tamao de las carteras de inversin en lnea (acciones, bonos, fondos mutuos y certicados de depsito) en una muestra de clientes de un grupo de 40 a 50 aos de edad. A continuacin aparece el valor de las inversiones en miles de dlares para los 70 participantes.

$669.9 301.9 136.4 380.7 228.6 39.5 31.3 221.1 295.7

$ 7.5 235.4 616.9 3.3 308.7 124.3 301.2 43.4 437.0

$ 77.2 716.4 440.6 363.2 126.7 118.1 35.7 212.3 87.8

$ 7.5 145.3 408.2 51.9 430.3 23.9 154.9 243.3 302.1

$125.7 26.6 34.4 52.2 82.0 352.8 174.3 315.4 268.1

$516.9 187.2 296.1 107.5 227.0 156.7 100.6 5.9 899.5

$ 219.9 315.5 185.4 82.9 321.1 276.3 236.7 1 002.2

$645.2 89.2 526.3 63.0 403.4 23.5 171.9 171.7

a)  Organice los datos en una distribucin de frecuencias. Cuntas clases sugerira? Qu valor propondra para un intervalo de clase? b) Disee un histograma. Interprete el resultado que obtuvo. 40.  En la primavera de 2005, un total de 5.9% del pblico que vea la televisin durante las horas de mayor audiencia vea programas de la ABC; 7.6% vea programas de la CBS; 5.5%, de Fox; 6.0%, de la NBC; 2.0%, de Warner Brothers y 2.2%, de UPN. Un total de 70.8% de la audiencia vea programas de otras cadenas televisivas de cable, como CNN y ESPN. El siguiente sitio web contiene informacin reciente sobre la audiencia televisiva: http://tv.zap2it. com/news/ratings. Disee una grca de pastel o una grca de barras para describir esta informacin. Redacte un prrafo que resuma sus hallazgos. 41.  La American Heart Association inform el siguiente desglose porcentual de gastos. Elabore una grca de pastel que represente la informacin. Interprete los resultados.

Categora Investigacin Educacin en salud pblica Servicio a la comunidad Recaudacin de fondos Entrenamiento tcnico y educativo Administracin y gastos generales

Porcentaje 32.3 23.5 12.6 12.1 10.9 8.6

42.  Los ingresos anuales, por tipo de impuesto, del estado de Georgia aparecen enseguida. Elabore el diagrama o grca adecuado y redacte un informe en el que resuma la informacin.

Tipo de impuesto Ventas Ingresos (individuales) Licencia Impuesto sobre la renta Propiedad Fallecimiento y donaciones Total

Cantidad (miles de dlares) $2 812 473 2 732 045 185 198 525 015 22 647 37 326 $6 314 704

43.  A continuacin se listan las importaciones anuales de socios comerciales canadienses seleccionados para el ao 2005. Disee un diagrama o grca adecuado y redacte un breve informe que resuma la informacin.

50

Captulo 2

Socio Japn Reino Unido Corea del Sur China Australia

Ingresos anuales (millones de dlares) $9 550 4 556 2 441 1 182 618

44.  La vida en las granjas ha cambiado desde principios del siglo XX. En los primeros aos del siglo XXI la maquinaria reemplaz gradualmente a la fuerza animal. Por ejemplo, en 1910 las granjas de Estados Unidos emplearon 24.2 millones de caballos y mulas, y slo alrededor de 1 000 tractores. Para 1960, 4.6 millones de tractores se empleaban y slo 3.2 millones de caballos y mulas. En 1920 haba ms de 6 millones de granjas en Estados Unidos. Hoy hay menos de 2 millones. En la lista que sigue aparece el nmero de granjas, en miles, en cada uno de los 50 estados. Redacte un prrafo en el que resuma sus hallazgos. 47 4 7 14 35 1 21 52 38 86 8 80 87 59 185 46 63 39 33 13 76 100 106 76 7 26 65 25 71 43 4 91 55 37 36 3 29 2 51 20 39 7 3 1 79 45 15 8 24 9

45.  Uno de los dulces ms populares en Estados Unidos es el M&M, fabricado por Mars Company. Al principio los dulces M&M eran todos cafs; ahora se producen en rojo, verde, azul, naranja, caf y amarillo. Si desea leer la historia del producto, localizar ideas para preparar pasteles con ste, comprar los dulces en los diferentes colores de su escuela o equipo favorito y conocer el porcentaje de cada color que contienen las bolsas normales visite http://global. mms.com/us/about/products/milkchocolate/. Hace poco una bolsa de 14 onzas de M&M en su presentacin regular contena 444 dulces distribuidos por colores de la siguiente manera: 130 cafs, 98 amarillos, 96 rojos, 35 anaranjados, 52 azules y 33 verdes. Elabore una grca que describa esta informacin y redacte un prrafo en el que resuma los resultados. 46.  La siguiente grca muestra la cantidad total de salarios pagados por compaas de software y areas en el estado de Washington de 1997 a 2005. Redacte un breve informe que resuma esta informacin.

$3.5
En miles de millones

Total de salarios pagados por compaas de software (trimestralmente) Total de salarios pagados por compaas areas (trimestralmente)

3.0 2.5 2.0 1.5 1.0 0.5 0 97 98 99 00 01 02 03 04 05

47.  Una grca de pastel muestra las acciones en el mercado de productos de cola. La rebanada que corresponde a Pepsi-Cola tiene un ngulo central de 90 grados. Cul es su participacin en el mercado?

ejercicios.com
48.  Las ventas mensuales y anuales de camiones se encuentran disponibles en el sitio web http://
www.pickuptruck.com. Dirjase a este sitio y busque en News la informacin ms reciente sobre ventas. Elabore una grca de pastel que muestre la informacin ms reciente. Cul es el camin mejor vendido? Cules son los cuatro o cinco camiones mejor vendidos? Cul es la participacin en el mercado? Quiz desee agrupar algunos de los camiones en una

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

51

categora denominada otros, para obtener una mejor idea de la participacin en el mercado. Comente sus descubrimientos.

Ejercicios de la base de datos


49.  Consulte los datos de inmobiliarias que aparecen en el apndice A, al nal del libro, los cuales contienen informacin sobre las casas vendidas en el rea de Denver, Colorado, el ao pasado. a) Organice los datos sobre la cantidad de recmaras en una frecuencia de distribucin. 1. Cul es el nmero tpico de recmaras? 2.  Cul es el nmero mnimo y el mximo nmero de recmaras que se ofrecen en el mercado? b)  Seleccione un intervalo de clase adecuado y organice los precios de venta en una distribucin de frecuencias. 1. Alrededor de qu valores tienden a acumularse los datos? 2. Cul es el precio de venta ms alto? Cul es el precio de venta ms bajo? c)  Elabore una distribucin de frecuencias acumulativas basada en la distribucin de frecuencias generada en el inciso b) 1. Cuntas casas se vendieron en menos de $200 000? 2. Calcule el porcentaje de casas que se vendieron en ms de $220 000. 3. Qu porcentaje de casas se vendi en menos de $125 000? 50.  Consulte los datos Baseball 2005, los cuales contienen informacin sobre los 30 equipos de las Ligas Mayores de Bisbol para la temporada 2005. a)  Organice la informacin sobre los salarios de los equipos en una distribucin de frecuencias. Seleccione un intervalo de clase apropiado. 1. Cul es el salario tpico de un equipo? Cul es el rango de salarios? 2.  Comente la forma de la distribucin. Parece que alguno de los salarios de los equipos no se encuentra en lnea con los dems? b)  Disee una distribucin de frecuencias acumulativas basada en la distribucin de frecuencias elaborada en el inciso a) 1.  Cuarenta por ciento de los equipos pagan menos de qu cantidad del salario total del equipo? 2. Cuntos equipos aproximadamente tiene salarios totales inferiores a $80 000 000? 3. Menos de qu cantidad pagan en salario total los cinco equipos con menos paga? c)  Organice la informacin relativa al tamao de los diversos estadios en una distribucin de frecuencias. 1.  Cul es el tamao de un estadio tpico? Dnde tienden a acumularse los tamaos de los estadios? 2.  Comente sobre la forma de la distribucin. Parece que algunos tamaos no estn en lnea con los dems? d)  Organice en una distribucin de frecuencias la informacin sobre el ao en que los 30 estadios de la liga mayor se construyeron. (Podra crear una nueva variable denominada edad sustrayendo el ao en el que se construy el estadio del ao en curso.) 1.  Cul es el ao en el que se construy el estadio tpico? Cules de esos aos tienden a agruparse? 2.  Comente sobre la forma de la distribucin. Parece que algunas de las antigedades de los estadios estn fuera de lnea con respecto de las dems? Si es as, cules? 51.  Consulte los datos Wage, que contienen informacin sobre salarios anuales de una muestra de 100 trabajadores. Tambin incluyen variables relacionadas con la industria, aos de educacin y gnero de cada trabajador. Dibuje una grca de barras de la variable ocupacin. Redacte un breve informe que resuma sus hallazgos. 52.  Consulte los datos CIA, los cuales contienen informacin demogrca y econmica de 46 pases. Elabore una distribucin de frecuencias para la variable PNB per cpita. Resuma sus hallazgos. Qu forma tiene la distribucin?

52

Captulo 2

Comandos de software
1.  Los comandos de Excel para la grca de pastel de la pgina 25 son los siguientes: a)  Active la celda A1 y escriba las palabras Uso de ventas. En las celdas A2 a A5 escriba Precios, Educacin, Bonos y Gastos. b)  Active la celda B1 y escriba Cantidad (millones de dlares) e introduzca los datos en las celdas B2 a B5. c)  De la barra de herramientas, seleccione Chart Wizard. Como tipo de grca seleccione Pie; seleccione el tipo de grca en la esquina superior izquierda y enseguida haga clic en Next. d)  En el caso del Data Range, escriba A1:B5, indique que los datos se encuentran en Columns, y enseguida haga clic en Next. e)  Haga clic en el rea para el ttulo y escriba Gastos de la Lotera de Ohio 2004. Enseguida haga clic en Finish.  Los comandos Excel para el histograma de la pgina 37 3. son los siguientes: a)  En la celda A1 indique que la columna de datos se reere al precio de venta y B1 a la frecuencia. En las celdas A2 a A8, inserte los puntos medios de los precios de venta en miles de dlares. En B1 a B8 registre las frecuencias de clase. b)  Con el ratn seale A1, haga clic y arrastre para resaltar las celdas A1:B8. c)  De la barra de herramientas seleccione Chart Wizard; bajo Chart type seleccione Column; bajo Chart subtype seleccione las barras verticales en la esquina superior izquierda y nalmente haga clic en Next en la esquina inferior derecha. d)  En la parte superior seleccione la etiqueta Serie. Bajo el recuadro de la lista Serie, se resalta Price. Seleccione Remove (no queremos que Precio forme parte de los valores). En la parte inferior, en el recuadro de texto Category (X) axis, haga clic en el cono ubicado en el extremo derecho. Coloque el cursor en la celda A2, haga clic y arrastre a la celda A8. Habr que recorrer un recuadro cerca de las celdas A2 a A8. Presione la tecla Enter. Esto identica la columna de Prices como eje de categoras X. Haga clic en Next. e)  En la parte superior del recuadro de dilogo haga clic en Titles. Haga clic en el recuadro Chart title y capture Precio de venta de 80 vehculos vendidos en el Whitner Autoplex Lot. Presione el tabulador y ubquese en el recuadro Category (X) axis y capture la etiqueta Precio de venta en miles de dlares. Oprima el tabulador para ubicarse en el recuadro Category(Y) axis e introduzca Frecuency. En la parte superior, seleccione Show legend y elimine la marca del recuadro de Show legend. Haga clic en Finish. f )  Para ampliar la grca, haga clic en el centro de la lnea superior y arrastre la lnea a la la 1. Asegrese de que los soportes aparezcan en el recuadro de la grca. Con el botn derecho del ratn, haga clic en una de las columnas. Seleccione Format Data Series. En la parte superior seleccione el rtulo Options. En el recuadro de texto Gap width, haga clic en la echa inferior hasta que el ancho del rango indique 0 y haga clic en OK.

 Los comandos de MegaStat para la distribucin de fre2. cuencias de la pgina 32 son: a)  Abra Excel y del disco incluido seleccione Data Sets y seleccione el formato de Excel; dirjase al captulo 2 y seleccione Whitner-2005. Haga clic en MegaStat, Frequency Distribution y seleccione Quantitative. b)  En el dilogo del recuadro introduzca el rango de A1:A81, seleccione Equal width intervals, utilice 3 000 como amplitud del intervalo, 15 000 como lmite inferior del primer intervalo, seleccione Histogram y enseguida haga clic en OK.

Descripcin de datos: Tablas de frecuencias, distribuciones de frecuencias

53

Captulo 2 Respuestas a las autoevaluaciones


2.1 a)  Datos cualitativos, ya que la respuesta de los consumidores a la prueba de degustacin es el nombre de una bebida. b)  Tabla de frecuencias. sta muestra el nmero de personas que preere cada una de las bebidas. c) c) Frecuencias de clase. d)  La concentracin ms grande de comisiones se encuentra entre $1 500 y $1 600. La comisin ms pequea es de aproximadamente $1 400 y la ms grande de casi $1 800. La cantidad tpica obtenida es de $15 500. a)  26 = 64 < 73 < 128 = 27. As que se recomiendan 7 clases. b)  La amplitud del intervalo debera ser de por lo menos (488 320)/7 = 24. Los intervalos de clase de 25 a 30 pies son razonables. c)  Si se utiliza un intervalo de clase de 25 pies y se comienza con un lmite inferior de 300 pies, seran necesarias ocho clases. Un intervalo de clase de 30 pies que comience con 300 pies tambin es razonable. Esta alternativa requiere solamente siete clases. a) 23 b)  28.75%, calculado de la siguiente manera: (23/80) 100. c) 7.5%, calculado de la siguiente manera: (6/80) 100 a)

2.3

40

30 Frecuencia 20 10 0 Cola-Plus Coca-Cola Pepsi Lima-limn Bebida


2.4 2.5

20

20 13 6 1 2 5 8 11 14 17 Importaciones (millones de dlares)

Nmero de proveedores

d)

15 10 5 0

10

Pepsi 20%

Lima-limn 15%

Coca-Cola 25%

Cola-Plus 40%

Porcentaje del total

40 30 20 10 0 2 5 8 11 14 Importaciones (millones de dlares) 17

2.2

a) Los datos brutos o datos no agrupados. b) Comisin $1 400 1 500 1 600 1 700 a a a a $1 500 1 600 1 700 1 800 Nmero de vendedores 2 5 3 1 11

 as puntos son: (3.5, 12), (6.5, 26), (9.5, 40), (12.5, 20) y L (15.5, 2). c)  El mnimo volumen anual de importaciones por parte de un proveedor es de aproximadamente $2 millones, el mximo, de $17 millones. La frecuencia ms alta se encuentra entre $8 millones y $11 millones.

Total

54
2.6

Captulo 2

a) Una distribucin de frecuencias.

15

Frecuencias acumulativas

b)

Salarios por hora Menos Menos Menos Menos Menos de de de de de $8 $10 $12 $14 $16

Nmero acumulado 0 3 10 14 15

12 8 4 0 X = 12 Y = 10

X = 14 Y = 14

10

12

14

16

Salarios por hora (en dlares)


c)  Alrededor de siete empleados ganan $11.00 o menos.  Cerca de la mitad de los empleados gana $11.25 o ms.  Alrededor de cuatro empleados gana $10.25 o menos.

Descripcin de datos
Medidas numricas

3
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Calcular la media aritmtica, la media ponderada, la mediana, la moda y la media geomtrica. 2. Explicar las caractersticas, usos, ventajas y desventajas de cada medida de ubicacin. 3. Identificar la posicin de la media, la mediana y la moda para las distribuciones simtrica y sesgada. 4. Calcular e interpretar el rango, la desviacin media, la varianza y la desviacin estndar. 5. Comprender las caractersticas, usos, ventajas y desventajas de cada medida de dispersin. 6. Comprender el teorema de Chebyshev y la regla emprica en relacin con un conjunto de observaciones.

Los pesos (en libras) de una muestra de cinco cajas que se envan por UPS son los siguientes: 12, 6, 7, 3 y 10. Calcule la desviacin estndar (vea ejercicio 76 y objetivo 4).

56

Captulo 3

Introduccin
El captulo 2 inicia al estudio de la estadstica descriptiva. Para transformar un cmulo de datos en bruto en algo con signicado, primero debe organizar los datos cuantitativos en una distribucin de frecuencias y despus hacer una representacin grca como un histograma; hay otras tcnicas para gracar, como las grcas de pastel, til para representar datos cualitativos, y polgonos de frecuencias para representar datos cuantitativos. Este captulo presenta dos formas numricas de describir datos cuantitativos: las medidas de ubicacin y las medidas de dispersin. A las medidas de ubicacin a menudo se les llama promedios. El propsito de una medida de ubicacin consiste en sealar el centro de un conjunto de valores. Usted est familiarizado con el concepto de promedio, medida de ubicacin que muestra el valor central de los datos. Los promedios aparecen diario en televisin, en el peridico y otras publicaciones. He aqu algunos ejemplos: La casa promedio en Estados Unidos cambia de dueo cada 11.8 aos.  El precio promedio de un galn de gasolina, la semana pasada, en Carolina del Sur era de $2.47 de acuerdo con un estudio de la Asociacin Estadounidense de Automviles.  El costo promedio por conducir un automvil particular es de $10 361 anuales en Los ngeles; de $9 660 anuales en Boston; de $10 762 anuales en Filadela.  Un estadounidense recibe un promedio de 568 piezas de correspondencia cada ao.  El salario inicial promedio para un graduado de la escuela de administracin el ao pasado era de $38 254. Para un graduado con licenciatura en artes liberales, era de $30 212.  Hay 26.4 millones de golstas mayores de 12 aos en Estados Unidos. Cerca de 6.1 millones son fervientes golstas; es decir que juegan un promedio de 25 partidos al ao. Ms informacin relacionada con los golstas: el costo medio de un partido de golf en un campo pblico de 18 hoyos en Estados Unidos es de $30. Hoy da, el tpico golsta es hombre, de 40 aos de edad, con un ingreso familiar de $68 209.  En Chicago la temperatura media alta es de 84 grados en julio y de 31 grados en enero. La precipitacin media es de 3.80 pulgadas en julio y de 1.90 pulgadas en enero. Si slo toma en cuenta las medidas de ubicacin en un conjunto de datos o si compara varios conjuntos de datos utilizando valores centrales, llegar a una conclusin incorrecta. Adems de las medidas de ubicacin, debe tomar en consideracin la dispersin, denominada con frecuencia variacin o propagacin, en los datos. Por ejemplo, suponga que el ingreso anual promedio de los ejecutivos de compaas relacionadas con Internet es de $80 000 y que el ingreso promedio de ejecutivos de compaas farmacuticas es tambin de $80 000. Si slo atiende a los ingresos promedio, podra concluir, equivocadamente, que las dos distribuciones de salarios son idnticas o casi idnticas. Un vistazo a los rangos salariales indica que esta conclusin no es correcta. Los salarios de los ejecutivos en las empresas de Internet van de $70 000 a $90 000, en cambio los salarios de los ejecutivos de marketing de la industria farmacutica van de $40 000 a $120 000. Por consiguiente, aunque los salarios promedio son los mismos en las dos industrias, hay ms propagacin o dispersin en los salarios de los ejecutivos de la industria farmacutica. Para describir la dispersin considere el rango, la desviacin media, la varianza y la desviacin estndar. En principio se discuten las medidas de ubicacin. No existe una medida de dispersin; de hecho, existen varias. Consideraremos cinco: la media aritmtica, la media ponderada, la mediana, la moda y la media geomtrica. La media aritmtica es la medida de ubicacin que ms se utiliza y que se publica con mayor frecuencia. Considerar la media como parmetro de poblacin y como estadstico de las muestras.

Estadstica en accin
Se ha topado alguna vez con un estadounidense promedio? Pues bien, se llama Robert (nivel nominal de la medicin); tiene 31 aos (nivel de razn); mide 1.77 metros (otro nivel de razn de la medicin); pesa 78 kilogramos; calza del 9; su cintura mide 85 cm de dimetro y viste trajes talla 40. Adems, el hombre promedio come 1.8 kg de papas fritas; mira 2 567 horas el televisor y se come 11.77 kg de pltanos al ao, adems de que duerme 7.7 horas cada noche. La estadounidense promedio mide 1.64 metros de estatura y pesa 64 kg, mientras que la modelo estadounidense promedio mide 1.65 metros y pesa 53 kg. Un da cualquiera, casi la mitad de las mujeres en Estados Unidos est a dieta. Idolatrada en la dcada de los cincuenta, Marilyn Monroe se considerara con sobrepeso segn los estndares de hoy. Usaba vestidos de las tallas 14 a la 18, y era una mujer saludable y atractiva.

Descripcin de datos: Medidas numricas

57

La media poblacional
Muchos estudios incluyen todos los valores que hay en una poblacin. Por ejemplo, hay 39 salidas en la carretera interestatal 75, que pasa por el estado de Kentucky. La distancia media entre dichas salidas es de 4.76 millas. ste es el parmetro poblacional, ya que es la distancia entre todas las salidas. Hay 12 asociados de ventas empleados en la tienda de menudeo Reynolds Road, de Carpets by Otto. El monto promedio de comisiones que ganaron el mes pasado fue de $1 345. ste es el valor poblacional, puesto que considera la comisin de todos los asociados de ventas. Otros ejemplos de media poblacional seran los siguientes: el precio de cierre promedio de las acciones de Johnson & Johnson durante los ltimos 5 das es de $61.75; la tasa anual promedio de recuperacin durante los ltimos 10 aos de Berger Funds es de 8.67% y el promedio de horas extra que trabajaron la semana pasada los seis soldadores del departamento de soldadura de Butts Welding, Inc., es de 6.45 horas. En el caso de los datos en bruto, que no han sido agrupados en una distribucin de frecuencias, la media poblacional es la suma de todos los valores en la poblacin dividida entre el nmero de valores de la poblacin. Para determinar la media poblacional, aplique la siguiente frmula: Media poblacional = Suma de todos los valores en la poblacin Nmero de valores en la pob blacin

En lugar de escribir las instrucciones completas para calcular la media poblacional (o cualquier otra medida), resulta ms conveniente utilizar smbolos matemticos adecuados. La media de una poblacin con smbolos matemticos es = MEDIA POBLACIONAL X N

[3.1]

en la cual: representa la media poblacional; se trata de la letra minscula griega mu; N es el nmero de valores en la poblacin; X representa cualquier valor particular; es la letra mayscula griega sigma e indica la operacin de suma; X es la suma de X valores en la poblacin. Cualquier caracterstica medible de una poblacin recibe el nombre de parmetro. La media de una poblacin es un parmetro. PARMETRO Caracterstica de una poblacin. Hay 12 compaas fabricantes de automviles en Estados Unidos. Enseguida aparece la lista del nmero de patentes concedidas por el Gobierno de Estados Unidos a cada compaa en un ao reciente.
Compaa General Motors Nissan DaimlerChrysler Toyota Honda Ford Nmero de patentes concedidas Compaa 511 385 275 257 249 234 Nmero de patentes concedidas

Ejemplo

Mazda 210 Chrysler 97 Porsche 50 Mitsubishi 36 Volvo 23 BMW 13

Representa esta informacin una muestra o una poblacin? Cul es la media aritmtica del nmero de patentes concedidas?

58

Captulo 3

Solucin

Es una poblacin, ya que se toma en cuenta a todas las compaas fabricantes que consiguen patentes. Sume el nmero de patentes de cada una de las 12 compaas. El nmero total de patentes de las 12 compaas es de 2 340. Para determinar la media aritmtica, divida este total entre 12. As, la media aritmtica es 195, calculada mediante la operacin 2 340/12. De acuerdo con la frmula 3.1, = 511 + 385 + + 13 2 340 = = 195 12 12

Cmo interpretar el valor 195? El nmero tpico de patentes que recibe una compaa fabricante de automviles es 195. Como se ha tomado en cuenta a todas las compaas que reciben patentes, este valor es un parmetro poblacional.

Media de una muestra


Como se explic en el captulo 1, con frecuencia se selecciona una muestra de la poblacin para encontrar algo sobre una caracterstica especca de la poblacin. Por ejemplo, el departamento de control de calidad necesita asegurarse de que los rodamientos de balas fabricados tengan un dimetro externo aceptable. Resultara muy costoso y consumira demasiado tiempo vericar el dimetro externo de todos los rodamientos producidos. Por consiguiente, se selecciona una muestra de cinco rodamientos y se calcula el dimetro externo de cinco rodamientos para aproximar el dimetro medio de todos. En el caso de los datos en bruto, de los datos no agrupados, la media es la suma de los valores de la muestra, divididos entre el nmero total de valores de la muestra. La media de una muestra se determina de la siguiente manera:
Media de datos no agrupados de una muestra

Media de la muestra =

Suma de todos los valores de la muestra Nmero de valores de la mue estra

La media muestral y la media poblacional se calculan en la misma manera, pero la notacin abreviada que se emplea es diferente. La frmula de la media muestral es: X = MEDIA DE UNA MUESTRA en la_ cual: X es la media de la muestra; se lee: X barra; n es el nmero de valores de la muestra. La media de una muestra o cualquier otra medicin basada en una muestra de datos recibe el nombre de estadstico. Si el dimetro promedio externo de una muestra de cinco rodamientos de bala es de 0.625 pulgadas, se trata de un ejemplo de estadstico. ESTADSTICO Caracterstica de una muestra. X n

[3.2]

Ejemplo

SunCom estudia la cantidad de minutos que emplean sus clientes en un plan tarifario de cierto telfono celular. Una muestra aleatoria de 12 clientes arroja la siguiente cantidad de minutos empleados el mes pasado.
90 77 91 110 94 89 92 100 119 112 113 83

Cul es valor de la media aritmtica de los minutos empleados?

Descripcin de datos: Medidas numricas

59

Solucin

De acuerdo con la frmula 3.2, la media muestral es: Media muestral = X = Suma de todos los valores en la muestra Nmero de valores en la muestra

X 90 + 77 + + 83 1 170 = = = 97.5 12 12 n

El valor de la media aritmtica de los minutos empleados el mes pasado por los usuarios de telfonos celulares de la muestra es de 97.5 minutos.

Propiedades de la media aritmtica


La media aritmtica es una medida de ubicacin muy utilizada. Cuenta con algunas propiedades importantes: 1.  Todo conjunto de datos de intervalo o de nivel de razn posee una media. Recuerde del captulo 1 que los datos del nivel de razn incluyen datos como edades, ingresos y pesos, en stos la distancia entre los nmeros es constante. 2. Todos los valores se encuentran incluidos en el clculo de la media. 3.  La media es nica. Slo existe una media en un conjunto de datos. Ms adelante en el captulo descubrir un promedio que podra aparecer dos o ms veces en un conjunto de datos. 4.  La suma de las desviaciones de cada valor de la media es cero. Expresado simblicamente, (X X ) = 0 Como ejemplo, la media de 3, 8 y 4 es 5. De esta manera, (X X ) = (3 5) + (8 5) + (4 5) = 2 + 3 1 =0
La media como punto de equilibro

De esta manera la media es un punto de equilibrio de un conjunto de datos. Para ilustrarlo, imagine una regla con los nmeros 1, 2, 3, ,9 uniformemente espaciados. Suponga que se colocaran tres barras del mismo peso sobre la regla en los nmeros 3, 4 y 8 y que el punto de equilibrio se colocara en 5, la media de los tres nmeros. Descubrira que la regla se equilibra perfectamente. Las desviaciones debajo de la media (3) son iguales a las desviaciones por encima de la media (+3). El esquema es:

2 1 +3

_ X

La media se ve afectada en exceso por valores grandes o pequeos poco comunes

La media tiene un punto dbil. Recuerde que el valor de cada elemento en una muestra, o poblacin, se utiliza cuando se calcula la media. Si uno o dos de estos valores son extremadamente grandes o pequeos comparados con la mayora de los datos,

60

Captulo 3

la media podra no ser un promedio adecuado para representar los datos. Por ejemplo, suponga que los ingresos anuales de un pequeo grupo de corredores de bolsa en Merrill Lynch es de $62 900, $61 600, $62 500, $60 800 y $1 200 000. El ingreso medio es de $289 560; claro, no es representativo del grupo, ya que todos, salvo un corredor, tienen ingresos entre $60 000 y $63 000. Un ingreso ($1.2 millones) afecta en exceso la media.

Autoevaluacin 3.1

1.  Los ingresos anuales de una muestra de empleados de gerencia media en Westinghouse son: $62 900, $69 100, $58 300 y $76 800. a) Proporcione una frmula para la media muestral. b) Determine la media muestral. c)  Es la media que calcul en el inciso b) un estadstico o un parmetro? Por qu razn? d )  Cul es su mejor aproximacin de la media de la poblacin? 2.  Todos los estudiantes de Ciencias Avanzadas de la Computacin de la clase 411 constituyen una poblacin. Sus calificaciones en el curso son de 92, 96, 61, 86, 79 y 84. a) Proporcione la frmula de la media poblacional. b) Calcule la calificacin media del curso. c)  Es la media que calcul en el inciso b) un estadstico o un parmetro? Por qu razn?

Ejercicios
Las respuestas a los ejercicios impares se encuentran al nal del libro. 1. 2. 3. 4. 5. 6.  Calcule la media de la siguiente poblacin de valores: 6, 3, 5, 7, 6. Calcule la media de la siguiente poblacin de valores: 7, 5, 7, 3, 7, 4. a) Calcule la media de los siguientes valores muestrales: 5, 9, 4, 10. b) Demuestre que (X X) = 0. a) Calcule la media de los siguientes valores muestrales: 1.3, 7.0, 3.6, 4.1, 5.0. b) Demuestre que (X X) = 0. Calcule la media de los siguientes valores muestrales: 16.25, 12.91, 14.58. Calcule el salario promedio por hora pagado a carpinteros que ganan los siguientes salarios por hora: $15.40, $20.10, $18.75, $22.76, $30.67, $18.00.

En los ejercicios 7 a 10, a) calcule la media aritmtica y b) indique si se trata de un estadstico o de un parmetro. 7.  Midtown Ford emplea a 10 vendedores. El nmero de automviles nuevos vendidos el mes pasado por los respectivos vendedores fueron: 15, 23, 4, 19, 18, 10, 10, 8, 28, 19. 8.  El departamento de contabilidad en una compaa de ventas por catlogo cont las siguientes cantidades de llamadas recibidas por da en el nmero gratuito de la compaa durante los primeros 7 das de mayo de 2006: 14, 24, 19, 31, 36, 26, 17. 9.  Cambridge Power and Light Company seleccion una muestra aleatoria de 20 clientes residenciales. En seguida aparecen las sumas, redondeadas al dlar ms prximo, que se cobraron a los clientes por el servicio de luz el mes pasado: 54 67 48 68 58 39 50 35 25 56 47 66 75 33 46 62 60 65 70 67

10.  l director de relaciones humanas de Ford inici un estudio de las horas de trabajo extra en el E Departamento de Inspeccin. Una muestra de 15 trabajadores revel que stos laboraron la siguiente cantidad de horas extra el mes pasado. 13 6 13 7 12 12 15 10 7 9 15 13 5 12 12

11.  AA Heating and Air Conditioning concluy 30 trabajos el mes pasado con un ingreso medio A de $5 430 por trabajo. El presidente desea conocer el ingreso total del mes. Sobre la base de la informacin limitada, puede calcular el ingreso total? A cunto asciende?

Descripcin de datos: Medidas numricas

61

12.  na compaa farmacutica grande contrata graduados de administracin de empresas para U vender sus productos. La compaa se expande rpidamente y dedica un da a capacitar en ventas a los nuevos vendedores. El objetivo que la compaa ja a cada nuevo vendedor es de $10 000 mensuales. ste se basa en las ventas promedio actuales de toda la compaa, que son de $10 000 mensuales. Despus de revisar las retenciones de impuestos de los nuevos empleados, la compaa encuentra que slo 1 de cada 10 empleados permanece ms de tres meses en la empresa. Haga algn comentario sobre la utilizacin de las ventas promedio actuales mensuales como objetivo de ventas para los nuevos empleados. Por qu abandonan los empleados la compaa?

Media ponderada
La media ponderada constituye un caso especial de la media aritmtica y se presenta cuando hay varias observaciones con el mismo valor. Para explicar esto, suponga que el Wendys Restaurant vende refrescos medianos, grandes y gigantes a $0.90, $1.25 y $1.50. De las 10 ltimas bebidas vendidas 3 eran medianas, 4 grandes y 3 gigantes. Para determinar el precio promedio de las ltimas 10 bebidas vendidas recurra a la frmula 3.2. $.90 + $.90 + $.90 + $1.25 + $1.25 + $1.25 + $1.25 + $1. .50 + $1.50 + $1.50 10 $12.20 X = = $1.22 10 X = el precio promedio de venta de las ltimas 10 bebidas es de $1. 22. Una manera fcil para determinar el precio promedio de venta consiste en determinar la media ponderada; multiplique cada observacin por el nmero de veces que _ aparece. La media ponderada se representa como X w , que se lee: X subndice w . Xw = 3($0.90) + 4($1.25) + 3($1.50) $12.20 = = $1.22 10 10

En este caso las ponderaciones son conteos de frecuencias. Sin embargo, cualquier medida de importancia podra utilizarse como una ponderacin. En general, la media ponderada del conjunto de nmeros representados como X1, X2, X3, , Xn con las ponderaciones correspondientes w1, w2, w3, , wn, se calcula de la siguiente manera: w X + w 2X 2 + w 3X 3 + + wn X n Xw = 1 1 MEDIA PONDERADA w1 + w 2 + w 2 + + w n La cual se abrevia de la siguiente manera: Xw = (wX ) w [3.3]

Observe que el denominador de una media ponderada siempre es la suma de las ponderaciones.

Ejemplo Solucin

Carter Construction Company paga a sus empleados que trabajan por hora $16.50, $19.50 o $25.00 la hora. Hay 26 empleados contratados para trabajar por hora, 14 de los cuales reciben una paga con la tarifa de $16.50; 10 con la tarifa de $19.00 y 2 con la de $25.00. Cul es la tarifa promedio por hora que se paga a los 26 empleados? Para determinar la tarifa media por hora, multiplique cada una de las tarifas por hora por el nmero de empleados que ganan dicha tarifa. De acuerdo con la frmula 3.3, la tarifa media por hora es: Xw = 14($16.50) + 10($19.00) + 2($25.00) $4 471.00 = = $18.1154 14 + 10 + 2 26

El salario promedio ponderado por hora se redondea a $18.12.

62

Captulo 3

Autoevaluacin 3.2

Springers vendi 95 trajes para caballero Antonelli a un precio normal de $400. Para la venta de primavera rebajaron los trajes a $200 y vendieron 126. Al final de la venta de liquidacin, redujeron el precio a $100 y los restantes 79 trajes fueron vendidos. a) Cul fue el precio promedio ponderado de un traje Antonelli? b)  Springers pag $200 por cada uno de los 300 trajes. Haga algn comentario sobre la ganancia de la tienda por traje, si un vendedor recibe $25 de comisin por cada traje que vende.

Ejercicios
13.  n junio una inversionista compr 300 acciones de Oracle (una compaa de tecnologa de E la informacin) a $20 la accin. En agosto compr 400 acciones ms a $25 cada una. En noviembre compr otras 400 acciones, pero el precio baj a $23 la accin. Cul es el precio promedio ponderado de cada accin? 14. Bookstall, Inc., es una librera especializada que se dedica a la venta de libros usados por  Internet. Los libros de pasta blanda cuestan $1.00 cada uno y los de pasta dura, $3.50 cada uno. De los 50 libros vendidos el pasado martes por la maana, 40 eran de pasta blanda y el resto de pasta dura. Cul fue el precio promedio ponderado de un libro? 15. Loris Healthcare System tiene 200 empleados en su personal de enfermera. Cincuenta son  auxiliares de enfermera; 50 enfermeras practicantes y 100 son enfermeras tituladas. Las auxiliares de enfermera ganan $8 la hora; las enfermeras practicantes $15 la hora y las tituladas $24 la hora. Cul es el salario promedio ponderado por hora? 16. Andrews and Associates se especializa en leyes empresariales. Cobran $100 la hora de inves tigacin de un caso; $75 la hora de asesora y $200 la hora de redaccin de un expediente. La semana pasada uno de los socios dedic 10 horas a dar asesora a una clienta, 10 horas a la investigacin del caso y 20 horas a la redaccin del expediente. Cul fue el monto medio ponderado por hora de honorarios por servicios legales?

Mediana
Ya se ha insistido en que si los datos contienen uno o dos valores muy grandes o muy pequeos, la media aritmtica no resulta representativa. Es posible describir el centro de dichos datos a partir de una medida de ubicacin denominada mediana. Para ilustrar la necesidad de una medida de ubicacin diferente de la media aritmtica, suponga que busca un condominio en Palm Aire. Su agente de bienes races le dice que el precio tpico de las unidades disponibles en este momento es de $110 000. An insiste en seguir buscando? Si usted se ha jado un presupuesto mximo de $75 000, podra pensar que los condominios se encuentran fuera de su presupuesto. Sin embargo, la vericacin de los precios de las unidades individuales podra hacerle cambiar de parecer. Los costos son de $60 000, $65 000, $70 000, $80 000 y de $275 000 en el caso de un lujoso penthouse. El importe promedio aritmtico es de $110 000, como le inform el agente de bienes races, pero un precio ($275 000) eleva la media aritmtica y lo convierte en un promedio no representativo. Parece que un precio de poco ms o menos $70 000 es un promedio ms tpico o representativo, y as es. En casos como ste, la mediana proporciona una medida de ubicacin ms vlida.

MEDIANA Punto medio de los valores una vez que se han ordenado de menor a mayor o de mayor a menor. El precio mediano de las unidades disponibles es de $70 000 Para determinarlo, ordene los precios de menor ($60 000) a mayor ($275 000) y seleccione el valor medio

Descripcin de datos: Medidas numricas

63

($70 000). En el caso de la mediana los datos deben ser por lo menos de un nivel ordinal de medicin.
Precios ordenados de menor a mayor Precios ordenados de mayor a menor $275 000 80 000 70 000 65 000 60 000

$ 60 000 65 000 70 000 Mediana 80 000 275 000

A la mediana le afectan menos los valores extremos

Observe que existe el mismo nmero de precios bajo la mediana de $70 000 que sobre ella. Por consiguiente, a la mediana no le afectan precios bajos o altos. Si el precio ms alto fuera de $90 000 o de $300 000, incluso de $1 000 000, el precio mediano an sera de $70 000. Asimismo, si el precio ms bajo fuera de $20 000 o $50 000, el precio mediano todava sera de $70 000. En el ejemplo anterior hay un nmero impar de observaciones (cinco). Cmo se determina la mediana en el caso de un nmero par de observaciones? Como antes, se ordenan las observaciones. Enseguida, con el n de obtener un nico valor por convencin, calcule la media de las dos observaciones medias. As, en el caso de un nmero par de observaciones, la mediana quiz no sea uno de los valores dados.

Ejemplo Solucin

Los rendimientos totales de tres aos de los mejores fondos mutualistas accionarios de ms alto desempeo se enlistan en seguida. Cul es el rendimiento mediano anualizado?

Nombre del fondo Artisian Mid Cap Clipper Fidelity Advisor Mid-Cap Fidelity Mid-Cap Stock Smith Barney Aggressive Van Kampen Comstock

Rendimiento total anualizado 42.10% 15.50 27.58 28.64 41.77 16.97

Observe que el nmero de rendimientos es par (6). Como hizo antes, primero ordene los rendimientos de menor a mayor. Enseguida identique los dos rendimientos de en medio. La media aritmtica de las dos observaciones de en medio proporciona el rendimiento mediano. Ordenados del ms bajo al ms alto, quedan:
Clipper Van Kampen Comstock Fidelity Advisor Mid-Cap Fidelity Mid-Cap Stock Smith Barney Aggressive Artisian Mid Cap 15.50% 16.97 27.58 28.64 41.77 42.10

56.22 2 28.11 %

Preste atencin a que la mediana no es uno de los valores. Asimismo, la mitad de los rendimientos se encuentran por debajo de la mediana y la mitad sobre ella.

64

Captulo 3

Las principales propiedades de la mediana son las siguientes: 1.  No influyen en ella valores extremadamente grandes o pequeos. Por consiguiente, la mediana es una valiosa medida de ubicacin cuando dichos valores se presentan. 2.  Es calculable para datos de nivel ordinal o ms altos. Recuerde que en el captulo 1 se ordenaron los datos de nivel ordinal de menor a mayor, como las respuestas excelente, muy bien, bien, aceptable y mal a una pregunta de una encuesta de mercado. Para dar un ejemplo sencillo, suponga que cinco personas calican una nueva barra de dulce de leche. Una persona pens que era excelente; otra, muy buena; la siguiente la calic de buena; una ms, de aceptable y la quinta la consider mala. La respuesta mediana es buena. La mitad de las respuestas se encuentran por encima de buena; la otra mitad por debajo.

La mediana se determina para cualquier nivel de datos, excepto los nominales

Moda
La moda es otra medida de ubicacin. Moda Valor de la observacin que aparece con mayor frecuencia. La moda es de especial utilidad para resumir datos de nivel nominal. Un ejemplo de esta aplicacin en datos de nivel nominal: una compaa cre cinco aceites para bao. La grca de barras 3.1 muestra los resultados de una encuesta de mercado diseada para determinar qu aceite para bao preeren los consumidores. La mayora de los encuestados se inclin por Lamoure, segn lo evidencia la barra ms grande. Por consiguiente, Lamoure representa la moda.
Nmero de encuestados 400 300 200 100 0

Amor

Lamoure Moda

Soothing Smell Nice Aceite para bao

Far Out

GRFICA 3.1 Nmero de encuestados que prefieren ciertos aceites para bao Los salarios anuales de los gerentes de control de calidad en algunos estados seleccionados aparecen enseguida.
Estado Arizona California Colorado Florida Idaho Salario $35 000 49 100 60 000 60 000 40 000 Estado Illinois Louisiana Maryland Massachusetts Nueva Jersey Salario $58 000 60 000 60 000 40 000 65 000 Estado Ohio Tennessee Texas Virginia Oeste Wyoming Salario $50 000 60 000 71 400 60 000 55 000

Ejemplo

Solucin

Un examen de los salarios revela que el salario anual de $60 000 se presenta con mayor frecuencia (seis veces) que otros salarios. Por tanto, la moda es $60 000.

Descripcin de datos: Medidas numricas

65

Desventajas de la moda

En resumen, es posible determinar la moda para todos los niveles de datos, nominal, ordinal, de intervalo y de razn. La moda tambin tiene la ventaja de que no inuyen en ella valores extremadamente grandes o pequeos. No obstante, la moda tiene sus desventajas, por las cuales se le utiliza con menor frecuencia que a la media o a la mediana. En el caso de muchos conjuntos de datos no existe la moda, porque ningn valor se presenta ms de una vez. Por ejemplo, no hay moda en el siguiente conjunto de datos de precios: $19, $21, $23, $20 y $18. Sin embargo, como cada valor es diferente, podra argumentar que cada valor es la moda. Por lo contrario, en el caso de algunos conjuntos de datos hay ms de una moda. Suponga que las edades de los miembros de un club de inversionistas son 22, 26, 27, 27, 31, 35 y 35. Ambas edades, 27 y 35 son modas. As, este agrupamiento de edades se denomina bimodal (tiene dos modas). Alguien podra cuestionar la utilizacin de dos modas para representar la ubicacin de este conjunto de datos de edades.
1.  Una muestra de personas solteras en Towson, Texas, que reciben pagos por seguridad social revel los siguientes subsidios mensuales: $852, $598, $580, $1 374, $960, $878 y $1 130. a) Cul es la mediana del subsidio mensual? b) Cuntas observaciones se encuentran debajo de la mediana? Por encima de ella? 2.  El nmero de interrupciones de trabajo en la industria automotriz en meses muestreados son de 6, 0, 10, 14, 8 y 0. a) Cul es la mediana en el nmero de interrupciones? b) Cuntas observaciones se encuentran por debajo de la mediana? Por encima de ella? c) Cul es el nmero modal de interrupciones de trabajo?

Autoevaluacin 3.3

Ejercicios
 Qu informara usted como valor modal para un conjunto de observaciones si hubiera un total 17. de: a) 10 observaciones y no hubiera dos valores iguales? b) 6 observaciones, todas iguales? c) 6 observaciones con valores de 1, 2, 3, 4 y 4? En los ejercicios 18 a 20, determine a) la media, b) la mediana y c) la moda. 18.  os siguientes son los nmeros de cambios de aceite de los ltimos 7 das en Jiffy Lube, que L se ubica en la esquina de Elm Street y Pennsylvania Avenue. 41 15 39 54 31 15 33

19.  l siguiente es el cambio porcentual en el ingreso neto de 2005 a 2006 en una muestra de 12 E compaas de la construccin en Denver. 5 1 10 6 5 12 7 8 2 5 1 11

20.  as siguientes son las edades de 10 personas en la sala de videojuegos del Southwyck ShoL pping Mall a las 10 de la maana. 12 8 17 6 11 14 8 17 10 8

21.  bajo se enlistan diversos indicadores del crecimiento econmico a largo plazo en Estados A Unidos. Las proyecciones se extienden hasta el ao 2008. Indicador econmico Inflacin Exportaciones Importaciones Ingreso real disponible Consumo Cambio porcentual 4.5% 4.7 2.3 2.9 2.7 Indicador econmico PNB real Inversin (residencial) Inversin (no residencial) Productividad (total) Productividad (fabricacin) Cambio porcentual 2.9% 3.6 2.1 1.4 5.2

a) Cul es la mediana del cambio porcentual? b) Cul es el cambio porcentual modal?

66

Captulo 3

 En la siguiente lista aparecen las ventas totales de automviles (en millones de dlares) en 22. Estados Unidos durante los pasados 14 aos. En dicho periodo, cul fue la mediana en el nmero de automviles vendidos? Cul es la moda? 9.0 8.5 8.0 9.1 10.3 11.0 11.5 10.3 10.5 9.8 9.3 8.2 8.2 8.5

 La empresa de contabilidad de Rowatti y Koppel se especializa en la elaboracin de declara23. ciones del impuesto sobre la renta de profesionales independientes, como mdicos, dentistas, arquitectos y abogados. La rma emplea a 11 contadores que preparan declaraciones. El ao pasado, el nmero de declaraciones elaboradas por cada contador fue la siguiente: 58 75 31 58 46 65 60 71 45 58 80

 Determine la media, la mediana y la moda de los nmeros de declaraciones elaboradas por cada contador. Si usted elaborara una, qu medida de ubicacin recomendara que se presentara? 24. La demanda de videojuegos suministrados por Mid-Tech Video Games, Inc., se ha disparado  en los ltimos siete aos. De ah que el propietario requiera contratar tcnicos que se mantengan a la par con la demanda. Mid-Tech proporciona a cada solicitante una prueba que el doctor McGraw, diseador de la prueba, cree que se relaciona estrechamente con la habilidad para crear videojuegos. Para la poblacin en general, la media de esta prueba es de 100. Enseguida aparecen los resultados de la prueba en el caso de lo aspirantes. 95 105 120 81 90 115 99 100 130 10

 El presidente se encuentra interesado en las cualidades generales de los aspirantes al puesto basadas en la prueba. Calcule los resultados medio y mediano de los diez aspirantes. Qu informara usted al presidente? Parece que los aspirantes son mejores que el resto de la poblacin?

Solucin con software


Con un paquete de software de estadstica determine varias medidas de ubicacin.

Ejemplo Solucin

La tabla 2.4 de la pgina 28 muestra los precios de 80 vehculos vendidos el mes pasado en Whitner Autoplex, en Raytown, Missouri. Determine los precios de venta medio y mediano. Los precios de venta medio y mediano se presentan en el informe de la siguiente salida de Excel. (Recuerde que las instrucciones para crear la salida aparecen en la seccin de Comandos de software localizada al nal del captulo.) En el estudio se incluyen 80 vehculos. As que los clculos con una calculadora resultaran tediosos y seran propensos a error.

Descripcin de datos: Medidas numricas

67

El precio promedio de ventas es de $23 218 y el mediano de $22 831. La diferencia entre estos dos valores es menor a $400. As que cualquier valor es razonable. Tambin es posible ver en la salida de Excel que se vendieron 80 vehculos, cuyo precio total es de $1 857 453. Ms adelante se explicar el signicado de error estndar, desviacin estndar y otras medidas. Qu podemos concluir? El precio de venta tpico de un vehculo es de $23 000. La seora Ball de AutoUSA puede usar ese valor en la proyeccin de sus ingresos. Por ejemplo, si el representante puede incrementar el nmero de ventas en un mes, de 80 a 90, puede resultar un incremento en los ingresos de $230 000, encontrado por 10 $23 000.

Posiciones relativas de la media, la mediana y la moda


En una distribucin en forma de campana la media, la mediana y la moda son iguales

Observe el histograma de la gura 3.2. Se trata de una distribucin simtrica que tambin tiene forma de campana. Esta distribucin posee la misma forma a cualquier lado del centro. Si el polgono estuviera doblado a la mitad, las dos mitades seran idnticas. En cualquier distribucin simtrica la moda, la mediana y la media siempre son iguales. Son equivalentes a 20 aos en la grca 3.2. Hay distribuciones simtricas que no tienen forma de campana.

y Frecuencia

Simtrica (cero sesgo)

x Media = 20 Mediana = 20 Moda = 20 Aos

GRFICA 3.2 Distribucin simtrica

Una distribucin sesgada no es simtrica

El nmero de aos correspondiente al punto ms alto de la curva es la moda (20 aos). Como la distribucin es simtrica, la mediana corresponde al punto en el que la distribucin se divide a la mitad (20 aos). El nmero total de frecuencias que representan muchos aos se encuentra compensado por el nmero total que representa pocos aos, lo cual da como resultado una media aritmtica de 20 aos. Cualquiera de estas tres medidas sera adecuada para representar el centro de la distribucin. Si una distribucin no es simtrica, o sesgada, la relacin entre las tres medidas cambia. En una distribucin con sesgo positivo la media aritmtica es la mayor de las tres medidas. Por qu? En ella inuyen ms que sobre la mediana o la moda unos cuantos valores extremadamente altos. La mediana es, por lo general, la siguiente medida ms grande en una distribucin de frecuencias con sesgo positivo. La moda es la menor de las tres medidas. Si la distribucin tiene un sesgo muy pronunciado, como en el caso de los ingresos semanales de la grca 3.3, la media no sera una medida adecuada. La mediana y la moda seran ms representativas.

68

Captulo 3

Frecuencia

Sesgada a la derecha (sesgo positivo)

x Ingreso semanal Moda $300 Mediana $500 Media $700

GRFICA 3.3 Distribucin con sesgo positivo

Por lo contrario, si una distribucin tiene un sesgo negativo, la media es la menor medida de las tres. Por supuesto, la media es sensible a la inuencia de una cantidad extremadamente pequea de observaciones. La mediana es mayor que la media aritmtica y la moda es la ms grande de las tres medidas. De nuevo, si la distribucin tiene un sesgo muy pronunciado, como la distribucin de fuerzas de tensin que se muestran en la grca 3.4, la media no se utilizara para representar a los datos.

y Frecuencia Sesgada a la izquierda (sesgo negativo)

x Fuerza de tensin Media 2 600 Mediana 2 800 Moda 3 000

GRFICA 3.4 Distribucin con sesgo negativo

Autoevaluacin 3.4

Las ventas semanales de una muestra de tiendas de suministros electrnicos de alta tecnologa se organizaron en una distribucin de frecuencias. La media de las ventas semanales que se calcul fue de $105 900, la mediana de $105 000 y la moda de $104 500. a)  Trace una grfica de las ventas con la forma de un polgono de frecuencias suavizado. Observe la ubicacin de la media, la mediana y la moda sobre el eje X. b)  La distribucin es simtrica, tiene un sesgo positivo o un sesgo negativo? Explique su respuesta.

Descripcin de datos: Medidas numricas

69

Ejercicios
25.  a tasa de desempleo en el estado de Alaska durante los 12 meses de 2004 aparece en la L siguiente tabla: Ene 8.7 Feb 8.8 Mar 8.7 Abr 7.8 May 7.3 Jun 7.8 Jul 6.6 Ago 6.5 Sep 6.5 Oct 6.8 Nov 7.3 Dic 7.6

a) Cul es la media aritmtica para la tasa de desempleo en Alaska? b) Encuentre la media y la moda para la tasa de desempleo. c)  Calcule la media aritmtica y la mediana slo para los meses de invierno (de diciembre a marzo). Es muy diferente? 26. Big Orange Trucking disea un sistema de informacin que se utiliza para comunicaciones en  cabina. Debe resumir datos de ocho sitios de cierta zona para describir condiciones tpicas. Calcule una medida adecuada de ubicacin central para cada una de las tres variables que aparecen en la siguiente tabla: Ciudad Anniston, AL Atlanta, GA Augusta, GA Birmingham, AL Jackson, MS Meridian, MS Monroe, LA Tuscaloosa, AL Direccin del viento Oeste Noroeste Suroeste Sur Suroeste Sur Suroeste Suroeste Temperatura 89 86 92 91 92 92 93 93 Pavimento Seco Mojado Mojado Seco Seco Sendero Mojado Sendero

Media geomtrica
La media geomtrica nunca es mayor que la media aritmtica

La media geomtrica resulta til para determinar el cambio promedio de porcentajes, razones, ndices o tasas de crecimiento. Posee amplias aplicaciones en la administracin y la economa, ya que con frecuencia hay inters en determinar los cambios porcentuales de ventas, salarios o cifras econmicas, como el producto interno bruto, los cuales se combinan o se basan unos en otros. La media geomtrica de un conjunto de n nmeros positivos se dene como la raz ensima de un producto de n variables. La frmula de la media geomtrica se escribe de la siguiente manera: GM = n (X 1)(X 2 )(X n ) MEDIA GEOMTRICA

[3.4]

La media geomtrica siempre es menor o igual (nunca mayor que) que la media aritmtica. Todos los datos deben ser positivos. Como ejemplo de media geomtrica, asuma que usted recibe 5% de incremento en el salario este ao y 15% de incremento el siguiente. El incremento porcentual anual promedio es de 9.886, no de 10. Por qu razn? Comience calculando la media geomtrica. Recuerde, por ejemplo, que 5% de incremento salarial equivale a 105%. Lo que expresa como 1.05. GM = (1.05)(1.15) = 1.09886 Este resultado puede vericarse suponiendo que su ingreso mensual fue de $3 000 para comenzar y que recibi dos incrementos de 5% y 15%. Incremento 1 = $3 000(.05) = $150.00 Incremento 2 = $3 150(.15) = 472.50 Total $622.50

70

Captulo 3

El incremento total a su salario es de $622.50. Esto equivale a: $3 000(.09886) = $296.58 $3 150(.09886) = 325.90 $622.48 es de alrededor de $622.50 El siguiente ejemplo muestra la media geomtrica de diversos porcentajes.

Ejemplo Solucin

La recuperacin de una inversin realizada por Atkins Construction Company durante cuatro aos consecutivos fue de 30%, 20%, 40% y 200%. Cul es la media geomtrica de la recuperacin de la inversin? El nmero 1.3 representa 30% de la recuperacin de la inversin, que es la inversin original de 1.0 ms la recuperacin de 0.3. El nmero 0.6 representa la prdida de 40%, que es la inversin original de 1.0 menos la prdida de 0.4. Este clculo supone que el total de la inversin de cada periodo se reinvierte o se convierte en la base de la siguiente. En otras palabras, la base para el segundo periodo es 1.3 y la base para el tercer periodo es (1.3)(1.2) y as sucesivamente. Entonces la media geomtrica de la tasa de recuperacin es de 29.4%, que se determina por medio del siguiente clculo: GM = n (X 1)(X 2 )(X n ) = 4 (1.3)(1.2)(0.6)(3.0) = 4 2.808 = 1.294 De esta manera, la media geomtrica es la raz cuarta de 2.808. As, la tasa promedio de recuperacin (tasa de crecimiento anual compuesta) es de 29.4%. Observe, asimismo, que si calcula la media aritmtica [(30 + 20 40 + 200)/4 = 52.5], obtendr un nmero mucho ms grande, lo que disparara la tasa de recuperacin real. Otro modelo de aplicacin de la media geomtrica tiene que ver con determinar un cambio porcentual promedio durante cierto periodo. Por ejemplo, si usted gan $30 000 en 1997 y $50 000, en 2007, cul es la tasa anual de incremento durante el periodo? sta es de 5.24%. La tasa de incremento se determina a partir de la siguiente frmula. Valor al final del periodo PORCENTAJE PROMEDIO QUE SE GM = n 1 INCREMENTA con el tiempo Valor al inicio o del periodo

[3.5]

En el recuadro anterior n es el nmero de periodos. Un ejemplo mostrar los detalles para determinar el incremento porcentual anual. Durante la dcada de los noventa y hasta los primeros aos del 2000, Las Vegas, Nevada, fue la ciudad de mayor crecimiento en Estados Unidos. La poblacin se increment de 258 295 en 1990 a 534 847 en 2005. Es un incremento de 276 552 personas o 107% de incremento durante el periodo de 15 aos. Cul es el incremento anual promedio? Hay 15 aos entre 1990 y 2005, as que n = 15. De esta manera, la frmula 3.5 de la media geomtrica, aplicada a este problema, se transforma en: GM = n 534 847 Valor al final de periodo 1.0 = 15 1.0 = 1.0497 1.0 = .0497 Valor al inicio del periodo 258 295

Ejemplo Solucin

El valor de 0.0497 indica que el crecimiento anual promedio durante el periodo de 15 aos fue de 4.97%. Expresado en otros trminos, la poblacin de Las Vegas creci a una tasa de 4.97% por ao de 1990 a 2005.

Descripcin de datos: Medidas numricas

71

Autoevaluacin 3.5

1.  El incremento porcentual en ventas de los pasados 4 aos en Combs Cosmetics fue de 4.91, 5.75, 8.12 y 21.60. a) Determine la media geomtrica del incremento porcentual. b) Determine la media aritmtica del incremento porcentual. c) Es igual la media aritmtica a la media geomtrica o mayor? 2.  La produccin de camiones Cablos se elev de 23 000 unidades en 1996 a 120 520 unidades en 2006. Calcule la media geomtrica del incremento porcentual anual.

Ejercicios
27. Calcule la media geomtrica de los siguientes incrementos porcentuales: 8, 12, 14, 26 y 5.  28.  Estime la media geomtrica de los siguientes incrementos porcentuales: 2, 8, 6, 4 10, 6, 8 y 4.  A continuacin se enlista el incremento porcentual en ventas de MG Corporation para los 29. pasados 5 aos. Determine la media geomtrica del incremento porcentual en ventas durante el periodo. 9.4 13.8 11.7 11.9 14.7

30.  n 1996 un total de 14 968 000 contribuyentes en Estados Unidos presentaron en forma elecE trnica sus declaraciones de impuestos. Para el ao 2004 el nmero se haba incrementado a 66 290 000. Cul es la media geomtrica del incremento anual para el periodo? 31. El U.S. Bureau of Labor Statistics publica mensualmente el ndice de precios al consumidor.  Informa el cambio de precios en una canasta de artculos en el mercado de un periodo a otro. El ndice para 1994 fue de 148.2, para 2004 se increment a 188.9 Cul es la media geomtrica del incremento anual de dicho periodo? 32. En 1976 el precio promedio en Estados Unidos de un galn de gasolina sin plomo en una  estacin de autoservicio era de $0.605. Para el ao 2005, el precio promedio se haba incrementado a $2.57. Cul es la media geomtrica del incremento anual en dicho periodo? 33. En 2001 haba 42 millones de suscriptores al servicio de buscapersonas. Para el ao 2006 el  nmero de suscriptores aument a 70 millones. Cul es la media geomtrica del incremento anual de dicho periodo? 34. La informacin que sigue muestra el costo de un ao de estudios en universidades pblicas y  privadas en 1992 y 2004. Cul es la media geomtrica del incremento anual en dicho periodo en el caso de las dos clases de escuelas? Compare las tasas de incremento.

Estadstica en accin
El servicio postal de Estados Unidos ha intentado comportarse de forma ms amigable con el usuario en los ltimos siete aos. Una encuesta reciente mostr que los consumidores estaban interesados en que hubiera ms regularidad en los tiempos de entrega. Antes una carta local podra tardar en llegar un da o varios. Slo dganme con cuntos das de anticipacin tengo que enviar una tarjeta de felicitacin a mam para que llegue el da de su cumpleaos, ni antes ni despus, era una queja comn. El nivel de regularidad se mide a partir de la desviacin estndar de los tiempos de entrega.

Tipo de universidad Pblica Privada

1992 $ 4 975 12 284

2004 $ 11 354 27 516

Por qu estudiar la dispersin?


Una medida de ubicacin, como la media o la mediana, solamente describe el centro de los datos. Desde este punto de vista resulta valiosa, pero no dice nada sobre la dispersin de los datos. Por ejemplo, si la gua de turismo ecolgico dice que el ro que se encuentra adelante tiene en promedio 3 pies de profundidad, querra usted cruzarlo a pie sin ms informacin? Quiz no. Usted deseara saber algo sobre la variacin de la profundidad. Mide 3.25 pies la mxima profundidad y 2.75 pies la mnima? En dicho caso, usted estara de acuerdo en cruzar. Qu hay si usted se enter de que la profundidad del ro variaba de 0.50 pies a 5.5 pies? Su decisin probablemente sera no cruzar. Antes de tomar una decisin sobre cruzar el ro, usted desea informacin tanto de la profundidad tpica como de la dispersin de la profundidad del ro. Un valor pequeo en una medida de dispersin indica que los datos se acumulan con proximidad alrededor de la media aritmtica. Por consiguiente, la media se considera representativa de los datos. Por lo contrario, una medida grande de dispersin indica que la media no es conable (vea la grca 3.5). Los 100 empleados de Hammond Iron

72

Captulo 3

Works, Inc., una compaa que fabrica acero, se organizan en un histograma basado en el nmero de aos que los empleados han laborado en la compaa. La media de 4.9 aos no es muy representativa de los empleados.

20

Empleados

10

0 0 10 Aos 20

GRFICA 3.5 Histograma de los aos laborados para Hammond Iron Works, Inc.

El promedio no es representativo como consecuencia de que la dispersin es grande

Una segunda razn para estudiar la dispersin en un conjunto de datos consiste en comparar la propagacin en dos o ms distribuciones. Por ejemplo, asuma que el nuevo monitor de computadora Vision Quest LCD se arma en Baton Rouge y tambin en Tucson. La produccin media aritmtica por hora tanto en la planta de Baton Rouge como en la de Tucson es de 50. Sobre la base de las dos medias, podra concluir que las distribuciones de las producciones por hora son idnticas. Sin embargo, los registros de produccin de 9 horas en las dos plantas revelan que esta conclusin no es correcta (vea la grca 3.6). La produccin de Baton Rouge vara de 48 a 52 montajes por hora. La produccin en la planta de Tucson es ms errtica, ya que vara de 40 a 60 la hora. Por tanto, la produccin por hora en Baton Rouge se acumula cerca de la media de 50; la produccin por hora de Tucson es ms dispersa.

Baton Rouge

Una medida de dispersin sirve para evaluar la conabilidad de dos o ms medidas de ubicacin
Tucson

48

49

50 _ X

51

52

40 41 42 43 44 45 46 47 48 49 50 _ 51 52 53 54 55 56 57 58 59 60 X Produccin diaria

GRFICA 3.6 Produccin por hora de monitores de computadora en las plantas de Baton
Rouge y Tucson

Descripcin de datos: Medidas numricas

73

Medidas de dispersin
Consideraremos diversas medidas de dispersin. El rango se sustenta en los valores mximo y mnimo del conjunto de datos. La desviacin media, la varianza y la desviacin estndar se basan en desviaciones de la media aritmtica.

Rango
La medida ms simple de dispersin es el rango. Representa la diferencia entre los valores mximo y mnimo de un conjunto de datos. En forma de ecuacin: RANGO Rango = Valor mximo valor mnimo [3.6]

El rango se emplea mucho en aplicaciones de control de procesos estadsticos (CPE) como consecuencia de que resulta fcil de calcular y entender.

Ejemplo Solucin

Consulte la grca 3.6. Determine el rango del nmero de monitores de computadora producidos por hora en las plantas de Baton Rouge y Tucson. Interprete los dos rangos. El rango de la produccin por hora de monitores de computadora en la planta de Baton Rouge es de 4, el cual se determina por la diferencia entre la produccin mxima por hora de 52 y la mnima de 48. El rango de la produccin por hora en la planta de Tucson es de 20 monitores de computadora, obtenido con el clculo 60 40. Por tanto: 1. Existe menos dispersin en la produccin por hora en la planta de Baton Rouge que en la planta de Tucson, porque el rango de 4 monitores de computadora es menor que el rango de 20 monitores; 2. La produccin se acumula ms alrededor de la media de 50 en la planta de Baton Rouge que en la planta de Tucson (ya que un rango de 4 es menor que un rango de 20). As, la produccin media en la planta de Baton Rouge (50 monitores de computadora) resulta una medida de ubicacin ms representativa que la media de 50 monitores de computadora en la planta de Tucson.

Desviacin media
Un problema que presenta el rango estriba en que parte de dos valores, el ms alto y el ms bajo; no toma en cuenta todos los valores. La desviacin media s lo hace; mide la cantidad media respecto de la cual los valores de una poblacin o muestra varan. Expresado esto en forma de denicin:

DESVIACIN MEDIA Media aritmtica de los valores absolutos de las desviaciones con respecto a la media aritmtica. En el caso de una muestra, la desviacin media, designada DM, se calcula mediante la frmula:

DESVIACIN MEDIA MD =

X X n

[3.7]

74

Captulo 3

en la cual: X _ es el valor de cada observacin; X es la media aritmtica de los valores; n es el nmero de observaciones en la muestra; | | indica el valor absoluto. Por qu ignorar los signos de las desviaciones de la media? De no hacerlo las desviaciones positivas y negativas de la media se compensaran con exactitud unas a otras y la desviacin media siempre sera cero. Dicha medida (cero) resultara un estadstico sin utilidad. El nmero de capuchinos vendidos en el local de Starbucks de Orange County Airport entre las cuatro y las siete de la tarde de una muestra de 5 das el ao pasado fue de 20, 40, 50, 60 y 80. En el aeropuerto de LAX en Los ngeles, el nmero de capuchinos vendidos en el local de Starbucks entre las cuatro y la siete de la tarde de una muestra de 5 das el ao pasado fue de 20, 49, 50, 51 y 80. Determine la media, la mediana, el rango y la desviacin media de cada local. Compare las diferencias. En el caso del local de Orange County, la media, la mediana y el rango son:
Media Mediana Rango 50 capuchinos por da 50 capuchinos por da 60 capuchinos por da

Ejemplo Solucin

La desviacin media es la media de las diferencias entre las observaciones individuales y la media aritmtica. En el caso de Orange County, la cantidad media de capuchinos vendida es de 50, el clculo es (20 + 40 + 50 + 80)/5. Enseguida determine las diferencias entre cada observacin y la media. Enseguida sume estas diferencias, haciendo caso omiso de los signos, y divida la suma entre el nmero de observaciones. El resultado es la diferencia media entre las observaciones y la media.
_ (X X ) (20 (40 (50 (60 (80 50) 50) 50) 50) 50)

Nmero de observaciones 20 40 50 60 80

Desviacin absoluta

= 30 30 = 10 10 = 0 0 = 10 10 = 30 30 Total 80

MD =

X X n

80 = 16 5

La desviacin media es de 16 capuchinos al da: el nmero de capuchinos vendidos se desva, en promedio, 16 unidades de la media de 50 capuchinos al da. En seguida aparece el resumen de la media, la mediana, el rango y la desviacin media en el caso de LAX. Realice los clculos para vericar los resultados.

Descripcin de datos: Medidas numricas

75

Media Mediana Rango Desviacin media

50 capuchinos por da 50 capuchinos por da 60 capuchinos por da 12.4 capuchinos por da

Recuerde que en el captulo anterior se le describieron datos mediante mtodos grcos. En este captulo se emplearn medidas numricas para describirlos. Cuando emplee medidas numricas, es muy importante informar siempre las medidas de ubicacin y de dispersin. Interprete y compare los resultados de las medidas en el caso de las tiendas de Starbucks. La media y la mediana de las dos tiendas son exactamente las mismas, 50 capuchinos al da. Por consiguiente, la ubicacin de ambas distribuciones es la misma. El rango en ambas tiendas tambin es el mismo, 60. Sin embargo, recuerde que el rango proporciona informacin limitada sobre la dispersin de la distribucin. Observe que las desviaciones medias no son las mismas porque se basan en las diferencias entre todas las observaciones y la media aritmtica, que muestra la relativa proximidad o acumulacin de los datos concerniente a la media o centro de la distribucin. Compare la desviacin media de Orange County de 16 con la desviacin de LAX de 12.4. Sobre la base de la desviacin media, es posible decir que la dispersin de la distribucin de ventas de LAX Starbucks se encuentra ms concentrada cerca de la media de 50 que en la tienda de Orange County.

Ventajas de la desviacin media

La desviacin media posee dos ventajas. Primero, incluye todos los valores de los clculos. Recuerde que el rango slo incluye los valores mximo y mnimo. Segundo, es fcil de denir: es la cantidad promedio que los valores se desvan de la media. Sin embargo, su inconveniente es el empleo de valores absolutos. Por lo general, es difcil trabajar con valores absolutos, as que la desviacin media no se emplea con tanta frecuencia como otras medidas de dispersin, como la desviacin estndar.

Autoevaluacin 3.6

Los pesos de los contenedores enviados a Irlanda son (en miles de libras):

95

103

105

110

104

105

112

90

a) Cul es el rango de los pesos? b) Calcule el peso medio aritmtico. c) Estime la desviacin media de los pesos.

Ejercicios
En los ejercicios 35-38, calcule: a) el rango; b) la media aritmtica; c) la desviacin media; d) el rango. Interprete los valores que obtenga.  Hubo cinco representantes de servicio al cliente trabajando en Electronic Super Store durante 35. la pasada venta de n de semana. Las cantidades de HDTV que vendieron estos representantes son: 5, 8, 4, 10 y 3.  El Departamento de Estadstica de la Western State University ofrece ocho secciones de esta36. dstica bsica. En seguida aparecen los nmeros de estudiantes matriculados en estas secciones: 34, 46, 52, 29, 41, 38, 36 y 28.  Daves Automatic Door instala puertas automticas para cocheras. La siguiente lista indica el 37. nmero de minutos que se requieren para instalar una muestra de 10 puertas automticas: 28, 32, 24, 46, 44, 40, 54, 38, 32 y 42.

76

Captulo 3

 Una muestra de ocho compaas de la industria aeronutica participaron en una encuesta 38. sobre la recuperacin de la inversin que tuvieron el ao pasado. Los resultados (en porcentaje) son los siguientes: 10.6, 12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y 15.6.  Diez adultos jvenes que viven en California, elegidos al azar, calicaron el sabor de una nue39. va pizza de sushi con atn, arroz y kelp en una escala de 1 a 50, en la que el 1 indica que no les gusta el sabor y 50 que s les gusta. Las calicaciones fueron las siguientes: 34 39 40 46 33 31 34 14 15 45

 En un estudio paralelo 10 adultos jvenes, elegidos al azar, en Iowa calicaron el sabor de la misma pizza. Las calicaciones fueron las siguientes: 28 25 35 16 25 29 24 26 17 20

 Como investigador de mercado, compare los mercados potenciales para la pizza de sushi.  Una muestra de archivos de personal de ocho empleados en las instalaciones de Pawnee de 40. Acme Carpet Cleaners, Inc., revel que durante el ltimo semestre stos perdieron la siguiente cantidad de das por enfermedad: 2 0 6 3 10 4 1 2

 Durante el mismo periodo, una muestra de ocho empleados en las instalaciones de Chickpee de Acme Carpets revel que ellos perdieron las siguientes cantidades de das por enfermedad: 2 0 1 0 5 0 1 0

 Como director de relaciones humanas, compara las dos instalaciones. Qu recomendara?

Varianza y desviacin estndar


La varianza y la desviacin estndar se basan en las desviaciones de la media elevadas al cuadrado

La varianza y la desviacin estndar tambin se fundamentan en las desviaciones de la media. Sin embargo, en lugar de trabajar con el valor absoluto de las desviaciones, la varianza y la desviacin estndar lo hacen con el cuadrado de las desviaciones.

VARIANZA Media aritmtica de las desviaciones de la media elevadas al cuadrado.

La varianza es no negativa y es cero slo si todas las observaciones son las mismas.

DESVIACIN ESTNDAR Raz cuadrada de la varianza.

Varianza de la poblacin Las frmulas de la varianza poblacional y la varianza de la muestra son ligeramente diferentes. La varianza de la poblacin se estudia primero. (Recuerde que una poblacin es la totalidad de las observaciones estudiadas.) La varianza de la poblacin se determina de la siguiente manera:
(X )2 N

2 = VARIANZA DE LA POBLACIN

[3.8]

Descripcin de datos: Medidas numricas

77

En esta frmula: es la varianza de la poblacin ( es la letra minscula griega sigma); se lee sigma 2  al cuadrado; X es el valor de una observacin de la poblacin; es la media aritmtica de la poblacin; N es el nmero de observaciones de la poblacin. Observe el proceso de clculo de la varianza: Comience determinando la media;  En seguida calcule la diferencia entre cada observacin y la media, y eleve al cuadrado dicha diferencia; Entonces sume todas las diferencias elevadas al cuadrado;  Por ltimo divida la suma de las diferencias elevadas al cuadrado entre el nmero de elementos de la poblacin. As, usted podra pensar que la varianza de la poblacin es la media de las diferencias elevadas al cuadrado entre cada valor y la media. En las poblaciones cuyos valores cercanos a la media, la varianza de la poblacin puede ser pequea.En las poblaciones cuyos valores se apartan de la media, la varianza de la poblacin puede ser grande. La varianza compensa el inconveniente que presenta el rango gracias a los valores absolutos de la poblacin, mientras que el rango incluye slo los valores mximo y mnimo. El problema de que (X ) = 0, se corrige elevando al cuadrado las diferencias, en lugar de emplear valores absolutos. Elevar al cuadrado las diferencias siempre dar como resultado valores no negativos.

Ejemplo Solucin

El nmero de multas de trnsito levantadas durante los pasados cinco meses en Beaufort County, Carolina del Sur, es de 38, 26, 13, 41 y 22. Cul es la varianza de la poblacin?

Nmero (X ) 38 26 13 41 22 140

X +10 2 15 +13 6 0*

(X )2 100 4 225 169 36 534 X 140 = = 28 N 5 (X )2 534 = = 106.8 N 5

2 =

*La suma de las desviaciones de la media debe ser igual a cero.

Como en el caso del rango y la desviacin media, la varianza se emplea para comparar la dispersin en dos o ms conjuntos de observaciones. Por ejemplo, se calcul que la varianza del nmero de multas levantadas en Beaufort County fue de 106.8. Si la varianza del nmero de multas levantadas en Marlboro County, Carolina del Sur, es de 342.9, se concluye que: 1. Hay menos dispersin en la distribucin del nmero de multas levantadas en Beaufort (ya que 106.8 es menor que 342.9); 2. El nmero de multas levantadas en Beaufort County se encuentran ms apiadas en torno a la media de 28 que el nmero de multas levantadas en Marlboro County. Por consiguiente, la media de multas levantadas en Beaufort County constituye una medida de ubicacin ms representativa que la media de multas en Marlboro County.

La varianza resulta difcil de interpretar porque las unidades se elevan al cuadrado

Desviacin estndar de la poblacin

Tanto el rango como la desviacin media resultan fciles de interpretar. El rango es la diferencia entre los valores alto y bajo de un conjunto de datos, y la desviacin media es la media de las desviaciones de la media.

78

Captulo 3

La desviacin estndar se expresa en las mismas unidades de los datos

Sin embargo, la varianza resulta difcil de interpretar en el caso de un solo conjunto de observaciones. La varianza de 106.8 del nmero de multas levantadas no se expresa en trminos de multas, sino de multas elevadas al cuadrado. Existe una forma de salir del problema. Si extrae la raz cuadrada de la varianza de la poblacin, puede convertirla a las mismas unidades de medicin empleadas en los datos originales. La raz cuadrada de 106.8 multas elevadas al cuadrado es de 10.3 multas. Las unidades ahora son sencillamente multas. La raz cuadrada de la varianza de la poblacin es la desviacin estndar de la poblacin.

DESVIACIN ESTNDAR DE LA POBLACIN

(X )2 N

[3.9]

Autoevaluacin 3.7

Este ao la oficina en Filadelfia de Price Waterhouse Coopers LLP contrat a cinco contadores que estn haciendo prcticas. Los salarios mensuales iniciales de stos fueron de $3 536, $3 173, $3 448, $3 121 y $3 622. a) Calcule la media de la poblacin. b) Estime la varianza de la poblacin. c) Aproxime la desviacin estndar de la poblacin. d)  La oficina de Pittsburgh contrat a cinco empleados que estn haciendo prcticas. El salario mensual promedio fue de $3 550 y la desviacin estndar de $250. Compare los dos grupos.

Ejercicios
Considere en una poblacin los siguientes cinco valores: 8, 3, 7, 3 y 4. a) Determine la media de la poblacin. b) Determine la varianza. Considere a los siguientes seis valores como una poblacin: 13, 3, 8, 10, 8 y 6. a) Determine la media de la poblacin. b) Determine la varianza. El informe anual de Dennis Industries incluy las siguientes ganancias primarias por accin comn durante los pasados 5 aos: $2.68, $1.03, $2.26, $4.30 y $3.58. Si supone que stos son los valores poblacionales, a)  Cules son las medias aritmticas de las ganancias primarias por accin comn? b) Cul es la varianza? 44. Con respecto al ejercicio 43, el informe anual de Dennis Industries tambin arroj estos rendi  mientos sobre valores de renta variable para el mismo periodo de cinco aos (en porcentaje): 13.2, 5.0, 10.2, 17.5 y 12.9. a) Cul es la media aritmtica del rendimiento? b) Cul es la varianza?  Plywood, Inc., inform las siguientes utilidades sobre valores de renta variable durante los 45. pasados 5 aos: 4.3, 4.9, 7.2, 6.7 y 11.6. Considere estos valores como poblacionales. a) Calcule el rango, la media aritmtica, la varianza y la desviacin estndar. b)  Compare las utilidades sobre valores de renta variable de Playwood, Inc., con las de Dennis Industries citadas en el ejercicio 44.  Los ingresos anuales de cinco vicepresidentes de TMV Industries son: $125 000, $128 000, 46. $122 000, $133 000 y $140 000. Considere estos valores como una poblacin. a) Cul es el rango? b) Cul es el ingreso medio aritmtico? c) Cul es la varianza poblacional? La desviacin estndar? d)  Tambin se estudiaron los ingresos anuales de personal de otra empresa similar a TMV. La media fue de $129 000 y la desviacin estndar de $8 612. Compare las medias y dispersiones de las dos rmas. 41. 42.  43.

Varianza muestral

La frmula para la media poblacional es _ = X / N. Sencillamente cambie los smbolos para la media de la muestra; es decir, X = X / n. Por desgracia, la conversin de una varianza poblacional en una varianza muestral no es tan directa.

Descripcin de datos: Medidas numricas

79

Requiere un cambio en el denominador. En lugar de sustituir n (el nmero en la muestra) por N (el nmero en la poblacin), el denominador es n 1. As, la frmula de la varianza muestral es: (X X )2 VARIANZA MUESTRAL s2 = n 1 en la cual: s2 es la varianza muestral; X _ es el valor de cada observacin de la muestra; X es la media de la muestra; n es el nmero de observaciones en la muestra. Por qu se hizo este cambio _ en el denominador? Aunque el empleo de n se entiende en virtud de que se utiliza X para calcular , esto tiende a subestimar la varianza poblacional, 2. La inclusin de (n 1) en el denominador proporciona la correccin adecuada para esta tendencia. Como la aplicacin fundamental de estadsticos muestrales como s2 es calcular parmetros de poblacin como 2, se preere (n 1) en lugar de n para denir la varianza muestral. Tambin se emplea esta convencin al calcular la desviacin estndar de una muestra.

[3.10]

Ejemplo Solucin

Los salarios por hora de una muestra de empleados de medio tiempo de Home Depot son: $12, $20, $16, $18 y $19. Cul es la varianza de la muestra? La varianza muestral se calcula con la frmula 3.10. X = X $85 = = $17 5 n
_ XX _ (X X ) 2 25 9 1 1 4 40

Salario por hora (X )

$12 $5 20 3 16 1 18 1 19 2 $85 0

s2 =

(X X )2 40 = n 1 5 1

= 10 en dlares al cuadrado

Desviacin estndar de la muestra

La desviacin estndar de la muestra se utiliza como estimador de la desviacin estndar de la poblacin. Como se hizo notar, la desviacin estndar de la poblacin es la raz cuadrada de la varianza de la poblacin. Asimismo, la desviacin estndar de la muestra es la raz cuadrada de la varianza de la muestra. La desviacin estndar de la muestra se calcula con mayor facilidad de la siguiente manera: (X X )2 n 1

DESVIACIN ESTNDAR DE LA MUESTRA

s=

[3.11]

80

Captulo 3

Ejemplo Solucin

La varianza de la muestra en el ejemplo anterior, que incluye salarios por hora, se calcul en 10. Cul es la desviacin estndar? __ La desviacin estndar de la muestra es $3.16, que se determina con 10 . Observe nuevamente que la varianza de la muestra se expresa en trminos de dlares al cuadrado, pero al extraer la raz cuadrada a 10 se obtiene $3.16, que se encuentra en las mismas unidades (dlares) que los datos originales.

Solucin con software


En la pgina 66 utilizamos Excel para determinar la media y la mediana de los datos de ventas de Whitner Autoplex. Tambin notar que Excel presenta la desviacin estndar de la muestra. Como la mayora de los paquetes de software de estadstica, Excel supone que los datos corresponden a una muestra. Otro paquete de software que utilizar en el libro es MINITAB. El paquete utiliza un formato de hoja de clculo, muy parecido a Excel, aunque genera una variedad ms amplia de datos de estadstica. Enseguida aparece la informacin de los precios de venta de Whitner Autoplex. Observe que se incluye un histograma (aunque la accin predeterminada consiste en utilizar un intervalo de clase de $2 000 con 11 clases), as como la media, la desviacin estndar de la muestra y el nmero de observaciones. Sobre la distribucin de frecuencias se superpone una grca de la curva normal. En el captulo 7 se le explicar la curva normal.

Autoevaluacin 3.8

Los aos de servicio de una muestra de siete empleados en la oficina de quejas de State Farm Insurance en Cleveland, Ohio, son: 4, 2, 5, 4, 5, 2 y 6. Cul es la varianza de la muestra? Calcule la desviacin estndar de la muestra.

Descripcin de datos: Medidas numricas

81

Ejercicios
En los ejercicios 47-52, efecte lo siguiente: a) Calcule la varianza de la muestra; b) Determine la desviacin estndar de la muestra.

47. Considere los siguientes valores como una muestra: 7, 2, 6, 2 y 3. 48. Los siguientes cinco valores son una muestra: 11, 6, 10, 6 y 7.  Daves Automatic Door, referido en el ejercicio 37, instala puertas automticas para cocheras. 49. Sobre la base de una muestra, los siguientes son los tiempos, en minutos, que se requieren para instalar 10 puertas automticas: 28, 32, 24, 46, 44, 40, 54, 38, 32 y 42.  A la muestra de ocho compaas en la industria aeronutica, referida en el ejercicio 36, se le 50. aplic una encuesta referente a su recuperacin de inversin del ao pasado. Los resultados son los siguientes: 10.6, 12.6, 14.8, 18.2, 12.0, 14.8, 12.2 y 15.6.  La Asociacin de Propietarios de Moteles de Houston, Texas, llev a cabo una encuesta relati51. va a las tarifas de motel entre semana en el rea. Enseguida aparece la tarifa por cuarto para huspedes de negocios en una muestra de 10 moteles. $101 $97 $103 $110 $78 $87 $101 $80 $106 $88

 Una organizacin de proteccin al consumidor se ocupa de las deudas con las tarjetas de 52. crdito. Una encuesta entre 10 adultos jvenes con una deuda con la tarjeta de crdito de ms de $2 000 mostr que stos pagan en promedio un poco ms de $100 mensuales como abono a sus saldos. En la siguiente lista aparecen las sumas que cada adulto joven pag el mes pasado. $110 $126 $103 $93 $99 $113 $87 $101 $109 $100

Estadstica en accin
Un promedio es un valor empleado para representar todos los datos. Sin embargo, a menudo no ofrece el panorama de los datos. Los inversionistas encaran con frecuencia con este problema cuando consideran dos inversiones en fondos mutualistas, como el ndice Vanguard 500 y los fondos GNMA. En agosto de 2003, la tasa de rendimiento anualizada de los fondos del Index 500 fue de 11.26% con una desviacin estndar de 16.9. El fondo GNMA tuvo una tasa de rendimiento anualizada de 8.86% con una desviacin estndar de 2.68. La desviacin estndar muestra que la tasa de rendimiento del ndice 500 puede variar mucho. De hecho, las tasas de rendimiento anuales de los pasados 10 aos variaron entre 22.15% a 37.45%. La desviacin estndar del fondo GNMA es mucho menor. Sus tasas de rendimiento durante los pasados 10 aos variaron de 0.95% a 11.22%. (www.vanguard.com)

Interpretacin y usos de la desviacin estndar


La desviacin estndar normalmente se utiliza como medida para comparar la dispersin de dos o ms conjuntos de observaciones. Por ejemplo, se calcula que la desviacin estndar de las sumas quincenales invertidas en el plan de reparto de utilidades Dupree Saint Company es de $7.51. Suponga que estos empleados se ubican en Georgia. Si la desviacin estndar de un grupo de empleados en Texas es de $10.47 y las medias son casi las mismas, esto indica que las sumas invertidas por los empleados de Georgia no se encuentran tan dispersas como las de los empleados en Texas (ya que $7.51 < $10.47). Como las sumas invertidas por los empleados de Georgia se acumulan ms cerca de la media, la media para los empleados de Georgia es una medida ms conable que la media para el grupo de Texas.

Teorema de Chebyshev
Ya se ha insistido en el hecho de que una desviacin estndar pequea para un conjunto de valores, indica que estos valores se localizan cerca de la media. Por lo contrario, una desviacin grande revela que las observaciones se encuentran muy dispersas con respecto a la media. El matemtico ruso P. L. Chebyshev (1821-1894) estableci un teorema que nos permite determinar la mnima porcin de valores que se encuentran a cierta cantidad de desviaciones estndares de la media. Por ejemplo, de acuerdo con el teorema de Chebyshev, por lo menos tres de cuatro valores, o 75%, deben encontrarse entre la media ms dos desviaciones estndares y la media menos dos desviaciones estndares. Esta relacin se cumple con independencia de la forma de la distribucin. Adems, por lo menos ocho de los nueve valores, 88.9%, se encontrarn ms de tres desviaciones estndares y menos tres desviaciones estndares de la media. Por lo menos 24 de 25 valores, o 96%, se encontrar entre ms y menos cinco desviaciones estndares de la media.

82

Captulo 3

El teorema de Chebyshev establece lo siguiente: TEOREMA DE CHEBYSHEV En cualquier conjunto de observaciones (muestra o poblacin), la proporcin de valores que se encuentran a k desviaciones estndares de la media es de por lo menos 1 1/k2, siendo k cualquier constante mayor que 1. La media aritmtica de la suma quincenal que aportan los empleados de Dupree Saint para el plan de reparto de utilidades de la compaa es de $51.54 y la desviacin estndar, de $7.51. Por lo menos qu porcentaje de las aportaciones se encuentra en ms 3.5 desviaciones estndares y menos 3.5 desviaciones de la media? Alrededor de 92%, que se determina de la siguiente manera: 1 1 k2 =1 1 (3.5)2 =1 1 = 0.92 12.25

Ejemplo Solucin

La regla emprica
La regla emprica slo se aplica a distribuciones simtricas con forma de campana

El teorema de Chebyshev tiene que ver con cualquier conjunto de valores; es decir, que la distribucin de valores puede tener cierta forma. Sin embargo, en cualquier distribucin simtrica con forma de campana, como muestra la grca 3.7, es posible ser ms precisos en la explicacin de la dispersin en torno a la media. Estas relaciones que implican la desviacin estndar y la media se encuentran descritas en la regla emprica, a veces denominada regla normal. REGLA EMPRICA En cualquier distribucin de frecuencias simtrica con forma de campana, aproximadamente 68% de las observaciones se encontrarn entre ms y menos una desviacin estndar de la media; cerca de 95% de las observaciones se encontrarn entre ms y menos dos desviaciones estndares de la media y, de hecho todas (99.7%), estarn entre ms y menos tres desviaciones estndares de la media. Estas relaciones se representan en la grca 3.7 en el caso de una distribucin con forma de campana con una media de 100 y una desviacin estndar de 10.

70

80

90

100 110 68% 95% 99.7%

120

130

GRFICA 3.7 Curva simtrica con forma de campana que muestra las relaciones entre la
desviacin estndar y las observaciones

Se ha observado que si una distribucin es simtrica y tiene forma de campana, todas las observaciones se encuentran entre la media ms y menos tres desviaciones estndares.

Descripcin de datos: Medidas numricas

83

_ Por consiguiente, si X = 100 y s = 10, todas las observaciones se encuentran entre 100 + 3(10) y 100 3(10), o 70 y 130. Por tanto, el rango es de 60, que se calcula restando 130 70. Por lo contrario, si sabe que el rango es de 60, puede aproximar la desviacin estndar dividiendo el rango entre 6. En este caso: rango 6 = 60 6 = 10, la desviacin estndar.

Ejemplo

Una muestra de tarifas de renta de los departamentos University Park se asemeja a una distribucin simtrica con forma de campana. La media de la muestra es de $500; la desviacin estndar de $20. De acuerdo con la regla emprica conteste las siguientes preguntas: 1.  Entre qu dos cantidades se encuentra aproximadamente 68% de los gastos mensuales en alimentos? 2.  Entre qu dos cantidades se encuentra cerca de, 95% de los gastos mensuales en alimentos? 3.  Entre qu dos cantidades se encuentran casi todos los gastos mensuales en alimentos?

Solucin

1.  Cerca de 68% se encuentra entre $480 y $520, calculado de la siguiente manera: _ X 1s = $500 1($20). 2.  Aproximadamente 95% se encuentra entre $460 y $540, calculado de la siguien_ te manera: X 2s = $500 2($20). 3.  Casi todas _ (99.7%) se encuentran entre $440 y $560, calculado de la siguiente manera: X 3s = $500 3($20).
Pitney Pipe Company es uno de los fabricantes nacionales de tubos PVC. El departamento de control de calidad tom una muestra de 600 tubos de 10 pies de longitud. A una distancia de 1 pie del extremo del tubo, se midi el dimetro externo. La media fue de 14.0 pulgadas y la desviacin estndar de 0.1 pulgadas. a)  Si no conoce la forma de la distribucin, por lo menos qu porcentaje de las observaciones se encontrar entre 13.85 y 14.5 pulgadas? b)  Si supone que la distribucin de los dimetros es simtrica y tiene forma de campana, entre qu dos valores se encontrar aproximadamente 95% de las observaciones?

Autoevaluacin 3.9

Ejercicios
 De acuerdo con el teorema de Chebyshev, por lo menos qu porcentaje de cualquier conjun53. to de observaciones se encontrar a 1.8 desviaciones estndares de la media?  El ingreso medio de un grupo de observaciones de una muestra es de $500; la desviacin 54. estndar es de $40. De acuerdo con el teorema de Chebyshev, por lo menos qu porcentaje de ingresos se encontrar entre $400 y $600?  La distribucin de pesos de una muestra de 1 400 contenedores de carga es simtrica y tiene 55. forma de campana. De acuerdo con la regla emprica, qu porcentaje de pesos se encontrar entre: _ _ a) entre X _ 2s _ y X + 2s?; _ b) entre X y X + 2s? Debajo de X 2s?  La siguiente grca representa la distribucin del nmero de refrescos tamao gigante ven56. didos en un restaurante Wendys los recientes 141 das. La cantidad promedio de refrescos vendidos por da es de 91.9 y la desviacin estndar de 4.67.

90

Ventas

100

Si utiliza la regla emprica, entre qu dos valores de 68% de los das se encontrarn las ventas?

84

Captulo 3

La media y la desviacin estndar de datos agrupados


Estadstica en accin
Derrek Lee, de los Osos de Chicago, ostent el mximo promedio de bateo de 0.335 durante la temporada 2005. Tony Gwynn bate 0.394 en la temporada 1994, en la que hubo pocos strikes, y Ted Williams bate 0.406 en 1941. Nadie ha bateado arriba de 0.400 desde 1941. El promedio de bateo se ha mantenido constante alrededor de 0.260 por ms de 100 aos, pero la desviacin estndar se redujo de 0.049 a 0.031. Esto indica que hay menos dispersin en el promedio de bateo de hoy y permite explicar la falta de bateadores que hayan alcanzado 0.400 recientemente.

En la mayora de los casos las medidas de ubicacin, como la media, y las medidas de dispersin, como la desviacin estndar, se determinan utilizando valores individuales. Los paquetes de software de estadstica facilitan el clculo de estos valores, incluso en el caso de conjuntos grandes de datos. Sin embargo, algunas veces slo se cuenta con la distribucin de frecuencias y se desea calcular la media o la desviacin estndar. En la siguiente discusin, se le mostrar cmo calcular la media y la desviacin estndar a partir de datos organizados en una distribucin de frecuencias. Hay que insistir en que una media o una desviacin estndar de datos agrupados es una estimacin de los valores reales correspondientes.

Media aritmtica
Para aproximar la media aritmtica de datos organizados en una distribucin de frecuencia, comience suponiendo que las observaciones en cada clase se representan a travs del punto medio de la clase. La media de una muestra de datos organizados en una distribucin de frecuencias se calcula de la siguiente manera:

MEDIA ARITMTICA DE DATOS AGRUPADOS

X =

fM n

[3.12]

En esta _ frmula: X designa la media muestral; M es el punto medio de cada clase; f es la frecuencia en cada clase; fM es la frecuencia en cada clase multiplicada por el punto medio de la clase; fM es la suma de estos productos; n es el nmero total de frecuencias.

Ejemplo

Los clculos de la media aritmtica de datos agrupados en una distribucin de frecuencias que aparecen enseguida se basan en los datos de Whitner Autoplex. Recuerde que en el captulo 2, tabla 2.7, construy una distribucin de frecuencias de precios de venta de vehculos. La informacin se repite abajo. Determine el precio de venta medio aritmtico de los vehculos.
Precio de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36

Frecuencia 8 23 17 18 8 4 2 80

Total

Descripcin de datos: Medidas numricas

85

Solucin

El precio de venta medio de los vehculos se calcula a partir de datos agrupados en una distribucin de frecuencias. Para calcular la media, suponga que el punto medio de cada clase es representativo de los valores de datos en dicha clase. Recuerde que el punto medio de una clase se encuentra a la mitad de los lmites de clase superior e inferior. Para determinar el punto medio de una clase en particular, sume los lmites de clase superior e inferior y divida entre 2. Por consiguiente, el punto medio de la primera clase es $16.5, que se calcula con la operacin ($15 + $18)/2. Asuma que el valor de $16.5 es representativo de los ocho valores en dicha clase. En otras palabras, se asume que la suma de los ochos valores en esta clase es de $132, que se calcula por medio del producto 8($16.5). Contine con el proceso de multiplicacin del punto medio de clase por la frecuencia de clase de cada clase y enseguida sume estos productos. Los resultados se resumen en la tabla 3.1. TablA 3.1 Precio de 80 nuevos vehculos vendidos el mes pasado en el lote de
Whitner Autoplex

Precio de venta (miles de dlares) Frecuencia (f ) 15 18 21 24 27 30 33 a a a a a a a

Punto medio (M )

fM

18 8 $16.5 $132.0 21 23 19.5 448.5 24 17 22.5 382.5 27 18 25.5 459.0 30 8 28.5 228.0 33 4 31.5 126.0 36 2 34.5 69.0 80 $1 845.0

Total

Al despejar la media aritmtica de la frmula 3.12 se obtiene: X = fM $1 845 = = $23.1(miles) 80 n

As, se concluye que el precio de venta medio de los vehculos es de aproximadamente $23 100.

Desviacin estndar
Para calcular la desviacin estndar de datos agrupados en una distribucin de frecuencias, necesita ajustar ligeramente la frmula 3.11. Pondere cada una de las diferencias cuadradas por el nmero de frecuencias en cada clase. La frmula es:

DESVIACIN ESTNDAR, DATOS AGRUPADOS

s=

f (M X )2 n 1

[3.13]

en la que: s es el smbolo de la desviacin estndar de la muestra; M es el punto medio de la clase; f es la frecuencia de clase; n _ es el nmero de observaciones en la muestra; X designa la media muestral.

86

Captulo 3

Ejemplo Solucin

Consulte la distribucin de frecuencias de los datos de Whitner Autoplex que aparecen en la tabla 3.1. Calcule la desviacin estndar de los precios de venta de los vehculos. De acuerdo con la misma tcnica empleada anteriormente para calcular la media de los datos agrupados en una distribucin de frecuencias, f es la frecuencia de clase, M es el punto medio de clase y n es el nmero de observaciones.
Precio de venta (miles de dlares) 15 18 21 24 27 30 33 a a a a a a a 18 21 24 27 30 33 36 Frecuencia (f ) 8 23 17 18 8 4 2 _ Punto medio (M ) (M X ) 16.5 6.6 19.5 3.6 22.5 0.6 25.5 2.4 28.5 5.4 31.5 8.4 34.5 11.4 _ (M X )2 _ f (M X )2 348.48 298.08 6.12 103.68 233.28 282.24 259.92

43.56 12.96 0.36 5.76 29.16 70.56 129.96

80

1 531.80

Para determinar la desviacin estndar: _ Paso 1: Reste la media del punto medio de clase. Es decir, encuentre (M X ).  Para la primera clase (16.5 23.1 = 6.6); para la segunda clase (19.5 23.1 = 3.6) y as en lo sucesivo. Paso 2: Eleve al cuadrado la diferencia entre el punto medio de clase y la media.  En el caso de la primera clase sera (16.5 23.1)2 = (6.6)2 = 43.56; en el caso de la segunda clase (19.5 23.1)2 = (3.6)2 = 12.96 y as en lo sucesivo. Paso 3: Multiplique la diferencia al cuadrado entre el punto medio de clase y la  media por la frecuencia de clase. Para la primera clase el valor es 8(16.5 23.1)2 = 348.48; para la segunda 23(19.5 23.1)2 = 298.08 y as sucesivamente. _ Paso 4: Sume f (M X )2. El total es 1 531.8. Para determinar la desviacin estndar, sustituya estos valores en la frmula 3.13. s= f (M X )2 1531.8 = 4.403 n 1 80 1

La media y la desviacin estndar calculadas a partir de datos agrupados en una distribucin de frecuencias, por lo general se encuentran cerca de los valores calculados a partir de los datos en bruto. Los datos agrupados originan la prdida de alguna informacin. En el caso del problema del precio de venta de los vehculos, el precio medio de venta que aparece en la hoja de Excel de la pgina 66 es de $23 218 y la desviacin estndar de $4 354. Los valores respectivos calculados a partir de datos agrupados en una distribucin de frecuencias son $23 100 y $4 403. La diferencia en las medias es de $118 o aproximadamente 0.51%. Las desviaciones estndares dieren por $49 o 1.1%. Sobre la base de la diferencia porcentual, las aproximaciones se acercan mucho a los valores reales.

Autoevaluacin 3.10

Los ingresos netos de una muestra de grandes importadores de antigedades se organizaron en la siguiente tabla:

Ingreso neto (millones de dlares) 2 a 6 6 a 10 10 a 14 14 a 18 18 a 22

Nmero de importadores 1 4 10 3 2

Descripcin de datos: Medidas numricas

87

a) Qu nombre recibe la tabla? b)  Sobre la base de la distribucin, cul es el clculo aproximado del ingreso neto medio aritmtico? c) Con base en la distribucin, cul es el clculo aproximado de la desviacin estndar?

Ejercicios
 Cuando calcula la media de una distribucin de frecuencia, por qu hace referencia a sta 57. como una media aproximada? 58. Determine la media y la desviacin estndar de la siguiente distribucin de frecuencias. Clase 0 5 10 15 20 a a a a a 5 10 15 20 25 Frecuencia 2 7 12 6 3

59. Determine la media y la desviacin estndar de la siguiente distribucin de frecuencias.

Clase 20 30 40 50 60 a a a a a 30 40 50 60 70

Frecuencia 7 12 21 18 12

 SCCoast, un proveedor de Internet en el sureste de Estados Unidos, elabor una distribucin 60. de frecuencias sobre la edad de los usuarios de Internet. Determine la media y la desviacin estndar. Edad (aos) 10 20 30 40 50 a a a a a 20 30 40 50 60 Frecuencia 3 7 18 20 12

 El IRS (Internal Revenue Service) estaba interesado en el nmero de formas scales individua61. les que preparan las pequeas empresas de contabilidad. El IRS tom una muestra aleatoria de 50 empresas de contabilidad pblica con 10 o ms empleados en la zona de Dallas-Fort Worth. La siguiente tabla de frecuencias muestra los resultados del estudio. Calcule la media y la desviacin estndar. Nmero de clientes 20 30 40 50 60 a a a a a 30 40 50 60 70

Frecuencia 1 15 22 8 4

88

Captulo 3

 Los gastos en publicidad constituyen un elemento signicativo del costo de los artculos ven62. didos. Enseguida aparece una distribucin de frecuencias que muestra los gastos en publicidad de 60 compaas fabricantes ubicadas en el suroeste de Estados Unidos. Calcule la media y la desviacin estndar de los gastos de publicidad.

Gastos en publicidad (millones de dlares) 25 35 45 55 65 a a a a a 35 45 55 65 75

Nmero de compaas 5 10 21 16 8 60

Total

tica e informe de resultados


En el captulo 1 se analiz la manera de informar resultados estadsticos con tica e imparcialidad. Aunque est aprendiendo a organizar, resumir e interpretar datos empleando la estadstica, tambin es importante que comprenda la estadstica con el n de que se convierta en un consumidor de informacin inteligente. En este captulo, aprendi la forma de calcular estadsticas descriptivas de naturaleza numrica. Especcamente la manera de calcular e interpretar medidas de ubicacin para un conjunto de datos: la media, la mediana y la moda. Tambin ha estudiado las ventajas y desventajas de cada estadstico. Por ejemplo, si un agente de bienes races le dice a un cliente que la casa promedio de determinada parcela se vendi en $150 000, supondr que $150 000 es un precio de venta representativo de todas las casas. Pero si el cliente pregunta, adems, cul es la mediana del precio de venta y resulta ser $60 000. Por qu inform el agente solamente el precio promedio? Esta informacin es de suma importancia para que una persona tome una decisin cuando compra una casa. Conocer las ventajas y desventajas de la media, la mediana y la moda es importante al dar un informe estadstico y cuando se emplea informacin estadstica para tomar decisiones. Tambin aprendi a calcular medidas de dispersin: el rango, la desviacin media y la desviacin estndar. Cada uno de estos estadsticos tambin tiene ventajas y desventajas. Recuerde que el rango proporciona informacin sobre la dispersin total de una distribucin. Sin embargo, no proporciona informacin sobre la forma en que se acumulan los datos o se concentran en torno al centro de la distribucin. Conforme aprenda ms estadstica, necesitar recordar que cuando emplea estadsticas debe mantener un punto de vista independiente y con principios. Cualquier informe estadstico requiere la comunicacin honesta y objetiva de los resultados.

Resumen del captulo


I.  Una medida de ubicacin es un valor que sirve para describir el centro de un conjunto de datos. A. La media aritmtica es la medida de ubicacin que ms se informa. 1.  Se calcula sumando los valores de las observaciones y dividiendo entre el nmero total de observaciones. a) La frmula para una media poblacional de datos no agrupados o en bruto es: X N

[3.1]

Descripcin de datos: Medidas numricas

89

b) La frmula para la media de una muestra es: X = X n fM n [3.2]

c) La frmula para la media muestral en una distribucin de frecuencias es

Estadstica en accin
La mayora de las universidades informan el tamao promedio de los grupos. Esta informacin puede inducir a error, ya que el tamao promedio de los grupos se determina de diversas formas. Si calcula la cantidad de estudiantes en cada clase en cierta universidad, el resultado es la cantidad promedio de estudiantes por clase. Si recaba una lista de tamaos de grupos y calcula el tamao de grupo promedio, podra hallar que la media es muy diferente. Una escuela descubri que el promedio de estudiantes en cada una de sus 747 clases era de 40. Pero cuando calcul la media a partir de una lista de tamaos de grupo, sta result ser de 147. Por qu la discrepancia? Hay menos estudiantes en los grupos pequeos y una gran cantidad de estudiantes en los grupos grandes, lo cual tiene el efecto de incrementar el tamao promedio de los grupos cuando se calcula de esta manera. Una universidad podra reducir su tamao promedio de grupo reduciendo el nmero de estudiantes en cada grupo. Esto significa eliminar las ctedras en las que hay muchos estudiantes de primer grado.

X =

[3.12]

2. Las caractersticas principales de la media aritmtica son las siguientes: a) Por lo menos se requiere la escala de medicin de intervalo. b) Todos los valores de los datos se incluyen en el clculo. c) Un conjunto de datos slo posee una media. Es decir que sta es nica. d) La suma de las desviaciones de la media es igual a 0. B.  La media ponderada se encuentra multiplicando cada observacin por su correspondiente ponderacin. 1. La frmula para determinar la media ponderada es: Xw = W1X 1 + W2 X 2 + W3 X 3 + + Wn X n W +W +W + +W
1 2 3 n

[3.3]

2. ste es un caso especial de la media aritmtica. C. La mediana es el valor que se encuentra en medio de un conjunto de datos ordenados. 1.  Para determinar la mediana, se ordenan las observaciones de menor a mayor y se identica el valor intermedio. 2. Las principales caractersticas de la mediana son las siguientes: a) Se requiere por lo menos la escala ordinal de medicin. b) No inuyen sobre sta valores extremos. c) Cincuenta por ciento de las observaciones son ms grandes que la mediana. d) sta es nica para un conjunto de datos. D. La moda es el valor que se presenta con mayor frecuencia en un conjunto de datos. 1. La moda se determina en el caso de datos de nivel nominal. 2. Un conjunto de datos puede tener ms de una moda. E. La media geomtrica es la ensima raz del producto de n valores positivos. 1. La frmula de la media geomtrica es la siguiente: GM = n (X 1)(X 2 )(X 3 )(X n ) [3.4]

2.  La media geomtrica tambin se emplea para determinar la razn de cambio de un periodo a otro. GM = n Valor al final del periodo Valor al princi ipio del periodo [3.5]

3. La media geomtrica siempre es igual o menor que la media aritmtica. II. La dispersin es la variacin o propagacin en un conjunto de datos. A. El rango es la diferencia entre el valor mximo y el mnimo en un conjunto de datos. 1. La frmula del rango es la siguiente: Rango Valor ms alto Valor ms bajo [3.6]

2. Las principales caractersticas del rango son: a) Slo dos valores se emplean en su clculo. b) Recibe la inuencia de los valores extremos. c) Es fcil de calcular y denir. B.  La desviacin absoluta media es la suma de los valores absolutos de las desviaciones de la media, dividida entre el nmero de observaciones. 1. La frmula para calcular la desviacin absoluta media es: 2. MD = X X n [3.7]

Las principales caractersticas de la desviacin absoluta media son las siguientes: a) No inuyen excesivamente sobre ella valores grandes o pequeos. b) Todas las observaciones se emplean en el clculo. c) Los valores absolutos son de alguna forma difciles de manejar.

90

Captulo 3

C. La varianza es la media de las desviaciones al cuadrado de la media aritmtica. 1. La frmula de la varianza de la poblacin es la siguiente: 2 = X N

)2

[3.8]

2. La frmula de la varianza de la muestra es la siguiente: s2 = X X n 1

3.

)2

[3.10]

Las principales caractersticas de la varianza son: a) Todas las observaciones se utilizan en el clculo. b) No inuyen excesivamente sobre ella observaciones extremas. c)  Resulta de alguna manera difcil trabajar con las unidades; stas son las unidades originales elevadas al cuadrado. D. La desviacin estndar es la raz cuadrada de la varianza. 1. Las principales caractersticas de la desviacin estndar son: a) Se expresa en las mismas unidades de los datos originales. b) Es la raz cuadrada de la distancia promedio al cuadrado de la media. c) No puede ser negativa. d) Es la medida de dispersin que se informa con ms frecuencia. 2. La frmula de la desviacin estndar de la muestra es: s= X X n 1

)2 )2

[3.11]

3. La frmula de la desviacin estndar para datos agrupados es: s= f M X n 1

[3.13]

III. Interpret la desviacin estndar empleando dos medidas. A.  El teorema de Chebyshev establece que independientemente de la forma de la distribucin, por lo menos 1 1/k2 de las observaciones se encontrarn a k desviaciones estndares de la media, siendo k mayor que 1. B.  La regla emprica arma que en el caso de una distribucin en forma de campana, aproximadamente 68% de los valores se encontrarn a una desviacin estndar de la media; 95%, a dos y casi todas, a tres.

Clave de pronunciacin
SMBOLO _X X _ SIGNIFICADO Media de poblacin Operacin de suma Suma de un grupo de valores Media de la muestra Media ponderada Media geomtrica Suma del producto de las frecuencias y los puntos medios de clase Varianza de la poblacin Desviacin estndar de la poblacin PRONUNCIACIN Mu Sigma Sigma X X barra X barra subndice w GM Sigma f M Sigma al cuadrado Sigma

X w GM fM 2

Ejercicios del captulo


63.  La empresa de contabilidad Crawford and Associates posee cinco socios. El da de ayer los socios atendieron a seis, cuatro, siete y cinco clientes, respectivamente. a) Calcule el nmero medio y el nmero mediano de clientes que cada socio atendi. b) Es la media una muestral o una poblacional? c) Verique que (X ) = 0.

Descripcin de datos: Medidas numricas

91

64.  Owens Orchards vende manzanas por peso en bolsas grandes. Una muestra de siete bolsas contena las siguientes cantidades de manzanas: 23, 19, 26, 17, 21, 24 y 22. a) Calcule la cantidad media y la cantidad mediana de manzanas que hay en una bolsa. _ b) Verique que (X X ) = 0. 65.  Una muestra de familias que ha contratado los servicios de la United Bell Phone Company revel el siguiente nmero de llamadas recibidas por familia la semana pasada. Determine el nmero medio y la mediana de llamadas recibidas. 52 34 43 46 30 32 38 18 30 41 42 5 12 46 39 37

66.  La Citizens Banking Company estudia la cantidad de veces que utiliza al da el cajero automtico ubicado en uno de los supermercados de Loblaws, sobre Market Steet. Enseguida guran las cantidades de ocasiones que se utiliz la mquina al da durante los pasados 30 das. Determine la cantidad media de veces que se utiliz la mquina al da. 83 63 95 64 80 36 84 84 78 76 73 61 84 68 59 54 52 84 75 65 95 59 90 47 70 52 87 61 77 60

67.  El gobierno canadiense desea conocer la edad relativa de su fuerza laboral. Conforme la generacin de baby boomers envejece, el gobierno se interesa en la disponibilidad de trabajadores jvenes calicados. Con el n de informarse, el gobierno realiza una encuesta en varias industrias sobre las edades de los empleados. La siguiente tabla contiene la edad media y mediana para dos industrias, comunicaciones y comercio minorista, tomando en cuenta seis diferentes tipos de trabajo. Directores Profesionales Tcnica/Oficios Marketing/Ventas Oficinistas/Administrativos Trabajadores de la produccin Comunicacin y otras empresas Media 42.6 40.8 41.4 NA 40.8 37.2 Mediana 43 40 42 NA 41 40 Comercio minorista y servicios al consumidor Media 38.6 40.0 37.1 33.7 38.0 32.0 Mediana 38 39 37 31 38 24

 Comente sobre la distribucin de edades. Qu industria parece tener trabajadores de ms edad? Cul tiene trabajadores ms jvenes? Qu tipos de trabajo muestran la mayor diferencia entre la edad media y la mediana en cada industria? 68.  Trudy Green trabaja para la True-Green Lawn Company. Su trabajo consiste en buscar por telfono negocios de mantenimiento de csped. Enseguida aparece una lista de la cantidad de citas por hora que hizo durante las ltimas 25 horas de llamadas. Cul es la media aritmtica de citas que hace por hora? Cul es la cantidad mediana de citas que hace por hora? Redacte un breve informe que resuma sus conclusiones. 9 4 5 4 2 7 6 8 5 4 6 4 4 5 4 5 7 4 2 8 3 3 6 3 3

69.  La Split-A-Rail Fence Company vende tres tipos de cerca a propietarios de casa en los suburbios de Seattle, Washington. Las cercas grado A tienen un costo de $5.00 el pie de instalacin. Las cercas grado B tienen un costo de $6.50 el pie de instalacin y las grado C, las de alta calidad, tienen un costo de $8.00 el pie de instalacin. Ayer, Split-A-Rail instal 270 pies de cerca grado A, 300 pies de cerca grado B y 100 pies de cerca grado C. Cul fue el costo medio por pie de cerca instalada? 70.  Rolland Poust es un estudiante de primer grado de la Facultad de Administracin del Scandia Tech. El semestre anterior tom dos cursos de estadstica y contabilidad de 3 horas cada uno y obtuvo una A en ambos. Obtuvo B en un curso de historia de cinco horas y B en un curso de historia del jazz de dos horas. Adems tom un curso de una hora que tena que ver con las reglas de bsquetbol con el n de obtener su licencia para arbitrar partidos de bsquetbol de escuela secundaria. Obtuvo una A en este curso. Cul fue su promedio semestral? Suponga que le dan 4 puntos por una A; 3 por una B y as sucesivamente. Qu medida de ubicacin calcul?

92

Captulo 3

71.  La siguiente tabla muestra el porcentaje de fuerza laboral desempleada y el tamao de la fuerza laboral en tres condados del noroeste de Ohio. Jon Elsas es director regional de desarrollo econmico. Debe presentar un informe a varias compaas que piensan ubicarse en el noroeste de Ohio. Cul sera un ndice de desempleo adecuado para toda la regin? Condado Wood Ottawa Lucas Porcentaje de desempleo 4.5 3.0 10.2 Tamao de la fuerza laboral 15 300 10 400 150 600

72.  La American Automobile Association verica los precios de la gasolina antes de varios nes de semana festivos. La siguiente lista incluye los precios de autoservicio de una muestra de 15 gasolineras de menudeo durante el n de semana del da del trabajo de 2005 en el rea de Detroit, Michigan. 3.44 3.41 73.  3.42 3.49 3.35 3.45 3.39 3.48 3.49 3.39 3.49 3.46 3.41 3.44 3.46

74. 

75.  76. 77.  78. 

a) Cul es la media aritmtica del precio de venta? b) Cul es la mediana del precio de venta? c) Cul es el precio de venta modal? El rea metropolitana de Los ngeles-Long Beach, California, es el rea que se espera que muestre el mayor incremento en el nmero de trabajos de 1989 a 2010. Se espera que el nmero de trabajos se incremente de 5 164 900 a 6 286 800. Cul es la media geomtrica de la tasa de incremento anual esperada? Un artculo reciente sugiri que, si en la actualidad usted gana $25 000 anuales y la tasa de inacin contina siendo de 3% anual, usted necesitar ganar $33 598 en 10 aos para tener el mismo poder adquisitivo. Qu necesitara hacer para percibir $44 771 si la tasa de inacin se elevara a 6%? Conrme si estas armaciones son exactas determinando la tasa media geomtrica de incremento. Las edades de una muestra que se tom de turistas canadienses que vuelan de Toronto a Hong Kong fueron las siguientes: 32, 21, 60, 47, 54, 17, 72, 55, 33 y 41. a) Calcule el rango. b) Estime la desviacin media. c) Calcule la desviacin estndar. Los pesos (en libras) de una muestra de cinco cajas enviadas por UPS son: 12, 6, 7, 3 y 10. a) Calcule el rango. b) Aproxime la desviacin media. c) Calcule la desviacin estndar. Un estado del sur de Estados Unidos cuenta con siete universidades estatales en su sistema. Los nmeros en volumen (en miles) que guardan en sus bibliotecas son: 83, 510, 33, 256, 401, 47 y 23. a) Es una muestra o una poblacin? b) Calcule la desviacin estndar. Los temas de salud representan una preocupacin para gerentes, especialmente cuando stos evalan el costo del seguro mdico. Una encuesta reciente de 150 ejecutivos de Elvers Industries, una importante empresa nanciera y de seguros, ubicada en el suroeste de Estados Unidos, inform la cantidad de libras de sobrepeso de los ejecutivos. Calcule la media y la desviacin estndar. Libras de sobrepeso 0 6 12 18 24 a a a a a 6 12 18 24 30 Frecuencia 14 42 58 28 8

79.  El programa espacial Apolo dur de 1967 hasta 1972 e incluy 13 misiones. Las misiones tuvieron una duracin de 7 a 301 horas. Enseguida aparece la duracin de cada vuelo. 9 10 195 295 241 142 301 216 260 7 244 192 147

Descripcin de datos: Medidas numricas

93

80. 

a) Explique la razn por la que los tiempos de vuelo constituyen una poblacin. b) Calcule la media y la mediana de los tiempos de vuelo. c) Estime el rango y la desviacin estndar de los tiempos de vuelo. Creek Ratz es un restaurante muy popular localizado en la costa del norte de Florida, sirve una variedad de alimentos con carne de res y mariscos. Durante la temporada de vacaciones de verano, no se aceptan reservaciones. La gerencia del restaurante est interesada en conocer el tiempo que un cliente tiene que esperar antes de pasar a la mesa. A continuacin aparece la lista de tiempos de espera, en minutos, para las 25 mesas que se ocuparon la noche del sbado pasado. 28 51 64 39 45 25 23 44 24 67 65 27 37 61 29 28 27 56 24 40 61 28 34 50 44

81. 

a) Explique la razn por la que los tiempos constituyen una poblacin. b) Calcule la media y la mediana de los tiempos de espera. c) Estime el rango y la desviacin estndar de los tiempos de espera. El gerente de la tienda Wal-Mart de la localidad estudia la cantidad de artculos que compran los consumidores en el horario de la tarde. A continuacin aparece la cantidad de artculos de una muestra de 30 consumidores. 15 12 5 8 4 6 6 7 11 9 8 14 9 12 5 4 10 6 18 10 6 10 11 5 10 9 13 12 13 5

a) Calcule la media y la mediana de la cantidad de artculos. b) Estime el rango y la desviacin estndar de la cantidad de artculos. c)  Organice la cantidad de artculos en una distribucin de frecuencias. Quiz desee repasar las instrucciones del captulo 2 para establecer el intervalo de clase y el nmero de clases. d)  Calcule la media y la desviacin estndar de los datos organizados en una distribucin de frecuencias. Compare estos valores con los que calcul en el inciso a) Por qu son diferentes? 82.  La siguiente distribucin de frecuencias contiene los costos de electricidad de una muestra de 50 departamentos de dos recmaras en Albuquerque, Nuevo Mxico, durante el mes de mayo del ao pasado. Costos de electricidad $ 80 100 120 140 160 180 a a a a a a $100 120 140 160 180 200 Frecuencia 3 8 12 16 7 4 50

Total

a) Calcule el costo medio. b) Aproxime la desviacin estndar. c)  Utilice la regla emprica para calcular la fraccin de costos que se encuentra a dos desviaciones estndares de la media. Cules son estos lmites? 83.  Bidwell Electronics, Inc., recin tom una muestra de empleados para determinar la distancia a la que viven de las ocinas centrales de la empresa. Los resultados aparecen a continuacin. Calcule la media y la desviacin estndar. Distancia (miles) 0 a 5 5 a 10 10 a 15 15 a 20 20 a 25 Frecuencia 4 15 27 18 6 M 2.5 7.5 12.5 17.5 22.5

94

Captulo 3

ejercicios.com
84.  El estado de Indiana y la Escuela de Administracin Kelley de la Universidad de Indiana ofrecen vnculos para diversas fuentes de datos. Dirjase a www.stats.indiana.edu; enseguida, bajo el encabezado de indicadores sociales y econmicos, seleccione Birth/Death/Marriage; bajo comparaciones de estados, seleccione Anual Birth Data; para Geography Type, seleccione U.S. and 50 States; para Specic Geography, seleccione all states y, nalmente, seleccione Get Data. La informacin se puede presentar en un formato de Excel. Suponga que se encuentra interesado en la cantidad tpica de nacimientos por estado. Calcule la media, la mediana y la desviacin estndar del nmero de nacimientos por estado y del nmero de nacimientos por cada 1 000 habitantes por estado para el ltimo ao disponible. Usted podra bajar esta informacin en un paquete de software para llevar a cabo los clculos. Qu medida de ubicacin es la ms representativa? Qu conjunto de datos recomendara utilizar: el nmero de nacimientos por estado o el nmero de nacimientos por cada 1 000 habitantes? Por qu? Asuma que se encuentra interesado en las tasas de nacimiento de los 50 estados y de Washington, D. C. Calcule la media, la mediana y la desviacin estndar. Redacte un breve informe que resuma los datos. 85.  Existen muchos sitios Web de nanzas que proporcionan informacin sobre acciones por industria. Por ejemplo, dirjase a http://nance.yahoo.com y seleccione Stock Research; bajo Analyst Research, seleccione Sector/Industry Analysis. Aqu hay muchas opciones disponibles, como Healthcare. Ahora se abre otra lista de opciones; seleccione una, como Drug Manufacturers-Major. Aparecer una lista de compaas en dicha industria. Elija una de las variables que aparecen, como la razn del precio respecto de las ganancias, que se encuentra representada por P/E. Esta variable es la razn del precio de venta de una accin de las acciones ordinarias de la compaa respecto de las ganancias por accin de las acciones ordinarias. Descargue esta informacin en Excel y determine la media, la mediana y la desviacin estndar. Regrese a Sector/Industry Analysis y seleccione otro sector o industria. Tal vez desee seleccionar Utilities y, enseguida, Gas Utilities. Aparecer una lista de compaas. Seleccione la misma variable que antes. Descargue la informacin en Excel y determine la media, la mediana y la desviacin estndar para esta industria. Compare la informacin de los dos sectores. Redacte un breve informe que resuma sus conclusiones. Son diferentes las medias? Se presenta mayor variabilidad en una industria que en la otra? 86.  Uno de los promedios ms famosos, el Promedio Industrial Dow Jones (DJIA), no es realmente un promedio. A continuacin aparece una lista de 30 compaas cuyos precios accionarios conforman el DJIA, su smbolo, su peso actual y el valor de cierre en agosto de 2005. Utilice un paquete de software para determinar la media de las 30 acciones. El DJIA es de 10 451. Es el valor que usted encontr para el promedio de las 30 acciones? Compaa Alcoa Inc. Amer. Intl. Group American Express Boeing Co. Citigroup Inc. Caterpillar Inc. Disney (Walt) Co. DuPont (EI) General Electric General Motors Home Depot Inc. Honeywell Intl. Hewlett-Packard IBM Intel Corp. Smbolo AA AIG AXP BA C CAT DIS DD GE GM HD HON HPQ IBM INTC Precio 27.29 59.27 55.01 66.31 43.10 53.49 25.33 39.74 33.38 34.14 39.81 38.02 27.01 80.38 25.41 Compaa Johnson & Johnson JP Morgan Chase Coca-Cola Co. McDonalds Corp. 3M Co. Altria Group Inc. Merck & Co. Microsoft Corp. Pfizer Inc. Procter & Gamble SBC Communication United Tech Corp. Verizon Communications Wal-Mart Stores Exxon Mobil Corp. Smbolo JNJ JPM KO MCD MMM MO MRK MSFT PFE PG SBC UTX VZ WMT XOM Precio 61.94 33.65 43.57 33.48 70.99 69.48 27.66 26.97 24.89 54.96 23.71 50.29 32.60 45.70 58.41

 Puede leer sobre la historia de DJIA, dirjase a http://www.djindexes.com, haciendo clic en About the Dow. Aqu se explica la razn por la que no es un promedio. Hay muchos otros sitios que puede visitar para vericar el valor actual del DJIA: http://money.cnn.com, http:// www.foxnews.com y http://www.usatoday.com son tres de las muchas fuentes. Para obtener una lista de las acciones reales que constituyen el promedio, dirjase a http://www.bloomberg.com. En la barra de herramientas, haga clic en Market Data; enseguida, bajando por la izquierda de la pantalla, seleccione Stocks y luego Dow. Aparecer una lista de precios de venta actuales de 30 acciones que conforman el DJIA.

Descripcin de datos: Medidas numricas

95

Ejercicios de la base de datos


87.  Consulte los datos Real Estate, que contienen informacin sobre casas vendidas en el rea de Denver, Colorado, el ao pasado. a) Seleccione la variable que se reere al precio de venta. 1. Determine la media, la mediana y la desviacin estndar. 2. Redacte un breve informe sobre la distribucin de los precios de venta. b) Seleccione la variable que se reere al rea de la casa en pies cuadrados. 1. Determine la media, la mediana y la desviacin estndar. 2. Redacte un breve informe sobre la distribucin del rea de las casas. 88.  Consulte los datos Baseball 2005, que incluyen informacin sobre los 20 equipos de la liga mayor para la temporada 2005. a)  Seleccione la variable que se reere a los salarios de los equipos y calcule la media, la mediana y la desviacin estndar. b)  Seleccione la variable que se reere a la fecha en que se construy el estadio. (Sugerencia: reste el ao en que se construy el estadio del ao actual para determinar la edad del estadio y trabaje con dicha variable.) Calcule la media, la mediana y la desviacin estndar. c)  Seleccione la variable que se reere al cupo del estadio. Determine la media, la mediana y la desviacin estndar. 89.  Consulte los datos CIA, que proporcionan informacin demogrca y econmica de 46 pases. a) Seleccione la variable que se reere a la expectativa de vida. 1. Determine la media, la mediana y la desviacin estndar. 2. Redacte un breve resumen sobre la distribucin de la expectativa de vida. b) Seleccione la variable GDP/cap. 1. Calcule la media, la mediana y la desviacin estndar. 2. Redacte un breve resumen de la distribucin GDP/cap.

Comandos de software
1.  Los comandos de Excel de estadstica descriptiva de la pgina 66 son los siguientes: a)  Del CD recupere el archivo de datos Whitner, llamado Whitner-2005. b)  De la barra de men, seleccione Tools y, enseguida, Data Analysis. Seleccione Descriptive Statistics y, enseguida, haga clic en OK. c)  Para Input Range, escriba A1:A81, indique que los datos se agrupan por columna y que las etiquetas se encuentran en la primera la. Haga clic en Output Range, indique que la salida debe incluirse en H1 (o en cualquier lugar que desee), haga clic en Summary statistics y, enseguida, en OK. d)  Despus de que obtenga los resultados, verique dos veces la cuenta en la salida para cerciorarse de que contiene la cantidad correcta de elementos. 2.  Los comandos de MINITAB para el resumen descriptivo de la pgina 80 son los siguientes: a)  Del CD recupere los datos Whitner, llamados Whitner 2005. b)  Seleccione Stat, Basic Statistics y, enseguida, Display Descriptive Statistics. En el cuadro de dilogo seleccione Price como variable y, enseguida, haga clic en Graphs en la esquina inferior derecha. Dentro del nuevo cuadro de dilogo seleccione Histogram of data, with normal curve y haga clic en OK. Haga clic en OK en el siguiente cuadro de dilogo.

96

Captulo 3

Captulo 3 Respuestas a las autoevaluaciones


3.1 1. a) X = X n c) X _ |X X | Desviacin absoluta 8 0 2 7 1 2 9 13 Total 42 95 | 8 | 103 | 0 | 105 | +2 | 110 | +7 | 104 | +1 | 105 | +2 | 112 | +9 | 90 | 13 | MD = 42 = 5.25 miles de libras 8 $16 900 = $3 380 5 (3 536 3 380)2 + + (3 622 3 380)2 5 (156)2 + (207)2 + (68)2

$267 100 b) X = = $66 775 4 c) Estadstico, pues se trata de un valor muestral. d)  $66 775. La media de la muestra constituye nuestra mejor aproximacin de la media poblacional. X N

2. a) =

3.2

498 = 83 b) = 6 c)  Parmetro, porque se calcul empleando todos los valores de la poblacin. a) $237, calculado de la siguiente manera: (95 $400) + (126 $200) + (79 $100) = $237.00 95 + 126 + 79 3.7

a) =

2 b) =

b)  La ganancia por traje es de $12, que se determina mediante la operacin $237 costo de $200 $25 de comisin. La ganancia total en los 300 trajes es de $3 600, la cual se calcula multiplicando 300 $12. 3.3 1. a) $878 b) 3,3 2. a)  7, que se calcula mediante la operacin (6 + 8)/2 =7 b) 3,3 c) 0 3.4 a)

+ (259)2 + (242)2 5 197 454 = = 39 490.8 5 = 3.8 c) = 39 490.8 = 198.72 d)  Hay ms variacin en la ocina de Pittsburgh, ya que la desviacin estndar es mayor. La media tambin es mayor en la ocina de Pittsburgh. 2.33, que se calcula de la siguiente manera: X = X 28 = =4 n 7 _ X X _ (X X )2 0 4 1 0 1 4 4 14

Frecuencia

Ventas semanales

3.5

b)  Con sesgo positivo, ya que la media es el promedio ms grande y la moda es el ms pequeo. 1. a)  Alrededor de 9.9%, que se obtiene con la raz
4

4 0 2 2 5 1 4 0 5 1 2 2 6 2 28 0 (X X )2 n 1 14 = 7 1 = 2.33

1.458602236.

b) Alrededor de 10.095% c) Mayor que, por que 10.095 > 9.9. 2.  8.63%, que se determina mediante la operacin 3.6
20

Moda Mediana Media

S2 =

120 520 1 = 1.0863 1 23 000

a)  22 000 de libras, que se determina restando 112 90 b) X = 824 = 103 miles de libras 8

s = 2.33 = 1.53

Descripcin de datos: Medidas numricas

97

3.9

a) k =

14.15 14.00 = 1.5 .10 13.85 14.0 k= = 1.5 .10 1 1 = 1 .44 = .56 (1.5)2

3.10 a) Distribucin de frecuencias. b) f 1 4 10 3 2 M fM

_ (M X )

_ f (M X )2

b) 13.8 y 14.2

4 4 8.2 67.24 8 32 4.2 70.56 12 120 0.2 0.40 16 48 3.8 43.32 20 40 7.8 121.68 244 303.20

20

X =

fM $244 = = $12.20 M 20

c) s =

303.20 = $3.99 20 1

4
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Elaborar e interpretar un diagrama de puntos. 2. Crear e interpretar una grfica de tallo y hojas. 3. Calcular y comprender los cuartiles, deciles y percentiles. 4. Construir e interpretar diagramas de caja. 5. Calcular y entender el coeficiente de sesgo. 6. Trazar e interpretar un diagrama de dispersin. 7. Construir e interpretar una tabla de contingencia.

Descripcin de datos
Presentacin y anlisis de datos

McGivern Jewelers recin coloc un anuncio en el peridico local en el que informaba la forma, el tamao, precio y grado de corte de 33 de sus diamantes en bodega. A partir de los datos del ejercicio 37, elabore un diagrama de caja para la variable precio y haga comentarios sobre el resultado.

Descripcin de datos: Presentacin y anlisis de datos

99

Introduccin
El captulo 2 dio inicio el estudio de la estadstica descriptiva. Con el n de transformar datos que estn en bruto o no agrupados en alguna forma signicativa, debe organizarlos en una distribucin de frecuencias; la cual se representa en forma grca en un histograma o en un polgono de frecuencias. Esto permite visualizar el lugar en donde tienden a acumularse los datos, los valores mximo y mnimo y la forma general de los datos. En el captulo 3 primero se calcularon diversas medidas de ubicacin, tales como la media y la mediana. Estas medidas de ubicacin permiten informar un valor tpico de un conjunto de observaciones. Tambin se calcularon diversas medidas de dispersin, tales como el rango y la desviacin estndar. Estas medidas de dispersin permiten describir la variacin o la dispersin en un conjunto de observaciones. Este captulo contina el estudio de la estadstica descriptiva. Se presentan los siguientes temas: 1) diagramas de puntos; 2) grca de tallo y hojas; 3) percentiles, y 4) diagramas de caja. Estos diagramas y la estadstica proporcionan una idea adicional del lugar en el que los valores se concentran, as como de la forma general de los datos. Enseguida se consideran datos bivariados para cada una de las observaciones individuales o seleccionadas. Algunos ejemplos incluyen: la cantidad de horas que estudia un alumno y los puntos que obtiene en un examen; si un producto tomado de la muestra es aceptable o no y el horario en el que se le fabrica; y la cantidad de electricidad que es consumida en un mes en una casa, as como la temperatura alta media diaria de la regin durante el mes.

Diagramas de puntos
Un histograma agrupa los datos en clases. Recuerde que en los datos de Whitner Autoplex de la tabla 2.1, las 80 observaciones se condensaron en siete clases. Una organizacin de datos en siete clases pierde el valor exacto de las observaciones. Un diagrama de puntos, por otra parte, agrupa los datos lo menos posible y evita la prdida de identidad de cada observacin. Para crear un diagrama de puntos se coloca un punto que representa a cada observacin a lo largo de una recta numrica horizontal, la cual indica los valores posibles de los datos. Si hay observaciones idnticas o las observaciones se encuentran muy prximas, los puntos se apilan uno sobre otro para que se puedan ver de manera individual. Esto permite distinguir la forma de la distribucin, el valor en torno al cual tienden a acumularse los datos y las observaciones mxima y mnima. Los diagramas de puntos son ms tiles en el caso de conjuntos de datos pequeos, mientras que los histogramas lo son para conjuntos grandes de datos, un ejemplo mostrar cmo construir e interpretar diagramas de puntos.

Ejemplo

Recuerde que en la tabla 2.4 aparecen los datos del precio de venta de 80 vehculos vendidos el mes pasado en Whitner Autoplex, Raytown, Missouri. Whitner es una de las muchas concesionarias de AutoUSA, la cual cuenta con muchas otras concesionarias localizadas en pequeas ciudades a lo largo de Estados Unidos. Enseguida aparece la cantidad de vehculos vendidos durante los pasados 24 meses en Smith Ford Mercury Jeep, Inc., en Kane, Pennsylvania, y en Brophy Honda Volkswagen, Greenville, Ohio. Construya un diagrama de puntos y presente un resumen estadstico de los dos lotes de AutoUSA ubicados en estas pequeas ciudades.
Smith Ford Mercury Jeep, Inc. 23 28 26 27 39 28 30 32 36 27 29 30 32 35 31 36 32 33 32 25 35 35 33 37

Brophy Honda Volkswagen 31 36 37 44 34 43 30 31 42 36 32 33 37 40 34 36 43 31 38 44 37 26 35 30

100

Captulo 4

Solucin

El sistema MINITAB proporciona un diagrama de puntos y permite calcular la media, la mediana, los valores mximo y mnimo y la desviacin estndar de la cantidad de automviles vendidos en cada concesionaria durante los pasados 24 meses.

A partir de la estadstica descriptiva, es posible visualizar que Brophy vendi un promedio de 35.83 vehculos mensuales y Smith un promedio de 31.292. As que Brophy normalmente vende 4.54 ms vehculos por mes. Tambin existe mayor dispersin o variacin en las ventas mensuales de Brophy que en las ventas de Smith. Cmo lo sabe? La desviacin estndar es mayor en Brophy (4.96 automviles por mes) que en Smith (4.112 automviles por mes). El diagrama de puntos, que aparece en la parte inferior derecha de la salida del software, ilustra grcamente las distribuciones para ambas concesionarias. Los puntos muestran la diferencia en la ubicacin y dispersin de las observaciones. Al observar los puntos, es claro que las ventas de Brophy se dispersan ms y tienen una media mayor que las ventas de Smith. Hay otras caractersticas de las ventas mensuales que se hacen evidentes: Smith vendi la menor cantidad de automviles en todos los meses, 23.  Brophy vendi 26 automviles en el mes ms bajo, que representa cuatro automviles menos que el siguiente mes ms bajo. Smith vendi exactamente 32 automviles en cuatro diferentes meses.  Las ventas mensuales se acumulan alrededor de 32 en el caso de Smith y de 36 en el caso de Bropy.

Grficas de tallo y hojas


En el captulo 2 ilustramos la manera de organizar datos en una distribucin de frecuencias de tal manera que permitiera resumir los datos en bruto de forma signicativa. La ventaja principal de organizar los datos en la distribucin de frecuencias estriba en que nos permite una visualizacin rpida de la forma de la distribucin sin necesidad de

Descripcin de datos: Presentacin y anlisis de datos

101

llevar a cabo ningn clculo. En otras palabras, podemos ver dnde se concentran los datos y, asimismo, determinar si hay valores extremadamente grandes o pequeos. Sin embargo, hay dos desventajas que se presentan al organizar los datos en la distribucin de frecuencias: a) se pierde la identidad exacta de cada valor; b) no es clara la forma en que los valores de cada clase se distribuyen. Para mayor precisin, la siguiente distribucin de frecuencias muestra la cantidad de espacios publicitarios que compraron los 45 miembros de la Greater Buffalo Automobile Dealers Association el ao 2005. Observe que 7 de las 45 concesionarias compraron de 90 a 100 espacios. Sin embargo, los espacios comprados en esta clase se acumulan en torno a 90, se distribuyen uniformemente a lo largo de la clase o se acumulan cerca de 99? No es posible armar nada.

Cantidad de espacios comparados 80 90 100 110 120 130 140 150 a a a a a a a a 90 100 110 120 130 140 150 160

Frecuencia 2 7 6 9 8 7 3 3 45

Total

Estadstica en accin
En 1939 John W. Tukey (1915-2000) recibi un doctorado en matemticas de Princeton. Sin embargo, cuando se uni a la Fire Control Research Office durante la Segunda Guerra Mundial, su inters en la matemtica abstracta se orient a la estadstica aplicada. Ide mtodos numricos y grficos eficaces para estudiar patrones en los datos. Entre las grficas que cre se encuentran el diagrama de tallo y hojas y el diagrama de caja y bigotes o diagrama de caja. De 1960 a 1980, Tukey encabez la divisin de estadstica del equipo de proyeccin nocturno de la NBC de las elecciones. En 1960 se hizo famoso, ya que evit el anuncio de la victoria anticipada de Richard Nixon en las elecciones presidenciales que gan John F. Kennedy.

Otra tcnica utilizada para representar informacin cuantitativa en forma condensada es el diagrama de tallo y hojas. Una ventaja de este diagrama sobre la distribucin de frecuencias consiste en que no pierde la identidad de cada observacin. En el ejemplo anterior, no se conoce la identidad de los valores en la clase de 90 a 100. Para ilustrar la forma de construir un diagrama de tallo y hojas a partir de la cantidad de espacios publicitarios comprados, suponga que las siete observaciones en la clase del 90 a 100 son: 96, 94, 93, 94, 95, 96 y 97. El valor de tallo es el dgito o dgitos principales, en este caso 9. Las hojas son los dgitos secundarios. El tallo se coloca a la izquierda de una lnea vertical y los valores de las hojas a la derecha. Los valores en la clase de 90 a 100 se veran de la siguiente manera:
9 | 6 4 3 4 5 6 7

Tambin es costumbre ordenar los valores en cada tallo de menor a mayor. Por consiguiente, la segunda la del diagrama de tallo y hojas se vera de la siguiente manera:

Con un diagrama de tallo y hojas es ms fcil observar que dos concesionarias compraron 94 espacios y que el nmero de espacios comprados vara de 93 a 97. Un diagrama de tallo y hojas se parece a una distribucin de frecuencias, pero con mayor informacin, es decir, que la identidad de las observaciones se conserva.

DIAGRAMA DE TALLO Y HOJAS Tcnica estadstica para la prestacin de un conjunto de datos. Cada valor numrico se divide en dos partes. El dgito principal se convierte en el tallo y los dgitos secundarios en las hojas. El tallo se localiza a lo largo del eje vertical y los valores de las hojas se apilan unos contra otros a lo largo del eje horizontal.

102

Captulo 4

El siguiente ejemplo explica los detalles para elaborar un diagrama de tallo y hojas.

Ejemplo

La tabla 4.1 contiene la lista de la cantidad de espacios publicitarios de 30 segundos en radio que compr cada uno de los 45 miembros de la Greater Buffalo Automobile Dealers Association el ao pasado. Organice los datos en un diagrama de tallo y hojas. Alrededor de qu valores tiende a acumularse el nmero de espacios publicitarios? Cul es el nmero menor de espacios publicitarios comprados? El nmero mximo de espacios comprados? TablA 4.1 Nmero de espacios publicitarios comprados por los miembros de la Greater
Buffalo Automobile Dealers Association
88 94 132 125 117 107 111 143 127 125 125 120 95 155 104 103

96 139 112 118

93 142 135 136

113 155 106 113

96 103 139 124

108 112 134 138

94 127 119

148 117 97

156 120 89

Solucin

De acuerdo con los datos de la tabla 4.1, el nmero mnimo de espacios publicitarios comprados es de 88. As que el primer valor de tallo es 8. El nmero mximo de 156, as que los valores de tallo comienzan en 8 y continan hasta 15. El primer nmero de la tabla 4.1 es 96, que tendr un valor de tallo de nueve y un valor de hoja de 6. Al desplazarnos por el rengln superior, el segundo valor es de 93 y el tercero de 88. Despus de considerar los primeros tres valores de datos, el diagrama queda de la siguiente manera:
Tallo 8 9 10 11 12 13 14 15 Hoja 8 63

Al organizar los datos, el diagrama de tallo y hojas queda de la siguiente manera:


Tallo 8 9 10 11 12 13 14 15 8 6 8 7 7 9 8 6 9 3 7 3 5 5 2 5 5 3 2 7 2 3 5 Hoja 6 4 7 0 9 4 6 2 5 4 4 3 1 5 6 7 983 04 8

El procedimiento acostumbrado consiste en ordenar los valores de las hojas de menor a mayor. La ltima lnea, la la que se reere a los valores prximos a 150, se vera de la siguiente manera:
15 | 5 5 6

La tabla nal sera la siguiente, en la cual estn ordenados todos los valores de las hojas:

Descripcin de datos: Presentacin y anlisis de datos

103

Tallo 8 9 10 11 12 13 14 15 8 3 3 1 0 2 2 5 9 4 3 2 0 4 3 5 4 4 2 4 5 8 6

Hoja 5 6 3 5 6 6 7 3 5 8 6 8 7 5 9 7 789 77 9

Es posible deducir algunas conclusiones del diagrama de tallo y hojas. Primero, la cantidad mnima de espacios publicitarios comprados es de 88 y la mxima de 156. Dos concesionarias compraron menos de 90 espacios, y tres compraron 150 o ms. Observe, por ejemplo, que las tres concesionarias que compraron ms de 150 espacios, en realidad compraron 155, 155 y 156 espacios. La concentracin de la cantidad de espacios se encuentra entre 110 y 130. Hubo nueve concesionarias que compraron entre 110 y 119 espacios y ocho compraron entre 120 y 129 espacios. Tambin note que en el grupo ubicado entre 120 y 129 el nmero real de espacios comprados se distribuy uniformemente. Es decir, que dos concesionarias compraron 120 espacios, una compr 124 espacios, tres compraron 125 espacios y dos compraron 127 espacios. Adems, es posible generar esta informacin en el sistema de software MINITAB. La variable se llama Spots. Abajo aparece la salida de MINITAB. Al nal del captulo usted puede encontrar los comandos de MINITAB, que generan esta salida.

La solucin de MINITAB proporciona informacin adicional relacionada con los totales acumulados. En la columna a la izquierda de los valores de tallo se encuentran nmeros como 2, 9, 15, y as sucesivamente. El nmero 9 indica que se presentaron 9 observaciones antes del valor de 100. El 15 muestra que se presentaron 15 observaciones antes de 110. Ms o menos a la mitad de la columna aparece el nmero 9 entre parntesis. El parntesis indica que el valor de en medio o mediana aparece en dicha la y que hay nueve valores en este grupo. En este caso, el valor

104

Captulo 4

medio es el valor debajo del cual se presenta la mitad de las observaciones. Hay un total de 45 observaciones, as que el valor medio, en caso de que los datos se ordenen de menor a mayor, sera la observacin vigsimo tercera; este valor es 118. Despus de la mediana, los valores comienzan a decrecer. Estos valores representan los totales acumulados ms que. Hay 21 observaciones de 120 o ms, 13 de 130 o ms, y as sucesivamente. El 9 entre parntesis tambin indica que hay 9 observaciones en la la de en medio. En realidad esto es cuestin de eleccin y conveniencia personal. Para la presentacin de datos, en especial con una gran cantidad de observaciones, usted se dar cuenta de que los diagramas de puntos se utilizan con mayor frecuencia. Encontrar diagramas de puntos en la literatura analtica, informes de marketing y, en ocasiones, informes anuales. Si realiza un anlisis rpido para usted mismo, los diagramas de tallo y hojas son accesibles y fciles, en particular en relacin con un conjunto pequeo de datos.

Autoevaluacin 4.1

1.  El siguiente diagrama muestra el nmero de empleados en cada una de las 142 tiendas de Home Depot, ubicadas al sureste de Estados Unidos.

80

84

88

92 96 Nmero de empleados

100

104

2.

a) Cules son los nmeros mximo y mnimo de empleados por tienda? b) Cuntas tiendas emplean a 91 personas? c) Alrededor de qu valores tiende a acumularse el nmero de empleados por tienda? La tasa de recuperacin de 21 acciones es la siguiente:

8.3 10.2

9.6 8.0

9.5 8.4

9.1 8.1

8.8 11.6

11.2 9.6

7.7 8.8

10.1 8.0

9.9 10.4

10.8 9.8

9.2

Organice esta informacin en un diagrama de tallo y hojas. a) Cuntas tasas son menores que 9.0? b) Haga una lista de las tasas en la categora que va de 10.0 a 11.0. c) Cual es la mediana? d) Cules son las tasas mxima y mnima de recuperacin?

Descripcin de datos: Presentacin y anlisis de datos

105

Ejercicios
1.  Describa las diferencias entre un histograma y un diagrama de puntos. Cundo podra resultar mejor un diagrama de puntos que un histograma? 2. Explique las diferencias entre un histograma y un diagrama de tallo y hojas. 3. Considere el siguiente diagrama.

a) Qu nombre recibe este diagrama? b) Cuntas observaciones hay en el estudio? c) Cules son los valores mximo y mnimo? d) En torno a qu valores tienden a acumularse las observaciones? 4.  El siguiente diagrama informa el nmero de telfonos celulares vendidos en Radio Shack durante los pasados 26 das.

14

19

a) Cules son los nmeros mximo y mnimo de telfonos celulares vendidos en un da? b) Cul es el nmero tpico de telfonos celulares vendidos? 5.  La primera la del diagrama de tallo y hojas es la siguiente: 62 | 1 3 3 7 9. Suponga que se trata de nmeros enteros. a) Cual es el posible rango de los valores de esta la? b) Cuntos valores de datos hay en esta la? c) Haga una lista de los valores reales de esta la de datos. 6.  La tercera la de un diagrama de tallo y hojas aparece de la siguiente manera: 21 | 0 1 3 5 7 9. Suponga que los valores son nmeros enteros. a) Cul es el posible rango de los valores de esta la? b) Cuntos valores de datos hay en esta la? c) Elabore una lista de los valores reales de esta la de datos. 7.  El siguiente diagrama de tallo y hojas del software de MINITAB muestra el nmero de unidades producidas por da en una fbrica. 1 1 2 9 (7) 9 7 2 3 4 5 6 7 8 9 10 8 6 0133559 0236778 59 00156 36

a) Cuntos das se registraron? b) Cuntas observaciones hay en la primera clase? c) Cul es el valor mnimo y el valor mximo? d) Elabore una lista de los valores reales de la cuarta la. e) Elabore una lista de los valores reales de la segunda la. f ) Cuntos valores son menores que 70? g) Cuntos valores son iguales a 80 o ms? h) Cul es la mediana? i ) Cuntos valores se encuentran entre 60 y 89, inclusive? 8.  El siguiente diagrama de tallo y hojas presenta la cantidad de pelculas rentadas por da en Video Connection, ubicado en la esquina de las calles Forth y Main. a) Cuntos das se registraron? b) Cuntas observaciones hay en la ltima clase?

106

Captulo 4

3 6 10 13 15 20 23 (5) 22 16 12 9 4 3 1 1

12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

689 123 6889 589 35 24568 268 13456 034679 2239 789 00179 8 13 0

c) Cules son los valores mximo y mnimo de todo el conjunto de datos? d) Elabore una lista de valores reales de la cuarta la. e) Elabore una lista de valores reales que aparecen en la penltima la. f ) En cuntos das se rentaron menos que 160 pelculas? g) En cuntos das se rentaron 220 o ms pelculas? h) Cul es el valor medio? i) En cuantos das se rentaron entre 170 y 210 pelculas? 9.  Una encuesta sobre el nmero de llamadas telefnicas por celular realizada con una muestra de suscriptores de Altel Wireless, la semana pasada revel la siguiente informacin. Elabore un diagrama de tallo y hojas. Cuntas llamadas hizo un suscriptor tpico? Cules fueron los nmeros mximo y mnimo de llamadas realizadas? 52 37 43 34 30 46 38 32 30 18 42 41 12 5 46 39

 Aloha Banking Co. estudia el uso de cajeros automticos en los suburbios de Honolulu. Una muestra de 30 cajeros automticos mostr que stos se utilizaron la siguiente cantidad de veces el da de ayer. Elabore un diagrama de tallo y hojas. Resuma la cantidad de veces que se utiliz cada cajero automtico. Cules son los nmeros mnimo y mximo de veces que se utiliz cada cajero automtico? 83 63 95 64 80 36 84 84 78 76 73 61 84 68 59 54 52 84 75 65 95 59 90 47 70 52 87 61 77 60

Otras medidas de dispersin


La desviacin estndar es la medida de dispersin ms generalmente utilizada. No obstante, existen otras formas de describir la variacin o dispersin de un conjunto de datos. Un mtodo consiste en determinar la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales. Estas medidas incluyen los cuartiles, deciles y percentiles. Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. Para explicarlo mejor, piense en un conjunto de valores ordenados de menor a mayor. En el captulo 3 denominamos mediana al valor intermedio de un conjunto de datos ordenados de menor a mayor. Es decir, que 50% de las observaciones son mayores que la mediana y 50% son menores. La mediana constituye una medida de ubicacin, ya que seala el centro de los datos. De igual manera, los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. El primer cuartil, representado mediante Q1, es el valor debajo del cual se presenta 25% de las observaciones, y el tercer cuartil, representado como Q3, es el valor debajo del cual se presenta 75% de las observaciones. Es lgico, Q2 es la mediana. Q1 puede considerarse como la mediana de la mitad inferior de los datos y Q3 como la mediana de la parte superior de los datos.

Descripcin de datos: Presentacin y anlisis de datos

107

Asimismo, los deciles dividen a un conjunto de observaciones en 10 partes iguales y los percentiles en 100 partes iguales. Por tanto, si su promedio general en la universidad se encuentra en el octavo decil, usted podra concluir que 80% de los estudiantes tuvieron un promedio general inferior al de usted y que 20%, un promedio superior. Un promedio general ubicado en el trigsimo tercer percentil signica que 33% de los estudiantes tienen un promedio general ms bajo y 67% tienen un promedio general ms alto. Las calicaciones expresadas en percentiles se utilizan a menudo para dar a conocer resultados relacionados con pruebas estandarizadas en Estados Unidos, como SAT, ACT, GMAT (empleado para determinar el ingreso en algunas maestras de administracin de empresas) y LSAT (empleado para determinar el ingreso a la escuela de leyes).

Cuartiles, deciles y percentiles


Para formalizar el proceso de clculo, suponga que Lp representa la ubicacin de cierto percentil que se busca. De esta manera, si quiere encontrar el trigsimo tercer percentil, utilizara L33, y si buscara la mediana, el percentil 50o, entonces L50. El nmero de observaciones es n; as que, si desea localizar la mediana, su posicin se encuentra en (n + 1)/2, o podra escribir esta expresin como (n + 1)(P/100), en la que P representa el percentil que busca. LOCALIZACIN DE UN PERCENTIL Lp = (n + 1) Un ejemplo ayudar explicar este hecho. P 100 [4.1]

Ejemplo

Enseguida aparecen las comisiones que gan el ltimo mes una muestra de 15 corredores de bolsa en la ocina de Salomon Smith Barneys Okland, California. Esta compaa de inversiones tiene ocinas a lo largo de Estados Unidos.
$2 038 1 940 $1 758 2 311 $1 721 2 054 $1 637 2 406 $2 097 1 471 $2 047 1 460 $2 205 $1 787 $2 287

Localice la mediana, el primer y el tercer cuartiles de las comisiones ganadas.

Solucin

El primer paso consiste en ordenar los datos de la mnima comisin a la mxima.


$1 460 2 047 $1 471 2 054 $1 637 2 097 $1 721 2 205 $1 758 2 287 $1 787 2 311 $1 940 2 406 $2 038

El valor mediano es la observacin que se encuentra en el centro. El valor central, o L50, se localiza en (n + 1)(50/100), en la que n representa el nmero de observaciones. En este caso es la posicin nmero 8, determinada por (15 + 1)(50/100). La octava comisin ms grande es de $2 038. As que sta es la mediana y la mitad de los corredores obtienen comisiones mayores que $2 038, y la mitad ganan menos de $2 038. Recordemos la denicin de cuartil. Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. Por consiguiente, 25% de las observaciones sern menores que el primer cuartil. Setenta y cinco por ciento de las observaciones sern menores que el tercer cuartil. Para localizar el primer cuartil, utilice la frmula 4.1, en la cual n = 15 y P = 25: P 25 = (15 + 1) =4 100 100 para localizar el tercer cuartil, n = 15 y P = 75: L25 = (n + 1) P 75 = (15 + 1) = 12 100 100 Por tanto, los valores del primer y tercer cuartiles se localizan en las posiciones 4 y 12. El cuarto valor en la serie ordenada es $1 721 y el decimosegundo es $2 205. stos constituyen el primer y tercer cuartiles. L75 = (n + 1)

108

Captulo 4

En el ejemplo anterior, la frmula de localizacin arroj un nmero entero. Es decir que al buscar el primer cuartil haba 15 observaciones, as que la frmula de localizacin indica que debera encontrar el cuarto valor ordenado. Si hubiera 20 observaciones en la muestra, es decir n = 20, y quisiera localizar el primer cuartil? De acuerdo con la frmula de localizacin 4.1: P 25 = (20 + 1) = 5.25 100 100 Localizara el quinto valor en la serie ordenada y enseguida se desplazara una distancia de 0.25 entre los valores quinto y sexto e informara a ste como el primer cuartil. Como en el caso de la mediana, el cuartil no necesita ser uno de los valores exactos del conjunto de datos. Para explicarlo ms a fondo, suponga que un conjunto de datos contiene los seis valores: 91, 75, 61, 101, 43 y 104. Busca localizar el primer cuartil. Ordene los valores de menor a mayor: 43, 61, 75, 91, 101 y 104. El primer cuartil se localiza en L25 = (n + 1) P 25 = (6 + 1) = 1.75 100 100 La frmula de localzacin indica que el primer cuartil se localiza entre el primero y segundo valores, que representa 0.75 de la distancia entre el primero y segundo valores. El primer valor es 43 y el segundo 61. De esta manera, la distancia entre estos valores es 18. Al localizar el primer cuartil, necesita desplazarse una distancia de 0.75 entre el primero y segundo valores; as, 0.75(18) = 13.5. Para completar el procedimiento, sume 13.5 al primer valor e indique que el primer cuartil es 56.5. Es posible ampliar la idea para incluir tanto deciles como percentiles. Para localizar el 23o percentil en una muestra de 88 observaciones, busque la posicin 18.63. L25 = (n + 1) P 23 = (80 + 1) = 18.63 100 100 Para determinar el valor correspondiente al 23o percentil, localice el 18o valor y el 19o, y determine la distancia entre los dos valores. Enseguida, multiplique esta diferencia por 0.63 y sume el resultado al valor ms pequeo. El resultado sera el 23o percentil. Con un paquete de software de estadstica, resulta relativamente sencillo ordenar los datos de menor a mayor y localizar percentiles y deciles. Tanto las salidas de MINITAB como de Excel generan resmenes estadsticos. Abajo aparece una salida de MINITAB. Los datos se registran en miles de dlares. stos incluyen el primer y el tercer cuartiles, as como la media, la mediana y la desviacin estndar para los datos de Whitner Autoplex (vase tabla 2.4). Concluya que 25% de los vehculos fueron vendidos en menos de $20 074 y que 75% se vendi en menos de $25 795. L23 = (n + 1)

Descripcin de datos: Presentacin y anlisis de datos

109

La siguiente salida de Excel incluye la misma informacin relacionada con la media, la mediana y la desviacin estndar. sta tambin incluye los cuartiles, aunque el mtodo de clculo no es tan preciso. Para obtener cuartiles, multiplique el tamao de la muestra por el percentil que busca e indique la parte entera de dicho valor. Para aclararlo, en los datos de Whitner Autoplex haba 80 observaciones y buscaba localizar el 25o percentil. Multiplique n + 1 = 80 + 1 = 81 por 0.25; el resultado es 20.25. Excel no permite introducir un valor fraccionario, as que utilice 20 y pida la localizacin de los 20 valores ms grandes y los 20 valores ms pequeos. El resultado constituye una buena aproximacin de los percentiles 25 y 75.

Autoevaluacin 4.2

El departamento de control de calidad de Plainsvill Peanut Company verifica el peso de un frasco de crema de cacahuate de ocho onzas. Los pesos de la muestra de nueve frascos fabricados la hora pasada son los siguientes:

7.69

7.72

7.8

7.86

7.90

7.94

7.97

8.06

8.09

a) Cul es el peso mediano? b) Determine los pesos correspondientes del primer y tercer cuartiles.

Ejercicios
11.  Determine la mediana y los valores correspondientes al primer y tercer cuartiles en los siguientes datos. 46 47 49 49 51 53 54 54 55 55 59

12.  Determine la mediana y los valores correspondientes al primer y tercer cuartiles en los siguientes datos.

5.24 9.61

6.02 10.37

6.67 10.39

7.30 11.86

7.59 12.22

7.99 12.71

8.03 13.07

8.35 13.59

8.81 13.89

9.45 15.42

110

Captulo 4

13.  Thomas Supply Company, Inc., es un distribuidor de generadores de gas. Como en cualquier negocio, el tiempo que les lleva a los clientes pagar sus recibos es importante. En la siguiente lista, en orden de menor a mayor, aparece el tiempo, en das, de una muestra de recibos de Thomas Supply Company, Inc. 13 41 13 41 13 41 20 45 26 47 27 47 31 47 34 50 34 51 34 53 35 54 35 56 36 62 37 67 38 82

a) Determine el primer y tercer cuartiles. b) Determine el segundo decil y el octavo decil. c) Determine el 67o percentil. 14.  Kevin Horn es el gerente nacional de ventas de National Textbooks, Inc. Cuenta con un personal de ventas conformado por 40 personas, las cuales hacen visitas a profesores universitarios en todo Estados Unidos. Cada sbado por la maana solicita a su personal que le enve un informe. Este informe incluye, entre otras cosas, la cantidad de profesores que visitaron la semana anterior. En la lista de abajo, en orden de menor a mayor, aparece la cantidad de visitas de la semana pasada. 38 40 41 45 48 48 50 50 51 51 52 52 53 54 55 55 55 56 56 57 59 59 59 62 62 62 63 64 65 66 66 67 67 69 69 71 77 78 79 79 a) Determine la cantidad mediana de llamadas. b) Determine el primer y tercer cuartiles. c) Determine el primero y el noveno decil. d) Determinar el 33o percentil.

Diagramas de caja
Un diagrama de caja es la representacin grca, basada en cuartiles, que ayuda a exhibir un conjunto de datos. Para construir un diagrama de caja, slo necesita cinco estadsticos: el valor mnimo, Q1 (primer cuartil), la mediana, Q3 (tercer cuartil) y el valor mximo. Un ejemplo ayudar a explicarlo.

Ejemplo

Alexanders Pizza ofrece entregas gratuitas de pizza a 15 millas a la redonda. Alex, el propietario, desea informacin relacionada con el tiempo de entrega. Cunto tiempo tarda una entrega tpica? En qu margen de tiempos deben completarse la mayora de las entregas? En el caso de una muestra de 20 entregas, Alex recopil la siguiente informacin: Valor mnimo = 13 minutos Q1 = 15 minutos Mediana = 18 minutos Q3 = 22 minutos Valor mximo = 30 minutos

Elabore un diagrama de caja para los tiempos de entrega. Qu conclusiones deduce sobre los tiempos de entrega?

Solucin

El primer paso para elaborar un diagrama de caja consiste en crear una escala adecuada a lo largo del eje horizontal. Enseguida, dibujamos una caja que inicie en Q1 (15 minutos) y termine en Q3 (22 minutos). Dentro de la caja trazamos una lnea vertical para representar a la mediana (18 minutos). Por ltimo, prolongamos lneas horizontales a partir de la caja dirigidas al valor mnimo (13 minutos) y al valor mximo (30 minutos). Estas lneas horizontales que salen de la caja, a veces reciben el nombre de bigotes, en virtud de que se asemejan a los bigotes de un gato.

Descripcin de datos: Presentacin y anlisis de datos

111

Valor mnimo

Mediana Q1 Q3

Valor mximo

12

14

16

18

20

22

24

26

28

30

32 Minutos

El diagrama de caja muestra que el valor medio de las entregas, 50%, consume entre 15 y 22 minutos. La distancia entre los extremos de la caja, 7 minutos, es el rango intercuartil. Este rango es la distancia entre el primer y el tercer cuartil; muestra la propagacin o dispersin de la mayora de las entregas. El diagrama de caja tambin revela que la distribucin de los tiempos de entrega tiene un sesgo positivo. En el captulo 3, pgina 67, recordemos que denimos el sesgo como la falta de simetra en un conjunto de datos. Cmo sabe que esta distribucin tiene un sesgo positivo? En este caso hay dos piezas de informacin que lo sugieren. Primero, la lnea punteada a la derecha de la caja, que va de 22 minutos (Q3) al tiempo mximo de 30 minutos, es ms larga que la lnea punteada a la izquierda que va de 15 minutos (Q1) al valor mnimo de 13 minutos. En otras palabras, 25% de los datos mayores que el tercer cuartil se encuentra ms disperso que el 25% menor que el primer cuartil. Una segunda indicacin del sesgo positivo es que la mediana no se encuentra al centro de la caja. La distancia del primer cuartil a la mediana es menor que la distancia de la mediana al tercer cuartil. El nmero de tiempos de entrega entre 15 y 18 minutos es el mismo que el nmero de tiempos de entrega entre 18 y 22 minutos.

Ejemplo Solucin

Consulte los datos de Whitner Autoplex de la tabla 2.4. Elabore un diagrama de caja de los datos. Cul es la conclusin respecto de la distribucin de los precios de venta de los vehculos? El sistema de software de estadstica de MINITAB se utiliz para crear el siguiente diagrama:

112

Captulo 4

Conclusin: el precio de venta mediano de los vehculos es de aproximadamente $23 000, que 25% de los vehculos se venden en menos de $20 000 y que alrededor del 25% se venden en ms de $26 000. Alrededor del 50% de los vehculos se venden a un precio entre $20 000 y $26 000. La distribucin tiene un sesgo positivo, ya que la lnea slida ubicada sobre $26 000 es de alguna manera ms larga que la encontrada debajo de $20 000. Sobre el precio de venta de $35 000 aparece un asterisco (*). Un asterisco indica un dato atpico. Un dato atpico es un valor que no concuerda con el resto de los datos. Un dato atpico se dene como un valor ms de 1.5 veces la amplitud del rango intercuartil ms pequeo que Q1, o mayor que Q3. En este ejemplo, un dato atpico sera un valor mayor que $35 000, el cual se determina con el siguiente clculo: Dato atpico > Q3 + 1.5(Q3 Q1) = $26 000 + 1.5($26 000 $20 000) = $35 000 Un valor menor que $11 000 tambin es un dato atpico. Dato atpico < Q1 1.5(Q3 Q1) = $20 000 1.5($26 000 $20 000) = $11 000 El diagrama de caja de MINITAB indica que slo hay un valor mayor que $35 000. Sin embargo, si se observan los datos reales de la tabla 2.4 de la pgina 28, resulta que en realidad hay dos valores ($35 851 y $35 925). No fue posible gracar dos puntos de datos tan prximos entre s, as que slo aparece un asterisco.

Autoevaluacin 4.3

El siguiente diagrama de caja muestra los activos en millones de dlares de cooperativas de crdito en Seattle, Washington.

10

20

30

40

50

60

70

80

90

100

Cules son los valores mnimo y mximo, los cuartiles primero y tercero, y la mediana? Estara usted de acuerdo en que la distribucin es simtrica?

Ejercicios
15.  l diagrama de caja muestra la suma que se gastaron en libros y suministros por un ao los E estudiantes de cuarto ao de universidades pblicas. $1 750 1 400 1 050 700 350 0 a) Calcule la mediana de la suma que se gast. b) Calcule el primero y el tercer cuartiles de la cantidad que se gast. c) Calcule el rango intercuartil de la cantidad que se gast. d) Ms all de qu punto un valor se considera dato atpico? e) Identique cualesquiera datos atpicos y calcule su valor. f ) Es la distribucin simtrica, o tiene sesgo positivo o negativo?

Descripcin de datos: Presentacin y anlisis de datos

113

 El diagrama de caja muestra el cargo interestatal de crdito por hora para carreras de cuatro 16. aos para estudiantes graduados en universidades pblicas.

$1 500 1 200 900 600 300 0

a) Calcule la mediana. b) Calcule el primer y tercer cuartiles. c) Determine el rango intercuartil. d) Ms all de qu punto se considera dato atpico un valor? e) Identique cualesquiera datos atpicos y calcule su valor. f) La distribucin es simtrica, o tiene sesgo positivo o negativo?  En un estudio sobre el rendimiento en millas por galn de gasolina de automviles modelo 17. 2005, la media de las millas por galn fue de 27.5 y la mediana de 26.8. El valor ms pequeo en el estudio fue de 12.70 millas por galn y el ms grande de 50.20. El primer y tercer intercuartiles fueron 17.95 y 35.45 millas por galn, respectivamente. Elabore un diagrama de caja y haga algn comentario sobre la distribucin. Es una distribucin simtrica?  Una muestra de 28 departamentos de tiempo compartido en el rea de Orlando, Florida, 18. revel las siguientes tarifas diarias de una suite con una recmara. Por comodidad, los datos se encuentran ordenados de menor a mayor. Construya un diagrama de caja para representar los datos. Haga algn comentario sobre la distribucin. Identique el primer y tercer cuartiles, as como la mediana. $116 229 260 307 $121 232 264 309 $157 236 276 312 $192 236 281 317 $207 239 283 324 $209 243 289 341 $209 246 296 353

Sesgo
En el captulo 3 se trataron las medidas de ubicacin central para un conjunto de observaciones por medio de la presentacin de un informe sobre la media, la mediana y la moda. Tambin se describieron medidas que muestran el grado de propagacin o variacin de un conjunto de datos, como el rango y la desviacin estndar. Otra caracterstica de un conjunto de datos es la forma. Hay cuatro formas: simtrica, con sesgo positivo, con sesgo negativo y bimodal. En un conjunto simtrico de observaciones la media y la mediana son iguales, y los valores de datos se dispersan uniformemente en torno a estos valores. Los valores de datos debajo de la media y de la mediana constituyen una imagen especular de los datos arriba de estas medidas. Un conjunto de valores se encuentra sesgado a la derecha o positivamente sesgado si existe un solo pico y los valores se extienden mucho ms all a la derecha del pico que a la izquierda de ste. En este caso la media es ms grande que la mediana. En una distribucin negativamente sesgada existe un solo pico, pero las observaciones se extienden ms a la izquierda, en la direccin negativa, que a la derecha. En una distribucin negativamente sesgada, la media es menor que la mediana. Las distribuciones positivamente sesgadas son ms comunes. Los salarios con frecuencia obedecen este patrn. Piense en los salarios de los empleados de una pequea compaa con aproximadamente 100 personas. El presidente y unos cuantos altos ejecutivos tendran salarios muy altos respecto de los dems trabajadores, y de ah que la distribucin de salarios mostrara un sesgo positivo. Una distribucin bimodal tendr dos o ms picos.

114

Captulo 4

Con frecuencia ste es el caso cuando los valores provienen de dos o ms poblaciones. Esta informacin se resume en la grca 4.1.

Simtrica

Positivamente sesgada Salarios mensuales

Negativamente sesgada Calicaciones en las pruebas

Bimodal Dimetro externo

Estadstica en accin
El difunto Stephen Jay Gould (1941-2002) fue profesor de zoologa y profesor de geologa en la Universidad de Harvard. En 1982 se le diagnostic cncer y le dieron ocho meses de vida. Con todo y sin darse por vencido su investigacin mostr que la distribucin de tiempos de supervivencia se encuentra drsticamente sesgada a la derecha y demostr que no slo 50% de pacientes de cncer similares sobreviven ms de 8 meses, sino que el tiempo de supervivencia poda ser de aos, no de meses. Sobre la base de su experiencia, escribi un ensayo varias veces publicado titulado The Median Is not the Message.

Edades

Frecuencia

Frecuencia

Frecuencia

Mediana Media

Media Mediana

GRFICA 4.1 Formas de los polgonos de frecuencias

En la literatura relacionada con la estadstica se utilizan diversas frmulas para calcular el sesgo. La ms sencilla, ideada por el profesor Karl Pearson (1857-1936), se basa en la diferencia entre la media y la mediana.

COEFICIENTE DE SESGO DE PEARSON sk =

3(X Mediana) s

Media

45 X

Aos

$3 000 $4 000

75 80 Calicacin

Frecuencia

0.98 1.04 Pulgadas

[4.2]

De acuerdo con esta expresin, el sesgo puede variar de 3 a 3. Un valor prximo a 3, como 2.57, indica un sesgo negativo considerable. Un valor como 1.63 indica un sesgo positivo moderado. Un valor de 0, que ocurre cuando la media y la mediana son iguales, indica que la distribucin es simtrica y que no se presenta ningn sesgo. En esta obra aparecen resultados obtenidos con paquetes de software de estadstica en MINITAB y Excel. Con ambos paquetes de software se calcula un valor del coeciente de sesgo basado en las desviaciones de la media elevadas al cubo. La frmula es la siguiente: X X 3 n COEFICIENTE DE SESGO sk = CALCULADO CON SOFTWARE (n 1)(n 2) s

[4.3]

La frmula 4.3 permite comprender la idea de sesgo. El miembro derecho de la frmula es la diferencia entre cada valor _ y la media, dividida entre la desviacin estndar. Esto corresponde a la porcin (X X )/s de la frmula. Esta idea recibe el nombre de estandarizacin. El concepto de estandarizacin de un valor se analiza con ms detalle en el captulo 7 al describir la distribucin de probabilidad normal. En este momento, observe que el resultado consiste en la diferencia entre cada valor y la media en unidades de desviacin estndar. Si la diferencia es positiva, el valor particular es ms grande que la media; si la variacin es negativa, la cantidad estandarizada es menor que la media. Cuando eleva al cubo estos valores, conserva la informacin relativa a la diferencia. Recuerde que en la frmula de la desviacin estndar (vase frmula 3.11), se elev al cuadrado la diferencia entre cada valor y la media de tal manera que, como resultado, todos los valores eran no negativos.

Descripcin de datos: Presentacin y anlisis de datos

115

Si el conjunto de valores de datos que se est estudiando es simtrico, al elevar al cubo los valores estandarizados y sumar todos los valores, el resultado se aproximara a cero. Si hay varios valores grandes, claramente separados unos de otros, la suma de las diferencias al cubo sera un valor positivo grande. Valores mucho menores dan como resultado una suma al cubo negativa. Un ejemplo ilustrar la idea de sesgo.

Ejemplo

Enseguida aparecen las utilidades por accin de una muestra de 15 compaas de software para el ao 2005. Las utilidades por accin se encuentran ordenadas de menor a mayor.
$0.09 3.50 $0.13 6.36 $0.41 7.83 $0.51 8.92 $ 1.12 10.13 $ 1.20 12.99 $ 1.49 16.40 $3.18

Calcule la media, la mediana y la desviacin estndar. Determine el coeciente de sesgo utilizando los mtodos de Pearson y de software. Qu concluye respecto de la forma de la distribucin?

Solucin

stos son los datos de una muestra, as que aplique la frmula 3.2 para determinar la media: X = X $74.26 = = $4.95 15 n

La mediana es el valor intermedio de un conjunto de datos, ordenados de menor a mayor. En este caso el valor medio es $3.18, as la mediana de las utilidades por accin es $3.18. Emplee la frmula 3.11 de la pgina 79 para calcular la desviacin estndar de la muestra: s= (X X )2 = n 1 ($0.09 $4.95)2 + + ($16.40 $4.95)2 = $5.22 15 1

El coeciente de sesgo de Pearson es de 1.017, calculado de la siguiente manera: sk = 3(X Mediana) 3($4.95 $3.18) = = 1.017 $5.22 s

Esto indica que existe un sesgo moderado en los datos de las utilidades por accin. Con el mtodo del software resulta un valor similar, aunque no exactamente el mismo. Los detalles de los clculos aparecen en la tabla 4.2 de la siguiente pgina. Para comenzar, determine la diferencia entre las utilidades por valor de accin, as como la media, y divida el resultado entre la desviacin estndar. Recuerde que a esto se llama estandarizacin. Enseguida, eleve al cubo, es decir, eleve a la tercera potencia el resultado del primer paso. Por ltimo, sume los valores elevados al cubo. Los detalles en el caso de la primera compaa, es decir, en la compaa con utilidades de $0.09 por accin, son: X X 0.09 4.95 = = (0.9310)3 = 0.8070 5.22 s Cuando _ sume los 15 valores cbicos, el resultado es 11.8274. Es decir, el trmino [(X X )/s]3 = 11.8274. Para determinar el coeciente de sesgo, utilice la frmula 4.3, con n = 15. X X n 15 (11.8274) = 0.975 sk = = s (n 1)(n 2) (15 1)(15 2)
3 3 3

116

Captulo 4

TablA 4.2 Clculo del coeficiente de sesgo


Utilidades por accin 0.09 0.13 0.41 0.51 1.12 1.20 1.49 3.18 3.50 6.36 7.83 8.92 10.13 12.99 16.40 (X X) s 0.9310 0.9234 0.8697 0.8506 0.7337 0.7184 0.6628 0.3391 0.2778 0.2701 0.5517 0.7605 0.9923 1.5402 2.1935 ( X X )3 s 0.8070 0.7873 0.6579 0.6154 0.3950 0.3708 0.2912 0.0390 0.0214 0.0197 0.1679 0.4399 0.9772 3.6539 10.5537 11.8274

La conclusin es que los valores de las utilidades por accin se encuentran un tanto sesgadas positivamente. El siguiente diagrama, de MINITAB, muestra las medidas descriptivas, como la media, la mediana y la desviacin estndar de los datos por utilidades por accin. Incluye, asimismo, el coeciente de sesgo y un histograma con una curva con forma de campana superpuesta.

Descripcin de datos: Presentacin y anlisis de datos

117

Autoevaluacin 4.4

Una muestra de cinco capturistas de datos que laboran en la oficina de impuestos de Horry County revis el siguiente nmero de expedientes fiscales durante la ltima hora: 73, 98, 60, 92 y 84. a) Calcule la media, la mediana y la desviacin estndar. b) Calcule el coeficiente de sesgo con el mtodo de Pearson. c) Calcule el coeficiente de sesgo usando un paquete de software. d ) Qu conclusin obtiene respecto del sesgo de los datos?

Ejercicios
En el caso de los ejercicios 19-22: a) Calcule la media, la mediana y la desviacin estndar. b) Calcule el coeciente de sesgo con el mtodo de Pearson. c) Estime el coeciente de sesgo con un paquete de software. 19.  Los siguientes valores son los sueldos iniciales, en miles de dlares, de una muestra de cinco graduados de contabilidad, quienes aceptaron puestos de contadura pblica el ao pasado.

36.0

26.0

33.0

28.0

31.0

20. En la siguiente lista aparecen los salarios, en miles de dlares, de una muestra de 15 directores de nanzas de la industria electrnica.

$516.0 546.0 486.0

$548.0 523.0 558.0

$566.0 538.0 574.0

$534.0 523.0

$586.0 551.0

$529.0 552.0

21. Enseguida aparece una lista de las comisiones (en miles de dlares) percibidas el ao pasado por representantes de ventas de Furniture Patch, Inc. $ 3.9 17.4 $ 5.7 17.6 $ 7.3 22.3 $10.6 38.6 $13.0 43.2 $13.6 87.7 $15.1 $15.8 $17.1

22. La lista que sigue est conformada por los salarios de los Yankees de Nueva York para el ao 2005. La informacin de los salarios se expresa en miles de dlares.

Jugador Rodriguez, Alex Jeter, Derek Mussina, Mike Johnson, Randy Brown, Kevin Giambi, Jason Sheffield, Gary Williams, Bernie Posada, Jorge Rivera, Mariano Pavano, Carl Matsui, Hideki Karsay, Steve

Salario (miles de dlares) Jugador $26 000 19 600 19 000 16 000 15 714 13 429 13 000 12 357 11 000 10 500 9 000 8 000 6 000 Wright, Jaret Stanton, Mike Gordon, Tom Rodriguez, Felix Quantrill, Paul Martinez, Tino Womack, Tony Sierra, Ruben Sturtze, Tanyon Flaherty, John Sanchez, Rey Crosby, Bubba Phillips, Andy

Salario (miles de dlares) $ 5 667 4 000 3 750 3 150 3 000 2 750 2 000 1 500 850 800 600 323 317

118

Captulo 4

Descripcin de la relacin entre dos variables


En el captulo 2 y en la primera seccin de este captulo se han expuesto tcnicas grcas para resumir la distribucin de una sola variable. En el captulo 2 se emple un histograma para resumir los precios de vehculos vendidos en Whitner Autoplex. En este captulo las herramientas usadas han sido los diagramas de puntos y las grcas de tallo y hojas para representar visualmente un conjunto de datos. En tanto que aparece una sola variable, se habla de datos univariables. Hay situaciones en las que se estudia y representa visualmente la relacin entre dos variables. Al estudiar la relacin entre dos variables, se hace referencia a los datos como bivariados. Los analistas de datos con frecuencia buscan entender la relacin entre dos variables. He aqu algunos ejemplos:  Tybo and Associates es una rma de abogados que se anuncia mucho en televisin. Los socios estn considerando la forma de incrementar su presupuesto publicitario. Antes de hacerlo, les gustara conocer la relacin entre la cantidad que se gasta al mes en publicidad y la cantidad total de cuentas por cobrar en dicho mes. En otras palabras, un incremento en la suma que se gasta en publicidad dar como resultado un incremento en las cuentas por cobrar?  Coastal Realty estudia sus precios de venta de casas. Qu variables parecen estar relacionadas con el precio de venta de las casas? Por ejemplo, las casas ms grandes se venden a un precio superior que las ms pequeas? Es probable. As que Coastal podra estudiar la relacin entre el rea en pies cuadrados y el precio de venta.  El doctor Stephen Givens es experto en desarrollo humano. Estudia la relacin entre la altura de los padres y la altura de sus hijos. Es decir, los padres altos tienden a tener hijos altos? Esperara usted que Shaquille ONeal, el basquetbolista profesional de siete pies y una pulgada de altura y 335 libras de peso tuviera hijos relativamente altos? Una tcnica grca til para mostrar la relacin entre variables es el diagrama de dispersin. Para trazar un diagrama de dispersin son necesarias dos variables. Se escala una de las variables sobre el eje horizontal (eje X) de una grca y la otra variable a lo largo del eje vertical (eje Y). Por lo general, una de las variables depende hasta cierto grado de la otra. En el tercer ejemplo citado, la altura del hijo depende de la altura del padre. As que se representa la altura del padre en el eje horizontal y la del hijo sobre el eje vertical. Un software de estadstica, como Excel, sirve para ejecutar la funcin de trazo. Precaucin: siempre se debe tener cuidado en la escala. Al cambiar la escala, ya sea del eje vertical o del eje horizontal, se afecta la fuerza de la relacin visual. Enseguida aparecen tres diagramas de dispersin (grca 4.2). El de la izquierda muestra una mayor relacin entre el tiempo de uso y el costo de mantenimiento del ao pasado de una muestra de 10 autobuses propiedad de la ciudad de Cleveland, Ohio. Note que conforme se incrementa el tiempo de uso del autobs, tambin aumenta el costo anual de mantenimiento. El ejemplo del centro, relativo a una muestra de 20 vehculos, muestra una mayor relacin entre la lectura del odmetro y el precio de venta de remate. Es decir, conforme aumente el nmero de millas recorridas, el precio de venta de remate se reduce. El ejemplo de la derecha describe la relacin entre la altura y el salario anual de una muestra de 15 supervisores de turno. Esta grca indica que existe una pequea relacin entre la altura y el salario anual.

Descripcin de datos: Presentacin y anlisis de datos

119

Precio de venta de remate

$10 000 8 000 6 000 4 000 2 000 0

Salario (miles de dlares)

Tiempo de uso de los autobuses y costo de mantenimiento

Precio de venta de remate frente a odmetro $5 600 5 200 4 800 4 400 4 000 10 000 30 000 Odmetro 50 000

Altura frente a salario 125 120 115 110 105 100 95 90 54 55 56 57 58 59 60 61 62 63 Altura (pulgadas)

Costo (anual)

1 2 3 4 5 Tiempo de uso (aos)

GRFICA 4.2 Tres ejemplos de diagramas de dispersin

Ejemplo

En la introduccin del captulo 2 aparecen datos de AutoUSA. En ese caso, la informacin tena que ver con los precios de 80 vehculos vendidos el mes pasado en el lote de Whitner Autoplex en Raytown, Missouri. Los datos de la pgina 21 incluan el precio de venta del vehculo, as como la edad del comprador. Existe alguna relacin entre el precio de venta de un vehculo y la edad del comprador? Sera razonable concluir que los vehculos ms caros son adquiridos por los compradores de ms edad? Es posible investigar la relacin entre el precio de venta de los vehculos y la edad del comprador con un diagrama de dispersin. Represente a escala la edad sobre el eje horizontal, o eje X, y el precio de venta sobre el eje vertical, o eje Y. Utilice Microsoft Excel para crear un diagrama de dispersin. Los comandos de Excel necesarios para la salida se muestran en la seccin Comandos de software ubicada al nal del captulo.

Solucin

El diagrama de dispersin muestra una relacin positiva entre las variables. De hecho, los compradores de ms edad tienden a comprar automviles ms caros. En el captulo 13 estudiar ms ampliamente la relacin entre variables, incluso calcular varias medidas numricas para expresar la relacin entre variables.

120

Captulo 4

En el ejemplo de Whitner Autoplex hay una relacin positiva o directa entre las variables. Es decir, conforme la edad se incrementa, el precio de venta del vehculo tambin lo hace. Sin embargo, hay muchos casos en los que existe una relacin entre las variables, pero dicha relacin es inversa o negativa. Por ejemplo:  El valor de un vehculo y el nmero de millas recorridas. Conforme la cantidad de millas se incrementa, el valor del vehculo desciende.  La prima de un seguro de automvil y la edad del conductor. Las cuotas de automvil tienden ser las ms altas para los adultos jvenes y menores para personas de ms edad.  Para muchos ociales encargados de hacer que se cumpla la ley, conforme aumenta el nmero de aos en el trabajo, el nmero de multas de trnsito disminuye. Esto puede deberse a que el personal se torna ms liberal en sus interpretaciones o a que quiz tengan puestos de supervisin y no un cargo en el que puedan levantar tantas multas. Pero en cualquier caso, conforme la edad aumenta, la cantidad de multas se reduce. Un diagrama de dispersin requiere que las dos variables sean por lo menos de escala de intervalo. En el ejemplo de Whitner Autoplex, tanto la edad como el precio de venta son variables de escala de razn. La altura tambin es una escala de razn, segn la manera en la que se utiliz en el estudio de la relacin entre la altura de los padres y la altura de los hijos. Y si desea estudiar la relacin entre dos variables cuando una o ambas son de escala nominal u ordinal? En este caso, debe registrar los resultados en una tabla de contingencia. TABLA DE CONTINGENCIA Tabla utilizada para clasificar observaciones de acuerdo con dos caractersticas identificables. Una tabla de contingencia es una tabulacin cruzada, que resume simultneamente dos variables de inters. Por ejemplo: Los estudiantes en una universidad se clasican por gnero y lugar en clase.  Un producto se clasica como aceptable o inaceptable y de acuerdo con el turno (matutino, vespertino, nocturno) en el que se le fabrica.  Un votante de una escuela que lleva a cabo elecciones para votar por un referendo que otorga becas se clasica de acuerdo con su aliacin partidista (demcrata, republicano u otro), y el nmero de hijos del votante que asisten a la escuela del distrito (0, 1, 2, etctera).

Ejemplo

Un fabricante de ventanas prefabricadas produjo 50 ventanas el da de ayer. Esta maana, el inspector de control de calidad revis cada ventana. Cada ventana se clasic como aceptable o inaceptable y de acuerdo con el turno en el que se fabric. Por consiguiente, hay dos variables en un solo elemento. Las dos variables son el turno y la calidad. Los resultados aparecen en la siguiente tabla.
Defectuoso Aceptable Total Matutino 3 17 20 Turno Vespertino 2 13 15 Nocturno 1 14 15 Total 6 44 50

Compare los niveles de calidad de cada turno.

Solucin

El nivel de medicin de ambas variables es nominal. Es decir, las variables turno y calidad slo permiten que a una unidad particular se le clasique o asigne a un grupo. El organizar la informacin en una tabla de contingencia permite comparar la calidad de los tres turnos. Por ejemplo, en el turno matutino, 3 de 20 ventanas, o 15%, estn defectuosas. En el turno vespertino, 2 de 15, o 13%, estn defectuosas y

Descripcin de datos: Presentacin y anlisis de datos

121

en el turno nocturno, 1 de 15, o 7% se encuentran defectuosas. En total, 12% de las ventanas estn defectuosas. Observe tambin que 40% de las ventanas se fabrican en el turno matutino, lo cual se determina con el calculo (20/50)(100). Las tablas de contingencia aparecen de nuevo en el capitulo 5, al estudiar probabilidad, y en el captulo 17 cuando estudie mtodos de anlisis no paramtricos.

Autoevaluacin 4.5

El grupo de rock Blue String Beans est de gira por Estados Unidos. El siguiente diagrama muestra la relacin entre el cupo para el concierto y el ingreso en miles de dlares en una muestra de conciertos.

Cantidad (miles de dlares)

7 6 5 4 3 2 5 800 6 300 Cupo 6 800 7 300

a) b) c) d )

Qu nombre recibe el diagrama? Cuntos conciertos se estudiaron? Calcule los ingresos del concierto con lleno total. Cmo caracterizara la relacin entre ingresos y cupo? Es fuerte o dbil, directa o inversa?

Ejercicios
23.  Elabore un diagrama de dispersin para los siguientes datos tomados de una muestra. Cmo describira la relacin entre los valores? Valor X 10 8 9 11 13 Valor Y 6 2 6 5 7 Valor X 11 10 7 7 11 Valor Y 6 5 2 3 7

 Silver Springs Moving and Storage, Inc., estudia la relacin que existe entre el nmero de habi24. taciones en una mudanza y el nmero de horas que se requieren de trabajo para la mudanza. Como parte del anlisis, el director de nanzas de Silver Springs cre el siguiente diagrama de dispersin.

40 30

Horas

20 10 0 1 2 3 Habitaciones 4 5

122

Captulo 4

a) Cuntas mudanzas se incluyen en la muestra? b)  Parece que se requieren ms horas de trabajo si la cantidad de habitaciones incrementa, o las horas de trabajo disminuyen si incrementa la cantidad de habitaciones?  El director de planeacin de Devine Dining, Inc., desea estudiar la relacin entre el gnero de 25. un husped y si el husped ordena postre. Para investigar esta relacin, el gerente recopil la siguiente informacin de 200 consumidores. Orden de postre S No Total Hombre 32 68 100 Gnero Mujer 15 85 100 Total 47 153 200

a) Cul es el nivel de medicin de las dos variables? b) Qu nombre recibe esta tabla? c) A partir de la evidencia en la tabla, los hombres piden ms postre que las mujeres? Explique. 26.  Sky Resorts Inc., de Vermont, considera su fusin con Gulf Shores, Inc., de Alabama. El consejo directivo encuest a 50 accionistas acerca de su posicin sobre la fusin. Los resultados aparecen enseguida. Nmero de participacin Menos de 200 200 hasta 1 000 Ms de 1 000 favor 8 6 6 20 Opinin En contra 6 8 12 26 Indeciso 2 1 1 4 Total 16 15 19 50

Total

a) Cul es el nivel de medicin usado en la tabla? b) Qu nombre recibe esta tabla? c) Qu grupo parece oponerse con ms fuerza a la fusin?

Resumen del captulo


I.  Un diagrama de puntos muestra el rango de valores sobre el eje horizontal, y se coloca un punto por encima de cada uno de los valores. A. Un diagrama de puntos muestra los detalles de cada observacin. B. Es de utilidad en la comparacin de dos o ms conjuntos de datos. II. Un diagrama de tallo y hojas constituye una alternativa al histograma. A. El dgito principal es el tallo y el dgito secundario, la hoja. B. Las ventajas de un diagrama de tallo y hojas sobre un histograma incluyen las siguientes: 1. La identidad de cada observacin no se pierde. 2. Los dgitos mismos proporcionan una representacin de la distribucin. 3. Tambin se exhiben las frecuencias acumulativas. III. Las medidas de localizacin describen la forma de un conjunto de observaciones. A. Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales. 1.  Veinticinco por ciento de las observaciones son menores que el primer cuartil, 50% son menores que el segundo cuartil y 75% son menores que el tercer cuartil. 2. El rango intercuartil es la diferencia entre el tercer y el primer cuartil. B.  Los deciles dividen a un conjunto de observaciones en diez partes iguales y los percentiles en 100 partes iguales. C. Un diagrama de caja es una representacin grca de un conjunto de datos. 1. Se traza una caja encerrando las regiones entre el primer y tercer cuartiles. a) Se dibuja una lnea en el interior de la caja en el valor intermedio. b)  Los segmentos punteados se prolongan a partir del tercer cuartil hasta el valor ms alto con el n de mostrar el 25% ms alto y a partir del primer cuartil hasta el valor ms bajo con el n de mostrar el 25% ms bajo de los valores.

Descripcin de datos: Presentacin y anlisis de datos

123

2.  Un diagrama de caja se basa en cinco estadsticos: los valores mximo y mnimo, el primer y tercer cuartiles y la mediana. IV. El coeciente de sesgo es una medida de la simetra de una distribucin. A. Existen dos frmulas para el coeciente de sesgo. 1. La frmula que elabor Pearson es: sk = 3(X Mediana) s [4.2]

2. El coeciente de sesgo calculado con un software de estadstica es: sk = X X 3 n (n 1)(n 2) s [4.3]

V.  Un diagrama de dispersin es una herramienta grca para representar la relacin entre dos variables. A. Ambas variables se miden con escalas de intervalo o de razn. B.  Si la propagacin de los puntos se dirige de la parte inferior izquierda a la parte superior derecha, las variables que se estudian se encuentran directa o positivamente relacionadas. C.  Si la dispersin de los puntos se orienta de la parte superior izquierda a la inferior derecha, las variables se encuentran relacionadas inversa o negativamente. VI.  Una tabla de contingencia se utiliza para clasicar observaciones de escala nominal de acuerdo con dos caractersticas.

Clave de pronunciacin
SMBOLO Lp Q 1 Q3 SIGNIFICADO Ubicacin del percentil Primer cuartil Tercer cuartil PRONUNCIACIN L subndice p Q subndice 1 Q subndice 3

Ejercicios del captulo


27.  Se le pregunt a una muestra de estudiantes que asiste a la Southern Florida University por la cantidad de actividades sociales en las que participaron la semana pasada. El diagrama que aparece enseguida se construy a partir de datos tomados de una muestra.

2 Actividades

28. 

a) Cul es el nombre que se da a este diagrama? b) Cuntos estudiantes se incluyeron en el estudio? c) Cuntos estudiantes informaron que no asistan a ninguna actividad social? Doctors Care es una clnica en la que no es necesario pedir cita, que tiene sucursales en Georgetown, Monks Corners y Aynor, y en la cual los pacientes reciben tratamiento por lesiones menores, resfriados, gripes y se les practican exmenes fsicos. Los siguientes diagramas muestran la cantidad de pacientes tratados en las tres sucursales el mes pasado.

Ubicacin Georgetown Monk Corners Aynor 10 20 Pacientes 30 40 50

124

Captulo 4

 Describa el nmero de pacientes atendidos en las tres sucursales cada da. Cules son los nmeros mximo y mnimo de pacientes atendidos en cada una de las sucursales? 29.  La siguiente grca de tallo y hojas muestra el nmero de minutos al da que ve la televisin una muestra de estudiantes de universidad. 2 0 3 1 6 2 10 3 13 4 24 5 30 6 (7) 7 33 8 28 9 21 10 12 11 8 12 4 13 1 14 05 0 137 0029 499 00155667799 023468 1366789 01558 1122379 022367899 2457 4668 249 5

a) Cuntos alumnos fueron estudiados? b) Cuntas observaciones hay en la segunda clase? c) Cul es el valor mnimo y cul es el mximo? d) Elabore una lista de los valores reales del cuarto rengln. e) Cuntos estudiantes vieron la televisin menos de 60 minutos? f ) Cuntos estudiantes vieron la televisin 100 minutos o ms? g) Cul es el valor de la mediana? h)  Cuntos estudiantes vieron la televisin por lo menos 60 minutos, pero menos de 100 minutos? 30.  La siguiente grca de tallo y hojas muestra la cantidad de pedidos recibidos por da en la ocina regional del noroeste de la Oriental Trading Co., Inc. 1 9 2 10 5 11 7 12 8 13 11 14 15 15 22 16 27 17 (11) 18 17 19 12 20 8 21 4 22 2 23 1 2 235 69 2 135 1229 2266778 01599 00013346799 03346 4679 0177 45 17

a) Cuntos das se incluyeron en el estudio? b) Cuntas observaciones hay en la cuarta clase? c) Cules son los valores mximo y mnimo? d) Elabore una lista de valores reales de la sexta clase. e) Cuntos das recibi la compaa menos de 140 pedidos? f ) Cuntos das recibi la empresa 200 o ms pedidos? g) En cuntos das recibi la empresa 180 pedidos? h) Cul es el valor de la mediana? 31.  En aos recientes, como consecuencia de las bajas tasas de inters, muchos propietarios de una casa renanciaron sus crditos. Linda Lahey es agente hipotecaria en Down River Federal Savings and Loan. A continuacin aparecen las sumas renanciadas de 20 prstamos a los que les dio curso la semana pasada. Los datos se expresan en miles de dlares y se encuentran ordenados de menor a mayor.

Descripcin de datos: Presentacin y anlisis de datos

125

59.2 59.5 83.7 85.6 100.2 100.7 32. 

61.6 85.8

65.5 86.6

66.6 87.0

72.9 87.1

74.8 90.2

77.3 93.3

79.2 98.6

a) Calcule la mediana, el primer cuartil y el tercer cuartil. b) Determine los percentiles 26 y 83. c) Trace un diagrama de caja de los datos. La industria disquera de Estados Unidos lleva a cabo un estudio sobre el nmero de discos compactos de msica que poseen las personas de la tercera edad y los adultos jvenes. La informacin aparece enseguida. Adultos de la tercera edad 28 35 41 48 52 81 97 98 98 99 118 132 133 140 145 147 153 158 162 174 177 180 180 187 188 Adultos jvenes 81 233 417 107 251 423 113 254 490 147 266 500 147 283 507 175 284 518 183 284 550 192 316 557 202 372 590 209 401 594

a)  Calcule la mediana y el primer y tercer cuartiles del nmero de compactos que poseen los ciudadanos de la tercera edad. Disee un diagrama de caja de la informacin. b)  Calcule la mediana, el primer y tercer cuartiles del nmero de compactos que poseen los adultos jvenes. Disee un diagrama de caja de la informacin. c) Compare el nmero de compactos que poseen ambos grupos. 33.  Las ocinas centrales de la empresa Bank.com, una empresa nueva de internet que realiza todas las transacciones bancarias a travs de internet, se localizan en el centro de Filadela. El director de recursos humanos lleva a cabo un estudio relacionado con el tiempo que invierten los empleados en llegar al trabajo. La ciudad hace planes para ofrecer incentivos a las empresas que se ubiquen en el centro si estimulan a sus empleados a utilizar el transporte pblico. A continuacin aparece una lista del tiempo que se requiri esta maana para llegar al trabajo segn el empleado haya utilizado el transporte pblico o su automvil. Transporte pblico 23 37 25 42 25 30 31 31 32 33 35 36

Particular 32 40 32 44 33 34 37 37 38 38 38 39

a)  Calcule la mediana, el primer y tercer cuartiles para el tiempo de desplazamiento de los empleados utilizando el transporte pblico. Elabore un diagrama de caja para la informacin. b)  Calcule la mediana, el primer y tercer cuartiles para el tiempo de desplazamiento de los empleados en su propio vehculo. Elabore un diagrama de caja para la informacin. c)  Compare los tiempos de los dos grupos. 34.  El siguiente diagrama de caja muestra la cantidad de diarios que se publican en cada estado y en el Distrito de Columbia. Redacte un breve informe para resumir la cantidad que se public. Cercirese de incluir informacin relativa a los valores del primer y tercer cuartiles, la mediana y si existe algn sesgo. Si hay datos aislados, calcule su valor.

* * * *

20

40

60

80

Nmero de diarios

100

126

Captulo 4

35.  Walter Gogel Company es un proveedor industrial de cinturones de seguridad, herramientas y resortes. Las sumas de sus ingresos varan mucho, desde menos de $20.00 hasta ms de $400.00. Durante el mes de enero enviaron 80 facturas. El siguiente es un diagrama de caja de estas facturas. Redacte un breve informe que resuma los montos de las facturas. Incluya informacin sobre los valores del primer y tercer cuartiles, la mediana y si existe algn sesgo. Si hay datos atpicos, aproxime el valor de estas facturas.

50

100

150

200
30 29 23

Monto de facturas 36.  National Mufer Company arma que puede cambiar el silenciador de su automvil en menos de 30 minutos. Un reportero investigador de WTOL Channel 11 supervis 30 cambios consecutivos de silenciadores en el taller de la calle Liberty. La siguiente tabla contiene la cantidad de minutos que se requieren para llevar a cabo los cambios. 44 40 16 37.  12 17 33 22 13 24 31 14 20 26 17 29 22 25 34 26 15 13 18 30 28 10 12 28

a) Disee un diagrama de caja para el tiempo de cambio de un silenciador. b) La distribucin muestra valores aislados? c) Resuma sus conclusiones en un breve informe. McGivern Jewelers se ubica en Levis Square Mall, justo al sur de Toledo, Ohio. Recin public un anuncio en el peridico local en el que indicaba la forma, el tamao, el precio y el grado de corte de 33 de sus diamantes en existencia. Enseguida se muestra la informacin. Grado de corte Corte ideal Corte perfeccionado Corte ideal Corte ideal Ultracorte ideal Corte promedio Corte perfeccionado Corte ideal Ultracorte ideal Corte perfeccionado Corte ideal Buen corte Corte perfeccionado Corte perfeccionado Buen corte Corte perfeccionado Corte perfeccionado Forma Tamao (quilates) Precio 0.77 0.76 0.71 0.71 0.70 0.66 0.62 0.52 0.51 0.51 0.45 0.44 0.44 0.40 0.35 0.32 $ 2 828 3 808 2 327 2 732 1 915 1 885 1 397 2 555 1 337 1 558 1 191 1 319 1 319 1 133 1 354 896 Grado de corte Ultracorte ideal Corte perfeccionado Corte perfeccionado Buen corte Corte perfeccionado Corte perfeccionado Buen corte Corte perfeccionado Corte ideal Corte perfeccionado Corte perfeccionado Corte promedio Corte perfeccionado Corte perfeccionado Buen corte Corte perfeccionado

Forma

Tamao (quilates) Precio 5.03 2.35 2.03 1.56 1.21 1.21 1.19 1.16 1.08 1.02 1.02 1.01 1.00 0.91 0.90 0.90 0.84 $44 312 20 413 13 080 13 925 7 382 5 154 5 339 5 161 8 775 4 282 6 943 7 038 4 868 5 106 3 921 3 733 2 621

Princesa Redonda Redonda Redonda Redonda Redonda Redonda Esmeralda Redonda Redonda Redonda Talla con 58 facetas Princesa Redonda Redonda Redonda Redonda

Redonda Oval Princesa Talla con 58 facetas Redonda Redonda Redonda Redonda Princesa Redonda Redonda Princesa Talla con 58 facetas Redonda Redonda Redonda

a)  Disee un diagrama de caja para la variable de precio y haga algn comentario sobre el resultado. Hay valores atpicos? Cul es la mediana del precio? Cul es el valor del primer y tercer cuartiles? b)  Disee un diagrama de caja de la variable de tamao y haga comentarios sobre el resultado. Hay valores atpicos? Cul es la mediana del precio? Cul es el valor del primer y tercer cuartiles? c)  Disee un diagrama de dispersin entre las variables de precio y tamao. Coloque el precio en el eje vertical y el tamao en el eje horizontal. Parece que hay alguna relacin entre las dos variables? La relacin es directa o indirecta? Parece que alguno de los puntos es diferente de los dems? d)  Disee una tabla de contingencia para las variables de forma y grado de corte. Cul es el grado de corte ms comn? Cul es la forma ms comn? Cul es la combinacin ms comn de grado de corte y forma?

250

Descripcin de datos: Presentacin y anlisis de datos

127

38.  En la siguiente lista aparece la cantidad de comisiones que ganaron el mes pasado los ocho miembros del personal de ventas de Best Electronics. Calcule el coeciente de sesgo utilizando ambos mtodos. Sugerencia: el uso de una hoja de clculo agilizar los clculos. 980.9 1 036.5 1 099.5 1 153.9 1 409.0 1 456.4 1 718.4 1 721.2

39.  La siguiente tabla contiene la cantidad de robos de automviles en una ciudad grande la semana pasada. Calcule el coeciente de sesgo utilizando ambos mtodos. Sugerencia: el uso de una hoja de clculo agilizar los clculos. 3 12 13 7 8 3 8

40.  El gerente de Servicios de Informacin de Wilkin Investigations, una empresa privada, estudia la relacin entre el tiempo de uso (en meses) de una mquina compuesta de impresora, copiadora y fax y el costo de mantenimiento mensual de sta. El gerente elabor el siguiente diagrama para una muestra de 15 mquinas. Qu puede concluir el gerente sobre la relacin entre las variables?

Costo mensual de mantenimiento

$130 120 110 100 90 80 34 39 Meses 44 49

41.  Una compaa de seguros de automvil arroj la siguiente informacin relacionada con la edad de un conductor y el nmero de accidentes registrados el ao pasado. Disee un diagrama de dispersin para los datos y redacte un breve resumen. Edad 16 24 18 17 Accidentes 4 2 5 4 Edad 23 27 32 22 Accidentes 0 1 1 3

42.  Wendys ofrece ocho diferentes condimentos (mostaza, catsup, cebolla, mayonesa, pepinillos, lechuga, tomate y guarnicin) en las hamburguesas. El administrador de una de las tiendas recogi la siguiente informacin relativa al nmero de condimentos que se pidieron y el grupo de edad de los clientes. Qu puede concluir respecto de la informacin? Quin tiende a ordenar la mayor o la menor cantidad de condimentos? Cantidad de condimentos 0 1 2 3 o ms Menos de 18 12 21 39 71 18 76 52 87 Edad De 18 a 40 De 40 a 60 24 50 40 47 60 o mayores 52 30 12 28

43.  La siguiente lista muestra el nmero de trabajadores empleados y desempleados de 20 aos o mayores, de acuerdo con su gnero en Estados Unidos para 2006. Gnero Hombres Mujeres Nmero de trabajadores (miles) Empleados 70 415 61 402 Desempleados 4 209 3 314

128

Captulo 4

a) Cuntos trabajadores se registraron? b) Qu porcentaje de trabajadores estaban desempleados? c) Compare el porcentaje de desempleados en el caso de hombres y mujeres.

Ejercicios.com
44.  Recupere el ejercicio 86 de la pgina 94, donde se sugieren sitios web para hallar informacin sobre el Promedio Industrial Dow Jones. Uno de los sitios web sugeridos es Bloomberg, que constituye una excelente fuente de datos de negocios. El sitio Bloomberg es: http://boomberg. com. Haga clic en Market Data, enseguida en Stocks y Dow. Debe aparecer al pie de la pgina una lista de precios de venta actuales de las 30 acciones que forma el Promedio Industrial Dow Jones. Calcule el cambio porcentual de ayer para cada una de las 30 acciones. Cree diagramas para describir el cambio porcentual. 45.  Los siguientes sitios web proporcionan los resultados del Sper Tazn, desde el primer juego que se practic en 1967: http://www.superbowl.com/history/recaps. Descargue el marcador de cada Sper Tazn y determine el margen de victoria. Cul fue el margen tpico? Cules fueron el primer y tercer cuartiles? Hay algunos partidos que constituyan datos atpicos?

Ejercicios de la base de datos


46.  Consulte los datos Real Estate, que incluyen informacin sobre las casas vendidas en Denver, Colorado, el ao pasado. Seleccione la variable precio de venta. a) Elabore un diagrama de caja. Estime el primer y tercer cuartiles. Hay datos atpicos? b)  Desarrolle un diagrama de dispersin con el precio en el eje vertical y el tamao de la casa en el horizontal. Parece que hay alguna relacin entre las dos variables? La relacin es directa o inversa? c)  Elabore un diagrama de dispersin con el precio en el eje vertical y la distancia al centro de la ciudad en el horizontal. Parece que hay alguna relacin entre las dos variables? La relacin es directa o inversa? 47.  Busque en Baseball 2005 la informacin sobre los 30 mejores equipos de la Liga Mayor en la temporada 2005. a)  Seleccione la variable que se reere al ao en que el estadio fue construido. (Sugerencia: reste el ao en el que el estadio se construy del ao actual para determinar el tiempo que tiene el estadio, y trabaje con esta variable.) Disee un diagrama de caja Hay datos atpicos? b)  Seleccione la variable relacionada con el salario del equipo y disee un diagrama de caja. Hay datos atpicos? Cules son los cuartiles? Redacte un breve resumen de su anlisis. Cmo se comparan los salarios de los Yanquis de Nueva York con los otros equipos? c)  Trace un diagrama de dispersin en cuyo eje vertical se indique el nmero de juegos ganados y el salario del equipo en el eje horizontal. Cules son sus conclusiones? d)  Seleccione la variable ganados. Trace un diagrama de puntos. Qu conclusiones puede obtener a partir de esta grca? 48.  Consulte los datos Wage, que contienen informacin sobre salarios anuales de una muestra de 100 trabajadores. Tambin se incluyen variables relacionadas con la industria, aos de educacin y gnero de cada trabajador. a)  Elabore una grca de tallo y hojas para la variable salario anual. Hay datos atpicos? Redacte un breve resumen de sus conclusiones. b)  Elabore una grca de tallo y hojas para la variable que se reere a los aos de educacin. Hay datos atpicos? Redacte un breve resumen de sus conclusiones. c)  Elabore una grca de barras de la variable ocupacin. Redacte un breve informe en el que resuma sus conclusiones. 49.  Consulte los datos CIA, que contienen informacin demogrca y econmica sobre 46 pases. a)  Seleccione la variable expectativa de vida. Disee un diagrama de caja. Determine el primer y tercer cuartiles. Hay datos atpicos? Es la distribucin sesgada o simtrica? Redacte un breve prrafo en el que resuma sus conclusiones. b)  Seleccione la variable PIB/cap. Disee un diagrama de caja. Determine el primer y tercer cuartiles. Hay datos atpicos? Es la distribucin sesgada o simtrica? Redacte un breve prrafo en el que resuma sus conclusiones. c)  Disee una grca de tallo y hojas referente al nmero de telfonos celulares. Resuma sus conclusiones.

Descripcin de datos: Presentacin y anlisis de datos

129

Comandos de software
 Los comandos de MINITAB para el diagrama de puntos 1. de la pgina 100 son los siguientes: a)  Introduzca los precios de venta de los vehculos de Smith Ford Mercury Jeep en la columna C1 y los de Brophy Honda Volkswagen en C2. Nombre las variables siguientes. b)  Seleccione Graph y Dotplot. En el primer cuadro de dilogo, seleccione Multiple Ys Simple en la esquina inferior izquierda y haga clic en OK. En el siguiente cuadro de dilogo, seleccione Smith y Brophy como variables para Graph, haga clic en Labels y escriba un ttulo adecuado. c)  Para calcular las estadsticas descriptivas que aparecen en la pantalla, seleccione Stat, Basic statistics y, enseguida, Display Descriptive statistics. En el cuadro de dilogo, seleccione Smith y Brophy como Variables, haga clic en Statistics y selecciones las estadsticas que desee obtener y, nalmente, haga doble clic en OK.  Los comandos de MINITAB para el diagrama de tallo y 2. hojas de la pgina 103 son los siguientes: a)  Importe los datos del CD. El nombre del archivo es Table4-1. b) Seleccione Graph y haga clic en Stem-and-Leaf. c)  Seleccione la variable Spots, introduzca 10 como Increment y haga clic enseguida en OK.

3.  Los comandos de MINITAB para el resumen descriptivo de la pgina 108 son los siguientes:

a)  Importe los datos de Whitner Autoplex del CD. El nombre del archivo es Whitner 2005. Seleccione la variable Price. b)  De la barra de herramientas, seleccin Stat, Basic Statistics y Display Descriptive Statistics. En el cuadro de dilogo seleccione Price como Variable; en la esquina inferior derecha haga clic en Graphs. En este cuadro seleccione Graphs, haga clic en Histogram of data, y enseguida haga clic en OK dos veces.

130

Captulo 4

 Los comandos de Excel para las estadsticas descripti4. vas de la pgina 109 son: a)  Recupere los datos de Whitner Autoplex del CD, que son Whitner 2005. b)  De la barra de men, seleccione Tools y, enseguida, Data Analysis. Seleccione Descriptive Statistics y enseguida haga clic en OK. c)  Para Input Range, escriba B1:B81, indique que los datos se encuentran agrupados por columna y que las etiquetas se encuentran en la primera la. Haga clic en Output Range, indique que la salida debe aparecer en D1 (o en el lugar que preera) y haga clic en Summary statistics. d)  En la esquina inferior izquierda, haga clic en Kth Largest y escriba 20 en el recuadro; haga clic en Kth Smallest y escriba 20 en dicho recuadro. e)  Despus de obtener resultados, verique dos veces la cuenta de la salida de datos para cerciorarse de que contiene el nmero correcto de valores.  Los comandos de MINITAB para el diagrama de caja de 5. la pgina 111 son los siguientes: a)  Importe los datos del CD. El nombre del archivo es Table2-1. b)  Seleccin Graph y enseguida Boxplot. En el recuadro de dilogo seleccione Simple en la esquina superior izquierda y haga clic en OK. Seleccione Price como Graph variable, haga clic en Labels, incluya un encabezamiento adecuado y enseguida haga clic en OK.  Los comandos de MINITAB para el resumen descriptivo 6. de la pgina 116 son los siguientes: a) Recupere los datos de Table4-1 en el CD. b)  Seleccione Stat, Basic Statistics y enseguida haga clic en Graphical Summary. Seleccione Earnings como variable y enseguida haga clic en OK.  Los comandos de Excel para el diagrama de dispersin 7. de la pgina 119 son los siguientes: a) Recupere los datos de Whitner 2005 del CD. b)  Necesitar copiar las variables en otras columnas en la hoja de clculo, en la que se coloca la edad en una columna y el precio en la siguiente. Esto le permitir colocar el precio en el eje vertical y la edad en el eje horizontal. c)  Haga clic en Chart, debajo de Insert, para dar inicio a Chart Wizard, seleccione XY (Scatter), as como el subtipo en la parte superior izquierda y enseguida haga clic en Next. d)  Seleccione o destaque las variables de edad seguidas de precio, enseguida haga clic en Next nuevamente. e)  Escriba un ttulo para el diagrama y d un nombre a las dos variables; enseguida haga clic en Next. En el cuadro de dilogo nal, seleccione una ubicacin para los diagramas.

Descripcin de datos: Presentacin y anlisis de datos

131

Captulo 4 Respuestas a las autoevaluaciones


4.1 1. a) 79, 105 b) 15 c)  De 88 a 97; 75% de las tiendas se encuentran en este rango. 2. 7 7 8 0013488 9 1256689 10 1248 11 26 a) 8 b) 10.1, 10.2, 10.4, 10.8 c) 9.5 d) 11.6, 7.7 4.2 a) 7.9 b) Q1 = 7.76, Q3 = 8.015  El valor ms bajo es 10 y el ms alto 85; el primer cuartil 4.3 es 25 y el tercero 60. Alrededor del 50% de los valores se encuentran entre 25 y 60. El valor de la mediana es de 40. La distribucin es positivamente sesgada. 4.4 407 a) X = = 81.4, mediana = 84 5 s= 923.2 = 15.19 5 1 b) sk = c) 3(81.4 84.0) = 0.51 15.19 X X s 0.1691 1.3051 2.7962 0.3398 0.0050 1.3154
3

XX X s 73 98 60 92 84 sk = 0.5530 1.0928 1.4088 0.6978 0.1712 5 [1.3154] (4)(3) = 0.5481

4.5

d)  La distribucin es de alguna forma negativamente sesgada. a) Diagrama de dispersin b) 16 c) $7 500 d) Fuerte y directa

132

Captulo 4

Repaso de los captulos 1-4


Esta seccin constituye un repaso de los conceptos y trminos ms importantes que estructuran los captulos 1 a 4. El captulo 1 inici con una descripcin del signicado y objetivo de la estadstica. Enseguida se describieron los diferentes tipos de variables y los cuatro niveles de medicin. El captulo 2 se centr en la descripcin de un conjunto de observaciones y la forma en la que se organizaban en una distribucin de frecuencias y, enseguida, en la representacin de la distribucin de frecuencias como un histograma o un polgono de frecuencias. El captulo 3 inici con la descripcin de medidas de ubicacin, como la media, la media ponderada, la mediana, la media geomtrica y la moda. Este captulo tambin incluy las medidas de dispersin o propagacin. En esta seccin se estudiaron el rango, la desviacin media, la varianza y la desviacin estndar. El captulo 4 incluy diversas tcnicas de gracacin, como los diagramas de puntos, los diagramas de caja y los diagramas de dispersin. Tambin el coeciente de sesgo, que indica la falta de simetra que hay en un conjunto de datos. A lo largo de esta seccin se enfatiz la importancia del software estadstico, como Excel y MINITAB. En estos captulos muchas pantallas de computadora demostraron la rapidez y efectividad con la que se puede organizar un conjunto de datos en una distribucin de frecuencias; mostraron, asimismo, el clculo de diversas medidas de ubicacin o de variacin y la informacin que se presenta de forma grca.

Glosario
Captulo 1
Estadstica Ciencia encargada de recolectar, organizar, ana lizar e interpretar datos numricos con el n de que se tomen decisiones ms efectivas. Estadstica de la guerra descriptiva Tcnicas empleadas para describir las caractersticas importantes de un conjunto de datos. stos pueden incluir la organizacin de los valores en una distribucin de frecuencias y el clculo debera ser de ubicacin, de dispersin y sesgos. Estadstica inferencial, tambin denominada inferencia estadstica Esta faceta de la estadstica tiene que ver con el clculo de un parmetro basado en la estadstica de una muestra. Por ejemplo, si 2 calculadoras de mano de una muestra de 10 calculadoras son defectuosas, podemos inferir que 20% de la produccin es defectuosa. Exhaustivo Cada observacin debe caer en alguna de las categoras. Medida de intervalo Si una observacin es mayor que otra por una cierta cantidad, y el punto cero es arbitario, la medicin corresponde a una escala de intervalo. Por ejemplo, la diferencia entre las temperaturas de 70 y 80 grados es de 10 grados. Asimismo, una temperatura de 90 grados es 10 grados ms alta que una temperatura de 80 grados, y as sucesivamente. Medida de razn Si las distancias entre nmeros son de cierto tamao constante conocido y existe un punto cero real, adems de que la razn entre dos valores es signicativa, la medida es de escala de razn. Por ejemplo, la distancia entre $200 y $300 es $100, y en el caso del dinero, existe un punto cero real. Si se tienen cero dlares, no hay dinero (no se tiene nada). Asimismo, la razn entre $200 y $300 es signicativa. Medida nominal Nivel de medicin ms bajo. Si los datos se clasican en categoras y el orden de dichas categoras no es importante, se trata del nivel nominal de medicin. Ejemplos de ste son el gnero (hombre, mujer) y la aliacin poltica (republicano, demcrata, independiente, todos los dems). Si no hay diferencia entre listar primero a un hombre que a una mujer, los datos son de nivel nominal. Medida ordinal los datos pueden ser ordenados lgicamente reerindose a un orden. Por ejemplo, la respuesta del consumidor al sonido de una nueva bocina puede ser: excelente, muy buena, regular o pobre. Muestra Porcin, o subconjunto, de la poblacin que se estudia. Mutuamente excluyente Propiedad de un conjunto de cate goras que permite incluir a un individuo, objeto o medida en una sola categora. Poblacin. Coleccin o conjunto de individuos, objetos o medidas, cuyas propiedades se estudian.

Captulo 2
Clase Intervalo en el que se recopilan los datos. Por ejemplo, $4 a $7 constituye una clase; $7 a $11 es otra clase. Distribucin de frecuencias Agrupacin de datos en cla ses que muestra el nmero de observaciones en cada una de las clases mutuamente excluyentes. Por ejemplo, los datos se organizan en clases como las siguientes: de $1 000 a $2 000; de $2 000 a $3 000, y as sucesivamente, con el n de resumir la informacin. Distribucin de frecuencias relativas Distribucin de fre cuencias que muestra la fraccin o parte del total de observaciones en cada clase. Frecuencia de clase Nmero de observaciones en cada cla se. Si hay 16 observaciones en la clase de $4 a $6, 16 es la frecuencia de clase. Grficas Formatos especiales de representacin utilizados para mostrar una distribucin de frecuencias, incluyendo histogramas, polgonos de frecuencias y polgonos de frecuencias acumulativas. Otros dispositivos grcos empleados para representar datos son las grcas de lneas, las grcas de barras, las grcas de pastel. stos son muy tiles, por ejemplo, para describir la tendencia de un adeudo a largo plazo o los cambios porcentuales entre las utilidades del ao pasado y este ao. Histograma Representacin grca de una frecuencia o una distribucin de frecuencias relativas. El eje horizontal muestra las clases. La altura vertical de barras adyacentes muestra la frecuencia o frecuencia relativa de cada clase. Punto medio Valor que divide a la clase en dos partes igua les. En las clases que van de $10 a $20 y de $20 a $30, los puntos medios son $15 y $25, respectivamente.

Repaso de los captulos 1-4

133

Captulo 3
Desviacin estndar Raz cuadrada de la varianza. Desviacin media Media de las desviaciones de la media, sin tomar en cuenta los signos. Se abrevia DM. Media aritmtica Suma de valores dividida entre el nmero _ de valores. El smbolo de la media de una muestra es X , y el smbolo de una media poblacional es . Media geomtrica Ensima raz del producto de los valores. Es de particular utilidad para promediar razones de cambio y nmeros indicadores. Minimiza la importancia de los valores extremos. Una segunda aplicacin de la media geomtrica tiene que ver con determinar el cambio porcentual anual medio durante cierto periodo. Por ejemplo, si las ventas en bruto fueron de $245 millones en 1985 y de $692 millones en 2005, cul es el incremento porcentual anual promedio? Media ponderada Cada valor se pondera de acuerdo con su importancia relativa. Por ejemplo, si 5 camisas cuestan $10 cada una, y 20 cuestan $8 cada una, el precio medio ponderado es de $8.40: [(5 $10) + (20 $8)]/25 = $210/25 = $8.40. Mediana Valor de la observacin media despus de que todas las observaciones se ordenaron de menor a mayor. Por ejemplo, si las observaciones 6, 9 y 4 se ordenan 4, 6 y 9, la mediana es 6, el valor medio. Medida de dispersin Valor que muestra la propagacin de los datos. El rango, la varianza y la desviacin estndar son medidas de dispersin. Medida de ubicacin Nmero que indica un solo valor que sea tpico de los datos. Seala al centro de una distribucin. La media aritmtica, la media ponderada, la mediana, la moda y la media geomtrica son medidas de ubicacin central. Moda Valor que se presenta con mayor frecuencia en un conjunto de datos. En el caso de datos agrupados, es el punto medio de la clase que contiene el mximo nmero de valores. Rango Medida de dispersin calculada como el valor mximo menos el valor mnimo. Varianza Medida de dispersin respecto de la media aritmtica basada en las diferencias promedio elevadas al cuadrado.

Captulo 4
Coeficiente de sesgo Medida de la falta de simetra de una distribucin. En el caso de una distribucin simtrica, no existe sesgo, as que el coeciente de sesgo es cero. De lo contrario, puede ser positivo o negativo, con lmites 3.0. Cuartiles Valores de un conjunto de datos ordenados (de mnimo a mximo) que dividen los datos en cuatro intervalos de frecuencias aproximadamente iguales. Deciles Valores de un conjunto de datos ordenados (de mnimo a mximo), que dividen los datos en diez intervalos de frecuencias aproximadamente iguales. Diagrama de caja Representacin grca que muestra la forma general de la distribucin de una variable. Se basa en cinco estadsticos descriptivos: los valores mximo y mnimo, el primer y tercer cuartiles y la mediana. Diagrama de dispersin Tcnica grca empleada para mostrar la relacin entre dos variables medidas con escalas de intervalo o de razn. Diagrama de puntos Un diagrama de puntos resume la dis tribucin de una variable apilando los puntos sobre una lnea de puntos que muestra los valores de la variable. Un diagrama de puntos utiliza todos los valores. Diagrama de tallo y hojas Mtodo para representar la distri bucin de una variable utilizando todos los valores. Los valores son clasicados por el dgito principal de los datos. Por ejemplo, si un conjunto de datos contiene valores entre 13 y 84, se utilizaran para los tallos ocho clases basadas en los dgitos de las decenas. Las unidades corresponderan a las hojas. Percentiles Valores de un conjunto de datos ordenados (de mnimo a mximo) que dividen los datos en cien intervalos de frecuencias aproximadamente iguales. Rango intercuartil Valor absoluto de la diferencia numrica entre el primer y tercer cuartiles. Cincuenta por ciento de los valores de una distribucin se presentan en este rango. Tabla de contingencia Tabla utilizada para clasicar obser vaciones de acuerdo con dos o ms caractersticas nominales.

Ejercicios
Cules de los siguientes conceptos no estn incluidos en la denicin de estadstica? a) Coleccin. b) Organizacin. c) Venta. d) Interpretacin. Se pidi a los clientes de un restaurante local que calicaran el servicio como excelente, bueno, regular o malo. El nivel de medicin es a) Nominal. b) Ordinal. c) De intervalo. d) De razn. 3. La edad, ingresos, altura y peso de una persona son ejemplos de a) Variables de poblacin. b) Variables cualitativas. c) Variables aleatorias. d) Variables cuantitativas.  Cules de los siguientes enunciados son verdaderos en el caso de una tabla de frecuencias? 4. a) Se basa en datos cualitativos. b) La agrupacin debe ser mutuamente excluyente. c) La variable es de naturaleza no numrica. d) Todo lo anterior es correcto. 1.  2.

134
5. 6. 7.

Captulo 4

En un diagrama de barras, a) Las frecuencias siempre se representan en el eje vertical. b) Las clases se representan en el eje horizontal. c) La variable de inters es cualitativa. d) Todo lo anterior es correcto. En una distribucin de frecuencias, el nmero de observaciones en cada clase se denomina a) Punto medio de clase. b) Frecuencia de clase. c) Intervalo de clase. d) Ninguno de stos. Un conjunto de datos incluye 75 observaciones. Cuntas clases recomendara usted? a) 2 b) 7 c) 9 d) 8

Se selecciona una muestra de cinco de los vicepresidentes de Midlands Federal Savings Bank. Han laborado en la compaa 11, 4, 9, 16 y 10 aos. Utilice esta informacin para responder las preguntas 8 a 12. 8. Cul es la media del nmero de aos que llevan con el banco? ______ 9. Cul es la mediana del nmero de aos que llevan con el banco? ______ 10. Cul es el rango del nmero de aos que llevan con el banco? ______ 11. Cul es la desviacin estndar del nmero de aos que llevan con el banco? ______ 12. Cul es el 80o percentil? ______ 13. Una medida til para observar la falta de simetra en un conjunto de datos recibe el nombre de: a) Coeciente de sesgo. b) Coeciente de normalidad. c) Coeciente de variacin. d) Varianza. 14.  En un conjunto de datos, la media, la mediana y la moda tienen un valor todas de 100. La desviacin estndar es de 4. Aproximadamente 95% de las observaciones se encuentran entre: a) 92 y 108. b) 96 y 104. c) 95 y 105. d) No puede calcularse.  Fine Furniture Inc. produjo 2 460 escritorios en 1995 y 6 520 en 2005. Cul es la media geomtrica de la 15. tasa anual de incremento para el periodo? ______ 16. Una grca que muestra la relacin entre dos variables de intervalo o de razn recibe el nombre de: a) Tabla de contingencia. b) Diagrama de dispersin. c) Diagrama de tallo y hojas. d) Diagrama de puntos. 17. Un resumen de datos medidos con dos variables nominales recibe el nombre de: a) Diagrama de dispersin. b) Tabla de contingencia. c) Distribucin de frecuencias. d) Histograma.

Observe la grca para responder las preguntas 18 a 20. 18. La grca recibe el nombre de: a) Distribucin de frecuencias. b)  Distribucin acumulativa de frecuencias. c) Polgono de frecuencias. d) Histograma. 19. El rango intercuartil es: a) 5 b) 10 c) 15 d) 35

400
Nmero de empleados

100 75 50 25 0

300 200 100 0 20 25 30 35 Edad 40 45 50 55

Porcentaje

Repaso de los captulos 1-4

135

20.  21.

Cul de los siguientes enunciados es verdadero? a) Alrededor de 300 empleados son menores de 30 aos. b) Veinticinco por ciento de los empleados son mayores de 45 aos. c) El rango intercuartil representa 60% de los empleados. d) Setenta y cinco por ciento de los empleados son menores de 35 aos. Una muestra de fondos depositados en la cuenta de cheques miniatura del First Federal Savings Bank, revel las siguientes cantidades: $124 39 186 116 145 $14 52 107 152 187 $150 103 142 206 165 $289 58 185 117 147 $52 136 75 52 158 $156 249 202 299 146 $203 110 119 58 185 $82 298 219 153 186 $27 251 156 219 149 $248 157 78 148 140

Utilizando los datos en bruto anteriores y un paquete de estadstica (como MINITAB): a) Organice los datos en una distribucin de frecuencias. b)  Calcule la media, la mediana y otras medidas descriptivas. Incluya un diagrama de puntos, un diagrama de tallo y hojas y un diagrama de caja. Usted decide lo que tiene que ver con el intervalo de clase. c)  Interprete los resultados de la computadora; es decir, describa la tendencia central, la dispersin, el sesgo y otras medidas. 22. Una muestra de 12 casas vendidas la semana pasada en St. Paul, Minnesota, revel la siguiente informa  cin. Trace un diagrama de dispersin. Es posible concluir que, conforme las dimensiones (expresadas en miles de pies cuadrados) de la casa aumentan, el precio de venta (en miles de dlares) tambin se incrementa? Dimensiones de la casa (miles de Precio de venta pies cuadrados) (miles de dlares) 1.4 1.3 1.2 1.1 1.4 1.0 100 110 105 120 80 105 Dimensiones de la casa (miles de pies cuadrados) 1.3 0.8 1.2 0.9 1.1 1.1

Precio de venta (miles de dlares) 110 85 105 75 70 95

 A continuacin guran las edades que tenan los 43 presidentes de Estados Unidos cuando comenzaron su 23. mandato. Organice los datos en un diagrama de tallo y hojas. Construya, asimismo, un diagrama de puntos. Determine una edad tpica en el momento de iniciar su mandato. 57 49 50 54 65 61 64 47 51 46 57 50 55 60 54 57 48 55 62 58 65 54 43 57 52 42 55 61 56 51 56 54 46 56 61 68 54 55 52 51 49 51 69

24. Consulte el siguiente diagrama:

40

80

120

160

200

a) Cul es el nombre de la grca? b) Cul es la mediana y los valores del primer y tercer cuartiles? c) Es la distribucin positivamente sesgada? Indique cmo lo sabe. d) Hay datos atpicos? Si es el caso, estime los valores. e) Puede determinar el nmero de observaciones en el estudio?

136

Captulo 4

 El ingreso personal per cpita, en miles de dlares, por estado (incluyendo el Distrito de Columbia) es el 25. siguiente: 11.1 18.9 14.4 9.5 17.1 11.1 10.5 17.7 14.3 11.1 13.6 12.2 11.9 13.8 13.2 13.2 11.2 11.9 12.3 11.8 13.2 10.7 14.7 12.7 13.8 13.7 13.5 16.8 11.4 16.6 15.1 12.4 10.7 15.1 15.4 17.5 15.9 12.2 12.8 19.2 12.9 14.1 18.3 13.9 15.4 15.1 13.2 14.7 11.1 14.7 14.5

a) Organice estos datos en una distribucin de frecuencias. b) Cul es un ingreso per cpita tpico para un estado? c) Cunta variacin hay en los datos de los ingresos? d) Es simtrica la distribucin? e) Resuma sus conclusiones.

Casos
A. Century Nacional Bank
El siguiente caso aparecer en las subsecuentes secciones de repaso. Suponga que usted trabaja en el Departamento de Planeacin del Century National Bank y que se presenta con la seora Lamberg. Usted necesita hacer un anlisis de datos y preparar un breve informe escrito. Recuerde que el seor Selig es el presidente del banco, de modo que usted querr asegurarse de que su informe sea completo y exacto. El apndice A.6 contiene una copia de los datos. Century National Bank cuenta con ocinas en diversas ciudades de la regin central y el sureste de Estados Unidos. Al seor Dan Selig, presidente y director ejecutivo, le gustara conocer las caractersticas de sus clientes con cuentas de cheques. Cul es el saldo de un cliente tpico? Cuntos servicios bancarios ms utilizan los clientes con cuentas de cheques? Utilizan los clientes el servicio de cajero automtico y, de ser as, cun a menudo? Qu hay de las tarjetas de dbito? Quin las utiliza y con cunta frecuencia? Para comprender mejor a los clientes, el seor Selig pidi a la seora Wendy Lamberg, directora de planeacin, que seleccionara una muestra de clientes y preparara un informe. Para comenzar, ella ha nombrado un equipo de entre su personal. Usted es el jefe del equipo y el responsable de elaborar el informe. Elige una muestra aleatoria de 60 clientes. Adems del saldo de cada cuenta al nal del mes pasado, usted determina lo siguiente: 1) el nmero de transacciones en cajeros automticos del mes pasado; 2) el nmero de servicios bancarios distintos (cuenta de ahorro, certicados de depsito, etc.) que utiliza el cliente; 3) si el cliente posee una tarjeta de dbito (ste es un servicio bancario relativamente nuevo respecto del cual los cargos se hacen directamente a la cuenta del cliente); 4) si se paga o no inters en la cuenta de cheques. La muestra incluye clientes de las sucursales en Cincinnati, Ohio; Atlanta, Georgia; Louisville, Kentucky, y Erie, Pennsylvania. 1.  Disee una grca o tabla que represente los saldos en las cuentas de cheques. Cul es el saldo de un cliente tpico? Hay clientes con ms de $2 000 en sus cuentas? Parece que existe una diferencia en la distribucin de las cuentas entre las cuatro sucursales? En torno a qu valor tienden a acumularse los saldos? 2.  Determine la media y la mediana de los saldos de las cuentas de cheques. Compare la media y la mediana de los saldos de las cuatro sucursales. Existe alguna diferencia entre las sucursales? Explique en su informe la diferencia entre la media y la mediana. 3.  Determine el rango y la desviacin estndar de los saldos de las cuentas de cheques. Qu muestran el primer y tercer cuartiles? Determine el coeciente de sesgo e indique lo que muestra. Como el seor Selig no maneja estadsticas diariamente, incluya una breve descripcin e interpretacin de la desviacin estndar y de otras medidas.

B.  Wildcat Plumbing Supply, Inc.: hay diferencias de gnero?


Wildcat Plumbing Supply ha dado servicios de plomera en el sur de Arizona por ms de 40 aos. La compaa fue fundada por el seor Terrence St. Julian y actualmente la dirige su hijo Cory. La compaa ha crecido de un puado de empleados a ms de 500 hoy da. Cory est interesado en los diferentes cargos en la compaa en los que tiene trabajando hombres y mujeres que llevan a cabo el mismo trabajo, pero con diferente salario. Para investigar, recoge la informacin que sigue. Suponga que usted es un estudiante que lleva a cabo prcticas en el departamento de contabilidad y que se le ha encomendado la tarea de redactar un informe que resuma la situacin.

Repaso de los captulos 1-4

137
tas que se comunican directamente con una gran cantidad de clientes, como los departamentos de educacin fsica de los principales institutos, universidades y franquicias de artculos deportivos profesionales. Hay 30 agentes de ventas que representan a la compaa ante tiendas de menudeo ubicadas en centros comerciales y grandes almacenes de descuento, como Kmart y Target. Al llegar a las ocinas centrales, el director ejecutivo solicit al gerente de ventas un informe en el que se compararan las comisiones que ganaron el ao pasado las dos secciones del equipo de ventas. Concluira usted que existe alguna diferencia? En el informe incluya informacin sobre la tendencia central, as como sobre la dispersin en los dos grupos.
Comisiones obtenidas por los representantes de ventas que se comunican con los departamentos de deportes ($)
354 87 1 676 1 187 579 69 3 202 680 39 1 683 1 106 434 557 615 4 635 149 392 527 883 3 140 1 168 278 416 299 2 197 175 7 357 526 159 1 105 249

Salario anual (miles de dlares) Menos de 30 30 a 40 40 a 50 50 a 60 60 a 70 70 a 80 80 o ms

Mujeres 2 3 17 17 8 3 0

Hombres 0 1 4 24 21 7 3

Para arrancar el proyecto, el seor Cory St. Julian organiz una junta con su personal, a la cual usted fue invitado. En esta junta se sugiri que usted calculara diversas medidas de ubicacin, que trazara diagramas, como una distribucin de frecuencias acumulativas y que determinara los cuartiles tanto para hombres como para mujeres. Elabore los diagramas y redacte el informe en el que resume los salarios anuales de los empleados de Wildcat Plumbing Supply. Parece que hay diferencias de pago a partir del gnero?

252 1 602 2 321

427 1 738

13 1 604

C.  Kimble Products: hay alguna diferencia en el pago de comisiones?


En la junta nacional de ventas de enero, al director ejecutivo de Kimble Products se le cuestion sobre la poltica de la compaa en lo que se reere al pago de comisiones a sus representantes de ventas. La compaa vende artculos deportivos en dos mercados importantes. Hay 40 representantes de ven-

Comisiones obtenidas por los representantes de ventas que se comunican con tiendas de menudeo grandes ($)
1 116 681 1 294 719 12 754 1 206 1 448 899 870 944 1 255 850 886 1 556 918 1 213 1 291 934 1 313 1 083

886 1 315 1 858 1 262 1 338 1 066

807 1 244 758

5
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Definir el trmino probabilidad. 2. Describir los enfoques clsico, emprico y subjetivo de la probabilidad. 3. Explicar los trminos experimento, evento, resultado, permutaciones y combinaciones. 4. Definir los trminos probabilidad condicional y probabilidad conjunta. 5. Calcular probabilidades utilizando las reglas de la adicin y las reglas de la multiplicacin. 6. Aplicar un diagrama de rbol para organizar y calcular probabilidades. 7. Calcular una probabilidad utilizando el teorema de Bayes.

Estudio de los conceptos de la probabilidad

En el Willowbrook Farm Development viven 20 familias. De stas, 10 elaboran su declaracin del impuesto sobre la renta del ao pasado, 7 encargan la elaboracin de su declaracin a un profesionista de la localidad y a los 3 restantes se las prepara H&R Block. Cul es la probabilidad de seleccionar una familia que elabora su propia declaracin de impuestos? (Ejercicio 64a y objetivo 5.)

Estudio de los conceptos de la probabilidad

139

Introduccin
Los captulos 2, 3 y 4 se enfocan en la estadstica descriptiva. En el captulo 2 se organizaron los precios de 80 vehculos vendidos el mes pasado en el local de AutoUSA de Whitner Autoplex en una distribucin de frecuencias. Esta distribucin de frecuencias muestra los precios de venta ms bajo y ms alto y el punto donde la concentracin de datos se presenta. En el captulo 3, mediante medidas numricas de ubicacin y dispersin, se ubic un precio de venta tpico y analiz la dispersin de los datos. Se describi la dispersin en los precios de venta con medidas de dispersin como el rango y la desviacin estndar. En el captulo 4 se disearon diagramas y grcas, tales como el diagrama de dispersin, con el n de describir ms a fondo los datos de manera grca. A la estadstica descriptiva le concierne el resumen de datos recogidos de eventos pasados. Por ejemplo, los precios de venta de vehculos el mes pasado en Whitner Autoplex. Ahora se presenta la segunda faceta de la estadstica, a saber, el clculo de la probabilidad de que algo ocurra en el futuro. Esta faceta de la estadstica recibe el nombre de inferencia estadstica o estadstica inferencial. Quien toma decisiones, pocas veces cuenta con la informacin completa para hacerlo. Por ejemplo:  Toys and Things, un fabricante de juguetes y rompecabezas, recin cre un nuevo juego basado en una trivia deportiva. Pretende saber si los fanticos del deporte comprarn el juego. Slam Dunk y Home Run son dos de los nombres que se consideran. Una forma de reducir al mnimo el riesgo de tomar una decisin incorrecta consiste en contratar a una empresa de investigacin de mercado para que tome una muestra de, por ejemplo, 2 000 consumidores de la poblacin y pregunte a cada entrevistado su opinin del nuevo juego y los nombres que propone. De acuerdo con los resultados de la muestra, la compaa calcular la proporcin de la poblacin que comprar el juego.  El departamento de control de calidad de la fundidora Bethlehem Steel debe asegurar a la gerencia que el cable de un cuarto de pulgada que se fabrica tiene una fuerza de tensin aceptable. Es obvio que no todo el cable que se fabrica es probado en cuanto a la fuerza de tensin, ya que la prueba requiere que el cable se tense hasta que se rompa, lo destruye. De modo que se selecciona una muestra de 10 piezas y se prueban. A partir de los resultados de la prueba, todo el cable que se fabrica se calica de aceptable o inaceptable.  Otras preguntas que implican incertidumbre son: debe suspenderse de inmediato la telenovela Days of Our Lives? Ser redituable un nuevo cereal con sabor a menta si se comercializa? Charles Linden, auditor del condado en Batavia County, ser elegido? La inferencia estadstica tiene que ver con las conclusiones relacionadas con una poblacin sobre la base de una muestra tomada de dicha poblacin. (Las poblaciones de los ejemplos anteriores son: todos los consumidores acionados a las trivias deportivas; todos los cables de acero de un cuarto de pulgada fabricados; todos los televidentes que ven telenovelas; toda la gente que compra cereal para el desayuno, etctera.) Dada la incertidumbre existente en la toma de decisiones, es importante que se evalen cientcamente todos los riesgos implicados. La teora de la probabilidad, a menudo conocida como la ciencia de la incertidumbre, resulta til en esta evaluacin. La aplicacin de la teora de la probabilidad permite a quien toma decisiones y posee informacin limitada analizar los riesgos y reducir al mnimo el peligro que existe, por ejemplo, al lanzar al mercado un nuevo producto o aceptar un envo que quiz contenga partes defectuosas. Puesto que los conceptos de la probabilidad son importantes en el campo de la inferencia estadstica (lo cual se analiza en el captulo 8), en este captulo se introduce el lenguaje bsico de la probabilidad, incluyendo trminos como experimento, evento, probabilidad subjetiva y reglas de la adicin y de la multiplicacin.

140

Captulo 5

Qu es la probabilidad?
Sin duda usted se encuentra familiarizado con trminos como probabilidad, azar y posibilidad. Con frecuencia se les emplea de manera indistinta. El meteorlogo anuncia que hay 70% de probabilidad de lluvia para el domingo del Sper Tazn. Con base en una encuesta de consumidores que degustaron un pepinillo recin elaborado con sabor a pltano, la probabilidad de que sea un xito nanciero si se le comercializa es de 0.03. (Esto signica que la probabilidad de que el pepinillo sabor a pltano sea aceptado por el pblico es muy remota.) Qu es la probabilidad? En general es un nmero que describe la posibilidad de que algo suceda. PROBABILIDAD Valor entre cero y uno, inclusive, que describe la posibilidad relativa (oportunidad o casualidad) de que ocurra un evento. Es comn que una probabilidad sea expresada en forma decimal, como 0.70, 0.27 o 0.50. No obstante, tambin se da en forma de fraccin, como 7/10, 27/100 o 1/2. Se puede suponer cualquier nmero de 0 a 1, inclusive. Si una compaa slo tiene cinco regiones de ventas, y el nombre o nmero de cada regin se escribe en un trozo de papel, que se coloca en un sombrero, la probabilidad de seleccionar una de las cinco regiones es de 1. La probabilidad de sacar del sombrero un trozo de papel rotulado con Pittsburgh Steelers es 0. Por consiguiente, la probabilidad de 1 representa algo que seguramente suceder, y la probabilidad de 0 representa algo que no suceder. Cuanto ms prxima se encuentre una probabilidad a 0, ms improbable es que el evento suceda. Cuanto ms prxima se encuentre la probabilidad a 1, ms seguro es que suceda. El siguiente diagrama muestra la relacin e incluye algunas conjeturas personales. Sin embargo, usted podra seleccionar una probabilidad distinta de que Slo Poke gane el Derby de Kentucky o de que se incrementen los impuestos federales.

No suceder 0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80

Con seguridad suceder 0.90 1.00

Probabilidad de que nuestro Sol desaparezca este ao

Posibilidades que tiene Slo Poke de ganar el Derby de Kentucky

Posibilidades Posibilidad de que caiga de que se cara en un solo incrementen lanzamiento los impuestos de moneda federales

Posibilidad de que llueva en Florida este ao

En el estudio de la probabilidad se utilizan tres palabras clave: experimento, resultado y evento. Dichos trminos son empleados en el lenguaje de la vida cotidiana, pero en estadstica adquieren signicados especcos. EXPERIMENTO Proceso que induce a que ocurra una y slo una de varias posibles observaciones. Esta denicin es ms general que la empleada en las ciencias fsicas, en las que es imaginable a alguien que manipula tubos de ensayo o microscopios. Respecto de la probabilidad, un experimento tiene dos o ms posibles resultados y no se sabe cul ocurrir. RESULTADO Un resultado particular de un experimento.

Estudio de los conceptos de la probabilidad

141

Por ejemplo, el lanzamiento de una moneda constituye un experimento. Usted puede observar el lanzamiento de una moneda, pero no est seguro si caern caras o cruces. De manera similar, preguntar a 500 estudiantes universitarios si compraran un nuevo sistema de cmputo Dell a cierto precio, constituye un experimento. Si se lanza una moneda, un resultado particular es cara. El otro posible resultado es cruz. En el experimento de la compra de la computadora, un posible resultado es que a 273 estudiantes indiquen que les gustara comprar la computadora. Otro es que 317 estudiantes la compren. Todava hay otro resultado, que 432 estudiantes indiquen que la compraran. Cuando se observan uno o ms resultados en los experimentos, constituyen un evento. EVENTO Conjunto de uno o ms resultados de un experimento. En la siguiente gura se presentan ejemplos para aclarar las deniciones de los trminos experimento, resultado y evento. En el caso del experimento del lanzamiento de un dado, hay seis posibles resultados, pero existen varios posibles eventos. Cuando se cuenta el nmero de miembros de la junta directiva de las compaas Fortune 500 que tienen ms de 60 aos de edad, el nmero posible de resultados vara de cero al total de miembros. Hay un nmero an mayor de eventos posibles en este experimento.

Experimento

Lanzamiento de un dado

Listado del nmero de miembros de la junta directiva de las compaas Fortune 500, mayores de 60 aos Ninguno tiene ms de 60 Uno tiene ms de 60 Dos tienen ms de 60 ... 29 tienen ms de 60 ... ... 48 tienen ms de 60 ...

Todos los posibles resultados

Se observa un 1 Se observa un 2 Se observa un 3 Se observa un 4 Se observa un 5 Se observa un 6

Algunos posibles eventos

Se observa un nmero par Se observa un nmero mayor que 4 Se observa un 3 o un nmero menor

Ms de 13 tienen ms de 60 Menos de 20 tienen ms de 60

Autoevaluacin 5.1

Video Games, Inc. recin cre un nuevo videojuego. Ochenta jugadores veteranos van a probar su facilidad de operabilidad. a) En qu consiste el experimento? b) Cul es uno de los posibles resultados? c)  Suponga que 65 jugadores intentaron jugar el nuevo juego y dicen que les gust. Es 65 una probabilidad? d)  La probabilidad de que el nuevo juego sea un xito es de 1.0. Haga comentarios al respecto. e) Especifique un posible evento.

142

Captulo 5

Enfoques para asignar probabilidades


Conviene analizar dos perspectivas para asignar probabilidades: los enfoques objetivo y subjetivo. La probabilidad objetiva se subdivide en a) probabilidad clsica y b) probabilidad emprica.

Probabilidad clsica
La probabilidad clsica parte del supuesto de que los resultados de un experimento son igualmente posibles. De acuerdo con el punto de vista clsico, la probabilidad de un evento que se est llevando a cabo se calcula dividiendo el nmero de resultados favorables entre el nmero de posibles resultados: Probabilidad de Nmero de resultados favorables = PROBABILIDAD CLSICA [5.1] Nmero total l de posibles resultados un evento

Ejemplo Solucin

Considere el experimento de lanzar un dado. Cul es la probabilidad del evento cae un nmero par de puntos? Los posibles resultados son:

Un punto Dos puntos Tres puntos

Cuatro puntos Cinco puntos Seis puntos

Hay tres resultados favorables (un dos, un cuatro y un seis) en el conjunto de seis resultados igualmente posibles. Por consiguiente, Probabilidad de un nmero par = Nmero de resultados favorables 3 = ibles resultados 6 Nmero total de posi = 0.5

El concepto de conjuntos mutuamente excluyentes se present en el estudio de las distribuciones de frecuencias en el captulo 2. Recordemos que creamos clases de tal manera que un evento particular se incluyera en una sola de las clases y que no hubiera superposicin entre clases. Por tanto, slo uno de varios eventos puede presentarse en cierto momento. Mutuamente excluYente El hecho de que un evento se presente significa que ninguno de los dems eventos puede ocurrir al mismo tiempo. La variable gnero da origen a resultados mutuamente excluyentes: hombre y mujer. Un empleado seleccionado al azar es hombre o mujer, pero no puede tener ambos gneros. Una pieza fabricada es aceptable o no lo es. La pieza no puede ser aceptable e inaceptable al mismo tiempo. En una muestra de piezas fabricadas, el evento de seleccionar una pieza no aceptable y el evento de seleccionar una pieza aceptable son mutuamente excluyentes.

Estudio de los conceptos de la probabilidad

143

Si un experimento incluye un conjunto de eventos con todo tipo de resultados posible, como los eventos un nmero par y un nmero impar en el experimento del lanzamiento del dado, entonces el conjunto de eventos es colectivamente exhaustivo. En el experimento del lanzamiento del dado, cada resultado ser o par o impar. Por consiguiente, el conjunto es colectivamente exhaustivo. COLECTIVAMENTE EXHAUSTIVO Por lo menos uno de los eventos debe ocurrir cuando se lleva a cabo un experimento.
Suma de probabilidades = 1

Si el conjunto de eventos es colectivamente exhaustivo y los eventos son mutuamente excluyentes, la suma de las probabilidades es 1. En trminos histricos, el enfoque clsico de la probabilidad fue creado y aplicado en los siglos XVII y XVIII a los juegos de azar, como las cartas y los dados. Resulta innecesario llevar a cabo un experimento para determinar la probabilidad de un evento utilizando el enfoque clsico, ya que el nmero total de resultados se sabe antes de realizar el experimento. Lanzar una moneda tiene dos posibles resultados; el arrojar un dado tiene seis posibles resultados. Por lgica, es posible determinar la probabilidad de sacar una cruz al lanzar una moneda o tres caras al lanzar tres monedas. El enfoque clsico de la probabilidad tambin puede aplicarse a la lotera. En Carolina del Sur, uno de los juegos de la Lotera Educativa es Pick 3. Para concursar, una persona compra un billete de lotera y selecciona tres nmeros entre 0 y 9. Una vez a la semana, tres nmeros son seleccionados en forma aleatoria de una mquina que gira tres contenedores, cada uno de los cuales contiene bolas numeradas de 0 a 9. Una forma de ganar consiste en atinar los nmeros, as como el orden de stos. Dado que hay 1 000 posibles resultados (000 a 999), la probabilidad de ganar con un nmero de tres dgitos es de 0.001, o 1 en 1 000.

Probabilidad emprica
La probabilidad emprica o frecuencia relativa es el segundo tipo de probabilidad. sta se basa en el nmero de veces que ocurre el evento como proporcin del nmero de intentos conocidos. PROBABILIDAD EMPRICA La probabilidad de que un evento ocurra representa una fraccin de los eventos similares que sucedieron en el pasado. En trminos de una frmula: Probabilidad emprica = Nmero de veces que el evento ocurre Nmero total de observacione es

El enfoque emprico de la probabilidad se basa en la llamada ley de los grandes nmeros. La clave para determinar probabilidades de forma emprica consiste en que una mayor cantidad de observaciones proporcionarn un clculo ms preciso de la probabilidad. LEY DE LOS GRANDES NMEROS En una gran cantidad de intentos, la probabilidad emprica de un evento se aproximar a su probabilidad real. Para explicar la ley de los grandes nmeros, supongamos que lanzamos una moneda comn. El resultado de cada lanzamiento es cara o cruz. Si lanza la moneda una sola vez, la probabilidad emprica de las caras es cero o uno. Si lanzamos la moneda una gran cantidad de veces, la probabilidad del resultado de las caras se aproximar a 0.5. La siguiente tabla muestra los resultados de un experimento en el que se lanza una moneda 1, 10, 50, 100, 500, 1 000 y 10 000 veces y, enseguida, se calcula la frecuencia relativa de las caras. Note que conforme incrementamos el nmero de intentos, la probabilidad emprica de que salga una cara se aproxima a 0.5, que es su valor de acuerdo con el enfoque clsico de la probabilidad.

144

Captulo 5

Nmero de ensayos 1 10 50 100 500 1 000 10 000

Nmero de caras 0 3 26 52 236 494 5 027

Frecuencia relativa de las caras .00 .30 .52 .52 .472 .494 .5027

Qu ha demostrado? A partir de la denicin clsica de probabilidad, la posibilidad de obtener una cara en un solo lanzamiento de una moneda comn es de 0.5. Desde el enfoque emprico de la frecuencia relativa de la probabilidad, la probabilidad del evento se aproxima al mismo valor determinado de acuerdo con la denicin clsica de probabilidad. Este razonamiento permite emplear el enfoque emprico y de la frecuencia relativa para determinar una probabilidad. He aqu algunos ejemplos.  El semestre anterior 80 estudiantes se registraron para Estadstica administrativa 101 en la Scandia University. Doce estudiantes obtuvieron A. Con base en dicha informacin y de acuerdo con la regla emprica de la probabilidad, la posibilidad calculada de que un estudiante obtenga una A es de 0.15.  Shaquille ONeal, jugador de Miami Heat, hizo 353 de 765 intentos de tiro libre durante la temporada 2004-2005 de la NBA. De acuerdo con la regla emprica de la probabilidad, las posibilidades de que haga su siguiente intento de tiro son de 0.461. Reggie Millar, de Indiana Pacers, hizo 250 de 268 intentos. Calculamos que la probabilidad de que haga su prximo tiro libre es de 0.933. Las compaas de seguros de vida confan en datos similares a los anteriores para determinar la aceptabilidad de un solicitante, as como la prima que se le va a cobrar. Las tablas de mortalidad incluyen una lista de las posibilidades de que una persona de determinada edad fallezca el siguiente un ao. Por ejemplo, la probabilidad de que una mujer de 20 aos de edad fallezca el siguiente ao es del 0.0015. El concepto emprico se ilustra con el siguiente ejemplo.

Ejemplo Solucin

El 1 de febrero de 2003, el transbordador espacial Columbia explot. ste fue el segundo desastre en 113 misiones espaciales de la NASA. Con base en esta informacin, cul es la probabilidad de que una futura misin concluya con xito? Para simplicar, utilice letras o nmeros. P representa a la probabilidad y, en este caso, P(A) representa la probabilidad de que una futura misin concluya con xito. Probabilidad de un vuelo exitoso = Nmero de vuelos exitosos Nmero total de vuelos 111 P (A) = = .98 113

Este resultado sirve como aproximacin de la probabilidad. En otras palabras, por experiencia, la probabilidad de que una futura misin del transbordador espacial concluya con xito es de 0.98.

Probabilidad subjetiva
Si se cuenta con poca o ninguna experiencia o informacin con la cual sustentar la probabilidad, es posible aproximarla en forma subjetiva. En esencia, esto signica que un individuo evala las opiniones e informacin disponibles y enseguida calcula o asigna la probabilidad. Esta probabilidad se denomina adecuadamente probabilidad subjetiva. CONCEPTO SUBJETIVO DE PROBABILIDAD Posibilidad (probabilidad) de un evento en particular que asigna un individuo a partir de cualquier informacin que encuentre disponible.

Estudio de los conceptos de la probabilidad

145

Algunos ejemplos de probabilidad subjetiva son los siguientes: 1. C  alcular la posibilidad de que los Patriotas de Nueva Inglaterra jueguen en el Sper Tazn el ao que viene. 2. Calcular la posibilidad de que usted contraiga matrimonio antes de los 30 aos. Calcular la posibilidad de que el dcit presupuestario de Estados Unidos se reduz3.  ca a la mitad en los siguientes 10 aos. En la grca 5.1 se resumen los diferentes tipos de probabilidad. Un enunciado probabilstico siempre asigna una posibilidad a un evento que no ha ocurrido an. Por supuesto, hay un amplio grado de incertidumbre en este tipo de probabilidad, la cual se basa, principalmente, en el conocimiento que posee el individuo del proceso que estudia. Dado el amplio conocimiento que el individuo tiene acerca del lanzamiento de dados, puede establecer que la probabilidad de que aparezca un punto en el lanzamiento de un dado no cargado es de un sexto. Sin embargo, es escasa la experiencia respecto de la aceptacin del mercado de un nuevo producto que no ha sido probado. Por ejemplo, aun cuando la directora de investigacin de mercado prueba un producto recin creado en 40 tiendas minoristas y establece que existe 70% de posibilidades de que el producto genere ventas por ms de un milln de unidades, posee un conocimiento limitado de cmo reaccionarn los consumidores cuando se comercialice en todo el pas. En ambos casos (el de la persona que lanza un dado y en el que se prueba un nuevo producto), el individuo asigna un valor probabilstico a un evento de inters, y slo existe una diferencia, la conanza del pronosticador en la precisin de la aproximacin. No obstante, prescindiendo del punto de vista, se aplicarn las mismas leyes de la probabilidad (que se exponen en las siguientes secciones).

Enfoques de la probabilidad

Objetivo

Subjetivo

Probabilidad clsica

Probabilidad emprica

Parte de informacin disponible

Se basa en resultados igualmente probables

Se sustenta en las frecuencias relativas

GRFICA 5.1 Resumen de enfoques de la probabilidad

Autoevaluacin 5.2

1.  Se selecciona al azar una carta de una baraja convencional de 52 cartas. Cul es la probabilidad de que la carta resulte reina? Qu enfoque de la probabilidad emple para responder la pregunta? 2.  El Center for Child Care publica informacin sobre 539 nios, as como el estado civil de sus padres. Hay 333 casados, 182 divorciados y 24 viudos. Cul es la probabilidad de que un nio elegido al azar tenga un padre divorciado? Qu enfoque utiliz? 3.  Cul es la probabilidad de que el ndice Industrial Dow Jones sea mayor que 12 000 durante los prximos 12 meses? Qu enfoque de la probabilidad utiliz para responder la pregunta?

146

Captulo 5

Ejercicios
1.  Hay personas que apoyan la reduccin de los impuestos federales con el n de incrementar los gastos del consumidor, aunque otros estn en contra. Se seleccionan dos personas y se registran sus opiniones. Si ninguna est indecisa, elabore una lista de los posibles resultados.  Un inspector de control de calidad selecciona una pieza para probarla. Enseguida, la pieza 2. se declara aceptable, reparable o chatarra. Entonces se prueba otra pieza. Elabore una lista de los posibles resultados de este experimento relacionado con dos piezas.  Una encuesta de 34 estudiantes en la Wall College of Business mostr que stos tienen las 3. siguientes especialidades: Contabilidad Finanzas Economa Administracin Marketing  4. 10 5 3 6 10

Suponga que elige a un estudiante y observa su especialidad. a) Cul es la probabilidad de que el estudiante tenga una especialidad en administracin? b) Qu concepto de probabilidad utiliz para hacer este clculo? Una compaa grande que debe contratar un nuevo presidente, prepara una lista nal de cinco candidatos, todos los cuales tienen las mismas cualidades. Dos de los candidatos son miembros de un grupo minoritario. Para evitar que el prejuicio inuya al momento de elegir al candidato, la compaa decide elegir al presidente por sorteo. a)  Cul es la probabilidad de que uno de los candidatos que pertenece a un grupo minoritario sea contratado? b) Qu concepto de probabilidad utiliz para hacer este clculo?  En cada uno de los siguientes casos, indique si se utiliz la probabilidad clsica, emprica o 5. subjetiva. a)  Un jugador de bisbol consigue 30 hits en 100 turnos al bate. La probabilidad de que consiga un hit en su siguiente turno al bate es de 0.3. b)  Un comit de estudiantes con siete miembros se forma para estudiar problemas ambientales. Cul es la probabilidad de que cualquiera de los siete sea elegido vocero del equipo? c)  Usted compra uno de 5 millones de boletos vendidos por el Lotto Canada. Cules son las posibilidades de que gane un milln de dlares? d)  La probabilidad de un terremoto al norte de California en los prximos 10 aos es de 0.80. 6. Una empresa promover a dos empleados de un grupo de seis hombres y tres mujeres. a)  Elabore una lista de los resultados de este experimento, si existe un inters particular con la igualdad de gnero. b) Qu concepto de probabilidad utilizara para calcular estas probabilidades?  Una muestra de 40 ejecutivos de la industria del petrleo se eligi para someter a prueba un 7. cuestionario. Una pregunta relacionada con cuestiones ambientales requera un s o un no. a) En qu consiste el experimento? b) Indique un posible evento. c)  Diez de los 40 ejecutivos respondieron que s. Con base en estas respuestas de la muestra, cul es la probabilidad de que un ejecutivo de la industria del petrleo responda que s? d) Qu concepto de probabilidad se ilustra? e) Los posibles resultados tienen la misma probabilidad y son mutuamente excluyentes?  Una muestra de 2 000 conductores con licencia revel la siguiente cantidad de violaciones al 8. lmite de velocidad. Cantidad de violaciones 0 1 2 3 4 5 o ms Total a) En qu consiste el experimento? b) Indique un posible evento. Cantidad de conductores 1 910 46 18 12 9 5 2 000

Estudio de los conceptos de la probabilidad

147

c)  Cul es la probabilidad de que un conductor haya cometido dos violaciones al lmite de velocidad? d) Qu concepto de probabilidad se ilustra?  9. Los clientes del Bank of America seleccionan su propio nmero de identicacin personal de tres dgitos (NIP), para emplearlo en los cajeros automticos. a) Considere esto un experimento y haga una lista de cuatro posibles resultados. b)  Cul es la probabilidad de que el seor Jones y la seora Smith seleccionen el mismo NIP? c) Qu concepto de probabilidad utiliz en la respuesta b? 10. Un inversionista compra 100 acciones de AT&T y registra los cambios de precio diariamente. a) Elabore una lista de los posibles eventos para este experimento. b) Calcule la probabilidad de cada evento descrito en el inciso a. c) Qu concepto de probabilidad utiliz en b?

Algunas reglas para calcular probabilidades


Ahora, una vez denida la probabilidad y descrito sus diferentes enfoques, cabe atender al clculo de la probabilidad de dos o ms eventos aplicando las reglas de la adicin y la multiplicacin.

Reglas de la adicin
Existen dos reglas de la adicin, la regla especial de la adicin y la regla general de la adicin. Primero la regla especial de la adicin.
Los eventos mutuamente excluyentes no pueden ocurrir al mismo tiempo.

Regla especial de la adicin Para aplicar la regla especial de la adicin, los eventos deben ser mutuamente excluyentes. Recuerde que mutuamente excluyentes signica que cuando un evento ocurre, ninguno de los dems eventos puede ocurrir al mismo tiempo. Un ejemplo de eventos mutuamente excluyentes en el experimento del lanzamiento del dado son los eventos un nmero 4 o mayor y un nmero 2 o menor. Si el resultado se encuentra en el primer grupo {4, 5 y 6}, entonces no puede estar en el segundo grupo {1 y 2}. Otro ejemplo consiste en que un producto proveniente de la lnea de montaje no puede estar defectuoso y en buen estado al mismo tiempo. Si dos eventos A y B son mutuamente excluyentes, la regla especial de la adicin establece que la probabilidad de que ocurra uno u otro es igual a la suma de sus probabilidades. Esta regla se expresa mediante la siguiente frmula:
REGLA ESPECIAL DE LA ADICIN P (A o B) = P (A) + P (B) [5.2]

En el caso de los tres eventos mutuamente excluyentes designados A, B y C, la regla se expresa de la siguiente manera: P (A o B o C) = P (A) + P (B) + P (C) Un ejemplo ayudar a entender los detalles.

Ejemplo

Una mquina automtica Shaw llena bolsas de plstico con una combinacin de frijoles, brcoli y otras verduras. La mayora de las bolsas contienen el peso correcto, aunque, como consecuencia de la variacin del tamao del frijol y de otras verduras, un paquete podra pesar menos o ms. Una revisin de 4 000 paquetes que se llenaron el mes pasado arroj los siguientes datos:
Peso Evento Menos peso Peso satisfactorio Ms peso A B C Nmero de Probabilidad de paquetes que ocurra el evento 100 .025 3 600 .900 300 .075 4 000 1.000 100 4 000

148

Captulo 5

Cul es la probabilidad de que un paquete en particular pese menos o pese ms?

Solucin

El resultado pesa menos es el evento A. El resultado pesa ms es el evento C. Al aplicar la regla especial de la adicin se tiene: P (A o C) = P (A) + P (C) = .025 + .075 = .10 Note que los eventos son mutuamente excluyentes, lo cual signica que un paquete de verduras mixtas no puede pesar menos, tener el peso satisfactorio y pesar ms al mismo tiempo. stos tambin son colectivamente exhaustivos; es decir, que un paquete seleccionado debe pesar menos, tener un peso satisfactorio o pesar ms.

Un diagrama de Venn es una herramienta til para representar las reglas de adicin o multiplicacin.

El lgico ingls J. Venn (1834-1923) cre un diagrama para observar una representacin grca del resultado de un experimento. El concepto de eventos mutuamente excluyentes, as como de otras reglas para combinar probabilidades, se ilustra mediante este dispositivo. Para construir un diagrama de Venn, primero se encierra un espacio, el cual representa el total de posibles resultados. Este espacio es de forma rectangular. As, un evento se representa por medio de un rea circular, que se dibuja dentro del rectngulo, la cual corresponde a la probabilidad del evento. El siguiente diagrama de Venn ilustra el concepto de eventos mutuamente excluyentes. Los eventos no se superponen, lo cual signica que los eventos son mutuamente excluyentes. En el siguiente diagrama suponga que los eventos A, B y C son igualmente probables.

Evento A

Evento B

Evento C

Regla del complemento La probabilidad de que una bolsa de verduras mixtas seleccionadas pese menos, P(A), ms la probabilidad de que no sea una bolsa con menos peso, P (~A), que se lee no A, deber ser por lgica igual a 1. Esto se escribe:
P (A) + P (~A) = 1 Esto puede reformularse: REGLA DEL COMPLEMENTO P (A) = 1 P (~A) [5.3]

Tal es la regla del complemento. Se emplea para determinar la probabilidad de que un evento ocurra restando de 1 la probabilidad de un evento que no ha ocurrido. Esta regla es til porque a veces es ms fcil calcular la probabilidad de que un evento suceda determinando la probabilidad de que no suceda y restando el resultado de 1. Note que los eventos A y ~A son mutuamente excluyentes y colectivamente exhaustivos. Por consiguiente, las probabilidades de A y ~A suman 1. Un diagrama de Venn ilustra la regla del complemento de la siguiente manera:

Evento A
A

Estudio de los conceptos de la probabilidad

149

Ejemplo Solucin

Recuerde que la probabilidad de que una bolsa de verduras mixtas pese menos es de 0.025 y la probabilidad de que una bolsa pese ms es de 0.075. Aplique la regla del complemento para demostrar que la probabilidad de una bolsa con un peso satisfactorio es de 0.900. Muestre la solucin en un diagrama de Venn. La probabilidad de que la bolsa no tenga un peso satisfactorio es igual a la probabilidad de que la bolsa tenga mayor peso ms la probabilidad de que la bolsa pese menos. Es decir, que P(A o C) = P(A) + P(C) = .025 + .075 = .100. La bolsa tiene un peso satisfactorio si no tiene menos peso ni ms peso; as que P(B) = 1 [P(A) + P(C)] = 1 [.025 + .075] = 0.900. El diagrama de Venn que representa este caso es el siguiente:

A 0.025 C 0.075 no A o C 0.90

Autoevaluacin 5.3

Una muestra de empleados de Worldwide Enterprises se va a encuestar en cuanto a un nuevo plan de cuidado de la salud. Los empleados se clasifican de la siguiente manera:

Clasificacin Supervisores Mantenimiento Produccin Administracin Secretarias

Evento A B C D E

Nmero de empleados 120 50 1 460 302 68

a) Cul es la probabilidad de que la primera persona elegida sea: i) de mantenimiento o secretaria? ii) que no sea de mantenimiento? b) Dibuje un diagrama de Venn que ilustre sus respuestas del inciso a). c)  Los eventos del inciso a) i) son complementarios, mutuamente excluyentes o ambos?

Regla general de la adicin

Los resultados de un experimento pueden no ser mutuamente excluyentes. Como ilustracin, supongamos que Florida Tourist Commission seleccion una muestra de 200 turistas que visitaron el estado durante el ao. La encuesta revel que 120 turistas fueron a Disney World y 100 a Busch Gardens, cerca de Tampa. Cul es la probabilidad de que una persona seleccionada haya visitado Disney World o Busch Gardens? Si se emplea la regla especial de la adicin, la probabilidad de seleccionar un turista que haya ido a Disney World es de 0.60, que se determina mediante la divisin 120/200. De manera similar, la probabilidad de que un turista vaya a Busch Gardens es de 0.50. La suma de estas probabilidades es de 1.10. Sin embargo, sabemos que esta probabilidad no puede ser mayor que 1. La explicacin es que muchos turistas visitaron ambas atracciones tursticas y se les est contando dos veces. Una revisin de las respuestas de la encuesta revel que 60 de los 200 encuestados visit, en realidad, ambas atracciones tursticas. Para responder la pregunta, cul es la probabilidad de elegir a una persona que haya visitado Disney World o Busch Gardens?, 1) sume la probabilidad de que un turista

150

Captulo 5

Estadstica en accin

Si usted desea llamar la atencin en la siguiente reunin a la que asista, diga que usted cree que por lo menos dos personas presentes nacieron en la misma fecha; es decir, el mismo da, pero no necesariamente el mismo ao. Si hay 30 personas en la sala, la probabilidad de que las fechas se dupliquen es de 0.706. Si hay 60 personas en la sala, la probabilidad de que por lo menos dos personas compartan la misma fecha de cumpleaos es de 0.994. Si slo hay 23 personas, las probabilidades son iguales, es decir, 0.50, de que por lo menos dos personas cumplan aos la misma fecha. Sugerencia: para calcularlo, determine la probabilidad de que todos hayan nacido en distintos das y aplique la regla del complemento.

haya visitado Disney World y la probabilidad de que l o ella haya visitado Busch Gardens y 2) reste la probabilidad de visitar ambas atracciones tursticas. Por consiguiente: P(Disney o Busch) = P(Disney) + P(Busch) P(tanto Disney como Busch) = 0.60 + 0.50 0.30 = 0.80 Cuando dos eventos ocurren al mismo tiempo, la probabilidad se denomina probabilidad conjunta. La probabilidad de que un turista visite ambas atracciones tursticas (0.30) es un ejemplo de probabilidad conjunta. El siguiente diagrama de Venn muestra dos eventos que no son mutuamente excluyentes. Ambos se superponen para ilustrar el evento conjunto de que algunas personas hayan visitado ambas atracciones.

P(Disney) = 0.60

P(Busch) = 0.50

P(Disney y Busch) = 0.30

PROBABILIDAD CONJUNTA Probabilidad que mide la posibilidad de que dos o ms eventos sucedan simultneamente. Esta regla para dos eventos designados A y B se escribe:

REGLA GENERAL DE LA ADICIN

P (A o B) = P (A) + P (B) P (A y B)

[5.4]

Estudio de los conceptos de la probabilidad

151

En el caso de la expresin P(A o B), la palabra o sugiere que puede ocurrir A o puede ocurrir B. Esto tambin incluye la posibilidad de que A y B ocurran. Tal uso de o a veces se denomina inclusivo. Tambin es posible escribir P(A o B o ambos) para hacer hincapi en el hecho de que la unin de dos eventos incluye la interseccin de A y B. Si comparamos las reglas general y especial de la adicin, la diferencia que importa consiste en determinar si los eventos son mutuamente excluyentes. Si los eventos son mutuamente excluyentes, entonces la probabilidad conjunta P(A y B) es 0 y podramos aplicar la regla especial de la adicin. De lo contrario, debemos tomar en cuenta la probabilidad conjunta y aplicar la regla general de la adicin.

Ejemplo Solucin

Cul es la probabilidad de que una carta, escogida al azar, de una baraja convencional sea rey o corazn? Quiz se sienta tentado a sumar la probabilidad de sacar un rey y la probabilidad de sacar un corazn. Sin embargo, esto crea problemas. Al hacerlo as, cuenta al rey de corazones con los reyes y lo mismo sucede con los corazones. De esta manera, si suma la probabilidad de sacar un rey (hay 4 en una baraja de 52 cartas) a la probabilidad de sacar un corazn (hay 13 en una baraja de 52 cartas) 17 de 52 cartas cumplen con el requisito, pero, ha contado dos veces el rey de corazones. Necesita restar una carta de las 17, de tal manera que el rey de corazones slo se cuente una vez. Por tanto, hay 16 cartas que son corazones o reyes. As que la probabilidad es de 16/52 = 0.3077.

Carta Rey Corazn Rey de corazones

Probabilidad P ( A ) = 4/52 P ( B ) = 13/52 P ( A y B ) = 1/52

Explicacin 4 reyes en una baraja de 52 cartas 13 corazones en una baraja de 52 cartas 1 rey de corazones en una baraja de 52 cartas

De acuerdo con la frmula (5.4): P (A o B ) = P (A) + P (B ) P (A y B ) = 4/52 + 13/52 1/52 = 16/52 o 0.3077 Un diagrama de Venn representa estos resultados, que no son mutuamente excluyentes.

Corazones Reyes A A
y

Ambos

152

Captulo 5

Autoevaluacin 5.4

Cada ao se llevan a cabo exmenes fsicos de rutina como parte de un programa de servicios de salud para los empleados de General Concrete, Inc. Se descubri que 8% de los empleados requieren calzado ortopdico; 15% requieren tratamiento dental mayor y 3% requieren tanto zapatos ortopdicos como tratamiento dental mayor. a)  Cul es la probabilidad de que un empleado elegido de forma aleatoria requiera zapatos ortopdicos o tratamiento dental mayor? b) Muestre esta situacin en forma de diagrama de Venn.

Ejercicios
11.  os eventos A y B son mutuamente excluyentes. Suponga que P(A) = 0.30 y P(B) = 0.20. Cul L es la probabilidad de que ocurran ya sea A o B? Cul es la probabilidad de que ni A ni B sucedan? 12. Los eventos X y Y son mutuamente excluyentes. Si P(X) = 0.05 y P(Y) = 0.02. Cul es la pro babilidad de que X o Y ocurran? Cul es la probabilidad de que ni X ni Y sucedan? 13. Un estudio de 200 empresas de publicidad revel los siguientes ingresos despus de impues tos: Ingreso despus de impuestos Menos de $1 milln De $1 milln a $20 millones $20 millones o ms 14.  15.  16.  17.  18.  19.  20. Nmero de empresas 102 61 37

 21.

a)  Cul es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso despus de impuestos menor que $1 milln? b)  Cul es la probabilidad de que una empresa de publicidad seleccionada al azar tenga un ingreso despus de impuestos entre $1 milln y $20 millones o un ingreso de $20 millones o ms? Qu regla de la probabilidad aplic? El presidente de la junta directiva arma: Hay 50% de posibilidades de que esta compaa  obtenga utilidades; 30% de que termine sin prdidas ni ganancias y 20% de que pierda dinero durante el prximo trimestre. a)  Aplique una de las reglas de la adicin para determinar la probabilidad de que la compaa no pierda dinero el siguiente trimestre. b)  Aplique la regla del complemento para determinar la probabilidad de que no pierda dinero el prximo trimestre. Suponga que la probabilidad de que saque una A en esta clase es de 0.25 y que la probabilidad de obtener una B es de 0.50. Cul es la probabilidad de que su calicacin sea mayor que C? Se lanzan al aire dos monedas. Si A es el evento dos caras y B es el evento dos cruces, A y B son mutuamente excluyentes? Son complementos? Las probabilidades de los eventos A y B son 0.20 y 0.30, respectivamente. La probabilidad de que A y B ocurran es de 0.15. Cul es la probabilidad de que A o B ocurran? Sean P(X) = 0.55 y P(Y) = 0.35. Suponga que la probabilidad de que ambos ocurran es de 0.20. Cul es la probabilidad de que X o Y ocurran? Suponga que los dos eventos A y B son mutuamente excluyentes. Cul es la probabilidad de que se presenten de forma conjunta? Un estudiante toma dos cursos, historia y matemticas. La probabilidad de que el estudiante pase el curso de historia es de 0.60 y la probabilidad de que pase el curso de matemticas es de 0.70. La probabilidad de pasar ambos es de 0.50. Cul es la probabilidad de pasar por lo menos uno? Una encuesta sobre tiendas de comestibles del sureste de Estados Unidos revel que 40% tenan farmacia, 50% tenan orera y 70% tenan salchichonera. Suponga que 10% de las tiendas cuentan con los tres departamentos, 30% tienen tanto farmacia como salchichonera, 25% tienen orera y salchichonera y 20% tienen tanto farmacia como orera. a)  Cul es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta con farmacia y orera? b)  Cul es la probabilidad de seleccionar una tienda de manera aleatoria y hallar que cuenta con farmacia y salchichonera?

Estudio de los conceptos de la probabilidad

153

c)  Los eventos seleccionar una tienda con salchichonera y seleccionar una tienda con farmacia son mutuamente excluyentes? d)  Qu nombre se da al evento seleccionar una tienda con farmacia, orera y salchichonera? e)  Cul es la probabilidad de seleccionar una tienda que no incluya los tres departamentos? 22. Un estudio llevado a cabo por el National Service Park revel que 50% de los vacacionistas  que se dirigen a la regin de las Montaas Rocallosas visitan el parque de Yellowstone, 40% visitan los Tetons y 35% visitan ambos lugares. a)  Cul es la probabilidad de que un vacacionista visite por lo menos una de estas atracciones? b) Qu nombre recibe la probabilidad de 0.35? c) Los eventos son mutuamente excluyentes? Explique su respuesta.

Reglas de la multiplicacin
Cuando empleamos las reglas de la adicin en la seccin anterior, determinamos la probabilidad de combinar dos eventos. En esta seccin estimar la probabilidad de que la ocurrencia de dos eventos sea simultnea. Por ejemplo, una empresa de marketing desea calcular la probabilidad de que una persona de 21 aos de edad o mayor compre un Hummer. Los diagramas de Venn ilustran este hecho como la interseccin de dos eventos. Para determinar la probabilidad de dos eventos que se presentan simultneamente emplee la regla de la multiplicacin. Hay dos reglas de la multiplicacin, la regla especial y la regla general.

Regla especial de la multiplicacin

La regla especial de la multiplicacin requiere que dos eventos, A y B, sean independientes, y lo son si el hecho de que uno ocurra no altera la probabilidad de que el otro suceda. INDEPENDENCIA Si un evento ocurre, no tiene ningn efecto sobre la probabilidad de que otro evento acontezca.

Una forma de entender la independencia consiste en suponer que los eventos A y B ocurren en diferentes tiempos. Por ejemplo, cuando el evento B ocurre despus del evento A, inuye A en la probabilidad de que el evento B ocurra? Si la respuesta es no, entonces A y B son eventos independientes. Para ilustrar la independencia, supongamos que se lanzan al aire dos monedas. El resultado del lanzamiento de una moneda (cara o cruz) no se altera por el resultado de cualquier moneda lanzada previamente (cara o cruz). En el caso de dos eventos independientes A y B, la probabilidad de que A y B ocurran se determina multiplicando las dos probabilidades, tal es la regla especial de la multiplicacin y su escritura simblica es la siguiente: REGLA ESPECIAL DE LA MULTIPLICACIN P (A y B) = P (A)P (B) [5.5]

En el caso de tres eventos independientes, A, B y C, la regla especial de la multiplicacin utilizada para determinar la probabilidad de que los tres eventos ocurran es: P (A y B y C) = P (A)P (B)P (C) Una encuesta llevada a cabo por la American Automobile Association (AAA) revel que el ao pasado 60% de sus miembros hicieron reservaciones en lneas areas. Dos de ellos fueron seleccionados al azar. Cul es la probabilidad de que ambos hicieran reservaciones el ao pasado? La probabilidad de que el primero haya hecho una reservacin el ao pasado es de 0.60, que se expresa como P(R1) = .60, en la que R1 representa el hecho de que el primer miembro hizo una reservacin.

Ejemplo Solucin

154

Captulo 5

La probabilidad de que el segundo miembro elegido haya hecho una reservacin es tambin de 0.60, as que P(R2) = .60. Como el nmero de miembros de la AAA es muy grande, se supone que R1 y R2 son independientes. En consecuencia, de acuerdo con la frmula (5.5), la probabilidad de que ambos hayan hecho una reservacin es de 0.36, que se calcula de la siguiente manera: P(R1 y R2) = P(R1)P(R2) = (.60)(.60) = .36 Todos los posibles resultados pueden representarse como se muestra a continuacin. Aqu, R signica que se hizo la reservacin y NR, que no se hizo la reservacin. Con las probabilidades y la regla del complemento se calcula la probabilidad conjunta de cada resultado. Por ejemplo, la probabilidad de que ningn miembro haga una reservacin es de 0.16. Adems, la probabilidad de que el primero y el segundo miembro (regla especial de la adicin) hagan una reservacin es de 0.48(0.24 + 0.24). Tambin se puede observar que los resultados son mutuamente excluyentes y colectivamente exhaustivos. Por tanto, las probabilidades suman 1.
Resultados R1 R2 R1 NR NR R2 NR NR Probabilidad conjunta (.60)(.60) (.60)(.40) (.40)(.60) (.40)(.40) = = = = .36 .24 .24 .16 1.00

Total

Autoevaluacin 5.5

Por experiencia, Teton Tire sabe que la probabilidad de que una llanta XB-70 rinda 60 000 millas antes de que quede lisa o falle es de 0.80. A cualquier llanta que no dure las 60 000 millas se le hacen arreglos. Usted adquiere cuatro llantas XB-70. Cul es la probabilidad de que las cuatro llantas tengan una duracin de 60 000 millas?

Regla general de la multiplicacin Si dos eventos no son independientes, se dice que son dependientes. Con el n de ilustrar el concepto de dependencia, supongamos que hay 10 latas de refresco en un refrigerador, siete de los cuales son normales y 3 dietticos. Se selecciona una lata del refrigerador. La probabilidad de seleccionar una lata de refresco diettico es de 3/10, y la probabilidad de seleccionar una lata de refresco normal es de 7/10. Entonces se elige una segunda lata del refrigerador sin devolver la primera. La probabilidad de que la segunda lata sea de refresco diettico depende de que la primera s lo haya sido o no. La probabilidad de que la segunda lata sea de refresco diettico es:
2/ 9, si la primera bebida es diettica (slo dos latas de refresco diettico quedan en el refrigerador). 3/ 9 si la primera lata elegida es normal (los tres refrescos an estn en el refrigerador). La denominacin adecuada de la fraccin 2/9 (o 3/9) es probabilidad condicional, ya que su valor se encuentra condicionado (o depende) por el hecho de que un refresco regular o diettico haya sido el primero en ser seleccionado del refrigerador. PROBABILIDAD CONDICIONAL Probabilidad de que un evento en particular ocurra, dado que otro evento haya acontecido.

Estudio de los conceptos de la probabilidad

155

La regla general de la multiplicacin sirve para determinar la probabilidad conjunta de dos eventos cuando stos no son independientes. Por ejemplo, cuando el evento B ocurre despus del evento A, y A inuye en la probabilidad de que el evento B suceda, entonces A y B no son independientes. Lar regla general de la multiplicacin establece que en caso de dos eventos, A y B, la probabilidad conjunta de que ambos eventos ocurran se determina multiplicando la probabilidad de que ocurra el evento A por la probabilidad condicional de que ocurra el evento B, dado que A ha ocurrido. Los smbolos de la probabilidad conjunta, P(A y B), se calcula de la siguiente manera: REGLA GENERAL DE LA MULTIPLICACIN P (A y B) = P (A)P (B | A) [5.6]

Ejemplo Solucin

Un golsta tiene 12 camisas en su clset. Suponga que 9 son blancas y las dems azules. Como se viste de noche, simplemente toma una camisa y se la pone. Juega golf dos veces seguidas y no las lava. Cul es la probabilidad de que las dos camisas elegidas sean blancas?

El evento que tiene que ver con el hecho de que la primera camisa seleccionada sea blanca es W1. La probabilidad es P(W1) = 9/12, porque 9 de cada 12 camisas son blancas. El evento de que la segunda camisa seleccionada sea blanca tambin se identica con W2. La probabilidad condicional relacionada con el hecho de que la segunda camisa seleccionada sea blanca, dado que la primera camisa seleccionada es blanca tambin, es P(W2|W1) = 8/11. A qu se debe esto? A que despus de que se selecciona la primera camisa, quedan 11 camisas en el clset y 8 de stas son blancas. Para determinar la probabilidad de que se elijan 2 camisas blancas aplicamos la frmula (5.6): 9 8 P (W1 y W2 ) = P (W1)P (W2 W1) = = .55 12 11 Por consiguiente, la probabilidad de seleccionar dos camisas, las cuales son de color blanco, es de 0.55.

A propsito, se supone que este experimento se llev a cabo sin reemplazo. Es decir, que la primera camisa no se lav y se coloc en el clset antes de hacer la seleccin de la segunda. As, el resultado del segundo evento es condicional o depende del resultado del primer evento. Es posible ampliar la regla general de la multiplicacin para que incluya ms de dos eventos. En el caso de los tres eventos, A, B y C, la frmula es: P (A y B y C ) = P (A)P (B|A)P (C|A y B ) En el caso del ejemplo de la camisa de golf, la probabilidad de elegir tres camisas blancas sin reemplazo es: 9 8 7 P (W1 y W2 y W3 ) = P (W1)P (W2 |W1)P (W3 |W1 y W2 ) = = .38 12 11 10 De esta manera, la probabilidad de seleccionar tres camisas sin reemplazo, todas las cuales sean blancas, es de 0.38.

156

Captulo 5

Autoevaluacin 5.6

La junta directiva de Tarbell Industries consta de ocho hombres y cuatro mujeres. Un comit de cuatro miembros ser elegido al azar para llevar a cabo una bsqueda, en todo el pas, del nuevo presidente para la compaa. a) Cul es la probabilidad de que los cuatro miembros del comit de bsqueda sean mujeres? b) De que los cuatro miembros del comit de bsqueda sean hombres? c)  Las probabilidades de los eventos descritos en los incisos a y b suman 1? Explique su respuesta.

Tablas de contingencias
Estadstica en accin
En 2000, George W. Bush gan la presidencia de Estados Unidos por un mnimo margen. Surgieron muchas historias sobre las elecciones, algunas de las cuales hablaban de irregularidades en las votaciones y otras que dieron lugar a interesantes preguntas. En una eleccin local de Michigan, result un empate entre dos candidatos para un puesto de eleccin. Para resolver el empate, los candidatos sacaron una hoja de papel de una caja que contena dos hojas, una rotulada Ganador, y otra sin marcar. Para determinar qu candidato sacara primero el papel, los funcionarios electorales lanzaron una moneda al aire. El ganador del lanzamiento tambin sac el papel del ganador. Ahora bien, era realmente necesario lanzar una moneda al aire? No, porque los dos eventos son independientes. Ganar en el lanzamiento de la moneda no altera la probabilidad de que cualquiera de los candidatos saque la hoja con el nombre del ganador.

A menudo los resultados de una encuesta son registrados en una tabla de dos direcciones y utilizados para determinar diversas probabilidades. Ya se ha descrito esta idea a partir de la pgina 120 del captulo 4. Para recordarlo: una tabla de dos direcciones es una tabla de contingencia.

TABLA DE CONTINGENCIAS Tabla utilizada para clasificar observaciones de una muestra, de acuerdo con dos o ms caractersticas identificables.

Una tabla de contingencias consiste en una tabulacin cruzada que resume simultneamente dos variables de inters, as como la relacin entre stas. El nivel de medicin puede ser nominal. A continuacin algunos ejemplos.  Una encuesta de 150 adultos clasicados segn su gnero y la cantidad de pelculas que vieron en el cine el mes pasado. Cada entrevistado se clasica de acuerdo con dos criterios: la cantidad de pelculas que ha visto y el gnero.

Pelculas vistas 0 1 2 o ms Total Hombres 20 40 10 70

Gnero Mujeres 40 30 10 80 Total 60 70 20 150

 La American Coffee Association proporciona la siguiente informacin sobre la edad y la cantidad de caf que se consumi en un mes.

Edad (aos) Menos de 30 30 a 40 40 a 50 50 o ms Total Bajo 36 18 10 26 90

Consumo de caf Moderado 32 30 24 24 110 Alto 24 27 20 29 100 Total 92 75 54 79 300

De acuerdo con esta tabla, cada uno de los 300 entrevistados se clasica segn dos criterios: 1) la edad; 2) la cantidad de caf que consumen.

Estudio de los conceptos de la probabilidad

157

El siguiente ejemplo muestra la forma en que las reglas de adicin y multiplicacin se emplean en tablas de contingencias.

Ejemplo

Se entrevist a una muestra de ejecutivos respecto de su lealtad a la compaa. Una de las preguntas fue: si otra compaa le hace una oferta igual o le ofrece un puesto un poco mejor del que tiene ahora, permanecera con la compaa o aceptara el otro puesto? A partir de las respuestas de los 200 ejecutivos que participaron en la encuesta se hizo una clasicacin cruzada segn el tiempo de servicio a la compaa. TablA 5.1 Lealtad de los ejecutivos y tiempo de servicio a la compaa
Menos de 1 ao, B1 10 25 35 Tiempo de servicio 1 a 5 aos, B2 30 15 45 6 a 10 aos, B3 Ms de 10 aos B4

Lealtad

Total

Permanecera, A1 No permanecera, A2

5 75 120 10 30 80 15 105 200

Cul es la probabilidad de seleccionar al azar a un ejecutivo leal a la compaa que permanecera en ella y cul de ellos tiene ms de 10 aos de servicio? Note que los dos eventos ocurren al mismo tiempo, el ejecutivo permanecera en la compaa y l o ella tiene ms de 10 aos de servicio. 1.  El evento A1 ocurre si un ejecutivo elegido de forma aleatoria permanece con la compaa a pesar de que otra compaa le haga una oferta igual o mejor. Para determinar la probabilidad de que el evento A1 suceda, consulte la tabla 5.1. Note que hay 120 ejecutivos, de los 200 de la encuesta, que permaneceran en la compaa, de modo que P(A1) = 120/200, o .60. 2.  El evento B4 sucede si un ejecutivo elegido al azar tiene ms de 10 aos de servicio en la compaa. Por consiguiente, P(B4A1) es la probabilidad condicional de que un ejecutivo con ms de 10 aos de servicio permanezca en la compaa a pesar de que otra compaa le haga una oferta igual o mejor. Respecto de la tabla de contingencias, tabla 5.1, 75 de los 120 ejecutivos que permaneceran tienen ms de 10 aos de servicio, as que P(B4A1) = 75/120. Al despejar la probabilidad de que un ejecutivo elegido al azar permanezca en la compaa y que tenga ms de 10 aos de servicio en la regla general de la multiplicacin, incluida en la frmula (5.6) se obtiene: 120 75 9 000 = = .375 P (A1 y B4 ) = P (A1)P (B4 |A1) = 200 120 24 000 Para determinar la probabilidad de elegir un ejecutivo que permanezca o que tenga menos de 1 ao de experiencia, aplique la regla general de la adicin, la frmula (5.4). 1.  El evento A1 se reere a los ejecutivos que permanecera en la compaa. De este modo, P(A1) = 120/200 = .60. 2.  El evento B1 se reere a los ejecutivos que han laborado en la compaa menos de 1 ao. La probabilidad de que ocurra B1 es P(B1) = 35/200 = .175. 3.  Los eventos A1 y B1 no son mutuamente excluyentes. Es decir, que un ejecutivo puede querer permanecer en la compaa y tener menos de 1 ao de experiencia.

Solucin

158

Captulo 5

Esta probabilidad, que recibe el nombre de probabilidad conjunta, aparece como P(A1 y B1) = 10/200 = .05. Hay 10 ejecutivos que permaneceran en la compaa y que cuentan con menos de 1 ao de experiencia. En realidad se les estn contando dos veces, as que es necesario restar este valor. 4.  Sustituya estos valores en la frmula (5.4) y el resultado es el siguiente: P (A1 o B1) = P (A1) + P (B1) P (A1 y B1) = .60 + .175 .05 = .725 As que la probabilidad de que un ejecutivo elegido permanezca en la compaa o haya laborado para la compaa menos de 1 ao es de 0.725.

Autoevaluacin 5.7

Consulte la tabla 5.1 para calcular las siguientes probabilidades. a) De seleccionar a un ejecutivo con ms de 10 aos de servicio? b)  De seleccionar a un ejecutivo que no permanezca en la compaa, dado que l o ella cuentan con ms de 10 aos de servicio? c)  De seleccionar a un ejecutivo con ms de 10 aos de servicio o a uno que no permanezca en la compaa?

Diagramas de rbol
El diagrama de rbol es una grca til para organizar clculos que implican varias etapas. Cada segmento del rbol constituye una etapa del problema. Las ramas del rbol se ponderan por medio de probabilidades. Utilizaremos los datos de la tabla 5.1 para mostrar la construccin de un diagrama de rbol.
Pasos para la construccin de un diagrama de rbol.

1.  Para construir un diagrama de rbol, comenzamos dibujando un punto grueso a la izquierda para representar la raz del rbol (vase grca 5.2). 2.  En este problema, dos ramas principales salen de la raz, la rama superior representa el evento permanecera y la rama inferior el evento no permanecera. Sus probabilidades se escriben sobre las ramas, en este caso, 120/200 y 80/200. Estas probabilidades tambin se denotan P(A1) y P(A2). 3.  De cada una de las ramas principales salen cuatro ramas, las cuales representan el tiempo de servicio: menos de 1 ao, 1 a 5 aos, 6 a 10 aos y ms de 10 aos. Las probabilidades condicionales para la rama superior del rbol, 10/120, 30/120, 5/120, etc., se escriben en las ramas adecuadas. stas son P(B1A1), P(B2A1), P(B3A1) y P(B4A1), en las cuales B1 se reere a menos de 1 ao de servicio; B2, a 1 a 5 aos de servicio, B3, a 6 a 10 aos de servicio y B4, a ms de 10 aos. Enseguida, escribimos las probabilidades condicionales para la rama inferior. 4.  Por ltimo, las probabilidades conjuntas relativas al hecho de que los eventos A1 y Bi o los eventos A2 y Bi ocurrirn al mismo tiempo aparecen al lado derecho. Por ejemplo, de acuerdo con la frmula (5.6), la probabilidad conjunta de seleccionar al azar a un ejecutivo que permanecera en la compaa y que tenga ms de 1 ao de servicio es: 120 10 = .05 P (A1 y B1) = P (A1)P (B1|A1) = 200 120 Como las probabilidades conjuntas representan todos los posibles resultados (permanecera, 6 a 10 aos de servicio, no permanecera, ms de 10 aos de servicio, etc.), deben sumar 1.00 (vase grca 5.2).

Estudio de los conceptos de la probabilidad

159

Lealtad Probabilidades condicionales

Servicio Probabilidades conjuntas

10 ____ 120 30 ____ 120

120 ____ 10 = .050 Menos de 1 ao ____ 200 120 1-5 aos 120 ____ 30 = .150 ____ 200 120 120 ____ 5 = .025 ____ 200 120

Permanecera 120 ____ 200

5 ____ 120 75 ____ 120

6-10 aos

120 ____ 75 = .375 Ms de 10 aos ____ 200 120

80 ____ 200 No permanecera

25 ___ 80 15 ___ 80

Menos de 1 ao 1-5 aos

80 ____ 200 80 ____ 200 80 ____ 200

25 = .125 ___ 80 15 = .075 ___ 80 10 = .050 ___ 80 30 = .150 ___ 80 1.000

10 ___ 80 30 ___ 80

6-10 aos

80 Ms de 10 aos ____ 200

Deben sumar en total 1.00

GRFICA 5.2 Diagrama de rbol que muestra la lealtad y los aos de servicio

Autoevaluacin 5.8

Considere una encuesta a algunos consumidores relacionada con la cantidad relativa de visitas que hacen a una tienda Circuit City (con frecuencia, ocasionalmente o nunca) y con el hecho de si la tienda se ubicaba en un lugar conveniente (s y no). Cuando las variables son de escala nominal, tal como estos datos, por lo general los resultados se resumen en una tabla de contingencias.

Visitas Con frecuencia Ocasionalmente Nunca

Lugar conveniente S 60 25 5 90 No 20 35 50 105 Total 80 60 55 195

a)  El nmero de visitas y la ubicacin en un lugar conveniente, son variables independientes? Por qu razn? Interprete su conclusin. b) Dibuje un diagrama de rbol y determine las probabilidades conjuntas.

160

Captulo 5

Ejercicios
23. Suponga que P(A) = .40 y P(BA) = .30. Cul es la probabilidad conjunta de A y B? 24. Suponga que P(X1) = .75 y P(Y2X1) = .40. Cul es la probabilidad conjunta de X1 y Y2?  Un banco local informa que 80% de sus clientes tienen cuenta de cheques; 60% tiene cuenta 25. de ahorros y 50% cuentan con ambas. Si se elige un cliente al azar, cul es la probabilidad de que el cliente tenga ya sea una cuenta de cheques o una cuenta de ahorros?  All Seasons Plumbing tiene dos camiones de servicio que se descomponen con frecuencia. Si 26. la probabilidad de que el primer camin est disponible es de 0.75, la probabilidad de que el segundo camin est disponible es de 0.50 y la probabilidad de que ambos estn disponibles es de 0.30, cul es la probabilidad de que ningn camin se encuentre disponible? 27. Observe la siguiente tabla. Segundo evento B 1 B2 Total a) Determine P(A1). A1 2 1 3 Primer evento A2 1 2 3 A3 3 1 4 Total 6 4 10

b) Estime P(B1A2).

 Clean-brush Products envi por accidente tres cepillos dentales elctricos defectuosos a una 28. farmacia, adems de 17 sin defectos. a)  Cul es la probabilidad de que los primeros dos cepillos elctricos vendidos no sean devueltos a la farmacia por estar defectuosos? b) De que los primeros dos cepillos elctricos vendidos no estn defectuosos?  Cada vendedor de Puchett, Sheets, and Hogan Insurance Agency recibe una calicacin 29. debajo del promedio, promedio y por encima del promedio en lo que se reere a sus habilidades en ventas. A cada vendedor tambin se le calica por su potencial para progresar: regular, bueno o excelente. La siguiente tablea muestra una clasicacin cruzada de estas caractersticas de personalidad a los 500 empleados. Habilidades en ventas Debajo del promedio Promedio Por encima del promedio Potencial para progresar Regular 16 45 93 Bueno 12 60 72 Excelente 22 45 135

c) Aproxime P(B2 y A3).

a) Qu nombre recibe esta tabla? b)  Cul es la probabilidad de que una persona elegida al azar tenga una habilidad para las ventas con calicacin por encima del promedio y un excelente potencial para progresar? c)  Construya un diagrama de rbol que muestre las probabilidades, probabilidades condicionales y probabilidades conjuntas. 30. Un inversionista cuenta con tres acciones ordinarias. Cada accin, independiente de las  dems, tiene la misma probabilidad de: 1) incrementar su valor; 2) bajar su valor; 3) permanecer con el mismo valor. Elabore una lista de los posibles resultados de este experimento. Calcule la probabilidad de que por lo menos dos de las acciones aumenten de valor.  La junta directiva de una pequea compaa consta de cinco personas. Tres de ellas son 31. lderes fuertes. Si compran una idea, toda la junta estar de acuerdo. El resto de los miembros dbiles no tienen inuencia alguna. Se programa a tres vendedores, uno tras otro, para que lleven a cabo una presentacin frente a un miembro de la junta que el vendedor elija. Los vendedores son convincentes, aunque no saben quines son los lderes fuertes. Sin embargo, ellos se enterarn a quin le habl el vendedor anterior. El primer vendedor que encuentre a un lder fuerte ganar en la presentacin. Tienen los tres vendedores las mismas posibilidades de ganar en la presentacin? Si no es as, determine las probabilidades respectivas de ganar.

Estudio de los conceptos de la probabilidad

161

 Si pregunta a tres extraos las fechas de sus cumpleaos, cul es la probabilidad de que 32. a) todos haya nacido el mircoles; b) todos hayan nacido en diferentes das de la semana c) todos hayan nacido el sbado?

Teorema de Bayes
En el siglo XVIII, el reverendo Thomas Bayes, un ministro presbiteriano ingls, plante esta pregunta: Dios realmente existe? Dado su inters en las matemticas, intent crear una frmula para llegar a la probabilidad de que Dios existiera sobre la base de la evidencia de que dispona en la Tierra. Ms tarde, Pierre-Simon Laplace perfeccion el trabajo de Bayes y le dio el nombre de teorema de Bayes. De una forma entendible, el teorema de Bayes es el siguiente: P (A1)P (B|A1) P (A1|B ) = TEOREMA DE BAYES P (A1)P (B|A1) + P (A2 )P (B|A2 )

[5.7]

Estadstica en accin
Un estudio reciente de la National Collegiate Athletic Association (NCAA) inform que de 150 000 muchachos de los ltimos cursos de la escuela secundaria que juegan en su equipo de basquetbol, 64 formaran un equipo profesional. En otras palabras, las posibilidades de que un jugador de bsquetbol de los ltimos cursos de la escuela secundaria forme parte de un equipo profesional son de 1 en 2 344. De acuerdo con el mismo estudio: a)  las posibilidades de que un jugador de basquetbol de los ltimos cursos de la escuela secundaria juegue en alguna universidad son de alrededor de 1 en 40; b)  las posibilidades de que un chico de los ltimos cursos de la escuela secundaria juegue bsquetbol universitario como estudiante de los ltimos cursos de la universidad son de 1 en 60; c)  si usted juega basquetbol como estudiante de los ltimos cursos de la universidad, las posibilidades de formar parte de un equipo profesional son de alrededor de 1 en 37.5.

Si en la frmula (5.7), los eventos A1 y A2 son mutuamente excluyentes y colectivamente exhaustivos, y Ai se reere al evento A1 o a A2. De ah que en este caso A1 y A2 sea complementos. El signicado de los smbolos utilizados se ilustra en el siguiente ejemplo. Suponga que 5% de la poblacin de Umen, un pas cticio del tercer mundo, tiene una enfermedad propia del pas. Sea A1 el evento padece la enfermedad y A2 el evento no padece la enfermedad. Por tanto, si selecciona al azar a una persona de Umen, la probabilidad de que el individuo elegido padezca la enfermedad es de 0.05 o P(A1) = 0.05. Esta probabilidad, P (A1) = P (padece la enfermedad) = 0.05, recibe el nombre de probabilidad a priori. Se le da este nombre, porque la probabilidad se asigna antes de obtener los datos empricos. PROBABILIDAD A PRIORI Probabilidad basada en el nivel de informacin actual. Por ende, la probabilidad a priori de que una persona no padezca la enfermedad es de 0.95, o P(A2) = 0.95, que se calcula restando 1 0.05. Existe una tcnica de diagnstico para detectar la enfermedad, pero no es muy precisa. Sea B el evento la prueba revela la presencia de la enfermedad. Suponga que la evidencia histrica muestra que si una persona padece realmente la enfermedad, la probabilidad de que la prueba indique la presencia de sta es de 0.90. De acuerdo con las deniciones de probabilidad condicional establecidas en el captulo, dicho enunciado se expresa de la siguiente manera: P(BA1) = .90 Si la probabilidad de que la prueba indique la presencia de la enfermedad en una persona que en realidad no la padece es de 0.15. P(BA2) = .15 Elija al azar a una persona de Umen y aplique la prueba. Los resultados de la prueba indican que la enfermedad est presente. Cul es la probabilidad de que la persona en realidad padezca la enfermedad? Lo que desea saber, en forma simblica, es P(A1 B), que se interpreta de la siguiente manera: P (padece la enfermedad la prueba resulta positiva). La probabilidad P(A1 B) recibe el nombre de probabilidad a posteriori.

PROBABILIDAD A POSTERIORI Probabilidad revisada a partir de informacin adicional. Con la ayuda del teorema de Bayes, frmula (5.7), determine la probabilidad a posteriori:

162

Captulo 5

P (A1|B ) = =

P (A1)P (B|A1) P (A1)P (B|A1) + P (A2 )P (B|A2 ) (.05)(.90) .0450 = = .24 (.05)(.90) + (.95)(.15) .1875

As, la probabilidad de que una persona padezca la enfermedad, dado que la prueba sale positiva, es de 0.24. Cmo interpreta el resultado? Si selecciona al azar a una persona de la poblacin, la probabilidad de que se encuentre enferma es de 0.05. Si se le somete a la prueba y resulta positiva, la probabilidad de que la persona padezca realmente la enfermedad se incrementa cinco veces, de 0.05 a 0.24. En el problema anterior slo haba dos eventos mutuamente excluyentes y colectivamente exhaustivos A1 y A2. Si hay n eventos A1, A2, , An, el teorema de Bayes, frmula (5.7), se transforma en P (Ai )P (B|Ai ) P (A1|B ) = P (A1)P (B|A1) + P (A2 )P (B|A2 ) + + P (An )P (B|An ) Con la notacin anterior, los clculos del problema de Umen se resumen en la siguiente tabla:
Evento, Ai Padece la enfermedad, A1 No padece la enfermedad, A2 Probabilidad Probabilidad a priori, condicional, P(Ai) P(B | Ai) .05 .95 .90 .15 Probabilidad conjunta, P(Ai y B) .0450 .1425 P (B ) = .1875 Probabilidad a posteriori, P(Ai | B) .0450/.1875 = .24 .1425/.1875 = .76 1.00

A continuacin otro ejemplo del teorema de Bayes. Un fabricante de reproductores de DVD compra un microchip en particular, denominado LS-24, a tres proveedores: Hall Electronics, Schuller Sales y Crawford Components. Treinta por ciento de los chips LS-24 se le compran a Hall Electronics; 20%, a Schuller Sales y el restante 50%, a Crawford Components. El fabricante cuenta con amplios historiales sobre los tres proveedores y sabe que 3% de los chips LS24 de Hall Electronics tiene defectos, 5% de los chips de Schuller Sales tiene defectos y 4% de los chips que se compran a Crawford Components tiene defectos. Cuando los chips LS-24 le llegan al fabricante, se les coloca directamente en un depsito y no se inspeccionan ni se identican con el nombre del proveedor. Un trabajador selecciona un chip para instalarlo en un reproductor de DVD y lo encuentra defectuoso. Cul es la probabilidad de que lo haya fabricado Schuller Sales? Como primer paso, resuma parte de la informacin incluida en el enunciado del problema.  Hay tres eventos mutuamente excluyentes y colectivamente exhaustivos, es decir, tres proveedores: A1 el LS-24 se le compr a Hall Electonics; A2 el LS-24 se le compr a Schuller Sales; A3 el LS-24 se le compr a Crawford Components.

Ejemplo

Solucin

Estudio de los conceptos de la probabilidad

163

Las probabilidades a priori son: P(A1) = .30 La probabilidad de que Hall Electronics haya fabricado el LS-24. P(A2) = .20 La probabilidad de que Schuller Sales haya fabricado el LS-24. La probabilidad de que Crawford Components haya fabricado el P(A3) = .50  LS-24. La informacin adicional es la siguiente: B1 el LS-24 parece defectuoso; B2 el LS-24 no parece defectuoso. Se dan las siguientes probabilidades condicionales. P(B1| A1) = .03  La probabilidad de que un chip LS-24 fabricado por Hall Electronics se encuentre defectuoso. La probabilidad de que un chip LS-24 fabricado por Schuller P(B1| A2) = .05  Sales se encuentre defectuoso. La probabilidad de que un chip LS-24 fabricado por Crawford P(B1| A3) = .04  Components se encuentre defectuoso. Se selecciona un chip del depsito. Como el fabricante no identic los chips, no est seguro de qu proveedor fabric los chips. Desea determinar la probabilidad de que el chip defectuoso haya sido fabricado por Schuller Sales. La probabilidad se expresa como P(A2| B1). Observe el registro de calidad de Schuller. Es el peor de los tres proveedores. Ahora que ha encontrado un chip LS-24 defectuoso, sospecha que P(A2| B1) es mayor que P(A2). Es decir, la probabilidad revisada es mayor que 0.20. Pero cun mayor? El teorema de Bayes ofrece la respuesta. Como primer paso considere el diagrama de rbol de la grca 5.3. Los eventos son dependientes, as que la probabilidad a priori en la primera rama se multiplica por la probabilidad condicional en la segunda rama para obtener la probabilidad conjunta. La probabilidad conjunta gura en la ltima columna de la grca 5.3. Para construir el diagrama de rbol de la grca 5.3, se emple una sucesin de etapas que iban del proveedor hacia la determinacin de si el chip era o no aceptable. Lo que necesita hacer es invertir el proceso. Esto es, en lugar de desplazarce de izquierda a derecha en la grca 5.3, necesita hacerlo de derecha a izquierda. Tiene un chip defectuoso, y quiere determinar la probabilidad de que se le haya comprado a Schuller Sales. Cmo se consigue esto? Primero considere las probabilidades conjuntas como frecuencias relativas de entre 1 000 casos. Por ejemplo, la posibilidad de que Hall Electronics haya fabricado un chip LS-24 defectuoso es de 0.009. As que de 1 000 casos es de esperar 9 chips defectuosos fabricados por Hall Electronics. Observe que en 39 de 1 000 casos el chip LS-24 seleccionado para montarlo ser defectuoso, lo cual se calcula sumando 9 + 10 + 20. De estos 39 chips defectuosos, 10 fueron fabricados por Schuller and Sales. Por consiguiente, la probabilidad de que se le haya comprado un chip LS-24 es de 10/39 = 0.2564. Ha determinado la probabilidad revisada de P(A2| B1). Antes de encontrar el chip defectuoso, la probabilidad de que se le haya comprado a Schuller Sales era de 0.20. Esta posibilidad se ha incrementado a 0.2564. Esta informacin se resume en la siguiente tabla:
Evento, Ai Hall Schuller Crawford Probabilidad Probabilidad a priori, condicional, P(Ai) P(B1 | Ai) .30 .20 .50 .03 .05 .04 Probabilidad conjunta, P(Ai y B1) .009 .010 .020 P (B 1) = .039 Probabilidad a posteriori, P(Ai | B1) .009/.039 = .2308 .010/.039 = .2564 .020/.039 = .5128 1.0000

164

Captulo 5

Probabilidad condicional Probabilidad a priori

Probabilidad conjunta

B1 = Defectuoso P (B1| A1) = .03 P (A1 y B1) = P (A1) P (B1| A1) = (.30) (.03) B2 = En buen estado P (A1 y B2) = P (A1) P (B2|A1) = (.30) (.97) B1 = Defectuoso P (A2 y B1) = P (A2) P (B1|A2) = (.20) (.05) B2 = En buen estado P (A2 y B2) = P (A2) P (B2|A2) = (.20) (.95) B1 = Defectuoso P (A3 y B1) = P (A3) P (B1|A3) = (.50) (.04) B2 = En buen estado P (B2|A3) = .96 = .009

A1 = Hall P (A1) = .30

P (B2| A1) = .97

= .291

A2 = Schuller P (A2) = .20

P (B1| A2) = .05

= .010

P (B2|A2) = .95

= .190

A3 = Crawford P (A3) = .50

P (B1|A3) = .04

= .020

P (A3 y B2) = P (A3) P (B2|A3) = (.50) (.96)

= .480

Total 1.000

Diagrama de rbol del problema de la fabricacin de reproductores de DVD GRFICA 5.3

La probabilidad de que el chip LS-24 defectuoso provenga de Schuller Sales puede determinarse formalmente mediante el teorema de Bayes. Calcule P(A2 | B1), en la que A2 se reere a Schuller Sales y B1 al hecho de que el chip LS-24 estaba defectuoso: P (A2 |B1) = = P (A 2 )P (B1|A 2 ) P (A1)P (B1|A1) + P (A2 )P (B1|A2 ) + P (A 3 )P (B1|A 3 ) (.20)(.05) .010 = = .2564 (.30)(.03) + (.20)(.05) + (.50)(.04) .039

Es el mismo resultado que se obtuvo en la grca 5.3 y en la tabla de probabilidad condicional.

Autoevaluacin 5.9

Considere el ejemplo anterior junto con la solucin. a)  Disee una frmula para determinar la probabilidad de que la pieza seleccionada provenga de Crawford Components, dado que se trataba de un chip en buenas condiciones. b) Calcule la probabilidad con el teorema de Bayes.

Ejercicios
 P(A1) = .60, P(A2) = .40, P(B1| A1) = .05, y P(B1| A2) = .10. Aplique el teorema de Bayes para 33. determinar P(A1| B1).  P(A1) = .20, P(A2) = .40 y P(A3) = .40. P(B1| A1) = .25. P(B1| A2) = .05, y P(B1| A3) = .10. Aplique 34. el teorema de Bayes para determinar P(A3| B1).

Estudio de los conceptos de la probabilidad

165

 El equipo de bisbol Ludlow Wildcats, un equipo de las ligas menores de la organizacin de 35. los Indios de Cleveland, juega 70% de sus partidos por la noche y 30% de da. El equipo gana 50% de los juegos nocturnos y 90% de los juegos de da. De acuerdo con el peridico de hoy, ganaron el da de ayer. Cul es la probabilidad de que el partido se haya jugado de noche?  La doctora Stallter ha enseado estadstica bsica por varios aos. Ella sabe que 80% de los 36. estudiantes terminar los problemas asignados. Tambin determin que entre quienes hacen sus tareas, 90% pasar el curso. Entro los que no hacen su tarea, 60% pasar el curso. Mike Fishbaugh curs estadstica el semestre pasado con la doctora Stallter y pas. Cul es la probabilidad de que haya terminado sus tareas?  El departamento de crdito de Lions Department Store en Anaheim, California, inform que 37. 30% de las ventas se paga con efectivo o con cheque; 30% se paga con tarjeta de crdito y 40%, con tarjeta de dbito. Veinte por ciento de las compras con efectivo o cheque, 90% de las compras con tarjeta de crdito y 60% de las compras con tarjeta de dbito son por ms de $50. La seora Tina Stevens acaba de comprar un vestido nuevo que le cost $120. Cul es la probabilidad de que haya pagado en efectivo o con cheque?  Una cuarta parte de los residentes de Burning Ridge Estates dejan las puertas de sus coche38. ras abiertas cuando salen de su hogar. El jefe de la polica de la localidad calcula que al 5% de las cocheras les robarn algo, pero slo al 1% de las cocheras con puertas cerradas les robarn algo. Si roban una cochera, cul es la probabilidad de que se hayan dejado las puestas abiertas?

Principios de conteo
Si la cantidad de posibles resultados de un experimento es pequea, resulta relativamente fcil contarlas. Por ejemplo, existen seis posibles resultados del lanzamiento de un dado, a saber:

Sin embargo, si hay un nmero muy grande de resultados, tal como el nmero de caras y cruces en un experimento con 10 lanzamientos de una moneda, sera tedioso contar todas las posibilidades. Todos podran ser caras, una cruz y nueve caras, dos caras y ocho cruces, y as sucesivamente. Para facilitar la cuenta, se analizarn tres frmulas para contar: la frmula de la multiplicacin (no se confunda con la regla de la multiplicacin descrita en el captulo), la frmula de las permutaciones y la frmula de las combinaciones.

Frmula de la multiplicacin
Primero la frmula de la multiplicacin. FRMULA DE LA MULTIPLICACIN Si hay m formas de hacer una cosa y n formas de hacer otra cosa, hay m n formas de hacer ambas cosas. En trminos de una frmula: FRMULA DE LA MULTIPLICACIN Nmero total de disposiciones = (m)(n) [5.8]

Esta frmula se puede generalizar para ms de dos eventos. Para tres eventos m, n y o: Nmero total de disposiciones = (m)(n)(o)

Ejemplo Solucin

Un distribuidor de automviles quiere anunciar que por $29 999 usted puede comprar un convertible, un sedn de dos puertas o un modelo de cuatro puertas y elegir entre rines de rayos o planos. Cuntas disposiciones de modelos y rines puede ofrecer el distribuidor? Por supuesto, el distribuidor podra determinar el nmero total de disposiciones haciendo un diagrama y contando. Hay seis.

166

Captulo 5

Convertible con rines de rayos

Convertible con rines planos

Dos puertas con rines de rayos

Dos puertas con rines planos

Cuatro puertas con rines de rayos

Cuatro puertas con rines planos

Mediante la frmula de la multiplicacin se verica el resultado (en cuyo caso m es el nmero de modelos y n el tipo de rin). De acuerdo con la frmula (5.8): Nmero total de posibles disposiciones = (m)(n) = (3)(2) = 6 No result difcil contar todas las posibles combinaciones de modelos y rines en este ejemplo. Sin embargo, supongamos que el distribuidor decidi ofrecer ocho modelos y seis tipos de rines. Resultara tedioso representar y contar todas las posibles alternativas. Ms bien, se puede aplicar la frmula de la multiplicacin. En este caso, hay (m)(n)= (8)(6) = 48 posibles disposiciones. Observe en el ejemplo que en la frmula de la multiplicacin haba dos o ms agrupamientos de los cuales usted hizo selecciones. El distribuidor, por ejemplo, ofreci una variedad de modelos y de rines para elegir. Si un constructor de casas le ofrece cuatro diferentes estilos de exteriores y tres modelos de interiores, se aplicara la frmula de la multiplicacin para determinar cuntas combinaciones son posibles. Hay 12 posibilidades.

Autoevaluacin 5.10

1.  Womens Shopping Network ofrece suteres y pantalones para dama por televisin de cable. Los suteres y pantalones se ofrecen en colores coordinados. Si los suteres se encuentran disponibles en cinco colores y los pantalones en cuatro colores, cuntos diferentes conjuntos se pueden anunciar? 2.  Pioneer fabrica tres modelos de receptores estereofnicos, dos reproductores MP3, cuatro bocinas y tres carruseles de CD. Cuando se venden juntos los cuatro tipos de componentes, forman un sistema. Cuntos diferentes sistemas puede ofrecer la empresa de electrnica?

Frmula de las permutaciones


Como se ve, la frmula de la multiplicacin se aplica para determinar el nmero de posibles disposiciones de dos o ms grupos. La frmula de las permutaciones se aplica para determinar el nmero posible de disposiciones cuando slo hay un grupo de objetos. He aqu algunos ejemplos de esta clase de problemas.  Tres piezas electrnicas se van a montar en una unidad conectable a un aparato de televisin. Las piezas se pueden montar en cualquier orden. La pregunta es: de cuntas formas pueden montarse tres partes?  Un operador de mquinas debe llevar a cabo cuatro vericaciones de seguridad antes de arrancar su mquina. No importa el orden en que realice las vericaciones. De cuntas formas puede hacer las vericaciones?

Estudio de los conceptos de la probabilidad

167

Un orden para el primer ejemplo sera: primero el transistor, enseguida las LED y en tercer lugar el sintetizador. A esta distribucin se le conoce como permutacin. PERMUTACIN Cualquier distribucin de r objetos seleccionados de un solo grupo de n posibles objetos. Observe que las distribuciones a b c y b a c son permutaciones diferentes. La frmula para contar el nmero total de diferentes permutaciones es: FRMULA DE LAS PERMUTACIONES donde: n representa el total de objetos; r representa el total de objetos seleccionados. Antes de resolver los dos problemas planteados, note que en las permutaciones y las combinaciones (que se plantean en breve) se emplea la notacin denominada n factorial. sta se representa como n! y signica el producto de n(n 1)(n 2)(n 3) (1). Por ejemplo, 5! = 5 4 3 2 1 = 120. Muchas de las calculadoras tienen una tecla con x!, que ejecuta el clculo. Ahorrar mucho tiempo. Por ejemplo, la calculadora Texas Instrument TI-36X tiene la siguiente tecla:
x! 10x LOG
n Pr

n! (n r )!

[5.9]

Es la tercera funcin, as que revise el manual del usuario o internet para leer las instrucciones. La notacin factorial se puede eliminar cuando los mismos nmeros aparecen tanto en el numerador como en el denominador, como se muestra a continuacin: 6!3! 6 5 4 3 2 1(3 2 1) = = 180 4! 4 3 21 Por denicin, cero factorial, que se escribe 0!, es 1. Es decir que 0! = 1. Respecto del grupo de tres piezas electrnicas que se van a montar en cualquier orden, de cuntas formas se pueden montar? Hay tres piezas electrnicas que van a montarse, as que n = 3. Como las tres se van a insertar en la unidad conectable, r = 3. De acuerdo con la frmula (5.9), el resultado es: 3! 3! 3! n! = = = =6 n Pr = (n r )! (3 3)! 0! 1! Podemos vericar el nmero de permutaciones que obtuvimos con la frmula de las permutaciones. Determinamos cuntos espacios hay que llenar y las posibilidades para cada espacio. En el problema de las tres piezas electrnicas, hay tres lugares en la unidad conectable para las tres piezas. Hay tres posibilidades para el primer lugar, dos para el segundo (una se ha agotado) y una para el tercero: (3)(2)(1) = 6 permutaciones Las seis formas en que las tres piezas electrnicas, representadas con las letras A, B, C, se pueden ordenar es:
ABC BAC CAB ACB BCA CBA

Ejemplo Solucin

168

Captulo 5

En el ejemplo anterior, seleccionamos y distribuimos todos los objetos, es decir que n = r. En muchos casos, slo se seleccionan algunos objetos y se ordenan tomndolos de entre los n posibles objetos. En el siguiente ejemplo explicamos los detalles de este caso. Betts Machine Shop, Inc., cuenta con ocho tornos, aunque slo hay tres espacios disponibles en el rea de produccin para las mquinas. De cuntas maneras se pueden distribuir las ocho mquinas en los tres espacios disponibles? Hay ocho posibilidades para el primer espacio disponible en el rea de produccin, siete para el segundo espacio (una se ha agotado) y seis para el tercer espacio. Por consiguiente: (8)(7)(6) = 336, es decir, hay un total de 336 diferentes distribuciones posibles. Este resultado tambin podra obtenerse aplicando la frmula (5.9). Si n = 8 mquinas y r = 3 espacios disponibles, la frmula da como resultado
n Pr

Ejemplo Solucin

8! 8! (8)(7)(6) 5 ! n! 6 = = = = 336 (n r )! (8 3)! 5! 5!

Frmula de las combinaciones


Si el orden de los objetos seleccionados no es importante, cualquier seleccin se denomina combinacin. La frmula para contar el nmero de r combinaciones de objetos de un conjunto de n objetos es:
n Cr

FRMULA DE LAS COMBINACIONES

n! r !(n r )!

[5.10]

Por ejemplo, si los ejecutivos Able, Baker y Chauncy van a ser electos para formar un comit de negociacin de una fusin, slo existe una posible combinacin con estos tres ejecutivos; el comit formado por Able, Baker y Chauncy es el mismo comit que el que forman Baker, Chauncy y Able. De acuerdo con la frmula de las combinaciones:
n Cr

3 2 1 n! = =1 () r !(n r )! 3 2 11

Ejemplo

Se ha dado al departamento de marketing la tarea de designar cdigos de colores para las 42 diferentes lneas de discos compactos vendidos por Goody Records. Tres colores se van a utilizar para cada CD; ahora bien, una combinacin de tres colores para un CD no se puede reordenar para identicar un CD diferente. Esto signica que si se utilizaron el verde, amarillo y violeta para identicar una lnea, entonces el amarillo, verde y violeta (o cualquier otra combinacin de estos tres colores) no se puede emplear para identicar otra lnea. Seran adecuados siete colores tomados de tres en tres para codicar las 42 lneas? De acuerdo con la frmula (5.10), hay 35 combinaciones, que se determinan mediante
7 C3

Solucin

n! 7! 7! = = = 35 r !(n r )! 3! (7 3)! 3!4!

Los siete colores tomados de tres en tres (es decir, tres colores para una lnea) no seran adecuados para codicar las 42 lneas, ya que slo proporcionaran 35 combinaciones. Ocho colores tomados de tres en tres daran 56 combinaciones. Esto sera ms que suciente para codicar las 42 diferentes lneas.

Estudio de los conceptos de la probabilidad

169

Cuando el nmero de permutaciones o combinaciones es grande, los clculos son laboriosos. El software de las computadoras y las calculadoras de mano tienen funciones para calcular estos nmeros. A continuacin aparece una salida de Excel que contiene la ubicacin de los ocho tornos en el rea de produccin de Betts Machine Shop, Inc. Hay un total de 336 distribuciones.

Enseguida aparece la salida de los cuatro cdigos de colores de Goody Records. Tres colores son elegidos de entre siete posibles. El nmero de combinaciones posibles es de 35.

Autoevaluacin 5.11

1.  Un msico piensa escribir una escala basada slo en cinco cuerdas: B bemol, C, D, E y G. Sin embargo, slo tres de las cinco cuerdas se van a utilizar en sucesin, por ejemplo: C, B bemol y E. No se permiten repeticiones como B bemol, B bemol y E. a) Cuntas permutaciones de las cinco cuerdas, tomadas de tres en tres, son posibles? b) De acuerdo con la frmula (5.9), cuntas permutaciones son posibles? 2.  Un operador de mquinas debe hacer cuatro verificaciones antes de hacer una pieza. No importa en qu orden lleve a cabo las verificaciones. De cuntas formas puede hacer las verificaciones? 3.  Los 10 nmeros del 0 al 9 se van a emplear en grupos de cdigos de cuatro dgitos para identificar una prenda. El cdigo 1083 podra identificar una blusa azul, talla mediana; el grupo de cdigo 2031 podra identificar unos pantalones talla 18, etc. No estn permitidas las repeticiones de nmeros. Es decir, el mismo nmero no se puede utilizar dos veces (o ms) en una sucesin completa. Por ejemplo, 2256, 2562 o 5559 no estaran permitidos. Cuntos diferentes grupos de cdigos se pueden asignar? 4.  En el ejemplo relacionado con Goody Records, concluy que ocho colores tomados de tres en tres daran un total de 56 diferentes combinaciones. a) Aplique la frmula (5.10) para demostrar que esto es verdadero. b)  Como alternativa para codificar con colores las 42 diferentes lneas, se ha sugerido que slo dos colores se coloquen en un disco. Diez colores seran adecuados para codificar las 42 diferentes lneas? (De nuevo, se podra utilizar una sola vez una combinacin de

170

Captulo 5

dos colores, es decir, si rosa y azul se utilizaron para codificar una lnea, el azul y el rosa no se pueden utilizar para identificar otra lnea.) 5.  En un juego de lotera se seleccionan al azar tres nmeros de una tmbola de bolas numeradas del 1 al 50. a) Cuntas permutaciones son posibles? b) Cuntas combinaciones son posibles?

Ejercicios
39. Resuelva las siguientes operaciones: a) 40!/35! b) 7P4 c) 5C2

40. Resuelva las siguientes operaciones: a) 20!/17! b) 9P3 c) 7C2

 Un encuestador seleccion en forma aleatoria a 4 de 10 personas disponibles. Cuntos dife41. rentes grupos de 4 es posible formar?  Un nmero telefnico consta de siete dgitos, los primeros tres representan el enlace. Cun42. tos nmeros telefnicos son posibles con el enlace 537?  Una compaa de entregas rpidas debe incluir cinco ciudades en su ruta. Cuntas dife43. rentes rutas se pueden formar suponiendo que no importa el orden en que se incluyen las ciudades en la ruta?  Una representante de la Environmental Protection Agency (EPA) piensa seleccionar muestras 44. de 10 terrenos. El director tiene 15 terrenos de los cuales la representante puede recoger las muestras. Cuntas diferentes muestras son posibles?  Un encuestador nacional ha formulado 15 preguntas diseadas para medir el desempeo del 45. presidente de Estados Unidos. El encuestador seleccionar 10 de las preguntas. Cuntas distribuciones de las 10 preguntas se pueden formar tomando en cuenta el orden?  Una compaa va a crear tres nuevas divisiones, para dirigir una de las cuales hay siete geren46. tes elegibles. De cuntas formas se podran elegir a los tres nuevos directores?

Resumen del captulo


I.  Una probabilidad es un valor entre 0 y 1, inclusive, que representa las posibilidades de que cierto evento ocurra. A. Un experimento es la observacin de alguna actividad o el acto de tomar una medida. B. Un resultado es una consecuencia particular de un experimento. C. Un evento es la coleccin de uno o ms resultados de un experimento. II. Existen tres deniciones de probabilidad. A.  La denicin clsica se aplica cuando hay n resultados igualmente posibles en un experimento. B.  La denicin emprica se emplea cuando el nmero de veces que ocurre un evento se divide entre el nmero de observaciones. C. Una probabilidad subjetiva se basa en cualquier informacin disponible. III. Dos eventos son mutuamente excluyentes si como consecuencia de que uno de los dos suce de, el otro no puede ocurrir. IV. Los eventos son independientes si el hecho de que un evento suceda no inuye en que el otro  ocurra. V. Las reglas de la adicin se reeren a la unin de eventos.

Estudio de los conceptos de la probabilidad

171

A.  La regla especial de la adicin se aplica cuando los eventos son mutuamente excluyentes. P (A o B ) = P (A) + P (B ) [5.2] B.  La regla general de la adicin se aplica cuando los eventos no son mutuamente excluyentes. P (A o B ) = P (A) + P (B ) P (A y B ) [5.4] C.  La regla del complemento se utiliza para determinar la probabilidad de un evento restando de 1 la probabilidad de que el evento no suceda. P (A) = 1 P ( A ) [5.3]

Estadstica en accin
Las estadsticas gubernamentales muestran que hay alrededor de 1.7 muertes provocadas por accidentes automovilsticos por cada 100 000 000 de millas recorridas. Si usted maneja 1 milla a la tienda para comprar un billete de lotera y enseguida regresa a casa, usted ha recorrido 2 millas. Por consiguiente, la probabilidad de que usted se una a este grupo de estadsticas en sus siguientes 2 millas de viaje redondo es de 2 1.7/ 100 000 000 = 0.000000034. Esto tambin se expresa como una en 29 411 765. Por tanto, si usted maneja a la tienda a comprar su boleto, la probabilidad de morir (o matar a alguien) es ms de 4 veces la probabilidad de que saque la lotera, una posibilidad en 120 526 770. http://www.durangobill.com/ Powerball Odds.html

VI. Las reglas de la multiplicacin se reeren al producto de eventos. A. La regla especial de la multiplicacin se reere a eventos que son independientes. P (A y B ) = P (A )P (B ) P (A y B ) = P (A )P (B |A) [5.5]

B. La regla general de la multiplicacin aplica en eventos que no son independientes. [5.6]

C. U  na probabilidad conjunta es la posibilidad de que dos o ms eventos sucedan al mismo tiempo. D.  Una probabilidad condicional es la posibilidad de que un evento suceda, dado que otro evento ha sucedido. E.  El teorema de Bayes es un mtodo que consiste en revisar una probabilidad, dado que se obtenga informacin adicional. En el caso de dos eventos mutuamente excluyentes y colectivamente exhaustivos, P (A 1 |B ) = P (A 1)P (B|A 1) + P (A 2)P (B|A 2) P (A 1)P (B|A 1) [5.7]

VII. E  xisten tres reglas de conteo tiles para determinar el nmero de resultados de un experimento. A.  La regla de la multiplicacin establece que si hay m formas de que un evento suceda y n formas de que otro pueda suceder, entonces hay mn formas en que los dos eventos pueden suceder. Nmero de arreglos = (m)(n) [5.8]

B.  Una permutacin es un arreglo en el que el orden de los objetos seleccionados de un conjunto especco es importante.
n Pr

n! (n r )!

[5.9]

C. U  na combinacin es un arreglo en el que el orden de los objetos seleccionados de un conjunto especco no es importante.
n Cr

n! r !(n r )!

[5.10]

Clave de pronunciacin
SMBOLO P(A) P(~A) P(A y B) P(A o B) P(A | B)
nPr nCr

SIGNIFICADO Probabilidad de A Probabilidad de no A Probabilidad de A y B Probabilidad de A o B Probabilidad de A dado que B ha ocurrido Permutacin de n elementos seleccionados r a la vez Combinacin de n elementos seleccionados r a la vez

PRONUNCIACIN P de A P de no A P de A y B P de A o B P de A, dado B Pnr Cnr

172

Captulo 5

Ejercicios del captulo


47.  El departamento de investigacin de mercados de Vernos planea realizar una encuesta entre adolescentes sobre un refresco recin creado. A cada uno de ellos se le va a pedir que lo comparen con su refresco favorito. a) En qu consiste el experimento? b) Cul es uno de los eventos posibles? 48.  El nmero de veces que ocurri un evento en el pasado se divide entre el nmero de veces que ocurre. Cmo se llama este enfoque de la probabilidad? 49.  La probabilidad de que la causa y la cura de todo tipo de cncer se descubran antes del ao 2010 es de 0.20. Qu enfoque de la probabilidad ilustra este enunciado? 50.  Berdines Chicken Factory posee varias tiendas en el rea del Hilton Head, Carolina del Sur. Al entrevistar a los candidatos para el puesto de mesero, al propietario le gustara incluir informacin referente a la propina que un mesero espera ganar por cuenta (o nota). Un estudio de 500 cuentas recientes indic que el mesero ganaba las siguientes propinas por turno de 8 horas. $0 20 50 100 200 Propina a a a a o $ 20 50 100 200 ms Nmero 200 100 75 75 50 500

Total 51. 52. 53.  54.

a) Cul es la probabilidad de que una propina sea de $200 o ms? b) Las categoras $0 a $20, $20 a $50, etc., se consideran mutuamente excluyentes? c) Si las probabilidades relacionadas con cada resultado se sumaran, cul sera el total? d) Cul es la probabilidad de que una propina sea de $50? e) De que una propina sea inferior a $200? Dena cada uno de los siguientes conceptos: a) Probabilidad condicional. b) Evento. c) Probabilidad conjunta. La primera carta de una baraja de 52 cartas es un rey. a)  Si lo regresa a la baraja, cul es la probabilidad de sacar un rey en la segunda seleccin? b)  Si no lo regresa a la baraja, cul es la probabilidad de sacar un rey en la segunda seleccin? c)  Cul es la probabilidad de seleccionar un rey en la primera carta que se toma de la baraja y otro rey en la segunda (suponiendo que el primer rey no fue reemplazado? Armco, un fabricante de sistemas de semforos, descubri que, en las pruebas de vida acelerada, 95% de los sistemas recin desarrollados duraban 3 aos antes de descomponerse al cambiar de seal. a)  Si una ciudad comprara cuatro de estos sistemas, cul es la probabilidad de que los cuatro sistemas funcionen adecuadamente durante 3 aos por lo menos? b) Qu regla de la probabilidad se ejemplica en este caso? c)  Representando los cuatro sistemas con letras, escriba una ecuacin para demostrar cmo lleg a la respuesta a. Observe el siguiente dibujo.

B a) Qu nombre recibe el dibujo? b) Qu regla de la probabilidad se ilustra? c)  B representa el evento que se reere a la seleccin de una familia que recibe prestaciones sociales. A qu es igual P(B) + P(~B)? 55.  En un programa de empleados que realizan prcticas de gerencia en Claremont Enterprises, 80% de los empleados son mujeres y 20% hombres. Noventa por ciento de las mujeres fue a la universidad y 78% de los hombres fue a la universidad.

Estudio de los conceptos de la probabilidad

173

a)  Al azar se elige a un empleado que realiza prcticas de gerencia. Cul es la probabilidad de que la persona seleccionada sea una mujer que no asisti a la universidad? b )  El gnero y la asistencia a la universidad son independientes? Por qu? c)  Construya un diagrama de rbol que muestre las probabilidades condicionales y probabilidades conjuntas. d) Las probabilidades conjuntas suman 1.00? Por qu? 56.  Suponga que la probabilidad de que cualquier vuelo de Northwest Airlines llegue 15 minutos despus de la hora programada es de 0.90. Seleccione cuatro vuelos de ayer para estudiarlos. a)  Cul es la probabilidad de que los cuatro vuelos seleccionados lleguen 15 minutos despus de la hora programada? b)  De que ninguno de los vuelos seleccionados llegue 15 minutos despus de la hora programada? c)  De que por lo menos uno de los vuelos seleccionados no llegue 15 minutos despus de la hora programada? 57.  Hay 100 empleados en Kiddie Carts International. Cincuenta y siete de los empleados son trabajadores de la produccin, 40 son supervisores, 2 son secretarias y el empleado que queda es el presidente. Suponga que selecciona un empleado. a)  Cul es la probabilidad de que el empleado seleccionado sea un trabajador de produccin? b)  Cul es la probabilidad de que el empleado seleccionado sea un trabajador de produccin o un supervisor? c) Respecto del inciso b. Estos eventos son mutuamente excluyentes? d)  Cul es la probabilidad de que el empleado seleccionado no sea trabajador de la construccin ni supervisor? 58.  Derrek Lee, de los osos de Chicago, tuvo el promedio de bateo ms alto en la temporada 2005 de la liga mayor de bisbol. Su promedio fue de 0.335. As que suponga que la probabilidad de conectar un hit es de 0.335 en cada turno al bate. En cierto juego en particular, suponga que bate tres veces. a) De qu tipo de probabilidad constituye ste un ejemplo? b) Cul es la probabilidad de conectar tres hits en un juego? c) De que no conecte ningn hit en un juego? d) De conectar por lo menos un hit? 59.  La probabilidad de que un misil de crucero d en el blanco en cierta misin es de 0.80. Cuatro misiles de crucero se envan hacia el mismo blanco. Cul es la probabilidad: a) de que todos den en el blanco? b) de que ninguno d en el blanco? c) de que por lo menos uno d en el blanco? 60.  Noventa y nueve estudiantes se graduarn de Lima Shawnee High School esta primavera. De los 90 estudiantes, 50 estn haciendo planes para ir a la universidad. Se van a elegir dos estudiantes al azar para que porten banderas en la graduacin. a)  Cul es la probabilidad de que los dos estudiantes seleccionados hagan planes para asistir a la universidad? b)  Cul es la probabilidad de que uno de los estudiantes seleccionados haga planes para asistir a la universidad? 61.  Brooks Insurance, Inc., pretende ofrecer seguros de vida a hombres de 60 aos por internet. Las tablas de mortalidad indican que la probabilidad de que un hombre de 60 aos de edad sobreviva otro ao es de 0.98. Si el seguro se ofrece a cinco hombres de 60 aos de edad: a) Cul es la probabilidad de que los cinco hombres sobrevivan el ao? b) Cul es la probabilidad de que por lo menos uno no sobreviva? 62.  Cuarenta por ciento de las casas construidas en el rea de Quail Creek incluyen un sistema de seguridad. Se seleccionan 3 casas al azar. a)  Cul es la probabilidad de que las tres casas seleccionadas cuenten con sistema de seguridad? b) De que ninguna de las tres casas seleccionadas cuente con sistema de seguridad? c) De que por lo menos una de las casas seleccionadas cuente con sistema de seguridad? d) Supone que los eventos son dependientes o independientes? 63.  Repase el ejercicio 62, pero suponga que hay 10 casas en el rea de Quail Creek y cuatro de ellas cuentan con sistema de seguridad. Se eligen tres casas al azar. a)  Cul es la probabilidad de que las tres casas seleccionadas cuenten con sistema de seguridad? b)  Cul es la probabilidad de que ninguna de las tres casas seleccionadas cuenten con sistema de seguridad? c)  Cul es la probabilidad de que por lo menos una de las tres casas seleccionadas cuente con sistema de seguridad? d) Supone que los eventos son dependientes o independientes? 64.  Veinte familias viven en el Willbrook Farms Development. De estas familias 10 elaboraron sus propias declaraciones de impuestos del ao pasado, 7 encargaron la elaboracin de sus declaraciones a un profesional de la localidad y los restantes 3 las encargaron a H&R Block.

174

Captulo 5

a)  Cul es la probabilidad de seleccionar a una familia que haya preparado su propia declaracin? b)  Cul es la probabilidad de seleccionar a dos familias que hayan preparado sus propias declaraciones? c)  Cul es la probabilidad de seleccionar a tres familias que hayan preparado sus propias declaraciones? d)  Cul es la probabilidad de seleccionar a dos familias, a ninguna de las cuales le elabor sus declaraciones H&R Block? 65.  La junta directiva de Saner Automatic Door Company consta de 12 miembros, 3 de los cuales son mujeres. Para redactar un nuevo manual relacionado con la poltica y procedimientos de la compaa, se elige al azar un comit de 3 miembros de la junta directiva para llevar a cabo la redaccin. a) Cul es la probabilidad de que todos los miembros del comit sean hombres? b) Cul es la probabilidad de que por lo menos un miembro del comit sea mujer? 66.  Una encuesta reciente publicada en BusinessWeek aborda el tema de los salarios de los directores ejecutivos de grandes compaas y si accionistas ganan o pierden dinero. Director ejecutivo con un salario mayor que $1 000 000 Director ejecutivo con un salario menor que $1 000 000 11 3 14 Total 13 7 20

Los accionistas ganan dinero 2 Los accionistas pierden dinero 4 Total 6

 Si una compaa se selecciona al azar de la lista de 20 estudiadas, cul es la probabilidad de que: a) el director ejecutivo gane ms de $1 000 000? b) gane ms de $1 000 000 o los accionistas pierdan dinero? c) gane ms de $1 000 000 dado que los accionistas pierden dinero?  d) se seleccionen 2 directores ejecutivos y se descubra que ambos ganan ms de $1 000 000? 67.  Althoff and Roll, una empresa de inversiones en Augusta, Georgia, se anuncia ampliamente en el Augusta Morning Gazette, el peridico que ofrece sus servicios en la regin. El personal de marketing del Gazette calcula que 60% del mercado potencial de Althoff and Roll ley el peridico; calcula, adems, que 85% de quienes leyeron el Gazette recuerdan la publicidad de Althoff and Roll. a)  Qu porcentaje del mercado potencial de la compaa inversionista ve y recuerda el anuncio? b)  Qu porcentaje del mercado potencial de la compaa inversionista ve, pero no recuerda el anuncio? 68.  Una compaa de internet localizada en Carolina del Sur tiene boletos de temporada para los juegos de basquetbol de Los Angeles Lakers. El presidente de la compaa siempre invita a uno de los cuatro vicepresidentes para que lo acompae al juego, y arma que selecciona a la persona al azar. Uno de los cuatro vicepresidentes no ha sido invitado para ir a alguno de los ltimos cinco juegos en casa de los Lakers. Cul es la probabilidad de que esto pudiera deberse al azar? 69.  Un proveedor minorista de computadoras compr un lote de 1 000 discos CD-R e intent formatearlos para una aplicacin particular. Haba 857 discos compactos en perfectas condiciones, 112 se podan utilizar, aunque tenan sectores en malas condiciones y el resto no se poda emplear para nada. a)  Cul es la probabilidad de que un CD seleccionado no se encuentre en perfecto estado? b)  Si el disco no se encuentra en perfectas condiciones, cul es la probabilidad de que no se le pueda utilizar? 70.  Un inversionista compr 100 acciones de Fifth Third Bank y 100 de Santee Electric Cooperative. La probabilidad de que las acciones del banco incrementen su valor en un ao es de 0.70. La probabilidad de que las utilidades de la compaa elctrica se incrementen en el mismo periodo es de 0.60. a)  Cul es la probabilidad de que las dos acciones aumenten de precio durante el periodo? b)  Cul es la probabilidad de que las acciones del banco incrementen su precio, aunque las utilidades, no? c) Cul es la probabilidad de que por lo menos una de las acciones aumente de precio? 71.  Flashner Marketing Research, Inc. se especializa en la evaluacin de las posibles tiendas de ropa para dama en centros comerciales. Al Flashner, el presidente, informa que evala las posibles tiendas como buenas, regulares y malas. Los registros de anteriores evaluaciones muestran que 60% de las veces los candidatos fueron evaluados como buenos; 30% de las veces regulares, y 10% de las ocasiones, malos. De los que fueron calicados como buenos, 80% hicieron mejoras el primer ao; los que fueron calicados como regulares, 60% hicieron mejoras el primer ao, y de los que fueron mal evaluados, 20% hicieron mejoras el primer ao. Connies Apparel fue uno de los clientes de Flashner. Connies Apparel hizo mejoras el ao pasado. Cul es la probabilidad de que se le haya dado originalmente una mala calicacin?

Estudio de los conceptos de la probabilidad

175

72.  Se recibieron de la fbrica dos cajas de camisas para caballero Old Navy. La caja 1 contena 25 camisas polo y 15 camisas Super-T. La caja 2 contena 30 camisas polo y 10 camisas Super-T. Una de las cajas se seleccion al azar y se eligi una camisa de dicha caja, tambin en forma aleatoria, para revisarla. La camisa era polo. Dada esta informacin, cul es la probabilidad de que la camisa polo provenga de la caja 1? 73.  En la compra de una pizza grande en Tonys Pizza, el cliente recibe un cupn, que puede raspar para ver si tiene premio. Las posibilidades de ganar un refresco son de 1 en 10, y las posibilidades de ganar una pizza grande son de 1 en 50. Usted tiene planes de almorzar maana en Tonys Pizza. Cul es la probabilidad de que usted: a) gane una pizza grande o un refresco? b) no gane nada? c) no gane nada en tres visitas consecutivas a Tonys? d) gane por lo menos algo en sus siguientes tres visitas a Tonys? 74.  Para el juego diario de la lotera en Illinois, los participantes seleccionan tres nmeros entre 0 y 9. No pueden seleccionar un nmero ms de una vez, as que, un billete ganador podra ser, por ejemplo, 307, pero no 337. La compra de un billete le permite seleccionar un conjunto de nmeros. Los nmeros ganadores se anuncian en televisin todas las noches. a) Cuntos diferentes resultados (nmeros de tres dgitos) es posible formar? b) Si compra un billete para el juego de la noche, cul es la probabilidad de que gane? c)  Suponga que compra tres boletos para el juego de lotera de la noche y selecciona un nmero diferente para cada boleto. Cul es la probabilidad de que no gane con cualquiera de los boletos? 75.  Hace varios aos, Wendys Hamburgers anunci que hay 256 diferentes formas de pedir una hamburguesa. Es posible elegir entre cualquiera de las siguientes combinaciones para la hamburguesa: mostaza, ctsup, cebolla, pepinillos, tomate, salsa, mayonesa y lechuga. Es correcto el anuncio? Explique la forma en la que lleg a la respuesta. 76.  Se descubri que 60% de los turistas que fue a China visitaron la Ciudad Prohibida, el Templo del Cielo, la Gran Muralla y otros sitios histricos dentro o cerca de Beijing. Cuarenta por ciento visit Xian, con sus magncos soldados, caballos y carrozas de terracota, que yacen enterrados desde hace 2 000 aos. Treinta por ciento de los turistas fueron tanto a Beijing como a Xian. Cul es la probabilidad de que un turista haya visitado por lo menos uno de estos lugares? 77.  Considere una nueva goma de mascar que ayuda a quienes desean dejar de fumar. Si 60% de la gente que masca la goma tiene xito en dejar de fumar, cul es la probabilidad de que en un grupo de cuatro fumadores que mascan la goma por lo menos uno deje el cigarro? 78.  Reynolds Construction Company est de acuerdo en no construir casas iguales en una nueva subdivisin. Se ofrecen cinco diseos de exterior a los posibles compradores. La constructora ha uniformado tres planos de interior que pueden incorporarse a cualquiera de los cinco modelos de exteriores. Cuntos planos de exterior e interior se pueden ofrecer a los posibles compradores? 79.  A un nuevo modelo de automvil deportivo le fallan los frenos 15% del tiempo y 5% un mecanismo de direccin defectuoso. Suponga y espere que estos problemas se presenten de manera independiente. Si uno u otro problema se presentan, el automvil recibe el nombre de limn. Si ambos problemas se presentan, el automvil se denomina peligro. Su profesor compr uno de estos automviles el da de ayer. Cul es la probabilidad de que sea: a) un limn? b) un peligro? 80.  En el estado de Maryland, las placas tienen tres nmeros seguidos de tres letras. Cuntas diferentes placas son posibles? 81.  Hay cuatro candidatos para el cargo de director ejecutivo de Dalton Enterprises. Tres de los solicitantes tiene ms de 60 aos de edad. Dos son mujeres, de las cuales slo una rebasa los 60 aos. a) Cul es la probabilidad de que un candidato tenga ms de 60 aos y sea mujer? b) Si el candidato es hombre, cul es la probabilidad de que tenga menos de 60 aos? c) Si el individuo tiene ms de 60 aos, cul es la probabilidad de que sea mujer? 82.  Tim Beckie es propietario de Bleckie Investment y Real Estate Company. La compaa recientemente compr cuatro terrenos en Holly Farms Estates y seis terrenos en Newburg Woods. Los terrenos eran igual de atractivos y se venden en el mismo precio aproximadamente. a)  Cul es la probabilidad de que los siguientes dos terrenos vendidos se ubiquen en Newburg Woods? b)  Cul es la probabilidad de que por lo menos uno de los siguientes cuatro vendidos se ubique en Holly Farms? c) Estos eventos son independientes o dependientes? 83.  La contrasea de una computadora consta de cuatro caracteres. Los caracteres pueden ser una de las 26 letras del alfabeto. Cada carcter se puede incluir ms de una vez. Cuntas diferentes contraseas puede haber? 84.  Una caja con 24 latas contiene 1 lata contaminada. Tres latas se van a elegir al azar para probarlas. a) Cuntas diferentes combinaciones de 3 latas podran seleccionarse? b) Cul es la probabilidad de que la lata contaminada se seleccione para la prueba?

176

Captulo 5

85.  El acertijo de un peridico presenta un problema de comparacin. Los nombres de los 10 presidentes de Estados Unidos aparecen en una columna, y los vicepresidentes se colocan en la segunda columna en lista aleatoria. En el acertijo se pide al lector que ponga en correspondencia a cada presidente con su vicepresidente. Si usted realiza las correspondencias al azar, cuntas correspondencias son posibles? Cul es la probabilidad de que las 10 correspondencias sean correctas? 86.  El siguiente diagrama representa un sistema de dos componentes, A y B, en serie. (Dos componentes A y B estn en serie si ambos deben trabajar para que el sistema funcione.) Suponga que los dos componentes son independientes. Cul es la probabilidad de que el sistema funcione en estas condiciones? La probabilidad de que A funcione es de 0.90 y la probabilidad de que B funciones es de 0.90 tambin.

87.  Horwege Electronics, Inc., compra tubos de televisin a cuatro proveedores. Tyson Wholesale proporciona 20% de los tubos; Fuji Importers, 30%; Kirkpatricks, 25%, y Parts, Inc., 25%. Tyson Wholesale normalmente tiene la mejor calidad, ya que slo 3% de sus tubos llegan defectuosos. Cuatro por ciento de los tubos de Fuji Importers estn defectuosos; 7% de los tubos de Kirkpatricks y 6.5% de los tubos de Parts, Inc. se encuentran defectuosos. a) Cul es el porcentaje total de tubos defectuosos? b)  Un tubo de televisin defectuoso fue descubierto en el ltimo envo. Cul es la probabilidad de que proviniera de Tyson Wholesale? 88.  ABC Auto Insurance clasica a los conductores en buenos, de riesgo medio o malos. Los conductores que solicitan un seguro caen dentro de estos tres grupos en porcentajes de 30%, 50% y 20%, respectivamente. La probabilidad de que un buen conductor tenga un accidente es de 0.01; la probabilidad de un conductor de riesgo medio es de 0.03, y la probabilidad de que un mal conductor tenga un accidente es de 0.10. La compaa le vende al seor Brophy una pliza de seguro y l tiene un accidente. Cul es la probabilidad de que el seor Brophy sea: a) un buen conductor? b) un conductor de riesgo medio? c) un mal conductor?

ejercicios.com
89.  Durante la dcada de los setenta, el programa de juegos Lets Make a Deal tuvo mucho xito en televisin. En el programa a un concursante se le daba a elegir entre tres puertas, detrs de una de las cuales haba un premio. Las otras dos contenan una broma. Despus de que el concursante haba elegido una puerta, el presentador del programa les preguntaba si deseaban cambiar la puerta por alguna de las que no haban elegido. El concursante debera cambiar? Las posibilidades de ganar aumentan el cambio de puertas? Entre al siguiente sitio web, que se encuentra administrado por el Departamento de Estadstica de la Universidad de Carolina del Sur, y ponga a prueba su estrategia: http://www. stat.sc.edu/~west/applets/LetsMakeDeal.html; dirjase al siguiente sitio web y lea respecto de las posibilidades en el juego: http://www.stat.sc.edu/~west/javahtml/LetsMakeaDeal.html. Su estrategia fue correcta?

Ejercicios de la base de datos


90.  Consulte los datos Real Estate, que contienen informacin sobre casas vendidas en el rea de Denver, Colorado, durante el ao pasado. a)  Distribuya los datos en una tabla que muestre el nmero de casas con alberca frente al nmero de casas sin alberca en cada uno de los cinco municipios. Si selecciona una casa al azar, calcule las siguientes probabilidades: 1. La casa se localiza en Township 1 o tiene alberca. 2. Dado que la casa se encuentra en Township 3, que tenga alberca. 3. Tiene alberca y se localiza en Township 3. b)  Distribuya los datos en una tabla que muestre el nmero de casas con cochera frente a las que no la tienen en cada uno de los cinco municipios. Se elige una casa al azar y calcule las siguientes probabilidades. 1. La casa tiene cochera. 2. Si la casa se localiza en Township 5, que no tenga cochera. 3. La casa tiene cochera y se localiza en Township 3. 4. No tiene cochera o se localiza en Township 2.

Estudio de los conceptos de la probabilidad

177

91. C  onsulte los datos Baseball 2005, que contienen informacin sobre los 30 equipos de la Liga Mayor de Bisbol para la temporada 2005. Establezca una variable que divida a los equipos en dos grupos, los que ganaron en la temporada y los que no lo hicieron. Es decir, cree una variable para contar los equipos que ganaron 81 juegos o ms y los que ganaron 80 juegos o menos. Enseguida cree una nueva variable para la asistencia, con tres categoras: una asistencia inferior a 2.0 millones; una asistencia de 2.0 millones a 3.0 millones y una asistencia de 3.0 millones o ms. a)  Elabore una tabla que muestre el nmero de equipos que ganaron en la temporada frente a los que perdieron de acuerdo con las tres categoras de asistencia. Si selecciona un equipo al azar, calcule las siguientes probabilidades: 1. Tener una temporada de victorias. 2. Tener una temporada de victorias o contar con una asistencia de 3.0 millones. 3. Dada una asistencia de ms de 3.0 millones, tener una temporada de victorias. 4.  Tener una temporada de derrotas y contar con una asistencia de menos de 2.0 millones. b) E  labore una tabla que muestre el nmero de equipos que juegan en supercies articiales y naturales de acuerdo con sus marcas de triunfos y derrotas. Si elige un equipo al azar, calcule las siguientes probabilidades: 1. Seleccionar un equipo cuya cancha tenga una supercie natural. 2.  Es mayor la probabilidad de seleccionar un equipo con un registro de victorias cuya cancha tenga una supercie natural o articial? 3. Tener un registro de victorias o una supercie articial. 92.  Consulte los datos Wages, que contienen informacin relacionada con los salarios anuales de una muestra de 100 trabajadores. Tambin incluyen variables relacionadas con la industria en la que labora, los aos de educacin y gnero de cada trabajador. Disee una tabla que muestre la industria en que labora cada trabajador segn su gnero. Seleccione un trabajador en forma aleatoria; calcule la probabilidad de que la persona elegida sea: a) mujer; b) mujer o persona que trabaje en la industria manufacturera; c) mujer, dado que la persona seleccionada trabaja en la industria manufacturera; d) mujer que trabaja en la industria manufacturera.

Comandos de software
1.  nseguida se enumeran los comandos de Excel para E determinar el nmero de permutaciones de la pgina 169. a) Haga clic en Insert en la barra de herramientas; enseguida seleccione Function. b) En cuadro Insert Function, seleccione Statistical como categora; enseguida vaya al recuadro PERMUT en la lista Select a function. Haga clic en OK. c) En el cuadro PERMUT, introduzca 8 en Number y en el cuadro de Number_chosen, 3. La respuesta correcta, 336, aparece dos veces en el cuadro.  Los comandos de Excel para determinar el nmero de 2. combinaciones de la pgina 169 son los siguientes. a )  Haga clic en Insert en la barra de herramientas y, enseguida, seleccione Function. b ) En el cuadro Insert function, seleccione Math & Trig como categora y, enseguida, vaya a COMBIN en la lista Select a function. Haga clic en OK. c) En el cuadro COMBIN, escriba 7 en Number y 3, en Number_chosen. La respuesta correcta, 35, aparece dos veces en el cuadro.

178

Captulo 5

Captulo 5 Respuestas a las autoevaluaciones


5.1 a) Prueba de un nuevo juego de computadora. b)  A 73 jugadores les gust el juego. Hay muchas otras respuestas posibles. c)  No. La probabilidad no puede ser mayor que 1. La probabilidad de que el juego sea un xito si se comercializa es de 65/80, o 0.8125. d) No puede ser menor que 0. Tal vez un error aritmtico. e)  A ms de la mitad de los jugadores que probaron el juego, les gust. (Por supuesto, hay otras posibles respuestas.) 1. 4 reinas en una baraja 4 = = .0769 52 cartas en total 52 2 Clsico. b) Una posibilidad es:

B Ambos A .15 .03 .08

5.2

5.5 (.80)(.80)(.80)(.80) = .4096. 5.6. a) .002, que se determina mediante: b) 0.14, que se determina de la siguiente manera: c)  No, porque existen otras posibilidades, como tres mujeres y un hombre. 5.7 a) P (B4 ) = 105 = .525 200 30 = .286 105 8 7 6 5 1 680 12 11 10 9 = 11 880 = .1414 4 3 2 1 24 = = .002 12 11 10 9 11 880

182 2. = .338 Emprico. 539 3.  El punto de vista del autor al escribir el libro es que la probabilidad de que el DJIA aumente a 12 000 es de 0.25. Usted podra ser ms o menos optimista. Subjetivo. a) i. (50 + 68) = .059 2 000 302 = .849 2 000

5.3

b)

ii. 1

b) P (A2 |B4 ) =

c) P (A2 o B4 ) =

5.8

80 105 30 155 + = = .775 200 200 200 200 a)  La independencia requiere que P(A |B) = P(A). Una posibilidad es: P(visitas frecuentes | s, ubicacin conveniente) = P(visitas frecuentes)

 60/90 = 80/195? No, las dos variables no son independientes.

 Por consiguiente, cualquier probabilidad en la tabla debe calcularse aplicando la regla general de la multiplicacin.

5.4

c)  No son complementarios, pero son mutuamente excluyentes. a)  El evento A se reere a la necesidad de zapatos ortopdicos. El evento B se reere a la necesidad de un tratamiento dental. P (A o B ) = P (A) + P (B ) P (A y B ) = .08 + .15 .03 = .20

Estudio de los conceptos de la probabilidad

179

b)

5.11 1. a) 60, que se calcula multiplicando (5)(4)(3). b) 60, que se calcula mediante la operacin:

Probabilidades conjuntas
60/ 90 25 90

.31 Con frecuencia

2. 24, que se calcula mediante la operacin: 3. 5 040 que se calcula mediante la operacin: 4. a)  56 es correcto, el cual se calcula mediante la operacin: n! 8! = = 56 8 C3 = r !(n r )! 3!(8 3)! b)  S. Hay 45 combinaciones, que se calculan de la siguiente manera: a) 5. b)
10 C2

5! 5 4 3 2 1 = (5 3)! 2 1

/195

Visitas

.13 Ocasionalmente
5/ 90

/90

4! 4! 4! 4 3 2 1 = = = (4 4)! 0! 1 1

Nunca Conveniente no
105/ 195 20/ 105 35

.03

10! 10 9 8 7 6 5 4 3 2 1 = (10 4)! 6 5 4 3 2 1

.10 Con frecuencia .18 Ocasional

/105

Visitas
50/ 105

Nunca

.25

= = =

n! 10! = = 45 r !(n r )! 2!(10 2)! 50! = 117 600 (50 3)! 50! = 19 600 3!(50 3)!

50 P3

5.9

a)

P (A3 |B2 ) =

P (A3 )P (B2 |A3 ) P (A1)P (B2 |A1) + P (A2 )P (B2 |A2 ) + P (A3 )P (B2 |A3 )

b)

(.50) + (.96) = (.30)(.97) + (.20)(.95) + (.50)(.96) ) .480 = = .499 .961

50 P3

5.10 a) (5)(4) = 20 b) (3)(2)(4)(3) = 72

6
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Definir los trminos distribucin de probabilidad y variable aleatoria. 2. Distinguir entre distribuciones de probabilidad continua y discreta. 3. Calcular la media, varianza y desviacin estndar de una distribucin de probabilidad discreta. 4. Describir las caractersticas de la distribucin de probabilidad binomial y su aplicacin en el clculo de probabilidades. 5. Describir las caractersticas de la distribucin de probabilidad hipergeomtrica y su aplicacin en el clculo de probabilidades. 6. Describir las caractersticas de la distribucin de probabilidad de Poisson y su aplicacin en el clculo de probabilidades.

Distribuciones discretas de probabilidad

Croissant Bakery, Inc., ofrece pasteles decorados para cumpleaos, bodas y ocasiones especiales. La pastelera tambin cuenta con pasteles normales. De acuerdo con los datos de la tabla, calcule la media, la varianza y la desviacin estndar de la cantidad de pasteles que venden al da. (Vase el ejercicio 44, objetivo 3.)

Distribuciones discretas de probabilidad

181

Introduccin
Los captulos 2 a 4 se consagraron al estudio de la estadstica descriptiva: datos en bruto organizados en una distribucin de frecuencias, la cual se representa en tablas, grcas y diagramas. Asimismo, se calcul una medida de ubicacin como la media aritmtica, la mediana o la moda para localizar un valor tpico cercano al centro de la distribucin. Mediante el rango y la desviacin estndar se describi la dispersin de los datos. Estos captulos se centran en describir algo que sucedi. A partir del captulo 5, el tema cambia: ahora el anlisis es sobre algo que posiblemente suceda. Esta faceta de la estadstica recibe el nombre de inferencia estadstica. El objetivo consiste en hacer inferencias (armaciones) sobre una poblacin con base en determinada cantidad de observaciones, denominadas muestra, que se selecciona de la poblacin. En el captulo 5 se estableci que una probabilidad es un valor entre 0 y 1, inclusive, y se analiz la forma en que las probabilidades pueden combinarse de acuerdo con las reglas de la adicin y la multiplicacin. Este captulo inicia el estudio de las distribuciones de probabilidad. Una distribucin de probabilidad proporciona toda la gama de valores que se pueden presentar en un experimento. Es similar a una distribucin de frecuencias relativas; sin embargo, en lugar de describir el pasado, describe la probabilidad de que un evento se presente en el futuro. Por ejemplo, si un fabricante de medicamentos arma que cierto tratamiento permitir que 80% de la poblacin baje de peso, la agencia de proteccin al consumidor quiz someta a prueba el tratamiento con una muestra de seis personas. Si la armacin del fabricante es cierta, es casi imposible tener un resultado en el que nadie en la muestra pierda peso y es muy probable que 5 de cada 6 pierdan peso. En este captulo se examinan la media, la varianza y la desviacin estndar de una distribucin de probabilidad, as como tres distribuciones de probabilidad que se presentan con frecuencia: binomial, hipergeomtrica y de Poisson.

Qu es una distribucin de probabilidad?


Una distribucin de probabilidad muestra los posibles resultados de un experimento y la probabilidad de que cada uno se presente. DISTRIBUCIN DE PROBABILIDAD Listado de todos los resultados de un experimento y la probabilidad asociada con cada resultado. Cmo generar una distribucin de probabilidad?

Ejemplo Solucin

Suponga que le interesa el nmero de caras que aparecen en tres lanzamientos de una moneda. Tal es el experimento. Los posibles resultados son: cero caras, una cara, dos caras y tres caras. Cul es la distribucin de probabilidad del nmero de caras? Hay ocho posibles resultados. En el primer lanzamiento puede aparecer una cara, una cruz en el segundo lanzamiento y otra cruz en el tercer lanzamiento de la moneda. O puede obtener cruz, cruz y cara, en ese orden. Para obtener los resultados del conteo (5.8), aplique la frmula de la multiplicacin: (2)(2)(2), es decir, 8 posibles resultados. Estos resultados se listan enseguida.
Lanzamiento de la moneda Resultado posible Primero Segundo Tercero 1 2 3 4 5 6 7 8 C C C C Cr Cr Cr Cr C C Cr Cr C C Cr Cr C Cr C Cr C Cr C Cr Nmero de caras 0 1 1 2 1 2 2 3

182

Captulo 6

Observe que el resultado cero caras ocurre slo una vez; una cara ocurre tres veces; dos caras, tres veces, y el resultado tres caras ocurre una sola vez. Es decir, cero caras se present una de ocho veces. Por consiguiente, la probabilidad de cero caras es de un octavo; la probabilidad de una cara es de tres octavos, etc. La distribucin de probabilidad se muestra en la tabla 6.1. Como uno de estos resultados debe suceder, el total de probabilidades de todos los eventos posibles es 1.000. Esto siempre se cumple. La grca 6.1 contiene la misma informacin. TablA 6.1 Distribucin de probabilidad de los eventos relativos a cero, una, dos y tres
caras en tres lanzamientos de una moneda
mero de N caras, x 0 1 2 3 Total

Probabilidad del resultado, P (x) 1 = .125 8 3 = .375 8 3 = .375 8 1 = .125 8 8 = 1.000 8

P( x ) 3 8 Probabilidad 2 8 1 8 0 0 1 2 3

Nmero de caras

GRFICA 6.1 Presentacin grfica del nmero de caras que resultan de tres lanzamientos
de una moneda y la probabilidad correspondiente

Antes de continuar, observe las caractersticas importantes de una distribucin de probabilidad. CARACTERSTICAS DE UNA DISTRIBUCIN DE PROBABILIDAD 1.  La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive. 2. Los resultados son eventos mutuamente excluyentes. 3.  La lista es exhaustiva. As, la suma de las probabilidades de los diversos eventos es igual a 1.

Distribuciones discretas de probabilidad

183

Repase el ejemplo del lanzamiento de una moneda de la tabla 6.1. La probabilidad de x se representa P(x). De esta manera, la probabilidad de cero caras es P(0 caras) = 0.125, y la probabilidad de una cara es P(1 cara) = 0.375, etc. La suma de estas probabilidades mutuamente excluyentes es de 1; es decir, de acuerdo con la tabla 6.1, 0.125 + 0.375 + 0.375 + 0.125 = 1.00.

Autoevaluacin 6.1

Los posibles resultados de un experimento que implica el lanzamiento de un dado son: uno, dos, tres, cuatro, cinco y seis. a) Elabore una distribucin de probabilidad para el nmero de posibles resultados. b) Represente grficamente la distribucin de probabilidad. c) Cul es la suma de las probabilidades?

Variables aleatorias
En cualquier experimento aleatorio, los resultados se presentan al azar; as, a ste se le denomina variable aleatoria. Por ejemplo, lanzar un dado constituye un experimento: puede ocurrir cualquiera de los seis posibles resultados. Algunos experimentos dan origen a resultados de ndole cuantitativa (como dlares, peso o nmero de nios); otros dan origen a resultados de naturaleza cualitativa (como el color o la aliacin religiosa). Cada valor de la variable aleatoria se relaciona con una probabilidad que indica la posibilidad de un resultado determinado. Unos cuantos ejemplos aclararn el concepto de variable aleatoria.  Si cuenta el nmero de empleados ausentes en el turno matutino del lunes, el nmero puede ser 0, 1, 2, 3, El nmero de ausencias es una variable aleatoria.  Si pesa cuatro lingotes de acero, los pesos pueden ser de 2 492 libras, 2 497 libras, 2 506 libras, etc. El peso es una variable aleatoria.  Si lanza dos monedas y cuenta el nmero de caras, puede caer cero, una o dos caras. Como el nmero de caras que resulta de este experimento se debe al azar, el nmero de caras que caen es una variable aleatoria.  Otras variables aleatorias pueden ser el nmero de focos defectuosos producidos por hora en Cleveland Company, Inc.; la calidad (9, 10, 11 o 12) de los miembros del equipo de basquetbol femenil de St. James; el nmero de corredores del maratn de Boston en la carrera de 2006 y la cantidad diaria de conductores multados por conducir bajo la inuencia del alcohol en Texas. VARIABLE ALEATORIA Cantidad que resulta de un experimento que, por azar, puede adoptar diferentes valores. El siguiente diagrama ilustra los trminos experimento, resultado, evento y variable aleatoria. Primero, en el caso del experimento en el que se lanza una moneda tres veces, hay ocho posibles resultados. En este experimento, interesa el evento de que se presenta una cara en tres lanzamientos. La variable aleatoria es el nmero de caras. En trminos de probabilidad, desea saber la probabilidad del evento que tiene una variable aleatoria igual a 1. El resultado es P(1 cara en 3 lanzamientos) = 0.375.
Posibles resultados de tres lanzamientos de moneda CCCr CCrC CrCC CCrCr CrCCr CrCrC

CCC

CrCrCr

Ocurre el evento {una cara}, y la variable aleatoria x = 1.

Una variable aleatoria puede ser discreta o continua.

184

Captulo 6

Variable aleatoria discreta


Una variable aleatoria discreta adopta slo cierto nmero de valores separados. Si hay 100 empleados, el recuento de la cantidad de ausentes el lunes slo puede ser 0, 1, 2, 3, , 100. Una variable discreta suele ser resultado de contar algo. Por denicin:

VARIABLE ALEATORIA DISCRETA Variable aleatoria que adopta slo valores claramente separados.

A veces, una variable aleatoria discreta asume valores fraccionarios o decimales. Estos valores deben estar separados: debe haber cierta distancia entre ellos. Por ejemplo, las calicaciones de los jueces por destreza tcnica y formas artsticas en una competencia de patinaje artstico son valores decimales, como 7.2, 8.9 y 9.7. Dichos valores son discretos, pues hay una distancia entre calicaciones de 8.3 y 8.4. Una calicacin no puede tener un valor de 8.34 o de 8.347, por ejemplo.

Variable aleatoria continua


Por otra parte, si la variable aleatoria es continua, es una distribucin de probabilidad continua. Si mide algo, como la anchura de una recmara, la estatura de una persona o la presin de la llanta de un automvil, se trata de una variable aleatoria continua. Se puede suponer una innidad de valores, con ciertas limitaciones. Por ejemplo:  Los tiempos de los vuelos comerciales entre Atlanta y Los ngeles son de 4.67 horas, 5.13 horas, etc. La variable aleatoria es la cantidad de horas.  La presin, medida en libras por pulgada cuadrada (psi), en un nuevo neumtico Chevy Trail-blazer puede ser de 32.78 psi, 31.62 psi, 33.07 psi, etc. En otras palabras, es razonable que se presente cualquier valor entre 28 y 35. La variable aleatoria es la presin de la llanta. Por lgica, si organiza un conjunto de posibles valores de una variable aleatoria en una distribucin de probabilidad, el resultado es una distribucin de probabilidad. As, cul es la diferencia entre una distribucin de probabilidad y una variable aleatoria? Una variable aleatoria representa el resultado particular de un experimento. Una distribucin de probabilidad representa todos los posibles resultados, as como la correspondiente probabilidad. Las herramientas que se utilizan, as como las interpretaciones probabilsticas, son diferentes en el caso de distribuciones de probabilidades discretas y continuas. Este captulo se limita al anlisis e interpretacin de distribuciones discretas. En el siguiente captulo estudiar las distribuciones continuas. Cul dira que es la diferencia entre los dos tipos de distribuciones? Por lo general, una distribucin discreta es el resultado de contar algo, como: El nmero de caras que se presentan en tres lanzamientos de una moneda. El nmero de estudiantes que obtienen A en clase.  El nmero de empleados de produccin que se ausentaron hoy en el segundo turno.  El nmero de comerciales de 30 segundos que pasan en la NBC de las 8 a las 11 de la noche.

Las distribuciones continuas son el resultado de algn tipo de medicin, como: La duracin de cada cancin en el ltimo lbum de Tim McGraw. El peso de cada estudiante de esta clase.

Distribuciones discretas de probabilidad

185

La temperatura ambiente en el momento en que lee este libro.  La suma de dinero que gana cada uno de los 750 jugadores actuales en la lista de los equipos de la Liga Mayor de Bisbol.

Media, varianza y desviacin estndar de una distribucin de probabilidad


En el captulo 3 estudi medidas de ubicacin y variacin de una distribucin de frecuencias. La media indica la localizacin central de los datos, y la varianza describe la dispersin de los datos. De forma similar, una distribucin de probabilidad queda resumida por su media y su varianza. La media de una distribucin de frecuencias se identica mediante la letra minscula griega mu (), y la desviacin estndar, con sigma ().

Media
La media constituye un valor tpico para representar la localizacin central de una distribucin de probabilidad. Tambin es el valor promedio de larga duracin de la variable aleatoria. La media de una distribucin de probabilidad tambin recibe el nombre de valor esperado. Se trata de un promedio ponderado en el que los posibles valores de una variable aleatoria se ponderan con sus correspondientes probabilidades de ocurrir. La media de una distribucin de probabilidad discreta se calcula con la frmula:

MEDIA DE UNA DISTRIBUCIN DE PROBABILIDAD

= [xP(x)]

[6.1]

Aqu P(x) es la probabilidad de un valor particular x. En otras palabras, se multiplica cada valor x por la probabilidad de que ocurra y enseguida se suman los productos.

Varianza y desviacin estndar


Como se observ, la media constituye un valor tpico para resumir una distribucin de probabilidad discreta. Sin embargo, sta no describe el grado de dispersin (variacin) en una distribucin. La varianza s lo hace. La frmula para la varianza de una distribucin de probabilidad es:

VARIANZA DE UNA DISTRIBUCIN DE PROBABILIDAD

2 = [(x )2P(x)]

[6.2]

Los pasos para el clculo son los siguientes: 1. La media se resta de cada valor y la diferencia se eleva al cuadrado. 2. Cada diferencia al cuadrado se multiplica por su probabilidad. 3. Se suman los productos que resultan para obtener la varianza.
2 La desviacin _ estndar, , se determina al extraer la raz cuadrada positiva de ; 2 es decir, = . Un ejemplo ayudar a explicar los detalles del clculo e interpretacin de la media y la desviacin estndar de una distribucin de probabilidad.

186

Captulo 6

Ejemplo

John Ragsdale vende automviles nuevos en Pelican Ford. Por lo general, John vende la mayor cantidad de automviles el sbado. Ide la siguiente distribucin de probabilidades de la cantidad de automviles que espera vender un sbado determinado.
antidad de C automviles vendidos, x 0 1 2 3 4 Total Probabilidad, P (x) .10 .20 .30 .30 .10 1.00

1. De qu tipo de distribucin se trata? 2. Cuntos automviles espera vender John un sbado normal? 3. Cul es la varianza de la distribucin?

Solucin

1.  Se trata de una distribucin de probabilidad discreta para la variable aleatoria denominada nmero de automviles vendidos. Observe que John slo espera vender cierto margen de automviles; no espera vender 5 automviles ni 50. Adems, no puede vender medio automvil. Slo puede vender 0, 1, 2, 3 o 4 automviles. Asimismo, los resultados son mutuamente excluyentes: no puede vender un total de 3 y 4 automviles el mismo sbado. 2.  La media de la cantidad de automviles vendidos se calcula al multiplicar el nmero de automviles vendidos por la probabilidad de vender dicho nmero, y sumar los productos de acuerdo con la frmula (6.1): = [xP (x )] = 0(.10) + 1(.20) + 2(.30) + 3(.30) + 4(.10 0) = 2.1 Estos clculos se resumen en la siguiente tabla.
Nmero de automviles vendidos, x

Probabilidad P (x )

x P (x ) 0.00 0.20 0.60 0.90 0.40 = 2.10

0 .10 1 .20 2 .30 3 .30 4 .10 Total 1.00

 Cmo interpretar una media de 2.1? Este valor indica que, a lo largo de una gran cantidad de sbados, John Ragsdale espera vender un promedio de 2.1 automviles por da. Por supuesto, no es posible vender exactamente 2.1 automviles un sbado en particular. Sin embargo, el valor esperado se utiliza para predecir la media aritmtica de la cantidad de automviles vendidos a la larga. Por ejemplo, si John trabaja 50 sbados en un ao, puede esperar vender (50)(2.1) o 105 automviles slo los sbados. Por consiguiente, a veces la media recibe el nombre de valor esperado.

Distribuciones discretas de probabilidad

187

3.  De nuevo, una tabla resulta til para sistematizar los clculos de la varianza, que es de 1.290.
mero de auto- N mviles vendidos, Probabilidad x P (x )

(x )

(x )2

(x )2P (x ) 0.441 0.242 0.003 0.243 0.361 2 = 1.290

0 .10 0 2.1 4.41 1 .20 1 2.1 1.21 2 .30 2 2.1 0.01 3 .30 3 2.1 0.81 4 .10 4 2.1 3.61

Recuerde que la desviacin estndar, , es la raz cuadrada positiva de la varianza. En este ejemplo es 2 = 1.290 = 1.136 automviles. Cmo interpretar una desviacin estndar de 1.136 automviles? Si la vendedora Rita Kirsch tambin vendi un promedio de 2.1 automviles los sbados y la desviacin estndar en sus ventas fue de 1.91 automviles, concluira que hay ms variabilidad en las ventas sabatinas de Kirsch que en las de Ragsdale (pues 1.91 > 1.136).

Autoevaluacin 6.2

Pizza Palace ofrece tres tamaos de refresco de cola chico, mediano y grande para acompaar su pizza. Los refrescos cuestan $0.80, $0.90 y $1.20, respectivamente. Treinta por ciento de los pedidos corresponde al tamao chico; 50%, al mediano, y 20%, al grande. Organice el tamao de los refrescos y la probabilidad de venta en una distribucin de frecuencias. a) Se trata de una distribucin de probabilidad discreta? Indique por qu. b) Calcule la suma promedio que se cobra por refresco de cola. c)  Cul es la varianza de la cantidad que se cobra por un refresco de cola? Cul es la desviacin estndar?

Ejercicios
1. Calcule la media y la varianza de la siguiente distribucin de probabilidad discreta. x 2. 0 1 2 3 P (x) .2 .4 .3 .1

Calcule la media y la varianza de la siguiente distribucin de probabilidad discreta. x 2 8 10 P (x) .5 .3 .2

3.  Las tres tablas que aparecen en la parte superior de la pgina 188 muestran variables aleatorias y sus probabilidades. Sin embargo, slo una constituye en realidad una distribucin de probabilidad.

188

Captulo 6

a) Cul de ellas es? x 5 10 15 20 P (x) x P (x) x P (x) .5 .3 .2 .4

.3 5 .3 10 .2 15 .4 20

.1 5 .3 10 .2 15 .4 20

b) Con la distribucin de probabilidad correcta, calcule la probabilidad de que x sea: 1) Exactamente 15. 2) No mayor que 10. 3) Mayor que 5. 4. Cules de las siguientes variables aleatorias son discretas y cules continuas? a) El nmero de cuentas abiertas por un vendedor en 1 ao. b) El tiempo que transcurre entre el turno de cada cliente en un cajero automtico. c) El nmero de clientes en la esttica Big Nick. d) La cantidad de combustible que contiene el tanque de gasolina de su automvil. e) La cantidad de miembros del jurado pertenecientes a una minora. f ) La temperatura ambiente el da de hoy. 5.  La informacin que sigue representa el nmero de llamadas diarias al servicio de emergencia por el servicio voluntario de ambulancias de Walterboro, Carolina del Sur, durante los ltimos 50 das. En otras palabras, hubo 22 das en los que se realizaron 2 llamadas de emergencia, y 9 das en los que se realizaron 3 llamadas de emergencia. Nmero de llamadas Frecuencia 8 10 22 9 1 50

0 1 2 3 4 Total

a)  Convierta esta informacin sobre el nmero de llamadas en una distribucin de probabilidad. b) Constituye un ejemplo de distribucin de probabilidad discreta o continua? c) Cul es la media de la cantidad de llamadas de emergencia al da? d) Cul es la desviacin estndar de la cantidad de llamadas diarias? 6.  El director de admisiones de Kinzua University en Nova Scotia calcul la distribucin de admisiones de estudiantes para el segundo semestre con base en la experiencia pasada. Cul es el nmero de admisiones esperado para el segundo semestre? Calcule la varianza y la desviacin estndar del nmero de admisiones.

Admisiones 1 000 1 200 1 500

Probabilidad .6 .3 .1

7.  Belk Department Store tiene una venta especial este n de semana. Los clientes que registren cargos por compras de ms de $50 en su tarjeta de crdito de Belk recibirn una tarjeta especial de la lotera de Belk. El cliente raspar la tarjeta, la cual indica la cantidad que se retendr del total de compras. A continuacin aparecen la suma de precios y el porcentaje del tiempo que se deducir del total de las compras. Suma de premios $ 10 25 50 100 Probabilidad .50 .40 .08 .02

Distribuciones discretas de probabilidad

189

a) Cul es la cantidad media deducida de la compra total? b) Cul es la desviacin estndar de la cantidad deducida del total de las compras? 8.  La Downtown Parking Authority de Tampa, Florida, inform los siguientes datos de una muestra de 250 clientes relacionada con la cantidad de horas que se estacionan los automviles y las cantidades que pagan. Nmero de horas Frecuencia 20 38 53 45 40 13 5 36 250 Pago $ 3.00 6.00 9.00 12.00 14.00 16.00 18.00 20.00

1 2 3 4 5 6 7 8

a)  Convierta la informacin relacionada con la cantidad de horas de estacionamiento en una distribucin de probabilidad. Es una distribucin de probabilidad discreta o continua? b)  Determine la media y la desviacin estndar del nmero de horas de estacionamiento. Qu respondera si se le pregunta por la cantidad de tiempo que se estaciona un cliente normal? c) Calcule la media y la desviacin estndar del pago.

Distribucin de probabilidad binomial


La distribucin de probabilidad binomial es una distribucin de probabilidad discreta que se presenta con mucha frecuencia. Una caracterstica de una distribucin binomial consiste en que slo hay dos posibles resultados en determinado intento de un experimento. Por ejemplo, el enunciado en una pregunta de cierto o falso es o cierto o falso. Los resultados son mutuamente excluyentes, lo cual signica que la respuesta a una pregunta de cierto o falso no puede ser al mismo tiempo cierta o falsa. En otro ejemplo, un producto se clasica como aceptable o inaceptable por el departamento de control de calidad; un trabajador se clasica como empleado o desempleado, y una llamada da como resultado que el cliente compre el producto o no lo compre. Con frecuencia, se clasican los dos posibles resultados como xito y fracaso. Sin embargo, esta clasicacin no implica que un resultado sea bueno y el otro malo. Otra caracterstica de la distribucin binomial es el hecho de que la variable aleatoria es el resultado de conteos. Es decir, se cuenta el nmero de xitos en el nmero total de pruebas. Lance una moneda equilibrada cinco veces y cuente el nmero de veces que aparece una cara; seleccione 10 trabajadores y liste cuntos tienen ms de 50 aos, o seleccione 20 cajas de Raisin Bran de Kellog y cuente el nmero de cajas que pesan ms de lo que indica el paquete. Una tercera caracterstica de una distribucin binomial consiste en que la probabilidad de xito es la misma de una prueba a otra. Dos ejemplos son:  La probabilidad de que adivine la primera pregunta de una prueba de verdadero o falso (xito) es de un medio. sta constituye la primera prueba. La probabilidad de que adivine la segunda pregunta (segunda prueba) tambin es de un medio; la probabilidad de xito en la tercera prueba es de otro medio, y as sucesivamente.

190

Captulo 6

 Si la experiencia revel que el puente giratorio sobre Intercoastal Waterway, en Socastee, se elev una de cada 20 veces que usted se aproxim a l, entonces la probabilidad de una vigsima (un xito) de que se eleve la prxima ocasin que se acerque a l es de un veinteavo, etctera. La ltima caracterstica de una distribucin de probabilidad binomial consiste en que cada prueba es independiente de cualquiera otra. Que sean independientes signica que no existen patrones en las pruebas. El resultado de una prueba en particular no inuye en el resultado de otra prueba.
Caractersticas binomiales

EXPERIMENTO DE PROBABILIDAD BINOMIAL 1.  El resultado de cada prueba de un experimento se clasifica en una de dos categoras mutuamente excluyentes: xito o fracaso. 2.  La variable aleatoria permite contar el nmero de xitos en una cantidad fija de pruebas. 3.  La probabilidad de xito y fracaso es la misma para cada prueba. 4.  Las pruebas son independientes, lo cual significa que el resultado de una prueba no influye en el resultado de otra prueba.

Cmo se calcula una probabilidad binomial?


Para construir una probabilidad binomial en particular se necesita: 1) el nmero de pruebas; 2) la probabilidad de xito de cada prueba. Por ejemplo, si un examen al trmino de un seminario de administracin incluye 20 preguntas de opcin mltiple, el nmero de pruebas es de 20. Si cada pregunta contiene cinco elecciones y slo una de ellas es correcta, la probabilidad de xito en cada prueba es de 0.20. Por consiguiente, la probabilidad de que una persona sin conocimientos del tema d con la respuesta a una pregunta es de 0.20. De modo que se cumplen las condiciones de la distribucin binomial recin indicadas. Una probabilidad binomial se calcula mediante la frmula: FRMULA DE LA PROBABILIDAD BINOMIAL En sta: C representa una combinacin. n es el nmero de pruebas. x es la variable aleatoria denida como el nmero de xitos. es la probabilidad de un xito en cada prueba. Empleamos la letra griega (pi) para representar un parmetro de poblacin binomial. No se confunda con la constante matemtica 3.1416. P(x) = nCx x(1 )n x [6.3]

Ejemplo Solucin

US Airways tiene cinco vuelos diarios de Pittsburgh al Aeropuerto Regional de Bradford, Pennsylvania. Suponga que la probabilidad de que cualquier vuelo llegue tarde sea de 0.20. Cul es la probabilidad de que ninguno de los vuelos llegue tarde hoy? Cul es la probabilidad de que exactamente uno de los vuelos llegue tarde hoy? Aplique la frmula (6.3). La probabilidad de que un vuelo llegue tarde es de 0.20, as, = 0.20. Hay cinco vuelos, as, n = 5, y x, la variable aleatoria, se reere al nmero de xitos. En este caso un xito consiste en que un avin llegue tarde. Como no hay demoras en las llegadas, x = 0. P (0) = nCx ()x (1 )n x = 5C0 (.20)0 (1 .20)5 0 = (1)(1)(.3277) = .3277

Distribuciones discretas de probabilidad

191

La probabilidad de que exactamente uno de los cinco vuelos llegue tarde hoy es de 0.4096, que se calcula de la siguiente manera: P (1) = nCx ()x (1 )n x = 5C1(.20)1(1 .20)5 1 = (5)(.20)(.4096) = .4096 La distribucin de probabilidad binomial completa con = 0.20 y n = 5 aparece a la izquierda de la siguiente hoja de clculo de Excel. Tambin se muestra un diagrama de barras de la distribucin de probabilidad. Observe que la probabilidad de que exactamente 3 vuelos lleguen tarde es de 0.0512, y, del diagrama de barras, que la distribucin del nmero de llegadas demoradas tiene un sesgo positivo. Las instrucciones de Excel para calcular estas probabilidades son las mismas que las de la salida de Excel de la pgina 219.

La media () y la varianza (2) de una distribucin binomial se calculan con la siguiente frmula, fcil y rpida: MEDIA DE UNA DISTRIBUCIN BINOMIAL = n [6.4]

VARIANZA DE UNA DISTRIBUCIN BINOMIAL

2 = n (1 )

[6.5]

Por ejemplo, respecto del nmero de vuelos retrasados, recuerde que = 0.20 y n = 5. Por tanto, = n = (5)(.20) = 1.0 2 = n (1 ) = (5)(.20)(1 .20) = .80

192

Captulo 6

La media de 1.0 y la varianza de 0.80 se verican con las frmulas (6.1) y (6.2). La distribucin de probabilidad del resultado de Excel de la pgina anterior, as como los detalles de los clculos, aparecen a continuacin.
Nmero de vuelos retrasados, x

P(x)

xP(x)

(x )2

(x )2P(x) 0.3277 0 0.2048 0.2048 0.0576 0.0048 2 = 0.7997

0 0.3277 1 0.4096 2 0.2048 3 0.0512 4 0.0064 5 0.0003

0.0000 1 1 0.4096 0 0 0.4096 1 1 0.1536 2 4 0.0256 3 9 0.0015 4 16 = 1.0000

Tablas de probabilidad binomial


Con la frmula (6.3) se construye una distribucin de probabilidad binomial para cualesquiera valores de n y . Sin embargo, si n es grande, los clculos consumen ms tiempo. Por conveniencia, las tablas del apndice B.9 muestran el resultado de la aplicacin de la frmula en el caso de varios valores de n y . La tabla 6.2 muestra parte del apndice B.9 para n = 6 y diversos valores de . TablA 6.2 Probabilidades binomiales para n = 6 y valores selectos de
n6 Probabilidad x \ 0 1 2 3 4 5 6 .05 .735 .232 .031 .002 .000 .000 .000 .1 .531 .354 .098 .015 .001 .000 .000 .2 .262 .393 .246 .082 .015 .002 .000 .3 .118 .303 .324 .185 .060 .010 .001 .4 .047 .187 .311 .276 .138 .037 .004 .5 .016 .094 .234 .313 .234 .094 .016 .6 .004 .037 .138 .276 .311 .187 .047 .7 .001 .010 .060 .185 .324 .303 .118 .8 .000 .002 .015 .082 .246 .393 .262 .9 .000 .000 .001 .015 .098 .354 .531 .95 .000 .000 .000 .002 .031 .232 .735

Ejemplo

Cinco por ciento de los engranajes de tornillo producidos en una fresadora automtica de alta velocidad Carter-Bell se encuentra defectuoso. Cul es la probabilidad de que, en seis engranajes seleccionados, ninguno se encuentre defectuoso? Exactamente uno? Exactamente dos? Exactamente tres? Exactamente cuatro? Exactamente cinco? Exactamente seis de seis? Las condiciones binomiales se cumplen: a) hay slo dos posibles resultados (un engranaje determinado est defectuoso o es aceptable); b) existe una cantidad ja de pruebas (6); c) hay una probabilidad constante de xito (0.05); d) las pruebas son independientes. Consulte la tabla 6.2 y localice la probabilidad de que exactamente cero engranajes se encuentren defectuosos. Descienda por el margen izquierdo hasta llegar al valor 0 de x. Ahora siga por la horizontal hasta la columna con un encabezado de 0.05 para determinar la probabilidad. sta es de 0.735. La probabilidad de que haya exactamente un engranaje defectuoso en una muestra de seis engranajes de tornillo es de 0.232. La distribucin de probabilidad completa de n = 6 y = 0.05 es la siguiente:

Solucin

Distribuciones discretas de probabilidad

193

Nmero de engranajes Probabilidad defectuosos, de que ocurra, x P (x ) 0 1 2 3 .735 .232 .031 .002

Nmero de engranajes defectuosos, x 4 5 6

Probabilidad de que ocurra, P (x ) .000 .000 .000

Por supuesto, existe una ligera posibilidad de que salgan cinco engranajes defectuosos de seis selecciones aleatorias. sta es de 0.00000178, que se determina al sustituir los valores adecuados en la frmula binomial: P(5) = 6C5(.05)5(.95)1 = (6)(.05)5(.95) = .00000178 En el caso de seis de seis, la probabilidad exacta es de 0.000000016. Por consiguiente, la probabilidad de seleccionar cinco o seis engranajes defectuosos de una muestra de seis es muy pequea. Es posible calcular la media o valor esperado de la distribucin del nmero de engranajes defectuosos: = n = (6)(.05) = 0.30 2 = n (1 ) = 6(.05)(.95) = 0.285

El software MegaStat tambin calcula las probabilidades de una distribucin binomial. A continuacin aparece la salida del ejemplo anterior. En MegaStat, p se utiliza para representar el xito en lugar de . Tambin se incluyen la probabilidad acumulativa, valor esperado, varianza y desviacin estndar.

194

Captulo 6

Autoevaluacin 6.3

Ocho por ciento de los empleados de la planta de General Mills en Laskey Road recibe su sueldo bimestral por medio de transferencias de fondos electrnicos. Este mecanismo tambin recibe el nombre de depsito directo. Suponga que selecciona una muestra aleatoria de siete empleados. a) Esta situacin cumple los supuestos de la distribucin binomial? b) Cul es la probabilidad de que a los siete empleados se les haga un depsito directo? c)  Aplique la frmula (6.3) para determinar la probabilidad exacta de que a cuatro de los siete empleados de la muestra se les haga un depsito directo. d) De acuerdo con el apndice B.9, verifique sus respuestas a los incisos b y c.

El apndice B.9 es limitado; ofrece probabilidades para n valores de 1 a 15, y para valores de 0.05, 0.10, , 0.90 y 0.95. Un programa de software puede generar las probabilidades de un nmero de especco de xitos, dados n y . La salida Excel que aparece a continuacin muestra la probabilidad cuando n = 40 y = 0.09. Observe que el nmero de xitos se detiene en 15, pues las probabilidades de 16 a 40 se aproximan mucho a 0.

Se deben mencionar otras cuestiones adicionales relacionadas con la distribucin de probabilidad binomial. 1.  Si n permanece igual y se incrementa de 0.05 a 0.95, la forma de la distribucin cambia. Observe la tabla 6.3 y la grca 6.2. Las probabilidades de que sea 0.05 TablA 6.3 Probabilidad de 0, 1, 2, xitos para valores de de 0.05, 0.10, 0.20, 0.50 y
0.70 y una n de 10
.1 .349 .387 .194 .057 .011 .001 .000 .000 .000 .000 .000 x \ 0 1 2 3 4 5 6 7 8 9 10 .05 .599 .315 .075 .010 .001 .000 .000 .000 .000 .000 .000 .2 .107 .268 .302 .201 .088 .026 .006 .001 .000 .000 .000 .3 .028 .121 .233 .267 .200 .103 .037 .009 .001 .000 .000 .4 .006 .040 .121 .215 .251 .201 .111 .042 .011 .002 .000 .5 .001 .010 .044 .117 .205 .246 .205 .117 .044 .010 .001 .6 .000 .002 .011 .042 .111 .201 .251 .215 .121 .040 .006 .7 .000 .000 .001 .009 .037 .103 .200 .267 .233 .121 .028 .8 .000 .000 .000 .001 .006 .026 .088 .201 .302 .268 .107 .9 .000 .000 .000 .000 .000 .001 .011 .057 .194 .387 .349 .95 .000 .000 .000 .000 .000 .000 .001 .010 .075 .315 .599

Distribuciones discretas de probabilidad

195

presentan un sesgo positivo. Conforme se aproxima a 0.50, la distribucin se torna ms simtrica. Conforme supere el 0.50 y se aproxime a 0.95, la distribucin de probabilidad adquiere un sesgo negativo. La tabla 6.3 destaca las probabilidades de n = 10 y valores de de 0.05, 0.10, 0.20, 0.50 y 0.70. Las grcas de estas distribuciones de probabilidad se muestran en la grca 6.2.

P( x ) .60 .50 .40 .30 .20 .10 .00 = .05 n = 10 = .10 n = 10 = .20 n = 10 = .50 n = 10 = .70 n = 10

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

0 1 2 3 4 5 6 7 8 9 10

xitos

xitos

xitos

xitos

xitos

GRFICA 6.2 Representacin grfica de la distribucin de probabilidad binomial para valores


de de 0.05, 0.10, 0.20, 0.50 y 0.70 y una n de 10

2.  Si , la probabilidad de xito, conserva el mismo valor, pero n aumenta, la forma de la distribucin binomial se torna ms simtrica. La grca 6.3 muestra el caso en el que permanece constante en 0.10, pero n se incrementa de 7 a 40.

P(x) .50 n=7 .40 .30 .20 .10 .00 n = 12 n = 20 n = 40

01234

01234567

012345678

0 1 2 3 4 5 6 7 8 9 10 11

Nmero de xitos (x)

GRFICA 6.3 Representacin grfica de la distribucin de probabilidad binomial


para valores de de 0.10 y una n de 7, 12, 20 y 40

196

Captulo 6

Ejercicios
9.  En una situacin binomial, n = 4 y = 0.25. Determine las probabilidades de los siguientes eventos con la frmula binomial. a) x = 2 b) x = 3 10.  En una situacin binomial, n = 5 y = 0.40. Determine las probabilidades de los siguientes eventos con la frmula binomial. a) x = 1 b) x = 2 11. Suponga una distribucin binomial en la que n = 3 y = 0.60. a) Consulte el apndice B.9 y elabore una lista de probabilidades de x de 0 a 3. b)  Determine la media y la desviacin estndar de la distribucin a partir de las deniciones generales de las frmulas (6.1) y (6.2). 12. Suponga que existe una distribucin binomial en la que n = 5 y = 0.30. a) Consulte el apndice B.9 y elabore una lista de probabilidades de x de 0 a 3. b)  Determine la media y la desviacin estndar de la distribucin a partir de las deniciones generales de las frmulas (6.1) y (6.2). 13.  Un estudio de la American Society of Investors descubri que 30% de inversionistas particulares haba utilizado un agente de descuentos. En una muestra aleatoria de nueve personas, cul es la probabilidad de que: a) exactamente dos personas hayan utilizado un agente de descuentos? b) exactamente cuatro personas hayan utilizado un agente de descuentos? c) ninguna persona haya utilizado un agente de descuentos? 14.  El Servicio Postal de Estados Unidos informa que 95% de la correspondencia de primera clase dentro de la misma ciudad se entrega en un periodo de dos das a partir del momento en que se enva. Se enviaron seis cartas de forma aleatoria a diferentes lugares. a) Cul es la probabilidad de que las seis lleguen en un plazo de dos das? b) Cul es la probabilidad de que exactamente cinco lleguen en un plazo de dos das? c) Determine la media del nmero de cartas que llegarn en un plazo de dos das. d)  Calcule la varianza y la desviacin estndar del nmero de cartas que llegarn en un plazo de dos das. 15.  Las normas de la industria sugieren que 10% de los vehculos nuevos requiere un servicio de garanta durante el primer ao. El da de ayer, Jones Nissan, en Sumter, Carolina del Sur, vendi 12 automviles marca Nissan. a)  Cul es la probabilidad de que ninguno de estos vehculos requiera servicio de garanta? b)  Cul es la probabilidad de que exactamente uno de estos vehculos requiera servicio de garanta? c)  Determine la probabilidad de que exactamente dos de estos vehculos requiera servicio de garanta. d) Calcule la media y la desviacin estndar de esta distribucin de probabilidad. 16.  Un agente de telemarketing hace seis llamadas por hora y es capaz de hacer una venta con 30% de estos contactos. Para las siguientes dos horas, determine: a) la probabilidad de realizar exactamente cuatro ventas; b) la probabilidad de no realizar ninguna venta; c) la probabilidad de hacer exactamente dos ventas; d) la media de la cantidad de ventas durante el periodo de dos horas. 17.  Una encuesta reciente de la American Accounting Association revel que 23% de los estudiantes graduados en contabilidad elige la contadura pblica. Suponga que elige una muestra de 15 recin graduados. a) Cul es la probabilidad de que dos hayan elegido contadura pblica? b) Cul es la probabilidad de que cinco hayan elegido contadura pblica? c) Cuntos graduados esperara que eligieran contadura pblica? 18.  Puede sealar la diferencia entre Coca-Cola y Pepsi en una prueba de degustacin a ciegas? La mayora arma que puede hacerlo y se inclina por una u otra marca. Sin embargo, las investigaciones sugieren que la gente identica correctamente una muestra de uno de estos productos slo 60% de las veces. Suponga que decide investigar esta cuestin y selecciona una muestra de 15 estudiantes universitarios. a)  Cuntos de los 15 estudiantes esperara que identicaran correctamente la Coca-Cola o la Pepsi? b)  Cul es la probabilidad de que exactamente 10 de los estudiantes que participaron en la encuesta identiquen correctamente la Coca Cola o la Pepsi? c)  Cul es la probabilidad de que por lo menos 10 estudiantes identiquen correctamente la Coca-Cola o la Pepsi?

Distribuciones discretas de probabilidad

197

Distribuciones de probabilidad binomial acumulada


Tal vez desee conocer la probabilidad de adivinar la respuesta a 6 o ms preguntas de verdadero o falso de un total de 10. O quizs est interesado en la probabilidad de seleccionar, en forma aleatoria, menos de dos artculos defectuosos en la produccin de la hora anterior. En estos casos necesita distribuciones de frecuencia acumulada similares a las del captulo 2 (vase la p. 41). El siguiente ejemplo ilustra este hecho. Un estudio del Departamento de Transporte de Illinois concluy que 76.2% de quienes ocupaban la parte anterior en los vehculos utilizaba cinturn de seguridad. Esto signica que los dos ocupantes de la parte delantera utilizaban cinturones de seguridad. Suponga que decide comparar la informacin con el uso actual que se da al cinturn de seguridad. Seleccione una muestra de 12 vehculos. 1.  Cul es la probabilidad de que los ocupantes de la parte delantera de exactamente 7 de 12 vehculos seleccionados utilicen cinturones de seguridad? 2.  Cul es la probabilidad de que los ocupantes de la parte delantera de por lo menos 7 de 12 vehculos utilicen cinturn de seguridad?

Ejemplo

Solucin

Esta situacin satisface los requisitos binomiales.  En un vehculo en particular, ambos ocupantes de la parte delantera utilizan cinturn de seguridad o no lo hacen. Slo hay dos posibles resultados.  Existe una cantidad ja de pruebas, 12 en este caso, pues se verican 12 vehculos.  La probabilidad de un xito (los ocupantes utilizan cinturn de seguridad) es la misma de un vehculo al siguiente: 76.2%.  Las pruebas son independientes. Si, en el cuarto vehculo seleccionado en la muestra, todos los ocupantes utilizan cinturn de seguridad, esto no inuye en los resultados del quinto o dcimo vehculos. Para determinar la probabilidad de que los ocupantes de exactamente 7 vehculos de la muestra utilicen cinturn de seguridad, aplique la frmula (6.3). En este caso, n = 12 y = 0.762. P (x = 7|n = 12 y = .762) =
7 12 7 12C7 (.762) (1 .762)

= 792(.149171)(.000764) = .0902

De esta manera, concluye que la probabilidad de que los ocupantes de exactamente 7 de los 12 vehculos de la muestra utilicen cinturones de seguridad es de aproximadamente 9%. Como se hizo en esta ecuacin, con frecuencia se emplea una barra | para dar a entender dado que. As, en esta ecuacin busca saber la probabilidad de que x sea igual a 7 dado que el nmero de pruebas es de 12 y la probabilidad de un xito es de 0.762. Para determinar la probabilidad de que los ocupantes en 7 o ms de los vehculos utilicen su cinturn de seguridad, aplique la frmula (6.3) de este captulo, as como la regla especial de la adicin del captulo anterior [vase frmula (5.2), p. 147]. Como los eventos son mutuamente excluyentes (lo cual signica que una muestra de 12 vehculos no puede tener un total de 7 ni, al mismo tiempo, un total de 8 vehculos en que los ocupantes utilizan cinturn de seguridad), se determina la probabilidad de que en 7 de los vehculos los ocupantes utilizan cinturn de seguridad; la probabilidad de que en 8 de los vehculos los ocupantes utilicen cinturones de seguridad y, as sucesivamente, la probabilidad de que en los 12 vehculos de la muestra los ocupantes estn utilizando cinturn de seguridad. La probabilidad de cada uno de estos resultados se suma enseguida. P (x 7|n = 12 y = .762) = P (x = 7) + P (x = 8) + P (x = 9) + P (x = 10) + P (x = 11) + P (x = 12) = .0902 + .1805 + .2569 + .2467 + .1436 + .0383 = .9562

198

Captulo 6

De esta manera, la probabilidad de seleccionar 12 automviles y hallar que los ocupantes de 7 o ms vehculos utilizaban cinturn de seguridad es de 0.9562. Esta informacin se muestra en la siguiente hoja de clculo de Excel. Existe una pequea diferencia en la respuesta con software como consecuencia del redondeo. Los comandos de Excel son similares a los que se indican en la pgina 210, punto 2.

Autoevaluacin 6.4

Si n = 4 y = 0.60, determine la probabilidad de que: a) x = 2. b) x 2. c) x 2.

Ejercicios
19.  En una distribucin binomial, n = 8 y = 0.30. Determine las probabilidades de los siguientes eventos. a) x = 2. b) x 2 (la probabilidad de que x sea igual o menor que 2). c) x 3 (la probabilidad de que x sea igual o mayor que 3). 20.  En una distribucin binomial, n = 12 y = 0.60. Determine las probabilidades de los siguientes eventos. a) x = 5. b) x 5. c) x 6. 21.  En un estudio reciente se descubri que 90% de las familias de Estados Unidos tiene televisores de pantalla grande. En una muestra de nueve familias, cul es la probabilidad de que: a) las nueve tengan televisores de pantalla grande? b) menos de cinco tengan televisores de pantalla grande? c) ms de cinco tengan televisores de pantalla grande? d) al menos siete familias tengan televisores de pantalla grande? 22.  Un fabricante de marcos para ventanas sabe, por experiencia, que 5% de la produccin tendr algn tipo de defecto menor, que requerir reparacin. Cul es la probabilidad de que en una muestra de 20 marcos:

Distribuciones discretas de probabilidad

199

a) ninguno requiera reparacin? b) por lo menos uno requiera reparacin? c) ms que dos requieran reparacin? 23.  La rapidez con la que las compaas de servicios resuelven problemas es de suma importancia. Georgetown Telephone Company arma que es capaz de resolver 70% de los problemas de los clientes el mismo da en que se reportan. Suponga que los 15 casos que se reportaron el da de hoy son representativos de todas las quejas. a)  Cuntos problemas esperara que se resolvieran el da de hoy? Cul es la desviacin estndar? b) Cul es la probabilidad de que 10 problemas se resuelvan el da de hoy? c) De que 10 u 11 problemas se resuelvan el da de hoy? d) Y de que ms de 10 problemas se resuelvan el da de hoy? 24.  Backyard Retreats, Inc., vende una lnea exclusiva de piscinas, jacuzzis y spas. La compaa se localiza a la salida del Bee Line Expressway, en Orlando, Florida. El propietario informa que 20% de los clientes que visitan la tienda har una compra de por lo menos $50. Suponga que 15 clientes entran en la tienda antes de las 10 de la maana cierto sbado. a) Cuntos de estos clientes esperara que hiciera una compra de por lo menos $50? b)  Cul es la probabilidad de que exactamente cinco clientes hagan una compra de por lo menos $50? c)  Cul es la probabilidad de que por lo menos cinco clientes hagan una compra de por lo menos $50? d)  Cul es la probabilidad de que por lo menos un cliente haga una compra de por lo menos $50?

Distribucin de probabilidad hipergeomtrica


Para aplicar una distribucin binomial, la probabilidad de que ocurra un xito debe permanecer igual en cada prueba. Por ejemplo, la probabilidad de adivinar la respuesta correcta a una pregunta de verdadero o falso es de 0.50. Esta probabilidad es igual para cada pregunta de un examen. Asimismo, suponga que 40% de los electores registrados en un distrito electoral es republicano. Si se seleccionan al azar 27 de los votantes registrados, la probabilidad de elegir a un republicano en la primera eleccin es de 0.40. La posibilidad de elegir a un republicano en la siguiente eleccin es de 0.40, tomando en cuenta que el muestreo incluye reemplazos, lo cual signica que la persona elegida vuelve a la poblacin antes de elegir a la que sigue. No obstante, la mayor parte del muestreo se realiza sin reemplazos. Por tanto, si la poblacin es reducida, la probabilidad de cada observacin cambiar. Por ejemplo, si la poblacin consta de 20 elementos, la probabilidad de seleccionar un elemento de dicha poblacin es de 1/20. Si el muestreo se realiza sin reemplazos, slo quedan 19 elementos despus de la primera seleccin; la probabilidad de seleccionar un elemento en la segunda seleccin es de 1/19 solamente. En la tercera seleccin, la probabilidad es de 1/18, etc. Esto supone que la poblacin es finita; es decir, se conoce el nmero de elementos de la poblacin, que es relativamente reducido. Ejemplos de poblaciones nitas son los 2 842 republicanos de un distrito electoral, las 9 421 solicitudes para la escuela de medicina y los 18 Pontiac Vibes actualmente en existencia en North Charleston Pontiac. Recuerde que uno de los criterios relacionados con la distribucin binomial estriba en que la probabilidad de xito debe permanecer igual en todas las pruebas. Como la probabilidad de xito no es la misma en todas las pruebas cuando se realiza un muestreo sin reemplazos en una poblacin relativamente pequea, no debe aplicarse la distribucin binomial. En lugar de sta se aplica la distribucin hipergeomtrica. Por tanto, 1) si se selecciona una muestra de una poblacin nita sin reemplazos y 2) si el tamao de la muestra n es mayor que 5% del tamao de la poblacin, se aplica la distribucin hipergeomtrica para determinar la probabilidad de un nmero especco de xitos o fracasos. Esto resulta especialmente apropiado cuando el tamao de la poblacin es pequeo.

200

Captulo 6

La frmula de la distribucin de probabilidad hipergeomtrica es la siguiente:

P (x ) = DISTRIBUCIN HIPERGEOMTRICA

(S Cx )(N S Cn x )
N Cn

[6.6]

Aqu, N representa el tamao de la poblacin. S es el nmero de xitos en la poblacin. x es el nmero de xitos en la muestra; ste puede asumir los valores 0, 1, 2, 3 n es el tamao de la muestra o el nmero de pruebas. C es el smbolo de combinacin. En resumen, una distribucin de probabilidad hipergeomtrica tiene las siguientes caractersticas: DISTRIBUCIN DE PROBABILIDAD HIPERGEOMTRICA 1.  Los resultados de cada prueba de un experimento se clasifican en dos categoras exclusivas: xito o fracaso. 2. La variable aleatoria es el nmero de xitos de un nmero fijo de pruebas. 3. Las pruebas no son independientes. 4.  Los muestreos se realizan con una poblacin finita sin reemplazos y n/N > 0.05. Por tanto, la probabilidad de xito cambia en cada prueba. El siguiente ejemplo ilustra los detalles para determinar una probabilidad con la distribucin de probabilidad hipergeomtrica.

Ejemplo

Play Time Toys, Inc., tiene 50 empleados en el departamento de ensamble. Cuarenta empleados pertenecen a un sindicato, y diez, no. Se eligen al azar cinco empleados para formar un comit que hablar con la empresa sobre los horarios de inicio de los turnos. Cul es la probabilidad de que cuatro de los cinco empleados elegidos para formar parte del comit pertenezcan a un sindicato? En este caso, la poblacin consiste en los 50 empleados del departamento de ensamble. Slo se puede elegir una vez a un empleado para formar parte del comit. De ah que el muestreo se lleve a cabo sin reemplazos. Por tanto, en cada prueba cambia la probabilidad de elegir a un empleado sindicalizado. La distribucin hipergeomtrica es adecuada para determinar la probabilidad. En este problema, N es igual a 50, el nmero de empleados. S tiene un valor de 40, el nmero de empleados sindicalizados. x es igual a 4, el nmero de empleados sindicalizados elegidos. n vale 5, el nmero de empleados elegidos. Se desea calcular la probabilidad de que 4 de los 5 miembros del comit sean sindicalizados. Al sustituir estos valores en la frmula (6.6), se obtiene:

Solucin

Distribuciones discretas de probabilidad

201

P (4) =

(40 C4 )(50 40 C5 4 )
50 C5

40! 10! 1!9! (91 390)(10) 4!36! = = .431 = 50! 2 118 760 5!45!

Por consiguiente, la probabilidad de elegir al azar a 5 trabajadores de ensamble de los 50 trabajadores y encontrar que 4 de 5 son sindicalizados es de 0.431. La tabla 6.4 muestra las probabilidades hipergeomtricas de encontrar 0, 1, 2, 3, 4 y 5 empleados sindicalizados en el comit. TablA 6.4 Probabilidades hipergeomtricas (n = 5, N = 50 y S = 40) del nmero
de empleados sindicalizados en el comit
Miembros de un sindicato 0 1 2 3 4 5 Probabilidad .000 .004 .044 .210 .431 .311 1.000

Con el n de comparar las dos distribuciones de probabilidad, la tabla 6.5 muestra las probabilidades hipergeomtricas y binomiales del ejemplo de Play Time Toys, Inc. Como 40 de los 50 empleados del departamento de ensamble son sindicalizados, establecemos que = 0.80 para la distribucin binomial. Las probabilidades binomiales de la tabla 6.5 provienen de la distribucin binomial con n = 5 y = 0.80. TablA 6.5 Probabilidades hipergeomtricas y binomial para el departamento
de ensamble de PlayTime Toys, Inc.
Nmero de miembros sindicalizados en el comit 0 1 2 3 4 5 Probabilidad hipergeomtrica, P(x) .000 .004 .044 .210 .431 .311 1.000 Probabilidad binomial (n 5 y .80) .000 .006 .051 .205 .410 .328 1.000

Cuando no es posible satisfacer alguno de los requisitos binomiales de una probabilidad constante de xito, se debe recurrir a la distribucin de probabilidad hipergeomtrica. No obstante, segn lo indica la tabla 6.5, es posible, en ciertas condiciones, emplear los resultados de la distribucin binomial para calcular la distribucin hipergeomtrica. Esto conduce a la siguiente regla emprica:  i los elementos seleccionados no se regresan a la poblacin, se puede aplicar S la distribucin binomial para calcular la distribucin hipergeomtrica cuando n < 0.05N. Es decir, basta la distribucin binomial si el tamao de la muestra es menor que 5% de la poblacin. En Excel es posible generar una distribucin hipergeomtrica. Observe la siguiente salida. En la seccin Comandos de software se incluyen los pasos pertinentes.

202

Captulo 6

Autoevaluacin 6.5

Horwege Discount Brokers hace planes para contratar este ao a 5 analistas financieros. Hay un grupo de 12 candidatos aprobados, y George Horwege, el propietario, decide elegir al azar a quines va a contratar. De los solicitantes aprobados, 8 son hombres y 4 mujeres. Cul es la probabilidad de que 3 de los 5 contratados sean hombres?

Ejercicios
25.  Una poblacin consta de 10 elementos, 6 de los cuales se encuentran defectuosos. En una muestra de 3 elementos, cul es la probabilidad de que exactamente 2 sean defectuosos? Suponga que las muestras se toman sin reemplazo. 26.  Una poblacin consta de 15 elementos, 4 de los cuales son aceptables. En una muestra de 4 elementos, cul es la probabilidad de que exactamente 3 sean aceptables? Suponga que las muestras se toman sin reemplazo. 27.  Kolzak Appliance Outlet acaba de recibir un cargamento de 10 reproductores de DVD. Poco despus de recibirlo, el fabricante se comunic para reportar un envo de tres unidades defectuosas. La seorita Kolzac, propietaria de la tienda, decidi probar 2 de los 10 reproductores de DVD que recibi. Cul es la probabilidad de que ninguno de los 2 reproductores de DVD que se probaron est defectuoso? Suponga que las muestras no tienen reemplazo. 28.  El departamento de sistemas de computacin cuenta con ocho profesores, de los cuales seis son titulares. La doctora Vonder, presidenta, desea formar un comit de tres profesores del departamento con el n de que revisen el plan de estudios. Si selecciona el comit al azar: a) Cul es la probabilidad de que todos los miembros del comit sean titulares? b)  Cul es la probabilidad de que por lo menos un miembro del comit no sea titular? (Sugerencia: aplique la regla del complemento para responder esta pregunta.)

Distribuciones discretas de probabilidad

203

29.  Keiths Florists tiene 15 camiones de entrega, que emplea sobre todo para entregar ores y arreglos orales en la zona de Greenville, Carolina del Sur. De estos 15 camiones, 6 presentan problemas con los frenos. En forma aleatoria se seleccion una muestra de 5 camiones. Cul es la probabilidad de que 2 de los camiones probados presenten frenos defectuosos? 30.  El juego de Lotto, patrocinado por la Comisin de la Lotera de Louisiana, otorga el premio mayor a un concursante que hace coincidir 6 de los posibles nmeros. Suponga que hay 40 pelotas de ping-pong numeradas del 1 al 40. Cada nmero aparece una sola vez y las pelotas ganadoras se seleccionan sin reemplazo. a)  La comisin informa que la probabilidad de que coincidan todos los nmeros es de 1 en 3 838 380. Qu signica esto en trminos de probabilidad? b)  Aplique la frmula de la distribucin de probabilidad hipergeomtrica para determinar esta probabilidad.  La comisin de la lotera tambin otorga un premio si un concursante hace coincidir 4 o 5 de los 6 nmeros ganadores. Sugerencia: divida los 40 nmeros en dos grupos: nmeros ganadores y no ganadores. c)  Calcule la probabilidad, de nuevo con la frmula de la distribucin de probabilidad hipergeomtrica, para hacer coincidir 4 de los 6 nmeros ganadores. d) Calcule la probabilidad de que coincidan 5 de los 6 nmeros ganadores.

Distribucin de probabilidad de Poisson


La distribucin de probabilidad de Poisson describe el nmero de veces que se presenta un evento durante un intervalo especco. El intervalo puede ser de tiempo, distancia, rea o volumen. La distribucin se basa en dos supuestos. El primero consiste en que la probabilidad es proporcional a la longitud del intervalo. El segundo supuesto consiste en que los intervalos son independientes. En otras palabras, cuanto ms grande sea el intervalo, mayor ser la probabilidad, y el nmero de veces que se presenta un evento en un intervalo no inuye en los dems intervalos. La distribucin tambin constituye una forma restrictiva de la distribucin binomial cuando la probabilidad de un xito es muy pequea y n es grande. A sta se le conoce por lo general con el nombre de ley de eventos improbables, lo cual signica que la probabilidad, , de que ocurra un evento en particular es muy pequea. La distribucin de Poisson es una distribucin de probabilidad discreta porque se genera contando. En resumen, una distribucin de probabilidad de Poisson posee tres caractersticas: EXPERIMENTO DE PROBABILIDAD DE POISSON 1.  La variable aleatoria es el nmero de veces que ocurre un evento durante un intervalo definido. 2.  La probabilidad de que ocurra el evento es proporcional al tamao del intervalo. 3. Los intervalos no se superponen y son independientes.

Estadstica en accin
Cerca del final de la Segunda Guerra Mundial, los alemanes crearon bombas propulsadas por cohete, que lanzaron hacia la ciudad de Londres. El comando militar aliado no saba si estas bombas se lanzaban de forma aleatoria o si tenan un objetivo. Con el fin de averiguarlo, se dividi la ciudad de Londres en 576 regiones cuadradas. Se registr la distribucin de los bombarderos en cada regin cuadrada de la siguiente manera:
Bombardeos 0 1 2 3 4 5 Regiones 229 221 93 35 7 1

Con el fin de interpretar estos datos, la tabla anterior seala que 229 regiones no fueron bombardeadas. Siete regiones fueron atacadas cuatro veces. (contina)

La distribucin posee diversas aplicaciones. Se le utiliza como modelo para describir la distribucin de errores en una entrada de datos, el nmero de rayones y otras imperfecciones en las cabinas de automviles recin pintados, el nmero de partes defectuosas en envos, el nmero de clientes que esperan mesa en un restaurante o que esperan entrar en una de las atracciones de Disney World y el nmero de accidentes en la carretera federal 75 en un periodo de tres meses. La distribucin de Poisson se describe matemticamente por medio de la siguiente frmula:

DISTRIBUCIN DE POISSON P (x ) =

x e x!

[6.7]

204

Captulo 6

De acuerdo con la distribucin de Poisson, con una media de 0.93 bombardeos por regin, se obtiene la siguiente cantidad esperada de bombardeos:
Bombardeos 0 1 2 3 4 5 o

donde: (mu)   es la media de la cantidad de veces (xitos) que se presenta un evento en un intervalo particular. e es la constante 2.71828 (base del sistema de logaritmos naperianos). x es el nmero de veces que se presenta un evento. P(x) es la probabilidad para un valor especco de x. La media de nmero de xitos, , puede determinarse con n; en este caso, n es el nmero total de pruebas, y , la probabilidad de xito. MEDIA DE UNA DISTRIBUCIN DE POISSON = n [6.8]

ms Regiones 231.2 215.0 100.0 31.0 7.2 1.6

Puesto que la cantidad real de bombardeos se aproxima a la cantidad esperada, el comando militar lleg a la conclusin de que las bombas caan de forma aleatoria. Los alemanes no haban creado una bomba con un dispositivo para dar en el blanco.

La varianza de Poisson tambin es igual a su media. Si, por ejemplo, la probabilidad de que un cheque cobrado en un banco rebote es de 0.0003 y se cobran 10 000 cheques, la media y la varianza del nmero de cheques rebotados es de 3.0, que se determina mediante la operacin = n = 10 000(.0003) = 3.0. Recuerde que, en el caso de una distribucin binomial, existe una cantidad ja de pruebas. Por ejemplo, en una prueba de seleccin mltiple de cuatro preguntas, slo puede haber cero, uno, dos, tres o cuatro xitos (respuestas correctas). Sin embargo, la variable aleatoria, x, para una distribucin de Poisson puede adoptar una innidad de valores; es decir, 0, 1, 2, 3, 4, 5, . Sin embargo, las probabilidades se tornan muy bajas despus de las primeras veces que se presenta un evento (xitos). Para ejemplicar el clculo de la distribucin de Poisson, suponga que pocas veces se pierde equipaje en Northwest Airlines. En la mayora de los vuelos no se pierden maletas; en algunos se pierde una; en unos cuantos se pierden dos; pocas veces se pierden tres, etc. Suponga que una muestra aleatoria de 1 000 vuelos arroja un total de 300 maletas perdidas. De esta manera, la media aritmtica del nmero de maletas perdidas por vuelo es de 0.3, que se calcula al dividir 300/1 000. Si el nmero de maletas perdidas por vuelo se rige por una distribucin de Poisson con = 0.3, las diversas probabilidades se calculan con la frmula (6.7): P (x ) = x e x!

Por ejemplo, la probabilidad de que no se pierda ninguna maleta es la siguiente: P (0) = (0.3)0 (e 0.3 ) = 0.7408 0!

En otras palabras, en 74% de los vuelos no habr maletas perdidas. La probabilidad de que se pierda exactamente una maleta es: P (1) = (0.3)1(e 0.3 ) = 0.2222 1!

Por consiguiente, se espera que se pierda exactamente una maleta en 22% de los vuelos. Las probabilidades de Poisson tambin se pueden consultar en el apndice B.5.

Ejemplo

De acuerdo con el ejemplo anterior, el nmero de maletas se rige por una distribucin de Poisson con una media de 0.3. Consulte el apndice B.5 para determinar la probabilidad de que ninguna maleta se pierda en un vuelo. Cul es la probabilidad de que se pierda exactamente una maleta en un vuelo? En qu momento debe sospechar el supervisor de que en un vuelo se estn perdiendo demasiadas maletas?

Distribuciones discretas de probabilidad

205

Solucin

Parte del apndice B.5 se reproduce en la tabla 6.6. Para determinar la probabilidad de que ninguna maleta se pierda, se localiza la columna con el encabezado 0.3 y se desciende por dicha columna hasta el rengln sealado con 0. La probabilidad es de 0.7408. sta es la probabilidad de que no haya maletas perdidas. La probabilidad de que se pierda una maleta es 0.2222, y est en el siguiente rengln de la tabla, en la misma columna. La probabilidad de que se pierdan dos maletas es de 0.0333, rengln inferior; en el caso de tres maletas perdidas, la probabilidad es de 0.0033; y para cuatro maletas perdidas es de 0.0003. Por consiguiente, un supervisor no debera sorprenderse de que se pierda una maleta, pero debera esperar ver con menos frecuencia ms de una maleta perdida. TablA 6.6 Tabla de Poisson para diversos valores de (del apndice B.5)
x 0 1 2 3 4 5 6 7 0.1 0.9048 0.0905 0.0045 0.0002 0.0000 0.0000 0.0000 0.0000 0.2 0.8187 0.1637 0.0164 0.0011 0.0001 0.0000 0.0000 0.0000 0.3 0.7408 0.2222 0.0333 0.0033 0.0003 0.0000 0.0000 0.0000 0.4 0.6703 0.2681 0.0536 0.0072 0.0007 0.0001 0.0000 0.0000 0.5 0.6065 0.3033 0.0758 0.0126 0.0016 0.0002 0.0000 0.0000 0.6 0.5488 0.3293 0.0988 0.0198 0.0030 0.0004 0.0000 0.0000 0.7 0.4966 0.3476 0.1217 0.0284 0.0050 0.0007 0.0001 0.0000 0.8 0.4493 0.3595 0.1438 0.0383 0.0077 0.0012 0.0002 0.0000 0.9 0.4066 0.3659 0.1647 0.0494 0.0111 0.0020 0.0003 0.0000

Estas probabilidades tambin se determinan con el sistema MINITAB. Los comandos que se requieren se incluyen al nal del captulo.

Ya se mencion que la distribucin de probabilidad de Poisson constituye una forma restrictiva de la distribucin binomial. Es decir, se puede calcular una probabilidad binomial con la de Poisson. La distribucin de probabilidad de Poisson se caracteriza por el nmero de veces que se presenta un evento durante un intervalo o continuo. Algunos ejemplos son: El nmero de palabras mal escritas por pgina en un peridico. El nmero de llamadas por hora que recibe Dyson Vacuum Cleaner Company.  El nmero de vehculos vendidos por da en Hyatt Buick GMC, en Durham, Carolina del Norte. El nmero de anotaciones en un encuentro de ftbol colegial.

206

Captulo 6

En cada uno de estos ejemplos existe algn tipo de continuo: palabras mal escritas por pgina, llamadas por hora, vehculos vendidos por da o anotaciones por partido. En el ejemplo anterior, el nmero de maletas perdidas en cada vuelo, el continuo es un vuelo. Se conoca la media del nmero de maletas perdidas por vuelo, pero no el nmero de pasajeros ni la probabilidad de que se perdiera una maleta. Se sospech que el nmero de pasajeros era lo bastante grande y que era baja la probabilidad de que un pasajero perdiera su maleta. En el ejemplo siguiente se aplic la distribucin de Poisson para calcular una probabilidad binomial cuando n, el nmero de pruebas, es grande, y , la probabilidad de un xito, pequea.

Ejemplo

Coastal Insurance Company asegura propiedades frente a la playa a lo largo de Virginia, Carolina del Norte y del Sur, y las costas de Georgia; el clculo aproximado es que, cualquier ao, la probabilidad de que un huracn de categora III (vientos sostenidos de ms de 110 millas por hora) o ms intenso azote una regin de la costa (la isla de St. Simons, Georgia, por ejemplo) es de 0.05. Si un dueo de casa obtiene un crdito hipotecario de 30 aos por una propiedad recin comprada en St. Simons, cules son las posibilidades de que el propietario experimente por lo menos un huracn durante el periodo del crdito? Para aplicar la distribucin de probabilidad de Poisson, se comienza por determinar la media o nmero esperado de tormentas que se ajustan al criterio y que azotan St. Simons durante el periodo de 30 aos. Es decir, = n = 30(.05) = 1.5 Aqu, n es el nmero de aos, 30 en este caso. es la probabilidad de que toque tierra un huracn que se ajuste al criterio. es la media o nmero esperado de tormentas en un periodo de 30 aos. Para determinar la probabilidad de que por lo menos una tormenta azote la isla de St. Simons, Georgia, primero calcule la probabilidad de que ninguna tormenta azote la costa y reste dicho valor de 1. P (x 1) = 1 P (x = 0) = 1 0e 1.5 = 1 .2231 = .7769 0!

Solucin

As, se concluye que las posibilidades de que un huracn de ese tipo azote la propiedad frente a la playa en St. Simons, durante el periodo de 30 aos, mientras el crdito se encuentra vigente, son de 0.7769. En otras palabras, la probabilidad de que St. Simons sufra el azote de un huracn categora III o ms alta durante el periodo de 30 aos es de un poco ms de 75%. Se debe insistir en que el continuo, como antes se explic, an existe. Es decir, se espera que haya 1.5 tormentas que azotan la costa cada periodo de 30 aos. El continuo es el periodo de 30 aos. En el caso anterior utiliz la distribucin de Poisson como aproximacin de la binomial. Note que cumpli con las condiciones binomiales anotadas en la pgina 190.  Slo hay dos posibles resultados: un huracn azota el rea de St. Simons o no lo hace. Hay una cantidad ja de pruebas, en este caso, 30 aos.  Existe una probabilidad constante de xito; es decir, la probabilidad de que un huracn azote la zona es de 0.05 cada ao.  Los aos son independientes. Esto signica que si una tormenta importante azota en el quinto ao, esto no inuye en ningn otro ao.

Distribuciones discretas de probabilidad

207

Para calcular la probabilidad de que por lo menos una tormenta azote el rea en un periodo de 30 aos aplique la distribucin binomial: P (x 1) = 1 P (x 0) = 1
0 30 30C0 (.05) (.95)

= 1 (1)(1)(.2146) = .7854

La probabilidad de que por lo menos un huracn azote el rea de St. Simons durante el periodo de 30 aos con la distribucin binomial es de 0.7854. Qu respuesta es correcta? Por qu considerar el problema desde ambos puntos de vista? La respuesta obtenida con la distribucin binomial es la ms correcta tcnicamente. La que se obtuvo con la distribucin de Poisson puede tomarse como una aproximacin de la binomial, cuando n, el nmero de pruebas, es grande, y , la probabilidad de un xito, pequea. Considere el problema desde las dos distribuciones para destacar la convergencia de las dos distribuciones discretas. En ocasiones, la aplicacin de la distribucin de Poisson permite una solucin ms rpida y, como se ve, hay poca diferencia entre las respuestas. De hecho, conforme n se torna ms grande y ms pequea, se reducen las diferencias entre ambas distribuciones.

La distribucin de probabilidad de Poisson siempre tiene un sesgo positivo, y la variable aleatoria no posee lmite superior especco. La distribucin de Poisson para el caso de las maletas perdidas, en que = 0.3, est muy sesgada. Conforme se incrementa, la distribucin de Poisson se vuelve ms simtrica. Por ejemplo, la grca 6.4 muestra las distribuciones del nmero de servicios de transmisin, reemplazos de silenciadores y cambios de aceite al da en Avellinos Auto Shop. stas se ajustan a las distribuciones de Poisson con medias de 0.7, 2.0 y 6.0, respectivamente.
Probabilidad de que ocurra un suceso

P( x ) .50 .40 .30 .20 .10 .00

= 0.7

= 2.0

= 6.0

0 1 2 3 4 Servicios de transmisin

0 1 2 3 45 6 7 Reemplazo de silenciadores

0 1 2 3 4 5 6 7 8 9 10 11 12 13 Cambios de aceite

Nmero de veces que se presenta el evento

GRFICA 6.4 Distribuciones de probabilidad de Poisson con medias de 0.7, 2.0 y 6.0
Slo se necesita para construir la distribucin de Poisson

En resumen, la distribucin de Poisson es en realidad una familia discreta de distribuciones. Todo lo que se requiere para construir una distribucin de probabilidad de Poisson es la media del nmero de defectos, errores, etc., que se designan con .

Autoevaluacin 6.6

A partir de las tablas de actuara, Washington Insurance Company determin que la probabilidad de que un hombre de 25 aos de edad muera en el transcurso del prximo ao es de 0.0002. Si Washington Insurance vende 4 000 plizas a hombres de 25 aos durante este ao, cul es la probabilidad de que stos paguen exactamente una pliza?

208

Captulo 6

Ejercicios
31. En una distribucin de Poisson, = 0.4. a) Cul es la probabilidad de que x = 0? b) Cul es la probabilidad de que x > 0? 32. En una distribucin de Poisson, = 4. a) Cul es la probabilidad de que x = 2? b) Cul es la probabilidad de que x 2? c) Cul es la probabilidad de que x > 2? 33.  La seorita Bergen es ejecutiva del Coastal Bank and Trust. A partir de sus aos de experiencia, calcula que la probabilidad de que un solicitante no pague un prstamo inicial es de 0.025. El mes pasado realiz 40 prstamos. a) Cul es la probabilidad de que no se paguen 3 prstamos? b) Cul es la probabilidad de que por lo menos no se paguen 3 prstamos? 34.  Un promedio de 2 automviles por minuto ingresan a la salida de Elkhart de la autopista de Indiana. La distribucin de ingresos se aproxima a una distribucin de Poisson. a) Cul es la probabilidad de que ningn automvil ingrese en un minuto? b) Cul es la probabilidad de que por lo menos ingrese un automvil en un minuto? 35.  Se calcula que 0.5% de quienes se comunican al departamento de servicio al cliente de Dell, Inc., escuchar un tono de lnea ocupada. Cul es la probabilidad de que de las 1 200 personas que se comunicaron hoy, por lo menos 5 hayan escuchado un tono de lnea ocupada? 36.  Los autores y editores de libros trabajan mucho para reducir al mnimo la cantidad de errores en un libro. Sin embargo, algunos errores son inevitables. El seor J. A. Carmen, editor de libros de estadstica, informa que el promedio de errores por captulo es de 0.8. Cul es la probabilidad de que se cometan menos de 2 errores en determinado captulo?

Covarianza (opcional)
Ya se describi la forma de calcular e interpretar la media, tambin llamada valor esperado, de una variable aleatoria. Recuerde que la media es el promedio de larga duracin de una distribucin de probabilidad discreta. Se demostr que, a la larga, John Ragsdale, representante de ventas de Pelican Ford, tena una expectativa slida de vender 2.10 automviles cada sbado. A continuacin calcul la varianza y la desviacin estndar de la distribucin de la cantidad de automviles vendidos. La varianza y la desviacin estndar mostraron la variacin que Ragsdale poda esperar en la cantidad de automviles vendidos. Suponga que Pelican Ford emplea a otro representante de ventas. A continuacin se muestra la distribucin del nmero de automviles vendidos cada sbado por Bill Valiton, el otro representante.
Nmero de automviles vendidos X 0 1 2 Probabilidad P (X ) .10 .50 .40

Como gerente de ventas, a usted le interesa el nmero total de vehculos vendidos un sbado. Es decir, usted se encuentra interesado en la distribucin del total de vehculos vendidos, en lugar de las distribuciones individuales de Ragsdale y Valiton. Encontrar una combinacin lineal de las dos variables mediante la siguiente ecuacin: COMBINACIN LINEAL DE DOS VARIABLES ALEATORIAS En esta ecuacin: X y Y son dos variables aleatorias. a y b son constantes o ponderaciones. Z es la suma de los productos de dos variables aleatorias. Z = aX + bY

Distribuciones discretas de probabilidad

209

Si busca el valor esperado de la suma de dos variables aleatorias y a = b = 1, la ecuacin anterior se simplica: E(Z) = E(X) + E(Y). En otras palabras, la media de la distribucin de la suma de dos variables aleatorias es la suma de los dos valores esperados o medias. En el ejemplo de Pelican Ford, la media del nmero de vehculos vendidos por Valiton es de 1.30: = E (Y ) = Y (P (Y )) = 0(.10) + 1(.50) + 2(.40) = 1.30 La media, o valor esperado, del total de vehculos vendidos por los dos representantes es: E (Z ) = E (X ) + E (Y ) = 2.10 + 1.30 = 3.40 Es una solucin parcial del problema. Puede vislumbrar, por lgica, lo que suceder con la media, o valor esperado, de la suma de dos variables aleatorias. No obstante, tambin est interesado en la variacin de la suma de estas dos variables. Un factor que puede confundir es la posibilidad de que haya una interrelacin entre ambas variables. En el ejemplo de Pelican Ford, resulta razonable que exista una interrelacin entre las ventas de Ragsdale y las de Valiton. Por ejemplo, en un sbado de verano muy caluroso, los posibles clientes no se quedarn parados al sol, as que, por lgica, es posible que bajen las ventas de ambos representantes. La covarianza es una medida de la relacin entre dos variables aleatorias.

COVARIANZA

xy = (X E (X ))(Y E (Y ))P (X ,Y )

En este caso: xy es el smbolo de la covarianza. X y Y son los resultados de las variables aleatorias discretas. E(X) y E(Y)  son los valores esperados, o medias, de las dos variables aleatorias discretas. P(X,Y) es la probabilidad conjunta de dos variables aleatorias. La tabla que aparece a continuacin muestra la relacin entre las ventas de Ragsdale y las de Valiton. Observe que la probabilidad de que Ragsdale venda 2 automviles es de 0.30. Este valor se halla en la ltima la de la columna encabezada con un 2. La probabilidad de que Valiton venda exactamente 2 automviles es de 0.40. Este valor se encuentra en la columna de la derecha, en la la encabezada con un 2. La probabilidad de que cada uno venda dos automviles es de 0.20, que se encuentra en la interseccin de la y columna. Como estas ventas no son independientes (recuerde que si hay un da caluroso, lo es para los dos representantes), no se espera que sea aplicable la regla especial de la multiplicacin. Es decir, P(X,Y) no es igual a P(X)P(Y).

Valiton Automviles vendidos (Y ) 0 1 2 P (X )

Automviles vendidos por Ragsdale (X ) 0 .05 .05 .00 .10 1 .02 .15 .03 .20 2 .03 .07 .20 .30 3 .00 .20 .10 .30 4 .00 .03 .07 .10 P (Y ) .10 .50 .40 1.00

Para determinar la covarianza utilice la expresin xy = (X E (X ))(Y E (Y ))P (X ,Y )

210

Captulo 6

En este caso, xy = (0 2.1)(0 1.3).05 + (1 2.1)(0 1.3).02 + + (4 2.1)(2 1.3).07 = 0.95 La covarianza indica la forma en que las dos variables se mueven juntas. El valor de 0.95 indica que las dos variables se encuentran directamente relacionadas. Es decir, cuando Ragsdale vende ms de la cantidad media de automviles, Valiton tiende a vender ms de la media tambin. El principal inconveniente de la covarianza consiste en que aporta poco acerca de la magnitud de la diferencia. Las unidades son automviles cuadrados. Constituye 0.9500 mucho o poco? No lo sabe. Si la covarianza tuviera un valor negativo, esto indicara que las dos distribuciones estaran inversa o directamente relacionadas. Si tuviera un valor de 0, las distribuciones no se tendran relacin o seran independientes. Como ahora tiene informacin sobre la relacin entre las dos variables, le es posible pensar respecto de la varianza de la suma de stas. La varianza de la suma de dos variables aleatorias se determina mediante la expresin

2 2 2 2 2 VARIANZA DE LA SUMA DE DOS VARIABLES ALEATORIAS x + y = a x + b y + 2ab xy

Los valores de a y b, como antes, representan los valores o ponderaciones asignados. Si a = b = 1, la ecuacin se simplica:
2 2 2 x + y = x + y + 2 xy

En otras palabras, la ecuacin anterior indica que la varianza de la suma de dos variables aleatorias es igual a la suma de las varianzas de ambas variables aleatorias ms dos veces la covarianza. Esto signica que, cuando desea considerar la suma de dos variables, necesita tomar en cuenta la variacin en cada una de las variables ms la interrelacin entre ellas. Para completar la cuestin sobre la variabilidad del nmero total de automviles vendidos los sbados, necesita determinar la varianza de la distribucin de las ventas de Valiton. De acuerdo con la frmula (6.2),
2 2 2 2 2 y = (Y ) P (Y ) = (0 1.3) (.10) + (1 1.3) (.50) + (2 1.3) (.40) = 0.41

Recuerde que en la pgina 187 calcul que la varianza de la distribucin del nmero de vehculos vendidos por Ragsdale era de 1.29. As, la varianza de la suma de dos variables aleatorias es:
2 2 2 x + y = x + y + 2 xy = 1.29 + 0.41 + 2(0.95) = 3.60

Para resumir, la media del nmero de vehculos vendidos cada sbado en Pelican Ford es de 3.40 vehculos, y la varianza, de 3.60. La desviacin estndar es de 1.8974 vehculos, que se determina al extraer la raz cuadrada de 3.60. Una de las aplicaciones ms tiles de las expresiones anteriores tiene lugar en el campo del anlisis nanciero. Los inversionistas estn interesados en obtener la mxima tasa de rendimiento, aunque tambin en reducir el riesgo. En trminos estadsticos, reducir el riesgo implica reducir la varianza de la desviacin estndar. El siguiente ejemplo ayudar a explicar los detalles.

Ejemplo

Ernie DuBrul acaba de heredar $200 000 y los dividir en una cartera de dos inversiones. Despus de investigar, Ernie decide invertir 25% en American Funds World Cap y el resto en Burger International Funds. En el caso de American Funds World Cap, la tasa media de rendimiento es de 12%, y la desviacin estndar, de 3%. En el caso de Burger International Funds, la tasa media de rendimiento es de 20%, con una des-

Distribuciones discretas de probabilidad

211

viacin estndar de 8%. Despus de algunos clculos, el inversionista puede determinar que la covarianza entre las dos inversiones es 12. Cul es el valor esperado de la tasa de rendimiento de la cartera de inversiones? Qu debe concluir sobre la relacin entre ambas inversiones? Cul es la desviacin estndar de la cartera de inversiones?

Solucin

Ernie puede considerar las dos inversiones como variables aleatorias con medias de 12% y 20%, respectivamente. El valor de la primera inversin es de 0.25 (a = 0.25), y de 0.75 (b = 0.75) en el caso de la segunda. El valor esperado de la tasa de rendimiento de la cartera de inversiones es de 18%, la cual se determina de la siguiente manera: E (Z ) = E (X + Y ) = a(E (X )) + b(E (Y )) = .25(12) + .75(20) = 18.0 La covarianza de 12 sugiere una relacin positiva entre las dos inversiones, pues se trata de un nmero positivo. Sin embargo, el valor de 12 no dice mucho sobre la fuerza de la relacin. Determine la varianza de la cartera de inversiones de la siguiente manera:
2 2 2 2 2 2 2 2 8)2 + 2(.25)(.75)(12) = 41.0625 x + y = a x + b y + 2ab xy = (.25) (3) + (.75) (8

La raz cuadrada de 41.0625 es 6.4%, que es la desviacin estndar de la suma ponderada de las dos variables. Cmo interpreta Ernie esta informacin? Suponga que tena la oportunidad de invertir los $200 000 en acciones en internet, donde la tasa de rendimiento era la misma, 18%, aunque la desviacin estndar de esta distribucin era de 8.0%. La desviacin estndar de 8.0% indica un mayor riesgo en la inversin de acciones en internet. La mayora de los inversionistas desea reducir los riesgos; de ah que el mejor camino sea hacer la inversin que haba planeado. En los anteriores ejemplos haba una relacin entre las dos distribuciones; es decir, la covarianza no era igual que 0. Considere el siguiente ejemplo en el que no existe relacin entre las dos distribuciones.

Ejemplo

Suponga que participa en un juego con 2 monedas comunes. Las monedas se lanzan y cuenta el nmero de caras. Por cada cara que salga recibe $1.00 de la casa; por cada cruz debe pagar a la casa la misma cantidad. La siguiente tabla resume los resultados del juego.
Moneda 2 Cara $1 Cruz $1 Total Cara $1 .25 .25 .50 Moneda 1 Cruz $1 .25 .25 .50 Total .50 .50 1.00

Las medias de las dos variables aleatorias son: E (X ) = $1(.50) + ($ 1)(.50) = $0.00 E (Y ) = $1(.50) + ($ 1)(.50) = $0.00 Las varianzas de las dos variables aleatorias son:
2 2 2 x = (1 0) .50 + (1 0) (.50) = 1 2 2 2 y = (1 0) .50 + (1 0) (.50) = 1

212

Captulo 6

La covarianza de las dos variables aleatorias es: xy = (1 0)(1 0).25 + (1 0)(1 0).25 + (1 0)(1 0) ).25 + (1 0)(1 0).25 xy = (1).25 + (1).25 + (1).25 + (1).25 = 0 El hecho de que la covarianza sea 0 indica que no hay relacin entre las variables, que son independientes. Es decir, el resultado de la primera moneda no se relaciona con el resultado de la segunda moneda. Ya conoca esto desde el estudio de la probabilidad, pero que la covarianza sea 0 lo conrma.

Ejercicios
O.1 Se dan dos variables aleatorias en la siguiente tabla. 0 1 2 P (x ) 0 .3 .1 0 .4 1 .1 .3 0 .4 2 0 .1 .1 .2 P (y ) .4 .5 .1 1.00

a) Determine la media de las variables x y y. b) Estime la varianza de las variables x y y. c) Encuentre la covarianza. d) Determine el valor esperado de la suma de las dos variables. e) Aproxime la varianza de la suma de las dos variables. O.2  Un anlisis de dos acciones indica que la tasa media de rendimiento de la primera es de 8% con una desviacin estndar de 15%. La segunda posee una tasa media de rendimiento de 14% con una desviacin estndar de 20%. Suponga que invierte 40% en la primera accin y 60% en la segunda. a) Cul es el valor esperado de la tasa de rendimiento de la inversin total? b)  Si las dos acciones no se encuentran relacionadas, cul es la desviacin estndar de la tasa de rendimiento de la inversin total? c)  Suponga que la covarianza entre las dos acciones es de 150. Cul es la desviacin estndar de la tasa de rendimiento?

Resumen del captulo


I. Una variable aleatoria es un valor numrico determinado por el resultado de un experimento. II.  Una distribucin de probabilidad es una lista de posibles resultados de un experimento y la probabilidad asociada con cada resultado. A.  Una distribucin de probabilidad discreta slo puede adoptar ciertos valores. Las principales caractersticas son: 1. La suma de las probabilidades es 1.00. 2. La probabilidad de un resultado se encuentra entre 0.00 y 1.00. 3. Los resultados son mutuamente excluyentes. B.  Una distribucin continua puede adoptar una innidad de valores dentro de un rango especco. III.  La media y la varianza de una distribucin de probabilidad se calculan de la siguiente manera: A. La media es igual a: = [xP (x )] [6.1]

Distribuciones discretas de probabilidad

213

B. La varianza es igual a: 2 = [(x )2 P (x )] [6.2]

IV. La distribucin binomial posee las siguientes caractersticas: A. Cada resultado se clasica en una de dos categoras mutuamente excluyentes. B.  La distribucin es resultado de la cuenta del nmero de xitos en una cantidad ja de pruebas. C. La probabilidad de un xito es la misma de una prueba a la siguiente. D. Cada prueba es independiente. E. Una probabilidad binomial se determina de la siguiente manera: P (X ) = nCx x (1 )n x [6.3]

F. La media se calcula de la siguiente manera: G. La varianza es 2 = n (1 ) [6.5] = n [6.4]

V. La distribucin hipergeomtrica posee las siguientes caractersticas: A. Slo hay dos posibles resultados. B. La probabilidad de un xito no es la misma en cada prueba. C.  La distribucin es resultado de la cuenta del nmero de xitos en una cantidad ja de pruebas. D. Se le utiliza cuando se toman muestras sin reemplazo de una poblacin nita. E. Una probabilidad hipergeomtrica se calcula a partir de la siguiente ecuacin: P (x ) = VI. (S Cx )(N S Cn x ) ( N Cn ) [6.6]

a distribucin de Poisson posee las siguientes caractersticas: L A. Describe el nmero de veces que se presenta un evento en un intervalo especco. B. La probabilidad de un xito es proporcional a la longitud del intervalo. C. Los intervalos que no se superponen son independientes. D. Es una forma restrictiva de la distribucin binomial, en la que n es grande y pequea. E. La probabilidad de Poisson se determina a partir de la siguiente ecuacin: P (x ) = x e x! [6.7]

F. La media y la varianza son:

= n = n
2

[6.8]

Ejercicios del captulo


37. Cul es la diferencia entre una variable aleatoria y una distribucin de probabilidad? 38.  En cada uno de los siguientes enunciados, indique si la variable aleatoria es discreta o continua. a) El tiempo de espera para un corte de cabello. b) El nmero de automviles que rebasa un corredor cada maana. c) El nmero de hits de un equipo femenil de softbol de preparatoria. d)  El nmero de pacientes atendidos en el South Strand Medical Center entre las seis y diez de la noche, cada noche. e) La distancia que recorri en su automvil con el ltimo tanque de gasolina. f ) El nmero de clientes del Wendys de Oak Street que utilizaron las instalaciones. g)  La distancia entre Gainesville, Florida, y todas las ciudades de Florida con una poblacin de por lo menos 50 000 habitantes. 39. Cules son los requisitos de la distribucin binomial?

214

Captulo 6

40.  En qu condiciones arrojan, aproximadamente, los mismos resultados las distribuciones binomial y de Poisson? 41.  Samson Apartments, Inc., posee una gran cantidad de unidades. Uno de los intereses de la administracin tiene que ver con el nmero de departamentos vacos. Un estudio reciente revel el porcentaje de tiempo que determinado nmero de departamentos estn desocupados. Calcule la media y la desviacin estndar del nmero de departamentos desocupados. Nmero de unidades desocupadas 0 1 2 3

Probabilidad .1 .2 .3 .4

42.  Una inversin producir $1 000, $2 000 y $5 000 a n de ao. Las probabilidades de estos valores son de 0.25, 0.60 y 0.15, respectivamente. Determine la media y la varianza del valor de la inversin. 43.  El gerente de personal de Cumberland Pig Iron Company estudia el nmero de accidentes laborales en un mes y elabor la siguiente distribucin de probabilidad. Calcule la media, la varianza y la desviacin estndar del nmero de accidentes en un mes. mero de N accidentes 0 1 2 3 4

Probabilidad .40 .20 .20 .10 .10

44.  Croissant Bakery, Inc., ofrece pasteles con decorados especiales para cumpleaos, bodas y otras ocasiones. La pastelera tambin tiene pasteles normales. La siguiente tabla incluye el nmero total de pasteles vendidos al da, as como la probabilidad correspondiente. Calcule la media, la varianza y la desviacin estndar del nmero de pasteles vendidos al da. mero de pasteles N vendidos en un da 12 13 14 15

Probabilidad .25 .40 .25 .10

45.  Una mquina de esquila Tamiami produce 10% de piezas defectuosas, porcentaje demasiado alto. El ingeniero de control de calidad revisa los resultados en la mayora de las muestras desde la deteccin de esta anomala. Cul es la probabilidad de que en una muestra de 10 piezas: a) exactamente 5 estn defectuosas? b) 5 o ms estn defectuosas? 46.  Treinta por ciento de la poblacin de una comunidad del suroeste de Estados Unidos es hispanohablante. Se acus a un hispanohablante de haber asesinado a un estadounidense que no hablaba espaol. De los primeros 12 posibles jurados, slo dos son estadounidenses hispanohablantes y 10 no lo son. El abogado de la defensa se opone a la eleccin del jurado, pues dice que habr prejuicio contra su cliente. El scal no est de acuerdo y arguye que la probabilidad de esta composicin del jurado es frecuente. Calcule la probabilidad y explique los supuestos. 47.  Un auditor de Health Maintenance Services of Georgia informa que 40% de los asegurados de 55 aos de edad y mayores utilizan la pliza durante el ao. Se seleccionan al azar 15 asegurados para los registros de la compaa.

Distribuciones discretas de probabilidad

215

a) Cuntos asegurados cree que utilizaron la pliza el ao pasado? b)  Cul es la probabilidad de que diez de los asegurados seleccionados hayan utilizado la pliza el ao pasado? c)  Cul es la probabilidad de que 10 o ms de los asegurados seleccionados hayan utilizado la pliza el ao pasado? d)  Cul es la probabilidad de que ms de 10 de los asegurados seleccionados hayan utilizado la pliza el ao pasado? 48.  Tire and Auto Supply contempla hacer una divisin de 2 a 1 de las acciones. Antes de realizar la transaccin, por lo menos dos terceras partes de los 1 200 accionistas de la compaa deben aprobar la oferta. Para evaluar la probabilidad de que la oferta se apruebe, el director de nanzas eligi una muestra de 18 accionistas. Contact a cada uno y vio que 14 aprobaron la propuesta. Cul es la probabilidad de este evento, si dos terceras partes de los accionistas dan su aprobacin? 49.  Un estudio federal inform que 7.5% de la fuerza laboral de Estados Unidos tiene problemas con las drogas. Una ocial antidrogas del estado de Indiana decidi investigar esta armacin. En una muestra de 20 trabajadores: a)  Cuntos trabajadores cree que presenten problemas de adiccin a las drogas? Cul es la desviacin estndar? b)  Cul es la probabilidad de que ninguno de los trabajadores de la muestra manieste problemas de adiccin? c)  Cul es la probabilidad de que por lo menos uno de los trabajadores de la muestra presente problemas de adiccin? 50.  El Banco de Hawai informa que 7% de sus clientes con tarjeta de crdito dejar de pagar en algn momento. La sucursal de Hilo envi el da de hoy 12 nuevas tarjetas. a)  Cuntos de los nuevos tarjetahabientes cree que dejarn de pagar? Cul es la desviacin estndar? b) Cul es la probabilidad de que ninguno de los tarjetahabientes deje de pagar? c) Cul es la probabilidad de que por lo menos uno deje de pagar? 51.  Estadsticas recientes sugieren que 15% de los que visitan un sitio de ventas de menudeo en la Web realiza la compra. Un minorista desea vericar esta armacin. Para hacerlo, seleccion una muestra de 16 visitas de su sitio y descubri que en realidad 4 realizaron una compra. a) Cul es la probabilidad de que exactamente cuatro realicen una compra? b) Cuntas compras deben esperarse? c) Cul es la probabilidad de que cuatro o ms visitas terminen en compra? 52.  En el captulo 19 se estudia la muestra de aceptacin. El muestreo de aceptacin se utiliza para supervisar la calidad de la materia prima que entra. Suponga que un comprador de componentes electrnicos permite que 1% de los componentes se encuentren defectuosos. Para garantizar la calidad de las partes que entran, por lo general se toman 20 partes como muestra y se permite una parte defectuosa. a) Cul es la probabilidad de aceptar un lote con 1% de partes defectuosas? b)  Si la calidad del lote que ingresa en realidad fue de 2%, cul es la probabilidad de que se acepte? c)  Si la calidad del lote que ingresa en realidad fue de 5%, cul es la probabilidad de que se acepte? 53.  Colgate-Palmolive, Inc., recin cre una nueva pasta dental con sabor a miel. sta fue probada por un grupo de diez personas. Seis de ellas dijeron que les gustaba el nuevo sabor y las cuatro restantes indicaron que en denitiva no les agradaba. Cuatro de las diez se seleccionan para que participen en una entrevista a fondo. Entre quienes fueron elegidos para la entrevista, cul es la probabilidad de que a dos les haya gustado el nuevo sabor, y a dos no? 54.  La doctora Richmond, psicloga, estudia el hbito de ver televisin durante el da de estudiantes de preparatoria. Ella cree que 45% de los estudiantes de preparatoria ve telenovelas por la tarde. Para investigar un poco ms, elige una muestra de 10. a)  Elabore una distribucin de probabilidad para el nmero de estudiantes de la muestra que ven telenovelas. b) Determine la media y la desviacin estndar de esta distribucin. c) Cul es la probabilidad de encontrar que exactamente cuatro ven telenovelas? d)  Cul es la probabilidad de que menos de la mitad de los estudiantes elegidos vean telenovelas? 55.  Un estudio reciente llevado a cabo por Penn, Shone, and Borland para LastMinute.com revel que 52% de los viajeros de negocios planea sus viajes menos de dos semanas antes de partir. El estudio se va a repetir en un rea que abarca tres estados con una muestra de 12 viajeros de negocios frecuentes. a)  Elabore una distribucin de probabilidad para el nmero de viajeros que planean sus viajes a dos semanas de partir. b) Determine la media y la desviacin estndar de esta distribucin.

216

Captulo 6

c)  Cul es la probabilidad de que exactamente 5 de los 12 agentes viajeros planeen sus viajes dos semanas antes de partir? d)  Cul es la probabilidad de que 5 o ms de los 12 agentes viajeros seleccionados planeen sus viajes dos semanas antes de partir? 56.  Suponga que Hacienda estudia la categora de las contribuciones para la benecencia. Se seleccion una muestra de 25 declaraciones de parejas jvenes de entre 20 y 35 aos de edad con un ingreso bruto de ms de $100 000. De estas 25 declaraciones, cinco incluan contribuciones de benecencia de ms de $1 000. Suponga que cuatro de estas declaraciones se seleccionan para practicarles una auditora completa. a) Explique por qu resulta adecuada la distribucin hipergeomtrica. b)  Cul es la probabilidad de que exactamente una de las cuatro declaraciones auditadas tuvieran deducciones de benecencia de ms de $1 000? c)  Cul es la probabilidad de que por lo menos una de las cuatro declaraciones auditadas tuvieran deducciones de benecencia de ms de $1 000? 57.  El despacho de abogados Hagel and Hagel se localiza en el centro de Cincinnati. La empresa tiene 10 socios; 7 viven en Ohio y 3 en el norte de Kentucky. La seora Wendy Hagel, la gerente, desea nombrar un comit de 3 socios que estudien la posibilidad de mudar el despacho al norte de Kentucky. Si el comit se selecciona al azar de entre los 10 socios, cul es la probabilidad de que: a) un miembro del comit viva en el norte de Kentucky y los otros en Ohio? b) por lo menos 1 miembro del comit viva en el norte de Kentucky? 58.  Informacin reciente publicada por la Environmental Protection Agency indica que Honda es el fabricante de cuatro de los nueve vehculos ms econmicos en lo que se reere al consumo de gasolina. a)  Determine la distribucin de probabilidad del nmero de autos Honda en una muestra de tres autos elegidos entre los nueve ms econmicos. b) Cul es la posibilidad de que en la muestra de tres por lo menos haya un Honda? 59.  El cargo de jefe de la polica en la ciudad de Corry, Pennsylvania, se encuentra vacante. Un comit de bsqueda, integrado por los residentes de Corry, tiene la responsabilidad de recomendar al alcalde de la ciudad al nuevo jefe de la polica. Hay 12 candidatos, 4 de los cuales son mujeres o miembros de una minora. El comit decide entrevistar a los 12 candidatos. Primero seleccionaron al azar a cuatro candidatos para entrevistarlos el primer da, ninguno de los cuales result ser mujer ni miembro de una minora. El peridico local, Corry Press, en una de sus columnas editoriales, sugiere que hay discriminacin. Cul es la probabilidad de que as sea? 60.  De acuerdo con los clculos para 2004, en la lista siguiente aparece la poblacin por estado de los 15 con mayor poblacin. Asimismo, se incluye informacin sobre el hecho de que un lmite del estado est en el golfo de Mxico, el Ocano Atlntico o el Ocano Pacco (costa).

Rango 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Estado California Texas Nueva York Florida Illinois Pennsylvania Ohio Michigan Georgia Nueva Jersey Carolina del Norte Virginia Massachusetts Indiana Washington

Poblacin 35 893 799 22 490 022 19 227 088 17 397 161 12 713 634 12 406 292 11 459 011 10 112 620 8 829 383 8 698 879 8 541 221 7 459 827 6 416 505 6 237 569 6 203 788

Costa S S S S No No No No S S S S S No S

 Observe que 5 de los 15 estados no tienen costa. Suponga que se seleccionan tres estados al azar. Cul es la probabilidad de que: a) ninguno de los estados seleccionados tenga costa? b) exactamente un estado tenga costa? c) por lo menos un estado seleccionado tenga costa?

Distribuciones discretas de probabilidad

217

61. Las ventas de automviles Lexus en la zona de Detroit se rigen por una distribucin de Poisson con una media de 3 al da. a) Cul es la probabilidad de que ningn Lexus se venda determinado da? b)  Cul es la probabilidad de que durante 5 das consecutivos se venda por lo menos un Lexus? 62.  Suponga que 1.5% de las antenas de los nuevos telfonos celulares Nokia est defectuoso. En una muestra aleatoria de 200 antenas, calcule las siguientes probabilidades: a) Ninguna de las antenas se encuentra defectuosa. b) Tres o ms antenas se encuentran defectuosas. 63.  Un estudio relacionado con las las de las cajas registradoras en Safeway Supermarket, en el rea de South Strand, revel que entre las 4 y 7 de la tarde de los nes de semana hay un promedio de cuatro clientes en la la de espera. Cul es la probabilidad de que al visitar Safeway en este horario encuentre lo siguiente: a) ningn cliente en la la? b) cuatro clientes en la la de espera? c) cuatro o menos clientes en la? d) cuatro o ms clientes esperando? 64.  Un estudio interno llevado a cabo por el departamento de Servicios Tecnolgicos de Lahey Electronics revel que los empelados de la compaa reciben un promedio de dos correos electrnicos por hora. Suponga que la recepcin de estos correos obedece aproximadamente a una distribucin de Poisson. a)  Cul es la probabilidad de que Linda Lahey, presidenta de la compaa, haya recibido exactamente 1 correo entre las 4 y 5 de la tarde del da de ayer? b) Cul es la probabilidad de que haya recibido 5 o ms correos durante el mismo horario? c) Cul es la probabilidad de que no haya recibido correos en ese horario? 65.  Los informes recientes relacionados con el crimen indican que cada minuto ocurren 3.1 robos a vehculos motorizados en Estados Unidos. Suponga que la distribucin de los robos por minuto se puede aproximar por medio de una distribucin de probabilidad de Poisson. a) Calcule la probabilidad de que ocurran exactamente cuatro robos en un minuto. b) Cul es la probabilidad de que no haya robos en un minuto? c) Cul es la probabilidad de que por lo menos haya un robo en un minuto? 66.  New Process, Inc., proveedor grande de venta por correo de ropa para dama, anuncia sus entregas de pedidos el mismo da. Desde hace poco, el movimiento de los pedidos no corresponde a los planes y se presentan muchas quejas. Bud Owens, director de servicio al cliente, redise por completo el sistema de manejo de pedidos. El objetivo consiste en menos de cinco pedidos sin entregar al concluir 95% de los das hbiles. Las revisiones frecuentes de pedidos no entregados al nal del da revelan que la distribucin de pedidos sin entregar se rige por una distribucin de Poisson con una media de dos pedidos. a) Alcanz New Process, Inc., sus objetivos? Presente evidencias. b)  Trace un histograma que represente la distribucin de probabilidad de Poisson de pedidos sin entregar. 67.  La National Aeronautics and Space Administration (NASA) ha sufrido dos desastres. El Challenger estall en el ocano Atlntico en 1986 y el Columbia estall al este de Texas en 2003. Ha habido un total de 113 misiones espaciales. Suponga que los errores se siguen presentando con la misma razn y considere las siguientes 23 misiones. Cul es la probabilidad de que se presenten exactamente dos fallas? Cul es la probabilidad de que no se presenten fallas? 68.  De acuerdo con la teora de enero, si el mercado accionario sube durante enero, seguir hacindolo el resto del ao. Si no sube en enero, no lo har el resto del ao. De acuerdo con un artculo de The Wall Street Journal, esta teora se mantuvo vigente 29 de los ltimos 34 aos. Suponga que la teora es falsa; es decir, la probabilidad de que ste suba o baje es de 0.50. Cul es la probabilidad de que esto suceda por casualidad? (Es posible que requiera un paquete de software, como Excel o MINITAB.) 69.  Durante la segunda ronda del torneo abierto de golf de 1989 en Estados Unidos, cuatro jugadores registraron un hoyo en uno al jugar el sexto hoyo. Se calcula que la posibilidad de que un jugador profesional de golf registre un hoyo en uno es de 3 708 a 1; por tanto, la probabilidad es de 1/3 709. Ese da participaron 155 jugadores de golf en la segunda ronda. Calcule la probabilidad de que cuatro jugadores de golf registren un hoyo en uno al jugar el sexto hoyo. 70.  El 18 de septiembre de 2003, el huracn Isabel azot la costa de Carolina del Norte y provoc muchos daos. Das antes de tocar tierra, el National Hurricane Center pronostic que el huracn alcanzara las costas localizadas entre Cape Fear, Carolina del Norte y la frontera de Carolina del Norte con Virginia. Se calcul que la probabilidad de que el huracn azotara esta zona era de 0.95. De hecho, el huracn lleg a la orilla casi exactamente como se predijo y se ubic en el centro de la zona afectada. Suponga que el National Hurricane Center pronostica que los huracanes azotarn la zona afectada con un 0.95 de probabilidad. Responda las siguientes preguntas.

218

Captulo 6

La tormenta contina hacia el noroeste Posicin : 27.8 N, 71.4 O Movimiento: NNO a 8 mph Vientos constantes: 105 mph
A las 11 de la noche del martes Localizacin del huracn Localizacin de la tormenta tropical Pa. Va. N.C. S.C. N.J. Del. Md. 0 Zona del posible movimiento
40 300 mi

30

Ocano Atlntico CUBA


80 W 70 20

a) De qu distribucin de probabilidad se trata en este caso? b) Cul es la probabilidad de que 10 huracanes toquen tierra en la zona afectada? c)  Cul es la probabilidad de que por lo menos 10 huracanes toquen tierra fuera de la zona afectada? 71.  Un estudio reciente de CBS News inform que 67% de los adultos cree que el Departamento del Tesoro de Estados Unidos debe seguir acuando monedas de un centavo.

18-29 30-44 45-64 65 o ms

Un centavo ahorrado es para aquellos que 46% siempre piden cambio 40% 56% 71%

Suponga que se selecciona una muestra de 15 adultos. a)  Cuntos de los 15 adultos indicaran que el Departamento del Tesoro debe seguir acuando monedas de un centavo? Cul es la desviacin estndar? b)  Cul es la probabilidad de que exactamente 8 adultos indiquen que el Departamento del Tesoro debe seguir acuando monedas de un centavo? c)  Cul es la probabilidad de que por lo menos 8 adultos indiquen que el Departamento del Tesoro debe seguir acuando monedas de un centavo?

Distribuciones discretas de probabilidad

219

Ejercicios de la base de datos


72.  Consulte los datos de Real State, que reporta informacin de las casas vendidas en el rea de Denver, Colorado, el ltimo ao. a)  Construya una distribucin de probabilidad para el nmero de habitaciones. Calcule la media y la desviacin estndar de la distribucin. b)  Construya una distribucin de probabilidad para el nmero de baos. Calcule la media y la desviacin estndar de la distribucin. 73.  Consulte los datos Baseball 2005, los cuales contienen informacin sobre la temporada 2005 de la Liga Mayor de Bisbol. Hay 30 equipos en las ligas mayores, 3 de los cuales tienen canchas con supercies articiales. Como parte de las negociaciones con el sindicato de los trabajadores, se llevar a cabo un estudio relacionado con las lesiones ocasionadas en csped en comparacin con las lesiones ocasionadas en supercies articiales. Se seleccionarn cinco equipos para que participen en el estudio, los cuales se elegirn al azar. Cules son las posibilidades de que uno de los cinco equipos elegidos para el estudio jueguen sus partidos en casa sobre supercies articiales?

Comandos de software
1.  Los comandos de MegaStat para crear la distribucin de probabilidad binomial de la pgina 193 son: a)  Seleccione la opcin MegaStat en la barra de herramientas; haga clic en Probability y en Discrete Probability Distributions. b)  En el cuadro de dilogo, seleccione Binomial; el nmero de pruebas es 6; la probabilidad de un xito es de 0.05. Si desea ver una grca, haga clic en display graph.

2.  Los comandos de Excel para determinar la distribucin de probabilidad binomial de la pgina 194 son: a)  En una hoja de clculo de Excel en blanco escriba la palabra xito en la celda A1, y la palabra Probabilidad en la celda B1. De las celdas A2 a A17 escriba los nmeros enteros 0 a 15. Active la tecla B2 haciendo clic en ella. b)  De la barra de herramientas seleccione Insert y Function. c)  En el primer cuadro de dilogo seleccione Statistical en la categora de funciones, y BINOMDIST en la categora del nombre de la funcin; enseguida haga clic en OK. d)  En el segundo cuadro de dilogo introduzca los cuatro elementos que se requieren para calcular una probabilidad binomial. 1. Introduzca 0 como el nmero de xitos. 2. Introduzca 40 como el nmero de pruebas.

220

Captulo 6

3. Introduzca 0.09 como probabilidad de un xito. 4.  Introduzca la palabra falso o el nmero 0 como probabilidades individuales y haga clic en OK. 5.  Excel calcular la probabilidad de 0 xitos en 40 pruebas, con una probabilidad de 0.09 de xito. El resultado, 0.02299618, se almacena en la celda B2. e)  Para determinar por completo la distribucin de probabilidad, en la barra de frmulas sustituya el 0 ubicado a la derecha del parntesis de apertura con A2: A17. f )  Arrastre el ratn a la esquina inferior izquierda de la celda B2 hasta que aparezca el smbolo + con lneas slidas negras; enseguida haga clic, seleccione y resalte la columna B, celda B17. Aparecer la probabilidad de un xito para los diversos valores de la variable aleatoria. 3.  Los comandos de Excel para determinar la distribucin hipergeomtrica de la pgina 202 son los siguientes: a)  En una hoja de clculo en blanco de Excel, escriba las palabras Miembros de un sindicato en la celda E8 y la palabra Probabilidad en la celda F8. En las celdas E9 a E14 escriba los enteros 0 a 5. Haga clic en F9 como celda activa. b) De la barra de herramientas elija Insert y Function. c)  En el primer cuadro de dilogo, seleccione Statistical y HYPGEOMDIST, y enseguida haga clic en OK. d)  En el segundo cuadro de dilogo introduzca los cuatro elementos necesarios para calcular una probabilidad hipergeomtrica. 1. Introduzca 0 como nmero de xitos. 2. Introduzca 5 como nmero de pruebas. 3.  Introduzca 40 como nmero de xitos en la poblacin. 4.  Introduzca 50 como tamao de la poblacin y haga clic en OK. 5.  Excel calcular la probabilidad de 0 xitos en 5 pruebas (0.000118937) y almacenar el resultado en la celda F9. e)  Para determinar la distribucin de probabilidad completa, en la barra de frmulas sustituya el 0 a la derecha del parntesis de apertura con E9:E14. f )  Arrastre el ratn a la esquina inferior derecha de la celda F9 hasta que aparezca el smbolo + en lneas negras slidas; enseguida haga clic, seleccione y resalte la columna F, celda F14. Aparecer la probabilidad de un xito para los diversos resultados.

4.  Los comandos de MINITAB para generar la distribucin de Poisson de la pgina 205 son los siguientes: a)  En la columna C1 coloque el encabezado xitos, y en C2, Probabilidad. Introduzca los enteros 0 a 5 en la primera columna. b)  Seleccione Calc; enseguida Probability Distributions y Poisson. c)  En el cuadro de dilogo, haga clic en Probability; iguale la media a 0.3 y seleccione C1 como columna de entrada de datos. Designe C2 como memoria opcional y enseguida haga clic en OK.

Distribuciones discretas de probabilidad

221

Captulo 6 Respuestas a las autoevaluaciones


6.1 a) Nmero de puntos Probabilidad c) x $0.80 0.90 1.20 P (x) (x ) (x )2P (x) .00507 .00045 .01458 .02010

1 1 6 1 2 6 1 3 6 1 4 6 1 5 6 1 6 6 6 = 1.00 Total 6

.30 0.13 .50 0.03 .20 0.27

 La varianza es de 0.02010, y la desviacin estndar, de 14 centavos. 6.3 a)  Es razonable, porque a cada empleado se le hace un depsito directo o no se le hace; los empleados son independientes; la probabilidad de que se hagan depsitos directos es de 0.80 en el caso de todos, y se cuentan los empleados de 7 que se benecian del servicio. b) P (7) = 7C7 (.80)7 (.20)0 = .2097 6.4 c) P (4) = 7C4 (.80)4 (.20)3 = .1147 d) Las respuestas concuerdan. n = 4, = .60 a) P (x = 2) = .346 b) P (x 2) = .526 c) P (x > 2) = 1 .526 = .474
8 C3 4C2 12 C5

b)

Probabilidad

1 6

6.5

P (3) =

8! 4! 3!5! 2!2! = 12! 5!7!

6
6.6

Nmero de puntos
6.2 6 c) , o 1. 6 a)  Discreta, pues los valores $0.80, $0.90 y $1.20 se encuentran claramente separados entre s. Asimismo, la suma de las probabilidades es 1.00 y los resultados son mutuamente excluyentes. b) x P (x) xP (x) $ .80 .30 .90 .50 1.20 .20 La media es de 93 centavos. 0.24 0.45 0.24 0.93 P (1) =

(56)(6) = .424 792

= 4 000(.0002) = 0.8 0.81e 0.8 = .3595 1!

7
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Comprender la diferencia entre las distribuciones discreta y continua. 2. Calcular la media y la desviacin estndar de una distribucin uniforme. 3. Calcular probabilidades con la distribucin uniforme. 4. Enumerar las caractersticas de la distribucin de probabilidad normal. 5. Definir y calcular valores z. 6. Determinar la probabilidad de que una observacin se encuentre entre dos puntos en una distribucin de probabilidad normal. 7. Determinar la probabilidad de que una observacin se encuentre sobre (o debajo de) un punto en una distribucin de probabilidad normal. 8. Aplicar la distribucin de probabilidad normal para aproximar la distribucin binomial.

Distribuciones de probabilidad continua

La mayora de las tiendas de menudeo ofrecen sus propias tarjetas de crdito. En el momento en que se presenta la solicitud de crdito, el cliente recibe 10% de descuento en sus compras. El tiempo que se requiere para llenar la solicitud de crdito se rige por una distribucin, cuyos tiempos van de 4 a 10 minutos. Cul es la desviacin estndar del tiempo que dura el trmite? (Vase objetivo 2 y ejercicio 39.)

Distribuciones de probabilidad continua

223

Introduccin
En el captulo 6 inici su estudio de las tres distribuciones de probabilidad discreta: binomial, hipergeomtrica y de Poisson. Estas distribuciones se basan en variables aleatorias discretas, que slo adoptan valores claramente separados. Por ejemplo, si elige para estudiar 10 pequeas empresas que iniciaron sus operaciones en 2000, la cantidad de empresas que todava funcionan en 2006 puede ser de 0, 1, 2, , 10. No puede haber 3.7, 12 o 7 an funcionando en 2006. Entonces, slo son posibles determinados resultados, los cuales se encuentran representados por valores claramente separados. Adems, el resultado se determina al contar el nmero de xitos. Hay que contar el nmero de empresas que continan funcionando en 2006. En este captulo seguimos con el estudio de las distribuciones de probabilidad, pero ahora de las continuas. Una distribucin de probabilidad continua resulta de medir algo, como la distancia del dormitorio al saln de clases, el peso de un individuo o la cantidad de bonos que ganan los directores ejecutivos. Suponga que seleccionamos a cinco estudiantes y calculamos que las distancias, en millas, que viajan a clases son de 12.2, 8.9, 6.7, 3.6 y 14.6. Cuando examinamos una distribucin continua, la informacin que nos interesa es el porcentaje de estudiantes que viajan menos de 10 millas o el porcentaje que viaja ms de 8 millas. En otras palabras, en el caso de una distribucin continua, quiz desee conocer el porcentaje de observaciones que se presentan dentro de cierto margen. Es importante sealar que una variable aleatoria continua tiene un nmero innito de valores dentro de cierto intervalo particular. As, debe pensar en la probabilidad de que una variable tenga un valor dentro de un intervalo especco, en vez de pensar en la probabilidad de un valor especco. Considerar dos familias de distribuciones: la distribucin de probabilidad uniforme y la distribucin de probabilidad normal. Estas distribuciones describen la probabilidad de que una variable aleatoria continua con una innidad de valores posibles caiga dentro de un intervalo especco. Por ejemplo, suponga que el tiempo de acceso a la pgina web de McGraw-Hill (www.mhhe.com) se encuentra distribuido uniformemente con un tiempo mnimo de 20 milisegundos y un tiempo mximo de 60 milisegundos. Entonces, es posible determinar la probabilidad de que se pueda tener acceso a la pgina en 30 milisegundos o menos. El tiempo de acceso se mide en una escala continua. La segunda distribucin continua que se estudia en este captulo es la distribucin de probabilidad normal. La distribucin normal se describe mediante su media y desviacin estndar. Por ejemplo, suponga que la vida media de una batera Energizer tamao C se rige por una distribucin normal con una media de 45 horas y una desviacin estndar de 10 horas cuando se utiliza en determinado juguete. Puede determinar la probabilidad de que la batera dure ms de 50 horas, entre 35 y 62 horas, o menos de 39 horas. La vida media de la batera se mide en una escala continua.

La familia de distribuciones de probabilidad uniforme


La distribucin de probabilidad uniforme es, tal vez, la distribucin ms simple de una variable aleatoria continua. La distribucin tiene forma rectangular y queda denida por valores mnimos y mximos. He aqu algunos ejemplos que se rigen por una distribucin uniforme. E  l tiempo de vuelo de una aerolnea comercial de Orlando, Florida, a Atlanta, Georgia, vara de 60 a 120 minutos. La variable aleatoria es el tiempo de vuelo dentro de este intervalo. Observe que la variable de inters, el tiempo de vuelo en minutos, es continua en el intervalo de 60 a 120 minutos.  Los voluntarios de la Grand Strand Public Library elaboran formas para declaraciones de impuestos federales. El tiempo de elaboracin de una forma 1040-Z se rige por una distribucin uniforme en el intervalo de 10 a 30 minutos. La variable aleatoria es la cantidad de minutos que tarda llenar la forma, y puede tomar valores entre 10 y 30.

224

Captulo 7

En la grca 7.1 aparece una distribucin uniforme. La forma de la distribucin es rectangular y posee un valor mnimo a y un mximo b. Observe, asimismo, en la grca 7.1, que la altura de la distribucin es constante o uniforme para todos los valores entre a y b.
P(x)

1 ba

GRFICA 7.1 Distribucin uniforme continua La media de una distribucin uniforme se localiza a la mitad del intervalo entre los valores mnimo y mximo. Se calcula de la siguiente manera: MEDIA DE LA DISTRIBUCIN UNIFORME = a +b 2 [7.1]

La desviacin estndar describe la dispersin de una distribucin. En la distribucin uniforme, la desviacin estndar tambin se relaciona con el intervalo entre los valores mximo y mnimo. DESVIACIN ESTNDAR DE LA DISTRIBUCIN UNIFORME = La ecuacin de la distribucin de probabilidad uniforme es: 1 DISTRIBUCIN UNIFORME si a x b y 0 en cualquier otro lugar [7.3] P (x ) = b a Como se demostr en el captulo 6, las distribuciones de probabilidad sirven para hacer armaciones relativas a los valores de una variable aleatoria. En el caso de distribuciones que describen una variable aleatoria continua, las reas dentro de la distribucin representan probabilidades. En el caso de la distribucin uniforme, su forma rectangular permite aplicar la frmula del rea de un rectngulo. Recuerde que el rea de un rectngulo se determina al multiplicar la longitud por la altura. En el caso de la distribucin uniforme, la altura del rectngulo es P(x), que es 1/(b a). La longitud de la base de la distribucin es b a. Observe que, si multiplicamos la altura de la distribucin por todo su intervalo para determinar el rea, el resultado siempre es 1.00. En otras palabras, el rea total dentro de una distribucin de probabilidad continua es igual a 1.00. En general: rea = (altura)(base) = 1 (b a) = 1.00 (b a) (b a)2 12 [7.2]

De este modo, si una distribucin uniforme va de 10 a 15, la altura es de 0.20, que se determina mediante 1/(15 10). La base es de 5, que se calcula al restar 15 10. El rea total es: rea = (altura)(base) = 1 (15 10) = 1.00 (15 10)

Un ejemplo ilustrar las caractersticas de una distribucin uniforme y la forma de calcular probabilidades por medio de sta.

Distribuciones de probabilidad continua

225

Ejemplo

La Southwest Arizona State University proporciona servicio de transporte de autobs a los estudiantes mientras se encuentran en el recinto. Un autobs llega a la parada de North Main Street y College Drive cada 30 minutos, entre las 6 de la maana y las 11 de la noche entre semana. Los estudiantes llegan a la parada en tiempos aleatorios. El tiempo que espera un estudiante tiene una distribucin uniforme de 0 a 30 minutos. 1. Trace una grca de la distribucin. 2. Demuestre que el rea de esta distribucin uniforme es de 1.00. 3.  Cunto tiempo esperar el autobs normalmente un estudiante? En otras palabras, cul es la media del tiempo de espera? Cul es la desviacin estndar de los tiempos de espera? 4. Cul es la probabilidad de que un estudiante espere ms de 25 minutos? 5. Cul es la probabilidad de que un estudiante espere entre 10 y 20 minutos?

Solucin

En este caso, la variable aleatoria es el tiempo que espera un estudiante. El tiempo se mide en una escala continua, y los tiempos de espera varan de 0 a 30 minutos. 1.  La grca 7.2 muestra la distribucin uniforme. La lnea horizontal se traza a una altura de 0.0333, que se calcula mediante 1/(30 0). El intervalo de esta distribucin es de 30 minutos.
.060

Probabilidad

.0333

10

20 Tiempo de espera (minutos)

30

40

GRFICA 7.2 Distribucin de probabilidad uniforme de tiempos de espera de los estudiantes 2.  El tiempo que los estudiantes esperan el autobs es uniforme a lo largo del intervalo de 0 a 30 minutos; as, en este caso, a es 0 y b 30. rea = (altura)(base) = 1 (30 0) = 1.00 (30 0)

3. Para determinar la media, aplique la frmula (7.1): a + b 0 + 30 = = 15 2 2 La media de la distribucin es de 15 minutos; as, el tiempo de espera habitual en el servicio de autobs es de 15 minutos. Para determinar la desviacin estndar de los tiempos de espera, aplique la frmula (7.2): = (b a)2 (30 0)2 = = 8.66 12 12 La desviacin estndar de la distribucin es de 8.66 minutos. Es la variacin de  los tiempos de espera de los estudiantes. 4.  El rea dentro de la distribucin en el intervalo de 25 a 30 representa esta probabilidad en particular. De acuerdo con la frmula del rea: = P (25 < tiempo de espera < 30) = (altura)(bas se) = 1 (5) = .1667 (30 0)

226

Captulo 7

 s, la probabilidad de que un estudiante espere entre 25 y 30 minutos es 0.1667. A Tal conclusin se ilustra en la siguiente grca:
P(x) .0333 rea = .1667

10

= 15

20

25

30

5.  El rea dentro de la distribucin en el intervalo de 10 a 20 representa la probabilidad. P (10 < tiempo de espera < 20) = (altura)(base) = Esta probabilidad se ilustra de la siguiente manera:
P(x) .0333 rea = .3333

1 (10) = .3333 (30 0)

10

= 15

20

30

Autoevaluacin 7.1

Los perros ovejeros australianos tienen una vida relativamente corta. La duracin de sus vidas obedece a una distribucin uniforme de entre 8 y 14 aos. a) Trace la distribucin uniforme. Cules son los valores de la altura y de la base? b) Demuestre que el rea total bajo la curva es de 1.00. c) Calcule la media y la desviacin estndar de esta distribucin. d) Cul es la probabilidad de que un perro en particular viva entre 10 y 14 aos? e) Cul es la probabilidad de que un perro viva menos de 9 aos?

Ejercicios
1. Una distribucin uniforme se dene en el intervalo de 6 a 10. a) Cules son los valores de a y de b? b) Cul es la media de esta distribucin uniforme? c) Cul es la desviacin estndar? d) Demuestre que el rea total es de 1.00. e) Calcule la probabilidad de un valor mayor que 7. f) Calcule la probabilidad de un valor entre 7 y 9. 2. Una distribucin uniforme se dene en el intervalo de 2 a 5. a) Cules son los valores para a y b? b) Cul es la media de esta distribucin uniforme? c) Cul es la desviacin estndar? d) Demuestre que el rea total es de 1.00. e) Calcule la probabilidad de un valor mayor que 2.6. f) Calcule la probabilidad de un valor entre 2.9 y 3.7. 3.  America West Airlines informa que el tiempo de vuelo del Aeropuerto Internacional de Los ngeles a Las Vegas es de 1 hora con 5 minutos, o 65 minutos. Suponga que el tiempo real de vuelo tiene una distribucin uniforme de entre 60 y 70 minutos. a) Muestre una grca de la distribucin de probabilidad continua. b) Cul es el tiempo medio de vuelo? Cul es la varianza de los tiempos de vuelo?

Distribuciones de probabilidad continua

227

c) Cul es la probabilidad de que el tiempo de vuelo sea menor que 68 minutos? d) Cul es la probabilidad de que el tiempo de vuelo sea mayor que 64 minutos? 4.  De acuerdo con el Insurance Institute of America, una familia de cuatro miembros gasta entre $400 y $3 800 anuales en toda clase de seguros. Suponga que el dinero que se gasta tiene una distribucin uniforme entre estas cantidades. a) Cul es la media de la suma que se gasta en seguros? b) Cul es la desviacin estndar de la suma gastada? c)  Si elige una familia al azar, cul es la probabilidad de que gaste menos de $2 000 anuales en seguros? d) Cul es la probabilidad de que una familia gaste ms de $3 000 anuales? 5.  Las precipitaciones de abril en Flagstaff, Arizona, tienen una distribucin uniforme entre 0.5 y 3.00 pulgadas. a) Cules son los valores para a y b? b) Cul es la precipitacin media del mes? Cul es la desviacin estndar? c) Cul es la probabilidad de que haya menos de una pulgada de precipitacin en el mes? d)  Cul es la probabilidad de que haya exactamente 1.00 pulgada de precipitacin en el mes? e) Cul es la probabilidad de que haya ms de 1.5 pulgadas de precipitacin en el mes? 6.  Los clientes con problemas tcnicos en su conexin de internet pueden llamar al nmero 800 para solicitar asistencia tcnica. El tcnico tarda entre 30 segundos y 10 minutos para resolver el problema. La distribucin de este tiempo de asistencia tiene una distribucin uniforme. a) Cules son los valores para a y b en minutos? b)  Cul es el tiempo medio que se requiere para resolver el problema? Cul es la desviacin estndar del tiempo? c) Qu porcentaje de los problemas consumen ms de 5 minutos para resolverse? d)  Suponga que busca determinar 50% de los tiempos de resolucin de los problemas. Cules son los puntos extremos de estos dos tiempos?

La familia de distribuciones de probabilidad normal


Enseguida se estudia la distribucin de probabilidad normal. A diferencia de la distribucin uniforme [vase la frmula (7.3)], la distribucin de probabilidad normal tiene una frmula muy compleja. DISTRIBUCIN DE PROBABILIDAD NORMAL P (x ) = 1 2 e
( X )2 22

[7.4]

Sin embargo, no se preocupe por la complejidad de esta frmula. Usted ya conoce varios de estos valores. Los smbolos y se reeren a la media y a la desviacin estndar. La letra griega es una constante matemtica natural, cuyo valor es aproximadamente 22/7 o 3.1416. La letra e tambin es una constante matemtica. Es la base del sistema de logaritmos naturales y es igual a 2.718; y X es el valor de una variable aleatoria continua. As, una distribucin normal se basa se dene en su media y su desviacin estndar. No necesitar hacer clculos con la frmula (7.4). Ms bien, requerir una tabla, la cual aparece en el apndice B.1, para buscar las diversas probabilidades. La distribucin de probabilidad normal posee las siguientes caractersticas principales. 1.  Tiene forma de campana y posee una sola cima en el centro de la distribucin. La media aritmtica, la mediana y la moda son iguales, y se localizan en el centro de la distribucin. El rea total bajo la curva es de 1.00. La mitad del rea bajo la curva normal se localiza a la derecha de este punto central, y la otra mitad, a la izquierda. 2.  Es simtrica respecto de la media. Si hace un corte vertical, por el valor central, a la curva normal, las dos mitades son imgenes especulares. 3.  Desciende suavemente en ambas direcciones del valor central. Es decir, la distribucin es asinttica. La curva se aproxima ms y ms al eje X, sin tocarlo en realidad. En otras palabras, las colas de la curva se extienden indenidamente en ambas direcciones. 4.  La localizacin de una distribucin normal se determina a travs de la media, . La dispersin o propagacin de la distribucin se determina por medio de la desviacin estndar, . Estas caractersticas se muestran en la grca 7.3.

228

Captulo 7

La curva normal es simtrica Dos mitades idnticas

Cola En teora, la curva tiende a

Cola En teora, la curva tiende a +

La media, la mediana y la moda son iguales

GRFICA 7.3 Caractersticas de una distribucin normal No slo existe una distribucin de probabilidad normal, sino una familia. Por ejemplo, en la grca 7.4 se comparan las distribuciones de probabilidad del tiempo de servicio de los empleados de tres diferentes plantas. En la planta de Camden, la media es de 20 aos, y la desviacin estndar, de 3.1 aos. Existe otra distribucin de probabilidad normal para el tiempo de servicio en la planta de Dunkirk, donde = 20 aos y = 3.9 aos. En la planta de Elmira, = 20 aos y = 5.0 aos. Observe que las medias son las mismas, pero las desviaciones estndares dieren.
Medias iguales, desviaciones estndares diferentes

= 3.1 aos, planta de Camden = 3.9 aos, planta de Dunkirk = 5.0 aos, planta de Elmira

7 10 13 16 19 22 25 28 31 34 37 40 = 20 aos de servicio

GRFICA 7.4 Distribucin de probabilidad normal con medias iguales y distribuciones


estndares diferentes

La grca 7.5 muestra la distribucin de los pesos de las cajas de tres cereales. Los pesos tienen una distribucin normal con diferentes medias e idnticas desviaciones estndares.
Medias diferentes, desviaciones estndares iguales

Sugar Yummies = 1.6 gramos

Alphabet Gems = 1.6 gramos

Weight Droppers = 1.6 gramos

283 gramos

301 gramos

321 gramos

GRFICA 7.5 Distribucin de probabilidad normal con diferentes medias y desviaciones


estndares iguales

Distribuciones de probabilidad continua

229

Por ltimo, la grca 7.6 muestra tres distribuciones normales con diferentes medias y desviaciones estndares. stas muestran la distribucin de fuerzas de tensin, medidas en libras por pulgada cuadrada (psi) para tres clases de cables.
Diferentes medias, desviaciones estndares diferentes = 41 psi = 52 psi = 26 psi

2 000 psi diferentes

2 107 psi

2 186 psi

GRFICA 7.6 Distribuciones de probabilidad normales con medias y desviaciones estndares Recuerde que, en el captulo 6, las distribuciones de probabilidad discreta muestran las posibilidades especcas de que ocurra un valor discreto. Por ejemplo, en la pgina 190, con la distribucin binomial se calcula la probabilidad de que ninguno de los cinco vuelos que llegan al Aeropuerto Regional Bradford de Pennsylvania llegue retrasado. En el caso de la distribucin de probabilidad continua, las reas bajo la curva denen probabilidades. El rea total bajo la curva normal es de 1.0. Esto explica todos los posibles resultados. Como una distribucin de probabilidad normal es simtrica, el rea bajo la curva a la izquierda de la media es de 0.5, y el rea bajo la curva a la derecha de la media, de 0.5. Aplique esto a la distribucin de Sugar Yummies en la grca 7.5. Es una distribucin normal con una media de 283 gramos. Por consiguiente, la probabilidad de llenar una caja con ms de 283 gramos es de 0.5, y la probabilidad de llenar una caja con menos de 283 gramos, de 0.5. Tambin puede determinar la probabilidad de que una caja pese entre 280 y 286 gramos. Sin embargo, para determinar esta probabilidad necesita conocer la distribucin de probabilidad normal estndar.

Distribucin de probabilidad normal estndar


El nmero de distribuciones normales es ilimitado, y cada una posee diferentes media (), desviacin estndar () o ambas. Mientras que es posible proporcionar tablas de probabilidad para distribuciones discretas, como la binomial y la de Poisson, es imposible proporcionar tablas para una innidad de distribuciones normales. Por fortuna, un miembro de la familia se utiliza para determinar las probabilidades de todas las distribuciones de probabilidad normal. Es la distribucin de probabilidad normal estndar y es nica, pues tiene una media de 0 y una desviacin estndar de 1. Cualquier distribucin de probabilidad normal puede convertirse en una distribucin de probabilidad normal estndar al restar la media de cada observacin y dividir esta diferencia entre la desviacin estndar. Los resultados reciben el nombre de valores z o valores tipificados. VALOR Z Distancia con signo entre un valor seleccionado, designado X, y la media, , dividida entre la desviacin estndar, . De esta manera, el valor z es la distancia de la media, medida en unidades de desviacin estndar. En trminos de una frmula, VALOR NORMAL ESTNDAR z = X [7.5]

230

Captulo 7

Aqu: X es el valor de cualquier observacin y medicin. es la media de la distribucin. es la desviacin estndar de la distribucin.
Estadstica en accin
Las aptitudes de un individuo dependen de una combinacin de factores hereditarios y ambientales, cada uno de los cuales tiene ms o menos la misma influencia. Por consiguiente, como en el caso de una distribucin binomial con un gran nmero de pruebas, muchas habilidades y aptitudes tienen una distribucin normal. Por ejemplo, las calificaciones en el Scholastic Aptitude Test (SAT) tienen una distribucin normal con una media de 1 000 y una desviacin estndar de 140.

Segn se observa en la denicin anterior, un valor z expresa la distancia o diferencia entre un valor particular de X y la media aritmtica en unidades de desviacin estndar. Una vez que se estandarizan las observaciones con distribucin normal, los valores z se distribuyen normalmente con una media de 0 y una desviacin estndar de 1. As, la distribucin z posee todas las caractersticas de cualquier distribucin de probabilidad normal. Estas caractersticas aparecen en la lista de la pgina 227. La tabla del apndice B.1 (tambin incluida en la tercera de forros) contiene una lista de las probabilidades de la distribucin de probabilidad normal estndar. TablA 7.1 reas bajo la curva normal
z 1.3 1.4 1.5 1.6 1.7 1.8 1.9 . . . 0.00 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.01 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.02 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.03 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.04 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.05 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 ...

Para explicarlo, suponga que desea calcular la probabilidad de que las cajas de Sugar Yummies pesen entre 283 y 285.4 gramos. De acuerdo con la grca 7.5, el peso de la caja de Sugar Yummies tiene una distribucin normal con una media de 283 gramos y una desviacin estndar de 1.6 gramos. Ahora quiere conocer la probabilidad o rea bajo la curva entre la media, 283 gramos, y 285.4 gramos. Tambin se expresa este problema con notacin de la probabilidad, similar al estilo que se utiliz en el captulo anterior: P(283 < peso < 285.4). Para determinar la probabilidad, es necesario convertir tanto 283 gramos como 285.4 gramos a valores z con la frmula (7.5). El valor z correspondiente a 283 es 0, que se calcula mediante la operacin (283 283)/1.6. El valor z correspondiente a 285.4 es 1.50, que se calcula mediante la operacin (285.4 283)/1.6. Despus, consulte la tabla del apndice B.1. Una parte se reproduce en la tabla 7.1. Descienda por la columna de la tabla encabezada por la letra z hasta 1.5. Ahora siga por la horizontal a la derecha y lea la probabilidad bajo la columna encabezada con 0.00. sta es de 0.4332. Esto signica que el rea bajo la curva entre 0.00 y 1.50 es de 0.4332. Tal es la probabilidad de que una caja seleccionada al azar de Sugar Yummies pese entre 283 y 285.4 gramos. Esto se ilustra en la siguiente grca.

.4332

= 283 0

285.4 1.50

Gramos Valores z

Distribuciones de probabilidad continua

231

Aplicaciones de la distribucin normal estndar


Cul es el rea bajo la curva entre la media y X en el caso de los valores z? Verique sus respuestas comparndolas con las que se dan. No todos los valores aparecen en la tabla 7.5. Necesitar el apndice B.1 o la tabla localizada en la tercera de forros de este libro.
Valores z calculados 2.84 1.00 0.49 rea bajo la curva .4977 .3413 .1879

Ahora se calcula el valor z dada la media poblacional, , la desviacin estndar de la poblacin, , y una X elegida. Los ingresos semanales de los supervisores de turno de la industria del vidrio se rigen por una distribucin de probabilidad normal con una media de $1 000 y una desviacin estndar de $100. Cul es el valor z para el ingreso X de un supervisor que percibe $1 100 semanales? Y para un supervisor que gana $900 semanales? De acuerdo con la frmula (7.5), los valores z para los dos valores X ($1 100 y $900) son: z= Para X = $1 100 Para X = $900 X X z= $1 100 $1 000 $900 $1 000 = = $100 $100 = 1.00 = 1 . 00

Ejemplo

Solucin

El valor z de 1.00 indica que un ingreso semanal de $1 100 est en una desviacin estndar por encima de la media, y un valor z de 1.00 muestra que un ingreso de $900 est en una desviacin estndar por debajo de la media. Observe que ambos ingresos ($1 100 y $900) se encuentran a la misma distancia ($100) de la media.

Autoevaluacin 7.2

De acuerdo con la informacin del ejemplo anterior ( = $1 000 y = $100), convierta: a) El ingreso semanal de $1 225 en un valor z. b) El ingreso semanal de $775 en un valor z.

Regla emprica
Antes de analizar ms aplicaciones de la distribucin de probabilidad normal estndar, se consideran tres reas bajo la curva normal que se emplearn en los siguientes captulos. Estos hechos recibieron el nombre de regla emprica en el captulo 3 (vase la p. 82). 1.  Cerca de 68% del rea bajo la curva normal se encuentra a una desviacin estndar de la media. Esto se puede escribir como 1. 2.  Alrededor de 95% del rea bajo la curva normal se encuentra a dos desviaciones estndares de la media. Esto se puede escribir como 2. 3. Prcticamente toda el rea bajo la curva se encuentra a tres desviaciones estndares de la media, lo cual se escribe 3.

232

Captulo 7

Esta informacin se resume en la siguiente grca.

68% 95%

3 3

2 2

Prcticamente toda 1 + 1 se convierte en 1 0 1

+ 2 + 3 2 3

Escala de X Escala de z

La transformacin de medidas en desviaciones normales estndares modica la escala. Las conversiones tambin se muestran en la grca. Por ejemplo, + 1 se convierte en un valor z de 1.00. Asimismo, 2 se transforma en un valor z de 2.00. Note que el centro de la distribucin z es cero, lo cual indica que no hay desviacin de la media, .

Ejemplo

Como parte de su programa de control de calidad, la compaa Autolite Battery realiza pruebas acerca de la vida til de las bateras. La vida media de una batera de celda alcalina D es de 19 horas. La vida til de la batera se rige por una distribucin normal con una desviacin estndar de 1.2 horas. Responda las siguientes preguntas: 1. Entre qu par de valores se localiza 68% de las bateras? 2. Entre qu par de valores se localiza 95% de las bateras? 3. Entre qu par de valores se localiza prcticamente la totalidad de las bateras? Aplique los resultados de la regla emprica para responder estas preguntas. 1.  Alrededor de 68% de las bateras tiene una vida til de entre 17.8 y 20.2 horas, lo cual se determina con el clculo 19.0 1(1.2) horas. 2.  Cerca de 95% de las bateras tiene una vida til de entre 16.6 y 21.4 horas, lo cual se determina con el clculo 19.0 2(1.2) horas. 3.  De hecho, todas las bateras tienen una vida til de entre 15.4 y 22.6 horas, lo cual se determina con el clculo 19.0 3(1.2) horas. Esta informacin se resume en la siguiente grca.

Solucin

68% 95% Prcticamente todas 3 15.4 2 16.6 1 17.8 19.0 + 1 20.2 + 2 + 3 Escala 21.4 22.6 en horas

Distribuciones de probabilidad continua

233

Autoevaluacin 7.3

La distribucin de los ingresos anuales de un grupo de empleados de mandos medios en Compton Plastics se aproxima a una distribucin normal, con una media de $47 200 y una desviacin estndar de $800. a) Entre qu par de valores se encuentran aproximadamente 68% de los ingresos? b) Entre qu par de valores se encuentran aproximadamente 95% de los ingresos? c) Entre qu par de valores se encuentran casi todos los ingresos? d) Cules son los ingresos medio y modal? e) La distribucin de ingresos es simtrica?

Ejercicios
7.  Explique el signicado del siguiente enunciado: No existe slo una distribucin de probabilidad normal, sino una familia. 8. Enumere las caractersticas ms importantes de una distribucin de probabilidad normal. 9.  La media de una distribucin de probabilidad normal es de 500; la desviacin estndar es de 10. a) Entre qu par de valores se localiza aproximadamente 68% de las observaciones? b) Entre qu par de valores se localiza aproximadamente 95% de las observaciones? c) Entre qu par de valores se localiza prcticamente la totalidad de las observaciones? 10.  La media de una distribucin de probabilidad normal es de 60; la desviacin estndar es de 5. a) Alrededor de qu porcentaje de las observaciones se encuentra entre 55 y 65? b) Cerca de qu porcentaje de las observaciones se encuentra entre 50 y 70? c) Alrededor de qu porcentaje de las observaciones se encuentra entre 45 y 75? 11.  La familia Kamp tiene gemelos, Rob y Rachel. Ellos se graduaron de la universidad hace dos aos y actualmente cada uno gana $50 000 anuales. Rachel trabaja en la industria de las ventas de menudeo, donde el salario medio para ejecutivos con menos de cinco aos de experiencia es de $35 000, con una desviacin estndar de $8 000. Rob es ingeniero. El salario medio para los ingenieros con menos de cinco aos de experiencia es de $60 000, con una desviacin estndar de $5 000. Calcule los valores z para Rob y para Rachel, y comente sobre sus resultados. 12.  Un artculo reciente que apareci en el Cincinnati Enquirer inform que el costo medio de la mano de obra para reparar una bomba de calefaccin es de $90, con una desviacin estndar de $22. Montes Plumbing and Heating Service termin la reparacin de dos bombas de calefaccin por la maana. El costo de la mano de obra de la primera bomba fue de $75, y de la segunda, de $100. Calcule los valores z para cada caso y comente sobre sus resultados.

Determinacin de reas bajo la curva normal


La siguiente aplicacin de la distribucin normal estndar tiene que ver con la determinacin del rea en una distribucin normal entre la media y un valor elegido, que se identica con X. El siguiente ejemplo ilustra los detalles.

Ejemplo

En el ejemplo anterior (vase la p. 231), el ingreso medio semanal de un supervisor de turno de la industria del vidrio tiene una distribucin normal, con una media de $1 000 y una desviacin estndar de $100. Es decir, = $1 000 y = $100. Cul es la probabilidad de seleccionar a un supervisor cuyo ingreso semanal oscile entre $1 000 y $1 100? Esta pregunta se expresa con notacin de probabilidad de la siguiente manera: P($1 000 < ingreso semanal < $1 100). Ya sabe que $1 100 tiene un valor z de 1.00 mediante la frmula (7.5). Para repetir, z= X $1 100 $1000 = = 1.00 $100

Solucin

234

Captulo 7

La probabilidad asociada con un valor z de 1.00 se encuentra disponible en el apndice B.1. A continuacin se presenta una parte del apndice B.1. Para localizar la probabilidad, descienda por la columna izquierda hasta 1.0 y enseguida vaya a la columna con el encabezado 0.00. El valor es 0.3413.
z 0.7 0.8 0.9 1.0 1.1 0.00 .2580 .2881 .3159 .3413 .3643 0.01 .2611 .2910 .3186 .3438 .3665 0.02 .2642 .2939 .3212 .3461 .3686

El rea bajo la curva normal entre $1 000 y $1 100 es de 0.3413. Tambin puede decir que 34.13% de los supervisores de turno en la industria del vidrio gana entre $1 000 y $1 100 semanales, o que la probabilidad de seleccionar a un supervisor cuyo ingreso oscile entre $1 000 y $1 100 es de 0.3413. Esta informacin se resume en el siguiente diagrama.

.3413

1.0

Escala de z Escala en dlares

$1 000 $1 100

En el ejemplo anterior interesaba la probabilidad entre la media y un valor dado. Cambie la pregunta. En lugar de querer conocer la probabilidad de seleccionar al azar a un supervisor que gane entre $1 000 y $1 100, suponga que busca la probabilidad de seleccionar a un supervisor que gane menos de $1 100. En notacin probabilstica, este enunciado se escribe como P(ingreso semanal < $1 100). El mtodo de solucin es el mismo. Determine la probabilidad de seleccionar a un supervisor que gane entre $1 000, la media y $1 100. Esta probabilidad es 0.3413. Enseguida, recuerde que la mitad del rea, o probabilidad, se encuentra sobre la media, y la otra mitad, debajo de ella. As, la probabilidad de seleccionar a un supervisor que gane menos de $1 000 es de 0.5000. Por ltimo, sume las dos probabilidades, de modo que 0.3413 + 0.5000 = 0.8413. Alrededor de 84% de los supervisores de la industria del vidrio gana menos de $1 100 mensuales (vase el siguiente diagrama).

Distribuciones de probabilidad continua

235

Estadstica en accin
Muchos procesos, como llenar botellas de refresco y empacar fruta, tienen una distribucin normal. Los fabricantes tienen que protegerse del llenado excesivo, as como del llenado incompleto. Si ponen demasiado en la lata o en la botella, regalan el producto. Si ponen muy poco, el cliente se puede sentir engaado y el gobierno puede cuestionar la descripcin que aparece en la etiqueta. A menudo se utilizan grficas de control, con los lmites trazados en tres desviaciones estndares por arriba y por debajo de la media, para supervisar esta clase de procesos de produccin.

.5000

.3413

1.0

Escala de z Escala en dlares

$1 000 $1 100

Excel calcular esta probabilidad. Los comandos que se requieren se encuentran en la seccin Comandos de software, al nal del captulo. La respuesta es 0.8413, la misma que se calcul.

Ejemplo

Consulte la informacin relacionada con el ingreso semanal de los supervisores de turno en la industria del vidrio. La distribucin de los ingresos semanales tiene una distribucin de probabilidad normal, con una media de $1 000 y una desviacin estndar de $100. Cul es la probabilidad de seleccionar a un supervisor de turno de la industria del vidrio cuyo ingreso: 1) oscile entre $790 y $1 000? 2) sea menor que $790?

Solucin

Comience por localizar el valor z correspondiente a un ingreso semanal de $790. De acuerdo con la frmula (7.5): z= X $790 $1000 = = 2.10 $100 s

Vea el apndice B.1. Siga hacia abajo por el margen izquierdo hasta la la 2.1 y a lo largo de dicha la, hasta la columna con el encabezado 0.00. El valor es de 0.4821. As, el rea bajo la curva normal estndar correspondiente a un valor z de 2.10 es de 0.4821. Sin embargo, como la distribucin normal es simtrica, el rea entre 0 y un valor negativo de z es la misma que el rea entre 0 y el correspondiente valor positivo de z. La probabilidad de localizar a un supervisor que gane entre $790 y $1 000 es de 0.4821. En notacin probabilstica: P($790 < ingreso semanal < $1 000) = 0.4821.

236

Captulo 7

z 2.0 2.1 2.2 2.3

0.00 .4772 .4821 .4861 .4893

0.01 .4778 .4826 .4864 .4896

0.02 .4783 .4830 .4868 .4898

La media divide la curva normal en dos mitades idnticas. El rea bajo la mitad izquierda de la media es de 0.5000, y el rea a la derecha tambin es de 0.5000. Como el rea bajo la curva entre $790 y $1 000 es 0.4821, el rea debajo de $790 es 0.0179, que se determina al restar 0.5000 0.4821. En notacin probabilstica: P(ingreso semanal < $790) = 0.0179. Esto signica que 48.21% de los supervisores tiene ingresos semanales que oscilan entre $790 y $1 000. Adems, es previsible que 1.79% gane menos de $790 a la semana. Esta informacin se resume en el siguiente diagrama.

.4821 .0179

.5000

2.10 $790

0 $1 000

Escala de z Escala en dlares

Autoevaluacin 7.4

Los empleados de Cartwright Manufacturing obtienen calificaciones mensuales de eficacia con base en factores como productividad, actitud y asistencia. La distribucin de las calificaciones tiene una distribucin de probabilidad normal. La media es de 400, y la desviacin estndar, de 50. a)  Cul es el rea bajo la curva normal entre 400 y 482? Exprese el rea en notacin probabilstica. b)  Cul es el rea bajo la curva normal para calificaciones mayores de 482? Exprese el rea en notacin probabilstica. c) Muestre las facetas de este problema en un diagrama.

Ejercicios
13. 14. Una poblacin normal tiene una media de 20.0 y una desviacin estndar de 4.0. a) Calcule el valor z asociado con 25.0. b) Qu proporcin de la poblacin se encuentra entre 20.0 y 25.0? c) Qu proporcin de la poblacin es menor que 18.0? Una poblacin normal tiene una media de 12.2 y una desviacin estndar de 2.5. a) Calcule el valor z asociado con 14.3. b) Qu proporcin de la poblacin se encuentra entre 12.2 y 14.3? c) Qu proporcin de la poblacin es menor que 10.0?

Distribuciones de probabilidad continua

237

Otra aplicacin de la distribucin normal tiene que ver con la combinacin de dos reas o probabilidades. Una de las reas se encuentra a la derecha de la media y la otra a la izquierda.

15.  Un estudio reciente acerca de salarios por hora de integrantes de equipos de mantenimiento de las aerolneas ms importantes demostr que el salario medio por hora era de $20.50, con una desviacin estndar de $3.50. Suponga que la distribucin de los salarios por hora es una distribucin de probabilidad normal. Si elige un integrante de un equipo al azar, cul es la probabilidad de que gane: a) entre $20.50 y $24.00 la hora? b) ms de $24.0 la hora? c) menos de $19.00 la hora? 16.  La media de una distribucin de probabilidad normal es de 400 libras. La desviacin estndar es de 10 libras. a) Cul es el rea entre 415 libras y la media de 400 libras? b) Cul es el rea entre la media y 395 libras? c)  Cul es la probabilidad de seleccionar un valor al azar y descubrir que es menor que 395 libras?

Ejemplo

Recuerde la distribucin de ingresos semanales de los supervisores de turno de la industria del vidrio. Los ingresos semanales tienen una distribucin de probabilidad normal, con una media de $1 000 y una desviacin estndar de $100. Cul es el rea bajo esta curva normal, entre $840 y $1 200? El problema se puede dividir en dos partes. Para el rea entre $840 y la media de $1 000: z= $840 $1000 $160 = = 1.60 $100 $100

Solucin

Para el rea entre la media de $1 000 y $1 200: z= $1200 $1000 $200 = = 2.00 $100 $100

El rea bajo la curva para un valor z de 1.60 es 0.4452 (apndice B.1). El rea bajo la curva para un valor z de 2.00 es 0.4772. Si suma las dos reas: 0.4452 + 0.4772 = .9224. Por consiguiente, la probabilidad de elegir un ingreso entre $840 y $1 200 es de 0.9224. En notacin probabilstica: P($840 < ingreso semanal < $1 200) = 0.4452 + 0.4772 = 0.9224. Para resumir, 92.24% de los supervisores tiene un ingreso semanal de entre $840 y $1 200. Eso se muestra en el siguiente diagrama:

.4452 .4772 Cul es esta probabilidad?


1.6 $840

0 $1 000

2.0 $1 200

Escala de z Escala en dlares

Otra aplicacin de la distribucin normal tiene que ver con determinar el rea entre valores del mismo lado de la media.

238

Captulo 7

Ejemplo Solucin

De regreso a la distribucin del ingreso semanal de los supervisores de turno de la industria del vidrio ( = $1 000, = $100), cul es el rea bajo la curva normal entre $1 150 y $1 250? De nuevo, el caso se divide en dos partes, por lo que se aplica la frmula (7.5). Primero halle el valor z relacionado con un salario semanal de $1 250: z= $1 250 $1 000 = 2.50 $100 $1 150 $1 000 = 1.50 $100

Enseguida determine el valor z para un salario semanal de $1 150: z=

De acuerdo con el apndice B.1, el rea relacionada con un valor z de 2.50 es de 0.4938. As, la probabilidad de un salario semanal entre $1 000 y $1 250 es de 0.4938. De manera similar, el rea asociada con un valor z de 1.50 es 0.4332; de este modo, la probabilidad de un salario semanal entre $1 000 y $1 150 es de 0.4332. La probabilidad de un salario semanal entre $1 150 y $1 250 se calcula al restar el rea asociada con un valor z de 1.50 (0.4332) de la probabilidad asociada con un valor z de 2.50 (0.4938). Por consiguiente, la probabilidad de un salario semanal entre $1 150 y $1 250 es de 0.0606. En notacin probabilstica: P($1150 < ingreso semanal < $1 250) = .4938 .4332 = .0606.

.4332

.0606

$1 000 0

$1 150 $1 250 1.50 2.50

Escala de ingresos Escala de z

En sntesis, hay cuatro situaciones relacionadas con la determinacin del rea bajo la curva de la distribucin de probabilidad normal estndar. 1.  Para determinar el rea entre 0 y z (o z), se busca la probabilidad directamente en la tabla. 2.  Para determinar el rea ms all de z (o z), se localiza la probabilidad de z en la tabla y se resta dicha probabilidad de 0.5000. 3.  Para determinar el rea entre dos puntos localizados en diferentes lados de la media, se determinan los valores z y se suman las probabilidades correspondientes. 4.  Para determinar el rea entre dos puntos localizados en el mismo lado de la media, se determinan los valores z y se resta la probabilidad menor de la mayor.

Autoevaluacin 7.5

Repase el ejemplo anterior, en el que la distribucin de ingresos semanales es de naturaleza normal con una media de $1 000 y una desviacin estndar de $100. a)  Qu fraccin de los supervisores de turno tiene ingresos entre $750 y $1 225? Trace una curva normal y sombree el rea correspondiente en el diagrama. b)  Qu fraccin de los supervisores de turno tiene ingresos semanales entre $1 100 y $1 225? Trace una curva normal y sombree el rea correspondiente en el diagrama.

Distribuciones de probabilidad continua

239

Ejercicios
17. Una distribucin normal tiene una media de 50 y una desviacin estndar de 4. a) Calcule la probabilidad de un valor localizado entre 44.0 y 55.0. b) Calcule la probabilidad de un valor mayor que 55.0. c) Calcule la probabilidad de un valor localizado entre 52.0 y 55.0. 18. Una poblacin normal tiene una media de 8 y una desviacin estndar de 14.0. a) Calcule la probabilidad de un valor localizado entre 75.0 y 90.0. b) Calcule la probabilidad de un valor de 75.0 o menor. c) Calcule la probabilidad de un valor localizado entre 55.0 y 70.0. 19.  De acuerdo con el Internal Revenue Service, el reembolso medio de impuestos en 2004 fue de $2 454. Suponga que la desviacin estndar es de $650 y que las sumas devueltas tienen una distribucin normal. a) Qu porcentajes de reembolsos son superiores a $3 000? b) Qu porcentajes de reembolsos son superiores a $3 000 e inferiores a $3 500? c) Qu porcentajes de reembolsos son superiores a $2 500 e inferiores a $3 500? 20.  Los montos de dinero que se piden en las solicitudes de prstamos en Down River Federal Savings tienen una distribucin normal, una media de $70 000 y una desviacin estndar de $20 000. Esta maana se recibi una solicitud de prstamo. Cul es la probabilidad de que: a) el monto solicitado sea de $80 000 o superior? b) el monto solicitado oscile entre $65 000 y $80 000? c) el monto solicitado sea de $65 000 o superior? 21.  WNAE, estacin de AM dedicada a la transmisin de noticias, encuentra que la distribucin del tiempo que los radioescuchas sintonizan la estacin tiene una distribucin normal. La media de la distribucin es de 15.0 minutos, y la desviacin estndar, de 3.5. Cul es la probabilidad de que un radioescucha sintonice la estacin: a) ms de 20 minutos? b) 20 minutos o menos? c) entre 10 y 12 minutos? 22.  Entre las ciudades de Estados Unidos con una poblacin de ms de 250 000 habitantes, la media del tiempo de viaje de ida al trabajo es de 24.3 minutos. El tiempo de viaje ms largo pertenece a la ciudad de Nueva York, donde el tiempo medio es de 38.3 minutos. Suponga que la distribucin de los tiempos de viaje en la ciudad de Nueva York tiene una distribucin de probabilidad normal y la desviacin estndar es de 7.5 minutos. a) Qu porcentaje de viajes en la ciudad de Nueva York consumen menos de 30 minutos? b) Qu porcentaje de viajes consumen entre 30 y 35 minutos? c) Qu porcentaje de viajes consumen entre 30 y 40 minutos?

En los ejemplos anteriores se requiere determinar el porcentaje de observaciones localizadas entre dos observaciones, o el porcentaje de observaciones por encima o por debajo de una observacin X. Otra aplicacin de la distribucin normal tiene que ver con el clculo del valor de la observacin X, cuando se tiene el porcentaje por encima o por debajo de la observacin. Layton Tire and Rubber Company pretende establecer una garanta de millaje mnimo para su nuevo neumtico MX100. Algunas pruebas revelan que el millaje medio es 67 900 con una desviacin estndar de 2 050 millas, y que la distribucin de millas tiene una distribucin de probabilidad normal. Layton desea determinar el millaje mnimo garantizado de manera que no haya que sustituir ms de 4% de los neumticos. Qu millaje mnimo garantizado debe anunciar Layton? El siguiente diagrama muestra las facetas del caso, en el que X representa el millaje mnimo garantizado.

Ejemplo

Solucin

240

Captulo 7

.5000

Neumtico reemplazado si no llega a esta cantidad de millas 4% o .0400 .4600

X ?

67 900

Escala en millas

Al sustituir estos valores en la frmula (7.5), se obtiene: z= X X 67 900 = 2 050

Observe que hay dos incgnitas, z y X. Para determinar X, primero calcule z, y despus despeje X. Observe que el rea que se encuentra por debajo de la curva normal a la izquierda de es de 0.5000. El rea entre y X se determina al restar 0.5000 0.0400. Enseguida consulte el apndice B.1. Busque en la tabla el rea ms prxima a 0.4600. El rea ms cercana es 0.4599. Siga por los mrgenes de este valor y lea el valor z de 1.75. Como el valor se encuentra a la izquierda de la media, en realidad es de 1.75. Estos pasos se ilustran en la tabla 7.2.
reas selectas debajo de la curva normal TablA 7.2
z 1.5 1.6 1.7 1.8 .03 .4370 .4484 .4582 .4664 .04 .4382 .4495 .4591 .4671 .05 .4394 .4505 .4599 .4678 .06 .4406 .4515 .4608 .4686

Puesto que la distancia entre y X es de 1.75, o z = 1.75, ahora puede despejar X (millaje mnimo garantizado): X 67 900 2 050 X 67 900 1.75 = 2 050 1.75(2 050) = X 67 900 X = 67 900 1.75(2 050) = 64 312 z= Por consiguiente, Layton puede anunciar que reemplazar de forma gratuita cualquier neumtico que se desgaste antes de llegar a las 64 312 millas, y la empresa sabr que slo 4% de los neumticos se sustituir de acuerdo con este plan. Excel tambin puede encontrar el valor del millaje. Vea la siguiente pantalla. Los comandos necesarios se dan en la seccin Comandos de software, al nal del captulo.

Distribuciones de probabilidad continua

241

Autoevaluacin 7.6

Un anlisis de las calificaciones del examen final de introduccin a la administracin revela que las calificaciones tienen una distribucin normal. La media de la distribucin es de 75, y la desviacin estndar, de 8. El profesor quiere recompensar con una A a los estudiantes cuyas calificaciones se encuentren dentro del 10% ms alto. Cul es el punto de divisin para los estudiantes que merecen una A y los que merecen una B?

Ejercicios
23.  Una distribucin normal tiene una media de 50 y una desviacin estndar de 4. Determine el valor por debajo del cual se presentar 95% de las observaciones. 24.  Una distribucin normal tiene una media de 80 y una desviacin estndar de 14. Determine el valor por encima del cual se presentar 80% de las observaciones. 25.  Suponga que el costo medio por hora de operacin de un avin comercial se rige por la distribucin normal, con una media de $2 100 y una desviacin estndar de $250. Cul es el costo de operacin ms bajo para 3% de los aviones? 26.  Las ventas mensuales de silenciadores en el rea de Richmond, Virginia, tienen una distribucin normal, con una media de 1 200 y una desviacin estndar de 225. Al fabricante le gustara establecer niveles de inventario de manera que slo haya 5% de probabilidad de que se agoten las existencias. Dnde se deben establecer los niveles de inventario? 27.  De acuerdo con una investigacin de medios de comunicacin, el estadounidense comn escuch 195 horas de msica durante 2004. Esto se encuentra por debajo de las 290 horas en 1999. Dick Trythall es un gran acionado de la msica country y del oeste. Escucha msica mientras trabaja en casa, lee y maneja su camin. Suponga que la cantidad de horas que escucha msica tiene una distribucin de probabilidad normal, con una desviacin estndar de 8.5 horas. a)  Si Dick se encuentra por encima de 1% en lo que se reere al tiempo que escucha msica, cuntas horas al ao escucha msica? b)  Suponga que la distribucin de tiempos para 1999 tambin tiene una distribucin de probabilidad normal, con una desviacin estndar de 8.5 horas. Cuntas horas en realidad escucha msica 1% de los que menos escuchan msica? 28.  En 2004 y 2005, el costo medio anual para asistir a una universidad privada en Estados Unidos era de $20 082. Suponga que la distribucin de los costos anuales se rigen por una distribucin de probabilidad normal y que la desviacin estndar es de $4 500. Noventa y cinco por ciento de los estudiantes de universidades privadas paga menos de qu cantidad? 29.  El puesto de peridicos de la esquina de East 9th Street y Euclid Avenue, en el centro de Cleveland, vende la edicin diaria del Cleveland Plain Dealer. La cantidad de peridicos vendidos tiene una distribucin de probabilidad normal con una media de 200 ejemplares y una desviacin estndar de 17 ejemplares. Cuntos ejemplares debe solicitar el propietario del puesto de peridicos para que slo se le agoten 20% de los das?

242

Captulo 7

30.  El fabricante de una impresora lser informa que la cantidad media de pginas que imprime un cartucho antes de reemplazarlo es de 12 200. La distribucin de pginas impresas por cartucho se aproxima a la distribucin de probabilidad normal, y la desviacin estndar es de 820 pginas. El fabricante desea proporcionar lineamientos a los posibles clientes sobre el tiempo que deben esperar que les dure un cartucho. Cuntas pginas debe indicar el fabricante por cartucho si desea tener 99% de certeza en todo momento?

Aproximacin de la distribucin normal a la binomial


En el captulo 6 se describe la distribucin de probabilidad binomial, que es una distribucin discreta. La tabla de probabilidades binomiales del apndice B.9 corre en sucesin de una n de 1 a una n de 15. Si un problema implicaba una muestra de 60, generar una distribucin binomial para dicha cantidad tan grande habra consumido demasiado tiempo. Un enfoque ms eciente consiste en aplicar la aproximacin de la distribucin normal a la binomial. Parece razonable emplear la distribucin normal (una distribucin continua) en sustitucin de la distribucin binomial (una distribucin discreta) para valores grandes de n, pues, conforme n se incrementa, una distribucin binomial se aproxima cada vez ms a una distribucin normal. La grca 7.7 describe el cambio de forma de una distribucin binomial con = 0.50, de una n de 3 a una n de 20. Observe cmo el caso en el que n = 20 aproxima la forma de la distribucin normal. En otras palabras, compare el caso en el que n = 20 con la curva normal de la grca 7.3 de la pgina 228.

n=1 .50 .40


P (x )

n=3 .40 .30 .20 .10 .20 .15 .10 .05 0 1 2 3 x 0 2 4 6 8

n = 20

.30 .20 .10 0 1 x

10 12 14 16 18 20 x

Nmero de veces que se presenta el evento

Nmero de veces que se presenta el evento

Nmero de veces que se presenta el evento

GRFICA 7.7 Distribucin binomial para una n de 1, 3 y 20, donde = 0.50


Cundo utilizar la aproximacin normal

Cundo utilizar la aproximacin normal? La distribucin de probabilidad normal constituye una buena aproximacin de la distribucin de probabilidad binomial cuando n y n(1 ) son ambos 5 por lo menos. Sin embargo, antes de aplicar la aproximacin normal, debe estar seguro de que la distribucin de inters es en verdad una distribucin binomial. De acuerdo con el captulo 6, se deben satisfacer cuatro criterios: 1.  Slo existen dos resultados mutuamente excluyentes en un experimento: xito o fracaso. 2.  La distribucin resulta del conteo del nmero de xitos en una cantidad ja de pruebas. 3. La probabilidad de un xito, , es la misma de una prueba a otra. 4. Cada prueba es independiente.

Factor de correccin de continuidad


Para mostrar la aplicacin de la aproximacin de la distribucin normal a la binomial, as como la necesidad de un factor de correccin, suponga que la administracin de Santoni Pizza Restaurant se da cuenta de que 70% de sus nuevos clientes regresa a comer.

Distribuciones de probabilidad continua

243

Cul es la probabilidad de que 60% o ms clientes regresen a comer durante una semana en la que 80 nuevos (primera vez) clientes comen en Santoni? Observe que se cumplen las condiciones relacionadas con la distribucin binomial: 1) slo hay dos posibles resultados: un cliente regresa para consumir alimentos o no lo hace; 2) es posible contar el nmero de xitos, lo cual signica, por ejemplo, que 57 de los 80 clientes regresan; 3) las pruebas son independientes, lo cual signica que si la persona nmero 34 regresa a comer por segunda vez, esto no inuye en el hecho de que la persona 58 vuelva; 4) la probabilidad de que un cliente vuelva se mantiene en 0.70 para los 80 clientes. Por consiguiente, es aplicable la frmula binomial (6.3), descrita en la pgina 190. P (x ) = nCx ()x (1 )n x Para determinar la probabilidad de que 60 o ms clientes regresen para consumir pizza, primero necesita calcular la probabilidad de que regresen exactamente 60 clientes. Es decir: P (x = 60) = P (x = 61) =
60 20 80C60 (.70) (1 .70)

= .063 = .048

Enseguida determine la probabilidad de que exactamente 61 clientes regresen. Es decir:


61 19 80C61(.70) (1 .70)

Contine con el proceso hasta obtener la probabilidad de que regresen los 80 clientes. Finalmente, sume las probabilidades de 60 a 80. Resulta engorroso resolver este problema con este procedimiento. Tambin se puede utilizar un paquete de software de computadora, como MINITAB o Excel, para determinar las diversas probabilidades. Enseguida aparece una lista de las probabilidades binomiales para n = 80 y = 0.70, y x, el nmero de clientes que regresan, que va de 43 a 68. La probabilidad de que regrese cualquier cantidad de clientes inferior a 43 o superior a 68 es menor que 0.001. Tambin es posible suponer que estas probabilidades son iguales a 0.000.
Nmero de clientes que regresan Probabilidad 43 44 45 46 47 48 49 50 51 52 53 54 55 .001 .002 .003 .006 .009 .015 .023 .033 .045 .059 .072 .084 .093 Nmero de clientes que regresan 56 57 58 59 60 61 62 63 64 65 66 67 68

Probabilidad .097 .095 .088 .077 .063 .048 .034 .023 .014 .008 .004 .002 .001

Se determina la probabilidad de que 60 o ms clientes regresen al sumar 0.063 + 0.048 + + 0.001, que equivale a 0.197. Sin embargo, un vistazo a la grca de la pgina 244 muestra la similitud de esta distribucin con una distribucin normal. Todo lo que necesita es arreglar las probabilidades discretas para obtener una distribucin continua. Adems, trabajar con una distribucin normal implicar unos cuantos clculos ms que hacerlo con la binomial. El articio consiste en permitir que la probabilidad discreta de 56 clientes quede representada por un rea bajo la curva continua entre 55.5 y 56.5; despus, permitir que la probabilidad de los 57 clientes quede representada por un rea entre 56.5 y 57.5, etc. Esto es exactamente lo contrario de redondear las cifras a un nmero entero.

244

Captulo 7

Estadstica en accin
Muchas variables tienen una distribucin normal aproximada, como las calificaciones del cociente intelectual, las expectativas de vida y la estatura en la edad adulta. Esto implica que casi todas las observaciones ocurrirn dentro de 3 desviaciones estndares respecto de la media. Por otra parte, son poco frecuentes las observaciones que ocurren ms all de 3 desviaciones estndares respecto de la media. Por ejemplo, la estatura media de un adulto de sexo masculino es de 68.2 pulgadas (casi 5 pies con 8 pulgadas), con una desviacin estndar de 2.74. Esto significa que casi todos los hombres miden entre 60.0 pulgadas (5 pies) y 76.4 pulgadas (6 pies, 4 pulgadas) de estatura. Shaquille ONeal, jugador de basquetbol de Miami Heat, mide 86 pulgadas, o 7 pies con 2 pulgadas, lo cual rebasa las 3 desviaciones estndares respecto de la media. La altura convencional de una puerta es de 6 pies con 8 pulgadas, y debe ser lo bastante alta para la mayora de los hombres adultos, con excepcin de una persona poco comn, como Shaquille ONeal. Otro ejemplo consiste en el hecho de que el asiento del conductor de la mayora de los vehculos se encuentra colocado de manera que una persona que mida por lo menos 159 cm (62.5 pulgadas de estatura) se siente con comodidad. La distribucin de estaturas de mujeres adultas es ms o menos una distribucin normal con una media de 161.5 y una desviacin estndar de 6.3 cm. Por consiguiente, alrededor de 35% de las mujeres adultas no se sienta cmodamente en el asiento del conductor.

.10 .09 .08 .07 .06 .05 .04 .03 .02 .01
43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 Clientes

Como la distribucin normal sirve para determinar la probabilidad binomial de 60 o ms xitos, debe restar, en este caso, 0.5 de 60. El valor de 0.5 recibe el nombre de factor de correccin de continuidad. Debe hacerse este pequeo ajuste porque una distribucin continua (la distribucin normal) se est utilizando para aproximar una distribucin discreta (la distribucin binomial). Al restar se obtiene 60 0.5 = 59.5. FACTOR DE CORRECCIN DE CONTINUIDAD Valor de 0.5 restado o sumado, segn se requiera, a un valor seleccionado cuando una distribucin de probabilidad discreta se aproxima por medio de una distribucin de probabilidad continua.

Cmo aplicar el factor de correccin


Dicho factor se aplica en los siguientes cuatro casos: 1.  Para la probabilidad de que por lo menos ocurra X, se utiliza el rea por encima de (X .5). 2.  Para la probabilidad de que ocurra ms que X, se utiliza el rea por encima de (X + .5). 3.  Para la probabilidad de que ocurra X o menos, se utiliza el rea debajo de (X + .5). 4.  Para la probabilidad de que ocurra menos que X, se utiliza el rea debajo de (X .5). Para utilizar la distribucin normal con el n de aproximar la probabilidad de que regresen 60 o ms clientes de los 80 que van a Santoni por primera vez, se sigue el siguiente procedimiento. Paso 1. Se determina el valor z correspondiente a una X de 59.5 con la frmula  7.5, y las frmulas 6.4 y 6.5, para la media y la varianza de una distribucin binomial: = n = 80(.70) = 56 2 = n (1 ) = 80(.70)(1 .70) = 16.8 = 16.8 = 4.10 X 59.5 56 z= = = 0.85 4.10 Paso 2. Determine al rea bajo la curva normal entre una de 56 y una X de 59.5.  Segn el paso 1, el valor z correspondiente a 59.5 es de 0.85. Enseguida consulte el apndice B.1, vaya hacia abajo del margen izquierdo hasta 0.8 y luego, en lnea horizontal, hasta la columna con el encabezado 0.05. El rea es de 0.3023.

Probabilidad

Distribuciones de probabilidad continua

245

Paso 3. Calcule el rea ms all de 59.5, para restar 0.3023 de 0.5000 (0.5000  0.3023 = 0.1977). Por consiguiente, 0.1977 es la probabilidad de que regresen para consumir alimentos 60 o ms clientes de los 80 que acuden por primera vez a Santoni. En notacin probabilstica: P(clientes > 59.5) = 0.5000 0.3023 = 0.1977. Las facetas de este problema se muestran en la siguiente grca:

.5000 La probabilidad de que 60 o ms de cada 80 clientes regresen a Santoni es de 0.1977 .3023 .1977 56 0 59.5 .85 Escala de X Escala de z

Sin duda, usted estar de acuerdo en que utilizar la aproximacin normal de la binomial constituye un mtodo ms ecaz para calcular la probabilidad de que regresen 60 o ms clientes que acuden por primera vez. El resultado es comparable con el que se obtuvo en la pgina 243, donde se utiliz la distribucin binomial. La probabilidad, al utilizar la distribucin binomial, es de 0.197, mientras que con la aproximacin normal es de 0.1977.

Autoevaluacin 7.7

Un estudio de la compaa Great Southern Home Insurance revel que ninguno de los bienes robados fue recuperado por los dueos en 80% de los robos que se reportaron. a)  Durante un periodo en el que ocurrieron 200 robos, cul es la probabilidad de que los bienes robados no se recuperen en 170 o ms casos? b)  Durante un periodo en el que ocurrieron 200 robos, cul es la probabilidad de que no se recuperen los bienes robados en 150 o ms casos?

Ejercicios
31.  Suponga una distribucin de probabilidad binomial con n = 50 y = 0.25. Calcule lo siguiente: a) La media y la desviacin estndar de la variable aleatoria. b) La probabilidad de que X sea 15 o mayor. c) La probabilidad de que X sea 10 o menor. 32.  Suponga una distribucin de probabilidad binomial con n = 40 y = 0.55. Calcule lo siguiente: a) La media y la desviacin estndar de la variable aleatoria. b) La probabilidad de que X sea 25 o mayor. c) La probabilidad de que X sea 15 o menor. d) La probabilidad de que X se encuentre entre 15 y 25 inclusive. 33.  Dotties Tax Service se especializa en declaraciones del impuesto sobre la renta de clientes profesionistas, como mdicos, dentistas, contadores y abogados. Una auditora reciente de las declaraciones que elaboraba la empresa, que llev a cabo el Internal Revenue Service, IRS, indic que 5% de las declaraciones que haba elaborado durante el ao pasado contena errores. Si esta tasa de error contina este ao y Dotties elabora 60 declaraciones, cul es la probabilidad de que cometa errores en: a) ms de seis declaraciones? b) por lo menos seis declaraciones? c) seis declaraciones exactamente?

246

Captulo 7

34.  Shortys Mufer anuncia que puede instalar un silenciador nuevo en 30 minutos o menos. No obstante, hace poco el departamento de estndares laborales de las ocinas centrales realiz un estudio y descubri que 20% de los silenciadores no se instalaba en 30 minutos o menos. La sucursal Maumee instal 50 silenciadores el mes pasado. Si el informe de la empresa es correcto: a)  Cuntas instalaciones de la sucursal Maufee se esperara que tardaran ms de 30 minutos? b) Cul es la probabilidad de que ocho o menos instalaciones tarden ms de 30 minutos? c)  Cul es la probabilidad de que exactamente 8 de las 50 instalaciones tarden ms de 30 minutos? 35.  Un estudio realizado por Taurus Health Club, famoso en Estados Unidos, revel que 30% de sus nuevos miembros tiene un signicativo exceso de peso. Una campaa de promocin de membresas en un rea metropolitana dio como resultado la captacin de 500 nuevos miembros. a)  Se sugiri utilizar la aproximacin normal de la distribucin binomial para determinar la probabilidad de que 175 o ms de los nuevos miembros se encuentren muy excedidos de peso. Es este problema de naturaleza binomial? Explique. b)  Cul es la probabilidad de que 175 o ms de los nuevos miembros se encuentren muy pasados de peso? c)  Cul es la probabilidad de que 140 o ms de los nuevos miembros se encuentren muy pasados de peso? 36.  Un nmero reciente de Bride Magazine sugiri que las parejas que planean su boda deben esperar que dos terceras partes de las personas a las que envan invitacin conrmen su asistencia. Rich y Stacy tienen planes de casarse este ao y piensan enviar 197 invitaciones. a) Cuntos invitados esperara que aceptaran la invitacin? b) Cul es la desviacin estndar? c) Cul es la probabilidad de que 140 o ms acepten la invitacin? d) Cul es la probabilidad de que exactamente 140 acepten la invitacin?

Resumen del captulo


I.  La distribucin uniforme es una distribucin de probabilidad continua con las siguientes caractersticas: A. Tiene forma rectangular. B. La media y la mediana son iguales. C. Queda completamente descrita por su valor mnimo a y su valor mximo b. D. Tambin queda descrita por la siguiente ecuacin para la regin de a a b. P (x ) = 1 b a [7.3]

E.  La media y la desviacin estndar de una distribucin uniforme se calculan de la siguiente manera: = = (a + b) 2 (b a)2 12 [7.1] [7.2]

II.  La distribucin de probabilidad normal es una distribucin continua con las siguientes caractersticas: A. Tiene forma de campana y posee una sola cima en el centro de la distribucin. B. La distribucin es simtrica. C. Es asinttica, lo cual signica que la curva se aproxima al eje X sin tocarlo jams. D. Se encuentra completamente descrita por su media y su desviacin estndar. E. Existe una familia de distribuciones de probabilidad normal. 1.  Se genera otra distribucin de probabilidad normal cuando cambia la media o la desviacin estndar. 2. La distribucin de probabilidad normal queda descrita por medio de la frmula:
( x 2) 1 22 P (x ) = 1 e 2 P (x ) = 2 e 2
2

( x )2

[7.4]

Distribuciones de probabilidad continua

247

III. La distribucin de probabilidad normal estndar es una distribucin normal particular. A. Posee una media de 0 y una desviacin estndar de 1. B.  Toda distribucin de probabilidad normal puede convertirse en una distribucin de probabilidad normal estndar mediante la frmula: z= X [7.5]

C.  Al estandarizar una distribucin de probabilidad normal, se indica la distancia de un valor de la media en unidades de desviacin estndar. IV.  La distribucin de probabilidad normal puede aproximar una distribucin binomial en ciertas condiciones. A. n y n(1 ) deben ser ambos por lo menos 5. 1. n es el nmero de observaciones. 2. es la probabilidad de un xito. B. Las cuatro condiciones de una distribucin de probabilidad binomial son: 1. Slo hay dos posibles resultados. 2. permanece igual de una prueba a otra. 3. Las pruebas son independientes. 4.  La distribucin es el resultado de la enumeracin del nmero de xitos en una cantidad ja de pruebas. C.  La media y la varianza de una distribucin binomial se calculan de la siguiente manera: = n 2 = n (1 ) D.  El factor de correccin de continuidad de 0.5 se emplea para extender el valor continuo de X media unidad en cualquier direccin. Esta correccin compensa la aproximacin a una distribucin discreta por medio de una distribucin continua.

Ejercicios del captulo


37.  La cantidad de bebida de cola en una lata de 12 onzas tiene una distribucin uniforme entre 11.96 onzas y 12.05 onzas. a) Cul es la cantidad media de bebida por lata? b) Cul es la desviacin estndar de la cantidad de bebida por lata? c)  Cul es la probabilidad de elegir una lata de bebida de cola que contenga menos de 12 onzas? d)  Cul es la probabilidad de elegir una lata de bebida de cola que contenga ms de 11.98 onzas? e)  Cul es la probabilidad de elegir una lata de bebida de cola que contenga ms de 11 onzas? 38.  Un tubo de pasta dental Listerine Control Tartar contiene 4.2 onzas. Conforme la gente utiliza la pasta, la cantidad que queda en cualquier tubo es aleatoria. Suponga que la cantidad de pasta restante en el tubo tiene una distribucin uniforme. De acuerdo con estos datos, es posible determinar la siguiente informacin relativa a la cantidad restante de un tubo de pasta dental sin invadir la privacidad de nadie. a) Cunta pasta esperara que quedara en el tubo? b) Cul es la desviacin estndar de la pasta que queda en el tubo? c) Cul es la posibilidad de que en el tubo queden menos de 3.0 onzas? d) Cul es la posibilidad de que en el tubo queden ms de 1.5 onzas? 39.  Muchas tiendas de menudeo ofrecen sus propias tarjetas de crdito. En el momento de hacer la solicitud de crdito, el cliente recibe un descuento de 10% sobre la compra. El tiempo que se requiere para el proceso de la solicitud de crdito se rige por una distribucin uniforme con tiempos que varan de 4 a 10 minutos. a) Cul es el tiempo medio para el proceso de la solicitud? b) Cul es la desviacin estndar del tiempo de proceso? c) Cul es la probabilidad de que una solicitud tarde menos de 6 minutos? d) Cul es la probabilidad de que una solicitud tarde ms de 5 minutos? 40.  El tiempo que los huspedes del hotel Grande Dunes en Bahamas esperan el ascensor tiene una distribucin uniforme de entre 0 y 3.5 minutos. a) Demuestre que el rea bajo la curva es de 1.00. b) Cunto tiempo espera el cliente habitual el servicio de elevador?

248

Captulo 7

c) Cul es la desviacin estndar del tiempo de espera? d) Qu porcentaje de huspedes espera menos de un minuto? e) Qu porcentaje de huspedes espera ms de dos minutos? 41.  Las ventas netas y el nmero de empleados de fabricantes de aluminio con caractersticas similares estn organizados en una distribucin de frecuencias. Ambos tienen distribuciones normales. La media de las ventas netas es de $180 millones, y la desviacin estndar, de $25 millones. En el caso del nmero de empleados, la media es de 1 500, y la desviacin estndar, de 120. Clarion Fabricators tuvo ventas de $170 millones y 1 850 empleados. a) Convierta las ventas y el nmero de empleados de Clarion en valores z. b) Localice los dos valores z. c)  Compare las ventas de Clarion y el nmero de empleados que tiene con los de otros fabricantes. 42.  El departamento de contabilidad de Weston Materials, Inc., fabricante de cocheras desmontables, indica que dos trabajadores de la construccin tardan una media de 32 horas, con una desviacin estndar de dos horas, en armar el modelo Red Barn. Suponga que los tiempos de montaje tienen una distribucin normal. a)  Determine los valores z para 29 y 34 horas. Qu porcentaje de cocheras requiere entre 32 y 34 horas de armado? b) Qu porcentaje de cocheras requiere entre 29 y 34 horas de armado? c) Qu porcentaje de cocheras requiere 28.7 horas o menos de armado? d) Cuntas horas se requieren para armar 5% de las cocheras? 43.  Un informe reciente publicado en USA Today indicaba que una familia comn de cuatro miembros gasta $490 al mes en alimentos. Suponga que la distribucin de gastos de alimento para una familia de cuatro miembros sigue una distribucin normal, con una media de $490 y una desviacin estndar de $90. a) Qu porcentaje de familias gasta ms de $30 y menos de $490 en alimentos al mes? b) Qu porcentaje de familias gasta menos de $430 al mes en alimentos? c) Qu porcentaje de familias gasta entre $430 y $600 mensuales en alimentos? d) Qu porcentaje de familias gasta entre $500 y $600 mensuales en alimentos? 44.  Un estudio de llamadas telefnicas de larga distancia realizado en las ocinas centrales de Pepsi Botting Group, Inc., en Somers, Nueva York, demostr que las llamadas, en minutos, se rigen por una distribucin de probabilidad normal. El lapso medio de tiempo por llamada fue de 4.2 minutos, con una desviacin estndar de 0.60 minutos. a) Qu porcentaje de llamadas dur entre 4.2 y 5 minutos? b) Qu porcentaje de llamadas dur ms de 5 minutos? c) Qu porcentaje de llamadas dur entre 5 y 6 minutos? d) Qu porcentaje de llamadas dur entre 4 y 6 minutos? e)  Como parte de su informe al presidente, el director de comunicaciones desea informar la duracin de 4% de las llamadas ms largas. Cul es este tiempo? 45.  Shaver Manufacturing, Inc., ofrece a sus empleados seguros de atencin dental. Un estudio reciente realizado por el director de recursos humanos demuestra que el costo anual por empleado tuvo una distribucin de probabilidad normal, con una media de $1 280 y una desviacin estndar de $420 anuales. a) Qu porcentaje de empleados gener ms de $1 500 anuales de gastos dentales? b)  Qu porcentaje de empleados gener entre $1 500 y $2 000 anuales de gastos dentales? c) Calcule el porcentaje que no gener gastos por atencin dental. d)  Cul fue el costo del 10% de los empleados que gener gastos ms altos por atencin dental? 46.  Las comisiones anuales que percibieron los representantes de ventas de Machine Products, Inc., fabricante de maquinaria ligera, tienen una distribucin de probabilidad normal. El monto anual medio percibido es de $40 000, y la desviacin estndar, de $5 000. a) Qu porcentaje de representantes de ventas percibe ms de $42 000 anuales? b) Qu porcentaje de representantes de ventas percibe entre $32 000 y $42 000 anuales? c) Qu porcentaje de representantes de ventas percibe entre $32 000 y $35 000 anuales? d)  El gerente de ventas desea graticar a los representantes de ventas que perciben las comisiones ms altas con un bono de $1 000. Puede conceder un bono a 20% de los representantes. Cul es el lmite entre los que obtienen un bono y quienes no lo obtienen? 47.  De acuerdo con el South Dakota Department of Health, la media de la cantidad de horas que se ve televisin a la semana es ms alta entre mujeres adultas que entre hombres. Un estudio reciente mostr que las mujeres ven la televisin un promedio de 34 horas a la semana, y los hombres, 29 horas a la semana (www.state.sd.us/DOH/Nutriton/TV.pdf). Suponga que la distribucin de horas que se ve televisin tiene la distribucin normal en ambos grupos, y que la desviacin estndar entre las mujeres es de 4.5 horas, mientras que en los hombres es de 5.1 horas.

Distribuciones de probabilidad continua

249

a) Qu porcentaje de mujeres ve televisin menos de 40 horas a la semana? b) Qu porcentaje de hombres ve televisin ms de 25 horas a la semana? c)  Cuntas horas de televisin ve uno por ciento de las mujeres que ve ms televisin por semana? Encuentre el valor comparable para hombres. 48.  De acuerdo con un estudio del gobierno, entre los adultos de 25 a 34 aos de edad, la suma media que gastan cada ao en lectura y entretenimiento es de $1 994 (www.infoplease.com/ ipa/A0908759.html). Suponga que la distribucin de las sumas que se gastan tiene una distribucin normal, con una desviacin estndar de $450. a) Qu porcentaje de adultos gast ms de $2 500 anuales en lectura y entretenimiento? b) Qu porcentaje gast entre $2 500 y $3 000 anuales en lectura y entretenimiento? c) Qu porcentaje gast menos de $1 000 anuales en lectura y entretenimiento? 49.  La administracin de Gordon Electronics piensa instituir un sistema de bonos para incrementar la produccin. Una sugerencia consiste en pagar un bono sobre el 5% ms alto de la produccin tomado de la experiencia previa. Los registros del pasado indican que la produccin semanal tiene una distribucin normal. La media de esta distribucin es de 4 000 unidades a la semana, y la desviacin estndar es de 60 unidades semanales. Si el bono se paga sobre el 5% ms alto de produccin, a partir de cuntas unidades se pagar el bono? 50.  Fast Service Truck Lines utiliza exclusivamente el Ford Super Duty F-750. La administracin realiz un estudio acerca de los costos de mantenimiento y determin que el nmero de millas que se recorrieron durante el ao tena una distribucin normal. La media de la distribucin fue de 60 000 millas, y la desviacin estndar, de 2 000 millas. a) Qu porcentaje de los Ford Super Duty-750 registr en su bitcora 65 200 millas o ms? b)  Qu porcentaje de los Ford Super Duty-750 registr en su bitcora ms de 57 060 millas y menos de 58 280? c)  Qu porcentaje de los Ford Super Duty-750 recorri 62 000 millas o menos durante el ao? d)  Es razonable concluir que ninguno de los camiones recorri ms de 70 000 millas? Explique. 51.  Best Electronics, Inc., promueve una poltica de devoluciones sin complicaciones. La cantidad de artculos devueltos al da tiene una distribucin normal. La cantidad media de devoluciones de los clientes es de 10.3 diario, y la desviacin estndar, de 2.25 diario. a) Qu porcentaje de das hay 8 o menos clientes que devuelven artculos? b) Qu porcentaje de das hay entre 12 y 14 clientes que devuelven artculos? c) Existe alguna probabilidad de que haya un da sin devoluciones? 52.  Un informe reciente de BusinessWeek sealaba que 20% de los empleados le roba a la empresa cada ao. Si una compaa tiene 50 empleados, cul es la probabilidad de que: a) menos de 5 empleados roben? b) ms de 5 empleados roben? c) exactamente 5 empleados roben? d) ms de 5 empleados y menos de 15 roben? 53.  Como parte de su suplemento dominical dedicado a la salud, el diario Orange County Register inform que 64% de los varones estadounidenses mayores de 18 aos considera la nutricin una prioridad en su vida. Suponga que se elige una muestra de 60 hombres. Cul es la probabilidad de que: a) 32 o ms hombres consideren importante la nutricin? b) 44 o ms hombres consideren importante la nutricin? c) ms de 32 y menos de 43 consideren importante la nutricin? d) exactamente 44 hombres consideren importante la nutricin? 54.  Se calcula que 10% de los alumnos que presentan la parte correspondiente a mtodos cuantitativos del examen Certied Public Account (CPA) la reprobar. Este sbado presentarn el examen 60 estudiantes. a) Cuntos esperara que reprueben? Cul es la desviacin estndar? b) Cul es la probabilidad de que reprueben exactamente 2 estudiantes? c) Cul es la probabilidad de que reprueben por lo menos 2 estudiantes? 55.  La Trafc Division de Georgetown, Carolina del Sur, inform que 40% de las persecuciones de automviles da como resultado algn accidente grave o leve. Durante el mes en que ocurren 50 persecuciones de alta velocidad, cul es la probabilidad de que 25 o ms terminen en un accidente grave o leve? 56.  Los cruceros de la lnea Royal Viking informan que 80% de sus habitaciones se encuentra ocupado durante septiembre. En el caso de un crucero con 800 habitaciones, cul es la probabilidad de que 665 o ms habitaciones se encuentren ocupadas en septiembre? 57.  El objetivo de los aeropuertos de Estados Unidos que tienen vuelos internacionales consiste en autorizar estos vuelos en un lapso de 45 minutos. Es decir, 95% de los vuelos se autoriza en un periodo de 45 minutos, y la autorizacin del 5% restante tarda ms. Suponga, asimismo, que la distribucin es aproximadamente normal.

250

Captulo 7

a)  Si la desviacin estndar del tiempo que se requiere para autorizar un vuelo internacional es de 5 minutos, cul es el tiempo medio para autorizar un vuelo? b)  Suponga que la desviacin estndar es de 10 minutos, no los 5 del inciso a). Cul es la nueva media? c)  Un cliente tiene 30 minutos para abordar su limusina a partir del momento que aterriza su avin. Con una desviacin estndar de 10 minutos, cul es la probabilidad de que cuente con tiempo suciente para subir a la limusina? 58.  Los fondos que despacha el cajero automtico localizado cerca de las cajas en un centro comercial de Kroger, en Union, Kentucky, tienen una distribucin de probabilidad normal con una media de $4 200 al da y una desviacin estndar de $720 al da. La mquina se encuentra programada para noticar al banco ms prximo si la cantidad que despacha el cajero es muy baja (menor que $2 500) o muy alta (ms de $6 000). a) Qu porcentaje de das se noticar al banco si la cantidad despachada es muy baja? b) Qu porcentaje de das se noticar al banco si la cantidad despachada es muy alta? c) Qu porcentaje de das no se noticar al banco la cantidad despachada? 59.  Los pesos de jamn enlatado por la compaa Henline Ham tienen una distribucin normal, con una media de 9.20 libras y una desviacin estndar de 0.25 libras. En la etiqueta aparece un peso de 9.00 libras. a) Qu proporcin de latas pesa menos de la cantidad que seala la etiqueta? b)  El propietario, Glen Henline, considera dos propuestas para reducir la proporcin de latas debajo del peso de la etiqueta. Puede incrementar el peso medio a 9.25 y dejar igual la desviacin estndar, o puede dejar el peso medio en 9.20 y reducir la desviacin estndar de 0.25 libras a 0.15 libras. Qu cambio le recomienda? 60.  El Cincinnati Enquirer, en su suplemento sabatino de negocios, inform que la cantidad media de horas trabajadas por semana por empleados de tiempo completo es de 43.9. El artculo indic, adems, que alrededor de una tercera parte de los empleados de tiempo completo trabaja menos de 40 horas a la semana. a)  De acuerdo con esta informacin, y en el supuesto de que la cantidad de horas de trabajo tiene una distribucin normal, cul es la desviacin estndar de la cantidad de horas trabajadas? b)  El artculo indic incluso que 20% de los empleados de tiempo completo trabaja ms de 49 horas a la semana. Determine la desviacin estndar con esta informacin. Son similares las dos aproximaciones de la desviacin estndar? Qu concluira usted? 61.  La mayora de las rentas de automviles por cuatro aos abarcan hasta 60 000 millas. Si el arrendador rebasa esa cantidad, se aplica una sancin de 20 centavos la milla de renta. Suponga que la distribucin de millas recorridas en rentas por cuatro aos tiene una distribucin normal. La media es de 52 000 millas, y la desviacin estndar, de 5 000 millas. a)  Qu porcentaje de rentas generar una sancin como consecuencia del exceso en millas? b)  Si la compaa automotriz quisiera modicar los trminos de arrendamiento de manera que 25 rentas rebasaran el lmite de millas, en qu punto debe establecerse el nuevo lmite superior? c)  Por denicin, un automvil de bajo millaje es uno con 4 aos de uso y que ha recorrido menos de 45 000 millas. Qu porcentaje de automviles devueltos se considera de bajo millaje? 62.  El precio de las acciones del Banco de Florida al nal de cada jornada de comercializacin del ao pasado se rigi por una distribucin normal. Suponga que durante el ao hubo 240 jornadas de comercializacin. El precio medio fue de $42.00 por accin, y la desviacin estndar, de $2.25 por accin. a)  Qu porcentaje de jornadas el precio estuvo arriba de $45.00? Cuntas jornadas calculara usted? b) Qu porcentaje de jornadas el precio oscil entre $38.00 y $40.00? c) Cul fue el precio de las acciones 15% de las jornadas que se mantuvo ms alto? 63.  Las ventas anuales de novelas romnticas tienen una distribucin normal. Ahora bien, no se conoce la media ni la desviacin estndar. Cuarenta por ciento del tiempo, las ventas son superiores a 470 000, y 10%, superiores a $500 000. Cules son la media y la desviacin estndar? 64.  Al establecer garantas en aparatos HDTV, el fabricante pretende establecer los lmites de manera que pocos aparatos requieran reparacin con cargo al fabricante. Por otra parte, el periodo de garanta debe ser lo bastante prolongado para que la compra resulte atractiva al comprador. La media del nmero de meses que abarca la garanta de un HDTV es de 36.84, con una desviacin estndar de 3.34 meses. En qu punto deben establecerse los lmites de garanta de manera que slo 10% de los aparatos HDTV requiera reparacin con cargo al fabricante? 65.  DeKorte Tele-Merketing, Inc., piensa comprar una mquina que selecciona de manera aleatoria y marca automticamente nmeros telefnicos. DeKorte Tele-Marketing realiza la mayora

Distribuciones de probabilidad continua

251

e sus llamadas de noche; por consiguiente, se pierden las llamadas a telfonos de empresas. El d fabricante de la mquina arma que la programacin reduce las llamadas a nmeros de empresas a 15% del total. Para demostrar esta armacin, el director de compras de DeKorte program la mquina para que seleccionara una muestra de 150 nmeros telefnicos. Cul es la probabilidad de que ms de 30% de los nmeros telefnicos seleccionados pertenezca a empresas, en el supuesto de que sea correcta la armacin del fabricante?

Ejercicio de la base de datos


66.  Consulte los datos de Real Estate, que incluyen informacin sobre las casas vendidas en la zona de Denver, Colorado, el ao pasado. a)  El precio de venta medio (en miles de dlares) de las casas se calcul en $221.10, con una desviacin estndar de $47.11. Utilice la distribucin normal para calcular el porcentaje de casas que se vende en ms de $280.0. Compare esto con los resultados reales. La distribucin normal genera una buena aproximacin de los resultados reales? b)  La distancia media desde el centro de la ciudad es de 14.629 millas, con una desviacin estndar de 4.874 millas. Utilice la distribucin normal para calcular la cantidad de casas ubicadas a 18 o ms millas y a menos de 22 millas del centro de la ciudad. Compare con los resultados reales. La distribucin normal ofrece una buena aproximacin de los resultados reales? 67.  Consulte los datos de Baseball 2005, que incluyen informacin sobre los 30 equipos de la Liga Mayor de Bisbol de la temporada 2005. a)  La asistencia media por equipo en la temporada fue de 2 496 458, con una desviacin estndar de 672 879. Utilice la distribucin normal para calcular el nmero de equipos con asistencias superiores a 3.5 millones. Compare este resultado con el nmero real. Comente sobre la exactitud del clculo. b)  El salario medio por equipo fue de 73.06 millones, con una desviacin estndar de 34.23 millones. Utilice la distribucin normal para calcular el nmero de equipos con un salario por equipo superior a los $50 millones. Compare este resultado con la cantidad real. Comente sobre la exactitud de su aproximacin. 68.  Consulte los datos de la CIA, que incluyen informacin demogrca y econmica de 46 pases. a)  La media de la variable del PIB per cpita es de 16.58, con una desviacin estndar de 9.27. Utilice la distribucin normal para calcular el porcentaje de pases con exportaciones superiores a 24. Compare este clculo aproximado con la proporcin real. Parece que la distribucin normal es precisa en este caso? Explique. b)  La media de las exportaciones es de 116.3, con una desviacin estndar de 157.4. Utilice la distribucin normal para aproximar el porcentaje de pases con exportaciones superiores a 170. Compare el clculo con la proporcin real. La distribucin normal resulta precisa en este caso? Explique.

Comandos de software
1.  Los comandos de Excel que se requieren para generar la pantalla de la pgina 235 son los siguientes: a)  Seleccione Insert y Function; enseguida, del recuadro de categoras seleccione Statistical, y debajo, NORMDIST, y haga clic en OK. b)  En el cuadro de dilogo escriba 1100 en el cuadro correspondiente a X; 1000 para la Mean; 100 para la Standard_dev; verdadero en el cuadro Cumulative y haga clic en OK. c)  El resultado aparecer en el cuadro de dilogo. Si hace clic en OK, la respuesta aparecer en su hoja de clculo. 2.  Los comandos de Excel que se requieren para generar la pantalla de la pgina 241 son los siguientes: a)  Seleccione Insert y Function; enseguida, del cuadro de categoras seleccione Statistical, y debajo, NORMINV; haga clic en OK. b)  En el cuadro de dilogo, escriba 0.04 en Probability; 67900 en Mean, y 2050 en Standard_dev. c)  Los resultados aparecern en el cuadro de dilogo. Observe que la respuesta es diferente a la de la pgina 240 como consecuencia del error de redondeo. Si hace clic en OK, la respuesta tambin aparece en su hoja de clculo. d)  Intente introducir una Probability de 0.04, una Mean de 0 y una Standard_dev de 1. Se calcular el valor z.

252

Captulo 7

Captulo 7 Respuestas a las autoevaluaciones


7.1 a)

P(x) .167

c)

.5000

8
b) P (x ) = (altura)(base) 1 = (14 8) 14 8 1 = (6) = 1.00 6 c) = = a + b 14 + 8 22 = = = 11 2 2 2

14
0 400 7.5

.4495

.0505 1.64 Escala de z 482 Escala de calicaciones

a) 0.9816, que se calcula as: 0.4938 + 0.4878.

(b a)2 (14 8)2 36 = 3 = = 12 12 12 1 = (14 10) 14 8

d) P (10 < x < 14) = (altura)(base)

750 2.50

1 000 0

1 225 2.25

Escala en dlares Escala de z

1 (4) 6 = .667 e) P (x < 9) = (altura)(base) = 1 = (9 8) 14 8 = 0.167

b) 0.1465, que se calcula as: 0.4878 0.3413.

7.2

a) 2.25, que se calcula:

$1 225 $1000 $225 z= = = 2.25 $100 $100 b) 2.25, que se calcula: 7.3 a)  $46 400 y $48 000, que se obtienen mediante el clculo de $47 200 1($800). b)  $45 600 y $48 800, que se obtienen mediante el clculo de $47 200 2($800). c)  $44 800 y $49 600, que se obtienen mediante el clculo de $47 200 3($800). d)  $47 200. La media, la mediana y la moda son iguales para una distribucin normal. e) S; una distribucin normal es simtrica. 7.4 a) Clculo de z: 482 400 z= = +1.64 50 De acuerdo con el apndice B.1, el rea es de 0.4495. P(400 < calicacin < 482) = 0.4495 b) 0.0505, que se calcul as: 0.5000 0.4495 P(calicacin > 482) = 0.5000 0.4495 = 0.0505 z= $775 $1000 $225 = = 2.25 $100 $100

1 000 1 100 0 1.00

1 225 2.25

Escala en dlares Escala de z

7.6  85.24 (sin duda, el profesor lo convertir en 85). El rea ms prxima a 0.4000 es de 0.3997; z equivale a 1.28. Por consiguiente: X 75 8 10.24 = X 75 X = 85.24 a)  0.0465, que se calcula mediante = n = 200(.80) = 160, y 2 = n(1 ) = 200(.80)(1 .80) = 32. Entonces, 1.28 =

7.7

= 32 = 5.66 169.5 160 z= = 1.68 5.66  De acuerdo con el apndice B.1, el rea es de 0.4535. Al restar de 0.500, se obtiene 0.0465. b)  0.9686, que se calcula mediante 0.4686 + 0.5000. Primero se calcula z: 149.5 160 = 1.86 5.66 De acuerdo con el apndice B.1, el rea es de 0.4686. z=

Repaso de los captulos 5 a 7

253

Repaso de los captulos 5 a 7


Esta seccin constituye un repaso de los conceptos, trminos, smbolos y ecuaciones ms importantes de los captulos 5, 6 y 7. En estos tres captulos se estudian los mtodos para hacer frente a la incertidumbre. Como ejemplo de incertidumbre en los negocios, considere el papel que desempea el departamento de control de calidad en la mayora de las empresas de produccin masiva. Por lo general, el departamento no tiene personal ni tiempo para vericar, por ejemplo, los 200 mdulos con conexin producidos durante un periodo de dos horas. Tal vez el procedimiento de operacin convencional exija la seleccin de una muestra de 5 mdulos y el envo de los 200 mdulos en caso de que los 5 funcionen adecuadamente. Sin embargo, si uno o ms elementos que integran la muestra se encuentran defectuosos, se verican los 200. Si los 5 mdulos funcionan, el personal de control de calidad no puede estar seguro de que lo que hacen (permitir el envo de los mdulos) sea lo correcto. El estudio de la probabilidad permite medir la incertidumbre del envo de mdulos defectuosos. Asimismo, la probabilidad como medida de incertidumbre entra en juego cuando Gallup, Harris y otras empresas dedicadas a realizar encuestas de opinin predicen que Jim Barstow ganar la curul senatorial vacante en el estado de Georgia. El captulo 5 hace referencia al hecho de que una probabilidad es un valor entre 0 y 1, inclusive, que expresa la creencia de que un evento ocurrir. Un meteorlogo puede establecer que la probabilidad de que llueva maana es de 0.20. El director de proyectos de una empresa que participa en una licitacin para construir una estacin del metro en Bangkok puede evaluar la probabilidad de que la empresa obtenga el contrato en 0.50. Las reglas de la adicin y la multiplicacin, algunos principios de enumeracin y la importancia del teorema de Bayes permiten analizar las formas posibles de combinar las probabilidades. En el captulo 6 se exponen las distribuciones de probabilidad discreta: la distribucin binomial, la distribucin hipergeomtrica y la distribucin de Poisson. En subsecuentes captulos estudiar otro tipo de distribuciones de probabilidad (la distribucin t, la distribucin ji cuadrada, etc.). Las distribuciones de probabilidad constituyen listas de los posibles resultados de un experimento y de la probabilidad asociada con cada resultado. Una distribucin de probabilidad permite evaluar resultados de muestras. El captulo 7 describe las distribuciones de probabilidad continua: la distribucin de probabilidad uniforme y la distribucin de probabilidad normal. La distribucin uniforme tiene una conguracin rectangular y se describe por sus valores mnimo y mximo. La media y mediana son iguales y no tienen moda. Una distribucin de probabilidad normal se utiliza en la descripcin de fenmenos que se rigen por una distribucin normal con forma de campana, como la fuerza de tensin en cables, y los pesos de volmenes de latas y botellas. En realidad, existe una familia de distribuciones normales, cada una con sus propias media y desviacin estndar. Por ejemplo, existe una distribucin normal para una media de $100 y una desviacin estndar de $5; otra para una media de $149 y una desviacin estndar de $5.26, etc. Una distribucin de probabilidad normal es simtrica respecto de su media, y las colas de la curva normal se extienden indenidamente en cualquier direccin. Como existe una cantidad ilimitada de distribuciones normales, resulta difcil asignar probabilidades. En su lugar, cualquier distribucin normal puede convertirse en una distribucin de probabilidad normal estndar al calcular los valores z. La distribucin de probabilidad normal estndar tiene una media de 0 y una desviacin estndar de 1. Resulta de utilidad porque la probabilidad de cualquier evento a partir de una distribucin de probabilidad normal puede calcularse mediante tablas de probabilidad normal estndar.

Glosario
Captulo 5
Evento Conjunto de uno o ms resultados de un experimen to. Por ejemplo, un evento consiste en el conjunto de nmeros pares en el lanzamiento de un dado no cargado. Experimento Actividad que se observa o se mide. Por ejemplo, un experimento puede consistir en contar el nmero de respuestas correctas a una pregunta. Frmula de las permutaciones Frmula para contar el nme ro de posibles resultados. Si a, b, c es un arreglo, b, a, c otro, c, a, b otro, y as sucesivamente, el nmero total de arreglos se determina mediante la frmula
n Pr

otra cosa, hay m n formas de hacer ambas. Por ejemplo: una tienda de artculos deportivos ofrece dos chaquetas deportivas y tres pantalones deportivos combinados en $400. Cuntos diferentes trajes completos se pueden ofrecer? La respuesta es m n = 2 3 = 6. Frmula para las combinaciones Frmula para enumerar los posibles resultados. Si el orden a, b, c se considera el mismo que b, a, c, o c, b, a, etc., el nmero de disposiciones se determina mediante n! n Cr = r !(n r )! Independiente La incidencia de un evento no inuye en la probabilidad de que ocurra otro evento. Probabilidad Valor entre 0 y 1, inclusive, que indica la posibilidad de que ocurra un evento. Probabilidad clsica Probabilidad basada en el supuesto de que cada uno de los resultados tiene la misma probabilidad.

n! (n r )!

Frmula de la multiplicacin Una de las frmulas para contar el nmero de posibles resultados de un experimento. Establece que si hay m formas de hacer algo y n formas de hacer

254

Captulo 7

De acuerdo con este concepto de probabilidad, si hay n resultados posibles, la probabilidad de un resultado es de 1/n. Por tanto, al lanzar una moneda al aire, la probabilidad de que salga una cara es de 1/n = 1/2. Probabilidad condicional Posibilidad de que un evento ocu rra dado que haya ocurrido ya otro evento. Probabilidad emprica Concepto probabilstico asentado en la experiencia previa. Por ejemplo, la compaa Metropolitan Life Insurance inform que, durante el ao, 100.2 de cada 100 000 personas del estado de Wyoming murieron por accidentes (accidentes automovilsticos, cadas, ahogados, por armas de fuego). A partir de esta experiencia, Metropolitan calcula la probabilidad de que ocurra una muerte accidental en el caso de un habitante de Wyoming: 100.2/100 000 = 0.001002. Probabilidad subjetiva La posibilidad de que suceda un evento con base en cualquier informacin disponible: presentimiento, opinin personal, opiniones de otros, rumores, etctera. Regla especial de la adicin Para que esta regla sea aplica ble, los eventos deben ser mutuamente excluyentes. Para dos eventos, la probabilidad de que ocurran A o B se determina mediante la frmula P (A o B ) = P (A) + P (B ) Por ejemplo: la probabilidad de que en el lanzamiento de un dado aparezca un punto o dos puntos. P (A o B ) = 1 1 2 1 + = = 6 6 6 3

Captulo 6
Distribucin de probabilidad binomial Distribucin de probabilidad con base en una variable aleatoria discreta. Sus principales caractersticas son: 1.  Cada resultado se clasica en una de dos categoras mutuamente excluyentes. 2.  La distribucin es el resultado de contar el nmero de xitos. 3.  Cada prueba es independiente: la respuesta a la prueba 1 (correcta o incorrecta) no inuye en la respuesta a la prueba 2. 4. La probabilidad de xito es igual de una prueba a otra. Distribucin de probabilidad hipergeomtrica Distribucin de probabilidad establecida en una variable aleatoria discreta. Sus principales caractersticas son: 1. Hay una cantidad ja de pruebas. 2.  La probabilidad de xito no es la misma de una prueba a otra. 3. Slo hay dos posibles resultados. Distribucin de Poisson Distribucin que se emplea con frecuencia para aproximar probabilidades binomiales cuando n es grande y pequeo. Qu se considera grande o pequeo, no se dene con precisin, pero una regla general consiste en que n debe ser igual o mayor que 20, y , igual o menor que 0.05. Distribucin de probabilidad Lista de posibles resultados de un experimento y la probabilidad asociada con cada resultado. Variable aleatoria Cantidad que se obtiene de un experimen to que puede dar como resultado valores diferentes. Por ejemplo, la enumeracin del nmero de accidentes (el experimento) en la carretera federal 75 en una semana puede ser de 10, 11, 12, o cualquier otro nmero. Variable aleatoria continua Variable aleatoria que adopta una innidad de valores dentro de un intervalo. Variable aleatoria discreta Variable aleatoria que adopta slo ciertos valores separados.

Regla especial de la multiplicacin Si dos eventos no se encuentran relacionados son independientes, se aplica esta regla para determinar la probabilidad de que sucedan al mismo tiempo. P (A y B ) = P (A)P (B ) Por ejemplo: la probabilidad de que caigan dos caras en dos lanzamientos de una moneda es: P (A y B ) = P (A)P (B ) = 1 1 1 = 2 2 4

Captulo 7
Distribucin de probabilidad normal Distribucin continua en forma de campana con una media que divide la distribucin en dos partes iguales. Adems, la curva normal se extiende indenidamente en cualquier direccin y jams toca el eje X. La distribucin queda denida por su media y desviacin estndar. Distribucin de probabilidad uniforme Distribucin de pro babilidad continua de forma rectangular. Se le describe completamente con los valores mnimo y mximo de la distribucin para calcular la media y la desviacin estndar. Asimismo, los valores mnimo y mximo se utilizan para calcular la probabilidad de cualquier evento. Factor de correccin de continuidad Se utiliza para mejorar la exactitud de la aproximacin de una distribucin discreta por medio de una distribucin continua. Valor z Distancia entre un valor seleccionado y la media poblacional medida en unidades de desviacin estndar.

Regla general de la adicin Se utiliza para determinar las probabilidades de eventos complejos compuestos por A o B. P (A o B ) = P (A) + P (B ) P (A y B ) Regla general de la multiplicacin Se utiliza para determinar probabilidades de eventos A y B, los cuales se presentan al mismo tiempo. Por ejemplo: se sabe que hay 3 radios defectuosos en una caja que contiene 10 radios. Cul es la probabilidad de seleccionar 2 radios defectuosos en las primeras dos selecciones de la caja? P (A y B ) = P (A)P (B |A) = 3 2 6 = = .067 10 9 90

En este caso, P(B|A) es la probabilidad condicional, y signica la probabilidad de que B ocurra dado que haya ocurrido A. Resultado Observacin o medicin de un experimento. Teorema de Bayes Formulado por el reverendo Bayes en el siglo VIII, est diseado para determinar la probabilidad de que ocurra un evento A, dado que haya ocurrido otro evento B.

Repaso de los captulos 5 a 7

255

Ejercicios
Parte 1. Opcin mltiple
1. De los siguientes enunciados, cul no es correcto en lo que se reere a una probabilidad? a) Debe tener un valor entre 0 y 1. b) Se puede indicar como decimal o fraccin. c) Un valor cercano a 0 signica que no es probable que suceda el evento. d) Es el conjunto de diversos experimentos. 2. El conjunto de uno o ms resultados a partir de un experimento recibe el nombre de a) Evento. b) Probabilidad. c) Variable aleatoria. d) Valor z. 3. Si la incidencia de un evento implica que otro no puede presentarse, los eventos son: a) Independientes. b) Mutuamente excluyentes. c) Bayesianos. d) Empricos. 4. Desde qu perspectiva probabilstica tienen los resultados la misma probabilidad de ocurrir? a) Clsica. b) Subjetiva. c) De frecuencia relativa. d) Independiente. 5. Para aplicar la regla especial de la adicin, los eventos siempre deben ser: a) Independientes. b) Mutuamente excluyentes. c) Bayesianos. d) Empricos. 6. Una probabilidad conjunta es: a) La probabilidad de que sucedan dos eventos. b) La probabilidad de que suceda un evento dado otro evento. c) La que se basa en dos eventos mutuamente excluyentes. d) Llamada tambin probabilidad a priori. 7. Para aplicar la regla especial de la multiplicacin, los eventos siempre deben ser: a) Independientes. b) Mutuamente excluyentes. c) Bayesianos. d) Empricos. 8.  Una tabla que se emplea para clasicar observaciones muestrales de acuerdo con dos criterios recibe el nombre de: a) Tabla de probabilidades. b) Tabla de contingencias. c) Tabla bayesiana. d) Diagrama de dispersin. 9.  Una lista de posibles resultados de un experimento y la probabilidad correspondiente recibe el nombre de: a) Variable aleatoria. b) Tabla de contingencias. c) Distribucin de probabilidad. d) Distribucin de frecuencias. 10. Cul de los siguientes ejemplos no constituye un ejemplo de distribucin de probabilidad discreta? a) El precio de compra de una casa. b) El nmero de recmaras de una casa. c) El nmero de baos de una casa. d) Si una casa tiene o no piscina. 11. Cul de los siguientes enunciados no constituye una condicin de la distribucin binomial? a) Slo 2 posibles resultados. b) Probabilidad constante de un xito. c) Debe tener por lo menos 3 pruebas. d) Pruebas independientes. 12. En una distribucin de probabilidad de Poisson: a) La media y la varianza de una distribucin son iguales. b) La probabilidad de xito siempre es mayor que 0.5

256

Captulo 7

c) El nmero de pruebas siempre es menor que 0.5. d) Siempre contiene una tabla de contingencias. 13.  Cul de los siguientes enunciados no es correcto en lo que se reere a la distribucin de probabilidad normal? a) Se la dene por su media y desviacin estndar. b) La media y la mediana son iguales. c) Es simtrica. d) Se basa en slo dos observaciones. 14. Para emplear la aproximacin normal de la binomial, a) La probabilidad de un xito debe ser de por lo menos 0.5. b) El tamao de la muestra o el nmero de pruebas debe ser de por lo menos 30. c) El valor de n es mayor que 0.5. d) Los resultados deben ser mutuamente excluyentes. 15.  Si se utiliza la distribucin de probabilidad normal estndar, cul es la probabilidad de determinar un valor z mayor que 1.66? a) 0.4515 b) 0.9515 c) 0.5000 d) 0.0485

Parte II. Problemas


16.  Se dice que Proactine, un nuevo medicamento contra el acn, tiene 80% de efectividad: de cada 100 personas que se lo aplican, 80 muestran progresos signicativos. Se aplica en el rea afectada en un grupo de 15 personas. Cul es la probabilidad de que: a) las 15 muestren mejoras signicativas? b) menos de 9 muestren mejoras signicativas? c) 12 o ms personas muestren mejoras signicativas? 17.  El First National Bank investiga a conciencia a las personas que solicitan crditos para realizar mejoras menores en sus viviendas. Su registro de retrasos en los pagos es impresionante: la probabilidad de que un propietario de vivienda no cumpla puntualmente con sus pagos es de apenas 0.005. El banco aprob 400 crditos para mejoras menores de vivienda. Si aplica una distribucin de Poisson al problema: a) Cul es la probabilidad de que ninguno de los 400 propietarios de vivienda se retrase en los pagos? b) Cuntos de los 400 se espera que se retrasen? c)  Cul es la probabilidad de que 3 o ms propietarios de vivienda se retrasen en el pago de los crditos para mejoras menores de vivienda? 18.  Un estudio relacionado con la asistencia de acionados a los partidos de basquetbol de la Universidad de Alabama revel que la distribucin de la asistencia es normal, con una media de 10 000 y una desviacin estndar de 2 000. a) Cul es la probabilidad de que un partido registre una asistencia de 13 500 o ms espectadores? b) Qu porcentaje de partidos registra una asistencia de entre 8 000 y 11 500 acionados? c) Qu asistencia aproximada se registra en10% de los partidos? 19.  Un estudio del departamento de recursos humanos del North Ocean Medical Center revel la siguiente informacin sobre la cantidad de ausencias el mes pasado por parte de empleados de intendencia.

Das de ausencia 0 1 2 3 4 5 o ms

Nmero de empleados 20 35 90 40 10 5

Cul es la probabilidad de que un empleado elegido al azar: a) No se haya ausentado durante el mes? b) Se ausentara menos de 3 das? c) Se ausentara 4 o ms das? 20.  El Internal Revenue Service apart 200 declaraciones en las que parece excesivo el monto de contribuciones de benecencia. Se selecciona una muestra de 6 declaraciones del grupo. Si dos o ms declaraciones de este grupo registran montos excesivos deducidos de contribuciones de benecencia, todo el grupo se somete a una auditora. Cul es la probabilidad de que a todo el grupo se le practique una auditora si la proporcin real de deducciones excesivas es de 20%? Y si la proporcin es de 30%?

Repaso de los captulos 5 a 7

257

21.  La compaa de seguros Daniel-James asegurar una plataforma martima de produccin de Mobil Oil contra prdidas ocasionadas por el clima durante un ao. El presidente de la aseguradora calcula las siguientes prdidas (en millones de dlares) con las probabilidades correspondientes.

Monto de las prdidas (millones de dlares) 0 40 300

Probabilidad de prdida .98 .016 .004

a) Cul es el monto esperado que deber pagar Daniel-James a Mobil por concepto de demandas? b) Cul es la probabilidad de que Daniel-James pierda realmente menos del monto esperado? c)  En caso de que Daniel-James sufra una prdida, cul es la probabilidad de que sea de $300 millones? d) Daniel-James j la prima anual en 2.0 millones de dlares. Es una prima justa? Cubrir su riesgo? 22.  La distribucin de la cantidad de nios de edad escolar por familia en el rea de Whitehall Estates, de Boise, Idaho, es la siguiente:

Nmero de nios Porcentaje de familias

0 40

1 30

2 15

3 10

4 5

a)  Determine la media y la desviacin estndar del nmero de nios en edad escolar por familia en la regin de Whitehall Estates. b)  Se planea una nueva escuela en la regin de Whitehall Estates. Es necesario un clculo aproximado del nmero de nios en edad escolar. Hay 500 unidades familiares. Cuntos nios calculara que hay? c)  Se necesita informacin adicional de las familias que tienen nios exclusivamente. Convierta la informacin anterior para familias con nios. Cul es la media del nmero de nios en las familias con nios? 23.  En la siguiente tabla se desglosan los 108 miembros del Congreso de Estados Unidos por aliacin poltica.

Cmara Senado Demcratas 205 48

Partido Republicanos 229 51 Otros 1 1

a) Se elige al azar a un miembro del Congreso. Cul es la probabilidad de elegir a un republicano? b)  Si la persona elegida es miembro de la Cmara de Representantes, cul es la probabilidad de que sea un republicano? c) Cul es la probabilidad de elegir a un miembro de la Cmara de Representantes o a un demcrata?

Casos
A. Century National Bank
Consulte los datos relativos a Century National Bank. Es razonable que la distribucin para vericar los saldos de las cuentas se aproxime a una distribucin de probabilidad normal? Determine la media y la desviacin estndar para la muestra de 60 clientes. Compare la distribucin real con la terica. Mencione algunos ejemplos especcos y haga comentarios sobre sus conclusiones. Divida los saldos de las cuentas en tres grupos de 20 cada uno, y coloque la tercera parte ms pequea de los saldos en el primer grupo; la tercera parte de en medio en el segundo grupo y las que tienen el saldo ms considerable en el tercer grupo. Enseguida elabore una tabla que contenga el nmero de cada una de las categoras de los saldos de las cuentas por sucursal. Parece que las cuentas se relacionan con la sucursal correspondiente? Cite ejemplos o haga comentarios sobre sus conclusiones.

258

Captulo 7

B. Auditor de elecciones
Un tema como el del incremento en los impuestos, la revocacin de funcionarios electos o la expansin de los servicios pblicos pueden someterse a un referndum si se recaban sucientes rmas vlidas para apoyar la peticin. Por desgracia, muchas personas rmarn la peticin aunque no estn registradas en el distrito correspondiente, o rmarn la peticin ms de una vez. Sara Ferguson, auditora de elecciones en el condado de Venango, tiene que certicar la validez de las rmas antes de que se presente la peticin de manera ocial. No es de sorprender que su personal se encuentre agobiado de trabajo; as, ella piensa aplicar mtodos estadsticos para dar validez a los documentos, los cuales contienen 200 rmas, en lugar de dar validez a cada rma particular. En una reunin profesional reciente, descubri que, en algunas comunidades del estado, los funcionarios electorales vericaban apenas cinco rmas de cada pgina y rechazaban toda la pgina en caso de que dos o ms rmas se anularan. Con el n de investigar estos mtodos, Sara pide a su personal que extraiga los resultados de la ltima eleccin y tome una muestra de 30 pginas. Sucede que el personal escogi 14 pginas del distrito de Avondale, 9 del distrito de Midway y 7 de Kingston. Cada pgina contena 200 rmas; los datos que aparecen a continuacin muestran el nmero de rmas invalidadas en cada pgina. Utilice los datos para evaluar las dos propuestas de Sara. Calcule la probabilidad de rechazar una pgina de acuerdo con los dos enfoques. Obtendra aproximadamente los mismos resultados si analizara cada rma? Proponga su propio plan y explique por qu podra ser mejor o peor que los dos planes propuestos por Sara.

tos tipos de distribuciones de probabilidad (binomial, normal, hipergeomtrica, de Poisson, etc.) Puede dar algunos consejos a Geoff sobre el tipo de distribucin que debe emplear para adaptarse a estos datos lo mejor posible y decidir cundo aceptar a un empleado que est a prueba, una vez que alcanza el mayor grado de productividad? Es importante, pues implica un incremento salarial para el empleado y, en el pasado, algunos trabajadores a prueba abandonaron el empleo debido a que se desalentaron porque no cumplieron con los requisitos. Las llamadas de ventas exitosas por hora durante la semana del 14 de agosto son las siguientes: 4 2 3 1 4 5 5 2 3 2 2 4 5 2 5 3 3 0 1 3 2 8 4 5 2 2 4 1 5 5 4 5 1 2 4 Estadstica descriptiva: N 35 MN 0.0 MEDIA 3.229 MX 8.000 MEDIANA 3.000 Q1 2.000 MDIATR 3.194 Q3 5.000 DESSTD 1.682 MEDIASE 0.284

Qu distribucin piensa que Geoff debe utilizar para su anlisis?

D. Tarjeta de crdito del banco CNP


Antes de que un banco emita una tarjeta de crdito, normalmente clasica o calica al cliente en funcin de la probabilidad de que resulte un cliente rentable. Una tabla habitual de calicaciones es la siguiente:

Avondale 9 14 11 8 14 6 10 13 8 8 9 12 7 13

Midway 19 22 23 14 22 17 15 20 18

Kingston 38 39 41 39 41 39 39

Edad Menos de 25 25-29 30-34 35+ (12 pts.) (5 pts.) (0 pts.) (18 pts.) Tiempo <1 ao 1-2 aos 3-4 aos 5+ aos viviendo en (9 pts.) (0 pts.) (13 pts.) (20 pts.) la misma direccin Antigedad Ninguna 0-ao 2-4 aos 5+ aos con automvil (18 pts.) (12 pts.) (13 pts.) (3 pts.) Pago Ninguno $1-$99 $100-$299 $300+ mensual (15 pts.) (6 pts.) (4 pts.) (0 pts.) de automvil Costo de $1-$199 $200-$399 Propia Vive con vivienda (0 pts.) (10 pts.) (12 pts.) parientes (24 pts.) Cuenta de Ambas Slo Slo Ninguna cheques cheques ahorros o ahorros (15 pts.) (3 pts.) (2 pts.) (0 pts.)

C. Geoff aplica su educacin


Geoff Brown es gerente de una pequea empresa de telemarketing y evala la tasa de ventas de sus trabajadores con experiencia para establecer niveles mnimos con el n de hacer nuevas contrataciones. Durante las ltimas semanas registr el nmero de llamadas exitosas por hora del personal. Estos datos guran a continuacin e incluyen estadsticas resumidas que formul con ayuda de un software de estadstica. Geoff estudi en la universidad de la comunidad y ha odo sobre los distin-

La calicacin es la suma de los puntos de los seis rubros. Por ejemplo, Sushi Brown tiene menos de 25 aos (12 puntos); ha vivido en el mismo domicilio durante dos aos (0 puntos); desde hace cuatro aos es dueo de un automvil (13 puntos), por el que realiza pagos de $75 (6 puntos); realiza gastos domsticos

Repaso de los captulos 5 a 7

259

de $200 (10 pts.) y posee una cuenta de cheques (3 puntos). La calicacin que obtendra sera de 44. Despus, con una segunda tabla, se convierten las calicaciones en probabilidades de rentabilidad del cliente. A continuacin aparece una tabla de esta clase.

Calificacin 30 Probabilidad .70

40 .78

50 .85

60 .90

70 .94

80 .95

90 .96

David Edward Ann Nombre Born Brendan McLaughlin Edad 42 23 33 Tiempo de vivir en el mismo domicilio 9 2 5 Antigedad con el auto 2 3 7 Pago mensual del auto $140 $99 $175 Costo de vivienda $300 $200 Propia Cuenta de cheques o ahorros Ambas Slo de cheques Ninguna 1.  Calique a cada uno de estos clientes y calcule la probabilidad de que resulten rentables. 2.  Cul es la probabilidad de que los tres resulten rentables? 3. Cul es la probabilidad de que ninguno sea rentable? 4.  Determine la distribucin de probabilidad total del nmero de clientes rentables entre este grupo de tres clientes.

La calicacin de Sushi de 44 se traducira en una probabilidad de rentabilidad aproximada de 0.81. En otras palabras, 81% de los clientes como Sushi generaran dinero a las operaciones con tarjeta del banco. A continuacin se muestran los resultados de las entrevistas para los tres posibles clientes.

8
OBJETIVOS
Al concluir el captulo, ser capaz de: 1. Explicar la razn por la que una muestra es con frecuencia la nica forma viable para conocer algo sobre una poblacin. 2. Describir mtodos para seleccionar una muestra. 3. Definir y construir una distribucin muestral de la media de la muestra. 4. Comprender y explicar el teorema del lmite central. 5. Aplicar el teorema del lmite central para calcular probabilidades de seleccionar posibles medias muestrales de una poblacin especfica.

Mtodos de muestreo y teorema del lmite central

El informe anual de Nike indica que el estadounidense promedio compra 6.5 pares de zapatos deportivos al ao. Suponga que la desviacin estndar de la poblacin es de 2.1 y que se analizar una muestra de 81 clientes el siguiente ao. Cul es el error estndar de la media en este experimento? (Vase el objetivo 5 y el ejercicio 45.)

Mtodos de muestreo y teorema del lmite central

261

Introduccin
De los captulos 2 a 4 se hizo hincapi en las tcnicas para describir datos. Con el n de ilustrar dichas tcnicas, se organizaron los precios de 80 vehculos vendidos el mes pasado en Whitner Autoplex en una distribucin de frecuencias para calcular las diversas medidas de ubicacin y dispersin. Dichas medidas, como la media y la desviacin estndar, describen el precio de venta habitual y la dispersin de los precios de venta. En estos captulos se destac la descripcin de la condicin de los datos: se describi algo que ya haba sucedido. El captulo 5 comienza a establecer el fundamento de la inferencia estadstica con el estudio de la probabilidad. Recuerde que, en la inferencia estadstica, el objetivo es determinar algo sobre una poblacin a partir slo de una muestra. La poblacin es todo el grupo de individuos u objetos en estudio, y la muestra es una parte o subconjunto de dicha poblacin. El captulo 6 ampla los conceptos de probabilidad al describir tres distribuciones de probabilidad discreta: binomial, hipergeomtrica y de Poisson. El captulo 7 describe la distribucin de probabilidad uniforme y la distribucin de probabilidad normal. Ambas son distribuciones continuas. Las distribuciones de probabilidad abarcan todos los posibles resultados de un experimento, as como la probabilidad asociada con cada resultado. Mediante las distribuciones de probabilidad se evalu la probabilidad de que ocurra algo en el futuro. Este captulo inicia el estudio del muestreo, herramienta para inferir algo sobre una poblacin. Primero se analizan los mtodos para seleccionar una muestra de una poblacin. Despus se construye una distribucin de la media de la muestra para entender la forma como las medias muestrales tienden a acumularse en torno a la media de la poblacin. Por ltimo, se demuestra que, para cualquier poblacin, la forma de esta distribucin de muestreo tiende a seguir la distribucin de probabilidad normal.

Estadstica en accin
Con el importante papel que desempea la estadstica inferencial en todas las ramas de la ciencia, es ya una necesidad la disponibilidad de fuentes copiosas de nmeros aleatorios. En 1927 se public el primer libro de nmeros aleatorios, con 41 600 dgitos aleatorios, generados por L. Tippett. En 1938, R. A. Fisher y E. Yates publicaron 15 000 dgitos aleatorios, generados con dos barajas. En 1955, RAND Corporation public un milln de dgitos aleatorios, generados por pulsos de frecuencia aleatorios de una ruleta electrnica. Para 1970, las aplicaciones del muestreo requeran miles de millones de nmeros aleatorios. Desde entonces se han creado mtodos para generar, con ayuda de computadoras, dgitos casi aleatorios, por lo que se les llama seudoaleatorios. An es motivo de debate la pregunta acerca de si un programa de computadora sirve para generar nmeros aleatorios que de verdad sean aleatorios.

Mtodos de muestreo
Ya se mencion en el captulo 1 que el propsito de la estadstica inferencial consiste en determinar algo sobre una poblacin a partir de una muestra. Una muestra es una porcin o parte de la poblacin de inters. En muchos casos, el muestreo resulta ms accesible que el estudio de toda la poblacin. En esta seccin se explican las razones principales para muestrear y, enseguida, diversos mtodos para elegir una muestra.

Razones para muestrear


Cuando se estudian las caractersticas de una poblacin, existen diversas razones prcticas para preferir la seleccin de porciones o muestras de una poblacin para observar y medir. He aqu algunas razones para muestrear: 1. E  stablecer contacto con toda la poblacin requerira mucho tiempo. Un candidato para un puesto federal quiz desee determinar las posibilidades que tiene de resultar electo. Una encuesta de muestreo en la que se utiliza el personal y las entrevistas de campo convencionales de una empresa especializada en encuestas tardara de uno o dos das. Con el mismo personal y los mismos entrevistadores, y laborando siete das a la semana, se requeriran 200 aos para ponerse en contacto con toda la poblacin en edad de votar. Aunque fuera posible reunir a un numeroso equipo de encuestadores, quiz no valdra la pena entrar en contacto con todos los votantes. 2.  El costo de estudiar todos los elementos de una poblacin resultara prohibitivo. Las organizaciones que realizan encuestas de opinin pblica y pruebas entre consumidores, como Gallup Polls y Roper ASW, normalmente entran en contacto con menos de 2 000 de las casi 60 millones de familias en Estados Unidos. Una organizacin que entrevista a consumidores en panel cobra cerca de $40 000 por enviar muestras por correo y tabular las respuestas con el n de probar un producto (como un cereal para el desayuno, alimento para gato o algn perfume). La misma prueba del producto con los 60 millones de familias tendra un costo de aproximadamente $1 000 000 000.

262

Captulo 8

3. E  s imposible verificar de manera fsica todos los elementos de la poblacin. Algunas poblaciones son innitas. Sera imposible vericar toda el agua del lago Erie en lo que se reere a niveles de bacterias, as que se eligen muestras en diversos lugares. Las poblaciones de peces, aves, serpientes o mosquitos son grandes, y se desplazan, nacen y mueren continuamente. En lugar de intentar contar todos los patos que hay en Canad o todos los peces del lago Pontchartrain, se hacen aproximaciones mediante diversas tcnicas: se cuentan todos los patos que hay en un estanque, capturados al azar, se revisan las cestas de los cazadores o se colocan redes en lugares predeterminados en el lago. 4.  Algunas pruebas son de naturaleza destructiva. Si los catadores de vino de Sutter Home Winery, California, se bebieran todo el vino para evaluar la vendimia, acabaran con la cosecha y no quedara nada disponible para la venta. En el rea de produccin industrial: las placas de acero, cables y productos similares deben contar con una resistencia mnima a la tensin. Para cerciorarse de que el producto satisface la norma mnima, el departamento de control de calidad elige una muestra de la produccin actual. Cada pieza se somete a tensin hasta que se rompe y se registra el punto de ruptura (medido en libras por pulgada cuadrada). Es obvio que si se sometieran todos los cables o todas las placas a pruebas de resistencia a la tensin no habra productos disponibles para vender u utilizar. Por la misma razn, Kodak selecciona slo una muestra de pelcula fotogrca y la somete a pruebas para determinar la calidad de todos los rollos que se producen; y slo unas cuantas semillas se someten a pruebas de germinacin en Burpee, antes de la temporada de siembra. 5.  Los resultados de la muestra son adecuados. Aunque se contara con recursos sucientes, es difcil que la precisin de una muestra de 100% toda la poblacin resulte esencial en la mayora de los problemas. Por ejemplo, el gobierno federal utiliza una muestra de tiendas de comestibles distribuidas en Estados Unidos para determinar el ndice mensual de precios de los alimentos. Los precios del pan, frijol, leche y otros productos de primera necesidad se incluyen en el ndice. Resulta poco probable que la inclusin de todas las tiendas de comestibles de Estados Unidos inuya signicativamente en el ndice, pues los precios de la leche, el pan y otros productos de primera necesidad no varan ms de unos cuantos centavos de una cadena de tiendas a otra.

Muestreo aleatorio simple


El tipo de muestreo ms comn es el MUESTREO ALEATORIO SIMPLE Muestra seleccionada de manera que cada elemento o individuo de la poblacin tenga las mismas posibilidades de que se le incluya. Para ejemplicar el muestreo aleatorio simple y la seleccin, suponga que una poblacin consta de 845 empleados de Nitra Industries. Se va a elegir una muestra de 52 empleados de dicha poblacin. Una forma de asegurarse de que todos los empleados de la poblacin tienen las mismas posibilidades de que se les elija consiste en escribir primero el nombre de cada empleado en un papel y depositarlos todos en una caja. Despus de mezclarlos , se efecta la primera seleccin tomando un papel de la caja sin mirarlo. Se repite este proceso hasta terminar de elegir la muestra de 52 empleados. Un mtodo ms conveniente de seleccionar una muestra aleatoria consiste en utilizar un nmero de identicacin por cada empleado y una tabla de nmeros aleatorios como la del apndice B.6. Como su nombre lo indica, estos nmeros se generaron mediante un proceso aleatorio (en este caso, con una computadora).

Una tabla de nmeros aleatorios es una forma eciente de seleccionar a los miembros de una muestra.

Mtodos de muestreo y teorema del lmite central

263

Estadstica en accin
Es discriminacin sacar ventaja del fsico? Antes de contestar, considere un artculo reciente que apareci en Personnel Journal. Estos hallazgos indican que los hombres y mujeres atractivos ganan alrededor de 5% ms que los que tienen una apariencia promedio, quienes, a su vez, ganan 5% ms que sus compaeros poco agraciados. Esto se aplica tanto en hombres como en mujeres. Tambin es cierto en el caso de gran variedad de ocupaciones, desde la construccin hasta la reparacin de automviles y los empleos de telemarketing, ocupaciones para las que, segn se cree, la apariencia no es importante.

La probabilidad de 0, 1, 2, , 9 es la misma para cada dgito de un nmero. Por consiguiente, la probabilidad de que se seleccione el empleado 011 es la misma que para los empleados 722 o 382. Al emplear nmeros aleatorios para seleccionar empleados, se elimina la inuencia o sesgo del proceso de seleccin. En la siguiente ilustracin aparece parte de una tabla de nmeros aleatorios. Para seleccionar una muestra de empleados, elija primero un punto de partida en la tabla; cualquier punto sirve. Ahora suponga que el reloj marca las 3:04. Puede observar la tercera columna y enseguida desplazarse hacia abajo hasta el cuarto conjunto de nmeros. El nmero es 03759. Como slo hay 845 empleados, utilizar los tres primeros dgitos de un nmero aleatorio de cinco dgitos. Por tanto, 037 es el nmero del primer empleado que se convertir en miembro de la muestra. Otra forma de elegir el punto de partida consiste en cerrar los ojos y sealar un nmero de la tabla. Para continuar, puede desplazarse en cualquier sentido. Suponga que lo hace hacia la derecha. Los primeros tres dgitos del nmero a la derecha de 03759 son 447, el nmero del siguiente empleado seleccionado para integrar la muestra. El siguiente nmero de tres dgitos a la derecha es 961. Omita 961, pues slo hay 845 empleados. Contine hacia la derecha y seleccione al empleado 784; despus el 189 y as en lo sucesivo.
5 7 3 6 0 1 0 2 4 8 6 1 5 5 9 8 7 4 2 0 8 5 3 4 5 7 6 1 8 8 5 5 7 2 6 1 7 3 4 7 2 0 4 3 2 3 8 7 5 8 9 0 7 3 4 0 7 5 9 4 2 5 0 0 0 0 8 3 0 3 3 5 4 8 1 7 9 8 5 2 4 5 1 3 5 7 4 9 0 7 6 4 3 4 1 2 8 2 8 4 7 4 2 4 6 7 3 3 2 8 7 2 5 9 6 6 6 3 0 7 3 5 8 9 4 1 4 4 9 6 9 0 6 4 9 1 1 4 5 6 6 0 6 2 6 5 7 8 9 0 3 7 9 7 0 1 8 1 8 8 3 6 8 8 8 4 8 7 8 1 6 8 5 1 4 9 9 9 0 2 3 9 3 1 1 9 9 1 9 8 8 4 0 1 7 9 9 4 1 9 4 1 1 9 8 9 4 0 0 6

Punto de partida

Segundo empleado

Tercer empleado

Cuarto empleado

La mayora de los paquetes de software contienen una rutina para seleccionar una muestra aleatoria simple. En el siguiente ejemplo se emplea el sistema Excel para elegir una muestra aleatoria.

Ejemplo

Jane y Joe Millar administran el Foxtrot Inn, una pensin donde dan alojamiento y desayuno, localizada en Tryon, Carolina del Norte. Se rentan ocho habitaciones en esta pensin. A continuacin aparece el nmero de estas ocho habitaciones rentadas diariamente durante junio de 2006. Utilice Excel para seleccionar una muestra de cinco noches de junio.
Junio 1 2 3 4 5 6 7 8 9 10 Habitaciones en renta 0 2 3 2 3 4 2 3 4 7 Junio 11 12 13 14 15 16 17 18 19 20 Habitaciones en renta 3 4 4 4 7 0 5 3 6 2  Junio 21 22 23 24 25 26 27 28 29 30 Habitaciones en renta 3 2 3 6 0 4 1 1 3 3

Solucin

Excel seleccionar la muestra aleatoria y arrojar los resultados. En la primera fecha muestreada haba cuatro habitaciones rentadas de las ocho. En la segunda fecha muestreada de junio, se rentaron siete de las ocho habitaciones. La informacin aparece en la columna D de la hoja de clculo de Excel. Los pasos en Excel se incluyen

264

Captulo 8

en la seccin Comandos de software, al nal del captulo. El sistema Excel lleva a cabo el muestreo con reemplazo. Esto signica que tal vez el mismo da aparezca ms de una vez en una muestra.

Autoevaluacin 8.1

La siguiente lista incluye a los estudiantes que se matricularon en un curso de introduccin a la estadstica administrativa. Se elige al azar a tres estudiantes, a quienes se formulan varias preguntas relacionadas con el contenido del curso y el mtodo de enseanza. a)  Se escriben a mano los nmeros 00 a 45 en papeletas y se colocan en un recipiente. Los tres nmeros seleccionados son 31, 7 y 25. Qu estudiantes se van a incluir en la muestra? b) Ahora utilice la tabla de dgitos aleatorios, apndice B.6, para seleccionar su propia muestra. c) Qu hara si localizara el nmero 59 en la tabla de nmeros aleatorios?

CSPM 264 01 BUSINESS & ECONOMIC STAT 8:00 AM 9:40 AM MW ST 118 LIND D RANDOM NUMBER NAME 00 ANDERSON, RAYMOND 01 ANGER, CHERYL RENEE 02 BALL, CLAIRE JEANETTE 03 BERRY, CHRISTOPHER G 04 BOBAK, JAMES PATRICK 05 BRIGHT, M. STARR 06 CHONTOS, PAUL JOSEPH 07 DETLEY, BRIAN HANS 08 DUDAS, VIOLA 09 DULBS, RICHARD ZALFA 10 EDINGER, SUSAN KEE 11 FINK, FRANK JAMES 12 FRANCIS, JAMES P 13 GAGHEN, PAMELA LYNN 14 GOULD, ROBYN KAY 15 GROSENBACHER, SCOTT ALAN 16 HEETFIELD, DIANE MARIE 17 KABAT, JAMES DAVID 18 KEMP, LISA ADRIANE 19 KILLION, MICHELLE A 20 KOPERSKI, MARY ELLEN 21 KOPP, BRIDGETTE ANN 22 LEHMANN, KRISTINA MARIE CLASS RANK SO SO FR FR SO JR SO JR SO JR SR SR JR JR SO SO SO JR FR SO SO SO JR RANDOM NUMBER NAME 23 MEDLEY, CHERYL ANN 24 MITCHELL, GREG R 25 MOLTER, KRISTI MARIE 26 MULCAHY, STEPHEN ROBERT 27 NICHOLAS, ROBERT CHARLES 28 NICKENS, VIRGINIA 29 PENNYWITT, SEAN PATRICK 30 POTEAU, KRIS E 31 PRICE, MARY LYNETTE 32 RISTAS, JAMES 33 SAGER, ANNE MARIE 34 SMILLIE, HEATHER MICHELLE 35 SNYDER, LEISHA KAY 36 STAHL, MARIA TASHERY 37 ST. JOHN, AMY J 38 STURDEVANT, RICHARD K 39 SWETYE, LYNN MICHELE 40 WALASINSKI, MICHAEL 41 WALKER, DIANE ELAINE 42 WARNOCK, JENNIFER MARY 43 WILLIAMS, WENDY A 44 YAP, HOCK BAN 45 YODER, ARLAN JAY CLASS RANK SO FR SO SO JR SO SO JR SO SR SO SO SR SO SO SO SO SO SO SO SO SO JR

Mtodos de muestreo y teorema del lmite central

265

Muestreo aleatorio sistemtico


El procedimiento de muestreo aleatorio simple resulta complicado en algunos estudios. Por ejemplo, suponga que la divisin de ventas de Computer Graphic, Inc., necesita calcular rpidamente el ingreso medio en dlares por venta del mes pasado. La divisin encontr que se registraron 2 000 ventas y se almacenaron en cajones de archivo, y se decidi seleccionar 100 recibos para calcular el ingreso medio en dlares. El muestreo aleatorio simple requiere que la numeracin de cada recibo antes de utilizar la tabla de nmeros aleatorios para seleccionar los 100 recibos. Dicho proceso de numeracin puede tardar mucho tiempo. En su lugar, es posible aplicar el muestreo aleatorio sistemtico. MUESTREO ALEATORIO SISTEMTICO Se selecciona un punto aleatorio de inicio y posteriormente se elige cada k-simo miembro de la poblacin. Primero se calcula k, que es el resultado de dividir el tamao de la poblacin entre el tamao de la muestra. En el caso de Computers Graphic, Inc., seleccione cada vigsimo recibo (2 000/100) de los cajones del archivo; al hacerlo evita el proceso de numeracin. Si k no es un nmero entero, hay que redondearlo. En la seleccin del primer recibo emplee el muestreo aleatorio simple. Por ejemplo, seleccionar un nmero de la tabla de nmeros aleatorios entre 1 y k, en este caso, 20. Suponga que el nmero aleatorio result ser 18. Entonces, a partir del recibo 18, se seleccionar cada vigsimo recibo (18, 38, 58, etc.) como muestra. Antes de aplicar el muestreo aleatorio sistemtico, debe observar con cuidado el orden fsico de la poblacin. Cuando el orden fsico se relaciona con la caracterstica de la poblacin, no debe aplicar el muestreo aleatorio sistemtico. Por ejemplo, si los recibos se archivan en orden creciente de ventas, el muestreo aleatorio sistemtico no garantiza una muestra aleatoria. Debe aplicar otros mtodos de muestreo.

Estadstica en accin
Los mtodos de muestreo aleatorio y sin sesgos son muy importantes para realizar inferencias estadsticas vlidas. En 1936 se efectu un sondeo de opinin para predecir el resultado de la carrera presidencial entre Franklin Roosevelt y Alfred Landon. Se enviaron diez millones de papeletas en forma de postales retornables gratuitas a domicilios tomados de directorios telefnicos y registros de automviles. Se contest una alta proporcin de papeletas, con 59% en favor de Landon y 41% de Roosevelt. El da de la eleccin, Roosevelt gan con 61% de los votos. Landon obtuvo 39%. Sin duda, a mediados de la dcada de 1930, la gente que tena telfono y automvil no era representativa de los votantes estadounidenses.

Muestreo aleatorio estratificado


Cuando una poblacin se divide en grupos a partir de ciertas caractersticas, se aplica el muestreo aleatorio estratificado con el n de garantizar el hecho de que cada grupo se encuentre representado en la muestra. A los grupos tambin se les denomina estratos. Por ejemplo, los estudiantes universitarios se pueden agrupar en estudiantes de tiempo completo o de medio tiempo, por sexo, masculino o femenino, tradicionales o no tradicionales. Una vez denidos los estratos, se aplica el muestreo aleatorio simple en cada grupo o estrato con el n de formar la muestra. MUESTRA ALEATORIA ESTRATIFICADA Una poblacin se divide en subgrupos, denominados estratos, y se selecciona al azar una muestra de cada estrato. Por ejemplo, puede estudiar los gastos en publicidad de las 352 empresas ms grandes de Estados Unidos. Suponga que el objetivo del estudio consiste en determinar si las empresas con altos rendimientos sobre el capital (una media de rentabilidad) gastan en publicidad la mayor parte del dinero ganado en ventas que las empresas con un registro de bajo rendimiento o dcit. Para asegurar que la muestra sea una representacin imparcial de las 352 empresas, stas se agrupan de acuerdo con su rendimiento porcentual sobre el capital. La tabla 8.1 incluye los estratos y las frecuencias relativas. Si aplicara el muestreo aleatorio simple, observe que las empresas del tercero y cuarto estratos tienen una probabilidad alta de que se les seleccione (0.87), mientras que las empresas de los dems estratos tienen pocas probabilidades de que se les seleccione (0.13). Podra no seleccionar ninguna de las empresas que aparecen en los estratos 1 o 5 sencillamente por azar. No obstante, el muestreo aleatorio estraticado garantizar que por lo menos una empresa de los estratos 1 o 5 aparezca en la muestra. Considere una seleccin de 50 compaas para llevar a cabo un estudio minucioso. Entonces se seleccionar de forma aleatoria 1 (0.02 50) empresa del estrato 1; 5 (0.10 50), del estrato 2, etc. En este caso, el nmero de empresas en cada estrato es proporcional a la frecuencia relativa del estrato en la poblacin. El muestreo estraticado ofrece la ventaja

266

Captulo 8

de que, en algunos casos, reeja con mayor delidad las caractersticas de la poblacin que el muestreo aleatorio simple o el muestreo aleatorio sistemtico.
Nmero seleccionado para una muestra aleatoria estratificada proporcional TaBlA 8.1
Estrato 1 2 3 4 5 Probabilidad (recuperacin de capital) 30% y ms De 20% a 30% De 10% a 20% De 0% a 10% Dficit Total
*0.02 de 50 = 1, 0.10 de 50 = 5, etctera.

Nmero de empresas 8 35 189 115 5 352

Frecuencia relativa

Nmero muestreado

0.02 1* 0.10 5* 0.54 27 0.33 16 0.01 1 1.00 50

Muestreo por conglomerados


Otro tipo comn de muestreo es el muestreo por conglomerados. ste se emplea a menudo para reducir el costo de muestrear una poblacin dispersa en cierta rea geogrca. MUESTREO ACUMULADO Una poblacin se divide en conglomerados a partir de los lmites naturales geogrficos o de otra clase. A continuacin se seleccionan los conglomerados al azar y se toma una muestra de forma aleatoria con elementos de cada grupo. Suponga que desea determinar la opinin de los residentes de algn estado con referencia a las polticas federales y estatales de proteccin ambiental. Seleccionar una muestra aleatoria de residentes y ponerse en contacto con cada persona requerira mucho tiempo y resultara muy costoso. Sera mejor aplicar el muestreo por conglomerados y subdividir el estado en pequeas unidades: condados o regiones. Con frecuencia, se les conoce como unidades primarias. Suponga que dividi el estado en 12 unidades primarias, seleccion al azar cuatro regiones, 2, 7, 4 y 12, y concentr su atencin en estas unidades primarias. Usted puede tomar una muestra aleatoria de los residentes de cada una de estas regiones y entrevistarse con ellos (observe que se trata de una combinacin de un muestreo por conglomerados y un muestreo aleatorio simple). El estudio de los mtodos de muestreo de las secciones anteriores no incluye todos los mtodos de muestreo disponibles para el investigador. Si usted emprendiera un proyecto de investigacin importante de marketing, nanzas, contabilidad u otras reas, necesitara consultar libros dedicados exclusivamente a la teora del muestreo y al diseo de muestras.
9 2 3 1 4 5 8 7 12 11 6 10

Muchos mtodos ms de muestreo

Autoevaluacin 8.2

Consulte la autoevaluacin 8.1 y la lista de alumnos de la pgina 264. Suponga que en un muestreo aleatorio sistemtico se elegir a cada noveno estudiante de la clase. Al principio se elige al azar al cuarto estudiante de la lista. Dicho estudiante es el nmero 03. Recuerde que los nmeros aleatorios comienzan con 00, entonces, qu estudiantes se elegirn como miembros de la muestra?

Mtodos de muestreo y teorema del lmite central

267

Ejercicios
1.  La siguiente lista incluye las tiendas de Marcos Pizza en el condado de Lucas. Tambin se indica si la tienda es propiedad de alguna corporacin (C) o del administrador (A). Se seleccionar e inspeccionar una muestra de cuatro establecimientos en relacin con la conveniencia para el cliente, la seguridad, la higiene y otras caractersticas. Nmero de identi- ficacin Direccin Tipo 00 01 02 03 04 05 06 07 08 09 10 11 2607 Starr Av 309 W Alexis Rd 2652 W Central Av 630 Dixie Hwy 3510 Dorr St 5055 Glendale Av 3382 Lagrange St 2525 W Laskey Rd 303 Louisiana Av 149 Main St 835 S McCord Rd 3501 Monroe St C C C A C C A C C C A A Nmero de identificacin 12 13 14 15 16 17 18 19 20 21 22 23

Direccin 2040 Ottawa River Rd 2116 N Reynolds Rd 3678 Rugby Dr 1419 South Av 1234 W Sylvania Av 4624 Woodville Rd 5155 S Main 106 E Airport Hwy 6725 W Central 4252 Monroe 2036 Woodville Rd 1316 Michigan Av

Tipo C C C C C A A C A C C A

a)  Los nmeros aleatorios seleccionados son 08, 18, 11, 02, 41 y 54. Qu tiendas se eligieron? b)  Utilice la tabla de nmeros aleatorios para seleccionar su propia muestra de establecimientos. c)  Una muestra consta de cada sptimo establecimiento. El nmero 03 es el punto de partida. Qu establecimientos se incluirn en la muestra? d)  Suponga que una muestra consta de tres establecimientos, de los cuales dos son propiedad corporativa y uno del administrador. Seleccione una muestra adecuada. 2.  La siguiente lista incluye hospitales localizados en las regiones de Cincinnati (Ohio) y la regin norte de Kentucky. Tambin indica si se trata de un hospital general mdico o quirrgico (M/ Q), o de especialidades (E). Interesa calcular el promedio de enfermeras que trabaja medio tiempo en los hospitales del rea. a)  Se va a seleccionar de forma aleatoria una muestra de cinco hospitales. Los nmeros aleatorios son 09, 16, 00, 49, 54, 12 y 04. Qu hospitales se incluyen en la muestra? b)  Utilice una tabla de nmeros aleatorios para formar su propia muestra de cinco hospitales. Nmero

Nmero

e identid ficacin

Nombre

Direccin 10500 Montgomery Cincinnati, Ohio 45242 630 Eaton Avenue Hamilton, Ohio 45013 4700 East Galbraith Rd. Cincinnati, Ohio 45236 3000 Mack Road Fairfield, Ohio 45014 100 Riverfront Plaza Hamilton, Ohio 45011 105 McKnight Drive Middletown, Ohio 45044 3000 Hospital Drive Batavia, Ohio 45103 7500 State Road Cincinnati, Ohio 45255 619 Oak Street Cincinnati, Ohio 45206 3333 Burnet Avenue Cincinnati, Ohio 45229

Tipo M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q

e identid ficacin

Nombre

Direccin 2139 Auburn Avenue Cincinnati, Ohio 45219 311 Straight Street Cincinnati, Ohio 45219 375 Dixmyth Avenue Cincinnati, Ohio 45220 3200 Burnet Avenue Cincinnati, Ohio 45229 234 Goodman Street Cincinnati, Ohio 45267 2446 Kipling Avenue Cincinnati, Ohio 45239 3131 Queen City Avenue Cincinnati, Ohio 45238 401 E. 20th Street Covington, Kentucky 41014 One Medical Village Edgewood, Kentucky 41017 7380 Turfway Drive Florence, Kentucky 41075

Tipo M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q M/Q

00 Bethesda North 01 Ft. Hamilton-Hughes 02 Jewish Hospital- Kenwood 03 Mercy Hospital- Fairfield 04 Mercy Hospital- Hamilton 05 Middletown Regional 06 Clermont Mercy Hospital 07 Mercy Hospital- Anderson 08 Bethesda Oak Hospital 09 Childrens Hospital Medical Center

10 Christ Hospital 11 Deaconess Hospital 12 Good Samaritan Hospital 13 Jewish Hospital 14 University Hospital 15 Providence Hospital 16 St. Francis- St. George Hospital 17 St. Elizabeth Medical Center, North Unit 18 St. Elizabeth Medical Center, South Unit 19 St. Lukes Hospital West

268

Captulo 8

e identi- d ficacin Nombre 20 St. Lukes Hospital East 21 Care Unit Hospital 22 Emerson Behavioral Science 23 Pauline Warfield Lewis Center for Psychiatric Treat. 24 Childrens Psychiatric No. Kentucky

Nmero

Nmero Direccin Tipo 85 North Grand Avenue M/Q Ft. Thomas, Kentucky 41042 3156 Glenmore Avenue E Cincinnati, Ohio 45211 2446 Kipling Avenue E Cincinnati, Ohio 45239 1101 Summit Road E Cincinnati, Ohio 45237 502 Farrell Drive Covington, Kentucky 41011 E

e identid ficacin 25 26 27 28

Nombre Drake Center Rehab Long Term No. Kentucky Rehab HospitalShort Term Shriners Burns Institute VA Medical Center Cincinnati, Ohio 45220

Direccin 151 W. Galbraith Road Cincinnati, Ohio 45216 201 Medical Village Edgewood, Kentucky 3229 Burnet Avenue Cincinnati, Ohio 45229 3200 Vine

Tipo E E E E

c)  Una muestra incluir cada quinto establecimiento. Se selecciona 02 como punto de partida. Qu hospitales se incluirn en la muestra? d)  Una muestra consta de cuatro hospitales mdicos o quirrgicos y un hospital de especialidades. Seleccione una muestra adecuada. 3.  A continuacin aparece una lista de los 35 miembros de la Metro Toledo Automobile Dealers Association. Se desea calcular el ingreso medio de los departamentos de servicios de los distribuidores. Nmero de identificacin Distribuidor 11 12 13 14 15 16 17 18 19 20 21 22 Thayer Chevrolet/Toyota Spurgeon Chevrolet Motor Sales, Inc. Dunn Chevrolet Don Scott Chevrolet-Pontiac Dave White Chevrolet Co. Dick Wilson Pontiac Doyle Pontiac Buick Franklin Park Lincoln Mercury Genoa Motors Great Lakes Ford Nissan Grogan Towne Chrysler Hatfield Motor Sales Nmero de identificacin Distribuidor 23 24 25 26 27 28 29 30 31 32 33 34 Kistler Ford, Inc. Lexus of Toledo Mathews Ford Oregon, Inc. Northtowne Chevrolet Quality Ford Sales, Inc. Rouen Chrysler Jeep Eagle Saturn of Toledo Ed Schmidt Pontiac Jeep Eagle Southside Lincoln Mercury Valiton Chrysler Vin Divers Whitman Ford

Nmero de identificacin Distribuidor 00 Dave White Acura 01 Autofair Nissan 02 Autofair Toyota-Suzuki 03 George Balls Buick GMC Truck 04 Yark Automotive Group 05 Bob Schmidt Chevrolet 06  Bowling Green Lincoln Mercury Jeep Eagle 07 Brondes Ford 08 Brown Honda 09 Brown Mazda 10 Charlies Dodge

a)  Seleccione una muestra aleatoria de cinco distribuidores. Los nmeros aleatorios son: 05, 20, 59, 21, 31, 28, 49, 38, 66, 08, 29 y 02. Qu distribuidores se van a incluir en la muestra? b)  Utilice la tabla de nmeros aleatorios para seleccionar su propia muestra de cinco distribuidores. c)  Una muestra constar de cada sptimo distribuidor. El nmero 04 se selecciona como punto de partida. Qu distribuidores se incluyen en la muestra? 4.  Enseguida se enumera a los 27 agentes de seguros de Nationwide Insurance en el rea metropolitana de Toledo, Ohio. Se desea calcular el promedio de aos que han laborado en Nationwide. Nmero de identificacin Agente Nmero de identificacin Agente 19 20 21 22 23 24 25 26 Riker Craig 2621 N Reynolds Rd Schwab Dave 572 W Dussel Dr Seibert John H 201 S Main Smithers Bob 229 Superior St Smithers Jerry 229 Superior St Wright Steve 105 S Third St Wood Tom 112 Louisiana Av Yoder Scott 6 Willoughby Av

Nmero de

identificacin Agente 00 01 02 03 04 05 06 07 08 09

Bly Scott 3332 W Laskey Rd 10 Heini Bernie 7110 W Centra Coyle Mike 5432 W Central Av 11 Hinckley Dave Denker Brett 7445 Airport Hwy 14 N Holland Sylvania Rd Denker Rollie 7445 Airport Hwy 12 Joehlin Bob 3358 Navarre Av Farley Ron 1837 W Alexis Rd 13 Keisser David 3030 W Sylvania Av George Mark 7247 W Central Av 14 Keisser Keith 5902 Sylvania Av Gibellato Carlo 6616 Monroe St 15 Lawrence Grant 342 W Dussel Dr Glemser Cathy 5602 Woodville Rd 16 Miller Ken 2427 Woodville Rd Green Mike 4149 Holland Sylvania Rd 17 ODonnell Jim 7247 W Central Av Harris Ev 2026 Albon Rd 18 Priest Harvey 5113 N Summit St

Mtodos de muestreo y teorema del lmite central

269

a) S  eleccione una muestra aleatoria de cuatro agentes. Los nmeros aleatorios son: 02, 59, 51, 25, 14, 29, 77, 69 y 18. Qu distribuidores se incluirn en la muestra? b)  Utilice la tabla de nmeros aleatorios para seleccionar su propia muestra de cuatro agentes. c)  Una muestra consta de cada sptimo distribuidor. El nmero 04 se selecciona como punto de partida. Qu agentes se incluirn en la muestra?

Error de muestreo
En la seccin anterior se estudiaron mtodos de muestreo tiles para seleccionar una muestra que constituya una representacin imparcial o sin sesgos de la poblacin. Es importante sealar que, en cada mtodo, la seleccin de cualquier posible muestra de determinado tamao de una poblacin tiene una posibilidad o probabilidad conocidas. sta constituye otra forma de describir un mtodo de muestreo sin sesgo. Las muestras se emplean para determinar caractersticas de la poblacin. Por ejemplo, con la media de una muestra se calcula la media de la poblacin. No obstante, como la muestra forma parte o es una porcin representativa de la poblacin, es poco probable que la media de la muestra sea exactamente igual a la media poblacional. Asimismo, es poco probable que la desviacin estndar de la muestra sea exactamente igual a la desviacin estndar de la poblacin. Por tanto, puede esperar una diferencia entre un estadstico de la muestra y el parmetro de la poblacin correspondiente. Esta diferencia recibe el nombre de ERROR DE MUESTREO Diferencia entre el estadstico de una muestra y el parmetro de la poblacin correspondiente. El siguiente ejemplo aclara el concepto de error de muestreo. Revise el ejemplo anterior de la pgina 263, en el que estudi el nmero de habitaciones rentadas en Foxtrot Inn, en Tryon, Carolina del Norte. La poblacin se reere al nmero de habitaciones rentadas cada uno de los 30 das de junio de 2006. Determine la media de la poblacin. Utilice Excel u otro software de estadstica para seleccionar tres muestras aleatorias de cinco das. Calcule la media de cada muestra y comprela con la media poblacional. Cul es el error de muestreo en cada caso? Durante el mes se rentaron un total de 94 habitaciones. As, la media de las unidades rentadas por noche es de 3.13. sta es la media de la poblacin. Este valor se designa con la letra griega . X 0 + 2 + 3 + + 3 94 = = = 3.13 N 30 30 La primera muestra aleatoria de cinco noches dio como resultado el siguiente nmero de habitaciones rentadas: 4, 7, 4, 3 y 1. La media _ de esta muestra de cinco noches es de 3.8 habitaciones, que se representa como X 1. La barra sobre la X recuerda que se trata de una media muestral, y el subndice 1 indica que se trata de la media de la primera muestra. = X 4 + 7 + 4 + 3 + 1 19 = = = 3.80 n 5 5 El error de muestreo para la primera muestra es la diferencia entre la media _ poblacional (3.13) y la media muestral (3.80). De ah que el error muestral sea (X 1 = 3.80 3.13 = 0.67). La segunda muestra aleatoria de cinco das de la poblacin de 30 das de junio arroj el siguiente nmero de habitaciones rentadas: 3, 3, 2, 3 y 6. La media de estos cinco valores es de 3.4, que se calcula de la siguiente manera: X1 = X 3 + 3 + 2 + 3 + 6 = = 3.4 n 5 _ El error de muestreo es (X 2 = 3.4 3.13 = 0.27). X2 =

Ejemplo

Solucin

270

Captulo 8

En la tercera muestra aleatoria, la media fue de 1.8, y el error de muestro fue de 1.33. Cada una de estas diferencias, 0.67, 0.27 y 1.33, representa el error de muestreo cometido al calcular la media de la poblacin. A veces estos errores son valores positivos, lo cual indica que la media muestral sobreexcedi la media poblacional; otras veces son valores negativos, lo cual indica que la media muestral result inferior a la media poblacional.

En este caso, con una poblacin de 30 valores y muestras de 5 valores, existe una gran cantidad de posibles muestras, 142 506, para ser exactos. Para calcular este valor se aplica la frmula de las combinaciones 5.10, de la pgina 168. Cada una de las 142 506 diferentes muestras cuenta con las mismas posibilidades de que se le seleccione. Cada muestra puede tener una media muestral diferente y, por consiguiente, un error de muestreo distinto. El valor del error de muestreo se basa en el valor particular de las 142 506 posibles muestras seleccionadas. Por consiguiente, los errores de muestreo son aleatorios y se presentan al azar. Si determinara la suma de estos errores de muestreo en una gran cantidad de muestras, el resultado se aproximara mucho a cero. Sucede as porque la media de la muestra constituye un estimador sin sesgo de la media de la poblacin.

Distribucin muestral de la media


Ahora que aparece la posibilidad de que se presente un error de muestreo cuando se emplean los resultados del muestreo para aproximar un parmetro poblacional, cmo hacer un pronstico preciso relacionado con el posible xito de un nuevo dentfrico u otro producto sobre la nica base de los resultados del muestreo? Cmo puede el departamento de control de calidad, de una compaa de produccin en serie, enviar un cargamento de microchips a partir de una muestra de 10 chips? Cmo pueden las organizaciones electorales de CNN-USA Today o ABC News-Washington Post hacer pronsticos precisos sobre la eleccin presidencial con base en una muestra de 1 200 electores registrados de una poblacin de cerca de 90 millones? Para responder estas preguntas, primero hay que precisar el concepto de distribucin muestral de la media. Las medias muestrales del ejemplo anterior varan de una muestra a la siguiente. La media de la primera muestra de 5 das fue de 3.80 habitaciones, y la media de la segunda muestra fue de 3.40 habitaciones. La media poblacional fue de 3.13 habitaciones. Si organiza las medias de todas las muestras posibles de 5 das en una distribucin de probabilidad, el resultado recibe el nombre de DISTRIBUCIN MUESTRAL DE LA MEDIA Distribucin de probabilidad de todas las posibles medias de las muestras de un determinado tamao muestra de la poblacin.

Las medias muestrales varan de muestra en muestra

Mtodos de muestreo y teorema del lmite central

271

El siguiente ejemplo ilustra la construccin de una distribucin muestral de la media.

Ejemplo

Tartus Industries cuenta con siete empleados de produccin (a quienes se les considera la poblacin). En la tabla 8.2 se incluyen los ingresos por hora de cada empleado.
Ingresos por hora de empleados de produccin en Tartus Industries TaBlA 8.2
Empleado Ingresos por hora Empleado Ingresos por hora

Joe $7 Sam 7 Sue 8 Bob 8

Jan $7 Art 8 Ted 9

1. Cul es la media de la poblacin? 2. Cul es la distribucin muestral de la media para muestras de tamao 2? 3. Cul es la media de la distribucin muestral de la media? 4.  Qu observaciones es posible hacer sobre la poblacin y la distribucin muestral de la media?

Solucin

He aqu las respuestas. 1. La media de la poblacin es de $7.71, que se determina de la siguiente manera: X $7 + $7 + $8 + $8 + $7 + $8 + $9 = = $7.71 N 7 Identique la media de la poblacin por medio de la letra griega . En los captulos 1, 3 y 4 se convino en identicar los parmetros poblacionales con letras griegas. 2.  Para obtener la distribucin muestral de la media se seleccion, sin reemplazos de la poblacin, todas las muestras posibles de tamao 2 y se calcularon las medias de cada muestra. Hay 21 posibles muestras, que se calcularon con la frmula (5.10) de la pgina 168. =
N Cn

7! N! = = 21 n !(N n)! 2!(7 2)!

Aqu, N = 7 es el nmero de elementos de la poblacin, y n = 2, el nmero de elementos de la muestra. En la tabla 8.3 se ilustran las 21 medias muestrales de todas las muestras posibles de tamao 2 que pueden tomarse de la poblacin. Estas 21 muestras se utilizan para construir una distribucin de probabilidad, que es la distribucin muestral de la media, la cual se resume en la tabla 8.4. TaBlA 8.3 Medias muestrales de todas las posibles muestras de 2 empleados
Muestra Empleados 1 2 3 4 5 6 7 8 9 10 11 Joe, Sam Joe, Sue Joe, Bob Joe, Jan Joe, Art Joe, Ted Sam, Sue Sam, Bob Sam, Jan Sam, Art Sam, Ted Ingresos por hora Suma Media Muestra Empleados $7, $7 7, 8 7, 8 7, 7 7, 8 7, 9 7, 8 7, 8 7, 7 7, 8 7, 9 $14 15 15 14 15 16 15 15 14 15 16 $7.00 7.50 7.50 7.00 7.50 8.00 7.50 7.50 7.00 7.50 8.00 12 13 14 15 16 17 18 19 20 21 Sue, Bob Sue, Jan Sue, Art Sue, Ted Bob, Jan Bob, Art Bob, Ted Jan, Art Jan, Ted Art, Ted Ingresos por hora Suma Media $8, $8 8, 7 8, 8 8, 9 8, 7 8, 8 8, 9 7, 8 7, 9 8, 9 $16 $8.00 15 7.50 16 8.00 17 8.50 15 7.50 16 8.00 17 8.50 15 7.50 16 8.00 17 8.50

272

Captulo 8

TaBlA 8.4 Distribucin muestral de la media para n = 2


Media muestral $7.00 7.50 8.00 8.50 Nmero de medias 3 9 6 3 21 Probabilidad .1429 .4285 .2857 .1429 1.0000

3.  La media de la distribucin muestral de la media se obtiene al sumar las medias muestrales y dividir la suma entre el nmero de muestras. La media de todas las _ . La recuerda que se trata de un medias muestrales se representa mediante X valor poblacional, pues tom en cuenta todas las muestras posibles. El subndi_ ce X indica que se trata de la distribucin muestral de la media.
La media de la poblacin es igual a la media de las medias muestrales

X =

Suma de todas las medias muestrales $7.00 + $7.50 + + $8.50 = 21 Total de muestras $162 = = $7.71 21

4.  Consulte la grca 8.1, donde aparecen las dos distribuciones poblacionales y la distribucin muestral de la media. Caben las siguientes observaciones: a)  La media de la distribucin muestral de la media ($7.71) es igual a la media _ de la poblacin: = X . b)  La dispersin de la distribucin muestral de las medias es menor que la dispersin de los valores de poblacin. La media de las muestras vara de $7.00 a $8.50, mientras que los valores de poblacin varan de $7.00 a $9.00. Observe que, conforme se incrementa el tamao de la muestra, se reduce la dispersin de la distribucin muestral de las medias. c)  La forma de la distribucin muestral de la media y la forma de la distribucin de frecuencias de los valores de poblacin son diferentes. La distribucin muestral de las medias tiende a adoptar ms forma de campana y a aproximarse a la distribucin de probabilidad normal.

Distribucin de poblacin
Probabilidad Probabilidad

Distribucin muestral de las medias .40 .30 .20 .10 7 7.5 8 8.5 X 9 X Media de la muestra o ingresos por hora

.40 .30 .20 .10 7 8 9 Ingresos por hora

GRFICA 8.1 Distribucin de los valores de poblacin y distribucin muestral de las medias En resumen, tome todas las posibles muestras aleatorias de una poblacin y calcule un estadstico muestral (la media de los ingresos percibidos) para cada una. Este ejemplo ilustra las importantes relaciones entre la distribucin poblacional y la distribucin muestral de la media: 1.  La media de las medias de las muestras es exactamente igual a la media de la poblacin. 2.  La dispersin de la distribucin muestral de la media es ms estrecha que la distribucin poblacional. 3.  La distribucin muestral de la media suele tener forma de campana y se aproxima a la distribucin de probabilidad normal.

Mtodos de muestreo y teorema del lmite central

273

Dada una distribucin de probabilidad normal o de forma de campana, se aplican los conceptos del captulo 7 para determinar la probabilidad de seleccionar una muestra con una media muestral especca. En la siguiente seccin resalta la importancia del tamao de una muestra en relacin con la distribucin muestral de la media.

Autoevaluacin 8.3

Los tiempos de servicio de los ejecutivos que laboran en Standard Chemicals son los siguientes:

Nombre Seor Snow Seora Tolson Seor Kraft Seora Irwin Seor Jones

Aos 20 22 26 24 28

a)  De acuerdo con la frmula de las combinaciones, cuntas muestras de tamao 2 son posibles? b)  Elabore una lista de todas las muestras posibles de 2 ejecutivos de la poblacin y calcule las medias. c) Organice las medias en una distribucin muestral. d) Compare la media poblacional y la media de las medias de las muestras. e)  Compare la dispersin en la poblacin con la dispersin de la distribucin muestral de la media. f)  A continuacin se muestra una grfica con los valores de la poblacin. Tienen los valores de poblacin una distribucin normal (en forma de campana)? 1

Frecuencia
0

20 22 24 26 28 Tiempo de servicio

g)  Comienza la distribucin muestral de la media que se calcul en el inciso c) a indicar una tendencia a adoptar forma de campana?

Ejercicios
5. Una poblacin consta de los siguientes cuatro valores: 12, 12, 14 y 16. a) Enumere todas las muestras de tamao 2 y calcule la media de cada muestra. b)  Calcule la media de la distribucin muestral de la media y la media de la poblacin. Compare los dos valores. c) Compare la dispersin en la poblacin con la de las medias de las muestras. 6. Una poblacin consta de los siguientes cinco valores: 2, 2, 4, 4 y 8. a) Enumere todas las muestras de tamao 2 y calcule la media de cada muestra. b)  Calcule la media de la distribucin muestral de las medias y la media de la poblacin. Compare los dos valores. c) Compare la dispersin en la poblacin con la de las medias de las muestras. 7. Una poblacin consta de los siguientes cinco valores: 12, 12, 14, 15 y 20. a) Enumere todas las muestras de tamao 3 y calcule la media de cada muestra. b)  Calcule la media de la distribucin muestral de las medias y la media de la poblacin. Compare los dos valores. c) Compare la dispersin en la poblacin con la de las medias de las muestras. 8. Una poblacin consta de los siguientes cinco valores: 0, 0, 1, 3 y 6. a) Enumere todas las muestras de tamao 3 y calcule la media de cada muestra. b)  Calcule la media de la distribucin muestral de las medias y la media de la poblacin. Compare los dos valores. c) Compare la dispersin en la poblacin con la de las medias de las muestras. 9.  En el despacho de abogados Tybo and Associates, hay seis socios. En la siguiente tabla se incluye el nmero de casos que en realidad atendi cada socio en los tribunales durante el mes pasado.

274

Captulo 8

Socio Ruud Wu Sass Flores Wilhelms Schueller

Nmero de casos 3 6 3 3 0 1

a) Cuntas muestras de 3 son posibles? b)  Enumere todas las posibles muestras de 3 y calcule el nmero medio de casos en cada muestra. c)  Compare la media de la distribucin muestral de las medias con la de la media poblacional. d)  En una grca similar a la 8.1, compare la dispersin en la poblacin con la de las medias muestrales. 10.  Hay cinco vendedores en Mid-Motors Ford. Los cinco representantes de ventas y el nmero de automviles que vendieron la semana pasada son los siguientes: epresentantes R de ventas Peter Hankish Connie Stallter Juan Lopez Ted Barnes Peggy Chu Autos vendidos 8 6 4 10 6

a) Cuntas muestras de 2 son posibles? b) Enumere todas las posibles muestras de 2 y calcule la media de casos en cada muestra. c) Compare la media de la distribucin muestral de la media con la de la media poblacional. d)  En una grca similar a la 8.1, compare la dispersin en la poblacin con la de la media de la muestra.

Teorema del lmite central


En esta seccin se estudia el teorema del lmite central. Su aplicacin a la distribucin muestral de medias, en la seccin anterior, permite utilizar la distribucin de probabilidad normal para crear intervalos de conanza para la media poblacional (que se describe en el captulo 9) y llevar a cabo pruebas de hiptesis (descritas en el captulo 10). El teorema del lmite central hace hincapi en que, en el caso de muestras aleatorias grandes, la forma de la distribucin muestral de la media se aproxima a la distribucin de probabilidad normal. La aproximacin es ms exacta en el caso de muestras grandes que en el de muestras pequeas. sta es una de las conclusiones ms tiles de la estadstica. Permite razonar sobre la distribucin de las medias muestrales sin ninguna informacin acerca de la forma de la distribucin de poblacin de la que se toma la muestra. En otras palabras, el teorema del lmite central se cumple en el caso de todas las distribuciones. En seguida aparece el enunciado formal del teorema del lmite central. TEOREMA DEL LMITE CENTRAL Si todas las muestras de un tamao en particular se seleccionan de cualquier poblacin, la distribucin muestral de la media se aproxima a una distribucin normal. Esta aproximacin mejora con muestras ms grandes. Si la poblacin obedece a una distribucin normal, entonces, en el caso de cualquier tamao de muestra, la distribucin muestral de las medias tambin ser de naturaleza normal. Si la distribucin poblacional es simtrica (pero no normal), se ver que la forma normal de la distribucin muestral de las medias se presenta con muestras tan pequeas como 10. Por otra parte, si se comienza con una distribucin sesgada o con colas gruesas, quiz se requieran muestras de 30 o ms para observar la caracterstica de normalidad. Este concepto se resume en la grca 8.2 para diversas formas de

Mtodos de muestreo y teorema del lmite central

275

Poblaciones

Distribuciones muestrales

n=2 _ x

n=2 _ x

n=2 _ x

n=2 _ x

n=6 _ x

n=6 _ x

n=6 _ x

n=6 _ x

n = 30

n = 30

n = 30

n = 30

_ x

_ x

_ x

_ x

GRFICA 8.2 Resultados del teorema del lmite central para diversas poblaciones

poblacin. Observe la convergencia hacia una distribucin normal sin importar la forma de la distribucin de poblacin. La mayora de los especialistas en estadstica consideran que una muestra de 30 o mayor es lo bastante grande para aplicar el teorema del lmite central. La idea de que la distribucin muestral de las medias de una poblacin que no es normal converge hacia la normalidad se ilustra en las grcas 8.3, 8.4 y 8.5. En breve se analiza este ejemplo con ms detalles, pero la grca 8.3 es la grca de una distribucin de probabilidad discreta con sesgo positivo. Hay varias posibles muestras de 5 que puede seleccionar de esta poblacin. Suponga que selecciona al azar 25 muestras de tamao 5 cada una y calcula la media de cada muestra. Estos resultados se muestran en la grca 8.4. Observe que la forma de la distribucin muestral de las medias cambi la forma de la poblacin original aunque slo seleccion 25 de las diversas posibles muestras. En otras palabras, eligi 25 muestras al azar de tamao 5 de una poblacin positivamente sesgada, y encontr que la distribucin muestral de las medias cambi en lo que se reere a la forma de la poblacin. A medida que toma muestras ms grandes, es decir, n = 20 en lugar de n = 5, la distribucin muestral de las medias se aproximar a la distribucin normal. La grca 8.5 muestra los resultados de 25 muestras aleatorias de 20 observaciones cada una tomadas de la misma poblacin. Note la clara tendencia hacia la distribucin de probabilidad normal. sta es la esencia del teorema del lmite central. El siguiente ejemplo pondr de relieve esta condicin.

276

Captulo 8

Ejemplo

Ed Spence dio inicio a su negocio de engranes hace 20 aos. El negocio creci a lo largo del tiempo y ahora cuenta con 40 empleados. Spence Sprockets, Inc., encara algunas decisiones importantes relacionadas con la atencin mdica de sus empleados. Antes de tomar una decisin denitiva sobre el programa de atencin mdica que va a comprar, Ed decide formar un comit de cinco empleados. Se pedir al comit que estudie el tema del cuidado de la salud y haga alguna recomendacin sobre el plan que mejor convenga a los empleados. Ed cree que el punto de vista de los empleados ms recientes en relacin con el cuidado de la salud diere de los empleados con ms experiencia. Si Ed selecciona al azar este comit, qu puede esperar en trminos del promedio de aos que llevan con Spence Sprockets los miembros del comit? Cul es la forma de la distribucin de aos de experiencia de todos los empleados (la poblacin) en comparacin con la forma de la distribucin muestral de las medias? Los tiempos de servicio (redondeados al ao inmediato) de los 40 empleados que actualmente estn en nmina en Spence Sprockers, Inc., son los siguientes:
11 3 7 16 4 4 1 8 18 1 0 9 2 2 2 1 1 2 7 1 2 3 0 2 0 3 4 5 2 19 5 10 2 8 1 2 4 3 14 3

Solucin

La grca 8.3 muestra la distribucin de los aos de experiencia de la poblacin de 40 empleados actuales. La distribucin de tiempos de servicio tiene un sesgo positivo, pues unos cuantos empleados han laborado en Spence Sprockets por un periodo extenso. En especco, seis empleados han laborado en la compaa 10 aos o ms. Sin embargo, como el negocio creci, el nmero de empleados se increment en los ltimos cinco aos. De los 40 empleados, 18 han laborado en la compaa dos aos o menos.
9 8 7 6

Frecuencia

5 4 3 2 1 0 0 5 10 Aos de servicio 15 20

GRFICA 8.3 Tiempo de servicio en Spence Sprockets, Inc., de los empleados Considere el primero de los problemas de Ed Spence. A l le gustara formar un comit de cinco empleados con el objeto de que estudien la cuestin del cuidado de la salud y sugieran el tipo de cobertura de gastos mdicos ms adecuada para la mayora de los trabajadores. Cmo elegira al comit? Si lo selecciona al azar, qu puede esperar respecto del tiempo medio de servicio de quienes forman parte del comit?

Mtodos de muestreo y teorema del lmite central

277

Para comenzar, Ed anota el tiempo de servicio de cada uno de los 40 empleados en papeles y los coloca en una gorra de bisbol. Despus los revuelve y selecciona al azar cinco de ellos. Los tiempos de servicio de estos cinco empleados son: 1, 9, 0, 19 y 14 aos. Por tanto, el tiempo medio de servicio de estos cinco empleados muestreados es de 8.60 aos. Cmo se compara este resultado con la media de la poblacin? En este momento, Ed no conoce la media de la poblacin, aunque el nmero de empleados de la poblacin es de slo 40, as que decide calcular la media del tiempo de servicio de todos sus empleados. sta es de 4.8 aos, que se determina al sumar los tiempos de servicio de todos los empleados y dividir el total entre 40. 11 + 4 + 18 + + 2 + 3 = 4.80 40 _ La diferencia entre la media de la muestra (X ) y la media de la poblacin () recibe el nombre de error de muestreo. En otras palabras, la diferencia de 3.80 aos entre la media poblacional de 4.80 y la media muestral de 8.60 es el error de muestreo. ste se debe al azar. Por consiguiente, si Ed selecciona a estos cinco empleados para formar el comit, el tiempo medio de servicio de stos sera mayor que el de la media de la poblacin. Qu sucedera si Ed colocara de nuevo los papeles en la gorra y tomara otra muestra? Esperara que la media de esta segunda muestra fuera exactamente la misma que la anterior? Suponga que selecciona otra muestra de cinco empleados y encuentra que los tiempos de servicio de esta muestra son de 7, 4, 4, 1 y 3. La media muestral es de 3.80 aos. El resultado de seleccionar 25 muestras de cinco empleados cada una se muestra en la tabla 8.5 y en la grca 8.4. En realidad hay 658 008 posibles muestras de 5 tomas de la poblacin de 40 empleados, las cuales se determinan con la frmula de las combinaciones (5.10) con 40 objetos tomados de 5 en 5. Observe la diferencia de forma de las distribuciones poblacional y mues= TaBlA 8.5 Veinticinco muestras aleatorias de cinco empleados
Muestra de identificacin Datos de la muestra A B C D E F G H I J K L M N O P Q R S T U V W X Y 1 7 8 4 4 1 2 11 9 1 2 0 2 3 1 19 5 5 14 2 3 0 0 4 1 9 4 19 18 2 2 3 2 0 1 0 2 3 7 2 0 1 4 5 1 7 1 3 2 1 0 4 8 2 4 0 2 9 4 1 0 3 1 3 3 1 7 2 2 1 1 5 19 3 2 19 1 2 0 7 3 0 2 2 11 10 2 1 4 1 3 14 3 2 4 2 1 4 4 3 14 3 1 11 18 2 2 4 7 1 2 16 1 3 4 8 9 4 5 7 1 2 2 0 2 Media muestral 8.6 3.8 7.6 7.0 7.0 1.6 1.8 5.6 4.4 3.0 2.8 4.6 1.6 4.0 2.2 6.2 7.2 3.6 5.6 3.0 2.8 1.8 5.6 2.6 1.8

278

Captulo 8

5 4
Frecuencia

3 2 1 0 0 1 2 3 4 5 6 7 Tiempo medio de servicio 8 9

GRFICA 8.4 Histograma de tiempos de servicio medios para 25 muestras de cinco


empleados

tral de medias. La poblacin de tiempos de servicio de los empleados (grca 8.3) tiene un sesgo positivo, y la distribucin de estas 25 medias muestrales no reeja el mismo sesgo positivo. Tambin existe una diferencia en el rango de las medias muestrales en comparacin con el rango de la poblacin. La poblacin vara de 0 a 19 aos, mientras que las medias muestrales varan de 1.6 a 8.6 aos. La tabla 8.6 contiene los resultados de seleccionar 25 muestras de 20 empleados cada una y el clculo de las medias muestrales. Estas medias muestrales aparecen en la grca 8.5. Compare la forma de esta distribucin con la poblacin (grca 8.3) y con la distribucin muestral de medias si la muestra es de n = 5 (grca 8.4). Observe dos importantes caractersticas: TaBlA 8.6 Muestras aleatorias y medias muestrales de 25 muestras de 20 empleados de Spence Sprockets, Inc.
Nmero de muestra Datos de la muestra (tiempo de servicio) A B C D E F G H I J K L M N O P Q R S T U V W X Y 3 2 14 9 18 10 5 3 0 2 7 0 4 3 2 2 3 2 2 0 1 1 8 4 1 8 3 5 2 1 4 7 0 0 7 4 3 1 16 19 18 2 3 14 1 0 9 1 2 2 3 8 0 1 2 4 11 2 18 2 5 10 2 1 2 16 3 1 19 3 1 4 9 0 1 0 2 3 1 2 18 8 0 2 4 3 5 1 2 0 5 11 2 1 3 2 4 19 3 2 2 1 2 4 4 3 11 5 1 1 3 9 7 4 2 2 10 7 19 2 16 2 3 1 0 1 5 14 10 3 3 18 4 7 3 0 2 3 4 2 2 1 4 2 2 1 8 19 16 2 2 3 2 0 11 9 0 8 2 8 1 0 1 1 5 3 4 1 3 2 18 2 1 4 9 14 4 2 16 2 19 0 1 5 3 19 8 4 3 1 1 2 7 1 0 5 1 11 7 2 11 3 2 4 2 0 16 8 3 5 0 1 8 1 3 1 19 9 2 1 5 14 2 3 4 5 1 1 0 2 1 3 2 1 0 2 2 2 2 3 2 0 3 10 0 4 2 2 1 19 4 5 2 11 9 2 11 16 7 2 2 2 14 0 3 1 4 18 1 1 5 3 2 8 19 3 7 2 1 19 4 16 5 2 1 7 8 4 3 2 4 10 1 2 2 1 5 3 18 2 4 1 19 0 4 7 2 1 11 1 2 18 1 5 8 2 3 1 8 3 2 10 3 2 5 2 7 4 3 1 0 8 1 19 0 10 2 3 2 1 2 7 2 2 9 7 4 1 4 2 0 3 4 0 8 2 1 1 1 2 2 16 4 5 2 2 2 11 19 4 1 0 1 3 3 1 11 1 14 1 0 16 9 8 3 2 3 3 7 2 4 1 2 7 10 2 0 5 5 0 1 4 4 5 4 3 2 8 5 2 10 3 1 16 7 2 2 1 2 14 2 3 3 0 19 2 4 2 10 0 4 2 3 1 19 1 2 2 1 3 0 2 8 9 4 8 7 1 7 2 4 3 19 1 3 2 2 16 2 3 1 0 1 11 2 4 3 0 0 2 9 2 8 2 1 16 1 8 3 14 1 4 5 3 2 2 4 2 1 2 3 1 2 7 0 3 11 7 5 18 Media muestral 3.95 3.25 5.95 4.35 5.35 4.00 6.55 4.25 4.00 4.05 4.20 4.05 4.40 4.75 5.10 5.00 5.10 3.65 7.10 3.05 3.25 6.85 5.35 4.30 5.05

Mtodos de muestreo y teorema del lmite central

279

1.  La forma de la distribucin muestral de las medias es diferente a la de la poblacin. En la grca 8.3, la distribucin de empleados tiene un sesgo positivo. No obstante, conforme selecciona muestras aleatorias de la poblacin, cambia la forma de la distribucin muestral de las medias. A medida que incrementa el tamao de la muestra, la distribucin muestral de las medias se aproxima a la distribucin de probabilidad normal. Este hecho se ilustra con el teorema del lmite central.
5 4
Frecuencia

3 2 1 0 2.5 3.5 4.5 5.5 6.5 Tiempo medio de servicio 7.5

GRFICA 8.5 Histograma del tiempo medio de servicio de 25 muestras de 20 empleados 2.  Hay menos dispersin en la distribucin muestral de las medias que en la distribucin de la poblacin. En la poblacin, los periodos de servicio variaron de 0 a 19 aos. Cuando seleccion muestras de tamao 5, las medias de las muestras variaron de 1.6 a 8.6 aos, y cuando seleccion muestras de 20, las medias variaron de 3.05 a 7.10 aos. Tambin puede comparar la media de las medias de la muestra con la media de la poblacin. La media de las 25 muestras de los 20 empleados de la tabla 8.6 es de 4.676 aos. X = 3.95 + 3.25 + + 4.30 + 5.05 = 4.676 25

_ Emplee el smbolo X para identicar la media de la distribucin muestral de las medias. El subndice recuerda que la distribucin se reere a la media muestral. Se lee mu subndice X barra. Observe que la media de las medias muestrales, 4.676 aos, se encuentra muy prxima a la media de la poblacin de 4.80.

Qu concluye de este ejemplo? El teorema del lmite central indica que, sin importar la forma de la distribucin de poblacin, la distribucin muestral de la media se aproximar a la distribucin de probabilidad normal. Cuanto mayor sea el nmero de observaciones en cada muestra, ms evidente ser la convergencia. El ejemplo de Spence Sprockets, Inc., demuestra el mecanismo del teorema del lmite central. Comenz con una poblacin con sesgo positivo (grca 8.3). Despus seleccion 25 muestras aleatorias de 5 observaciones; calcul la media de cada muestra y, por ltimo, organiz las 25 medias de muestra en una grca (grca 8.4). Observ un cambio en la forma de la distribucin muestral de las medias respecto de la propia de la poblacin. El desplazamiento va de una distribucin con sesgo positivo a una que tiene la forma de la distribucin de probabilidad normal. Para aclarar ms los efectos del teorema del lmite central, incremente el nmero de observaciones en cada muestra de 5 a 20. Seleccione 25 muestras de 20 observaciones cada una y calcule la media de cada muestra. Por ltimo, organice estas medias muestrales en una grca (grca 8.5). La forma del histograma de la grca 8.5 se desplaza claramente hacia la distribucin de probabilidad normal.

280

Captulo 8

En el captulo 6, la grca 6.4 muestra diversas distribuciones binomiales con una proporcin de xitos de 0.10, lo cual es otra demostracin del teorema del lmite central. Observe que, conforme n se incrementa de 7 a 12 y de 20 a 40, el perl de las distribuciones de probabilidad se desplaza para acercarse cada vez ms a una distribucin de probabilidad normal. La grca 8.5 de la pgina 279 tambin muestra la convergencia hacia la normalidad conforme n se incrementa. Esto conrma de nuevo el hecho de que, conforme se incluyen ms observaciones de la muestra de cualquier distribucin poblacional, la forma de la distribucin muestral de las medias se aproximar cada vez ms a la distribucin normal. El teorema del lmite central mismo (lea de nuevo la denicin de la pgina 274) no dice nada sobre la dispersin de la distribucin muestral de medias ni sobre la comparacin entre la media de la distribucin muestral de medias y la media de la poblacin. Sin embargo, en el ejemplo de Spence Sprockets hay menor dispersin en la distribucin de la media muestral que en la distribucin de poblacin, lo que indica la diferencia en el rango de la poblacin y en el rango de las medias muestrales. Observe que la media de las medias de las muestras se encuentra cerca de la media de la poblacin. Se puede demostrar que la media de la distribucin muestral es la media poblacional, es decir, _ = , y si la desviacin estndar de la poblacin es , la desviacin estndar de que X _ las medias muestrales _ es /n , en la que n es el nmero de observaciones de cada muestra. Entonces, /n es el error estndar de la media. En realidad, el nombre completo es desviacin estndar de la distribucin muestral de medias. n

ERROR ESTNDAR DE LA MEDIA

X =

[8.1]

Esta seccin permite importantes conclusiones. 1.  La media de la distribucin muestral de las medias ser exactamente igual a la media poblacional si selecciona todas las muestras posibles del mismo tamao de una poblacin dada. Es decir, = X  Aunque no seleccione todas las muestras, es de esperar que la media de la distribucin muestral de medias se aproxime a la media poblacional. 2.  Habr menos dispersin en la distribucin muestral de las medias que en la poblacin. Si la desviacin estndar de la poblacin es , la desviacin estndar de la _ distribucin muestral de medias es /n . Note que, cuando se incrementa el tamao de la muestra, disminuye el error estndar de la media.

Autoevaluacin 8.4

Repase los datos de Spence Sprockets, Inc., de la pgina 276. Seleccione al azar 10 muestras de 5 empleados cada una. Utilice los mtodos descritos en el captulo y la tabla de nmeros aleatorios (apndice B.6) para determinar los empleados por incluir en la muestra. Calcule la media de cada muestra y trace una grfica de las medias muestrales en una grfica similar a la grfica 8.3. Cul es la media de las 10 medias muestrales?

Ejercicios
11.  El apndice B.6 es una tabla de nmeros aleatorios. De ah que cada dgito de 0 a 9 tenga la misma probabilidad de presentarse. a)  Trace una grca que muestre la distribucin de la poblacin. Cul es la media de la poblacin?

Mtodos de muestreo y teorema del lmite central

281

b)  A continuacin aparecen los 10 primeros renglones de cinco dgitos del apndice B.6. Suponga que se trata de 10 muestras aleatorias de cinco valores cada una. Determine la media de cada muestra y trace una grca similar a la grca 8.3. Compare la media de la distribucin muestral de las medias con la media poblacional. 0 9 5 7 6 1 1 8 0 7 2 4 4 7 1 7 3 7 8 8 7 8 9 6 5 1 7 4 9 8 1 7 2 4 4 4 4 5 9 0 1 3 1 0 5 7 8 5 9 4

12.  Scrapper Elevator Company tiene 20 representantes de ventas, que distribuyen su producto en Estados Unidos y Canad. La cantidad de unidades vendidas el mes pasado por cada representante se incluye a continuacin. Suponga que estas cifras representan los valores la poblacin. 2 3 2 3 3 4 2 4 3 2 2 7 3 4 5 3 3 3 3 5

a) Trace una grca que muestre la distribucin de poblacin. b) Calcule la media de la poblacin. c)  Seleccione cinco muestras aleatorias de 5 cada una. Calcule la media de cada muestra. Utilice los mtodos descritos en el captulo y en el apndice B.6 para determinar los elementos que deben incluirse en la muestra. d)  Compare la media de la distribucin muestral de medias con la media poblacional. Esperara que los dos valores fueran aproximadamente iguales? e)  Trace un histograma de las medias muestrales. Nota alguna diferencia en la forma de la distribucin muestral de las medias en comparacin con la forma de la distribucin de poblacin? 13.  Considere que todas las monedas (un centavo, 25 centavos, etc.) que tenga en el bolsillo o monedero constituyen una poblacin. Elabore una tabla de frecuencias, comience por el ao en curso y cuente de manera regresiva, para registrar la antigedad (en aos) de las monedas. Por ejemplo, si el ao en curso es 2006, una moneda que tiene impreso el ao 2004 tiene dos aos de antigedad. a) Trace un histograma u otro tipo de grca que muestre la distribucin de poblacin. b)  Seleccione de manera aleatoria cinco monedas y registre la antigedad media de las monedas seleccionadas. Repita el proceso 20 veces. Ahora trace un histograma u otro tipo de grca que muestre la distribucin muestral de las medias. c) Compare las formas de los dos histogramas. 14.  Considere los dgitos de los nmeros telefnicos en una pgina seleccionada al azar del directorio telefnico local como una poblacin. Elabore una tabla de frecuencias con el ltimo dgito de 30 nmeros telefnicos seleccionados al azar. Por ejemplo, si el nmero telefnico es 5-55-97-04, registre un 4. a)  Trace un histograma u otro tipo de grca que muestre la distribucin de poblacin. Con la distribucin uniforme, calcule la media de la poblacin y la desviacin estndar de la poblacin. b)  Registre, asimismo, la media de la muestra de los ltimos cuatro dgitos (97-04 dara una media de 5). Ahora elabore un histograma u otro tipo de grca que muestre la distribucin muestral de las medias. c) Compare la forma de los dos histogramas.

Uso de la distribucin muestral de las medias


El anlisis anterior reviste importancia, pues la mayora de las decisiones tomadas en los negocios tiene como fundamento los resultados de un muestreo. He aqu algunos ejemplos. 1.  Arm and Hammer Company desea cerciorarse de que su detergente para lavandera contiene realmente 100 onzas lquidas, como indica la etiqueta. Los registros de

282

Captulo 8

los procesos de llenado indican que la cantidad media por recipiente es de 100 onzas lquidas y que la desviacin estndar es de 2 onzas lquidas. A las diez de la maana el tcnico de calidad realiza la vericacin de 40 recipientes y encuentra que la cantidad media por recipiente es de 99.8 onzas lquidas. Debe interrumpir el proceso de llenado, o el error de muestreo es razonable? 2. A.C. Nielsen Company proporciona informacin a las empresas que se anuncian en televisin. Las investigaciones anteriores indican que, en promedio, los adultos estadounidenses ven televisin 6.0 horas al da. La desviacin estndar es de 1.5 horas. Para una muestra de 50 adultos que viven en el rea de Greater de Boston, sera razonable seleccionar al azar una muestra y encontrar que en promedio ven un promedio de 6.5 horas al da? 3. Haughton Elevator Company pretende formular especicaciones relacionadas con el nmero de personas que pueden desplazarse en un elevador nuevo de gran capacidad. Suponga que el peso medio de un adulto es de 160 libras, y que la desviacin estndar es de 15 libras. Ahora bien, la distribucin de pesos no sigue una distribucin de probabilidad normal. Tiene un sesgo positivo. Cul es la probabilidad de que, en una muestra de 30 adultos, el peso medio sea de 170 o ms libras? En cada una de estas situaciones hay una poblacin de la cual existe determinada informacin. Se toma una muestra de esta poblacin y se quiere saber si el error de muestreo, es decir, la diferencia entre el parmetro de poblacin y la muestra estadstica, se debe al azar. De acuerdo con los conceptos analizados en la seccin anterior, es posible calcular la probabilidad de que la media de una muestra se encuentre dentro de cierto margen. La distribucin de muestreo seguir la distribucin de probabilidad normal con dos condiciones: 1.  Cuando se sabe que las muestras se toman de poblaciones regidas por la distribucin normal. En este caso, el tamao de la muestra no constituye un factor. 2.  Cuando se desconoce la forma de la distribucin de poblacin o se sabe que no es normal, pero la muestra contiene por lo menos 30 observaciones. En este caso, el teorema del lmite central garantiza que la distribucin muestral de las medias sigue una distribucin normal. Aplique la frmula (7.5) del captulo anterior para convertir cualquier distribucin normal en una distribucin normal estndar. A este hecho tambin se le denomina valor z. As, se emplea la tabla estndar normal del apndice B.1 para determinar la probabilidad de seleccionar una observacin que caer dentro de un intervalo especco. La frmula para determinar un valor z es: z= X

En esta frmula, X es el valor de la variable aleatoria; es la media de la poblacin y es la desviacin estndar de la poblacin. Sin embargo, la mayor parte de las decisiones de negocios se reere a una muestra, _ no a una sola observacin. As, lo importante es la distribucin de X , la media muestral, en lugar de X, el valor de una observacin. ste es el primer cambio en la frmula (7.5). El segundo consiste en emplear el error estndar de la media de n observaciones en _ lugar de la desviacin estndar de la poblacin. Es decir, se usa /n en el denominador en vez de . Por consiguiente, para determinar la probabilidad de una media muestral con rango especicado, primero aplique la frmula para determinar el valor z correspondiente. Despus consulte el apndice B.1 para localizar la probabilidad. _ CLCULO DEL VALOR z DE X CUANDO SE CONOCE LA DESVIACIN ESTNDAR DE LA POBLACIN X / n

z=

[8.2]

Mtodos de muestreo y teorema del lmite central

283

El siguiente ejemplo muestra la aplicacin. El departamento de control de calidad de Cola, Inc., conserva registros sobre la cantidad de bebida de cola en su botella gigante. La cantidad real de bebida en cada botella es de primordial importancia, pero vara en una mnima cantidad de botella en botella. Cola, Inc., no desea llenar botellas con menos lquido del debido, pues tendra problemas en lo que se reere a la conabilidad de la etiqueta. Por otra parte, no puede colocar lquido de ms en las botellas porque regalara bebida, lo cual reducira sus utilidades. Los registros indican que la cantidad de bebida de cola tiene una distribucin de probabilidad normal. La cantidad media por botella es de 31.2 onzas, y la desviacin estndar de la poblacin, de 0.4 onzas. Hoy, a las 8 de la maana, el tcnico de calidad seleccion al azar 16 botellas de la lnea de llenado. La cantidad media de bebida en las botellas es de 31.38 onzas. Es un resultado poco probable? Es probable que el proceso permita colocar demasiada bebida en las botellas? En otras palabras, es poco comn el error de muestreo de 0.18 onzas? Utilice los resultados de la seccin anterior para determinar la probabilidad de seleccionar una muestra de 16 (n) botellas de una poblacin normal con una media de 31.2 () onzas y una desviacin estndar _ de la poblacin de 0.4 () onzas, y encontrar que la media muestral es de 31.38(X ). Aplique la frmula (8.2) para determinar el valor de z. = 1.80 / n 0.4 / 16 _ El numerador de esta _ ecuacin, _ X = 31.38 31.20 = .18, es el error muestral. El denominador, /n = 0.4/16 = 0.1, es el error estndar de la distribucin muestral de la media. As, los valores z expresan el error muestral en unidades estndar; en otras palabras, el error estndar. Despus, calcule la probabilidad de un valor z mayor que 1.80. En el apndice B.1 localice la probabilidad correspondiente a un valor z de 1.80. Este valor es de 0.4641. La probabilidad de un valor z mayor que 1.80 es de 0.0359, que se calcula con la resta 0.5000 0.4641. Qu concluye? No es probable menos de 4% de probabilidad que seleccione una muestra de 16 observaciones de una poblacin normal con una media de 31.2 onzas y una desviacin estndar poblacional de 0.4 onzas, y determine que la media de la muestra es igual o mayor que 31.38 onzas. La conclusin es que en el proceso se vierte demasiada bebida de cola en las botellas. El tcnico de control de calidad debe entrevistarse con el supervisor de produccin para sugerir la reduccin de la cantidad de bebida en cada botella. La informacin se resume en la grca 8.6. z= X = 31.38 31.20

Ejemplo

Solucin

.0359 .4641 31.20 0 31.38 1.80 Onzas ( X ) Valor z

GRFICA 8.6 Distribucin muestral de la cantidad media de bebida de cola


en una botella gigante

284

Captulo 8

Autoevaluacin 8.5

Consulte la informacin relativa a Cola, Inc. Suponga que el tcnico de control de calidad seleccion una muestra de 16 botellas gigantes con un promedio de 31.08 onzas. Qu concluye sobre el proceso de llenado?

Ejercicios
15.  Una poblacin normal tiene una media de 60 y una desviacin estndar de 12. Usted selecciona una muestra aleatoria de 9. Calcule la probabilidad de que la media muestral: a) Sea mayor que 63. b) Sea menor que 56. c) Se encuentre entre 56 y 63. 16.  Una poblacin normal posee una media de 75 y una desviacin estndar de 5. Usted selecciona una muestra de 40. Calcule la probabilidad de que la media muestral: a) Sea menor que 74. b) Se encuentre entre 74 y 76. c) Se encuentre entre 76 y 77. d) Sea mayor que 77. 17.  En el sur de California, la renta de un departamento con una recmara tiene una distribucin normal con una media de $2 200 mensuales y una desviacin estndar de $250 mensuales. La distribucin del costo mensual no se rige por la distribucin normal. De hecho, tiene un sesgo positivo. Cul es la probabilidad de seleccionar una muestra de 50 departamentos de una recmara y hallar que la media es de por lo menos $1 950 mensuales? 18.  De acuerdo con un estudio del Internal Revenue Service, los contribuyentes tardan 330 minutos en promedio en preparar, copiar y archivar en un medio electrnico la forma scal 1040. Esta distribucin de tiempos se rige por una distribucin normal, y la desviacin estndar es de 80 minutos. Un organismo de control selecciona una muestra aleatoria de 40 consumidores. a) Cul es el error estndar de la media de este ejemplo? b) Cul es la probabilidad de que la media de la muestra sea mayor que 320 minutos? c)  Cul es la probabilidad de que la media de la muestra se encuentre entre 320 y 350 minutos? d) Cul es la probabilidad de que la media de la muestra sea superior que 350 minutos?

Resumen del captulo


I. Hay muchas razones para realizar el muestreo de una poblacin. A.  Los resultados de una muestra permiten calcular adecuadamente el valor del parmetro poblacional, con lo cual se ahorra tiempo y dinero. B. Entrar en contacto con todos los miembros de la poblacin consume demasiado tiempo. C. Resulta imposible vericar y localizar a todos los miembros de la poblacin. D. El costo de estudiar a todos los elementos de la poblacin resulta prohibitivo. E.  En una prueba con frecuencia se destruye el elemento de la muestra y no se puede regresar a la poblacin. II.  En una muestra sin sesgo, todos los miembros de la poblacin tienen una posibilidad de ser seleccionados para la muestra. Existen diversos mtodos de muestreo de probabilidad. A.  En una muestra aleatoria simple, todos los miembros de la poblacin tienen la misma posibilidad de ser seleccionados para la muestra. B.  En una muestra sistemtica, se selecciona un punto de partida aleatorio y despus se selecciona cada k-simo elemento subsiguiente de la poblacin para formar la muestra. C.  En una muestra estraticada, la poblacin se divide en varios grupos, a los que se denomina estratos, y enseguida se selecciona una muestra aleatoria de cada estrato. D.  En el muestreo por conglomerados, la poblacin se divide en unidades primarias; despus se toman las muestras de las unidades primarias.

Mtodos de muestreo y teorema del lmite central

285

III.  El error de muestreo es la diferencia entre un parmetro poblacional y un estadstico de la muestra. IV.  La distribucin muestral de las medias es una distribucin de probabilidad de todas las posibles medias muestrales del mismo tamao de muestra. A.  Para un tamao de muestra dado, la media de todas las posibles medias muestrales tomadas de una poblacin es igual a la media de la poblacin. B.  Existe una menor variacin en la distribucin de las medias muestrales que en la distribucin de la poblacin. C.  El error estndar de la media mide la variacin de la distribucin muestral de las medias. El error estndar se calcula de la siguiente manera: X = n [8.1]

D.  Si la poblacin se rige por una distribucin normal, la distribucin muestral de las medias tambin se regir por la distribucin normal para muestras de cualquier tamao. Suponga que conoce la desviacin estndar de la poblacin. Para determinar la probabilidad de que una media muestral caiga dentro de determinada regin, se aplica la frmula z= X / n [8.2]

Clave de pronunciacin
SMBOLO
_ X _ X

SIGNIFICADO Media de la distribucin muestral de las medias Error estndar de la poblacin de las medias de las muestras

PRONUNCIACIN mu subndice X barra sigma subndice X barra

Ejercicios del captulo


19.  Las tiendas de venta al menudeo en el centro comercial de North Towne Square son las siguientes:

00 01 02 03 04 05 06 07 08

Elder-Beerman Sears Deb Shop Fredericks of Hollywood Petries Easy Dreams Summit Stationers E. B. Brown Opticians Kay-Bee Toy & Hobby

09 10 11 12 13 14 15 16 17

Lion Store Bootleggers Formal Man Leather Ltd. B Dalton Bookseller Pats Hallmark Things Remembered Pearle Vision Express Dollar Tree

18 19 20 21 22 23 24

County Seat Kid Mart Lerner Coach House Gifts Spencer Gifts CPI Photo Finish Regis Hairstylists

a)  Si selecciona los nmeros aleatorios 11, 65, 86, 62, 06, 10, 12, 77 y 04, con qu tiendas es necesario ponerse en contacto para realizar una encuesta? b) Seleccione una muestra aleatoria de cuatro tiendas. Utilice el apndice B.6. c)  Debe aplicar un procedimiento de muestreo sistemtico. Es necesario ponerse en contacto con la primera tienda y a continuacin con cada tercer establecimiento. Con qu tiendas entrar en contacto? 20.  Medical Mutual Insurance investiga el costo de una visita de rutina a consultorios de mdicos familiares en el rea de Rochester, Nueva York. La siguiente constituye una lista de mdicos familiares de la regin. Se seleccionar a los mdicos de forma aleatoria y se establecer comunicacin con ellos para conocer el monto de sus honorarios. Los 39 mdicos se codicaron del 00 al 38. Tambin se indica si cuentan con consultorio propio (P), si tienen un socio (S) o si tiene un consultorio en grupo (G).

286

Captulo 8

Nmero Mdico 00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 R. E. Scherbarth, M.D. Crystal R. Goveia, M.D. Mark D. Hillard, M.D. Jeanine S. Huttner, M.D. Francis Aona, M.D. Janet Arrowsmith, M.D. David DeFrance, M.D. Judith Furlong, M.D. Leslie Jackson, M.D. Paul Langenkamp, M.D. Philip Lepkowski, M.D. Wendy Martin, M.D. Denny Mauricio, M.D. Hasmukh Parmar, M.D. Ricardo Pena, M.D. David Reames, M.D. Ronald Reynolds, M.D. Mark Steinmetz, M.D. Geza Torok, M.D. Mark Young, M.D.

Tipo de consultorio Nmero Mdico P S S S S S P P G P P P S S S S G G P S 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 Gregory Yost, M.D. J. Christian Zona, M.D. Larry Johnson, M.D. Sanford Kimmel, M.D. Harry Mayhew, M.D. Leroy Rodgers, M.D. Thomas Tafelski, M.D. Mark Zilkoski, M.D. Ken Bertka, M.D. Mark DeMichiei, M.D. John Eggert, M.D. Jeanne Fiorito, M.D. Michael Fitzpatrick, M.D. Charles Holt, D.O. Richard Koby, M.D. John Meier, M.D. Douglas Smucker, M.D. David Weldy, M.D. Cheryl Zaborowski, M.D.

Tipo de consultorio S S S S P P P G G G S S S S S S P S S

a)  Los nmeros aleatorios que se obtuvieron del apndice B.6 son 31, 94, 43, 36, 03, 24, 17 y 09. Con qu mdicos se debe establecer comunicacin? b) Seleccione una muestra aleatoria con los nmeros aleatorios del apndice B.6. c)  Una muestra incluir a cada quinto mdico. El nmero 04 se selecciona como punto de partida. Con qu mdicos se debe establecer contacto? d)  Una muestra constar de dos mdicos con consultorio propio (P), dos que tienen socios (S) y uno con consultorio en grupo (G). Seleccione la muestra correspondiente. Explique su procedimiento. 21.  Qu es el error de muestreo? Puede ser cero el valor de una muestra? De ser cero, qu signicara? 22. Seale las razones del muestreo. Proporcione un ejemplo de cada una. 23.  El fabricante de eMachines, que manufactura una computadora econmica, recin concluy el diseo de un nuevo modelo de computadora porttil. A los altos ejecutivos de eMachines les gustara obtener ayuda para poner precio a la nueva computadora porttil. Se solicitaron los servicios de empresas de investigacin de mercados y se les pidi que prepararan una estrategia de precios. Marketing-Gets-Results prob las nuevas computadoras porttiles de eMachines con 50 consumidores elegidos al azar, quienes indicaron que tenan planes de adquirir la computadora el ao entrante. La segunda empresa de investigacin de mercados, llamada Marketing-Reaps-Prots, prob en el mercado la nueva computadora porttil de eMachines con 200 actuales propietarios de una computadora porttil. Cul de las pruebas de las empresas de investigacin de mercados resulta la ms til? Explique las razones. 24. Responda las siguientes preguntas en uno o dos enunciados bien construidos. a) Qu sucede con el error estndar de la media si aumenta el tamao de la muestra? b)  Qu sucede con la distribucin muestral de las medias si aumenta el tamao de la muestra? c)  Cuando se utiliza la distribucin de las medias muestrales para aproximar la media poblacional, cul es el benecio de utilizar tamaos muestrales ms grandes? 25.  Hay 25 moteles en Goshen, Indiana. El nmero de habitaciones en cada motel es el siguiente: 90 72 75 60 75 72 84 72 88 74 105 115 68 74 80 64 104 82 48 58 60 80 48 58 100 a)  De acuerdo con la tabla de nmeros aleatorios (apndice B.6), seleccione una muestra aleatoria de cinco moteles de esta poblacin. b)  Obtenga una muestra sistemtica seleccionando un punto de partida aleatorio entre los primeros cinco moteles y despus haga una seleccin cada quinto motel. c)  Suponga que los ltimos cinco moteles son de tarifas rebajadas. Describa la forma en que seleccionara una muestra aleatoria de tres moteles normales y dos de tarifas rebajadas.

Mtodos de muestreo y teorema del lmite central

287

26.  Como parte de su programa de servicio al cliente, United Airlines seleccion de forma aleatoria a 10 pasajeros del vuelo de hoy que parte de Chicago a Tampa a las nueve de la maana. A cada pasajero de la muestra se le har una entrevista a fondo en relacin con las instalaciones, servicios, alimentos, etc., en los aeropuertos. Para identicar la muestra, a cada pasajero se le proporcion un nmero al abordar la nave. Los nmeros comenzaron por 001 y terminaron en 250. a) Seleccione al azar 10 nmeros con ayuda del apndice B.6. b)  La muestra de 10 pudo seleccionarse con una muestra sistemtica. Elija el primer nmero con ayuda del apndice B.6 y, despus, mencione los nmeros con los que se entrevistar. c) Evale ambos mtodos sealando las ventajas y posibles desventajas. d) De qu otra forma se puede seleccionar una muestra aleatoria de los 250 pasajeros? 27.  Suponga que el profesor de estadstica le aplic seis exmenes durante el semestre. Usted obtuvo las siguientes calicaciones (porcentaje corregido): 79, 64, 84, 82, 92 y 77. En lugar de promediar las seis calicaciones, el profesor le indic que escogera dos al azar y calculara el porcentaje nal con base en dos porcentajes. a) Cuntas muestras de dos calicaciones se pueden tomar? b) Enumere todas las posibles muestras de tamao dos y calcule la media de cada una. c) Calcule la media de las medias de la muestra y comprela con la media de la poblacin. d)  Si usted fuera estudiante, le gustara este sistema? Sera diferente el resultado si se eliminara la calicacin ms baja? Redacte un breve informe. 28.  En la ocina del First National Bank, ubicada en el centro de la ciudad, hay cinco cajeros automticos. La semana pasada cada uno de los cajeros incurri en el siguiente nmero de errores: 2, 3, 5, 3 y 5. a) Cuntas muestras de dos cajeros se pueden seleccionar? b)  Escriba todas las posibles muestras de tamao 2 y calcule la media de cada una. c)  Calcule la media de las medias de las muestras y comprela con la media de la poblacin. 29.  El departamento de control de calidad tiene como empleados a cinco tcnicos en el turno matutino. A continuacin aparece el nmero de veces que cada tcnico indic al supervisor de produccin que interrumpiera el proceso durante la ltima semana. Tcnico Taylor Hurley Gupta Rousche Huang Interrupciones 4 3 5 3 2

a) Cuntas muestras de dos tcnicos se forman con esta poblacin? b)  Enumere todas las muestras de dos observaciones que se pueden tomar y calcule la media de cada muestra. c) Compare la media de las medias de las muestras con la media de la poblacin. d)  Compare la forma de la distribucin de la poblacin con la forma de la distribucin muestral de las medias. 30. T  he Appliance Center cuenta con seis representantes de ventas en su sucursal del norte de Jacksonville. A continuacin aparece el nmero de refrigeradores vendidos por cada representante el ltimo mes. Representante de ventas Zina Craft Woon Junge Ernie DeBrul Jan Niles Molly Camp Rachel Myak Refrigeradores vendidos 54 50 52 48 50 52

a) Cuntas muestras de tamao 2 se pueden tomar? b)  Seleccione todas las muestras posibles de tamao 2 y calcule la cantidad media de refrigeradores vendidos. c) Organice las medias de las muestras en una distribucin de frecuencias. d) Cul es la media de la poblacin? Cul es la media de las medias de la muestra? e) Cul es la forma de la distribucin de poblacin? f) Cul es la forma de la distribucin muestral de la media?

288

Captulo 8

31.  Mattel Corporation produce autos de control remoto que funcionan con bateras AA. La vida media de las bateras para este producto es de 35.0 horas. La distribucin de las vidas de las bateras se aproxima a una distribucin de probabilidad normal con una desviacin estndar de 5.5 horas. Como parte de su programa, Sony prueba muestras de 25 bateras. a) Qu se puede decir sobre la forma de la distribucin muestral de la media? b) Cul es el error estndar de la distribucin muestral de la media? c) Qu proporcin de las muestras tendr una media de vida til de ms de 36 horas? d) Qu proporcin de la muestra tendr una media de vida til mayor que 34.5 horas? e) Qu proporcin de la muestra tendr una media de vida til entre 34.5 y 36 horas? 32.  CRA CDs, Inc., desea que las extensiones medias de los cortes de un CD sean de 135 segundos (2 minutos y 15 segundos). Esto permitir a los disc jockeys contar con tiempo de sobra para comerciales entre cada segmento de 10 minutos. Suponga que la distribucin de la extensin de los cortes sigue una distribucin normal con una desviacin estndar de la poblacin de 8 segundos, y tambin que selecciona una muestra de 16 cortes de varios CD vendidos por CRA CDs, Inc. a) Qu puede decir sobre la forma de la distribucin muestral de la media? b) Cul es el error estndar de la media? c) Qu porcentaje de las medias muestrales ser superior a 140 segundos? d) Qu porcentaje de las medias muestrales ser superior a 128 segundos? e) Qu porcentaje de las medias muestrales ser superior a 128 segundos e inferior a 140? 33.  Estudios recientes indican que la mujer comn de 50 aos de edad gasta $350 anuales en productos de cuidado personal. La distribucin de las sumas que se gastan se rige por una distribucin normal con una desviacin estndar de $45 anuales. Se selecciona una muestra aleatoria de 40 mujeres. La cantidad media que gasta dicha muestra es de $335. Cul es la probabilidad de hallar una media muestral igual o superior a la de la poblacin indicada? 34.  La informacin del American Institute of Insurance indica que la cantidad media de seguros de vida por familia en Estados Unidos asciende a $110 000. Esta distribucin sigue la distribucin normal con una desviacin estndar de $40 000. a) Si selecciona una muestra aleatoria de 50 familias, cul es el error estndar de la media? b) Cul es la forma que se espera que tenga la distribucin muestral de la media? c)  Cul es la probabilidad de seleccionar una muestra con una media de por lo menos $112 000? d)  Cul es la probabilidad de seleccionar una muestra con una media de ms de $100 000? e)  Determine la probabilidad de seleccionar una muestra con una media de ms de $100 000 e inferior a $112 000. 35.  La edad media a la que los hombres se casan en Estados Unidos por primera vez se rige por la distribucin normal con una media de 24.8 aos. La desviacin estndar de la distribucin es de 2.5 aos. En el caso de una muestra aleatoria de 60 hombres, cul es la probabilidad de que la edad a la que se casaran por primera vez sea menor de 25.1 aos? 36.  Un estudio reciente llevado a cabo por la Greater Los Angeles Taxi Drivers Association mostr que la tarifa media por servicio de Hermosa Beach al aeropuerto internacional de Los ngeles es de $18.00, y la desviacin estndar, de $3.50. Seleccione una muestra de 15 tarifas. a)  Cul es la probabilidad de que la media de la muestra se encuentre entre $17.00 y $20.00? b) Qu debe suponer para llevar a cabo el clculo anterior? 37.  Crosset Trucking Company arma que el peso medio de sus camiones cuando se encuentran completamente cargados es de 6 000 libras, y la desviacin estndar, de 150 libras. Suponga que la poblacin se rige por la distribucin normal. Se seleccionan al azar 40 camiones y se pesan. Dentro de qu lmites se presentar 95% de las medias de la muestra? 38.  La cantidad media de abarrotes que compra cada cliente en Churchill Grocery Store es de $23.50, con una desviacin estndar de $5.00. Suponga que la distribucin de cantidades compradas sigue la distribucin normal. En el caso de una muestra de 50 clientes, conteste las siguientes preguntas. a) Cul es la probabilidad de que la media de la muestra sea de por lo menos $25.00? b)  Cul es la probabilidad de que la media de la muestra sea superior a $22.50 e inferior a $25.00? c) Dentro de qu lmites se presentar 90% de las medias muestrales? 39.  La calicacin media SAT para estudiantes atletas de la Divisin I es de 947, con una desviacin estndar de 205. Si selecciona una muestra aleatoria de 60 estudiantes, cul es la probabilidad de que la media se encuentre por debajo de 900? 40. Suponga que lanza un dado dos veces. a) Cuntas muestras se pueden seleccionar? b) Enumere cada una de las posibles muestras y calcule la media. c)  En una grca similar a la 8.1, compare la distribucin de las medias muestrales con la distribucin de la poblacin. d) Calcule la media y la desviacin estndar de cada distribucin y comprelas.

Mtodos de muestreo y teorema del lmite central

289

41.  La siguiente tabla contiene los ingresos personales per cpita de cada uno de los 50 estados en 2004. Nmero 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 Estado Alabama Alaska Arizona Arkansas California Colorado Connecticut Delaware Florida Georgia Hawaii Idaho Illinois Indiana Iowa Kansas Kentucky Louisiana Maine Maryland Massachusetts Michigan Minnesota Mississippi Missouri 2004 $27 795 34 454 28 442 25 725 35 019 36 063 45 398 35 861 31 455 30 051 32 160 27 098 34 351 30 094 30 560 30 811 27 709 27 581 30 566 39 247 41 801 31 954 35 861 24 650 30 608 Nmero 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 Estado 2004

Montana $26 857 Nebraska 31 339 Nevada 33 405 New Hampshire 37 040 New Jersey 41 332 New Mexico 26 191 New York 38 228 North Carolina 29 246 North Dakota 31 398 Ohio 31 322 Oklahoma 28 089 Oregon 29 971 Pennsylvania 33 348 Rhode Island 33 733 South Carolina 27 172 South Dakota 30 856 Tennessee 30 005 Texas 30 222 Utah 26 606 Vermont 32 770 Virginia 35 477 Washington 35 299 West Virginia 25 872 Wisconsin 32 157 Wyoming 34 306

a)  Usted pretende seleccionar una muestra de ocho elementos de la lista. Los nmeros aleatorios seleccionados son 45, 15, 81, 09, 39, 43, 90, 26, 06, 45, 01 y 42. Qu estados se incluyen en la muestra? b)  Usted desea utilizar una muestra sistemtica de cada sexto elemento y elige el dgito 02 como punto de partida. Qu estados se incluyen? 42.  Human Resource Consulting (HRC) lleva a cabo un sondeo con una muestra de 60 empresas con el n de estudiar los costos del cuidado de la salud del cliente. Uno de los elementos que se estudia es el deducible anual que deben pagar los empleados. La Bureau of Labor estatal informa que la media de esta distribucin es de $502, con una desviacin estndar de $100. a) Calcule el error estndar de la media muestral para HRC. b) Cul es la probabilidad de que HRC encuentre una media muestral entre $477 y $527? c) Calcule la probabilidad de que la media muestral oscile entre $492 y $512. d) Cul es la probabilidad de que la media muestral sea superior a $550? 43.  La dcada pasada, el nmero medio de miembros de la Information Systems Security Association, que tenan experiencia en ataques por negacin de servicios cada ao es de 510, con una desviacin estndar de 14.28 ataques. Suponga que nada cambia en este ambiente. a)  Cul es la probabilidad de que este grupo sufra un promedio de ms de 600 ataques los prximos 10 aos? b)  Calcule la probabilidad de que experimenten un promedio de entre 500 y 600 ataques durante los prximos 10 aos. c)  Cul es la probabilidad de que experimenten un promedio de menos de 500 ataques durante los prximos 10 aos? 44.  El Oi