Você está na página 1de 89

r

Universidad Tecnolgica Nacional Facultad Regional Buenos Aires

MAESTRA EN INGENIERA EN CALIDAD 2006

PROBABILIDAD Y ESTADSTICA APLICADA

Docentes:
Lic. Fernando Kornblit Ing. Gustavo Vzquez ferk@inti.gov.ar ogustavovazquez@yahoo.com.ar

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

PROBABILIDAD Y ESTADSTICA APLICADA


Motivacin y Objetivos generales del mdulo
El objetivo central de este curso es presentar los elementos estadsticos bsicos que sern luego utilizados en distintas aplicaciones en Calidad. Cualquier actividad relacionada con la Calidad requiere la utilizacin de datos numricos repetidos. La Estadstica aporta tcnicas para analizar estos datos. Cada vez son ms las decisiones que diariamente deben tomarse en las empresas, a diferentes niveles y, paralelamente, cada vez es mayor la exigencia de que esas decisiones sean correctas. En consecuencia, los responsables deben estar dotados de las herramientas adecuadas capaces de asistirlos en la toma de esas decisiones. Desestimar su uso significa otorgar ventajas considerables. En este contexto, existen diversas herramientas y mtodos estadsticos que ocupan un papel central. El papel de la Estadstica en la calidad industrial ha aumentado y se ha generalizado rpidamente, extendindose su aplicacin, desde situaciones meramente tcnicas, como el control de calidad, hasta otras situaciones de la empresa, incluyendo las vinculadas a la gestin. Algunas de estas situaciones pueden ser: la medicin de la satisfaccin del cliente, la evaluacin de proveedores y materias primas, la aplicacin de criterios racionales en la formulacin de un producto, el control de los procesos, etc.

Objetivos particulares
Para mayor aclaracin, a continuacin especificamos con ms detalle los objetivos generales presentados arriba

Presentar las bases estadsticas de las principales herramientas usadas en la


Calidad.

Dotar a los participantes de

la formacin necesaria para el empleo correcto de estas herramientas, las cuales sern desarrolladas, algunas en este mismo mdulo, y muchas otras en mdulos posteriores de aplicacin, como Confiabilidad, Control Estadstico de Procesos y Diseo de Experimentos

Autor: F. Kornblit

2 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Concebimos

que las citadas herramientas deben poder ser aplicadas no siempre de la misma forma, sino atendiendo a las particularidades concretas de cada empresa, de cada proceso o producto, y de cada situacin. Por lo tanto en necesario que los participantes reciban no slo el conocimiento de las diferentes tcnicas o herramientas, sino tambin la aptitud para adaptarlas. Para esto, se requiere el aprendizaje e incorporacin de criterios y conceptos tericos esenciales de Estadstica y Probabilidad. la correcta y fluida incorporacin de dichos conceptos, recurriremos a una nutrida ejemplificacin y ejercitacin, la cual ser comentada con los docentes

Para

Diferencia con otros cursos de Estadstica y Probabilidad


La aplicacin de una herramienta estadstica a situaciones reales comprende por lo general tres tareas progresivas: a) elegir la tcnica o herramienta adecuada para cada aplicacin, b) aplicarla eficientemente, teniendo en cuenta las particularidades que la situacin requiere c) interpretar correctamente los resultados; Sin embargo, es de notar que, por lo general, la bibliografa y los cursos de capacitacin aluden casi exclusivamente a la segunda de ellas, dejando de lado el abordaje global del problema, sin el cual no es posible sacar provecho de la tcnicas empleadas, ni asegurar que las decisiones consecuentes sean las adecuadas. Intentaremos siempre mostrar este abordaje global. La mayora de las carreras universitarias, no solamente las carreras tcnicas (ingenieras, licenciaturas en ciencias, bioqumica, informtica, ciencias sociales, etc) incluyen en sus currculas algn curso de Probabilidades y Estadstica. Probablemente muchos de los alumnos de esta carrera virtual hayan cursado alguno de estos cursos. La enseanza de la Estadstica en los estudios de grado suele tener una modalidad terica, no siempre vinculada a la resolucin de los problemas concretos. A diferencia de ellos, este no es un curso terico o acadmico. El ttulo de este mdulo es Probabilidad y Estadstica Aplicada, y sealamos particularmente la ltima palabra. Este curso pretende abarcar los diferentes temas desde el punto de vista de su aplicacin en la calidad.

Autor: F. Kornblit

3 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Nos proponemos, en este mdulo, recuperar aquellos temas y tcnicas estudiados, en el contexto de las aplicaciones citadas ms arriba. De esta manera, a la vez que se aprovecha y justifica la formacin previa, se le da un sentido diferente, otorgndole al alumno elementos que suponen una ventaja competitiva en sus actividades profesionales. Trabajaremos, siempre que sea posible, con casos y ejemplos tomados de la experiencia industrial o de servicios, y ser til complementar los contenidos y ejemplos brindados por los docentes con casos provenientes de la experiencia laboral de los alumnos, tanto en comunicaciones por e-mail como en las sesiones de chat.

Metodologa a utilizarse en el mdulo


La metodologa de enseanza de este curso debe ser acorde a los objetivos expuestos ms arriba. Se trabajar con la modalidad de curso-taller. En este marco, entendemos como muy importante la ejercitacin con datos concretos, tomados muchos de ellos de la prctica industrial Se pretende abordar los problemas a partir de la experiencia concreta en el propio mbito de trabajo de los asistentes, estimulando su participacin. Se trabajar dentro de lo posible a partir de la exposicin y resolucin de problemas concretos, que requieran el uso de herramientas estadsticas. Los alumnos intentarn la resolucin de estas situaciones, en forma individual o grupal, para luego evaluar globalmente esa solucin con los docentes. Se discutirn las posibilidades de aplicacin en cada caso. Los docentes aportarn estas situaciones tpicas, a partir de su propia experiencia en empresas de la alimentacin. Sin perjuicio de esto, se alentar tambin a que los participantes aporten casos de su propia actividad, para ser discutidos en clase, intentando la propuesta de soluciones. Previamente al estudio de estos casos, ser necesaria el repaso y/o profundizacin de los conceptos estadsticos vistos en las carreras de grado. Se reducir, en lo posible, la complejidad matemtica asociada a estos conceptos. Se ejercitarn los distintos temas, y habr, a lo largo del mdulo, preguntas y ejercicios para ser respondidos por el alumno USO DEL EXCEL: El Excel ser utilizado en este mdulo para ejemplificar los temas y realizar ejercicios. En el marco de la metodologa desarrollada ms arriba, entendemos como muy importante la ejercitacin con datos concretos, tomados muchos de ellos de la prctica industrial. La eleccin de esta herramienta se fundamenta en el hecho de ser el programa de manejo de datos y clculos ms conocido y utilizado. Adems, contiene las funciones y herramientas estadsticas necesarias para este mdulo.

Autor: F. Kornblit

4 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Por lo tanto, se recomienda fuertemente que los alumnos tengan conocimientos mnimos del uso de Excel (versin 95 o posterior). Muchos de los ejercicios que plantearemos para su resolucin estn pensados para ser resueltos en ese programa. La recomendacin de conocimientos mnimos de Excel significa slo eso: conocimientos mnimos: saber cargar datos en una hoja de clculo, copiar y pegar celdas, y, eventualmente, estar en condiciones de hacer un grfico, con el asistente de grficos, (este cono: ) y no mucho ms que eso. De ninguna manera se requiere tener un nivel de experto. Durante el mdulo, iremos explicando la utilizacin de algunas funciones y herramientas estadsticas particulares TRABAJOS PRCTICOS: Junto con este material se presenta un archivo Excel con 5 ejercicios de Trabajos Prcticos cuya resolucin grupal es obligatoria. Cada uno de estos ejercicios corresponde a un problema prctico en empresas ficticias. Para la resolucin de los mismos se requiere la aplicacin de algunas de las herramientas estadsticas vistas durante el curso. La solucin hallada por el grupo deber elaborarse de forma tal que simule ser un informe para la empresa en cuestin (realizado por un grupo de la misma empresa, o por consultores externos, etc). Estos informes debern contener, al menos, los siguientes 4 puntos: a) Introduccin. Planteo del problema, aspectos a estudiar o mejorar, riesgos involucrados, etc b) Abordaje del problema. Herramientas utilizadas. Breve desarrollo de la metodologa empleada. No es necesario copiar las frmulas matemticas que se utilicen, sino slo el nombre de las herramientas. Se sugiere la utilizacin de la computadora. c) Resultados obtenidos luego de realizar los clculos estadsticos. Resultados numricos, tablas, grficos, deducciones estadsticas que correspondan. d) Conclusiones o decisiones sugeridas, a partir de los resultados. Deben ser redactadas teniendo en cuenta que sern enviadas a personas de la direccin de la empresa sin conocimiento de Estadstica. Este ltimo punto puede entenderse como la traduccin del punto c), a un lenguaje no estadstico EJERCICIOS A RESOLVER: En el Apndice IV se presenta una lista de ejercicios, cuya resolucin por los alumnos es altamente recomendada. Los ejercicios del examen final sern similares a stos. CONDICIONES DE APROBACIN: Para aprobar el mdulo, los alumnos debern tener los trabajos prcticos aprobados (en forma grupal) y, por otro lado, aprobar el examen final, individual que ser tomado la ltima clase.

Autor: F. Kornblit

5 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

CAP: I. INTRODUCCIN Y ESTADSTICA DESCRIPTIVA


Parte 1. LAS 10 PREGUNTAS INICIALES A continuacin, para introducir este mdulo vamos a formular algunas preguntas que pensamos se estarn haciendo ustedes en este momento, y a responderlas 1.Por qu estudiar Estadstica Aplicada en un curso de posgrado en Calidad? 2.Cules son las aplicaciones principales? 3.Cul fue, brevemente, la historia de los mtodos estadsticos en Calidad? 4. Qu es la Estadstica? 5. Cules son los Objetivos de la Estadstica? 6. Cmo se aplican las tcnicas estadsticas? 7.Qu desventaja y que ventaja, en general, tiene la aplicacin de una herramienta estadstica? 8. Cul es el papel de los datos y de qu tipo son? 9.Qu diferencia el contenido de este mdulo del de un curso de Estadstica de una carrera de grado? 10.Dnde aparece la variabilidad y cmo se relacional con los objetivos de estudio planteados? 1.Por qu estudiar Estadstica Aplicada en un curso de posgrado en Calidad? Podramos dar muchas respuestas a esta pregunta, pero preferimos dejar que la norma ISO 9000 responda por nosotros. En el punto 2.10. de ISO 9000.1:2000, Papel de las tcnicas estadsticas , se hace una referencia general a la aplicacin de la Estadstica en la Calidad: El uso de las tcnicas estadsticas puede ser de ayuda para comprender la variabilidad y ayudar por lo tanto a las organizaciones a resolver problemas y a mejorar la eficiencia y la eficacia. Asimismo estas tcnicas facilitan una mayor utilizacin de los datos disponibles para ayudar en la toma de decisiones La variabilidad puede observarse en el comportamiento y en los resultados de muchas actividades, incluso bajo condiciones de aparente estabilidad. Dicha variabilidad puede observarse en las caractersticas medibles de muchos procesos, y su existencia puede detectarse en las diferentes etapas del ciclo de vida de los productos, desde la investigacin de mercado hasta el servicio al cliente y su disposicin final. Las tcnicas estadsticas pueden ayudar a medir, describir, analizar, interpretar y hacer modelos de dicha variabilidad , incluso con

Autor: F. Kornblit

6 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

una cantidad relativamente limitada de datos. El anlisis estadstico de dichos datos puede ayudar a proporcionar un mayor entendimiento de la naturaleza, alcance y causas de la variabilidad, ayudando as a resolver e incluso prevenir los problemas que podran derivarse de dicha variabilidad, y a promover la mejora continua. En el informe estadstico ISO/TR 10017 se proporcionan orientaciones sobre las tcnicas estadsticas en los sistemas de gestin de la calidad El citado documento,ISO/TR 10017:1999(E) Guidance on statistical techniques for ISO 9001:1994, contiene una rpida referencia de las principales tcnicas y herramientas estadsticas para la gestin de la calidad, enfocada segn los criterios de la versin 1994 de la familia de normas, incluyendo las referencias cruzadas entre los distintos requisitos y dichas tcnicas. El mismo debiera ser completado agregando elementos necesarios para la satisfaccin de requisitos adicionales que aparecen en la versin 2000, tales como herramientas para medir de la satisfaccin del cliente o para la mejora continua. DEBATE: Preguntas para el debate: 1Qu entiende por eficiencia y eficacia? 2 Dar ejemplo de caractersticas medibles de los procesos de la empresa en que used trabaja o que usted conoce 3 dar ejemplos de variabilidad de procesos, tanto para procesos productivos como de gestin

2.Cules son las aplicaciones principales? Slo lo que puede medirse puede mejorarse es una de las primeras afirmaciones que debe tener en cuenta quien se introduce en el mundo de la Calidad. A tal fin, la Estadstica puede utilizarse para establecer objetivos, proponer indicadores y evaluar el grado de cumplimiento de los mismos. Las siguientes son algunas de las principales aplicaciones de la Estadstica en la Calidad. Todas ellas sern estudiadas en detalle en el transcurso de los diferentes mdulos de esta carrera virtual. En este mdulo, veremos algunas de estas aplicaciones, pero, al mismo tiempo daremos las bases estadsticas y probabilsticas para que sea posible, posteriormente, encarar los sucesivos mdulos estadsticos.

Autor: F. Kornblit

7 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

a) Estadstica Descriptiva: Tcnicas para describir, sintetizar y presentar datos cuantitativos de la forma adecuada para comprenderlos y analizarlos. Muchas veces, los anlisis descriptivos constituyen el primer paso de un estudio ms global. En este mdulo veremos las herramientas ms comunes b) Inferencia Estadstica: En este mdulo veremos los conceptos principales. Inferir significa obtener informacin sobre una poblacin bajo estudio, a partir de datos observados sobre una muestra extrada de aqulla. Esta informacin, por lo general, lleva implcita la toma de alguna decisin, tanto a nivel gerencial como operativo. La inferencia puede consistir en la estimacin de algn parmetro de la poblacin puntualmente o por un intervalo de confianza- , o en la aceptacin o rechazo de alguna hiptesis sobre la poblacin tests de hiptesis. c) Ensayos de aceptacin por muestreo: El trmino muestreo significa mtodos estadsticos sistemticos para obtener informacin sobre la poblacin, a partir de la inspeccin de muestras relativamente pequeas. El uso de estos mtodos para decidir la aceptacin o rechazo de lotes entregados por proveedores internos o externos, o bien de productos finales, ha sido histricamente la primera aplicacin de la estadstica al Control de Calidad, y an hoy siguen siendo utilizados en el marco de sistemas ms modernos de gestin. d) Control Estadstico de Procesos: En el mdulo del mismo nombre se estudiarn la herramientas asociada a los grficos de control, herramienta muy til y extendida. El Control Estadstico de Procesos (CEP, o SPC, en idioma ingls) es, un conjunto de tcnicas que tienen como objetivo controlar la variabilidad y estabilidad de los procesos, y detectar las posibles desviaciones de los mismos, con el fin de su rpida correccin, antes de que se produzcan unidades defectuosas. En general resulta muy tarde controlar un producto despus de su completa fabricacin. Es preferible controlar el proceso de fabricacin, del producto o de sus componentes. Sern los mismos responsables de la produccin, quienes controlen al mismo tiempo la calidad de la misma. De esta manera, se puede reducir o hasta eliminar la inspeccin final del producto. Los estudios de capacidad de procesos permiten, a su vez, evaluar estadsticamente el cumplimiento de la especificaciones. e) Confiabilidad: Es la aplicacin de mtodos estadsticos e ingenieriles para evaluar la performance de productos a lo largo de su tempo de uso, y predecir por lo tanto su vida til. Los estudios de confiabilidad son necesarios en diferentes etapas de la vida del producto, como por ejemplo el diseo. En el mdulo del mismo nombre sern estudiados estos mtodos.

Autor: F. Kornblit

8 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

f) Anlisis de mediciones: (Anlisis del Sistema de Medicin en el contexto de la industria automotriz).Comprende una serie de procedimientos estadsticos para asegurar la exactitud de las mediciones que puedan afectar a la calidad de los productos o procesos, teniendo en cuenta la variabilidad en las condiciones en que se realizan esas mediciones. Es necesario conocer la incertidumbre de las mediciones y asegurar que la misma es compatible con la capacidad de medicin requerida. En el mdulo Metrologa se estudiarn estos temas. g) Diseo de experimentos: estudios llevados a cabo para evaluar, con cierto nivel de confianza, caractersticas de productos, procesos o sistemas, a partir del conocimiento de la respuesta de los mismos ante la variacin planificada de algunas de sus magnitudes de influencia. En el mdulo Diseo de Experimentos Tecnolgicos se vern con detalles estas metodologas 3.Cmo fue, brevemente, la historia de los mtodos estadsticos en Calidad? Primeramente, la Estadstica se utilizaba en aplicaciones de Control de Calidad, inspeccionando productos terminados o semielaborados de produccin masiva Las primeras tcnicas utilizadas estaban relacionadas con ensayo de productos por muestreo y descarte de no conformes; esto es, se proceda al control del proceso despus de su fabricacin (ver c), en la pregunta anterior.). Surgieron as, distintos criterios y procedimiento para muestreo e inspeccin, basados en modelos estadsticos. Prontamente, estos mtodos comenzaron a volverse excesivamente costosos y poco prcticos, porque impedan la correccin de fallas durante los procesos productivos. En la dcada de 1920 en U.S.A. con los trabajos de Shewhart, de los Laboratorios Telefnicos Bell surge la idea de controlar el proceso, durante la fabricacin. Los mtodos del CEP (ver d) en la pregunta anterior) son difundidos durante la posguerra, en Japn por Deming (discpulo de Shewhart) e Ishikawa, y son muy bien aceptados. A partir de ac las herramientas estadsticas comienzan a tener un rol activo en el aseguramiento y gestin de la calidad. Recin en la dcada del 70 los mtodos del CEP son generalizados en Occidente. Hoy da, los mtodos ms aceptados de gestin de la Calidad, como TQM, o 6 sigma, reconocen como centrales a las herramientas estadsticas. Algunos de los principios de gestin de la ISO 9000:2000, como el de la mejora continua, el de la gestin por procesos, o el del enfoque al cliente llevan implcitos la utilizacin de tcnicas estadsticas. En sntesis, podemos decir que la aplicacin de la Estadstica en la Calidad, evolucion, durante todo el siglo XX, en la misma direccin que la Calidad misma: desde aplicaciones puramente tcnicas y separadas de los procesos productivos, hacia la inclusin en actividades de gestin, con un enfoque ms totalizador.

Autor: F. Kornblit

9 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

4. Qu es la Estadstica? Antes de ver la respuesta a esta pregunta, intente escribirla: .................................................................................................... ...................................................................................................................... .................. ...................................................................................................................... . La Estadstica provee un conjunto de tcnicas que permiten recolectar, procesar, describir, sintetizar o visualizar datos numricos, y obtener informacin a partir de los mismos, con el propsito de tomar decisiones tiles. Estos datos son por lo general recogidos por observacin o medicin, a partir de un universo sometido a estudio o inspeccin. Ese universo objeto de estudio es llamado poblacin. Por ejemplo, si una fbrica de pantalones desea estudiar la cantidad de defectos superficiales de la tela en la produccin de un mes, la poblacin est formada por todos los pantalones producidos ese mes. Si se desea saber con qu frecuencia un horno supera una dada temperatura admisible, la poblacin a todas las posibles operaciones posibles del horno. Si se quiere estudiar el grado de satisfaccin de nuestros clientes con alguno de nuestros productos, la poblacin abarca la totalidad de nuestros clientes (reales o potenciales) En general resulta imposible o impracticable la inspeccin de todos los elementos de una poblacin. Una muestra es un subconjunto de elementos tomados de la poblacin. En los ejemplos anteriores, una muestra est formada por los 80 pantalones que sern inspeccionados buscando defectos, o por 30 repeticiones del proceso de horneado en las que se medir la temperatura mxima, o por 200 clientes que sern sometidos a una encuesta. Al nmero de elementos de la muestra se lo llama tamao de la misma. Notaremos x1,...,xn a una muestra tpica, de tamao n. Se busca que la muestra sea lo ms representativa posible de la poblacin. Si eligiramos por ejemplo los 20 primeros pantalones producidos el primer da del mes, no estaramos haciendo lo correcto estadsticamente, dado que la muestra obtenida no registrara cambios en la produccin posteriores a su obtencin. Se trata de elegir la muestra al azar entre la poblacin, esto es, de forma tal que cada elemento de la poblacin tenga igual chance de ser elegido. 5. Objetivos de la Estadstica: Haciendo una gran simplificacin, podemos decir que la Estadstica persigue alguno de los dos objetivos siguientes:

Autor: F. Kornblit

10 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

1.Expresar resultados numricos en un contexto tal que se puedan interpretar y juzgar, para: 2.Tomar las decisiones correctas, teniendo en cuenta un nivel de confianza o de riesgo adecuado El primero de ellos es evidentemente menos ambicioso que el segundo. Basta con presentar cierta informacin sobre datos observados o medidos, de alguna forma conveniente. Llamamos Estadstica Descriptiva (ver 2a) a esta disciplina. Abriendo cualquier peridico podemos ver informacin estadstica descriptiva sobre distintos temas, en forma de grficos o tablas por ejemplo. En este caso, en rigor, no nos preocupamos demasiado por la representatividad de esos datos que se han descrito, solamente por la forma de describirlos. El segundo de los objetivos implica un estudio ms global que comprende, as como la evaluacin de la representatividad de la muestra observada, el estudio de las caractersticas de la poblacin de la que esa muestra fue extrada, dado que la decisin que se tomar afectar a la totalidad de la poblacin, no solamente a la muestra. Llamamos Inferencia Estadstica a esta disciplina (ver 2b) Dado que la aplicacin de tcnicas de Inferencia Estadstica requiere tener conocimientos previos sobre la poblacin en estudio, se vuelve necesario dominar algunos elementos de la Teora de la probabilidad, que sern dados en este mdulo a partir del Captulo 2. Fundamentalmente, las aplicaciones de la inferencia pueden clasificarse a dos casos. En primer lugar tenemos aquellos en que las caractersticas de la poblacin (parmetros, como por ejemplo el valor medio de un proceso, o la proporcin de unidades falladas) son desconocidas y deben ser estimadas a partir de datos de muestras. Las tcnicas de estimacin y de intervalos de confianza se incluye en esta modalidad. Otras aplicaciones aparecen cuando queremos verificar si alguna suposicin asumida sobre la poblacin es cierta o no. En estos casos aplicamos los llamados tests de hiptesis. De alguna manera, lo que tratamos de hacer ac es dilucidar cundo un fenmeno dado puede deberse o no al azar . Como ejemplo de esto ltimo, supongamos que un fabricante suele comprar ciertos componentes a un proveedor determinado. Este ltimo afirma que el material que vende slo es defectuoso en un 3%; sin embargo, el fabricante no est dispuesto a aceptar a ciegas su palabra, y quiere verificar tal afirmacin, mediante un plan de muestreo. Selecciona al azar 50 componentes y encuentra, entre ellos, 3 defectuosos (6%). Refuta este hecho la afirmacin del proveedor, o no? Esta pregunta podr ser contestada al ver Test de hiptesis ms adelante.

Autor: F. Kornblit

11 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

En este mdulo veremos las bases de la Estadstica Descriptiva e Inferencial, pero muchas de los temas que sern vistos en mdulos futuros tambin pueden ser comprendidos dentro de los esquemas dados ac. 6. Cmo se aplican las tcnicas estadsticas? La aplicacin de la Estadstica a situaciones reales comprende por lo general tres tareas sucesivas: d) elegir la tcnica o herramienta adecuada para cada aplicacin, e) aplicarla eficientemente, teniendo en cuenta las particularidades que la situacin requiere f) interpretar correctamente los resultados; Sin embargo, es de notar que en general la bibliografa y los cursos de capacitacin aluden casi exclusivamente a la segunda de ellas, dejando de lado el abordaje global del problema, sin el cual no es posible sacar provecho de la tcnicas empleadas, ni asegurar que las decisiones consecuentes sean las adecuadas. Intentaremos siempre mostrar este abordaje global. 7. Qu desventaja y que ventaja, en general, tiene la aplicacin de una herramienta estadstica? DESVENTAJA Ningn mtodo estadstico es 100% seguro No estamos libres de riesgos! VENTAJA Estos riesgos pueden ser cuantificados, y los mtodos pueden ser elegidos para que sean razonablemente pequeos

Una respuesta tpica de un problema estadstica puede ser dada, por ejemplo, con un 95% de confianza, o con un 99% de confianza. Al trabajar con datos aleatorios, hay siempre un nivel de riesgo de que las conclusiones no sean correctas. Sin embargo, en tren de asegurar confianza al usuario de la herramienta en cuestin, deberemos elegir la misma con niveles altos de confianza. 8. Cul es el papel de los datos y de qu tipo son? Podemos decir que los datos constituyen la materia prima de la Estadstica. Por eso es que vale la pena detenerse en clasificar los distintos tipos de datos que pueden aparecer, de acuerdo al siguiente diagrama.
NOMINALES (pertenencia) CUALITATIVOS ORDINALES (ranking) MODELO BINOMIAL

Autor: F. Kornblit

12 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

DA TO S

DE ITEMS DEFECTUOSOS DISCRETOS (resultados de conteos) CUANTITATIVOS CONTINUOS (resultados de mediciones)

DE DEFECTOS

MODELO DE POISSON

MODELO NORMAL

(GAUSSIANO) 1. Datos nominales: Indican pertenencia a grupos o clases. Por ejemplo, si hacemos una encuesta sobre el equipo de ftbol preferido de los alumnos, tendramos como resultados datos nominales (por ejemplo, podramos tener: 15 alumnos pertenecientes a Boca Juniors, 12 pertenecientes a River Plate, 8 pertenecientes a Racing, etc) Para su anlisis estadstico, los datos nominales pueden ser convertidos en datos cuantitativos 2. Datos ordinales: Datos que representan un orden de preferencias. Si se le pide a un consumidor que ordene, segn sus preferencias, 5 productos similares de 5 marcas diferentes, tendremos esta situacin. Los datos cualitativos, tanto nominales como ordinales, son tiles en investigaciones de mercado, y mediciones de satisfaccin de los clientes. Sin embargo, en este curso nos concentraremos en el el tratamiento de los datos cuantitativos, por entender que su estudio brinda un enfoque ms general, y porque, si se trabaja con muestras reales, los datos cualitativos pueden tratarse muchas veces con las mismas herramientas, por ejemplo, como datos cuantitativos discretos. 3. Datos discretos. Datos resultantes de contar elementos o eventos. Por ejemplo, nmero de unidades falladas en una muestra bajo inspeccin, o nmero de reclamos de clientes, o nmero de empleados ausentes por da, o nmero de entregas de un producto a trmino. Si bien desde el punto de vista de su estructura matemtica, los datos discretos estn representados por nmeros enteros, podramos reemplazar en los ejemplo anteriores, nmero de... por porcentaje o proporcin de....con lo cual se pierde la condicin de enteros. Para estudiar las caractersticas probabilsticas de los sistemas con datos discretos, utilizamos dos modelos matemticos: el de la Distribucin Binomial para casos como aquellos en los cuentan la cantidad de unidades falladas y el de la Distribucin de Poison para casos como aquellos en los

Autor: F. Kornblit

13 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

que se cuenta la de cantidad de fallas. Los datos discretos aparecen cada vez que se hacen controles o inspecciones por atributos esto es, detectando la presencia o ausencia de una falla u otro atributo no numrico. 4. Por ltimo, los datos continuos son aquellos que pueden tomar cualquier valor numrico, no necesariamente entero. En general, los datos continuos aparecen como resultados de mediciones (fsicas, qumicas, biolgicas, etc). Por ejemplo, dimetros de piezas, temperaturas de procesos, concentraciones de impurezas, caudales de tuberas, etc. Si bien no hay un nico modelo matemtico para caracterizar las propiedades probabilsticas de estos sistemas, el de la Distribucin Normal (o Gaussiana) se aplica en la mayora de los casos.. Los datos continuos aparecen cada vez que se hacen controles o inspecciones por variables esto es, midiendo caractersticas numricas en las muestras bajo ensayo Para el alumno: Intente dar ejemplo de diferentes tipos de datos, en las siguientes situaciones, en una empresa que conoce o donde trabaja: a) Control de los procesos b) Tratamientos de reclamos c) Procesos de anlisis y mejora d) Revisin por la direccin e)Ensayos 9.Qu diferencia el contenido de este mdulo del de un curso de Estadstica de una carrera de grado? La mayora de las carreras universitarias, no solamente las carreras tcnicas (ingenieras, licenciaturas en ciencias, bioqumica, informtica, ciencias sociales, etc) incluyen en sus currculas algn curso de Probabilidades y Estadstica. Probablemente muchos de los alumnos de esta carrera virtual hayan cursado alguno de estos cursos. La enseanza de la Estadstica en los estudios de grado suele tener una modalidad terica, no siempre vinculada a la resolucin de los problemas concretos. A diferencia de ellos, este no es un curso terico o acadmico. El ttulo de este mdulo es Probabilidad y Estadstica Aplicada, y sealamos particularmente la ltima palabra. Este curso pretende abarcar los diferentes temas desde el punto de vista de su aplicacin en la calidad. Nos proponemos, en este mdulo, recuperar aquellos temas y tcnicas estudiados, en el contexto de las aplicaciones citadas ms arriba. De esta manera, a la vez que se aprovecha y justifica la formacin previa, se le da un sentido diferente, otorgndole al alumno elementos que suponen una ventaja competitiva en sus actividades profesionales.

Autor: F. Kornblit

14 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Trabajaremos, siempre que sea posible, con casos y ejemplos tomados de la experiencia industrial o de servicios, y ser til complementar los contenidos y ejemplos brindados por los docentes con casos provenientes de la experiencia laboral de los alumnos. 10 Dnde aparece la variabilidad y cmo se relaciona con los objetivos de estudio planteados? Podemos decir tambin que la Estadstica provee un estudio sistemtico de la variabilidad. Este concepto de variabilidad, que apareca en la ISO 9000 (ver pregunta 1) es central. La variabilidad existe siempre, en todos los procesos, en todos los sistemas, en todas las situaciones consideradas, y su existencia es lo que justifica la introduccin de tcnicas y mtodos estadsticos. En general uno intenta de actuar de forma lo ms consistente posible, obteniendo la menor variacin. Una medida de la calidad de un proceso es la baja dispersin entre sus resultados. Sin embargo, es imposible llegar a una variacin nula. Si consideramos una muestra de 10 productos producidos por un mismo proceso, o de 10 mediciones sobre una misma unidad, los resultados obtenidos no sern ni exactamente iguales al valor deseado, ni tampoco exactamente iguales entre s, por ms esfuerzo que pongamos en ello. Por lo tanto, existir variabilidad. Una forma clsica de representar las causas de esta variabilidad es a travs del diagrama de Ishikawa o de espina de pescado, en el cual se muestran los factores ms usuales que la generan: Mquinas, Mtodos, Mano de Obra, Mediciones, Medio ambiente, Materiales (las 6 M). A su vez, cada una de estas M puede subdividrse en otras causas de variabilidad, llegando a obtener un mapa de la variabilidad de un proceso

Autor: F. Kornblit

15 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Si la variabilidad del resultado est dentro de los lmites esperados, deduciremos que todos los factores estarn controlados. Pero, por el contrario, si la variabilidad del resultado no es la esperada, deberemos investigar cul o cules de ellos estn fallando. Para detectar esto, podemos utilizar la tcnicas del Diseo de Experimentos Otra manera de entender las causas de variabilidad es a travs de sus distribuciones de proabilidad Estas son leyes, o modelos matemticos qu explican de qu manera vara cada uno de estos factores. Ms adelante hablaremos con detalle de las distribuciones de probabilidad, pero por ahora podemos introducir grficamente este concepto en el diagrama de Ishikawa:

Autor: F. Kornblit

16 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

II. ESTADSTICA DESCRIPTIVA Distinguimos dos tcnicas bsicas para describir datos. Por un lado, las tcnicas de clculo de estadsticos o medidas de tendencia, y por otro lado las tcnicas grficas. 1.Estadsticos: Son valores obtenidos por clculo, a partir de los datos muestrales, que sirven para representar las caractersticas bsicas de la muestra. 1.1.Estadsticos de valor medio o tendencia central. Muchas veces se vuelve necesario describir a una muestra (conjunto de datos numricos) de una manera lo ms sinttica posible, representndola a partir de uno nico valores que "resuma" toda la informacin presente en ella. Una medida de valor medio (o tendencia central o posicin) es un estadstico que nos dice la posicin central de los valores de la muestra, respecto de una referencia dada. 1.1.1. Promedio aritmtico: La medida de posicin ms conocida es el promedio o media muestral x=

x
i =1

n El uso del promedio como medida de localizacin est justificado en el hecho de que, al promediar los valores, los "pequeos desvos" que influyen en cada repeticin, se compensan, anulndose mutuamente. Desde el punto de vista de la teora estadstica, el promedio tiene muchas propiedades deseables para caracterizar la posicin o tendencia central de una muestra. Debemos prevenir, sin embargo, la posible presencia de valores anmalos o no consistentes con el resto de la serie (outliers), pues el promedio es muy sensible ante este tipo de irregularidades. Supongamos por ejemplo que tenemos 5 valores: 3,21 3,26 3,18 3,55 3,20

El clculo da 3,28. Si observamos bien los datos, vemos que el cuarto de ellos difiere de los dems, posiblemente por algn error o accidente grosero al que no podemos catalogar de "aleatorio". Esto produce una diferencia significativa con el promedio que se obtendra de los restantes 4 valores, de 3,21. Este ejemplo nos dice que debemos analizar los datos antes de emplear mecnicamente una tcnica estadstica. Clculo del promedio con datos agrupados: Supongamos que se arroj 20 veces un dado, y se obtuvieron los siguientes resultados: 1 1 2 3 2 2 5 1 6 6 6 4 4 4 3 5 5 3 4 1

Autor: F. Kornblit

17 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Calculemos el promedio, ordenndolos de menor a mayor, y haciendo el siguiente desarrollo matemtico:


x= 1+ 2 + 3 + 5 + 6 + 6 + 4 + 3 + 5 + 4 + 1+ 3 + 2 + 1+ 6 + 4 + 4 + 5 + 3 + 1 = = 20 1 4 + 2 2 + 3 .4 + 4 4 + 5 .3 + 6 .3 = = 20 4 2 4 4 3 3 = 1 +2 +3 +4 + 5 +6 = 20 20 20 20 20 20 = 1 fr( 1 ) + 2 fr( 2 ) + 3 fr( 3 ) + 4 fr( 4 ) + 5 fr( 5 ) + 6 fr( 6 ) = = i fr(i) = 3,95

donde fr(1), fr(2), etc representan a las frecuencias relativas de cada resultado, esto es, la cantidad de veces que ocurri cada resultado dividida por la cantidad total de datos:
fr (5) = 3 , 20 fr (6) = 4 nmero de ocurrencias del resultado i ,, fr (i ) = 20 n

1.1.2. Mediana. Otra medida de tendencia central es la mediana de una muestra. Para calcular la mediana se debe ordenar la muestra de menor a mayor; si el tamao de la muestra es impar, la mediana es el valor central de la muestra ordenada. Si es par, el promedio de los dos valores centrales. En el ejemplo anterior ( 3,21 3,26 3,18 3,55 3,20), la mediana es m = 3,21. Eliminando el cuarto valor, la mediana llega a ser m'=(3,20+3,21)/2 = 3,205 . Se observa en el ejemplo una caracterstica de la mediana: su poca sensibilidad ante la presencia de valores anmalos. Observemos que si el cuarto dato, en lugar de 3,55 fuera 1000,55 , la mediana m seguira siendo 3,21 . Entonces, la ventaja de la mediana respecto de la media es, adems de ser ms fcil su clculo, su alta resistencia a modificaciones groseras en los datos. En cambio, es un estadstico menos eficiente que la media dado que utiliza menos informacin de la muestra (solamente el o los valores centrales). Se utiliza la mediana cuando hay una gran probabilidad de que en la muestra haya valores anmalos, o cuando los datos no se distribuyen simtricamente.

Autor: F. Kornblit

18 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Clculos en Excel: Para calcular el promedio y la mediana de una muestra usando las funciones estadsticas del Excel, realice lo siguiente: (Intente con los 5 datos del ejemplo anterior) 1. Ingrese a la hoja de clculo los datos los datos cuyo promedio (o mediana) desea calcular. stos ocuparn un rango de celdas (por ejemplo, si ingresa 5 valores y los ubica desde la primera celda de la hoja y hacia abajo, el rango de celdas ser A1:A5). Luego, site el cursor o el mouse en cualquier otra celda. 2.Haga doble click en el Asistente de Funciones, correspondiente al cono siguiente: 3. En la ventana izquierda, Categora de la funcin busque Estadsticas A continuacin, busque en la ventana de la derecha, Nombre de la funcin, hasta encontrar las funciones promedio (o mediana). Luego cliquee Aceptar 4. Ingrese el rango de celdas de la hoja de clculo donde se encuentran los datos cuyo promedio (o mediana) desea calcular. Puede marcar este rango pintndolo con el mouse en la hoja de clculo. Luego cliquee en Aceptar 5. El resultado aparecer en la celda donde se ubicaba el cursor antes de llamar al asistente de funciones. 6. Una vez que memoriza el nombre de la funcin (en este caso promedio o mediana) no necesita llamar al asistente de funciones cada vez. Puede realizar el clculo tipeando la funcin directamente. Por ejemplo: =promedio(A1:A5) o =mediana(A1;A5) (El smbolo = le indica al Excel que lo que viene a continuacin es una funcin o frmula.)

Ejercicio: En una empresa mediana trabajan 70 personas. Los siguientes datos muestran el salario de los empleados, segn sus categoras: 40 personas ganan $400 15 personas ganan $800 5 personas ganan $1500 5 personas ganan $2000 3 personas ganan $3000 1 persona gana $4000 1 persona gana $5000 Calcular, usando la computadora, el promedio y la mediana de los sueldos del personal. qu conclusiones puede sacar?

Autor: F. Kornblit

19 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Otro ejemplo: Dos proveedores diferentes suministran una materia prima entregada en recipientes de 5l. Se han tomado muestras de 10 recipientes de cada proveedor, analizando qumicamente el contenido de impurezas de cada recipiente, y obteniendo los siguientes valores (por ejemplo, en mg/l) Proveedor 1 0.15 0.17 0.26 0.29 0.22 0.17 0.18 0.27 0.19 0.21 0.30 0.19 0.21 0.18 0.16 Proveedor 2 0.03 0.11 0.14 0.04 0.07 0.12 0.12 0.09 0.07 0.14 0.03 0.12 0.06 0.12 0.05 Ahora, intente calcular, por medio del Excel, los promedios y medianas para ambos proveedores (puede copiar directamente la tabla con los datos al Excel) y verificar que, (redondeando al segundo decimal):
x1 = 0,21 x1 = 0,09 med1 = 0,19 med1 = 0,09

Es evidente que, tanto el promedio como la mediana permiten caracterizar la diferencia entre ambos proveedores. Compare los resultados de este caso con el de los sueldos. Qu conclusiones puede sacar?

1.2. Estadsticos de dispersin. Para caracterizar una muestra, en general no alcanza con dar una medida de tendencia central. Conviene ac introducir otro concepto, el de dispersin de una muestra. Supongamos que tenemos dos muestras correspondientes a productos fabricados con el mismo proceso pero con dos mquinas distintas I y II. Se mide una misma caracterstica de cada uno de los productos y se obtiene Mquina I Mquina II 2,31 2,33 2,33 2,35 2,30 2,36 2,31 2,40 2,32 2,32 2,32 2,31 2,33 2,28 2,31 2,25 2,34 2,23 2,30 2,27

Los promedios obtenidos para ambas muestras son semejantes entre s: 2,32 y 2,31 Sin embargo, un mero anlisis visual nos revela una diferencia: Los valores de la muestra I son ms cercanos entre s que los de la II. Podemos decir que la muestra I est ms concentrada alrededor de su promedio, o que la II tiene ms dispersin, por lo tanto, ser preferible la mquina 1, que producir resultados ms predecibles. Este ejemplo nos muestra la necesidad de introducir estadsticos que nos den una idea de la dispersin de los datos muestrales.

Autor: F. Kornblit

20 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

1.2.1.Rango. La forma ms simple de hacerlo es considerar el rango de los datos. Esto es, la diferencia entre el mayor y el menor de ellos. R = max(x1,...,xn) - min(x1,...,xn) En el ejemplo anterior resultan ser RI = 2,34 - 2,30 = 0,04 RII = 2,40 - 2,23 = 0,17 El rango es un estadstico muy sencillo de calcular, sin embargo, es poco eficiente, dado que no aprovecha bien toda la informacin contenida en la muestra, sino slo sus valores extremos. Por otro lado, y por este mismo motivo, es extremadamente sensible a la presencia de valores anmalos. 1.2.2.Desviacin estndar. Es este el estadstico ms utilizado para medir la dispersin de una muestra. La desviacin estndar muestral s, se calcula como la raz cuadrada del promedio de las desviaciones cuadrticas de cada valor respecto del promedio de la muestra:
s= ( xi - x )2 n-1

La justificacin para la expresin anterior proviene del hecho de que, cuanto ms dispersa sea la muestra, ms lejos de x estarn los datos, y mayor valor tendrn las cantidades (xi- x ) (el uso del cuadrado garantiza que todas ellas sean mayores o iguales que 0), y por lo tanto su promedio ser tambin mayor cuanto ms dispersa sea la muestra (en lugar de dividir por n, se divide por n-1, por razones que veremos ms adelante). La extraccin de la raz compensa la elevacin al cuadrado de las diferencias, de forma tal que el s obtenido sea presentada en la misma escala y con las mismas unidades que los datos originales. La varianza de una muestra es definida como el cuadrado de su desviacin estndar. Ejercicio: Clculo de los estadsticos de dispersin: Calcule el rango y la desviacin standard para las muestras de ambas mquinas de ms arriba, usando las funciones de Excel: No hay una funcin propia para el rango, por lo que se calcula como la diferencia de las funciones max y min La desviacin standard se calcula mediante la funcin desvest Puede veificar que, para los ejemplos de las mquinas, s I= 0,01 y s II = 0,05 (redondeados a dos decimales) Notas: a. Para calcular s con ayuda de una calculadora con funciones estadsticas, se debe usar la tecla n-1

Autor: F. Kornblit

21 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

b. A pesar de la nota anterior, debemos advertir que, no debe confundirse la desviacin standard s aqu definida con la desviacin standard de una poblacin, , la cual estudiaremos ms adelante. 1.3. Estadstico de proporcin. Al analizar una muestra de elementos por atributos (por ejemplo, todo tipo de controles pasa/no pasa) puede ser necesario contar cul es la proporcin de las unidades bajo inspeccin que presentan un atributo determinado (por ejemplo, una falla). Para esto se utiliza la llamada frecuencia relativa del atributo, esto es: f ( atributo ) fr ( atributo ) = n donde f(atributo) es la frecuencia absoluta- del atributo, o sea, la cantidad de unidades ensayadas en que el atributo aparece, y n el tamao de la muestra, o sea, la cantidad total de unidades ensayadas. La frecuencia relativa indica pues la proporcin en que el atributo se encuentra en la muestra. 2. Tcnicas grficas. 2.1.HISTOGRAMAS Para entender la naturaleza de las desviaciones aleatorias, utilizaremos una tcnica estadstica comn, como es el histograma de los datos, que se confecciona de la siguiente manera: a)Se detecta primero el valor mximo y el valor mnimo medidos. A la diferencia entre ambos se la denomina rango de las mediciones. b)El intervalo correspondiente al rango es dividido en un cierto nmero de intervalo de clases dentro de los cuales se agruparn los datos. Se puede utilizar la siguiente frmula aproximada para determinar el nmero de clases: Nmero de clases n donde, como ya dijimos, n es el nmero de mediciones, o tamao de la muestra. c)Una vez fijadas las clases, se clasificarn los valores dentro de las mismas, calculando las frecuencias y/o frecuencias relativas de cada intervalo (el nmero o proporcin de observaciones que caen en en cada intervalo) Es claro que la suma de las frecuencias de todas las clases iguala el nmero total de datos: f(i) = n, y, por lo tanto, que la suma de las frecuencias relativas ser igual a 1:

Autor: F. Kornblit

22 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

fr(i) = 1 d)Se realiza un grfico de barras con las frecuencias (absolutas o relativas) Ejemplo: Supongamos que medimos los dimetros de 20 piezas producidas por un proceso, obteniendo s siguientes valores (en mm): 39,81 40,00 39,92 39,96 39,98 40,04 39,87 39,89 39,90 40,01 39,90 39,85 39,88, 39,88 39,96 39,88 39,90 39,91 39,87 39,99 El siguiente es el histograma correspondiente a las frecuencias relativas. Ejercicio: Dada la siguiente muestra de 70 observaciones, construir varios histogramas, para distintas configuraciones de intervalos (por ejemplo, basados en 5 n=20 intervalos, en 10 intervalos y en 15 intervalos). Luego, elegir la cantidad de 0.2 intervalos que mejor permita representar a los datos.(copiar y pegar)
0.484 0.432 0.514 0.573 0.569 0.600 0.386 0.487 0.562 0.442 0.482 0.480 0 0.577 0.495 0.490 0.472 0.615 0.549 0.640 0.464 0.423 0.454 0.419 0.480 0.498 0.502 0.482 0.629 0.408 0.460 0.539 0.518 0.449 0.487 0.507 0.531 0.508 0.451 0.610 0.527 0.463 0.411 0.403 0.447 0.458 0.390 0.469 0.478 0.507 0.480 0.596 0.415 0.530 0.551 0.612 0.495 0.471 0.538 0.479 0.543 0.368 0.583 0.432 0.464 0.543 0.526 0.550 0.534 0.427 0.440
0.4

Informacin contenida en un histograma El histograma de una serie de observaciones resume toda la informacin estadstica de relevancia. En particular, es apreciable a simple vista el valor medio muestral, como se ve en los histogramas superpuestos siguientes, correspondientes a dos muestras similares pero cuyos valores medios (promedios o medianas, para el caso es lo mismo) estn corridos uno respecto del otro. Las flechas indican donde se posicionan estos valores medios.

Autor: F. Kornblit

23 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

En el grfico siguiente se representan dos histogramas de muestras con el mismo valor medio pero diferente dispersin:

Adems del valor medio y la dispersin, es importante observar la forma de los histogramas (concepto similar a lo que ms adelante llamaremos distribucin. En los tres caso siguientes vemos diferencias de forma. Las barras marrones representan una muestra cuyas frecuencias son ms o menos constantes para todos los intervalos (caso que puede aparecer si tiramos un dado muchas veces, por ejemplo). Las barras celestes, en cambio revelan mayor frecuencia en la zona central, y menores frecuencias al irnos alejarnos del centro, hacia los costados. Adems, este histograma presenta simetra alrededor del valor central. Esto significa que la cantidad de unidades que tengan valores mayores que valor medio (o del valor mximo) ser ms o menos igual a la cantidad de unidades que tengan valores menores. Por ltimo, las barras amarillas presentan un comportamiento no simtrico. Hay mucha mayor frecuencia a la izquierda del intervalo de altura mxima que a la derecha.

En el caso de la serie celeste, decimos que el histograma tiene forma de campana o distribucin normal. Aqu est de vuelta; .

Autor: F. Kornblit

24 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Las propiedades estadsticas de casos como este sern estudiadas con gran detalle ms adelante. Daremos por ahora que, si el histograma es simtrico, la mediana y el promedio muestral toman valores muy similares entre s. El alumno lo puede verificar calculndolos en el ejemplo de los 20 dimetros. Pregunta; si el histograma es asimtrico alargado hacia la izquierda (como la serie amarilla) ser mayor el promedio o la mediana? y si es asimtrico alargado hacia la derecha? Sugerimos volver a chequear el ejemplo de los sueldos de ms arriba, y confeccionar el histograma en ese caso. 2.2.Otras herramientas grficas. Adems de los histogramas, existen muchas otras posibilidades para graficar datos. Algunas de ellas fueron consideadas como herramientas bsicas de la Calidad por Ishikawa, como el grfico de Pareto, el grfico de correlacin y los grficos de control. Estos ltimos sern vistos en detalle en el mdulo de CEP. Ahora veremos los otros dos. 2.2.1.Grfico de Pareto (Pareto, 1848 -1923, economista) Es una representacin grfica de las causas de fallas (sobre un producto, proceso o sistema), y de acuerdo a la importancia de sus efectos, muy til para la toma de decisiones. El grfico muestra claramente cules son las causas que tienen ms influencia. Juran, en los 50s foment su uso en Calidad. El fundamento del grfico de Pareto es que, por lo general, el 20% de las causas son responsables del 80% de los efectos. Es preciso, entonces, fijar prioridades para su correccin.

Autor: F. Kornblit

25 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Se trata de agrupar las fallas registradas por tipos, y ordenar en forma decreciente las proporciones de cada tipo de falla. Esta herramienta ser vista nuevamente en un mdulo posterior, pero decimos ac que puede ser entendida como un histograma para datos por atributos 2.2.2. Grfico de correlacin. Es una representacin grfica de la relacin entre dos variables o caractersticas. A modo de ejemplo, se muestra una muestra de 30 circuitos electrnicos, a los cuales se las ha medico su capacidad elctrica (Y, en pF) y la separacin entre pistas (X,

en m).El grfico de correlacin evidencia que ambas variables estn correlacionas: al aumentar x aumenta y y viceversa. Dado que la capacidad es una caracterstica importante de la performance del producto, esta podr ser controlada en el proceso de elaboracin controlando la separacin entre pistas, lo cual resulta ms sencillo operativamente. La correlacin entre dos variables puede expresarse tambin cuantitativamente a travs del coeficiente de correlacin R, el cual toma valores menores o iguales que 1 (en valor absoluto). Cuanto ms cercano a 1 es R, mayor ser la correlacin

Autor: F. Kornblit

26 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

entra ambas variables. Para el ejemplo anterior, en el grfico puede apreciarse el cuadrado del coeficiente de correlacin entre ambas variables. Trabajo prctico. Ejercicio global de aplicacin Para terminar, y a modo de sntesis de este captulo, proponemos un ejercicio de repaso sobre todos los contenidos de este mdulo. Suponga que usted debe comprar una cierta mercadera, y tres proveedores ofrecen sus productos. Dado que en la empresa no se tienen conocimientos previos para evaluar a los proveedores, se decide analizar una muestra tpica de los productos ofrecidos por cada uno de ellos. A continuacin usted puede ver tres muestras de 50 unidades cada una, correspondientes a cada proveedor. Se pide: x , R , s de cada muestra y comparar. a) Calcular, x , ~ b) En su empresa manejan lmites de especificacin de 46.46 (inferior) y 50.04 (superior). Fuera de estos lmites, los productos deben ser considerados defectuosos. Calcular en cada caso, la proporcin (frecuencia relativa) de productos defectuosos. c) Realizar histogramas para cada muestra, y compararlos. d) En base a todo lo anterior, a qu proveedor propondra comprarle?

Autor: F. Kornblit

27 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Proveedor 1
50.49 50.13 49.99 50.00 50.00 50.13 50.15 49.87 50.05 50.12 50.02 50.13 50.17 50.46 49.83 50.12 50.41 50.17 50.16 49.98 50.02 50.15 50.33 50.21 50.38 50.00 50.11 50.18 50.23 49.98 50.29 50.39 50.13 50.34 50.03 50.18 50.19 50.03 50.13 50.12 49.99 50.25 50.01 50.24 50.11 50.10 50.11

Proveedor 2
49.90 49.68 50.13 50.41 50.27 50.49 50.25 49.70 49.59 50.30 50.18 50.45 49.69 49.97 50.10 49.52 50.28 50.06 49.65 50.40 50.12 50.03 49.61 49.81 50.34 50.00 49.68 49.94 49.98 49.66 49.88 49.95 50.49 50.40 50.35 50.13 50.35 50.08 50.01 49.54 50.42 49.65 50.03 50.25 50.20 49.92 50.45

Proveedor 3
50.42 50.15 50.36 50.20 50.14 50.49 49.50 50.48 50.41 50.48 49.57 50.32 50.49 50.29 50.44 49.99 50.40 50.30 50.43 50.50 49.93 50.42 50.50 50.41 50.20 49.52 50.48 50.49 50.46 49.92 50.14 50.10 50.11 50.40 50.42 50.11 50.44 50.45 50.31 50.06 50.22 49.51 50.06 50.39 50.28 50.50 50.49

50.22 50.38 50.18

50.12 49.66 49.75

50.39 50.11 50.32

Autor: F. Kornblit

28 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Autor: F. Kornblit

29 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

CAP. III INFERENCIA ESTADSTICA Y PROBABILIDAD


Este captulo consta de tres partes. Primeramente, veremos el esquema bsico de la Inferencia Estadstica, luego algunos conceptos relativos a poblaciones y muestras, y por ltimo abordaremos el clculo bsico de probabilidad. Parte 1. EL PROCESO DE LA INFERENCIA ESTADSTICA Hasta ahora trabajamos con datos referidos a muestras numricas. A veces es necesario ir ms all del anlisis de una muestra. Deberemos encarar la relacin entre muestras y poblaciones. Entramos as a la Estadstica Inferencial. El siguiente esquema muestra una interpretacin de lo que podemos llamar el proceso genrico de la inferencia estadstica.

Veremos en detalle las etapas de este proceso: La POBLACIN es la totalidad de las unidades bajo estudio (ISO 3534. Definiciones y trminos estadsticos). En una aplicacin estadstica, lo primero es definir el alcance de la misma, esto es, nuestro objeto de estudio, al cual llamamos poblacin. Por ejemplo, si una fbrica de pantalones desea estudiar la cantidad de defectos superficiales de la tela en la produccin de un mes, la poblacin est formada por todos los pantalones producidos ese mes. Si se desea saber con qu frecuencia, en un cierto proceso, un horno supera una dada temperatura admisible, la poblacin en este caso es algo ms difcil de imaginar, dado que involucra a todas las posibles repeticiones del proceso que se realicen con ese

Autor: F. Kornblit

30 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

horno. En el primer caso la poblacin es finita, mientras que en el segundo diremos que es infinita. MUESTRA En general, por ms que tratemos con poblaciones finitas, resulta imposible o impracticable la inspeccin de todos los elementos de una poblacin. Una muestra es un subconjunto de elementos extrados de la poblacin. En los ejemplos anteriores, una muestra est formada por los 80 pantalones que sern inspeccionados buscando defectos, o por 30 repeticiones del proceso de horneado en las que se medir la temperatura mxima. Al nmero de elementos de la muestra (80 o 30 en los ejemplos) se lo llama tamao de la misma. Notaremos x1,...,xn a una muestra tpica, de tamao n. Nota: Debemos distinguir entre muestra fsica y muestra estadstica. Para un estadstico, una muestra es un conjunto numrico, producto de observaciones o mediciones sobre los elementos fsicos. En el ejemplo de los pantalones, si nos interesa la cantidad de defectos superficiales, en nuestra muestra x1,...,x80 cada xi representa la cantidad de defectos en la i-sima unidad inspeccionada. En cambio, si nos interesara estudiar la resistencia de las costuras, deberamos realizar un ensayo de fuerza en cada unidad, siendo x i la fuerza que debi hacerse para vencer la costura en la i-sima. La misma muestra fsica (80 pantalones) gener 2 muestras estadsticas distintas.

(Sub)proceso de muestreo:

POBLACIN

MUESTRA

El proceso de muestreo debe ser encarado de forma tal que garantice que la muestra sea lo ms representativa posible de la poblacin. Si eligiramos por ejemplo los 20 primeros pantalones producidos el primer da del mes, no estaramos haciendo lo correcto estadsticamente, dado que la muestra obtenida no registrara cambios en la produccin posteriores a su obtencin.Se trata de elegir la muestra al azar entre la poblacin, esto es, de forma tal que cada elemento de la poblacin tenga igual chance de ser elegido. En cada proceso de muestreo se deber prestar atencin a cmo generar muestras representativas, atento a las caractersticas que estemos estudiando. DATOS En la clase anterior vimos con detalle los tipos de datos a utilizar, por lo que no hablremos en detalle aqu. Slo diremos que los datos son resultados de la medicin de la muestra. (Sub)proceso de medicin (inspeccin, ensayo u observacin):

Autor: F. Kornblit

31 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

MUESTRA

D ATOS

Este proceso tiene tambin sus propias reglas. En el caso de medir caractersticas fsicas o qumicas de la muestra, (temperatura del horno en las 30 repeticiones, resistencia de una muestra de piezas metlicas, concentracin de impurezas en 20 tarros de pintura) estas reglas se estudian en el rea de M etrologa (ciencia de las mediciones). En caso de inspeccin u observacin visual, es necesario el adecuado entrenamiento del inspector, etc. (Sub)proceso de inferencia (estimacin o ensayos de hiptesis):

DATOS

POBLACION

Como ya se dijo, inferir significa sacar conclusiones sobre la poblacin, a partir de los datos muestrales. Es necesario adoptar criterios correctos de inferencia, a fin de no sacar conclusiones equivocadas. En sucesivos captulos nos referiremos a esto ltimo Decisin. Por ltimo, recordemos que toda inferencia deriva en alguna toma de decisin sobre la poblacin, y que, si cualquiera de las etapas anteriores ha sido ejecutada en forma incorrecta, se corre el riesgo de que la decisin sea equivocada.

A continuacin, mostraremos algunos ejemplos del proceso general de inferencia estadstica en diversas aplicaciones en Calidad Aplicacin: Aceptacion De Productos Por Ensayo De Muestreo . Se trata de decidir si un lote de mercadera enviada por un proveedor alcanza o no cierta calidad aceptable. En este caso, la poblacin es el Lote completo, del cual se extrae una muestra representativa para inspeccin. La inspeccin permite medir la calidad de la muestra, por ejemplo, mediante el porcentaje de unidades no conformes en la muestra. Finalmente, inferimos sobre la calidad del lote completo. La decisin involucrada es la aceptacin o rechazo del lote. Por ejemplo, si el lote consiste de N = 200 unidades, de las cuales muestreamos n = 50 y en ellas encontramos 3 no conformes (6%), inferimos que aproximadamente el 6% del lote (12 unidades) ser no conforme. Sobre la base de esta informacin tomamos la decisin de aceptar o rechazar.

Autor: F. Kornblit

32 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Aplicacin: Control Estadistico De Procesos. En este caso se trata de determinar si un proceso dado est bajo control, o sea, si funciona dentro o de acuerdo a sus niveles histricos. La poblacin corresponde al proceso entero, a lo largo de un cierto perodo de tiempo. Seleccionamos muestras a tiempos regulares, obteniendo as fotografas instantneas del proceso. Estas muestras son medidas y se calculan algunos estadsticos correspondientes al instante del control, como por ejemplo el promedio o el rango de las unidades de la muestra extrada. Estos valores son introducidos en un grfico de control, verificndose si los mismos quedan dentro de ciertos lmites histricos (lmites de control). Si es as se dice (sed infiere) que el proceso est bajo control. Si no, se infiere que est fuera de control y se toma la decisin de corregir el proceso.

Autor: F. Kornblit

33 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Parmetros Poblacionales Y Muestrales La idea base a transmitir en esta parte es la siguiente:

Existen dos versiones para los principales conceptos o parmetros que se utilizan en la Estadstica: Versin poblacional Versin muestral

Para comenzar a tratar el tema, les pedimos que respondan la siguiente: Cul es la probabilidad de que salga un 4 al tirar un dado?

Esta pregunta tiene, en rigor dos respuestas posibles: 1. Un resultado favorable entre 6, o sea, 1/6. A esta respuesta la podramos llamar respuesta terica o, puesto que se basa en el conocimiento previo de cmo es el dado, y no requiere ninguna experiencia previa (no requiere tirar el dado). Tambin podemos llamarla respuesta poblacional porque, en caso de que el dado sea equilibrado, la sexta parte de todas las (infinitas) tiradas posibles saldrn 4. En general, este tipo de respuestas esta asociado a modelos de la realidad (dado equiibrado) 2. 2.La segunda respuesta posible requiere tirar el dado una cantidad de veces (n veces, lo que correspondera a una muestra de todas las tiradas posibles) y calcular la frecuencia relativa del resultado 4. A esta respuesta la podramos llamar respuesta experimental muestral y requiere siempre la realizacin de una experiencia. El resultado obtenido es ms general que el anterior, pues no es necesaria la suposicin del que el dado est equilibrado para que la respuesta sea correcta. En sntesis, observamos que el conocido concepto de probabilidad, o porcentaje admite las dos versiones mencionadas, la poblacional y la muestral. Si decimos por ejemplo que

el 85% de nuestros clientes estn

Autor: F. Kornblit

34 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

satisfechos con nuestro servicio


y si al decirlo nos referimos a un dato ya conocido sobre la totalidad de clientes o poblacin estamos haciendo referencia a una proporcin poblacional, equivalente a decir que, si elegimos un cliente al azar, la probabilidad de que el mismo est satisfecho es igual a 0,85 (85%). Este tipo de afirmaciones poblacionales suele estar basada en informacin previa, histrica. Sobre la misma poblacin. En cambio, si lo que queremos decir es que, de una muestra de clientes a los cuales se les pregunt su nivel de satisfaccin , el 85% de ellos respondieron satisfactoriamente, hacemos referencia a un porcentaje muestral, que nos puede servir para inferir sobre el nivel de satisfaccin de la poblacin entera, el cual no conocemos. Las afirmaciones de carcter muestral siempre estn basadas en observaciones o mediciones sobre una muestra extrada. Valor medio Vimos en al captulo anterior el concepto de promedio muestral Este concepto tambin tiene una versin poblacional. Suponiendo que fuera posible medir la totalidad de la poblacin y aplicar la misma frmula que para el clculo del promedio muestral con esta totalidad, obtendramos as el promedio o media poblacional, denotado .

x
i=1

donde N es el tamao de la poblacin. En rigor, esta ltima frmula es puramente terica, dado que no es posible conocer la totalidad de la poblacin (la cual a veces se considera infinita: N = ). Sin embargo, la media poblacional suele relacionarse con modelos matemticos de la poblacin, que permiten realizar clculos tericos, o bien relacionarse con valores histricos. Es muy comn, por ejemplo, asumir como a la media histrica de un proceso. Es de esperar que, si la muestra es representativa de la poblacin, el promedio muestral sea numricamente cercano al poblacional, y que esta cercana sea mayor cuanto mayor sea n (tamao muestral): x Esta propiedad, conocida como Ley de los Grandes Nmeros, justifica el hecho de estimar la media poblacional (difcil o imposible de calcular) a partir de la media muestral.

Autor: F. Kornblit

35 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Dispersin De manera similar, si tuviramos la informacin sobre la poblacin entera, y aplicramos las frmulas de la varianza y desviacin standard a estos datos, podramos calcular la varianza y el desvo standard poblacionales, llamados 2 y respectivamente:

=
2

( x i - x ) N

Notas: a) Valen las mismas consideraciones sobre el carcter terico de estas frmulas, que hacamos en el caso del promedio poblacional. b) Observar que el denominador de estas frmulas es N en lugar de por N-1. Dado que N, el tamao de la poblacin, ser siempre un nmero muy grande (a diferencia de n, tamao de la muestra, que puede ser pequeo), la diferencia entre dividir por N y por N-1 ser mnima. c) Se suele confundir, en la prctica y en alguna bibliografa, las notaciones s con , designadas para desvos standard muestrales y poblacionales respectivamente. Nosotros mantendremos esta notacin. Al igual que ocurre con la media, el desvo standard muestral es un estimador del poblacional. s ;s 2 2 Esto de acuerdo a la Ley de los grandes nmeros. Distribuciones de probabilidad Siguiendo los razonamientos anteriores, si tuviramos la informacin de la poblacin entera, podramos imaginar la realizacin de un histograma con todos estos datos. La forma del grfico resultante es llamada distribucin de la poblacin en estudio (o distribucin de probabilidad). La distribucin caracteriza estadsticamente el comportamiento de la poblacin. El histograma obtenido a partir de una muestra se convierte en una aproximacin de la distribucin poblacional, as como la media o la desviacin standard muestral estiman la media o la desviacin standard poblacionales. Esto se puede visualizar en el siguiente grfico, donde se observan histogramas correspondientes a datos continuos.

2 ( x i - x ) N

Autor: F. Kornblit

36 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

En cuanto al grfico anterior, es de destacar que, como el nmero de intervalos aumenta al aumentar n, cada intervalo se va haciendo ms angosto y en el lmite la distribucin queda representada por una curva suave. En cambio, si las variables que graficamos son discretas, la distribucin toma la forma de un grfico de barras, como se ver en el prximo captulo. La distribucin resume toda la informacin estadstica de una poblacin y permite visualizar cmo es su variacin aleatoria. En primer lugar, indica en forma aproximada, donde se concentran la mayor parte de los datos. Algunas distribuciones tienen ms de un grupo de concentracin. Estas se denominan polimodales. En general las distribuciones asociadas con datos de produccin son unimodales, o sea con un slo grupo de concentracin, si el nmero de casos es grande. Las distribuciones polimodales indican falta de homogeneidad en los datos. Por ejemplo productos realizados con dos materias primas diferentes, o con dos mquinas diferentes. No todas las distribuciones relacionadas con procesos industriales son simtricas. Hay muchos casos donde hay simetra hacia la izquierda (asimetra positiva) o hacia la derecha (asimetra negativa). En distribuciones con simetra positiva. la media es mayor que la mediana, mientras que, con simetra negativa, sucede al revs. Ejemplos tpicos de asimetra (positiva) son distribuciones relacionadas con tiempos de vida til de una poblacin de productos fabricados, los que sern estudiados en Confiabilidad

Autor: F. Kornblit

37 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Resumen: En la siguiente tabla se resume lo visto en esta parte sobre caractersticas poblacionales y muestrales: ENFOQUES Caractersticas (parmetros) De proporcin De valor medio De dispersin De forma Basado en poblacional (terico) probabilidad distribucin variables aleatorias muestral (experimental) frecuencia relativa x s histograma observaciones

Parte 3. Clculo bsico de probabilidades Se vuelve necesario, ahora, introducir algunos conceptos de la Teora de la Probabilidad, la cual estudia los fenmenos y experiencias aleatorios. Un experimento aleatorio es aquel cuyo resultado no conocemos, aunque s conocemos el conjunto de todos los posibles resultados que puede llegar a tener. Tal conjunto es llamado espacio muestral, o espacio de eventos. Ejemplos: a) El ejemplo ms simple de experiencia aleatoria es lanzar una moneda al aire y observar de que lado cae. El espacio muestral est formado por los eventos "cara" y "seca". b) Si tiramos un dado, el espacio muestral consiste en los nmeros enteros del 1 al 6. c) Si la experiencia consiste en tirar una moneda la cantidad de veces necesaria hasta obtener cara por primera vez, y contar el nmero de tiradas, los resultados posibles son 1, 2, 3,... En este caso el espacio muestral es infinito, dado que, en teora, cualquier nmero entero positivo podra ocurrir. d) Si la experiencia consiste en conectar una bombita de luz y registrar cunto tiempo pasa hasta que se queme, el espacio muestral consiste en todos los nmeros positivos y el 0. e) De un lote de 10000 neumticos fabricados se extrae una muestra de 30 a los que se les realiza un ensayo de presin, contabilizando el nmero de defectuosos. El espacio muestral consiste en el conjunto de nmeros enteros entre 0 y 30. f) Se cuenta el nmero de roturas o defectos en un largo tramo de tubos de gas. En este caso, nuevamente, cualquier nmero entero positivo ( o 0) puede ser el resultado.

Autor: F. Kornblit

38 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

g) Se mide el dimetro de un cojinete; se sabe que no puede superar 35 mm. El

espacio muestral corresponde al intervalo limitado entre 0 35 mm. h) Se mide la temperatura del agua de un motor, la cual, por consideraciones tcnicas, estamos seguros de que estar entre 60 0C y 95 0C . El espacio muestral consiste en el intervalo [60 0C,95 0C]. i) En general, son experimentos aleatorios todos los procesos que involucran mediciones de magnitudes fsicas, dado que existen errores aleatorios de medicin, que modifican el resultado en forma no del todo predecible. PROBABILIDAD Todos los ejemplos anteriores tienen en comn su aleatoriedad. Si repitiramos cualquiera de ellos varias veces, aunque las condiciones sean idnticas, seguramente los resultados no sern los mismos, sino que variaran dentro de los lmites del espacio muestral en cada caso. Llamamos evento o suceso a un grupo de uno o varios resultados, esto es, a un subconjunto del espacio muestral. Sacar un nmero impar con el dado (ejemplo b), u obtener un dimetro mayor a 30 mm (ejemplo g), son ejemplos de eventos. La probabilidad de un evento es un nmero comprendido entre 0 y 1, relacionado con la chance de ocurrencia de ese evento. En los ejemplos a y b, si el dado o la moneda no estn cargados, cada uno de los resultados tendr igual probabilidad de salir. Diremos en este caso que el espacio muestral es equiprobable. En estos casos es sencillo calcular la probabilidad P de un evento A, como el cociente entre la cantidad de elementos de A y la cantidad de elementos del espacio muestral S:
P ( A) = nmero de elementos en A #A = nmero de elementos en S #S

Por ejemplo, la probabilidad de que, al tirar un dado, ocurra el evento A= {resultado mayor o igual que 5} es P(A)=2/6. La probabilidad de obtener un resultado impar es: P(impar)= 3/6= 0.5 La probabilidad de obtener cara al lanzar la moneda es P(cara)= 1/2 En los otros ejemplos, los espacios muestrales no son equiprobables. En c, por caso, intuitivamente resulta claro que ser ms probable sacar cara por primera vez en la

Autor: F. Kornblit

39 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

primera o segunda tirada, que en la nmero 100 . En tales casos, el clculo de la probabilidad de un evento es algo ms complicado y requiere un modelo matemtico en particular, como veremos ms adelante. Nota: Indistintamente escribiremos la probabilidad como valor numrico entre 0 y 1 o bien como porcentaje entre 0% y 100%. Por ejemplo podemos decir, indistintamente, la probabilidad de que un trabajo sea defectuoso es igual a 0,08 o del 8%. Probabilidad y frecuencia relativa: Como vimos antes, hay una directa relacin entre probabilidad y frecuencia relativa, Si tiramos un dado n veces la frecuencia relativa del resultado "6", por ejemplo, se asemejar a la probabilidad terica de obtener 6, 1/6 . En general, si un dado experimento aleatorio es repetido un nmero grande (n) de veces, y consideramos cualquier evento A, vale que:
fr(a) P(A)

y ms cercanos estarn ambos valores cuanto mayor sea n. En el lmite (si pudisemos repetir la experiencia infinitas veces) diremos que fr(A) "converge" a P(A). Esta es otra consecuencia de la Ley de los Grandes Nmeros, mencionada ms arriba. Repetimos pues que se presentan entonces dos enfoques para el mismo concepto. Si queremos saber cul es la probabilidad de obtener un 6 en el dado por ejemplo, podramos hacer el cociente 1/6 (probabilidad), o bien tirar el dado un nmero grande de veces y dividir la cantidad de veces que sali 6 por la cantidad total de tiradas (frecuencia relativa). Supongamos que lo tiramos 100 veces y obtenemos 10 seis. fr(6)=0.16, mientras que P(6)= 1/6 0.17 En relacin al ejemplo anterior, la probabilidad de que un trabajo sea defectuoso es igual a 0,08 o del 8%. da lugar a las dos lecturas siguientes: Al tomar un trabajo al azar, la probabilidad de que ste sea defectuoso, es igual a 0,08 o el 8% Al tomar una muestra grande de trabajos, aproximadamente el 8% ser defectuoso Como quizs usted ya comprendi, stas son dos maneras diferentes de decir lo mismo.

Autor: F. Kornblit

40 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Otra forma de escribir la frecuencia relativa: En Estadstica, el smbolo ^ significa estimado. As, como la frecuencia relativa del resultado 6 estima a la probabilidad, podemos escribir
= 0,16 p

que se lee probabilidad estimada igual a 0,16 Si, al tirar el dado 100 veces, obtenemo en cambio, una frecuencia relativa fr(6) = 0,1 como este resultado difiere, del valor esperado p = 1/6 = 0,17 habra lugar para dos conclusiones diferentes, si queremos explicar la diferencia entre lo observado y lo esperado: a) podemos suponer que esa diferencia es "aleatoria", esto es, que la frecuencia relativa result baja slo por azar, y que, si repetimos la experiencia ms veces, seguramente obtendramos resultados ms similares al valor esperado b) o podemos suponer que el dado no es equilibrado y por tanto la probabilidad real de seis es menor que 1/6. En tal caso, por ms que repitamos la experiencia muchas veces, no nos acercaramos ms al valor esperado 1/6. Si se nos permite ilustrar este tema con una referencia potica, citamos un texto de Borges:

..el vago azar o las precisas leyes que rigen este sueo, el Universo...

Reflexiones de esta naturaleza, cuando es necesario determinar si determinado fenmeno observado fue causado por el vago azar (comportamiento no atribuible a ninguna causa especfica, o ms simplemente, a causas aleatorias), o ms bien por precisas leyes (comportamiento atribuible a una o ms causas especficas o asignables) se presentan no slo en la poesa sino tambin, y habitualmente, en tareas relacionadas con la calidad.

Autor: F. Kornblit

41 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

A modo de ejemplo, si sabemos que, en un proceso, la masa del 95% de las piezas fabricadas en serie se encuentra entre 100g y 102g, pero luego de un cambio de repuesto en la maquinaria se fabricaron dos piezas ms, pesando 101,9 g y 102,0 g; podemos preguntarnos: si tal resultado, diferente de lo anterior, fue slo por azar, o si el cambio de repuesto produjo alguna modificacin significativa en la maquinaria. . Propiedades De La Probabilidad La probabilidad asigna entonces un nmero a cada evento del espacio muestral, y debe cumplir con las siguientes propiedades, las cuales sern tiles para la resolucin de los ejercicios prximos. a) Para todo evento A, P(A) 0 y P(A) 1 Si un evento tiene probabilidad 0, lo llamaremos "evento imposible", y si tiene probabilidad 1, lo llamaremos "evento seguro". El espacio muestral completo es un evento seguro. (Si tiramos un dado, siempre saldr un nmero entre 1 y 6) b) Frmula del complemento La probabilidad de que A no ocurra es igual a 1 menos la probabilidad de que ocurra P(Ac) = 1- P(A) donde Ac es el complemento de A, esto es, el suceso opuesto. Por ejemplo, el suceso obtener 5 o 6 al tirar el dado es el complemento del suceso obtener ,1 2, 3 o 4 al tirar el dado y por lo tanto P(5 o 6) = 1- P(1, ,2, 3 o 4) 2/6 = 1 - 4/6 c) Frmula de la suma (sucesos excluyentes) Dos eventos se llaman disjuntos o excluyentes cuando no pueden ocurrir ambos al mismo tiempo. Si A y B son excluyentes vale la frmula de la suma: P( A o B ) = P(A) + P(B) o sea, la probabilidad de que ocurra alguno de los dos es la suma de las probabilidades individuales. La probabilidad de obtener {par o 3} en el dado es P(par o 3) = P(par) + P(3) = 3/6 + 1/6 = 4/6

Autor: F. Kornblit

42 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

dado que los eventos {par} y {3} son excluyentes; en cambio no ocurre lo mismo con la probabilidad de obtener {impar o menor que 3} pues el evento {impar o menor que 3} consiste en {1,2,3,5}, siendo su probabilidad igual a 4/6, mientras que P(impar) + P(menor que 3) = 3/6 + 2/6 =5/6. d) Frmula de la suma (en general) Dados dos eventos A y B (no necesariamente excluyentes), la probabilidad de que ocurra alguno de los dos es: P( A o B ) = P(A) + P(B) - P(A y B) es decir, a la frmula anterior hay que restarle la probabilidad de que ocurran al mismo tiempo A y B. (Si los eventos fueran excluyentes, ste ltimo trmino es 0, y volvemos a la formula anterior). De acuerdo a esto la probabilidad de obtener {impar o menor que 3} es: P(impar o menor que 3) = = P(impar) + P(menor que 3) - P(impar y menor que 3)= = P(impar) + P(menor que 3) - P(1)= = 3/6 + 2/6 - 1/6 = = 4/6 Dos eventos se llaman independientes si la ocurrencia de uno no afecta la ocurrencia del otro. Supongamos por ejemplo que tiramos una moneda una sino dos veces. El espacio muestral consiste en los pares (cara,cara), (cara, seca), (seca, cara) y (seca,seca), siendo la primer componente de cada para el resultado de la primera tirada y el segundo, el de la segunda. Los eventos {cara la primera tirada} y {cara la segunda tirada} son independientes, dado que el resultado de la primera no tiene por qu afectar a la segunda. e)Frmula del producto: Dados dos eventos independientes A y B, la probabilidad de que ocurran ambos al mismo tiempo es el producto de las probabilidades individuales: P( A y B) = P(A. P(B) Por ejemplo la probabilidad de sacar cara las dos veces que se tir la moneda es: P(2 caras) = P(cara la primera vez). P(cara la segunda vez) = 2/4 . 2/4 = 1/4.

Autor: F. Kornblit

43 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Atencin!: Es comn confundir eventos excluyentes con independientes, cuando en realidad no es lo mismo; de hecho, si son excluyentes, la ocurrencia del primero impide la del otro y por lo tanto nunca pueden ser independientes). Ejemplos del uso de las propiedades de la probabilidad 1.cul es la probabilidad de que al tirar un dado 4 veces salga a) ningn 6 b) al menos un 6? a) La probabilidad de que no salga ningn 6 puede entenderse como: no sale 6 en la primer tirada y no sale 6 en la segunda tirada y no sale 6 en la tercera tirada y no sale 6 en la cuarta tirada En smbolos: P(ningn 6)= P(no 6 y no 6 y no 6 y no 6) Como las tiradas se consideran independientes (lo que sale en una tirad no influye sobre el resultado de las dems), se puede aplicar la frmula del producto: P(ningn 6)= P(no6). P(no6) . P(no6) . P(no6) = P(no6)4 = (5/6)4 = 0,48 (o 48%) b) Decir que sale al menos un 6 es exactamente lo opuesto de decir ningn 6 (el complemento) y por lo tanto P(al menos un 6) = 1 - P (ningn 6) = 52% En consecuencia, si se tira un dado 4 veces es aproximadamente igual de probable sacar al menos un 6 que no sacar ninguno. 2. La produccin en serie de una placa elctrica tiene un 5% de unidades no conformes. cul es la probabilidad de que, en una muestra de 30 de estas piezas, funcionen todas ellas? P(una pieza funcione) = 0,95 Suponiendo independencia y aplicando la frmula del producto, P(funcionen todas) = P(la 1. pieza funcioe y la 2. pieza funcione y.........y la 30 pieza funcione) = 0,95 . 0,95 . 0,95...... . 0,95== 0,95 30 = 0,21 (o 21%)

Autor: F. Kornblit

44 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

A continuacin, y para cerrar esta parte, le proponemos otros ejercicios para realizar: Autoevaluacin de Probabilidad: 1. En un lote de 200 tornillos hay 30 tornillos defectuosos. cul es la probabilidad de que, al extraer un tornillo al azar, este resulte defectuoso? 2. Al realizar una encuesta a 500 clientes de una empresa de servicios, se observ que 145 de ellos quedaron disconformes con el servicio brindado. Estimar la probabilidad de que un nuevo cliente quede disconforme, si la empresa no toma acciones correctivas. 3. Para estimar la calidad de un proveedor, quien entrega semanalmente lotes de 30 piezas de un producto, se tom nota de la cantidad de piezas defectuosas entregadas en las ltimas 20 semanas: i. 0 1 3 0 1 1 2 1 2 1 ii. 1 2 5 1 0 0 2 3 2 1 En base a esta informacin, cmo estimara el porcentaje de piezas defectuosas para este proveedor? cul es la probabilidad de que, al sacar una carta de un mazo de cartas espaolas, ,se obtenga un As o un Rey? cul es la probabilidad de que, al sacar una carta de un mazo de cartas espaolas, ,se obtenga un As o una espada? Los lmites de especificacin para una pieza son: Inferior 30,2 mm y Superior: 30,8 mm. Si el 0,5% de las piezas producidas cae por debajo del lmite inferior y el 0,8% cae por encima del lmite superior, calcular, usando las propiedades adecuadas de la probabilidad, el porcentaje de piezas aceptables. En la produccin de ciertos envases plsticos por inyeccin, es comn que aparezcan alguna de las siguientes fallas: a)Burbujas, que aparecen en el 6% de los envases b)Fallas de forma en el pico, que aparecen en el 3% de los envases Ambos modos de fallas corresponden a momentos diferentes del proceso, y por lo tanto pueden considerarse independientes entre s. Responder, usando las frmulas de la suma y del producto: cul es el porcentaje de envases no conformes?, y cul es el porcentaje de los envases que presentan ambos modos de fallas? El motor de una heladera industrial consta de 300 componentes individuales. Se considera que la heladera est en buenas condiciones slo cuando sus 300 componentes funcionan. Por otro lado, stos componentes son entregados por diferentes proveedores que garantizan, todos ellos, un nivel de calidad del 99%, o sea, no ms del 1% de los componentes defectuosos en cada caso. a)calcular la probabilidad de que la heladera pueda considerarse en buenas condiciones, usando la frmula del producto

4. 5. 6.

7.

8.

Autor: F. Kornblit

45 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

b)en funcin de lo anterior, cmo evaluara la calidad de los proveedores, como aceptable o insuficiente? c)qu calidad mnima debiera exigirse a los proveedores si se desea que el 95% de las heladeras fabricadas est en condiciones? 9. Una cmara tiene 2 bombas de desage, que funcionan independientemente. La probabilidad de que la primera de descomponga es del 3%, y la probabilidad de que la segunda de descomponga es del 6%. Para disear un plan de contingencia se debe saber cul es la probabilidad de que no funcione ninguna. Calcular esta probabilidad.
10. Paradojas de la probabilidad y de la estadstica. Las 4 afirmaciones siguientes contienen errores en la utilizacin de distintos conceptos probabilsticos o estadsticos. Encontrarlos y rebatir las afirmaciones

a) Dicen que una de cada cinco personas naci en China. Estoy seguro que eso no es posible. Yo tengo como 15 amigos, 20 parientes, Don Tito el carnicero y su familia, la barra del club, y los Gonzlez. Todos juntos son cerca de 80, y ninguno de ellos naci en China b) En un reportaje que le hicieron cuando era presidente de EEUU, en la dcada del 50, Dwight Eisenhower expresa asombro y preocupacin al enterarse que, segn investigaciones, la mitad de los norteamericanos tena una coeficiente intelectual por debajo de la media... [citado por C. Sagan en su ltimo libro]
Si usted fuera Eisenhower, debiera realmente preocuparse?

c) Le dijeron al Sr. Marino que la probabilidad de haya una bomba en un avin es de uno en mil (1/1000). Por lo tanto, haciendo un clculo rpido, concluimos que la probabilidad de que en el mismo avin haya dos bombas es de 1/1000 x 1/1000 = 1/1000000. (uno en un milln). Para viajar ms tranquilo, cada vez que el Sr. Marino viaja en avin lleva una bomba en su equipaje. De esa manera, como la probabilidad de que haya dos es tan baja, l est casi seguro de que no habr otra ms que la que lleva l, que est desactivada. d) CLEMENTE, de Clarn del 4/4/97

Autor: F. Kornblit

46 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Autor: F. Kornblit

47 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Cap. IV. VARIABLES ALEATORIAS Y DISTRIBUCIONES DE PROBABILIDAD


Vimos en el captulo anterior las bases de la Teora de la Probabilidad. Ahora desarrollaremos los conceptos de variables aleatorias, para vincular aquellos elementos con los datos numricos. Una variable aleatoria es un resultado numrico de un experimento aleatorio. Dicho de otro modo, definimos variables aleatorias si asignamos un valor numrico a cada resultado de un experimento aleatorio. Por ejemplo, podemos concebir el trabajo de inspeccionar una muestra de 20 productos, y contar el nmero total de defectuosos entre ellos como un experimento aleatorio, puesto que no podemos saber, a priori, cules unidades sern buenas y cules sern defectuosas. Una variable aleatoria asociada a este experimento aleatorio puede ser el nmero de productos defectuosos encontrados. Dada la propia aleatoriedad del problema, no podemos conocer a priori qu valor numrico tomar esta variable aleatoria, slo podemos asegurar que ese valor estar entre 0 y 20. Nos puede interesar conocer, a priori de la inspeccin, la probabilidad de no encontrar ningn defectuoso, o bien de encontrar slo 1, o bien de encontrar ms de 3, etc. Para responder a estas preguntas, cada variable aleatoria est caracterizada por una distribucin de probabilidad, que asigna un valor de probabilidad a cada resultado posible. En el caso de los ensayos discretos, la distribucin de probabilidad es una funcin que asigna un nmero a cada resultado (su probabilidad). Por ejemplo, la distribucin de probabilidad asociada a la tirada de un dado es la funcin que asigna el valor 1/6 a cada uno de los posibles resultados: resultado x probabilidad p(x) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

Est claro que, como la probabilidad total debe ser siempre igual a 1, debe valer que p(k) = 1 donde p es la distribucin de probabilidad, y la suma se realiza sobre todos los resultados posibles La distribucin de probabilidad cumple un papel similar al del histograma de la distribucin poblacional cuando la poblacin es infinita. Si tiramos un dado un nmero grande de veces y realizamos el histograma correspondiente a los resultados, ste se asemejar al grfico de la distribucin de probabilidad.

Autor: F. Kornblit

48 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

MEDIA Y VARIANZA DE VARIABLES ALEATORIAS Es necesario tambin poder calcular un parmetro de localizacin o tendencia central para una variable aleatoria X, as como se haca con las muestras. Este parmetro representar el valor medio (terico) de la misma. Lo llamaremos media poblacional o esperanza de la v.a., y, para calcularla, partimos de la frmula equivalente para muestras con datos agrupados, reemplazando la frecuencia relativa que ah apareca por la probabilidad: = x p( x ) donde E(X) se lee "esperanza de X", la suma se da sobre todos los x del espacio muestral, y p(x) es la distribucin de probabilidades de la v.a. X. La esperanza de una variable puede ser tambin interpretada como su valor esperado, esto es, como el valor que esperaramos que tome la variable antes de la realizacin del experimento. En nuestro ejemplo del dado, la esperanza es: De manera anloga se puede calcular la varianza y desvo standard de variables aleatorias, 2 y .

DISTRIBUCIONES ESPECIALES
Veremos ahora algunas de las distribuciones ms utilizadas en la prctica. En primer lugar, trataremos con distribuciones discretas. V: DISTRIBUCIN BINOMIAL Consideremos un experimento que tiene slo dos resultados posibles, como cara-seca, o defectuoso-no defectuoso, y supongamos por ahora que conocemos la probabilidad de ambos resultados. A alguno de los dos resultados posibles lo llamaremos suceso , y a su probabilidad, p. Ahora imaginemos que el mismo experimento es repetido una cantidad n de veces, siempre bajo las mismas condiciones y en forma independiente (esto es, sin que el resultado en cualquiera de las repeticiones influya en los resultados de las otras). Consideremos entonces a la variable aleatoria que cuenta la cantidad de sucesos obtenidos en las n repeticiones. Ejemplos de esto son, el nmero de caras obtenidas al tirar una moneda n veces, o el nmero de piezas defectuosas encontradas al inspeccionar una muestra de n piezas. Las variables aleatorias que respondan a este esquema se dice que siguen una distribucin binomial, teniendo como parmetros a los valores n y p. En smbolos: X Bi (n,p)

Autor: F. Kornblit

49 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Los parmetros de una distribucin (n y p en este caso) son valores que la caracterizan, en algunos casos son conocidos y en otros no. La distribucin binomial cumple un rol fundamental en todos los procesos de muestreo de productos. Aqu, p es la proporcin (poblacional) de productos defectuosos, o , lo que es lo mismo, la probabilidad de que un producto elegido al azar de la poblacin, resulte defectuoso. Se presentan dos enfoques distintos. a)Poblacin finita -un lote grande ya producido-. p ser considerado la proporcin de defectuosos en el mismo . Para conocer p debiramos inspeccionar el 100% del lote. Como esto no resulta prctico, extraemos una muestra de tamao n, y contamos la cantidad X de defectuosos en la muestra. b) Poblacin infinita. Supongamos que queremos conocer la proporcin de artculos defectuosos que produce un determinado proceso. Ac no tenemos un lote ya producido, sino que la poblacin consiste en todos los artculos que se podran llegar a producir. En este caso, p es interpretado como la probabilidad (terica) de que un artculo producido sea defectuoso. En este caso, tambin se toma una muestra de tamao n, y se cuentan los defectuosos, obteniendo la v.a. binomial X. Interesa saber, dadas n y p, cul es la distribucin de probabilidad de una v.a. binomial, esto es, cul es la probabilidad de que X tome un dado valor. Esto responde a:
p(i) = P(X = i) = n! p i (1- p ) n-i i!(n - i)!

para i=0,1,...,n En la frmula anterior, el smbolo ! representa el factorial. Esperanza y varianza. Dados n y p, la esperanza y varianza de una distribucin binomial Bi(n,p) son: = n.p ; = n.p.(1-p)

Ejemplo prcticoUna cadena de hamburguesas y comida rpida planifica una nueva sucursal en una capital provincial, en la que se van a utilizar, por turno, 50 empleados para atender al pblico. En realidad, 45 personas son suficientes para la atencin del pblico en un turno, pero se contratar a 50 para cubrir la posibilidad de empleados faltantes por enfermedad u otros motivos. Si, en alguna oportunidad, llegaren a faltar ms de 5 empleados, se deber requerir personal

Autor: F. Kornblit

50 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

de refuerzo para asegurar el Sin embargo, la empresa prefiere manejarse solamente con el personal originalmente contratado. Teniendo en cuenta que, de acuerdo a la experiencia recogida en otras sucursales ya existentes, se prev una proporcin promedio de empleados ausentes del 8%, la gerencia se pregunta si los 50 empleados sern suficientes para no necesitar la contratacin de personal de refuerzo. La pregunta a formular es, pues: contando con 50 empleados originales, con qu frecuencia se necesitar llamar a personal de refuerzo? o, en otras palabras, con qu frecuencia se ausentarn ms de 5 empleados? Se dijo que el porcentaje promedio de empleados ausentes en la poblacin, es p = 8% (En base a la experiencia previa de otras sucursales, se toma ste ltimo como parmetro poblacional) Primero estimaremos, a partir de este dato, con qu frecuencia se pueden esperar los posibles valores para el nmero de empleados ausentes en la nueva sucursal. Frecuencia (x) 10 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 7 (x) 8 9 10 11 12

Ahora, calcule la frecuencia relativa y grafique el resultado en la prxima figura para cada uno de los sucesos observados, teniendo en cuenta que la frecuencia relativa se define como el cociente de la frecuencia por el nmero de ensayos n
fr ( x ) = f ( x) n

Autor: F. Kornblit

51 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

De esta manera, y si nos basramos solamente en esta informacin, kntente responder: con qu frecuencia no falta ningn empleado?................................................ con qu frecuencia se ausentan 3 empleados? .............................................. con qu frecuencia se ausentan 5 empleados o menos? ............................... con qu frecuencia se ausentan 5 empleados o menos? ............................... En conclusin, sern suficientes 50 empleados? ............................................. Es indudable que encontramos una solucin para el problema planteado. Sin embargo, la misma est lejos de ser la mejor solucin posible. En primer lugar, porque no es demasiado prctico recurrir a la caja de bolitas cada vez que se plantea un problema similar a este. Pero adems, porque esta solucin es muy dependiente de la aleatoriedad de las experiencias realizadas con la caja. Si volviramos a repetir todas las tiradas otra vez, posiblemente obtendramos diferente resultado. Si, en cambio, se hicieran muchas ms repeticiones con la caja de bolitas, la influencia del azar sobre el resultado total ser cada vez ms pequea. Un matemtico dira: si se realizan infinitas repeticiones, el resultado ya no quedara influenciado por el azar en absoluto. Las frecuencias relativas h(x) de la Figura anterior (muestrales) pasaran a ser las probabilidades g(x) (poblacionales)
fr ( x ) p ( x ) n

Afortunadamente, las infinitas repeticiones pueden ser reemplazadas por un clculo matemtico. En la tabla siguiente se representa el resultado de este clculo: la funcin de probabilidad g(x) correspondiente, llamada Distribucin Binomial, con n = 50 y p = 0,08. A su vez, los valores de la tabla fueron transportados en el grfico de barras de la derecha.

p(x) es la probabilidad individual, o sea la probabilidad de encontrar exactamente x unidades con determinado atributo (empleado ausente) entre los n tems ensayados (50 empleados)

Autor: F. Kornblit

52 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

x 0 1 2 3 4 5 6 7 8 9 10 11 12

p(x) 1.5% 6.7% 14.3% 19.9% 20.4% 16.3% 10.6% 5.8% 2.7% 1.1% 0.4% 0.1% 0.0%

Como ya se dijo, los valores de la tabla (y el grfico) fueron calculados, no repitiendo la tirada con la caja muchsimas veces, sino por medio de las frmulas de la pgina 3-7. Es interesante comparar este grfico de barras (de probabilidades) con el grfico de frecuencias relativas anterior. Nuevamente, comparamos un elemento muestral con uno poblacional. Siguiendo con el ejemplo: Para calcular la probabilidad de un mximo de cinco empleados ausentes, se suman las probabilidades individuales. De esta manera se obtiene la funcin de distribucin F(x).

F(5) = p(O) + p(1) + p(2) + p(3) + p(4) + p(5) F(x) es la probabilidad acumulada, o sea la probabilidad de encontrar hasta (mximo) x unidades con determinado atributo entre los n tems

La probabilidad de como mximo cinco empleados ausentes enfermos es La probabilidad para ms de cinco ausentes es: Si hacemos referencia aproximadamente el refuerzo. al 1 - F(5) =

F(5) =

problema planteado, esto significa que, en de los casos se deber solicitar personal de

Autor: F. Kornblit

53 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

En base a estos resultados, qu decisin tomara?

DISTRIBUCIN DE POISON Otra distribucin discreta til es la distribucin de Poison, que suele describir los experimentos aleatorios relacionados con conteos del nmero de defectos en una unidad, o el nmero de errores en un proceso, o el nmero de accidentes producidos por unidad de tiempo, etc. La distribucin de Poison , P() , responde a un parmetro, , y la frmula de su distribucin es: - . i p(i) = e ; i = 0,1,2,3,. i! La esperanza de una v.a. de Poison es , y la varianza , nuevamente, es .

Autor: F. Kornblit

54 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

EJERCICIO El servidor de una red informtica recibe correos para distribuir. Se supone que la cantidad de correos recibidos por da sigue una distribucin de Poison. A continuacin se muestran los registros de los tiempos en los que se recibieron trabajos en un da laboral (entre las 8 y las 20 horas). Estimar, en base a esta informacin, el parmetro , y responder: con qu probabilidad pueden llegar a recibirse ms de 10 correos por hora? con qu probabilidad pueden recibirse ms de 40 correos por maana (8h12 h)? 1 se 1 1 se 1 2 4 8 h 6 min 6 g 2 h 2 min 2 g 6 h 9 min 7 seg 1 se 1 1 2 se 1 4 3 8 h 9 min 4 g 2 h 5 min 3 g 6 h 4 min 1 seg 1 4 se 1 2 1 se 1 5 1 8 h 3 min 3 g 2 h 3 min 6 g 6 h 0 min 1 seg 2 5 se 1 3 5 se 1 1 8 h 4 min 7 g 2 h 2 min 4 g 7 h 1 min 7 seg 3 2 se 1 3 2 se 1 1 5 8 h 2 min 6 g 2 h 8 min 6 g 7 h 2 min 2 seg 3 1 se 1 5 4 se 1 1 8 h 8 min 5 g 2 h 2 min 9 g 7 h 5 min 1 seg 4 4 se 1 4 se 1 2 3 8 h 6 min 3 g 3 h 5 min 0 g 7 h 6 min 3 seg 5 3 se 1 1 4 se 1 3 1 8 h 8 min 0 g 3 h 4 min 4 g 7 h 2 min 4 seg 2 se 1 2 se 1 3 4 9 h 9 min 1 g 3 h 4 min 6 g 7 h 7 min 7 seg 1 1 se 1 3 5 se 1 4 9 h 7 min 5 g 3 h 6 min 8 g 7 h 5 min 5 seg 2 2 se 1 4 4 se 1 5 1 9 h 4 min 1 g 3 h 7 min 0 g 7 h 3 min 5 seg 4 1 se 1 5 se 1 3 9 h 0 min 5 g 3 h 1 min 1 g 8 h 2 min 6 seg 4 3 se 1 5 1 se 1 1 4 9 h 9 min 2 g 3 h 9 min 9 g 8 h 1 min 5 seg 1 1 se 1 4 se 1 1 0 h 0 min 4 g 4 h 9 min 1 g 8 h 7 min 9 seg 1 se 1 1 5 se 1 2 5 0 h 6 min 0 g 4 h 8 min 0 g 8 h 5 min 4 seg 1 1 se 1 2 2 se 1 3 1 0 h 7 min 2 g 4 h 6 min 7 g 8 h 2 min 1 seg

Autor: F. Kornblit

55 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

1 0h 1 0h 1 0h 1 0h 1 0h 1 1h 1 1h 1 1h 1 1h 1 1h 1 1h 1 1h 1 2h 1 2h

2 2 min 3 0 min 3 6 min 4 8 min 5 6 min 3 min 1 5 min 2 1 min 3 5 min 4 1 min 4 7 min 5 6 min 2 min 9 min

se 8g 3 se 9g 3 se 9g se 8g 5 se 2g 2 se 2g 2 se 6g 4 se 9g 3 se 5g 4 se 1g 1 se 8g 1 se 2g se 5g 2 se 9g

1 4h 1 4h 1 4h 1 4h 1 5h 1 5h 1 5h 1 5h 1 5h 1 5h 1 5h 1 6h 1 6h 1 6h

3 1 min 3 9 min 4 8 min 5 6 min 2 min 1 1 min 2 3 min 2 8 min 3 8 min 4 5 min 5 5 min 6 min 1 1 min 1 8 min

se 6g 1 se 2g 1 se 6g 1 se 0g 1 se 7g se 2g 2 se 1g 2 se 9g se 2g 1 se 4g 3 se 5g se 7g 5 se 8g 3 se 2g

1 8h 1 8h 1 8h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h 1 9h

4 0 min 4 9 min 5 6 min

3 2 seg 5 8 seg

4 seg 5 2 min 9 seg 2 5 min 4 seg 1 1 min 0 seg 1 1 6 min 5 seg 2 4 2 min 3 seg 2 3 9 min 6 seg 3 3 7 min 2 seg 4 4 3 min 3 seg 5 2 1 min 0 seg 5 5 4 min 7 seg 5 1 6 min 0 seg

Autor: F. Kornblit

56 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

VII. DISTRIBUCION NORMAL Entre las distribuciones de probabilidad la ms importante es la llamada normal (DN), cuya forma es similar a los histogramas con forma de campana descritos anteriormente. Tal distribucin depende de 2 parmetros v alor medio poblacional o esperanza) y (desviacin estndar poblacional), y la expresin matemtica de su distribucin es:

f(x) =

1 2. .

En el caso particular en que =0 y =1, la distribucin correspondiente se denomina normal standard ( N(0,1) ). La importancia de la distribucin normal proviene del hecho de que, en la mayora de los casos en los que una variable aleatoria est sujeta a varias fuentes diferentes e independientes de variacin, en que cada variacin por separado puede resultar imperceptible pero la combinacin de todas ellas s afecta el resultado, la distribucin subyacente es normal. Sin embargo, hay que prevenir que no siempre una variable aleatoria continua de estas caractersticas es normal. Hay distintas herramientas estadsticas que permiten chequear cundo una muestra de valores o variable aleatoria continuas, tiene DN. Si tuvisemos una gran cantidad de datos, y quisiramos chequear su normalidad, podramos construir el histograma correspondiente y comparar su forma con la campana. Sin embargo, es preferible utilizar el Grfico de Probabilidad Normal, o Red de Probabilidad Normal. Linealidad: Una propiedad importante de la distribucin normal es la siguiente: Si X tiene distribucin normal, y llamamos Z a la variable aleatoria obtenida de X restndole su media y dividindola por su desviacin estndar , entonces Z tiene distribucin normal standard:
X N ( , ) Z =

Esta ltima propiedad sirve para calcular probabilidades referida a variables normales, ya que las probabilidades relacionadas con la distribuciones normales standard estn tabuladas. Por ejemplo, sea X una variable aleatoria con DN(2,2) (esto significa =2, =2); y queremos hallar P(X < 4):
4-2 X-2 P(X < 4) = P < = P(Z < 1) = 0.84 2 2

X N ( 0,1)

segn la tabla.

Autor: F. Kornblit

57 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Valores de probabilidad para la distribucin normal. Diremos cunto se alejan, para un dado , los valores del valor medio en la distribucin normal: Dada una variable aleatoria X con distribucin normal: a) La probabilidad de que X caiga en el intervalo comprendido entre y + es aproximadamente 68%; b) La probabilidad de que X caiga en el intervalo comprendido entre 2 y + es aproximadamente del 95,5%; c) La probabilidad de que X caiga en el intervalo comprendido entre 3 y + 3 es aproximadamente del 99,73% Estas 3 propiedades se representan grficamente como sigue:

Otras propiedades, que sern tiles en el Captulo 5, son las representadas en los grficos siguientes

Autor: F. Kornblit

58 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Autor: F. Kornblit

59 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

CAP. V. ESTIMACIN DE PARMETROS


El problema fundamental de la Estadstica es inferir propiedades de las distribuciones a partir de las mismas propiedades, pero referidas a una muestra pequea. En general se trata de estimar parmetros desconocidos de un poblacin, a partir de estadsticos calculados sobre la muestra. Los ejemplos mas claros son estimar la media de una poblacin a partir del promedio de una muestra, o el desvo standard poblacional a partir del desvo standard muestral s, o la probabilidad de ocurrencia de cierto evento, p, a partir de la frecuencia relativa de las ocurrencias en una muestra. En forma esquemtica:

DATOS

POBLACION

Es de esperar que haya un error de estimacin, dado que las muestras sobre los que se calculan los estadsticos siempre estn sujetas a variaciones aleatorias. Parte 1. INTERVALOS DE CONFIANZA Es por esta ltima razn que generalmente no alcanza con dar un valor puntual para estimar un parmetro, sino que es conveniente dar un intervalo, un rango de valores que, con una probabilidad alta, cubra al parmetro. Por ejemplo, partimos de una muestra aleatoria (o sea, una muestra X 1, ..., Xn de variables aleatorias todas ellas con distribucin N(, ), queremos dar un intervalo tal que podamos asegurar que el verdadero parmetro , poblacional, est contenido en ese intervalo con probabilidad 0.95 . El nivel de un intervalo de confianza es la probabilidad de que el mismo cubra al parmetro. Suelen tomarse intervalos con nivel 0.95, o 0.99 . El nivel suele ser escrito como 1-, donde , que debe ser un nmero pequeo (0.05, o 0.01), representa el riesgo estadstico del mtodo. INTERVALOS DE CONFIANZA PARA MEDIAS. VARIANZA CONOCIDA. Partiendo de una muestra aleatoria con distribucin N(,), donde resulta conocida, un intervalo de confianza para la media es:
IC( ) = X - z ; X + z /2 /2 n n

Autor: F. Kornblit

60 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

donde z/2 es el valor obtenido de la tabla de la distribucin normal, que deja a su derecha un probabilidad de /2. Por ejemplo , si deseamos un intervalo de 1 = 95%, /2 = 2.5%, y entonces z/2 = 1.96 DISTRIBUCIN t . EL CASO DE VARIANZA DESCONOCIDA. Si no se conoce , el intervalo para se obtiene de manera similar, reemplazando (desconocido) por s, el desvo standard de la muestra. Pero en este caso el valor de z/2 debe ser reemplazado por el valor t/2,n-1 que se busca en las tablas de la distribucin "t" de Student (ver Apndice). Esta es una nueva distribucin, similar a la normal, que depende de un parmetro n (llamado nmero de grados de libertad) , y que , cuanto mayor sea n, ms se parece a la normal. El hecho de estimar por s introduce un error adicional en los estadsticos considerados, y esa modificacin se refleja en la distribucin t. El intervalo resulta:
IC( ) = X - t /2,n -1 s n ; X + t /2,n -1 s n

DISTRIBUCIN 2 INTERVALOS DE CONFIANZA PARA VARIANZAS . En otros casos puede ser necesario dar un intervalo de confianza para estimacin de 2 o . Para esto introducimos la distribucin " 2", cuyas tablas se encuentran en el apndice. La misma depende tambin de un parmetro n, llamado nmero de grados de libertad, y relacionado con la precisin en la estimacin de por s. A diferencia de las distribuciones normal y t, sta no es simtrica. El valor X2,n es aqul que deja un rea igual a a su izquierda en el grfico de su distribucin. El intervalo correspondiente a es:
2 2 s s IC( 2 ) = (n - 1) ; (n - 1) 2 2 n -1,1- n -1, /2 /2

Parte2. TESTS DE HIPTESIS En muchas otras ocasiones lo que interesa no es estimar un parmetro por un valor puntual ni por un intervalo, sino solamente verificar si el mismo cumple o no determinada condicin. Por ejemplo, puede ser necesarIo asegurarse si la concentracin media (poblacional) de cierta sal en agua mineral no supera un valor mximo tolerado, o si el ancho medio (poblacional) del paso de un rosca fileteada est

Autor: F. Kornblit

61 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

dentro de ciertos valores de especificacin de plano, o si la proporcin (poblacional) de artculos defectuosos obtenidos en un proceso no supera el 1%, etctera. En todos estos casos el problema es similar. Se tiene un parmetro en estudio (correspondiente a una poblacin completa), y se admiten para l dos situaciones posibles: dentro - fuera de especificacin o de norma, proporcin de defectuosos mayor - menor o igual que 1%. Para resolver estos y otros problemas con estas caractersticas se utiliza un Test de Hiptesis que, como toda otra tcnica estadstica, utiliza la informacin contenida en una muestra, extrada de la poblacin original, para llegar a una conclusin. En primer lugar debemos formular las 2 hiptesis a ser testeadas, por ejemplo:

0 versus > 0
si es concentracin media, y 0 es la mxima tolerada.Tengamos en cuenta que no se conoce el verdadero valor de (media poblacional), pero si el mximo valor tolerado 0 Dijimos antes que un test deber basarse en estadsticos obtenidos a partir de muestras aleatorias (una muestra de n botellas de agua a las que se mida la concentracin de sal, por ejemplo), para ayudarnos a decidir entre ambas hiptesis. Dado que x ser similar a , para valores altos de n, lo razonable sera considerar un criterio como el siguiente : Si x resulta "grande" , decidir > 0, y si resulta "chico", decidir 0 Seguidamente diremos con mayor precisin que significan "grande" y "chico". Hay que tener en cuenta que, como todo mtodo basado en muestras estadsticas, existe la posibilidad de cometer errores aleatorios en resultado del test. Reconocemos 4 posibles situaciones : a) la concentracin media real es realmente menor o igual que la mxima tolerada, y nuestro test registra esta realidad. b) la concentracin media real es realmente menor o igual que la mxima tolerada, pero, por errores estadsticos, nuestro test nos dir que la supera. c) la concentracin media real es realmente mayor que la mxima tolerada, pero, por errores estadsticos, nuestro test nos dir que es menor o igual. d) la concentracin media real es realmente mayor que la mxima tolerada, y nuestro test registra esta realidad.

Autor: F. Kornblit

62 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Sintticamente: RESULTADO DEL TEST <0 REALIDAD <0 >0 a. sin error c. error I b. error II d. sin error >0

Como se ve, hay dos errores posibles. Uno de estos dos por lo general es considerado ms "grave", y ser aqul que queramos controlar en lo posible. En nuestro ejemplo, el error ms "grave" ser el c ("no darnos cuenta que la concentracin supera la tolerada"). Muchas veces la formulacin de cul es el error ms grave es subjetiva y no debe tomrselo en forma estricta. Por ejemplo, si un fabricante y un comprador deciden hacer un test para chequear si determinado producto alcanza o no un determinada caracterstica de calidad, lo ms "grave" para el fabricante ser que del test surja que no se alcanza la caracterstica anunciada cuando en realidad s se alcanza, y por tanto se rechacen productos buenos; para el comprador, lo ms grave ser que del test surja que se alcanza la caracterstica esperada, cuando esto no es cierto, y por tanto comprar productos malos. En cualquier caso, una vez elegido el error cuyo riesgo se quiera controlar, al mismo se le asigna el nombre "ERROR I", o "ERROR ". Al otro, al menos "grave", se lo llama "ERROR II", o "ERROR " Una vez nombrados los dos tipos de error, nombraremos las dos hiptesis. Llamaremos Hiptesis Nula (H0) a la hiptesis verdadera del ERROR I. Llamaremos Hiptesis Alternativa (Ha) a la hiptesis verdadera del ERROR II. O, en otras palabras, ambos errores posibles pueden describirse como: ERROR I: "rechazar la hiptesis nula cuando sta es verdadera"; ERROR II: "aceptar la hiptesis nula cuando sta es falsa". El siguiente elemento que debemos definir es el nivel de un test. Llamaremos nivel (y lo notaremos con la letra ), a la probabilidad de cometer error de tipo I: = P(ERROR I) = P(rechazar H0 si H0 es cierta) Se tratar, (como en Intervalos de Confianza) de elegir valores pequeos de , para plantear un test . Por lo general se toma = 0.1, 0.05, o 0.01 . Se designa con a la probabilidad de error de tipo II:

Autor: F. Kornblit

63 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

= P(ERROR II) = P(aceptar H0 si H0 es falsa) A diferencia que , no es elegido al comienzo del test, sino que toma un valor de acuerdo a la muestra tratada. Cuanto ms pequeo se exija que sea , mayor ser . Los otros dos elementos que necesitamos para plantear un test son: el estadstico del mismo, o sea aquel valor numrico que calcularemos a partir de la muestra, y la regin de rechazo o criterio de rechazo. El criterio de rechazo es aquella condicin que deber cumplir el estadstico del test, para rechazar la hiptesis nula. Posiblemente esto se aclare bastante al empezar a plantear tests en concreto. TESTS PARA MEDIAS.VARIANZA CONOCIDA Supongamos que tenemos una muestra aleatoria X1,..., Xn, de variables todas ellas con distribucin N(, ). El desvo standard es conocido, y queremos testear : A: Ho: 0 vs. Ha: > 0

al nivel (o sea, tal que el riesgo , o probabilidad de decidir > 0 cuando en realidad 0, sea ). Decamos antes que era razonable rechazar Ho cuando el promedio muestral es "grande", mayor que alguna cantidad lmite, y aceptar Ho en caso contrario. Esa cantidad lmite se elige de manera tal, que la P(ERROR I) sea si = 0. Da ac surge el criterio de rechazo que define nuestro test : Se rechaza H 0 si : Z > z donde z es el correspondiente percentil de la distribucin normal que deja rea a la derecha (ver Intervalos de Confianza), y Z, el estadstico de este test, es la media muestral normalizada: X - 0 Z = / n Despejando x en la desigualdad de arriba, vemos que el criterio se puede enunciar tambin as: Se rechaza H 0 si : X > z + 0 n

Autor: F. Kornblit

64 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

que responde a lo dicho anteriormente, de rechazar Ho si superaba alguna cantidad lmite. Tomar el criterio de rechazo de esta manera nos garantiza que el nivel obtenido sea el deseado: P(ERROR I) = P(Z > z ) = puesto que, si = 0, la media muestral tiene distribucin N( ,/ n), y por tanto, Z tiene distribucin N(0,1). Utilizacin del test: En la prctica, se procede de la siguiente manera: Calculamos el estadstico Z (lo podemos hacer pues 0 es conocido, al igual que ), y lo comparamos contra el valor lmite o valor crtico que obtenemos de la tabla de la distribucin normal. Si se cumple el criterio de rechazo, podemos decir que Ho es falsa, y la probabilidad que tenemos de equivocarnos es, a lo sumo, . En cambio, si no se cumple la condicin de rechazo, no es igualmente correcto afirmar que Ho es verdadera, dado que el error que podramos llegar a cometer si lo afirmamos es el ERROR II, y no sabemos cul es la probabilidad de cometerlo. Esta podra ser muy grande y por tanto es poco lo que podemos afirmar, a no ser que calculemos y nos aseguremos de que es pequea. Cuando se quiere confirmar una hiptesis sobre un parmetro, se debe entonces colocar esa hiptesis en el lugar de Ha, y as, si se cumple la condicin de rechazo, podemos rechazar Ho seguros (salvo el riesgo , elegido pequeo) de no equivocarnos. Si no se cumple la condicin de rechazo, nada podemos afirmar. Esto ltimo se puede interpretar as: si no se cumple la condicin de rechazo no hay suficiente evidencia, o informacin en los datos de la muestra, como para llegar a una conclusin vlida. En tal caso, se puede intentar nuevamente el test con una muestra mayor. Hay otras dos posibilidades para el planteo de las hiptesis. Estas son: B: y Ho: = 0 C: vs. Ha: 0 La forma de construir los tests correspondientes similar. El mecanismo para el planteo de cualquier test es similar. Solamente cambian los criterios de rechazo. Ms abajo Ho: 0 vs. Ha: < 0

Autor: F. Kornblit

65 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

damos una sntesis para los diferentes casos que se consideran en este curso. No est de ms decir que, en este tema, es conveniente una buena ejercitacin para refirmar los conceptos. El caso desconocido. Si no conocemos , usamos es estadstico T, igual que en Intervalos de Confianza, X - 0 T = s/ n con el criterio de rechazo: Se rechaza H 0 si : T > t ,n-1 donde el valor crtico t,n-1 se encuentra en la tabla de la distribucin t. Despejando en esta ltima ecuacin, surge que el criterio derechazo se puede escribir tambin: Se rechaza H 0 si : X > t ,n-1 s + 0 n

El caso asinttico: Hasta ahora hemos trabajado con muestras X1,...Xn con distribucin normal. Puede ocurrir que esto no ocurra. Pero, si n es suficientemente grande, en virtud del Teorema Central del Lmite, es posible suponer distribuciones aproximadamente normales para los promedios, obteniendo el mismo test que anteriormente. Tests para : Tambin puede ser necesario testear hiptesis sobre , como: Ho: 0 A: vs. Ha: > 0
2 El criterio de rechazo para este test es: Se rechaza H 0 si : X > ,n-1 donde el valor crtico se obtiene de la tabla de la distribucin "chi" cuadrado, y el estadistico X es: s2 X = (n - 1) 2 0

Autor: F. Kornblit

66 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

APNDICE I. Formulas para Intervalos de Confianza y Tests de Hiptesis


INTERVALOS DE CONFIANZA a) Para , conocido, distribucin normal b) Para , desconocido, distribucin normal c) Para p, (aproximacin normal de la binomial)
z 2 p

X z 2

X t 2 ,n 1
(1 p ) p ; n

s n
= Xn p

TESTS DE HIPOTESIS 1. Para . Distribucin normal, conocido


Z= X 0 n

Criterios de rechazo: A: Ho: 0 Ha: > 0 Ho: 0 Ha: < 0 Ho: = 0 Ha: 0 Z > z

B:

Z < - z Z > z/2

C:

3. Para . Distribucin normal, desconocido


T = X 0 s n

Criterios de rechazo:

A: B: C:

T > t, n-1 T < -t, n-1 T > t/2, n-1

Autor: F. Kornblit

67 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

3. Para p . Aproximacin normal a la binomial p0 p Z= p0 ( 1 p0 ) n Criterios de rechazo: A: Ho: p p0 Ha: p > p 0 Ho: p p0 Ha: p < p0 Ho: p = p0 Ha: p p0 Z > z

B:

Z < -za

C:

Z > za/2

4. Para . Distribucin normal.


s2 X = ( n 1) 2 0

Criterios de rechazo: A: Ho: 0 Ha: > 0 Ho: 0 Ha: < 0 X > 2, n-1 X < 21-, n-1

B:

5. Para diferencia de medias: 1 2 . Dos muestras, de tamaos m y n, con distribucin normal, independientes entre s, y con distintas medias 1, 2 y el mismo conocido
Z= X1 X2 1 1 + m n

Criterios de rechazo: A: Ho: 1 2 Ha: 1 > 2 Z > z

Autor: F. Kornblit

68 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

B:

Ho: 1 2 Ha: 1 < 2 Ho: 1 = 2 Ha: 1 2

Z < - z Z > z/2

C:

6. Para diferencia de medias: 1 2 . Dos muestras, de tamaos m y n, con distribucin normal, independientes entre s, y con distintas medias 1, 2 y el mismo desconocido
T= X1 X 2 sp sp = 1 1 + m n

( m 1) s2 ( ) 2 x + n 1 sy
m+n2

Criterios de rechazo: A: Ho: 1 2 Ha: 1 > 2 Ho: 1 2 Ha: 1 < 2 Ho: 1 = 2 Ha: 1 2 T > t, m+n-2

B:

T < -t, m+n-2 T > t/2, m+n-2

C:

7. Para comparacin de varianzas: 1/ 2 . Dos muestras, de tamaos m y n, con distribucin normal, independientes entre s. s2 F= 1 s2 2 Criterios de rechazo: Ho: 1 2 Ha: 1 > 2 (recordar que f1-, n-1,m-1 = 1 / f, m-1,n-1) F > f, m-1,n-1

Autor: F. Kornblit

69 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

Autor: F. Kornblit

70 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

APNDICE II: GLOSARIO


Muchas de las definiciones que aqu aparecen fueron extradas de: ISO 3534 -1997 Statistics Vocabulary and symbols.

Concepto
Coeficiente de correlacin muestral Coeficiente de correlacin poblacional Criterio de rechazo (condicin de rechazo) Curva caracterstica de un plan de muestreo Datos Datos continuos Datos discretos Defecto Desviacin estndar muestral Desviacin estndar poblacional (de una variable aleatoria) Desviacin estndar de un promedio

Smbolo
R

Definicin
Parmetro que indica la interdependencia (correlacin lineal) entre series de observaciones apareadas. Es un estimador del coeficiente de correlacin poblacional. Parmetro que indica la interdependencia (correlacin lineal) entre dos variables aleatorias. Toma valores entre 1 y 1 Condicin que debe cumplirse para tomar la decisin de rechazar la hiptesis nula en un test de hiptesis Curva que muestra, para un dado plan de muestreo, la probabilidad de aceptar un lote como funcin de su calidad real Resultados de observaciones, inspecciones, mediciones o ensayos Datos que son resultado de mediciones fsicas sobre tems de una muestra. Toman valores numricos reales Datos que son resultado de conteos de caractersticas cualitativas (atributos) sobre tems de una muestra. Por lo general toman valores enteros. No conformidad con requerimientos especificados Estimador de la desviacin estndar poblacional, calculada a partir de la frmula

CO

s=

( x

x)

n 1

(sigma)

Raz cuadrada positiva de la varianza poblacional Desviacin estndar (poblacional o muestral) asignada a la variable aleatoria obtenida como promedio de otras n variables aleatorias Distribucin de probabilidad de la variable aleatoria discreta que cuenta el nmero de tems con determinado atributo, de una muestra ensayada de tamao n, cuando la probabilidad de ocurrencia de tal atributo en la poblacin es igual a p. Los ensayos de los diferentes tems deben ser independientes Distribucin de probabilidad de la variable

s n

Distribucin binomial

DB(n,p)

Distribucin de Poison

DP()

Autor: F. Kornblit

71 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada aleatoria discreta que cuenta el nmero de atributos encontrados en una muestra (unidad de inspeccin) ensayada, cuando el nmero medio de defectos por unidad de inspeccin en la poblacin es igual a Funcin que determina la probabilidad con la que una variable aleatoria tome algn valor o pertenezca a un conjunto dado de valores Distribucin del cociente entre las varianzas muestrales de dos muestras independientes. Los parmetros de la distribucin son el nmero de grados de libertad de ambas varianzas muestrales, m-1 y n-1 si las muestras son de tamao m y n respectivamente. Distribucin de probabilidad de una variable aleatoria continua cuya funcin de densidad corresponde a la campana de Gauss, con valor medio y desviacin estndar Distribucin normal con parmetros = 0 y = 1 Distribucin del cociente: obtenido a partir s n de n variables aleatorias todas con la misma distribucin normal. Un parmetro de la distribucin es el nmero de grados de libertad n-1 Distribucin de la suma de los cuadrados de variables aleatorias con distribucin normal estandarizada. El nmero de tales variables es un parmetro de la distribucin (grados de libertad). Dada una muestra de tamao n, la 2 s varianza muestral estandarizada ( n 1 ) x

Distribucin de probabilidad

Distribucin F

Distribucin normal Distribucin normal estndar

DN(,) DN(0,1)

Distribucin t (Student)

Distribucin 2 (chi cuadrado o ji cuadrado)

Error de tipo I Error de tipo II Espacio muestral


S

Especificacin Estadstica descriptiva

tiene distribucin 2 con n-1 grados de libertad En un test de hiptesis, error que consiste en rechazar la hiptesis nula cuando sta se cumple En un test de hiptesis, error que consiste en no rechazar (aceptar) la hiptesis nula cuando sta no se cumple Conjunto de todos los resultados posibles de un experimento aleatorio Declaracin detallada que incluye un conjunto de requerimientos para ser satisfechos por un producto, material o proceso, indicando, si es apropiado, el procedimiento por el cual puede determinarse si los requerimientos dados son satisfechos Rama de la Estadstica que se ocupa de

Autor: F. Kornblit

72 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada describir datos muestrales, ya sea por tcnicas grficas o numricas Cualquier funcin matemtica obtenida a partir de los valores observados derivados de una muestra Proceso para obtener una variable aleatoria Z con distribucin normal estndar DN(0 , 1) a partir de una variable aleatoria X con distribucin normal cualquiera DN( , )

Estadstico

Estandarizacin

X Z =

Estimacin Estimado (Valor estimado) Evento Experimento aleatorio Frecuencia Frecuencia relativa (proporcin muestral) Funcin de densidad de una variable aleatoria continua Funcin de distribucin acumulada de una variable aleatoria Funcin de probabilidad puntual de una variable aleatoria discreta F Fr fx Fx

Operacin hecha con el propsito de asignar, a partir de valores observados en una muestra, valores numricos a los parmetros de una distribucin elegida como modelo estadstico de la poblacin a partir de la cual la muestra fue extrada Resultado de la operacin de estimacin Ver Suceso Experiencia que previamente a su realizacin, no es posible conocer el resultado que se obtendr, pero s se conocen todos los posibles resultados Nmero de tems en una muestra que caen en una determinada clase o que cumplen con un determinado evento Cociente entre la frecuencia de una clase y el tamao de la muestra Derivada, si existe, de la funcin de distribucin acumulada Funcin que da, para cada valor x la probabilidad de que la variable aleatoria X sea menor o igual que x, FX(x) = P(X x) Si xi es un valor que puede tomar la variable aleatoria X, px(xi) indica con que probabilidad puede tomar ese valor Parmetro que indica la cantidad de informacin utilizada pare estimar una desviacin estndar poblacional a partir de una desviacin estndar muestral. Una estimacin simple, basada en una muestra de tamao n, tiene n-1 grados de libertad Hiptesis opuesta a la hiptesis nula. Usualmente es una hiptesis compuesta (por ejemplo: < 3 > 3) Hiptesis sometida a rechazo o no rechazo (aceptacin) como resultado de un test de

px

Grados de libertad

n-1

Hiptesis alternativa Hiptesis nula

Ha H0

Autor: F. Kornblit

73 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada hiptesis Representacin grfica de una distribucin de frecuencias o de frecuencias relativas (en general, mediante grficos de barras) Rama de la Estadstica que se ocupa de obtener conclusiones sobre la poblacin bajo estudio a partir de observaciones muestrales Mtodo que consiste en registrar, para cada tem de una poblacin o de una muestra extrada de una poblacin, la presencia o ausencia de una cierta caracterstica cualitativa (atributo) y contar cuntos tems poseen o no poseen esa caracterstica NOTA: El modelo de la distribucin binomial se suele aplicar a este tipo de inspeccin Mtodo que consiste en registrar, para cada tem de una poblacin o de una muestra extrada de una poblacin, l nmero de defectos por tem o por cada 100 tems NOTA: El modelo de la distribucin de Poison de suele aplicar a este tipo de inspeccin Mtodo que consiste en medir una caracterstica cuantitativa para cada tem de una poblacin o de una muestra extrada de una poblacin NOTA: El modelo de la distribucin normal se puede aplicar a este tipo de inspeccin Intervalo cuyos lmites son calculados a partir de estadsticos muestrales, y que cubren a un determinado parmetro poblacional con un probabilidad dada (nivel de confianza) Unidad individual bajo estudio. Valor observado nico 50 percentil de una distribucin (ISO 3535). Valor que deja el 50% de la distribucin a la izquierda (valores menores) y el 50% a la derecha (valores mayores) Valor que, al ordenar la muestra de menor a mayor, deja el 50% de la muestra a la izquierda (valores menores) y el 50% a la derecha (valores mayores). Se calcula como el valor central de la muestra ordenada, si el tamao de la misma es impar, y el promedio aritmtico de los dos valores centrales, si es par. Uno o ms tems (individuos) tomados de una poblacin que proveen informacin sobre la misma y posiblemente sirva de base para una decisin sobre la poblacin o sobre el proceso que la ha producido () Procedimiento utilizado para obtener una muestra Mximo porcentaje de tems defectuosos (o

Histograma Inferencia estadstica

Inspeccin por atributos

Inspeccin por conteo de defectos

Inspeccin por variables

Intervalo de confianza tem Mediana (poblacional) de una distribucin de probabilidad

I.C.

Med

Mediana muestral

~ x

Muestra Muestreo Nivel de calidad aceptable AQL

Autor: F. Kornblit

74 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada mximo nmero de defectos por 100 unidades) que, para propsitos de inspeccin por muestreo, puede ser considerado satisfactorio como promedio del proceso de entrega

Nivel de confianza (de un intervalo de confianza) Nivel de un test de hiptesis Nmero de aceptacin Nmero de rechazo Observacin (medicin, inspeccin, ensayo)

1
C D

Outliers, valores anmalos (por ejemplo: p, , ) , , p f,m-1,n-1

Probabilidad de que un intervalo de confianza contenga a un parmetro poblacional Probabilidad mxima para el error de tipo I en un test de hiptesis En inspeccin por atributos, mximo valor para el nmero de tems defectuosos o de defectos que involucre la aceptacin del lote En inspeccin por atributos, mnimo valor para el nmero de tems defectuosos o de defectos que involucre el rechazo del lote Proceso de observar, medir, ensayar, ,inspeccionar, calibrar y eventualmente compara los resultados obtenidos con requerimientos aplicables En una muestra, aquellos valores que, por errores groseros en la observacin, o por otros motivos no se les puede aplicar la misma distribucin de probabilidad que al resto de la muestra Magnitud usada para describir la distribucin de una caracterstica de la poblacin Ver Estimado (Valor estimado)

Parmetro Parmetro estimado Percentil de la distribucin F, con m-1 y n-1 grados de Grados de libertad Percentil de la distribucin normal estndar
Percentil de la distribucin t, con n grados de libertad

z t, n-1

Valor numrico que asegura que, si X es una variable aleatoria con la citada distribucin, la probabilidad de que X supere a dicho valor es igual a

Percentil de la distribucin 2, con n-1 grados de libertad

2 , n-1
Plan que consiste en extraer una o ms muestras de una poblacin para obtener informacin sobre la misma y posiblemente tomar una decisin NOTA: Las decisiones involucradas pueden consistir, por ejemplo, en aceptar o rechazar lotes de mercadera Totalidad de los tems bajo consideracin. El

Plan de muestreo

Poblacin

Autor: F. Kornblit

75 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada objeto de estudio de un anlisis estadstico Nmero entre 0 y 1 que cuantifica la chance de ocurrencia de un suceso Suma de los valores que componen una muestra dividida por el tamao de la misma Probabilidad de que un tem de una poblacin cumpla con determinado atributo Diferencia entre el mayor y el menor valor de una muestra Probabilidad de que, por efectos aleatorios, un lote sea aceptado, a pesar de que su calidad es inferior a la especificada Probabilidad de que, por efectos aleatorios, un lote sea rechazado, a pesar de que su calidad es igual o superior a especificada Subconjunto del espacio muestral. Hecho que puede o no ocurrir, de acuerdo a una determinada probabilidad Par de sucesos que no pueden ocurrir al mismo tiempo Par de sucesos para los cuales la ocurrencia o no de uno de ellos no afecta para nada la probabilidad de ocurrencia del otro Nmero de tems que componen una poblacin (siempre y cuando la misma no sea infinita) Nmero de tems que componen una muestra Procedimiento estadstica que pretende decidir si una determinada hiptesis acerca de la distribucin de una poblacin debiera ser aceptada o rechazada Lmite probabilstico del promedio muestral, cuando el tamao de la muestra tiende a Para variables aleatorias discretas, se calcula mediante la frmula = pi xi donde pi es la funcin de probabilidad puntual de la variable aleatoria X evaluada en xi Para variables aleatorias continuas, se calcula mediante la frmula = x f ( x ) donde f es la funcin de densidad de la variable aleatoria X Variables que pueden tomar cualquier valor en un conjunto de valores especificado y que tiene asociada una distribucin de probabilidad Variables aleatorias que pueden tomar cualquier valor dentro de un intervalo de valores posibles (Ver: Datos continuos) Variables aleatorias que slo puede tomar valores aislados (Ver: Datos discretos) Estimador de la varianza poblacional, calculada

Probabilidad de un suceso Promedio aritmtico, valor medio, promedio muestral Proporcin poblacional Rango Riesgo del comprador Riesgo del proveedor Suceso Sucesos excluyentes Sucesos independientes Tamao de la poblacin Tamao de una muestra Tests de hiptesis

P(
x

p R

N n

Valor esperado de una variable aleatoria (esperanza matemtica, o valor medio poblacional)

Variables aleatorias Variables aleatorias continuas Variables aleatorias discretas Varianza muestral

x1,...,xn

s2

Autor: F. Kornblit

76 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada a partir de la frmula s 2 =

( x

x)

n 1

Varianza poblacional (varianza de una variable aleatoria)

El valor esperado del cuadrado de la variable 2 centrada E ( X )

Autor: F. Kornblit

77 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

APNDICE III: TABLAS


1. Probabilidad acumulada a la izquierda de z, bajo la curva de la distribucin normal standard

DISTRIBUCION NORMAL STANDARD ACUMULADA z 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9

( z)
0.5000 0.5398 0.5793 0.6179 0.6554 0.6915 0.7257 0.7580 0.7881 0.8159 0.8413 0.8643 0.8849 0.9032 0.9192 0.9332 0.9452 0.9554 0.9641 0.9713

z 2 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9

( z)
0.9772 0.9821 0.9861 0.9893 0.9918 0.9938 0.9953 0.9965 0.9974 0.9981 0.9987 0.9990 0.9993 0.9995 0.9997 0.9998 0.9998 0.9999 0.9999 1.0000

Autor: F. Kornblit

78 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

2.Valores crticos superiores de la Distribucin t (dejan a la derecha un rea igual a % del total)
DISTRIBUCIN t DE UNA COLA (PARA TESTS CASOS A o B)

g.l. 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 39 40 45 50 55 60 65 70 75 80 90 0.5% 9.92 5.84 4.60 4.03 3.71 3.50 3.36 3.25 3.17 3.11 3.05 3.01 2.98 2.95 2.92 2.90 2.88 2.86 2.85 2.83 2.82 2.81 2.80 2.79 2.78 2.77 2.76 2.76 2.75 2.74 2.74 2.73 2.73 2.72 2.72 2.72 2.71 2.70 2.69 2.68 2.67 2.66 2.65 2.65 2.64 2.64 2.63 1.0% 6.96 4.54 3.75 3.36 3.14 3.00 2.90 2.82 2.76 2.72 2.68 2.65 2.62 2.60 2.58 2.57 2.55 2.54 2.53 2.52 2.51 2.50 2.49 2.49 2.48 2.47 2.47 2.46 2.46 2.45 2.45 2.44 2.44 2.44 2.43 2.43 2.43 2.42 2.41 2.40 2.40 2.39 2.39 2.38 2.38 2.37 2.37 2.5% 4.30 3.18 2.78 2.57 2.45 2.36 2.31 2.26 2.23 2.20 2.18 2.16 2.14 2.13 2.12 2.11 2.10 2.09 2.09 2.08 2.07 2.07 2.06 2.06 2.06 2.05 2.05 2.05 2.04 2.04 2.04 2.03 2.03 2.03 2.03 2.03 2.02 2.02 2.01 2.01 2.00 2.00 2.00 1.99 1.99 1.99 1.99 5.0% 2.92 2.35 2.13 2.02 1.94 1.89 1.86 1.83 1.81 1.80 1.78 1.77 1.76 1.75 1.75 1.74 1.73 1.73 1.72 1.72 1.72 1.71 1.71 1.71 1.71 1.70 1.70 1.70 1.70 1.70 1.69 1.69 1.69 1.69 1.69 1.69 1.68 1.68 1.68 1.68 1.67 1.67 1.67 1.67 1.67 1.66 1.66 10.0% 1.89 1.64 1.53 1.48 1.44 1.41 1.40 1.38 1.37 1.36 1.36 1.35 1.35 1.34 1.34 1.33 1.33 1.33 1.33 1.32 1.32 1.32 1.32 1.32 1.31 1.31 1.31 1.31 1.31 1.31 1.31 1.31 1.31 1.31 1.31 1.30 1.30 1.30 1.30 1.30 1.30 1.30 1.29 1.29 1.29 1.29 1.29

Autor: F. Kornblit

79 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006


2.58 2.33
2

Probabilidad y Estadstica Aplicada


1.96 1.65 1.28

3.Valores crticos superiores de la Distribucin (dejan a la derecha un rea igual a % del total)

g.l.
2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 45 50 55 60 65 70 75 80

0.5%
10.6 12.8 14.9 16.7 18.5 20.3 22.0 23.6 25.2 26.8 28.3 29.8 31.3 32.8 34.3 35.7 37.2 38.6 40.0 41.4 42.8 44.2 45.6 46.9 48.3 49.6 51.0 52.3 53.7 55.0 56.3 57.6 59.0 60.3 61.6 62.9 64.2 65.5 66.8 73.2 79.5 85.7 92.0 98.1 104.2 110.3 116.3

1.0%
9.2 11.3 13.3 15.1 16.8 18.5 20.1 21.7 23.2 24.7 26.2 27.7 29.1 30.6 32.0 33.4 34.8 36.2 37.6 38.9 40.3 41.6 43.0 44.3 45.6 47.0 48.3 49.6 50.9 52.2 53.5 54.8 56.1 57.3 58.6 59.9 61.2 62.4 63.7 70.0 76.2 82.3 88.4 94.4 100.4 106.4 112.3

2.5%
7.4 9.3 11.1 12.8 14.4 16.0 17.5 19.0 20.5 21.9 23.3 24.7 26.1 27.5 28.8 30.2 31.5 32.9 34.2 35.5 36.8 38.1 39.4 40.6 41.9 43.2 44.5 45.7 47.0 48.2 49.5 50.7 52.0 53.2 54.4 55.7 56.9 58.1 59.3 65.4 71.4 77.4 83.3 89.2 95.0 100.8 106.6

5.0%
6.0 7.8 9.5 11.1 12.6 14.1 15.5 16.9 18.3 19.7 21.0 22.4 23.7 25.0 26.3 27.6 28.9 30.1 31.4 32.7 33.9 35.2 36.4 37.7 38.9 40.1 41.3 42.6 43.8 45.0 46.2 47.4 48.6 49.8 51.0 52.2 53.4 54.6 55.8 61.7 67.5 73.3 79.1 84.8 90.5 96.2 101.9

10.0%
4.6 6.3 7.8 9.2 10.6 12.0 13.4 14.7 16.0 17.3 18.5 19.8 21.1 22.3 23.5 24.8 26.0 27.2 28.4 29.6 30.8 32.0 33.2 34.4 35.6 36.7 37.9 39.1 40.3 41.4 42.6 43.7 44.9 46.1 47.2 48.4 49.5 50.7 51.8 57.5 63.2 68.8 74.4 80.0 85.5 91.1 96.6

90.0%
0.2 0.6 1.1 1.6 2.2 2.8 3.5 4.2 4.9 5.6 6.3 7.0 7.8 8.5 9.3 10.1 10.9 11.7 12.4 13.2 14.0 14.8 15.7 16.5 17.3 18.1 18.9 19.8 20.6 21.4 22.3 23.1 24.0 24.8 25.6 26.5 27.3 28.2 29.1 33.4 37.7 42.1 46.5 50.9 55.3 59.8 64.3

95.0%
0.1 0.4 0.7 1.1 1.6 2.2 2.7 3.3 3.9 4.6 5.2 5.9 6.6 7.3 8.0 8.7 9.4 10.1 10.9 11.6 12.3 13.1 13.8 14.6 15.4 16.2 16.9 17.7 18.5 19.3 20.1 20.9 21.7 22.5 23.3 24.1 24.9 25.7 26.5 30.6 34.8 39.0 43.2 47.4 51.7 56.1 60.4

97.5%
0.1 0.2 0.5 0.8 1.2 1.7 2.2 2.7 3.2 3.8 4.4 5.0 5.6 6.3 6.9 7.6 8.2 8.9 9.6 10.3 11.0 11.7 12.4 13.1 13.8 14.6 15.3 16.0 16.8 17.5 18.3 19.0 19.8 20.6 21.3 22.1 22.9 23.7 24.4 28.4 32.4 36.4 40.5 44.6 48.8 52.9 57.2

99.0%
0.0 0.1 0.3 0.6 0.9 1.2 1.6 2.1 2.6 3.1 3.6 4.1 4.7 5.2 5.8 6.4 7.0 7.6 8.3 8.9 9.5 10.2 10.9 11.5 12.2 12.9 13.6 14.3 15.0 15.7 16.4 17.1 17.8 18.5 19.2 20.0 20.7 21.4 22.2 25.9 29.7 33.6 37.5 41.4 45.4 49.5 53.5

99.5%
0.0 0.1 0.2 0.4 0.7 1.0 1.3 1.7 2.2 2.6 3.1 3.6 4.1 4.6 5.1 5.7 6.3 6.8 7.4 8.0 8.6 9.3 9.9 10.5 11.2 11.8 12.5 13.1 13.8 14.5 15.1 15.8 16.5 17.2 17.9 18.6 19.3 20.0 20.7 24.3 28.0 31.7 35.5 39.4 43.3 47.2 51.2

Autor: F. Kornblit

80 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006


90 128.3 124.1 118.1 113.1 107.6 73.3

Probabilidad y Estadstica Aplicada


69.1 65.6 61.8 59.2

4a.Valores crticos superiores de la Distribucin F, con = 0.05 (dejan a la derecha un rea igual al 5% del total)
=0.05
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 50 1 161 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.0 243.9 244.7 245.4 245.9 246.5 246.9 247.3 247.7 248.0 250.1 251.1 251.8 g.l. numerador 2 3 4 5 6 7 8 9 10 15 20 30 40 50 199 216 225 230 234 237 239 241 242 246 248 250 251 252 19.0 9.6 6.9 5.8 5.1 4.7 4.5 4.3 4.1 3.7 3.5 3.3 3.2 3.2 19.2 9.3 6.6 5.4 4.8 4.3 4.1 3.9 3.7 3.3 3.1 2.9 2.8 2.8 19.2 9.1 6.4 5.2 4.5 4.1 3.8 3.6 3.5 3.1 2.9 2.7 2.6 2.6 19.3 9.0 6.3 5.1 4.4 4.0 3.7 3.5 3.3 2.9 2.7 2.5 2.4 2.4 19.3 8.9 6.2 5.0 4.3 3.9 3.6 3.4 3.2 2.8 2.6 2.4 2.3 2.3 19.4 8.9 6.1 4.9 4.2 3.8 3.5 3.3 3.1 2.7 2.5 2.3 2.2 2.2 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.1 2.6 2.4 2.3 2.2 2.1 19.4 8.8 6.0 4.8 4.1 3.7 3.4 3.2 3.0 2.6 2.4 2.2 2.1 2.1 19.4 8.8 6.0 4.7 4.1 3.6 3.3 3.1 3.0 2.5 2.3 2.2 2.1 2.0 19.4 8.8 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.1 2.9 2.5 2.3 2.1 2.0 2.0 19.4 8.7 5.9 4.7 4.0 3.6 3.3 3.0 2.9 2.4 2.2 2.1 2.0 1.9 19.4 8.7 5.9 4.6 4.0 3.5 3.2 3.0 2.9 2.4 2.2 2.0 1.9 1.9 19.4 8.7 5.9 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.9 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8 19.4 8.7 5.8 4.6 3.9 3.5 3.2 3.0 2.8 2.4 2.2 2.0 1.9 1.8 19.4 8.7 5.8 4.6 3.9 3.5 3.2 2.9 2.8 2.3 2.1 1.9 1.9 1.8 19.4 8.7 5.8 4.6 3.9 3.4 3.2 2.9 2.8 2.3 2.1 1.9 1.8 1.8 19.5 8.6 5.7 4.5 3.8 3.4 3.1 2.9 2.7 2.2 2.0 1.8 1.7 1.7 19.5 8.6 5.7 4.5 3.8 3.3 3.0 2.8 2.7 2.2 2.0 1.8 1.7 1.6 19.5 8.6 5.7 4.4 3.8 3.3 3.0 2.8 2.6 2.2 2.0 1.8 1.7 1.6

g.l. denominador

Autor: F. Kornblit

81 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

4b.Valores crticos superiores de la Distribucin F, con = 0.01 (dejan a la derecha un rea igual al 1% del total)
=0.01
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 30 40 50 1 4052 98.5 34.1 21.2 16.3 13.7 12.2 11.3 10.6 10.0 9.6 9.3 9.1 8.9 8.7 8.5 8.4 8.3 8.2 8.1 7.6 7.3 7.2 2 199 19.0 9.6 6.9 5.8 5.1 4.7 4.5 4.3 4.1 4.0 3.9 3.8 3.7 3.7 3.6 3.6 3.6 3.5 3.5 3.3 3.2 3.2 3 216 19.2 9.3 6.6 5.4 4.8 4.3 4.1 3.9 3.7 3.6 3.5 3.4 3.3 3.3 3.2 3.2 3.2 3.1 3.1 2.9 2.8 2.8 4 225 19.2 9.1 6.4 5.2 4.5 4.1 3.8 3.6 3.5 3.4 3.3 3.2 3.1 3.1 3.0 3.0 2.9 2.9 2.9 2.7 2.6 2.6 5 230 19.3 9.0 6.3 5.1 4.4 4.0 3.7 3.5 3.3 3.2 3.1 3.0 3.0 2.9 2.9 2.8 2.8 2.7 2.7 2.5 2.4 2.4 6 234 19.3 8.9 6.2 5.0 4.3 3.9 3.6 3.4 3.2 3.1 3.0 2.9 2.8 2.8 2.7 2.7 2.7 2.6 2.6 2.4 2.3 2.3 g.l. numerador 7 8 9 237 239 241 19.4 19.4 19.4 8.9 8.8 8.8 6.1 6.0 6.0 4.9 4.8 4.8 4.2 4.1 4.1 3.8 3.7 3.7 3.5 3.4 3.4 3.3 3.2 3.2 3.1 3.1 3.0 3.0 2.9 2.9 2.9 2.8 2.8 2.8 2.8 2.7 2.8 2.7 2.6 2.7 2.6 2.6 2.7 2.6 2.5 2.6 2.5 2.5 2.6 2.5 2.5 2.5 2.5 2.4 2.5 2.4 2.4 2.3 2.3 2.2 2.2 2.2 2.1 2.2 2.1 2.1 10 242 19.4 8.8 6.0 4.7 4.1 3.6 3.3 3.1 3.0 2.9 2.8 2.7 2.6 2.5 2.5 2.4 2.4 2.4 2.3 2.2 2.1 2.0 15 246 19.4 8.7 5.9 4.6 3.9 3.5 3.2 3.0 2.8 2.7 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.2 2.2 2.0 1.9 1.9 20 248 19.4 8.7 5.8 4.6 3.9 3.4 3.2 2.9 2.8 2.6 2.5 2.5 2.4 2.3 2.3 2.2 2.2 2.2 2.1 1.9 1.8 1.8 30 250 19.5 8.6 5.7 4.5 3.8 3.4 3.1 2.9 2.7 2.6 2.5 2.4 2.3 2.2 2.2 2.1 2.1 2.1 2.0 1.8 1.7 1.7 40 50 251 252 19.5 19.5 8.6 8.6 5.7 5.7 4.5 4.4 3.8 3.8 3.3 3.3 3.0 3.0 2.8 2.8 2.7 2.6 2.5 2.5 2.4 2.4 2.3 2.3 2.3 2.2 2.2 2.2 2.2 2.1 2.1 2.1 2.1 2.0 2.0 2.0 2.0 2.0 1.8 1.8 1.7 1.7 1.6 1.6

g.l. denominador

Autor: F. Kornblit

82 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

APNDICE IV. EJERCICIOS DE APLICACIN


1. Un producto es elaborado en serie por dos lneas de produccin, paralelamente. Se tomaron dos muestras de 50 productos cada una, correspondientes a ambas lneas, midiendo en cada caso una misma caracterstica cuantitativa. Responder si es verdadero o falso: a) Si los dos histogramas correspondientes a cada lnea por separado revelan tener ambos distribucin normal, entonces el histograma elaborado con la muestra global de los 100 productos de ambas lneas, deber mostrar forzosamente una distribucin normal. b) El promedio de la muestra global de los 100 productos puede ser calculado como el promedio de los promedios de ambas lneas c) La desviacin estndar muestral de los 100 productos deber ser forzosamente menor que la desviacin estndar de ambas muestras por separado. d) Los siguientes datos representan los desvos, expresados en milmetros, respecto de un target de 150 mm para la longitud de una pieza producida por dos mquinas en paralelo. Se tienen dos muestras de 50 unidades cada una:
Mq I
1 0 2 -1 -1 3 4 3 3 -5 1 2 1 2 0 0 -2 -3 1 1 3 -3 -4 0 2 5 0 0 -3 -1 6 -2 -1 -1 -2 3 0 3 1 -1 -1 -2 -1 4 4 0 0 1 -2 4 1 3 4 5 3 2 3 4 2 4 3 3 1 2 3 4 1 5 -1 2 5 2 3 3

Mq II

2 -4 1 2 0 0 1 0 1 -5 -1 -1 -4 1 -4 -3 0 -3 -1 0 -1 -2 1 0 -2 1

Construir dos histogramas por separado para cada lnea, y uno global para los 100 datos c)Si las tolerancias para la longitud de esta pieza son 146 mm (lmite inferior) y 154 mm (lmite superior). Estimar la proporcin de unidades no conformes en cada muestra, y la proporcin global. d) Se precisa estimar las medias y desviaciones estndar poblacionales de ambos procesos. Cmo lo hara? 2. Si un sistema de refrigeracin funciona con probabilidad 98%, y un sistema de reserva se descompone el 3% de las veces, a) la probabilidad de que no funcione ninguno es: menos del 1%,? menos del 0,1 %?, menos de 100 ppm?, menos de 10 ppm? la probabilidad de que funcionen ambos sistemas es ms del 90 %? ms del 95 %?

Autor: F. Kornblit

83 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

ms del 99 %? ms del 99.5 %? 3. Una cadena de hamburguesas y comida rpida est por abrir una nueva sucursal. En base a estudios de mercado estima que sern necesarias 24 personas por turno para cubrir todas las tareas. Por otro lado, los registros de otras sucursales indican un porcentaje de ausentismo del 6% diario. Por lo tanto, para cubrir a los empleados faltantes, deben contratarse algunas personas ms que 24 por turno. a) Si se contratan 25 personas por turno, cul ser la probabilidad de que en un turno cualquiera no se cubran las tareas necesarias? b) dem, si se contratan a 26, 27, ..., 30 empleados por turno. cuntos empleados debern contratarse para cumplir el objetivo de que slo un da laborable por mes no puedan cubrirse las tareas necesarias?(1 mes = 20 das laborables) 4. Dado que no todos los pasajeros de una aerolnea abordan el vuelo que han reservado, la aerolnea vende 125 boletos para un vuelo de 120 asientos. Se sabe que la probabilidad de que un pasajero no aborde el vuelo es de 0,10 y el comportamiento es independiente. a) Cul es la probabilidad de que todos los pasajeros quieran abordar el vuelo? b) Cul es la probabilidad de que el vuelo quede vaco? 5. a) Un posible comprador de un lote desea realizar un muestreo para chequear proporcin de unidades defectuosas, con criterio de 0 defectos (o sea c = 0). Cun grande debe ser la muestra para asegurar el rechazo del 95% de los lotes que posean el 1,5% de defectuosos? b) dem si trabaja con un criterio de aceptacin de c=1, y de c=2 6. Si el nmero de baches en una ruta se toma como una variable aleatoria con media de 2 baches por kilmetro: a) Calcular la probabilidad de que no haya baches en un tramo de 5 km b) Calcular la probabilidad de que haya al menos un bache en un tramo de 0,5 km. 7. En funcin de registros anteriores, se sabe que, en cierto tipo de tela, aparece una media de 2 defectos de hilado por m2 de tela (se asume distribucin de Poisson). Si se inspecciona una muestra de 8 m2 de tela, cul ser la probabilidad encontrar ms de 15 defectos en esa muestra? y ms de 20? 8. En la fabricacin de maquinaria agrcola se utiliza gran cantidad de cierto tipo de piezas cilndricas. La especificacin para sus dimetros es: 5,8 mm 0,2 mm. Para la provisin de estas piezas han sido preseleccionados tres proveedores. Ellos declaran los siguientes parmetros para sus productos:

Autor: F. Kornblit

84 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

proveedor A B C

(mm) 5,600 5,85 5,8

(mm) 0,005 0,05 0,1

% NC (aproximado) inferior superior Total

a) Suponiendo distribucin normal, calcular aproximadamente el porcentaje de piezas no conformes que entregara cada proveedor (ltima columna) y recomendar a cul elegir a igualdad de precio. b) Si se eligen 25 piezas de B, calcular la probabilidad aproximada de que el promedio de las mismas supere los 5,87 mm: .................................... (NOTA: para este ejercicio no se requiere la tabla de la distribucin normal) 9. Un proveedor entrega una determinada materia prima en paquetes. Por contrato, los paquetes deben pesar ms de 650 g . Sin embargo, el peso de cada paquete es una variable aleatoria normal con = 656,5 g, y = 2,5 g. Para una inspeccin de recepcin, se extraen 50 paquetes, si 48 o ms de ellos cumplen con la especificacin prevista en el contrato, se acepta el envo. Calcular la probabilidad de que esto ocurra. 10. El peso neto de cereal una caja sigue una DN con = 600 g. El proceso de llenado de cajas debe ser diseado para que slo una caja de cada 100 quede fuera del intervalo 590 g - 610 g Cul deber ser el del proceso para alcanzar este objetivo? 11. a) Las tolerancias de un proceso son 1.500 0.005 . Un estudio basado en gran cantidad de datos de ese proceso inform una media =1.502 y una desviacin estndar de =0.002 . cul ser la fraccin defectuosa del proceso, suponiendo distribucin normal? b) Si es posible corregir el centrado del proceso, poniendo a punto la mquina, cul ser ahora la fraccin defectuosa del proceso? c) Un estudio de capacidad de 4 mquinas similares arroja los siguientes resultados: Mquina 1 2 3 4 1,4950 1,5021 1,5000 1,4979 0,0006 0,0012 0,0020 0,0020

Ordenar las mquinas de peor a mejor, en el caso de que sea posible corregir el centrado, y en el caso de que no lo sea. 12. En la fabricacin de una alfombra se usa una fibra con una resistencia a la traccin

Autor: F. Kornblit

85 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

que tiene una distribucin normal con media 75,5 psi y desviacin estndar 3,5 psi. Encuentre la probabilidad de que en una muestra aleatoria de n = 6, la media de la resistencia a la traccin sea mayor que 75, 75 psi. Cmo cambia la desviacin estndar de la media muestral si el tamao de la muestra pasa a n = 49? 13. El lmite mximo permitido de descarga de desechos slidos a un ro en una ciudad es de 60 mg/l diarios. Un minucioso estudio realizado en muestras de agua seleccionadas al azar del desecho de una fbrica durante un largo perodo de tiempo permiti saber que la cantidad de slidos descargados por da (en mg/l) es una v.a. con = 52, = 6. a) Calcular la probabilidad de que en un da cualquiera la fbrica no cumpla el requerimiento. (suponer distribucin normal) b) Calcular la probabilidad de que el promedio mensual de desechos no cumpla el requerimiento. Es necesaria aqu la suposicin de normalidad de a? 14.a) Se desea determinar la concentracin de cloruro de vinilo en una bebida gaseosa envasada en botellas plsticas. Se toman 20 botellas de la produccin de una fbrica, determinando la concentracin de cada botella, y promediando los 20 valores obtenidos. Si la muestra produjo una media de 0.5 ppm y una desviacin estndar s = 0.02 ppm, dar un I de C del 95 % para la concentracin media. b) Esta determinacin debe ser realizada diariamente en la fbrica. Para abaratar el ensayo, un ingeniero propone un mtodo alternativo: mezclar volmenes iguales de cada una de las 20 botellas muestreadas, obteniendo as un nico volumen, y realizar sobre esta mezcla una nica determinacin. Qu ventajas estadsticas tiene el primer mtodo sobre el segundo? c) Se propone un tercer mtodo, como una modificacin del anterior: en lugar de realizar una nica determinacin, se realizan 20 sobre la mezcla, promediando los resultados. Es este ltimo mtodo estadsticamente equivalente al primero? 15. Se desea dar un intervalo de confianza del 95% para el dimetro exterior de un cierto tipo de roscas. a) Si una muestra de 10 roscas presenta un dimetro promedio de 257 mm, y una desviacin estndar de 12 mm, qu lmites tiene el intervalo? Qu suposicin estadstica debe hacerse sobre los dimetros individuales de las roscas? b) Si en lugar de utilizar la desviacin estndar de la muestra dada se utiliza un valor histrico de = 13 mm como desvo estndar de los dimetros, cmo cambia el intervalo? 16. Un artculo cientfico describe las caractersticas de las varillas de combustible usadas en un reactor nuclear para la generacin de energa elctrica. El porcentaje de enriquecimiento medido en 12 varillas es el siguiente:
2,94 2,75 2,75 2,81

Autor: F. Kornblit

86 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

2,90 3,00

2,90 2,95

2,82 3,00

2,95 3,05

a) Encuentre un intervalo de confianza del 99% para el porcentaje promedio de enriquecimiento. b)est de acuerdo con la afirmacin del artculo de que le porcentaje promedio de enriquecimiento es del 2,95%?por qu? 17. Para llenar recipientes con un determinado producto lquido, se utiliza una mquina llenadora. Se elige una muestra 10 recipientes, obteniendo un volumen de llenado promedio de 1,026 litros. Si la desviacin estndar histrica del proceso de llenado es 0,06 litros, obtener un intervalo de confianza para la media del proceso, y deducir si es necesario tomar la decisin de ajustar la mquina llenadora. 18. Contestar si es V o F a. Al aumentar el nivel de confianza de un intervalo, disminuye la precisin b. Para duplicar la precisin de un intervalo de confianza para del 90%, hay que duplicar el tamao de la muestra. c. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media de un proceso. Esto significa que el 95% de las mediciones realizadas estn entre estos valores. d. (7.38 ; 8.21) es un intervalo de confianza del 95% para la media de un proceso. Esto significa que la probabilidad de que est entre 7.38 y 8.21 es del 95% . e. Si se repite 100 veces el proceso de estimacin de la media de un proceso, por intervalos de confianza del 95%, en aproximadamente 95 de las repeticiones el intervalo obtenido cubre a . f. Un intervalo de confianza puede ser utilizado para decidir si una determinada caracterstica de calidad se aparta significativamente de una especificacin. 19. Un fabricante de tubos de gas afirma que la longitud de sus tubos tiene una desviacin estndar de 0.04 m. Un cliente que dispone de 7 tubos comprados a ese fabricante, decide medirlos y obtiene una desviacin estndar muestral de 0.054 m. Alcanzan estos datos para refutar la afirmacin del fabricante, al nivel 0.05? y al nivel 0.10? (suponer distribucin normal) 20. En una muestra aleatoria de 30 focos, la desviacin estndar muestral de la duracin de un foco es de 12,6 horas. Calcule un intervalo de confianza para la varianza de la duracin del foco. 21. Una especificacin correspondiente al soporte de un cuadrante dice que debe medir menos de 320 mm. Una muestra de 40 elementos gener una media de 320.8 mm, y una desviacin estndar de 0.4mm Los datos obtenidos, revelan que la media del proceso es < 321 mm? 22 a).Un posible comprador desea, antes de efectuar la compra de fibras que sern

Autor: F. Kornblit

87 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

utilizadas en fabricacin de indumentaria, testear si la resistencia a la tensin de las mismas es por lo menos de 125 psi. Experiencias previas indican que la desviacin estndar de la resistencia es de 2 psi. Se elige una muestra de 8 fibras, obteniendo una resistencia media de 126 psi. Cmo debe plantear las hiptesis del test, y qu decisin toma al nivel a =0.05? b) El fabricante de las mismas fibras quiere estar seguro de que ellas tienen resistencia menor a 125 psi antes de estudiar una posible mejora en el proceso. De una muestra de 12 fibras obtiene una resistencia media de 122 psi. Contestar la misma pregunta que en a. 23. Un nuevo sistema de purificacin es instalado en un proceso qumico. Antes de su instalacin, una muestra de 10 mediciones dio un porcentaje medio de impurezas de 9.85, con un desvo estndar de 8.27, y luego de la instalacin, otra muestra de 8 mediciones produjo un porcentaje de impurezas de 8.08 con un desvo estndar de 7.46. a) Se puede concluir que las varianzas de ambos sistemas son iguales, o distintas, con = 0.10? (test F) b) Se puede concluir que las el nuevo sistema reduce el porcentaje de impurezas, con = 0.05? (test de Student) 24.a) Segn una especificacin, el valor medio de un proceso no debe bajar de 120. Ante la sospecha de un posible descenso en ese valor medio, se quiere justificar adecuadamente la decisin de ajustarlo, con un nivel del 5%. Para esto, se mide una muestra de n =10 unidades, obteniendo un promedio de 119,6, con una desviacin estndar muestral de 1 est debidamente justificada la decisin de ajustar la media del proceso? b) Repetir la respuesta anterior si la muestra tomada fue de n =36 unidades, habiendo obtenido un promedio de 119,6, con una desviacin estndar muestral de 1 25. Dos proveedores fabrican un engranaje de plstico una de cuyas caractersticas clave es la resistencia al impacto. Una muestra aleatoria de 10 unidades del primer proveedor dio por resultado x1 = 290 unidades y s1 = 12 unidades. Una muestra del segundo proveedor de 15 engranajes obtuvo x 2 = 321 unidades y s2 = 15 unidades. a) Considerando que las varianzas son iguales y con = 0,05 existe evidencia que pruebe que los engranajes del segundo proveedor tienen mayor resistencia la impacto? b) los datos apoyan la afirmacin del segundo proveedor de que sus engranajes tienen una resistencia de por lo menos 25 unidades ms que los del primero? c) existe evidencia suficiente para concluir que la varianza de la resistencia al impacto es diferente para los dos proveedores?

Autor: F. Kornblit

88 / 89

UTN FRBA - Maestra en Ingeniera en Calidad - 2006

Probabilidad y Estadstica Aplicada

APNDICE V. BIBLIOGRAFIA

ISO/TR 10017:2003 Guidance on statistical techniques for ISO 9001:2000 ISO 9000:2000, Sistemas de Gestin de Calidad Conceptos y vocabulario ISO 3534 Part I: 1993. Statistics -- Vocabulary and symbols -- Part 1: Probability and general statistical terms MONTGOMERY, D. Control Estadstico de la Calidad, Edit. Iberoamericana, o Ed. J. Wiley DUNCAN, A. Control de Calidad y Estadstica Industrial, Ed. Alfa Omega MILLER, J. FREUND, J., Probabilidad y Estadstica para Ingenieros, Ed. Limusa MEYER, R. Probabilidad y aplicaciones estadsticas, Editorial Fondo Educativo Americano. ENGINEERING STATISTICS, HANBOOK, Manual on-line de Ingeniera Estadstica publicado por el NIST, National Institute for Standards and Technology, http://www.itl.nist.gov/div898/handbook/ JURAN, Manual de Control de Calidad, versin en espaol de Mc Graw Hill.

Autor: F. Kornblit

89 / 89