Você está na página 1de 163

ESTADSTICA Y PROBABILIDAD

EL PODER DE LA INFORMACIN Y LA TOMA DE DECISIONES


MATERIAL DEL ESTUDIANTE

UNIDAD ESTADSTICA Y PROBABILIDAD

Roberto Araya Schulz Mauricio Moya Mrquez Gustavo Rodrguez Seplveda Marcelo Gonzlez Molina Mara Alicia Venegas Thayer Macarena Escalante Salamanca Osvaldo Baeza Rojas Manuel Galaz Prez

I.S.B.N.: 978-956-303-040-2 2 edicin: Febrero de 2008 2003 por Centro Comenius Universidad de Santiago de Chile Inscripcin N 165473 Derechos Exclusivos Reservados Universidad de Santiago de Chile Editado por Centro Comenius Universidad de Santiago de Chile San Martn 40 A oficina 6, Santiago Telfono: 6883261 Fax: 6727140 Diseo Juan Rojas R. Impreso XXXXXX XXXXXXXX

Matemtica Interactiva: Aprender matemtica creando soluciones


Centro Comenius Universidad de Santiago de Chile El Centro Comenius de la Universidad de Santiago de Chile, desarroll el modelo interactivo para el aprendizaje matemtico, en el proyecto FONDEF D00I1073 Aprender matemtica creando soluciones entre los aos 2001 y 2004. El modelo cuenta, para su implementacin en salas de clases, con material para el alumno (actividades, guas, proyectos, etc.), material del profesor (sugerencias pedaggicas para trabajar los materiales, los contenidos e integrar las tecnologas), material de referencia (tratamiento ms formal de la matemtica), materiales manipulativos concretos (fichas, dados, juegos, etc.), evaluaciones y recursos tecnolgicos que siguen los principios de diseo tericos sugeridos en el modelo. Sobre la base del modelo interactivo, en la actualidad se est desarrollando el proyecto Enlaces Matemtica, con aportes del Centro de Educacin y Tecnologa, Red Enlaces, del Ministerio de Educacin de Chile y del Centro Comenius de la Universidad de Santiago de Chile, implementndose en siete regiones del pas, con la colaboracin de las universidades asociadas.

Profesionales del Proyecto Fidel Oteza Morra Director del Proyecto Gonzalo Villarreal Farah Sub Director del Proyecto Manuel Galaz Prez Encargado operativo y coordinador de desarrollo de materiales Hernn Miranda Vera Roberto Araya Schulz Lorena Espinoza Salfate Investigadores asociados Osvaldo Baeza Rojas Macarena Escalante Salamanca Evelyn Herrera Toro Mauricio Moya Mrquez Gustavo Rodrguez Seplveda Alicia Venegas Thayer Nelly Devia Ormeo Mara Isabel Escobar Gutierrez Autores de textos y guas, material concreto y recursos tecnolgicos Juan Silva Quiroz Evelyn Herrera Toro Encargados de la plataforma virtual Gladys Bobadilla Abarca Investigadora Asociada y Especialista en contenidos Lucrecia Zamorano Aravena Instrumentos de evaluacin y revisin de materiales Sergio Reyes Gonzlez Anlisis estadstico Claudia Matus Correa Asesora anlisis estadstico Gerardo Honorato Gutirrez Cristin Reyes Reyes Miguel Muoz Jara Editores matemticos Jessica Marinkovic O'Ryan Dwight Pennanen Arias Roxana Donoso Loyola Apoyo operativo y logstico Juan Rojas Rivera Diagramacin, diseo y edicin grfica Mauro Silva Cuevas Hctor Ros Bolbarn Ingeniera y Soporte tcnico

7
Gua 1 Las preguntas iniciales

8
Gua 2 Qu hacer con los datos?
Organizar los datos para graficar e interpretar

15
Gua 3 Y ahora, qu hacemos con estos datos?

21
Gua 4 Formas de representar la informacin

36
Gua 5 Qu nos dicen los datos? I
Situaciones en contexto

45
Gua 6 Qu nos dicen los datos? II
Situaciones en contexto

54
Gua 7Cmo observar patrones en la informacin?
Sorpresas mgicas. Buscando patrones en la informacin

60
Gua 8Cmo saber qu nos intoxic?
rboles de segmentacin

71
Gua 9Es posible discriminar mediante rectas?
Segmentacin de una poblacin, usando mtodos grficos

80
Gua 10 Aplicando lo aprendido
Situaciones en contexto

90
Gua 11 Necesitamos un representante!
Medidas de tendencia central

101
Gua 12 Medidas de tendencia central
Datos agrupados

107
Gua 13 Juntos o separados?

117
Gua 14 Cmo distribuir los valores en una muestra?

130
Gua 15 Apropindose de la tcnica

135
Gua 16 Qu es y cmo se usa la distribucin normal

146
Gua 17 La distribucin normal estndar

153
Gua 18 De la distribucin binomial a la distribucin normal

158
Gua 19 Un mtodo para aprender de la experiencia

GUIA 1 LAS PREGUNTAS INICIALES


La era de la informacin
Actualmente, en la era de la informacin, se manejan una gran cantidad de datos numricos, en las ms diversas reas: ciencia y tecnologa, poltica, economa y negocios, social, entre otras. Los medios de comunicacin e Internet ponen a nuestra disposicin estos datos, muchas veces representados en tablas y grficos que nos muestran ciertos resultados. De nuestro conocimiento y capacidad de interpretacin depende si esos datos nos trasmiten algo o no, para establecer conclusiones o inferencias.

Las preguntas
1. 2. Cmo puedes mejorar tus decisiones a partir del manejo de informacin disponible? Ms de una vez escuchaste decir: Despus de la batalla somos todos generales, vale la pena preguntarse adems: por qu antes de la batalla no es lo mismo? En nuestro contexto, Cmo anticipar si una decisin es adecuada o no? Qu tipos de grficos estadsticos se observan comnmente en los medios de comunicacin? Cul es la ventaja de que un conjunto de datos est organizado en un grfico o una tabla? Cmo encontrar patrones de comportamiento o regularidades en los datos, de modo que permita hacer inferencias sobre una o ms poblaciones? Qu pueden decir la moda, la media aritmtica y la mediana respecto a un conjunto de datos? Qu puede decir la desviacin estndar respecto a un conjunto de datos? Es posible encontrar un intervalo para la media de un conjunto de datos fijando un cierto nivel de precisin? Es posible inferir acerca del comportamiento de una poblacin, a partir de una muestra tomada? Qu caractersticas debe tener esa muestra?

3. 4. 5. 6. 7. 8. 9.

10. Cul es el rol de la tecnologa en el manejo de la informacin hoy en da?

Unidad: Estadstica y Probabilidad

GUIA 2 QU HACER CON LOS DATOS?


ORGANIZAR LOS DATOS PARA GRAFICAR E INTERPRETAR
El propsito de esta gua es observar y comparar algunas representaciones grficas para la interpretacin de los datos, y obtener la informacin necesaria para responder determinadas preguntas. Comenzars realizando una actividad con algunos datos tuyos y de tus compaeros. Para ello, completa la siguiente tabla con el nombre de cada compaero y al lado de este, su estatura y el nmero de calzado que utiliza.
Nombre Estatura Calzado Nombre Estatura Calzado

Tabla 1

Unidad: Estadstica y Probabilidad

En la recta
Comenzaremos la bsqueda de una representacin grfica en la siguiente recta numrica de los datos de la Tabla 1. Para ello te proponemos tomar cada una de las estaturas y ubicarlas haciendo una marca en la recta que represente este valor de forma aproximada y bajo ella el nombre del compaero. Conversa con un compaero si se les ocurre otra manera de ubicarlas en la recta.

Unidad: Estadstica y Probabilidad

Observando slo la recta numrica con los datos que acabas de incorporarle, responde las siguientes preguntas: 1. Cul es el valor de la estatura que ms se repite?

2.

Entre qu valores se acumula la mayor parte de los datos?

3.

Realiza una estimacin del promedio de estaturas del grupo curso observando el grfico. Explica cmo lo calculaste.

4.

Qu dificultades encontraste al momento de representar los datos en la recta numrica?

5.

Consideras que a travs de este tipo de representacin te fue fcil responder las tres primeras preguntas? Por qu?

6.

Se te ocurre una manera ms resumida de organizar las estaturas del grupo curso? Comenta con tus compaeros y tu profesor.

10

Unidad: Estadstica y Probabilidad

En un histograma
A continuacin representars las estaturas de la tabla 1 a travs de un histograma1 . Para esto construye una tabla agrupando las estaturas en intervalos cuya longitud sea de 3 cm partiendo por la estatura menor y abarcando todas las registradas. Por ejemplo, [1,601,63[, [1,631,66[, etc.

Intervalo

Frecuencia

Frecuencia relativa

Frecuencia Relativa %

Tabla 2

Grafica las frecuencias relativas absolutas de los intervalos de la Tabla 2. Como se trata de intervalos, las barras van juntas.

1 La definicin de histograma la puedes ver en la Gua 4, que ms adelante ser estudiada con mayor detalle.

Unidad: Estadstica y Probabilidad

11

Observando esta representacin grfica, responde: 1. En qu intervalo se acumula el mayor nmero de datos?

2.

En qu intervalo se encuentra la menor cantidad de datos?

3.

Haz una estimacin del promedio de estatura del grupo curso observando el histograma. Cmo lo hiciste para obtener ese valor?

4.

Qu otro tipo de informacin puedes extraer del grfico? Comenta con tus compaeros.

5.

Al comparar el histograma con la recta numrica, en cul te fue ms cmodo realizar las estimaciones pedidas?

12

Unidad: Estadstica y Probabilidad

Grfico circular
La informacin presente en la Tabla 2, se puede representar a travs de un grfico circular o de torta. Para esto se utilizan los porcentajes de cada intervalo presentes en la Tabla 2. En la imagen que se encuentra a continuacin, divide los sectores de acuerdo a los datos obtenidos en la Tabla 2.

1.

Qu intervalo de datos abarca un mayor sector en el grfico?

2.

Qu intervalo abarca el menor sector en el grfico?

3.

Entrega una estimacin del promedio de estatura del grupo curso solo observando el grfico circular. Explica cmo lo calculaste.

4.

Qu otro tipo de informacin puedes extraer de la grfica? Comenta con tus compaeros.

Unidad: Estadstica y Probabilidad

13

Analizando la informacin
De acuerdo con el trabajo realizado en esta gua, escribe el tipo de informacin que es ms fcil de estimar con slo observar cada una de las siguientes representaciones grficas, es decir, sin la necesidad de realizar algn tipo de clculo: 1. Recta numrica.

2.

Histograma.

3.

Grfico circular o de Torta.

4.

Escribe un ejemplo en el cual consideres ms conveniente utilizar un grfico circular a un histograma.

5.

Escribe un ejemplo en el que consideres que es ms conveniente representar los datos a travs de un histograma que un grfico circular.

14

Unidad: Estadstica y Probabilidad

GUA 3 Y AHORA, QU HACEMOS CON ESTOS DATOS?


En la gua anterior recopilaste datos de tus compaeros respecto a su estatura y nmero de calzado. A continuacin, se presenta una manera grfica de relacionar estos dos conjuntos de datos lo que permitir hacer otro tipo de anlisis respecto a los atributos de tus compaeros. Partirs recordando cmo ubicar pares ordenados en el plano XY, herramienta que necesitars para poder representar los datos anteriores.

Tiro al blanco
1. Toma un lpiz tinta o pasta y djalo caer verticalmente desde una determinada altura sobre el blanco 12 veces.

2.

La posicin de cada uno de los puntos generados est determinada por una coordenada horizontal (x) y otra vertical (y). Anota en la siguiente tabla cada una de estas coordenadas. Aproxima los valores decimales a 5 dcimas o al entero ms cercano. Lanzamiento x y 1 2 3 4 5 6 7 8 9 10 11 12

Unidad: Estadstica y Probabilidad

15

3.

Grafica en una recta los datos de las posiciones horizontales (x)

4.

Grafica en otra recta los datos de las posiciones verticales (y)

5.

Estas coordenadas podemos escribirlas como pares ordenados (x, y) donde el primer valor es la posicin vertical (x) y el segundo, la horizontal (y). Ubica en el plano cartesiano cada uno de estos pares ordenados. Lanz. 1 2 3 4 5 6 7 8 9 10 11 12 (x, y)

Observemos que cada uno de estos puntos tiene una ubicacin dentro del plano y que esta depende de los valores de las coordenadas x e y. A continuacin, realizars una actividad donde este tipo de grfico ser aplicado para caracterizar hombres y mujeres de acuerdo a dos conjuntos de datos: estatura y calzado.

16

Unidad: Estadstica y Probabilidad

En la siguiente actividad necesitas los datos que recopilaste junto con tus compaeros en la Gua 2: Qu hacer con los datos? El objetivo es caracterizar a hombres y mujeres de acuerdo a su estatura y nmero de calzado. Comenzars ordenando la estatura y el calzado de cada compaero como par ordenado distinguiendo entre hombres y mujeres. Considera 15 hombres y 15 mujeres1. Considera x : estatura y : calzado Mujeres
Nombre (x, y) Nombre

Hombres
(x, y)

Slo observando la informacin ordenada en la tabla: 1. Puedes observar alguna diferencia entre las estaturas de los hombres respecto a las mujeres?

1 En aquellos cursos donde falten hombres o mujeres, el profesor cuenta con un banco de datos que podrn utilizar para realizar la actividad.

Unidad: Estadstica y Probabilidad

17

2.

Puedes observar alguna diferencia entre la talla de calzado de los hombres respecto a las mujeres?

De acuerdo con la tabla anterior, hay datos de mujeres y hombres. Para distinguirlos en el grfico se puede representar el punto asociado al par ordenado con otra forma o color. Por ejemplo, los pares ordenados asociados a datos de mujeres se marcarn con un y los de hombre con un O, cada investigador puede escoger la representacin que ms le acomode. En la siguiente plano XY utiliza una escala conveniente - si lo crees necesario, los ejes no necesariamente deben partir en el (0,0) - para graficar estos pares ordenados, recordando hacer la distincin entre hombres y mujeres, de tal manera que podamos encontrar alguna relacin entre los datos de una forma visual.

Observando el grfico anterior responde las siguientes preguntas: 3. Considerando el eje de las estaturas (X): a. Entre qu valores se acumulan todos los datos del curso?

18

Unidad: Estadstica y Probabilidad

b. En el intervalo [150 - 160], entre qu valores vara el calzado? Recuerda considerar hombres y mujeres

c. En el mismo intervalo anterior, se observan ms mujeres u hombres? cuntos de cada gnero?

d. Encuentra un intervalo de largo 10 cm. donde se acumule el mayor nmero de hombres y determina un intervalo para su calzado.

4.

Considerando el eje del nmero de calzado (Y) a. Entre qu valores se acumulan todos los datos del curso?

b. Qu estatura tienen los hombres cuyo calzado est entre 39 y 42, considerando estos valores?

Considerando el anlisis realizado


1. Puedes observar alguna diferencia entre la estatura de las mujeres respecto a los hombres?

2.

Observas diferencias entre el nmero de calzado de los hombres respecto al de las mujeres?

Unidad: Estadstica y Probabilidad

19

A modo de cierre
1. Notas alguna diferencia entre observar los datos desde una tabla a un grfico XY? Discute con tus compaeros y profesor respecto a las ventajas y desventajas que utilizar ese tipo de grfico.

20

Unidad: Estadstica y Probabilidad

GUA 4
FORMAS DE REPRESENTAR LA INFORMACIN
Un grfico puede valer ms que mil palabras, pero puede tomar muchas palabras para hacerlo 1 John Tukey

La presentacin de datos estadsticos por medio de grficos es considerada una tarea importante en el proceso de comunicacin de los datos, considerando que es algo que se realiza a diario y en forma casi natural por personas de las ms diferentes profesiones. Usualmente, cuando alguien recibe en sus manos un documento con grficos, la primera mirada se dirige a stos. A pesar de la reconocida importancia este proceso, no siempre se realiza de la mejor manera.

La revista americana LIFE tena como consigna Una foto vale ms que mil palabras. La capacidad de visualizacin del hombre hace que esto sea casi cierto. En comparacin con otras formas de presentacin de los datos, los grficos nos permiten comprender el comportamiento de los datos, de una mirada, an cuando se trate de datos muy complejos; por lo tanto, ahorran tiempo al momento de analizar la informacin. Los grficos estadsticos permiten usar nuestra habilidad visual para procesar informacin de un grfico. Esto nos permite hacer juicios respecto a la variabilidad, escala, patrones y tendencias de los datos.

Entre las funciones que cumplen los grficos se pueden sealar las siguientes: Hacer ms visibles los datos, sistemas y procesos. Poner de manifiesto sus variaciones y su evolucin histrica o espacial. Evidenciar las relaciones entre diversos elementos de un sistema o de un proceso, y representar la correlacin entre dos o ms variables. Sistematizar y sintetizar los datos, sistemas y procesos. Aclarar y complementar las tablas y las exposiciones tericas o cuantitativas. El estudio de su disposicin y de las relaciones que muestran puede sugerir hiptesis nuevas.

1 http://cran.r-project.org/doc/contrib/grafi3.pdf

Unidad: Estadstica y Probabilidad

21

Las variables
Antes de comenzar el estudio sobre los distintos tipos de grficos que existen para representar la informacin, es importante definir un concepto que aparece recurrentemente en todo estudio estadstico, el concepto de variable. Informalmente podemos decir que una variable es un valor o cualidad que cambia, ya sea de una persona a otra, de un da a otro, entre una situacin y la siguiente. Ejemplos de variables son: La temperatura tomada a una determinada hora del da es una variable, ya que puede variar de un da a otro. El nmero de hijos que tiene una familia, se considera como una variable puesto que una familia puede tener 2 hijos, otra 4, o bien 0 hijos (no tienen hijos). El color de pelo de una persona, que puede ser rubio, negro, caf, etc. La calificacin de un programa de televisin en Muy Bueno, Bueno, No me interesa, Malo y Muy malo. El Lugar en una carrera deportiva: 1 Lugar, 2 Lugar, 3 Lugar, etc. Las variables se presentan en dos tipos diferentes: cualitativas y cuantitativas que dependen de los tipos de datos utilizados como se resume en el siguiente esquema2:

Ahora, escribe al lado de cada uno de los ejemplos anteriores a qu tipo de variable corresponde de acuerdo con este esquema.

Conociendo los Tipos de Grficos


A continuacin, se presentan algunos tipos de grficos que es frecuente observar en los medios de comunicacin. Para realizar este estudio, el curso se dividir en 9 grupos. Cada uno se har cargo de un tipo de grfico, el que luego deber presentar al resto de sus compaeros. Este estudio estar apoyado por una presentacin en PowerPoint, en la cual se irn proyectando los diferentes tipos de grficos, con el objetivo organizar la presentacin que har cada uno de los grupos y generar un ambiente de discusin y participacin entre los alumnos y el profesor.
2 Referencia: Contenidos bsicos de Estadstica y Probabilidades, Eugenio Saavedra. Ed Univ. de Santiago, 2005.

22

Unidad: Estadstica y Probabilidad

Grfico de Lneas
Este tipo de grfico permite observar y analizar los valores que va tomando una variable, especialmente en un periodo determinado de tiempo. En el eje X o eje horizontal, se ubican las categoras en que se organizaron los valores, que normalmente se refieren a tiempo (horas, das, meses, etc.) Con relacin al eje Y o eje vertical se ubican los puntos que representan los valores que toma la variable en cada una de esas categoras. Estos puntos luego son unidos por una lnea. El siguiente grfico de puntos muestra las temperaturas promedios mensuales3 registradas durante un ao, donde el Eje Y son los Grados Celsius (C) y el Eje X, los meses de enero a diciembre.

Qu tipo de preguntas puedes responder a travs de este grfico? Por ejemplo: En qu mes se observa la mayor temperatura promedio?

3 Segn recomendacin de Organizacin Meteorolgica Mundial (OMM) La temperatura promedio diaria se calcula con la siguiente frmula:

T mx + T mn + T 1 + T 2 4

T 1 corresponde a la temperatura tomada a las 8 horas en invierno y a las 9 horas en verano. T 2 corresponde a la temperatura tomada a las 20 horas en invierno y a las 21 horas en verano.

Y la temperatura promedio mensual se obtiene sumando las temperaturas promedios diarias de un mes y dividindolo por el nmero de das que tiene el mes.

Unidad: Estadstica y Probabilidad

23

Grfico de Barras Simples


El grfico de barras muestra la frecuencia o frecuencias relativas porcentuales de cada una de las categoras, dispuestas en el eje horizontal. Las frecuencias se representan por el alto de una barra, reflejada en el eje vertical. Todas las barras tienen el mismo ancho y estn igualmente espaciadas unas de otras. Suele utilizarse para comparar, especialmente si el nmero de datos es razonablemente pequeo y con pocas categoras. Existen distintos tipos de grfico de barras, estos pueden ser simples, los cuales muestran slo una variable por categora o pueden ser mltiples, los cuales muestran ms de una variable por categora. Adems, las barras de los grficos pueden ser tanto horizontales como verticales. Observa los siguientes grficos de barras simples. Ambos representan los resultados obtenidos de una encuesta presentada por el diario de Mercurio en el mes de abril del 2007 a 300 nios entre 4 y 12 aos. La pregunta de la encuesta fue: En qu prefieren gastar su dinero los nios?

Podemos observar adems, el mismo grfico pero ahora con barras horizontales, donde ahora las categoras se ubican en el eje vertical y las frecuencias en el eje horizontal.

24

Unidad: Estadstica y Probabilidad

Con slo observar este tipo de grfico, podemos responder preguntas como: Por ejemplo: Cules son los productos que tienen aproximadamente el mismo porcentaje de preferencia?

Grficos de barras mltiples


Ahora observa los siguientes grficos de barras mltiples. Ambos representan el nmero de trabajadores, distinguiendo entre hombres y mujeres, en diferentes sectores laborales. Sectores Comercial Hombre 40 Mujer 71 Industrial 88 14 Tcnica 17 42 Salud 16 12 Educacin 12 6

O bien las barras pueden poner una sobre otra, lo que entrega una informacin adicional (Cul?)

Unidad: Estadstica y Probabilidad

25

Con este tipo de grfico podemos responder preguntas como: Por ejemplo: En cul o cules sectores se observa mayor nmero de mujeres que hombres?

Histograma4
El histograma permite graficar las frecuencias, frecuencias relativas y porcentuales para variables continuas, como por ejemplo, estaturas, peso, tiempo, entre otros. Para ello, se agrupan estos datos en intervalos, preferentemente de igual longitud, que se denominan clases. Para construir un histograma se debe considerar lo siguiente: las barras, que representan las frecuencias relativas de cada clase, deben tener una base de igual longitud que la clase y el alto est dado por la siguiente frmula:
Alto = Frec Re lativa de la clase Amplitud de la clase

El siguiente histograma, representa las frecuencias relativas obtenidas de las estaturas, en centmetros, de un grupo aleatorio de 150 personas. Observa la longitud de cada intervalo y el alto de cada barra.

4 http://cran.r-project.org/doc/contrib/grafi3.pdf

26

Unidad: Estadstica y Probabilidad

Observaciones
Cada barra debe tener rea igual a la frecuencia relativa del intervalo que forma su base. Por esta razn dividimos la frecuencia relativa de un intervalo por su longitud, y usamos este valor como la altura del rectngulo que dibujamos en el grfico. Como cada rectngulo del histograma tiene rea igual a la frecuencia relativa, y como la suma de todas las frecuencias relativas es igual a 1, se tiene que el rea total bajo el histograma es igual a 1, pues corresponde a la suma de las reas de los rectngulos. Puedes observar esto en el histograma anterior. La Regla de Sturgest es til para determinar el posible nmero de intervalos, esta dice que un nmero razonable de intervalos es 1+3,3 logn, donde n es el nmero total de datos. En el caso que las longitudes de las clases sean iguales, como en el ejemplo anterior, es posible construir el histograma considerando, como alto de barras, slo las frecuencias relativas o absolutas de las variables:

Qu preguntas responderas a travs de un histograma? Por ejemplo: Cul es el intervalo donde se encuentra el mayor nmero de personas?

Unidad: Estadstica y Probabilidad

27

Polgono de Frecuencias
A partir del histograma se construye el grfico conocido como polgono de frecuencias, uniendo a travs de una lnea los puntos correspondientes a los pares ordenados originados por cada marca de clase y su respectiva frecuencia relativa. La marca de clase es el punto medio de cada clase y se obtiene sumando los extremos de los intervalos y dividindolo por dos. Adems, se incluyen dos intervalos de frecuencia cero, uno en cada extremo de la distribucin. Considerando el histograma de las estaturas, entregado anteriormente, a continuacin se presenta su correspondiente Polgono de Frecuencias. Marca Frecuencia de clase (%) 114,5 124,5 134,5 144,5 155,5 164,5 174,5 184,5 194,5 204,5 0 0,04 0,1 0,16 0,17 0,24 0,15 0,12 0,02 0 Polgono de Frecuencias, considerando la marca de clase de cada uno de los intervalos

Estaturas [110 - 119[ [120 - 129[ [130 - 139[ [140 - 149[ [150 - 159[ [160 - 169[ [170 - 179[ [180 - 189[ [190 - 199[ [200 - 209]

Entonces el Polgono de Frecuencias asociado es el siguiente:

28

Unidad: Estadstica y Probabilidad

Qu tipo de preguntas puedes responder al observar un polgono de frecuencias? Por ejemplo: Entre qu estaturas se encuentra la mayor parte de la muestra?

Grfico Circular o de Sectores


El grfico circular es un crculo que se divide en tantas porciones como categoras existan, de modo que a cada una de las categoras (variables cualitativas) le corresponde un sector del crculo proporcional a su frecuencia relativa o absoluta. El grfico circular es apropiado si el propsito es comparar la frecuencia de cada categora con la frecuencia total, y la limitacin principal es que puede representar solamente una variable, aunque desde luego, varios grficos circulares pueden ser usados para representar varias variables. Otro punto a considerar es el nmero de categoras, se recomienda a lo ms 6 7. Mediante un sector circular se representan las medidas angulares correspondientes a las diferentes categoras, respetando el orden establecido en la tabla y partiendo de un punto dado de la circunferencia. Ese punto dado generalmente es el punto ms alto de la circunferencia (12 en el reloj). Si el nombre de la variable que se representa en cada sector no puede colocarse dentro del mismo, se elabora una leyenda o se coloca fuera, adyacente al mismo. Se acostumbra a diferenciar los sectores con diferentes colores, lo que hace que resulte un grfico ms vistoso que el de barras simples. Observa el siguiente grfico circular extrado del peridico electrnico www.emol.cl, el da martes 19 de diciembre de 2006. Radiografa del sistema privado de salud

Unidad: Estadstica y Probabilidad

29

Considerando que el nmero total de cotizantes es de aproximadamente 1.500.000 se pueden formular preguntas como: Por ejemplo: Qu Isapre concentra el mayor nmero de cotizantes?

En resumen, los grficos circulares son una alternativa frente a los grficos de barras y son bastante simples de realizar. El dimetro de un grfico circular es arbitrario, pero el ngulo de cada sector circular es proporcional a la frecuencia de la categora correspondiente.

Ojiva
La ojiva es un grfico que muestra la frecuencia acumulada en el eje vertical de los valores de la variable, dispuestos en el eje horizontal. Los valores de cada frecuencia acumulada se representan por el alto de los puntos con relacin al eje vertical. Cada uno de estos puntos se conecta mediante una lnea. Su objetivo, al igual que el histograma y el polgono de frecuencias, es representar distribuciones de frecuencias de variables cuantitativas continuas, pero slo para frecuencias acumuladas. En el centro de Santiago se encuest a 40 personas, preguntndoles cuntas horas haban dormido la noche anterior. Los resultados de dicha encuesta se resumen en la siguiente tabla:
N de horas que durmi Frecuencia Frecuencia Acumulada Frecuencia Acumulada % N de horas que durmi Frecuencia Frecuencia Acumulada Acumulada %

Frecuencia

[0 - 1[ [1 - 2[ [2 - 3[ [3 - 4[ [4 - 5[ [5 - 6[

1 0 2 3 5 7

1 1+0=1 1+2=3 3 + 3 =6 6 + 5 = 11 11 + 7 = 18

2,5 % 2,5 % 7,5 % 15 % 27,5 % 45 %

[6 - 7[ [7 - 8[ [8 - 9[ [9 - 10[ [10 - 11[ [11 - [

9 6 4 2 1 0

18 + 9 = 27 27 + 6 = 33 33 + 4 = 37 37 + 2 = 39 39 + 1 = 40 40 + 0 = 40

67,5 % 82,5 % 92,5 % 97,5 % 100 % 100 %

El intervalo [11 - ...[ indica que la persona durmi ms de 11 horas.

30

Unidad: Estadstica y Probabilidad

En el siguiente grfico de ojivas se observan las frecuencias acumuladas (%) de acuerdo a los resultados obtenidos en la encuesta.

Qu preguntas puedes responder con slo observar este grfico? Por ejemplo: qu porcentaje de encuestados durmi menos de 3 horas la noche anterior?

Grfico de Dispersin
El grfico de dispersin muestra la relacin entre dos variables cuantitativas como un conjunto de puntos. Dadas dos variables, X e Y, tomadas sobre los mismos elementos de una poblacin, el grfico de dispersin ser un grfico de dos dimensiones, donde en el eje vertical (eje X) se grafica una variable, y en el eje horizontal (eje Y) la otra. El objetivo es determinar si existe una relacin lineal entre los cambios observados para estas dos variables y se conoce como correlacin lineal. Las posibles situaciones que se pueden dar en cuanto a esta relacin existente entre dos variables son: Correlacin Positiva, esto quiere decir que al aumentar el valor de una de las variables, los valores de la otra variable tambin aumentarn. Y viceversa, si disminuyen los valores de una de las variables, los valores de la otra variable tambin disminuirn. Correlacin Negativa, esto quiere decir que al aumentar el valor de una de las variables, los valores de la otra variable disminuyen. Y viceversa, si disminuyen los valores de una de las variables, los valores de la otra variable aumentan.
Unidad: Estadstica y Probabilidad

31

Si los valores de ambas variables se revelan independientes entre s, se afirmara que no existe correlacin.

Tambin existe la posibilidad de que dos variables se relacionen de manera logartmica, exponencial o cuadrtica, que ahora no estudiaremos pero que si te interesa puedes investigar. A continuacin se muestra una tabla5 con algunas ciudades de Chile y el nombre de la estacin meteorolgica, se indica adems su latitud y la temperatura promedio anual6 que se registra en cada una de ellas. Ciudad / Estacin Arica / Chacalluta Antofagasta / Cerro Moreno Copiap / Chamonate La Serena / La Florida Valparaso / Punta ngeles Santiago / Quinta Normal Isla Juan Fernndez Curic / General Freire Chilln / General Bernardo O'Higgins Concepcin / Carriel Sur Temuco / Manquehue Valdivia / Pichoy Puerto Montt / El Tepual Coyhaique / Teniente Vidal Balmaceda / Aeropuerto Punta Arenas / Carlos Ibez Latitud () 18,5 23,4 27,3 29,9 33,0 33,4 33,6 35,0 36,6 36,8 38,8 39,6 41,4 45,6 45,9 53,0 T Prom. 18,7 16,4 15,2 13,6 14,0 14,4 15,3 13,1 12,7 12,2 11,2 11,0 10,1 8,1 6,4 5,9

5 Gentileza de la Direccin Meteorolgica de Chile 6 Es el promedio de las Temperaturas medias mensuales para el periodo 1970-1990.

32

Unidad: Estadstica y Probabilidad

En el siguiente grfico de dispersin es posible observar la relacin que existe entre las variables latitud y temperatura.

1.

De acuerdo con el grfico anterior, puedes afirmar que existe una correlacin entre la latitud y la temperatura de las ciudades? Explica.

2.

Escribe dos ejemplos en los cuales puedes utilizar un grfico de dispersin para analizar los datos. Discute con tus compaeros y profesor.

Unidad: Estadstica y Probabilidad

33

Pirmide Poblacional

Este tipo de grficos permite presentar en forma comparativa, la distribucin de la poblacin, por rangos de edad, segn dos grupos, por ejemplo, hombres y mujeres.

Pirmide de Poblacin Mundial en 1998

Pirmide de poblacin mundial estimada para el ao 2050

1.

De acuerdo con la Pirmide de Poblacin Mundial en 1998, cules son las caractersticas de la poblacin de ese ao?

2.

Qu diferencias distingues entre la poblacin de 1998 y la que se espera para 2050? Existen similitudes?

7 http://cran.r-project.org/doc/contrib/grafi3.pdf

34

Unidad: Estadstica y Probabilidad

Y para finalizar
De acuerdo a las presentaciones que se realizaron, responde: 1. Qu diferencias puedes observar entre un grfico de barras y un histograma?

2.

Qu diferencias puedes observar entre el grfico de puntos y el polgono de frecuencias?

Unidad: Estadstica y Probabilidad

35

GUA 5 QU NOS DICEN LOS DATOS? I


SITUACIONES EN CONTEXTO
Con frecuencia, encontramos que los medios de comunicacin (diarios, revistas, TV, Internet, etc.), nos entregan informacin estadstica, organizada en grficos y tablas de variadas formas. Estas representaciones son escogidas de manera que muestren lo ms claro posible el comportamiento de los datos observados. Las tendencias o comportamientos permiten inferir o extrapolar cierta informacin, por ejemplo: si se trata de la cantidad de lluvia cada, es posible investigar la posibilidad de sequa y el grado de riesgo para los cultivos agrcolas. Sin duda, la exigencia del mundo moderno nos transmite que es fundamental saber leer e interpretar informacin representada en las distintas formas grficas o en la tabulacin de datos, la comprensin nos llevar a tomar mejores decisiones, desarrollando con ello, nuestro razonamiento crtico, basado en la valoracin de la evidencia que suponemos ante todo objetiva. A continuacin se propone que analices un conjunto de situaciones que involucran diferentes tipos de informacin presentada en diferentes formas.

Infidelidad en la pareja1
Lo dicen las encuestas: la mayora de las personas desea una relacin de pareja estable y duradera. Lo indican los ratings: las historias de amor, los romances, las venturas y desventuras de las parejas nos interesan. Nos motivan, nos identifican. Nos vemos reflejados en esos amores arrobadores. Y tambin, desgraciadamente, en esas dolorosas traiciones. El dolor, el horror, el desconcierto son sentimientos que se suceden, al principio en un estado de shock y que cuesta mucho contener y llevar. Tampoco logran mostrar el largo camino hacia el perdn. Y menos se habla del valiente proceso que siguen quienes logran superar realmente esta situacin.
Fragmento, Andrea Poms Aguirre / Terapeuta Familiar y de Parejas.

Se entrevist a una muestra de 2.000 personas de una poblacin2 cuya edad estuviera entre 20 y 40 aos, preguntando por la fidelidad hacia su pareja, los resultados estn resumidos en el siguiente grfico circular.

1 http://www.centroespiral.cl/documentos/infidelidad.pdf 2 Una poblacin es un conjunto de personas u objetos que presentan una determinada caracterstica y sobre el que se va a llevar a cabo una investigacin. Se habla de muestra cuando se consideran slo algunos elementos de la poblacin que sirven para representarla.

36

Unidad: Estadstica y Probabilidad

1.

Expresa con tus palabras la informacin que est resumida en el grfico de torta.

2.

Quines son ms infieles, los hombres o las mujeres? Qu porcentaje representa cada uno de ellos?

3.

De acuerdo a la muestra de la poblacin, cuntas personas han sido infieles a su pareja? Cuntos hombres? Cuntas mujeres?

4.

Qu otro tipo de grfico utilizaras para representar esta informacin y hacer la distincin entre hombres y mujeres? Constryelo.

Unidad: Estadstica y Probabilidad

37

Extinciones causadas por la actividad humana3


El impacto creciente de las actividades humanas en la naturaleza est provocando una prdida de biodiversidad acelerada. La causa principal es la destruccin de ecosistemas de gran inters, cuando se ponen tierras en cultivo desecando pantanos o talando bosques, cuando se cambian las condiciones de las aguas o la atmsfera por la contaminacin, o cuando se destruyen hbitat en la extraccin de recursos. Adems la caza, la introduccin de especies exticas y otras actuaciones han provocado la extincin de un buen nmero de especies.

(EX) Se dice que un taxn se ha extinguido cuando no hay duda fundada de que el ltimo individuo ha muerto. (EW) Cuando slo sobrevive en cultivo, cautividad o como poblacin (o poblaciones) naturalizadas en un lugar distinto de su
hbitat original. (CR) Cuando tiene un riesgo muy alto de extincin en un futuro cercano (Usando los criterios correspondientes) (EN) Cuando su situacin no es crtica pero se enfrenta con un alto riesgo de extincin en un futuro cercano (Usando los criterios correspondientes)

Considerando los datos proporcionados por la tabla anterior, responde: 1. Describe con tus palabras la informacin que proporciona la tabla.

3 http://www.tecnun.es/asignaturas/ecologia/Hipertexto/12EcosPel/123BiodivPelig.htm

38

Unidad: Estadstica y Probabilidad

2.

Cul de las especies tiene mayor nmero de extinciones en la vida salvaje?

3.

Cuntos bivalvos se encuentran gravemente amenazados?

4.

Cul es la cantidad total de especies extinguidas? Cul es la especie con mayor nmero de extinciones?

5.

Cul(es) es(son) la(s) especie(s) que tiene un nmero de extinciones mayor a la de los insectos?

Unidad: Estadstica y Probabilidad

39

Analfabetismo en Chile4
Las cifras de analfabetismo en el pas son difciles de precisar porque cuando se realizan los censos generalmente se pregunta de forma oral a los encuestados si saben leer y escribir. Es fcil imaginar que por vergenza o para evitar la discriminacin de sus pares, las personas respondan que s. Adems, hay otro aspecto, por analfabeto se entiende a quien no es capaz de leer ni escribir, sin embargo, existen los analfabetos por desuso, es decir, aquellas personas que en algn momento de sus vidas s pudieron efectuar ambas labores pero que por falta de prctica han olvidado por completo cmo hacerlo. A quienes desde pequeos les ensearon a leer y escribir puede parecerles inconcebible sobrevivir hasta edad avanzada en una cultura que por definicin es letrada. Cuesta imaginarse las innumerables estrategias que habrn debido desarrollar para llegar a ser productivos. Para ellos no basta alcanzar la esquina de cualquier calle para leer un cartel y saber dnde estn ubicados, si quieren tomar una micro tienen que preguntar a otro qu nmero tiene para llegar a destino, tampoco pueden descifrar el titular de un diario expuesto en un quiosco, firmar un contrato o votar con seguridad en las elecciones. 1. Qu informacin nos entrega el grfico presentado?

2.

Qu indican las barras en el grfico?

4 http://gerontologia.uchile.cl/docs/entre_1.htm

40

Unidad: Estadstica y Probabilidad

3.

Cul es la regin con mayor analfabetismo?

4.

Cul es la regin con menor analfabetismo?

5.

Cules son las regiones con menos de 30.000 analfabetos?

6.

Cul es la poblacin estimada de analfabetos en la sptima regin?

7.

Cul es la poblacin estimada de analfabetos en el pas?

8.

A travs del grfico es posible determinar cul es la regin con una mayor proporcin de analfabetismo? Justifica.

Unidad: Estadstica y Probabilidad

41

Calentamiento Global5
El Calentamiento global es una teora que explica el aumento en la temperatura media de la atmsfera terrestre y de los ocanos, motivada por el efecto invernadero causado por las emisiones de dixido de carbono (CO2) y otros gases. La temperatura se ha elevado desde finales del siglo XIX, cuando se puso fin a una etapa de unos 400 aos conocida como "pequea glaciacin" y se estima que en gran medida es debido a la actividad humana, incrementndose durante los ltimos decenios. La teora predice, adems, que las temperaturas continuarn subiendo en el futuro si continan las emisiones de gases invernadero. El llamado "Efecto Invernadero" consiste en la elevacin de la temperatura del planeta provocada por la accin de un determinado grupo de gases, algunos de ellos producidos masivamente por el hombre, que retienen el calor de la atmsfera. Este fenmeno evita que el calor del Sol recibido por la Tierra deje la atmsfera y vuelva al espacio, produciendo a escala planetaria un efecto similar al observado en un invernadero. 1. De acuerdo a la lectura y el grfico presentado, cules son las variables involucradas?

2.

Entre qu valores fluctu la temperatura entre los aos 1000 y 1800? Qu ha sucedido a partir de 1800?

5 http://es.wikipedia.org/wiki/Calentamiento_global

42

Unidad: Estadstica y Probabilidad

3.

Entre qu valores fluctuaron las emisiones de CO2 entre los aos 1000 y 1800? Qu ha sucedido a partir de 1800?

4.

En la lectura inicial se dice que el aumento de la temperatura media de la atmsfera y de los ocanos se debe al efecto invernadero causado por la concentracin de CO2. De qu manera se puede inferir esto a partir del grfico?

5.

Qu pasar en el futuro si las condiciones ambientales no cambian dentro de los prximos 10 aos?

Manejo de la Informacin
En base a lo realizado, responde las siguientes preguntas: 1. En cuanto al manejo de la informacin en estadstica, Qu ventajas observas al tabular los datos?

2.

Para qu sirven los grficos? Qu informacin se puede extraer de ellos?

Unidad: Estadstica y Probabilidad

43

3.

Qu ventajas trae el saber leer e interpretar una tabla de datos? Por qu?

4.

Qu ventajas trae el saber leer e interpretar un grfico? Por qu?

5.

Cuntos tipos de grficos observaste? Cules son sus nombres?

44

Unidad: Estadstica y Probabilidad

GUA 6 QU NOS DICEN LOS DATOS? II


SITUACIONES EN CONTEXTO

Test de Cooper1
El Test de Cooper es una prueba de condicin fsica. Sirve para medir la resistencia aerbica y medir el VO2 mximo, que es la capacidad mxima del organismo para metabolizar el oxgeno en la sangre. Fue diseada por el Dr. Kennth H. Cooper en 1968 para el ejrcito de los EE.UU. Actualmente, se utiliza en diversos mbitos como sistema de evaluacin (Establecimientos de enseanza media y Facultades de Educacin Fsica) o como medio de clasificacin de los aspirantes en pruebas fsicas de acceso a los cuerpos de polica, bomberos, ejrcito, etc. El objetivo de la prueba es recorrer la mxima distancia posible en 12 minutos, y se evala bajo la siguiente tabla de datos.

1 http://es.wikipedia.org/wiki/Test_de_Cooper

Unidad: Estadstica y Probabilidad

45

1.

Mario tiene 15 aos y su hermano Sergio tiene 24, si al cabo de correr 12 minutos ambos alcanzan una distancia de 2450 metros, cul de los dos tiene mejor condicin fsica?

2.

Paula recorre 2,45 kilmetros y su hermana Carla de 18 aos recorre 1,5 kilmetros en 12 minutos. Si Paula tiene el doble de edad que Carla, qu condicin fsica tiene cada una?

3.

Ren tiene ms de 50 aos. Si al realizar el Test de Cooper, los resultados indican que su condicin fsica es buena, Cuntos metros como mnimo debi alcanzar en los doce minutos?

4.

Segn el Test de Cooper, Alicia tiene condicin fsica mala, si recorri 1750 metros, segn la tabla de datos, Qu edad podra tener Alicia?

5.

Es posible conocer el gnero de una persona que a sus 45 aos, realiz el Test de Cooper, y logr alcanzar una distancia de 2 kilmetros? Si Cul es el gnero? NO Por qu?

46

Unidad: Estadstica y Probabilidad

6.

Mauricio tiene 16 aos y su sueo es ingresar al cuerpo de bomberos. Para poder ingresar debe tener al menos, buena condicin fsica segn el Test de Cooper. Considerando que su ltimo registro en la prctica fue de 231.500 centmetros, con esta marca ingresa al cuerpo de bomberos? Si Por qu? NO Qu distancia le falta para obtener el mnimo de aprobacin?

Salud desde los primeros meses de vida2


Las vacunas (del latn vaccinus-a-um, vacuno; de vacca-ae, vaca) son preparados antignicos atenuados, confieren respuesta inmune pero no provocan enfermedad. Esta respuesta genera memoria inmunolgica produciendo, en la mayora de los casos, inmunidad permanente frente a la enfermedad. La vacuna fue inventada por Edgard Jenner. Las vacunas se clasifican en dos grandes grupos: (a) vacunas vivas o atenuadas (b) vacunas muertas o inactivadas. Existen varios mtodos de obtencin: (1) Vacunas avirulentas preparadas a partir de formas no peligrosas del microorganismo patgeno. (2) Vacunas posificadas a partir de organismos muertos o inactivos (3) Antgenos purificados (4) Vacunas genticas Las vacunas se administran por medio de una inyeccin, o por va oral (tanto con lquidos como con pastillas). Es por medio de las vacunaciones masivas, que se mantienen los niveles de proteccin adecuados en el mundo. Al ser proporcionado el libre acceso de vacunacin para los nios, podemos controlar, eliminar y erradicar enfermedades prevenibles o absolutamente evitables, tales como: Sarampin, Tos Convulsiva, Poliomielitis paraltica, Tuberculosis, Ttanos, Difteria, Rubola, Parotiditis.

2 http://es.wikipedia.org/wiki/Vacuna

Unidad: Estadstica y Probabilidad

47

Cundo deben ser vacunados los nios?3


La siguiente tabla de datos muestra el Calendario de vacunaciones, que se utiliza en todos los vacunatorios, y que sigue las normativas del Ministerio de Salud y de la Organizacin Mundial de la Salud.

Contra: (1) Tuberculosis (2) Difteria (3) Ttanos (4) Tos Convulsiva (5) Poliomielitis (6) Infecciones graves producidas por HIB (7) Sarampin (8) Rubola (9) Paperas

1.

Segn la tabla de datos, cules son las variables involucradas?

2.

Desde qu edad se vacuna a un nio? Cmo se llama la primera vacuna?

3.

Desde qu edad se vacuna a un nio contra la Influenza B?

4.

Cuntas veces debe ser proporcionada la vacuna de antipolio y a qu edades?

3 http://www.minsal.cl/ici/calendariovacunacion.htm

48

Unidad: Estadstica y Probabilidad

5.

Cuntas veces debe ser proporcionada la vacuna Tresvirica y a qu edades? De qu enfermedades nos previene esta vacuna?

Antes de analizar las siguientes tres actividades, aclararemos algunos conceptos respecto a las mediciones meteorolgicas que aqu se presentan, de acuerdo con la Organizacin Meteorolgica Mundial (OMM): La temperatura promedio diaria se calcula con la siguiente frmula: T 1 corresponde a la temperatura tomada a las 8 horas en invierno y a las 9 horas en verano. T 2 corresponde a la temperatura tomada a las 20 horas en invierno y a las 21 horas en verano.

T mx + T mn + T 1 + T 2 4

Y la temperatura promedio mensual se obtiene sumando las temperaturas promedios diarias de un mes y dividindolo por el nmero de das que tiene el mes. El climograma presenta temperaturas promedio mensuales considerando un registro de 30 aos, 1961 - 1990. Para calcular las precipitaciones observadas de forma: Diaria, es decir, precipitaciones acumuladas en 24 horas (en mm de agua cada), registradas desde las 8.00 a 20.00 horas en invierno y de 9.00 a 21.00 horas en verano. Mensual: El promedio de precipitaciones mensuales se obtiene sumando las precipitaciones acumuladas diariamente y luego se divide por el nmero de das del mes. El climograma presenta un promedio mensual de precipitaciones acumuladas considerando un registro de 30 aos (1961-1990). Este promedio indica lo normal a la fecha.

Unidad: Estadstica y Probabilidad

49

Punta Arenas y su clima4


Punta Arenas es una ciudad ubicada en el extremo austral del pas, de coordenadas geogrficas 53 8` de latitud sur, 70 53` de longitud oeste, con una elevacin media de 3 metros. Predomina un clima continental transandino con degeneracin esteparia. En esta zona, donde Chile logra un desarrollo transandino se produce la concurrencia de valores modestos de la precipitacin, con regmenes de distribucin anual muy homognea, originndose un clima fro con humedad suficiente, que se aproxima al de una estepa. La regularidad de las precipitaciones, pero con promedios que no sobrepasan los 300 mm, fuertes vientos dominantes del oeste y bajos promedios trmicos, son los rasgos caractersticos del clima de la Patagonia. Los bajos promedios trmicos no resultan exagerados si se considera la latitud de la regin. Dada la irregular topografa de la zona, que presenta una configuracin orogrfica desmembrada con una sucesin de islas, archipilagos y pennsulas recortadas por una infinidad de canales y fiordos, se presenta una hidrografa catica, son muy pocos los ros que van de cordillera a mar y por lo general son de corto desarrollo. 1. Describe con tus palabras la informacin representada en el grfico o climograma.

2.

Qu indican las barras en el grfico?

3.

Qu indica la curva en el grfico?

4 http://www.meteochile.cl/climas/climas_localidades.html#puntaarenas

50

Unidad: Estadstica y Probabilidad

4.

Segn el grfico, Cul es el mes ms lluvioso? Y el menos lluvioso?

5.

Segn el grfico, Cul es el mes ms caluroso? Y el ms fro?

6.

Segn el grfico, Qu meses registran un promedio mayor a los 9 C?

7.

Segn el grfico, Qu meses registran un promedio menor a los 30 mm en precipitaciones?

8.

Tiene sentido decir que en el mes de Marzo, las temperaturas son iguales a las precipitaciones? Por qu?

Unidad: Estadstica y Probabilidad

51

Antofagasta y su clima5
Antofagasta es una ciudad ubicada en una regin de aridez extrema. Sus coordenadas geogrficas son 23 38` de latitud sur, 70 25` longitud oeste, con una elevacin media de 40 metros. En la faja costera de la zona impera un clima desrtico con nublados abundantes, siendo los elementos climticos sobresalientes la ausencia de precipitaciones, un alto porcentaje de das con nublados matinales, humedad relativa elevada y temperaturas que presentan poca variacin diurna y estacional. Esta uniformidad se debe a la cercana del ocano, a la influencia moderadora de la corriente de Humboldt y a la presencia del anticicln semipermanente del Pacfico sur, que genera estabilidad atmosfrica. A pesar de todo el rigor del desierto, es posible encontrar algunos recursos hdricos, principalmente puntos de afloramiento de aguas subterrneas en cauces de quebradas secas. El ro Loa, de modesto caudal, es el nico que presenta escurrimiento continuo y que desemboca en el mar. 1. De acuerdo al grfico (climograma), cules son las variables involucradas?

2.

De acuerdo al grfico, Cules son los meses que no registraron precipitaciones?

3.

Segn el grfico, Qu meses registran un promedio mayor a los 15 C?

5 http://www.meteochile.cl/climas/climas_localidades.html#antofagasta 6 Gentileza de la Direccin Meteorolgica de Chile

52

Unidad: Estadstica y Probabilidad

Las siguientes preguntas estn dirigidas a comparar el clima de ambas ciudades de acuerdo a los datos presentados en los grficos:

4.

Cul es la escala utilizada en cada grfico para las temperaturas y las precipitaciones?

5.

En cul de los dos se registran las mayores temperaturas?

6.

En cul de los dos se registran las mayores precipitaciones?

7.

Es correcto afirmar que: en enero se registraron temperaturas similares? Justifica.

8.

Es correcto afirmar que: en septiembre se registr la misma cantidad de precipitaciones?

Unidad: Estadstica y Probabilidad

53

GUIA 7 CMO OBSERVAR PATRONES EN LA INFORMACIN?


SORPRESAS MGICAS. BUSCANDO PATRONES EN LA INFORMACIN
La actividad que se presenta a continuacin se desarrolla en el laboratorio de computacin. En sta se emplea el juego Sorpresas Mgicas de AutoMind1. Para comenzar sigue las instrucciones que entregar la profesora o el profesor. Como primera accin, forma un grupo de cuatro personas, donde cada uno debe elegir una casilla (1, 2, 3 o 4). Dentro del juego de las sorpresas mgicas se muestran 8 caractersticas distintas para la caja sorpresa. Estas caractersticas son: Color Caja, Largo Caja, Grosor Caja, Ancho Caja, Color Cara, Largo Cara, Ancho Cara y Expresin Cara. La caja mencionada anteriormente contiene una cartilla con cuatro casillas, como se muestra en la imagen adjunta. Cada una de las casillas puede tomar dos colores, blanco o negro. El objetivo del juego es poder predecir el color de la casilla asignada dentro del grupo, observando cada una de las caractersticas de la caja sorpresa. En la tabla que se encuentra en la pgina siguiente (Tabla 1: Apuestas), anota el color para tu primera apuesta, una B para Blanco o una N para Negro, de acuerdo a la casilla que te corresponde. Esta apuesta debe ser realizada antes de conocer el resultado de la cartilla emitida por el juego. De esta misma forma se realizarn 10 lanzamientos en total, en los cuales debes anotar tu apuesta de color de acuerdo a la casilla que te corresponde antes de conocer el resultado emitido por el juego en cada lanzamiento. En la segunda tabla (Tabla 2: Datos entregados por Sorpresas Mgicas) que se encuentra en la pgina siguiente, anota los valores entregados para las 8 caractersticas de la caja. Posteriormente, agrega en la columna Casilla de la tabla 2, la letra del color que es emitido por el juego, recuerda colocar una B si es Blanco o una N si es Negro, para que vayan contrastando estos resultados con las distintas apuestas realizadas por el grupo en las casillas correspondientes.

1 http://www.automind.cl

54

Tabla 1: Apuestas
Jugador Apuesta 1 1 2 3 4 5 6 7 8 9 10 2 3 4

Tabla 2: Datos entregados por Sorpresas Mgicas


Apuesta 1 2 3 4 5 6 7 8 9 10 Color Caja Largo Caja Grosor Caja Ancho Caja Color Cara Largo Cara Ancho Cara Expresin Cara Casilla 1 2 3 4

Unidad: Estadstica y Probabilidad

55

Una vez que ya tienes los datos entregados por el juego de las Sorpresas Mgicas en la tabla, responde las preguntas que se presentan a continuacin. 1. Con la informacin presente en la tabla, te es fcil detectar un patrn de comportamiento de los datos? Si Por qu? No

2.

Podras realizar una apuesta ms certera? Cul sera esta en el lanzamiento 11 de acuerdo a tu casilla?

Organizando la informacin para una mejor apuesta


1. Una vez completada la tabla con la informacin pertinente de los 10 lanzamientos, en una planilla electrnica, confecciona un grfico tomando dos de las variables del juego junto al casillero que tienes designado en el equipo. Por ejemplo, selecciona los datos de la columna Largo Caja y los datos de la columna Grosor Caja, a los que debes agregar los datos de la casilla que tienes asignada en el juego (para el ejemplo se tomar el Casillero 1). Te sugerimos que copies los datos en otro sector de la planilla. Supongamos que los datos de las columnas son los siguientes:
Largo Caja
8,5 5,8 5,9 5,8 5,7 6,9 8 9,7 6,9

Grosor Caja
2,23 2,16 2,6 2,2 2,61 2,62 2,18 2,96 2,14

1
B B B B B B B N B

56

Unidad: Estadstica y Probabilidad

2.

Ordena la informacin de las columnas de manera que las primeras filas sean B (Blanco) y las siguientes sean N (Negro). Para esto, selecciona las tres columnas con su informacin, ingresa al men datos, elige la opcin ordenar, en la ventana que aparece, en la seccin ordenar por escoger la columna de la casilla designada, para el ejemplo 1 y presiona Aceptar. Con esto la tabla quedar ordenada para ser graficada, como se muestra en la tabla siguiente, primero la informacin relativa a B (Blanco) y posteriormente la informacin relativa a N (Negro), de la respectiva casilla:
Largo Caja
8,5 5,8 5,9 5,8 5,7 6,9 8 6,9 9,7

Grosor Caja
2,23 2,16 2,6 2,2 2,61 2,62 2,18 2,14 2,96

1
B B B B B B B B N

3.

Una vez que se tienen ordenados los datos, se procede a graficar. Para esto selecciona las columnas Largo Caja y Grosor Caja hasta la ltima fila que contenga una letra B (Blanco), como se muestra en la imagen, y presiona el botn de Asistente de Grfico, en este primer paso del asistente escoge grficos tipo XY (Dispersin) y presiona siguiente.

4.

En el segundo paso del asistente selecciona la lengeta Serie y presiona Agregar, en la casilla Nombre escribe Negro y en la casilla Valores de X, selecciona los valores de la columna Largo Caja que contengan la letra N (Negro) y para los Valores de Y selecciona los valores de la columna Grosor Caja que contengan la letra N (Negro). Por otra parte, selecciona la serie existente y en la casilla Nombre cambiar por Blanco, luego presiona siguiente.
Unidad: Estadstica y Probabilidad

5.

57

6.

En el tercer paso del asistente, en la casilla Eje de Valores(X) escribe el nombre de la variable que estas graficando, para este caso Largo de Caja, y en la casilla Eje de Valores (Y) escribe la otra variable que estas graficando, para este caso Grosor Caja, presiona siguiente y luego Finalizar. De esta forma obtendrs un grfico como el siguiente:

Analizando las variables grficamente


Lo interesante es que aqu se puede visualizar fcilmente ciertos patrones. Por ejemplo, para el caso presentado en la gua, el casillero sale blanco cuando la variable Largo de Caja es menor a 9, o sale blanco cuando la variable Grosor Caja es menor a 2,8. Estos son dos patrones tentativos, que con ms datos pueden cambiar. Sin embargo, nos sugieren dos estrategias con las cuales jugar. Al tomar ms datos estos patrones pueden confirmarse, ajustarse o definitivamente descartarse. Tambin pueden aparecer mejores patrones con otras variables, por lo que conviene hacer otros grficos. Actividad: Siguiendo los pasos anteriores descritos, realiza el grfico XY (Dispersin) para el casillero que tienes asignado dentro de tu grupo, para los valores B (Blanco) y N (Negro), tomando los pares de variables de la tabla siguiente:

1 Variable Largo Caja Largo Caja Largo Caja Largo Caja Grosor Caja Grosor Caja Grosor Caja Ancho Caja Ancho Caja Largo Cara

vs. vs. vs. vs. vs. vs. vs. vs. vs. vs.

2 Variable Grosor Caja Ancho Caja Largo Cara Ancho Cara Ancho Caja Largo Cara Ancho Cara Largo Cara Ancho Cara Ancho Cara

58

Unidad: Estadstica y Probabilidad

1.

Al observar el comportamiento de los grficos, te fue posible determinar algn patrn para la apuesta? Si No

2.

Para los casos en que es posible observar algn patrn, cules son las variables que te permiten tomar mejores decisiones en las apuestas de las Sorpresas Mgicas?

3.

Anota los patrones en la informacin para cada variable que cumple con estos.

Analizando los resultados


1. Con todas las variables es posible encontrar un patrn en la informacin? Cules son los pares de variables que no permiten determinar un patrn claro?

2.

Con qu forma de representar la informacin fue ms claro detectar el patrn de comportamiento? Justifica.

3.

Ahora que ya tienes algunas herramientas, qu haras antes de realizar una apuesta con las Sorpresas Mgicas?

Con esta forma de analizar la informacin y con los patrones que encontraste, realiza una apuesta ms certera en el juego. Buena suerte!
Unidad: Estadstica y Probabilidad

59

GUA 8 CMO SABER QU NOS INTOXIC?


RBOLES DE SEGMENTACIN
En esta gua trabajaremos con otra forma de representacin de la informacin. Esta forma se denomina rboles de decisin o de segmentacin.

Un problema de intoxicacin
En un paseo al campo, donde asistieron 19 personas, se realiz un asado para compartir. Al da siguiente del asado, varias personas sufrieron sntomas de intoxicacin por algn alimento en mal estado. Con el fin de detectar cul o cules de los alimentos consumidos provocaron la intoxicacin, en los das siguientes se realiz una encuesta a los participantes del asado, sobre lo que cada uno ingiri aquel da. Los alimentos y bebidas consumidos fueron: vacuno, choclo, papas, tomate, pan, porotos verdes, lechuga y bebidas . La informacin se resumi en la tabla siguiente, en la que cada fila corresponde a una de las personas que fue al paseo y donde cada columna indica si la persona ingiri o no el alimento correspondiente. Adems se agreg una columna que indica quin se enferm y quin no.
Porotos verdes

Lechuga

Bebidas Si Si Si Si Si Si Si Si Si Si No Si Si Si Si Si No Si No

Vacuno

Tomate

Choclo

Papas

Pan

Salud Enfermo Enfermo Enfermo Sano Enfermo Enfermo Sano Enfermo Enfermo Enfermo Enfermo Sano Sano Enfermo Enfermo Enfermo Enfermo Enfermo Sano

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Si Si Si Si Si Si Si Si No Si Si Si Si Si Si Si Si No Si

Si Si Si No Si Si No Si Si No Si No No Si Si No Si Si No

No Si No No No No No No Si No No No No No No No No No No

Si Si No No No Si No No Si No No Si Si No Si No Si Si Si

Si Si Si Si Si No No Si Si Si Si Si No Si Si Si Si Si Si

No No No No No Si No Si Si Si No No No Si Si Si Si No No

Si No No No No Si Si No No No Si Si No No Si No Si No Si

60

Unidad: Estadstica y Probabilidad

1.

Observando la tabla anterior, podras decir qu alimento o alimentos causaron la intoxicacin?

Buscando la causa
De acuerdo a tu respuesta de la pregunta anterior, realizaremos un anlisis sistemtico por comparacin de dos variables. Para esto, se construye una tabla donde se analizan dos alimentos, por ejemplo, Tomate y Bebidas. Posteriormente en cada una de las celdas se anota el valor 1 para consignar que ingiri el alimento y 0 para cuando no haya ingerido el alimento. Finalmente, en la columna de salud se coloca el estado de la persona que asisti al asado (enfermo o sano). Con estos datos se procede a graficar en base a los valores 0 y 1, diferenciando a los enfermos (cuadrados oscuros) de los sanos (crculos blancos).

Bebidas

Tomate

Salud Enfermo Enfermo Enfermo Sano Enfermo Enfermo Sano Enfermo Enfermo Enfermo Enfermo Sano Sano Enfermo Enfermo Enfermo Enfermo Enfermo Sano

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

1 1 0 0 0 1 0 0 1 0 0 1 1 0 1 0 1 1 1

1 1 1 1 1 1 1 1 1 1 0 1 1 1 1 1 0 1 0

Unidad: Estadstica y Probabilidad

61

1.

De la informacin que se encuentra en la tabla, Cuntas personas consumieron Tomate? Cuntas personas consumieron Bebidas?

2.

Podras decir que todas las personas que consumieron Tomate enfermaron? Justifica.

3.

Podras asegurar que todas las personas que consumieron estos dos alimentos (Tomate y Bebidas) enfermaron? Justifica.

4.

Al observar y analizar el grfico, Qu informacin se puede extraer del grfico en relacin con la causa de la intoxicacin por alimentos?

Utilicemos rboles de segmentacin


Una vez ordenados en una tabla y graficado el par de alimentos escogidos, analizaremos estas dos variables generando un rbol de segmentacin. Para esto, comenzaremos con todos los invitados al asado agrupando la informacin en un recuadro (el cual se denomina nodo). En este nodo consignaremos el nmero de personas sanas, enfermas, el total de personas en el nodo, porcentaje que representa el nmero de sanos, porcentaje que representa el nmero de enfermos y el porcentaje total del nodo.

62

Unidad: Estadstica y Probabilidad

Luego, se realiza la segmentacin del primer alimento en dos ramas para consignar los datos relacionados con los invitados que ingirieron el alimento y aquellos que no. En una segunda segmentacin se vuelve a realizar el mismo anlisis anterior, en esta ocasin con el segundo alimento seleccionado. A continuacin se presenta el rbol de segmentacin de los alimentos Tomate y Bebidas.

1.

Qu porcentaje de la poblacin del asado se enferm producto de la intoxicacin por algn alimento?

2.

De las personas que consumieron tomate, cul es el nmero de sanos? Qu porcentaje representan?

3.

Existen personas enfermas, pese a no ingerir ninguno de estos alimentos? Qu porcentaje representan del total de personas asistentes al asado?

Unidad: Estadstica y Probabilidad

63

4.

Analizando las posibilidades que muestra el rbol de segmentacin Podras decir si se ha encontrado la causa de la intoxicacin por la ingesta de estos alimentos? Justifica.

Otro par de alimentos


Siguiendo lo realizado en el ejemplo anterior, selecciona dos alimentos distintos a los anteriores y completa la tabla. Recuerda completar las celdas con un 0 si la persona no ingiri el alimento y con un 1 si la persona ingiri dicho alimento, y no olvides agregar el estado de la persona asistente al asado (enfermo o sano). Grafica cada uno de los datos presentes en la tabla (19 datos) diferenciando las personas enfermas y las personas sanas, de acuerdo a un color o una forma especfica.

Salud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

64

Unidad: Estadstica y Probabilidad

1.

De la informacin que se encuentra en la tabla, cuntas personas no consumieron ninguno de los dos alimentos seleccionados?

2.

De las personas que no consumieron ninguno de los dos alimentos, existen enfermos? Cuntos?

3.

En cul de los alimentos existen ms personas enfermas? Cuntos son?

4.

Podras asegurar que todas las personas que consumieron estos dos alimentos enfermaron? Justifica.

El rbol de segmentacin
En esta oportunidad completars el rbol de segmentacin con la informacin necesaria y con la segmentacin del primer alimento que escogiste anteriormente. Una vez que completes la informacin solicitada (N de sanos, N de enfermos, total de personas del nodo, porcentaje de sanos, porcentaje de enfermos y porcentaje total del nodo respecto al inicial), realiza una segunda segmentacin del rbol utilizando el segundo alimento seleccionado, agregando en cada caso la informacin solicitada en las segmentaciones anteriores.

Unidad: Estadstica y Probabilidad

65

1.

En base a la segmentacin que hiciste para el segundo alimento, escogiste una de las ramas principales (rama 1 o rama 2). Explica el por qu de la eleccin para realizar la segmentacin.

66

Unidad: Estadstica y Probabilidad

2.

Las ramas presentes en el rbol te permiten determinar todas las posibilidades que se tiene con los alimentos seleccionados? Si Por qu? No

3.

De acuerdo a los dos alimentos seleccionados y de la informacin registrada en el rbol de segmentacin, puedes decir que estos alimentos son la causa de intoxicacin? Justifica.

Determinando los alimentos culpables


1. Con los alimentos analizados hasta este momento, puedes decir cul o cules son los alimentos causantes de la intoxicacin en el asado? Justifica.

2.

Selecciona dos posibles alimentos que causaron la intoxicacin de los asistentes al asado, discute con tus compaeros y el profesor si estos alimentos pueden ser causa.

3.

Realiza una conjetura del por qu piensas que estos alimentos escogidos pueden ser los causantes de la intoxicacin.

Unidad: Estadstica y Probabilidad

67

4.

De acuerdo a los alimentos que consideras que son la causa de la intoxicacin, completa la tabla siguiendo las instrucciones utilizadas hasta el momento y grafica cada uno de los puntos correspondientes a los invitados al asado.

Salud 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

5.

Todos lo que ingirieron estos alimentos se enfermaron?

6.

Cmo es la situacin de las personas que no ingirieron estos alimentos?

7.

Podras decir que has encontrado la causa de la intoxicacin en el asado? Justifica.

68

Unidad: Estadstica y Probabilidad

Generando el rbol de segmentacin


En el espacio que se encuentra a continuacin y siguiendo los mismos pasos anteriores, analiza estos dos nuevos alimentos generando un rbol de segmentacin para estas dos nuevas variables.

Analizando la actividad realizada


1. Al comenzar la actividad con la tabla inicial (pgina 1), a simple vista, pudiste determinar la causa de la intoxicacin? Justifica.

Unidad: Estadstica y Probabilidad

69

2.

Construyendo y analizando el grfico con valores 0 y 1, es posible analizar toda la informacin necesaria para detectar la causa de la intoxicacin? Justifica.

3.

Con esta tercera forma de registrar y analizar la informacin, el diagrama de rbol de segmentacin, permite obtener mayor cantidad de informacin por variable? Es claro para detectar las causas de intoxicacin? Justifica.

4.

En estricto rigor, Cuntas variables deberan analizarse para poder encontrar la causa de la intoxicacin? Cules seran las combinaciones de alimentos a analizar?

70

Unidad: Estadstica y Probabilidad

GUA 9
ES POSIBLE DISCRIMINAR MEDIANTE RECTAS?
SEGMENTACIN DE UNA POBLACIN, USANDO MTODOS GRFICOS
En esta gua veremos cmo segmentar una poblacin usando mtodos grficos y luego escribiendo los resultados con rboles.

Accidentes automovilsticos
Los choques de automviles son la causa prevenible N1 de muerte en adultos, jvenes y nios, como tambin la causa principal de daos permanentes al cerebro y la columna. Por ejemplo, una parada en seco a 50 k/h podra causar la misma fuerza sobre el cerebro y el cuerpo de un nio como la cada de un edificio de tres pisos. Por esta razn, al momento de conducir un vehculo se debe considerar una serie de factores y como conductor tenerlos presente y respetarlos. Algunas consideraciones al momento de conducir son: Cuando beba alcohol no conduzca; no utilice su telfono celular cuando conduzca; use siempre el cinturn de seguridad, incluso si su vehculo posee airbag; no traslade a menores o bebs en el asiento delantero; conduzca siempre atento a las condiciones de trnsito y sealizaciones viales; respete el lmite de velocidad mximo permitido en la ruta; mantenga la distancia de seguridad con el vehculo que lo antecede, aunque circule despacio; encienda las luces del vehculo al circular por un tnel; qutese las gafas de sol al entrar a un tnel; conduzca con precaucin si el pavimento est mojado; entre otras a considerar.

Consideraciones de una aseguradora de vehculos


Al momento de asegurar un vehculo las empresas toman en cuenta algunos factores, por ejemplo, si la persona que desea asegurar su vehculo es menor de 30 aos, no puede contratar un seguro total, ya que las estadsticas dicen que los menores de 30 aos tienen un alto porcentaje de sufrir accidentes en ruta. As como esta consideracin, las aseguradoras analizan otras variables para asegurar vehculos y, a su vez, premiar a los asegurados con buen comportamiento. En la serie de grficos que estn a continuacin, se muestran los datos referentes a un grupo de personas en relacin con siniestros automovilsticos durante el transcurso de un ao. En cada uno de los grficos los crculos significan que la persona NO ha tenido siniestros automovilsticos y cada cruz significa que SI ha tenido siniestros.

Unidad: Estadstica y Probabilidad

71

Situacin 1: En el grfico siguiente se considera la relacin entre dos variables a comparar, supongamos que la variable p representa el nmero de horas de conduccin y la variable q representa la edad de la persona que conduce.

1.

De acuerdo a la informacin que se encuentra en el grfico, cul es el tamao de la muestra?

2.

De acuerdo a la muestra, cuntas personas tuvieron siniestro? Y cuntas de ellas no?

3.

Escribe una tabla de datos con las mejores aproximaciones correspondientes al grfico pq, considerando todas las observaciones de la muestra. Para esto, toma el centro de los crculos como los valores de la observacin, y en las cruces considerar la interseccin de los segmentos. p q Siniestro p q Siniestro

72

Unidad: Estadstica y Probabilidad

4.

De las personas que sufrieron siniestro de acuerdo al grfico, estima el tiempo promedio que estuvieron manejando y la edad que tiene cada conductor.

5.

Analizando cada una de las variables presentes, qu puedes decir de la informacin que se muestra en el grfico?

6.

Si tuvieras que separar la poblacin entre las personas con siniestro y las sin siniestro, con tan solo trazar una recta. Podras hacer esta separacin en este grfico? Si Por qu? No

Situacin 2: En este segundo grfico se comparan otras dos variables. Supongamos que se analiza la relacin que pudiese existir entre las variables u, que representa el nmero de aos que se posee un automvil y v, que representa los aos de experiencia del conductor.

Unidad: Estadstica y Probabilidad

73

1.

Determina el porcentaje que representa cada uno de los casos, siniestros y no siniestros, con respecto a la muestra.

2.

Escribe una tabla de datos aproximados correspondientes al grfico uv, considerando todas las observaciones de la muestra. u v Siniestro u v Siniestro

3.

Analizando cada una de las variables que se presentan en el grfico, qu puedes concluir de la muestra observando el grfico uv?

4.

Podras realizar una discriminacin de la poblacin entre personas con siniestros y sin siniestros trazando una recta horizontal o una recta vertical en el grfico? Si No

Si tu respuesta es positiva, traza la recta en el grfico. Realiza una interpretacin de la segmentacin de la muestra que realizaste a travs de la recta.

74

Unidad: Estadstica y Probabilidad

Situacin 3: En este tercer grfico supngase que se presenta la relacin existente entre las variables w, que representa una estimacin de la distancia de seguridad que se mantiene con respecto al automvil que antecede y z, que representa la velocidad a que se desplaza el automvil.

1.

Escribe una posible tabla de datos correspondientes al grfico wz, considerando todas las observaciones de la muestra. w z Siniestro w z Siniestro

2.

En este tercer grfico, al observar el comportamiento de las variables, qu puedes decir de esta muestra?

3.

Podras discriminar la poblacin presente en este grfico trazando una sola recta? Si No

Unidad: Estadstica y Probabilidad

75

Por qu? Cuntas rectas son necesarias?

4.

Puedes discriminar la poblacin trazando solo rectas verticales y horizontales? Si No

En caso de ser positiva la respuesta, escribe las expresiones que representa cada una de ellas.

Realiza una interpretacin de la segmentacin de la muestra que realizaste a travs de la recta.

5.

Escribe cada segmentacin como rbol. Incluye los porcentajes en cada caso.

76

Unidad: Estadstica y Probabilidad

Situacin 4: En el grfico siguiente, inventa un par de variables que hipotticamente puedan relacionarse de acuerdo al contexto de las aseguradoras de automviles y de los valores que tiene cada uno de los ejes del grfico siguiente.

1.

Escribe una tabla de datos aproximados correspondientes al grfico sr, considerando todas las observaciones de la muestra. s r Siniestro s r Siniestro

2. 3.

En el grfico sr anterior, traza una recta que te permita una segmentacin de la muestra entre individuos con siniestros y sin siniestros. Estima dos puntos que pasen por la recta que trazaste y determina una posible expresin algebraica que describa la recta trazada en el grfico anterior.

Unidad: Estadstica y Probabilidad

77

4.

Realiza una interpretacin de la segmentacin de la muestra que realizaste a travs de la recta.

5.

Escribe cada segmentacin como rbol. Incluye los porcentajes en cada caso.

Analizando la informacin grfica


1. En cules grficos se observa un patrn ms claro que permita discriminar con lneas rectas entre siniestros y no siniestros?

78

Unidad: Estadstica y Probabilidad

2.

En cul(es) grfico(s) usaras ms de una recta para segmentar la muestra entre siniestros y no siniestros?

3.

En cul(es) grfico(s) usaras lneas, no necesariamente horizontales ni verticales, para discriminar siniestros de no siniestros. Dibjalas. Determina los porcentajes de siniestros y no siniestros de cada segmento.

4.

En todos los grficos presentados es posible discriminar la muestra entre siniestros y no siniestros mediante rectas? Justifica.

Unidad: Estadstica y Probabilidad

79

GUA 10 APLICANDO LO APRENDIDO


SITUACIONES EN CONTEXTO
El propsito de los siguientes ejercicios y actividades es reforzar los contenidos aprendidos hasta ahora. Trabaja con un compaero y resuelvan cada pregunta, consultando a tu profesor o profesora en aquellas que tengan dudas.

Actividad 1: Pesos
Grafica en una recta la siguiente informacin: Nombre Peso en Kg. Claudio Pamela 72 58 Mara 55 Ernesto Gustavo 80 69 Irene 67 Martn 70 Patricio 64

Entre qu valores se concentran los pesos de las mujeres? Entre qu valores se concentran los pesos de los hombres?

Actividad 2: Coordenadas
Imagina que se tienen los siguientes datos en coordenadas (x, y) como resultado de hacer 30 mediciones.
N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

X Y
N

8 0
16

9 0
17

10 0
18

10 1,5
19

10 2
20

11 -1
21

11 0
22

11 1
23

12 12 -2,5 -1
24 25

12 0
26

12 1
27

12 2
28

12 3
29

12 4
30

X Y

13 -3

13 -2

13 -1

13 0

13 1

14 -1

14 0,5

14 1

15 -2

15 -1

15 0

16 0

17 17 -1,5 -2

18 0

80

Unidad: Estadstica y Probabilidad

1.

Grafica los puntos anteriores en un grfico XY.

2.

Entre qu valores de x se concentran las mediciones?

3.

Entre qu valores de y se concentran las mediciones?

Actividad 3: Examen Dental


En un examen dental realizado a los alumnos de un cuarto medio, se obtuvo los siguientes resultados, en cuanto a caries no tratadas: 3 alumnos con 0 caries; 8 alumnos con 1 caries; 14 alumnos con 2 caries; 11 alumnos con 3 caries; 6 alumnos con 4 caries; 2 alumnos con 5 caries; 1 alumno con 6 caries.
Unidad: Estadstica y Probabilidad

81

1.

Ordena los datos anteriores en la siguiente tabla de frecuencias. N de caries Frecuencia absoluta Frecuencia relativa Frecuencia relativa %

Totales: 2. Construye dos grficos de barras para la informacin anterior. a) Considerando frecuencia absoluta b) Considerando frecuencia relativa

3.

En promedio, cuntas caries tendra un alumno del cuarto medio? Explica cmo obtuviste este valor a partir de la tabla de frecuencias.

82

Unidad: Estadstica y Probabilidad

Actividad 4: Notas
Los siguientes datos corresponden a las notas obtenidas por un curso de 33 alumnos en la asignatura de Lenguaje y Comunicacin. 4,5 3,3 4,4 1. 5,6 4,2 5,6 2,5 2,4 5,1 7 2,5 4,5 3,4 3,6 4,3 3,3 4,5 4,1 4,5 5,6 3,9 6,2 4,8 1,4 3,9 5,8 4,2 5,5 4,1 6,7 5,3 5,7 4,9

Organiza las notas en la siguiente tabla de frecuencias. Notas


[1 [2 [3 [4 [5 [6 2[ 3[ 4[ 5[ 6[ 7]

Frecuencia absoluta

Frecuencia relativa

Frecuencia relativa %

Totales: 2. Segn los datos anteriores, construye un histograma, usando frecuencias relativas porcentuales.

3.

Cul es el promedio de las notas del curso en Lenguaje y Comunicacin?

Unidad: Estadstica y Probabilidad

83

4.

En qu intervalo se concentra la mayor cantidad de notas?

Actividad 5: Razones para comprar un libro1


Una encuesta realizada por la Cmara Chilena del Libro en 1999, encuest a 17.458 personas mayores de 15 aos en las ciudades de Santiago, Valparaso y Concepcin. En la encuesta se les consult, entre otras cosas, acerca de las razones por las cuales compran o compraran libros. La siguiente tabla resume la informacin recogida en la encuesta:
Razones para comprar un libro Cultura general Ayuda a capacitarse Aumento de conocimientos Satisfaccin personal Otras Total Hombres 5003 1245 1455 398 159 8260 Mujeres 5705 1171 1560 609 153 9198 Total 10708 2416 3015 1007 312 17458

1.

Completa la tabla siguiente, donde se reflejen los mismos datos anteriores ahora en porcentajes.

Razones para comprar un libro Cultura general Ayuda a capacitarse Aumento de conocimientos Satisfaccin personal Otras Total

Hombres %

Mujeres %

Total

1 Ejercicio adaptado del libro Contenidos bsicos de Estadstica y Probabilidad, del autor Eugenio Saavedra Gallardo. Editorial Universidad de Santiago. Coleccin Ciencias 2005.

84

Unidad: Estadstica y Probabilidad

2.

Construye dos grficos circulares que reflejen la misma informacin en porcentajes, tanto para mujeres como para hombres.

Actividad 6: Principales causas de muerte en Chile


Considera los siguientes datos de la tabla Principales causas de muerte en Chile, 1998 N
1 2 3 4 5 6 7 8 9 10 11

Enfermedad
Aparato circulatorio Tumores malignos Traumatismo y envenenamiento Aparato respiratorio Aparato digestivo Sntomas y estados morbosos mal definidos Infecciosas y parasitarias Afecciones originadas en el perodo prenatal Aparato genitourinario Enfermedades de las glndulas endocrinas, nutricin, metabolismo y trastornos de la inmunidad Resto causas

Porcentaje
28% 22% 10% 13% 7% 4% 3% 1% 2% 4% 6% 100%

Unidad: Estadstica y Probabilidad

85

3.

Construye un grfico que muestre adecuadamente la informacin anterior. Justifica tu eleccin, es decir, por qu este grfico y no otro?

4.

Cules son las dos principales causas de muerte en Chile?

86

Unidad: Estadstica y Probabilidad

Actividad 7: Sismos en Chile


El siguiente grfico muestra la magnitud (Escala de Richter) de algunos sismos ocurridos en Chile entre los aos 1960 y 1999.

1.

Segn el grfico Cul es la mxima intensidad registrada y en qu ao?

2.

Cul es el rango de la magnitud de los sismos registrados entre 1960 y 1999?

Unidad: Estadstica y Probabilidad

87

Actividad 8: Sorpresas Mgicas


En el juego Sorpresas Mgicas se realizan apuestas sobre cuatro casilleros (C1, C2, C3 y C4) y se grafican los resultados en Excel de acuerdo a pares de variables. El propsito es ver cmo discriminan dichas variables (Largo caja, Ancho Caja, Largo de cara, etc.) sobre las apuestas de si el casillero es negro o blanco. Imagina que para el casillero 2 se tienen los siguientes grficos:

Grfico 1

88

Unidad: Estadstica y Probabilidad

Grfico 2

Grfico 3 1. Cules grficos te sirven para discriminar negro de blanco, segn las variables escogidas? Por qu?

Unidad: Estadstica y Probabilidad

89

2.

En aquellos en que discrimine, cules son los intervalos para negro y para blanco?

Actividad 9: Reacciones alrgicas


Un grupo de 25 personas presentaron reacciones alrgicas cuando fueron a un determinado lugar y estuvieron en contacto con diferentes especies arbreas. Para descubrir qu especies causaron mayormente los efectos se pregunt a cada una de las personas y se registr la informacin (0: no estuvo en contacto; 1: estuvo en contacto). Para hacer la discriminacin respecto a las dems especies, se construy el siguiente rbol de segmentacin respecto a las especies Ay B:

90

Unidad: Estadstica y Probabilidad

1. 2.

Completa la informacin que falta en las ramas anteriores. Qu informacin revela el rbol de segmentacin? Qu se puede concluir?

Actividad 10: Discriminando poblaciones


Observa los siguientes grficos. La poblacin A est representada por un crculo y B por un tringulo. Grafico 1 Grafico 2

Para cada uno de los siguientes grficos, responde las siguientes preguntas: 1. Cuntos casos hay en la muestra que presentan la caracterstica A y cuntos la B?

2.

Escribe una tabla con las coordenadas aproximadas para cada grfico XY.

Unidad: Estadstica y Probabilidad

91

3. 4.

En los grficos anteriores, traza lneas verticales, horizontales o diagonales, para mostrar una segmentacin apropiada de las dos poblaciones. Escribe los porcentajes de A y B respectivamente en cada grfico.

92

Unidad: Estadstica y Probabilidad

GUA 11 NECESITAMOS UN REPRESENTANTE!


MEDIDAS DE TENDENCIA CENTRAL
Hasta el momento, has realizado una descripcin visual de un conjunto de datos, a travs de distintos tipos de diagramas o grficos. La finalidad de esto es que te des cuenta sobre su utilidad para entregar rpidamente una visin general sobre el comportamiento de valores que asume una variable. En otras ocasiones, se requiere utilizar algunas medidas numricas o indicadores para describir resumidamente el comportamiento de un conjunto de datos. Entonces, la pregunta es existe algn valor o valores que sean capaces de representar adecuadamente un conjunto de datos? Ms an, pueden ser unos mejores representantes que los otros? Esta actividad tiene el propsito de que identifiques y compares algunos valores que son capaces de representar y describir a un conjunto de datos. Para ello, debes contar con una calculadora y formar un equipo de trabajo con algunos de tus compaeros.

En busca de representantes para un conjunto de datos


Lee la siguiente situacin: Carolina y Alejandro son alumnos del mismo profesor de matemtica, pero pertenecen a distintos cursos. En el curso de Carolina el profesor consider nueve notas para evaluar el semestre, mientras que en el de Alejandro consider once. La siguiente tabla muestra las notas respectivas:

Carolina Alejandro

4,8 4,5

4,1 4,0 4,0 4,8

Notas parciales de Matemtica 4,7 4,5 4,5 4,0 4,5 4,5 3,8 5,6 4,5 4,4 2,8 5,0

4,5

4,5

Quin obtuvo mejores calificaciones?


1. Observando las notas y sin realizar clculos quin de ellos obtuvo mejores calificaciones?

Unidad: Estadstica y Probabilidad

93

2.

Si se considera la suma de las respectivas notas quin de ellos tendra mejores calificaciones? Esta respuesta coincide con la respuesta anterior?

3.

Si se considera la nota mxima de las respectivas notas quin de ellos tendra mejores calificaciones? Esta respuesta, coincide con la respuesta inicial?

4.

Si se considera la nota que ms se repite, quin de ellos tendra mejores calificaciones? Esta respuesta, coincide con la respuesta inicial?

El valor que ms se repite en un conjunto de datos se conoce como MODA (Mo).

5.

Ordena las notas de menor a mayor.


Notas parciales de Matemtica Carolina Alejandro

6.

Cul es la nota que est al centro en cada caso? Considerando este valor, quin tiene mejores calificaciones? Esta respuesta coincide con la respuesta inicial?

El valor central de un conjunto de datos ordenados se conoce como MEDIANA (Me).

94

Unidad: Estadstica y Probabilidad

7.

Calcula el promedio de notas para cada caso. Para ello completa la siguiente tabla: Lo que se conoce como promedio y que se emplea, por ejemplo, en las calificaciones finales de las asignaturas, tambin se le conoce como Media o Media Aritmtica y se designa por X. Suma total de las notas parciales Carolina Alejandro N de notas Promedio de notas (X)

Hasta el momento has encontrado diferentes representantes de una muestra de datos, como por ejemplo: la nota mxima, la suma de las notas, la moda, la mediana, la media aritmtica. Ahora, de acuerdo a lo realizado: 8. Es posible considerar como un buen representante de la muestra a alguno de los valores registrados anteriormente? Por qu?

9.

Quin obtuvo mejores calificaciones? Por qu?

Por qu es el mejor representante? Buscando el equilibrio

En el siguiente grafico de barras, se observan las notas obtenidas por Carolina con su respectiva frecuencia absoluta.

Unidad: Estadstica y Probabilidad

95

Supongamos que cada una de estas barras tuviera un cierto peso de acuerdo a su altura. Si ubicamos estos pesos en el mismo orden sobre una balanza, para mantenerla equilibrada, en qu valor se encontrara el punto de equilibrio de la balanza? Antalo en el dibujo

Cmo saber si realmente el valor escogido es el punto de equilibrio? Ahora calcula la diferencia que hay entre el punto de equilibrio y cada una de las notas. Completa la tabla. Notas parciales de Matemtica (xi) Carolina
xi Pto de equilibrio

4,0

4,0

4,1

4,5

4,5

4,5

4,5

4,7

4,8

(x
i =1

pto de equilibrio )

Notar que:

(x pto de equilibrio)= (x
i =1

pto de equilibrio )+(x2 pto de equilibrio )+ ... + (x9 pto de equilibrio )

1.

Qu resultado obtienes al sumar todas las diferencias? Cmo lo interpretaras en la balanza?

2.

Luego de lo anterior, de qu manera puedes comprobar que un valor es un punto de equilibrio?

96

Unidad: Estadstica y Probabilidad

El punto de equilibrio y las medidas de tendencia central


Cul de las medidas de tendencia central permite obtener el punto de equilibrio? Para determinarlo realiza lo siguiente: Anota los valores de cada medida de tendencia central de las notas de Carolina y luego completa las tablas. Media ( X ) Mediana (Me) Moda (Mo)

Registra en la tabla, la diferencia de cada nota con la Mediana. Luego, suma los valores obtenidos. Notas parciales de Matemtica (xi) Carolina 4,0 4,0 4,1 4,5 4,5 4,5 4,5 4,7 4,8

x M
i

(x
i =1

Me)

Registra en la tabla, la diferencia de cada nota con la Moda. Luego, suma los valores obtenidos. Notas parciales de Matemtica (xi) Carolina 4,0 4,0 4,1 4,5 4,5 4,5 4,5 4,7 4,8

x M
i

(x
i =1

Mo)

Registra en la tabla, la diferencia de cada nota con la Media Aritmtica. Luego, suma los valores obtenidos. Notas parciales de Matemtica (xi) Carolina 4,0 4,0 4,1 4,5 4,5 4,5 4,5 4,7 4,8

x X
i

(x
i =1

)
Unidad: Estadstica y Probabilidad

97

1.

A qu medida de tendencia central corresponde el punto de equilibrio? Por qu? Qu sucede con la Mediana y con la Moda? Realiza un grfico de barras con las notas de Carolina y ubica estos valores.

2.

Considerando el trabajado realizado en esta gua, Cul crees t que debe(n) ser la(s) razn(es) por la(s) cual(es) la Media Aritmtica se destaque como un buen representante de un conjunto de datos por sobre la Mediana y la Moda?

98

Unidad: Estadstica y Probabilidad

Pasando en Limpio
Considerando el trabajo realizado y una muestra de datos cualesquiera, completa la siguiente tabla. Cuando corresponda, justifica brevemente.

Moda
S
Para su clculo, se utilizan todos los datos de la muestra?

Mediana
S No

Media Aritmtica
S No

No

S
El valor, es un dato de la muestra?

No

No

No

Cmo se obtiene esta medida? De qu manera afecta el hecho de que la cantidad de datos sea par o impar?

S
El valor, es punto de equilibrio en la balanza?

No

No

No

Unidad: Estadstica y Probabilidad

99

Desafos
Discute e investiga con tus compaeros, los siguientes casos: 1. Un ascensor tiene un cartel que indica lo siguiente: Mximo de personas 10, peso lmite 675 Kg.. Cul es el peso promedio que se debera considerar, por persona, y que exige el aviso del ascensor? Siempre podrn utilizar el ascensor 10 personas?

2. Un lago de 20 cm. de profundidad en promedio, permite que una persona de 1,70 m. pueda zambullirse totalmente de forma vertical en sus aguas. a. Es posible esta situacin?

b.

Necesitas informacin adicional? Cul?

c.

Intenta un bosquejo del hipottico lago, para que cumpla las condiciones anteriores.

100

Unidad: Estadstica y Probabilidad

GUIA 12 MEDIDAS DE TENDENCIA CENTRAL


DATOS AGRUPADOS
Esta actividad te permitir comprender la utilidad de organizar grandes colecciones de datos y resmenes de los mismos. Para ello, debes contar con una calculadora y formar un equipo de trabajo de a lo ms cuatro compaeros. A continuacin, procedan a realizar las acciones que se entregan posteriormente:

Puntajes en la PSU
Los puntajes obtenidos en la PSU por los alumnos de un establecimiento educacional fueron los siguientes. 360 730 325 501 790 425 358 560 345 540 658 351 417 515 552 584 325 445 650 742 800 430 427 368 451 531 545 457 321 410 630 625 490 610 679 645 320 420 729 562 651 620 381 780 745 372 573 777 518 478 328 504 800 800 550 660 389 383 760 500 677 600 790 430 410 520 820 555 470 478 580 750 666 770 478 330 400 690 643 390 699

1. A simple vista, puedes hacer una estimacin de la media aritmtica, la moda, y la mediana de la forma en que estn presentados los datos?

2. Cmo organizaras los datos para facilitar el clculo de las medidas de tendencia central?

Unidad: Estadstica y Probabilidad

101

Agrupando los datos


Una forma prctica para organizar los datos es a travs de intervalos o clases. Esta organizacin permite analizar los datos por sectores o grupos y no necesariamente analizar un dato en particular. Ahora para formar estos intervalos se necesita el rango y la amplitud de los intervalos o clases. 1. Determina el rango de los datos. Para esto, resta el mayor de los puntajes con el menor.

2. Divide el rango de los datos en un determinado nmero de intervalos, siendo stos del mismo tamao o amplitud. Para este caso, divide el rango por 10 (10 intervalos).

A este nmero se le denomina tamao del intervalo o amplitud de clase

3. Determina intervalos, utilizando la amplitud de clase y, asigna el nmero de puntajes que hay en cada intervalo definido, respectivamente. Para lo anterior, realiza los siguientes pasos, registrando lo que se seala en la tabla que se presenta a continuacin: i. Para definir el primer intervalo, utiliza el menor puntaje de todos los datos como extremo inferior. Luego, a este extremo, smale la amplitud de clase, as obtienes el extremo superior del primer intervalo [a - b [. Para el segundo intervalo, el extremo superior del primer intervalo asgnalo como el extremo inferior de este. Nuevamente le sumas la amplitud de clase. De esa forma obtienes el extremo superior para este intervalo y as sucesivamente hasta completar el nmero de intervalos definidos. Determina el nmero de puntajes (frecuencia) que estn en el interior de cada intervalo y regstralo en la columna N de puntajes. Puntaje PSU (Intervalos) [320 [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ [ ] N de puntajes (frecuencias)

ii.

iii.

iv.

v.

102

Unidad: Estadstica y Probabilidad

El N de puntajes registrados para cada intervalo se denominan frecuencia absoluta del intervalo ( fi ).

Registra el primer intervalo. En el caso que no conocieras los datos que hay en su interior, qu nmero puede ser el mejor representante de este intervalo? Calclalo.

El nmero que representa el conjunto de nmeros de una clase se denomina marca de clase.

Buscando medidas de tendencia central


1. Completa la tabla, con los datos del ejercicio inicial (Puntajes de la PSU): Clases (Intervalos) Frecuencia fi Marca de clase mi fi mi

[320,370[

2. Cul crees t que es la interpretacin de los valores obtenidos en la columna fi mi ? Justifica.

Unidad: Estadstica y Probabilidad

103

Explorando la Moda:
1. Cul es el intervalo que tiene mayor frecuencia?

2.

Cul es la marca de clase de este intervalo?

3.

La moda para datos agrupados corresponde a:

Explorando la Media Aritmtica:


1. Suma todos los valores de la columna fi mi .

2.

Divide la suma obtenida por el total de datos.

3.

Este valor corresponde a la media aritmtica. A partir de lo realizado anteriormente, describe con tus palabras cmo determinar la media de datos agrupados.

4.

La media aritmtica encontrada para los datos agrupados, es la que se obtendra al calcularla directamente en los datos originales? Justifica.

104

Unidad: Estadstica y Probabilidad

Practicando lo aprendido Sueldos de una familia


Una empresa hizo un estudio con respecto a los ingresos mensuales de una familia y se obtuvieron los siguientes resultados: $ 253.000 $ 98.000 $ 158.000 $ 135.000 $ 110.000 $ 267.000 $ 257.000 $ 483.000 $ 147.000 $ 121.000 $ 123.000 $ 358.000 $ 256.000 $ 145.000 $ 83.000 $ 148.000 $ 451.000 $ 407.000 $ 142.000 $ 103.000 $ 125.000 $ 147.000 $ 245.000 $ 124.000 $ 302.000 $ 179.000 $ 234.000 $ 321.000 $ 202.000 $ 99.000 $ 243.000 $ 149.000 $ 135.000 $ 120.000 $ 123.000

1.

Haz intervalos con amplitud de clase igual a 100.000, y luego completa la tabla. Clases Frecuencias fi Marca de clase mi fi mi

2.

Calcula la media y la moda.

Unidad: Estadstica y Probabilidad

105

Pasando en limpio
Junto a tus compaeros y tu profesor, expresa o define las caractersticas para presentar datos agrupados.

106

Unidad: Estadstica y Probabilidad

GUA 13 JUNTOS O SEPARADOS?


Hasta aqu ya conoces una forma para describir resumidamente un conjunto de datos a travs de la Media Aritmtica, la Mediana y la Moda. No obstante, con estos representantes no es posible determinar que tan agrupados o separados estn los datos a los cuales representan. Para saber cun parecidos son los datos reales en comparacin a las medidas de tendencia central, es necesario encontrar una forma adecuada para responder a la pregunta qu tan separados estn, entre s, un conjunto de datos?, esto es, encontrar una manera de medir la dispersin, la mayor o menor concentracin de los datos con respecto a la Media Aritmtica. Con esta actividad aprenders a determinar una manera apropiada de medir la dispersin de un conjunto de datos. Para ello, debes contar con una calculadora y formar un equipo de trabajo con algunos de tus compaeros, a lo ms cuatro. A continuacin, procedan a realizar las acciones que se indican:

En busca de una forma para medir la Dispersin


Macarena y Gustavo son alumnos del mismo profesor de matemtica quien realiza un taller de Estadstica, pero pertenecen a distintos grupos. El profesor consider 15 alumnos como mximo para cada grupo Cada una de las siguientes tablas muestra las notas de los integrantes del grupo de Macarena y Gustavo, respectivamente: Grupo de Macarena Alumno Nota 1 4,8 2 5,5 3 4 5 4,6 6 4,8 7 5,1 8 4,0 9 6,0 10 4,2 11 6,2 12 5,7 13 14 15 4,7 5,7 5,0 5,2 5,0

Grupo de Gustavo Alumno Nota 1 2,1 2 7,0 3 4 5 3,4 6 4,0 7 6,0 8 5,5 9 3,8 10 6,7 11 5,2 12 4,5 13 14 15 4,9 6,8 5,8 4,8 6,0

Qu grupo obtuvo mejores calificaciones?


1. Slo observando las notas de cada grupo, sin efectuar clculo alguno cul de ellos obtuvo mejores calificaciones?

Unidad: Estadstica y Probabilidad

107

2.

Calcula la Media Aritmtica de la notas de cada grupo. A partir de estos datos, Qu grupo tendra mejores calificaciones?

3.

Observa los grficos, los cuales representan las notas de cada grupo. En cada uno de ellos, traza una lnea horizontal punteada para representar la MEDIA ARITMTICA de cada caso.

4.

Segn estos grficos cul de los grupos obtuvo mejores calificaciones?

5.

Entre qu notas se encuentran concentradas las notas del grupo al que pertenece Macarena? Registra la nota mnima, la mxima y la diferencia de ambas.

6.

Entre qu notas se encuentran concentradas las notas del grupo de Gustavo? Registra la nota mnima, la mxima y la diferencia de ambas.

7.

Segn estas diferencias Qu grupo obtuvo calificaciones ms uniformes? Justifica.

A la diferencia entre el valor mximo y mnimo de un conjunto de datos, se le conoce como Rango (R).

108

Unidad: Estadstica y Probabilidad

8.

Es posible afirmar que el rango permite siempre comparar la dispersin o grado de esparcimiento de los datos de cualquier par de conjuntos de datos? Justifica.

9.

Contrasta tu respuesta, observando los siguientes grficos.

i.

Cul de los grficos muestra menor dispersin de los datos? Es decir, qu grupo es ms uniforme en cuanto a sus calificaciones? Justifique.

ii. Calcula el rango para cada caso Permite el rango comparar adecuadamente la dispersin? Justifique.

iii. Segn la definicin de rango, se entiende que utiliza todos los datos del conjunto? Justifique.

iv. Tomando con base las preguntas i, ii y iii, el rango es siempre una buena medida de dispersin? Justifique.

Unidad: Estadstica y Probabilidad

109

Buscando la Varianza
Vuelve al caso del Grupo de Macarena y el de Gustavo. Compara cada nota con la Media Aritmtica respectiva a travs de la diferencia de estos nmeros. Registra esta diferencia en la tabla. Luego, suma dichas diferencias en cada caso. Grupo de Macarena Alumno Nota (xi) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4,8 5,5 5,7 5,0 4,6 4,8 5,1

4,0 6,0 4,2 6,2 5,7 5,2 5,0 4,7

xi X

(x
i =1

15

Grupo de Gustavo Alumno Nota (xi) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

2,1 7,0 6,8 5,8 3,4 4,0 6,0

5,5 3,8 6,7 5,2 4,5 4,8 6,0 4,9

xi X

(x
i =1

15

1. Qu valor se obtiene en ambos casos?

Observa que: La diferencia que se produce en cada caso, es el error que se comete al representar las notas de los alumnos por el Promedio o Media aritmtica. Los valores positivos, que corresponden a los datos por encima de la Media aritmtica, se anulan con los valores negativos, que corresponden a los datos por debajo de la Media aritmtica.

110

Unidad: Estadstica y Probabilidad

2.

A continuacin, determina las distancias de cada valor al promedio o Media aritmtica. Para ello y con la intencin de obtener valores positivos, eleva al cuadrado cada una de las diferencias obtenidas. Luego, suma dichas distancias y calcula el promedio de ellas, en cada caso:

Grupo de Macarena Alumno Nota (xi) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

4,8 5,5 5,7 5,0 4,6 4,8 5,1

4,0 6,0 4,2 6,2 5,7 5,2 5,0 4,7

xi X

(
15 i =1

xi X
i

(x

)
1 2 3 4 5

(x
i =1

15

15

Grupo de Gustavo Alumno Nota (xi) 6 7 8 9 10 11 12 13 14 15

2,1 7,0 6,8 5,8 3,4 4,0 6,0

5,5 3,8 6,7 5,2 4,5 4,8 6,0 4,9

xi X

(
15 i =1

xi X
i

(x

(x
i =1

15

15

Cul de los valores obtenidos es el menor? A qu grupo representa?

A la luz de lo que has realizado, cul es el grupo de mejores calificaciones? Justifica.

Al promedio de los cuadrados de las diferencias de cada valor a la media aritmtica, o promedio de los errores cuadrticos, se le conoce como Varianza, se suele denotar por S2
Unidad: Estadstica y Probabilidad

111

Buscando la Desviacin Estndar


Cmo saber qu tan distanciados estn los datos de su representante: la media aritmtica? Para responder esta pregunta, realiza los siguientes clculos y registra los datos de cada grupo. Grupo de Macarena Registra la varianza de cada grupo. Calcula y registra la raz cuadrada de la varianza de cada grupo. Grupo de Gustavo

S =

(x
i =1

X n

S =

(x
i =1

X n

S=

(x
i =1

X n

S=

(x
i =1

X n

Este valor, es decir, la raz cuadrada de la Varianza o promedio de los errores cuadrticos se le conoce como Desviacin Estndar y se suele denotar por (S).

1.

Determina los extremos de los intervalos presentados para cada grupo. Para ello calcula la diferencia entre la Media Aritmtica y la Desviacin Estndar, y luego la suma de ambos. Grupo de Macarena Grupo de Gustavo

[x S , x + S ]= [
2.

[x S , x + S ] =[
Grupo de Macarena

Cuntos datos se encuentran en los intervalos definidos con la desviacin estndar? Grupo de Gustavo

Registra, para cada grupo, la cantidad de notas que se encuentran en el intervalo definido con la desviacin estndar. Registra, para cada grupo, el porcentaje que corresponde el valor obtenido con respecto al nmero total de notas.

112

Unidad: Estadstica y Probabilidad

Que sucede grficamente?


Ilustra los datos obtenidos en el siguiente esquema: Grupo de Macarena

Grupo de Gustavo

1.

Qu se puede interpretar a partir de los porcentajes obtenidos para cada grupo?

2.

Si todos los datos estn muy cercanos a la Media Aritmtica, entonces qu debe ocurrir con la Desviacin Estndar?

Unidad: Estadstica y Probabilidad

113

3.

Si la Media Aritmtica no es el mejor representante de un conjunto de datos, entonces qu debe ocurrir con la Desviacin Estndar?

Para ejercitar
Con los datos recopilados en la Gua 2: Qu hacer con los datos?, calcula lo siguiente: Estatura Media aritmtica Rango Varianza Desviacin estndar Calzado

x S, x + S
Porcentaje de datos en el intervalo Ahora, ilustra la situacin Estatura:

114

Unidad: Estadstica y Probabilidad

Calzado

Pasando en limpio
Junto a tus compaeros y tu profesor, expresa o define las Medidas de Dispersin y sus principales caractersticas.

RANGO (R)
Definicin

Principales caractersticas

VARIANZA (S2).
Definicin

Unidad: Estadstica y Probabilidad

115

Principales caractersticas

DESVIACIN ESTANDAR (S)


Definicin

Principales caractersticas

116

Unidad: Estadstica y Probabilidad

GUA 14
CMO DISTRIBUIR LOS VALORES EN UNA MUESTRA?
Esta gua tiene la finalidad de que identifiques valores que permitan ubicar, bajo y sobre l, porcentajes de una muestra de datos. Por ejemplo la mediana, posiciona aproximadamente al 50% de los datos sobre ella y el 50% de los datos bajo ella. Estos valores se conocen como percentiles. Para esta actividad forma un equipo de trabajo, ten a la mano una calculadora, y luego lean las situaciones que se presentan y realicen las acciones que se indican:

El peso de los peces


La empresa pesquera Oceana requiere definir rangos de peces segn sus pesos en gramos. De esta forma se podr evaluar el nivel de la pesca que se realiza diariamente y permitir una adecuada distribucin de la captura. Con estos datos, se podr optimizar las ganancias a futuro. Se ha escogido una muestra de peces y sus respectivos pesos, la cual se describe en la siguiente tabla:
N Cod. Pez Peso Pez en gramos N Cod. Pez Peso Pez en gramos 1 P1 2 P2 3 P3 4 P4 5 P5 6 7 8 P8 9 10 11 12 13 14

P6 P7

P9 P10 P11 P12 P13 P14

215 321 368 211 245 267 299 301 325 350 390 345 234 243 15 16 17 18 19 20 21 22 23 24 25 26 27 28 P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 P25 P26 P27 P28 400 200 312 389 354 239 283 294 377 285 265 342 203 391

1.

Ordena los datos relacionados con el peso de los peces, de forma ascendente (menor a mayor). Regstralos en la tabla que se muestra a continuacin
N 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Cod. Pez Peso Pez en gramos N 15 16 17 18 19 20 21 22 23 24 25 26 27 28
Unidad: Estadstica y Probabilidad

Cod. Pez

Peso Pez en gramos

117

Localizando porcentajes en la muestra


La empresa ya tiene una muestra de peces, ahora lo que necesita es localizar ciertos valores, los cuales dividen la muestra en dos grupos. Para comenzar la empresa necesita localizar el peso del pez el cual deja al 25% de la muestra bajo l y al 75% sobre l. Grficamente representa lo siguiente:

El valor que divide a la muestra en dos partes se le llama Percentil. En este caso, se debe buscar el Percentil 25, es decir, al valor que tiene el 25% de los datos bajo l y el 75% de los datos sobre l. Para ello realiza los siguientes pasos: 1. Registra el total de datos:

n =
2. Calcula la posicin (q) en la que se encuentra aproximadamente el 25% de los datos.

q =
3.

0,25 (n + 1) =

Si q no es un nmero entero, entonces registra la parte entera de dicho valor.

[q] =
4. De la tabla de datos ordenados de forma ascendente, selecciona los pesos de las posiciones [q] y [q] + 1, luego calcula el promedio de dichos pesos. Registra los datos a continuacin:
P25 = Valor posicin [q ]+ Valor posicin [q ]+ 1 = 2

5.

En la tabla de datos ordenados de forma ascendente, cuenta el nmero de pesos registrados menores que P25. A que porcentaje de la muestra corresponde?

118

Unidad: Estadstica y Probabilidad

6.

Registra el intervalo donde se ubica el 25% de los pesos. Recuerda: son los peces con peso menor que P25.

7.

Al obtener el percentil 25 se puede decir: El 25% de los peces pesa menos de El 75% de los peces pesa ms de

Buscando ms percentiles
Calcula los percentiles que se presentan a continuacin

Percentil 50
1. Calcula la posicin (q) en la que se encuentra aproximadamente el 50% de los datos

q=

0,5 (n + 1) =

2. Si q no es un nmero entero, entonces registra la parte entera de dicho valor. [q] = 3. De la tabla de datos ordenados de forma ascendente, selecciona los pesos de las posiciones [q] y [q] + 1, luego calcula el promedio de dichos pesos. Registra los datos a continuacin:
Valor posicin [ q ]+ Valor posicin [q ]+ 1 = 2

P50 =

4.

En la tabla de datos ordenados de forma ascendente, cuenta el nmero de pesos registrados menores que P50. A que porcentaje de la muestra corresponde?

5.

Registra el intervalo donde se ubica el 50% de los pesos. Recuerda: son los peces con peso menor que P50.

Unidad: Estadstica y Probabilidad

119

Percentil 80
1. A continuacin, calcula la posicin en la que se encuentra aproximadamente el 80% de los datos.

2.

Si no es un nmero entero, entonces registra la parte entera de dicho valor.

3.

De la tabla de datos ordenados de forma ascendente, selecciona los pesos de las posiciones [q] y [q] + 1, luego calcula el promedio de dichos pesos. Registra los datos a continuacin:

P80 =
4. Registra el intervalo donde se ubica el 80% de los pesos de los peces.

5.

Qu porcentaje de los datos, aproximadamente, es menor a P80 =? Y mayor?

6.

Determina los intervalos donde se ubicaron los pesos de los peces, segn la distribucin que permiten los percentiles calculados.

Los percentiles permiten dividir la muestra en 100 partes iguales, es decir, podemos calcular y analizar desde el percentil 1 hasta el percentil 99. Este mtodo para calcular un percentil es utilizado para datos no agrupados.

120

Unidad: Estadstica y Probabilidad

Puntajes de la PSU
Un liceo desea analizar los puntajes obtenidos por sus alumnos de cuarto ao medio en la PSU. Los resultados obtenidos por sus alumnos se muestran en la tabla. Completa los datos: Frec. Frec. Relativa Puntaje Frec. Abs. Acumulada* Acumulada 4 = 0,019 [350 - 400[ 4 4 212 10 = 0,047 [400 - 450[ 6 10 212 19 = 0,089 [450 - 500[ 9 19 212 39 = 0,183 [500 - 550[ 20 39 212 70 = 0,330 [550 - 600[ 31 70 212 150 = 0,707 [600 - 650[ 80 150 212 [650 - 700[ [700 - 750[ [750 - 800[ [800 - 850] Total de alumnos 42 10 8 2 212

Caracterizando la muestra
Para comenzar a analizar los datos, realiza un grafico de ojivas. Para ello realiza lo siguiente: 1. Identifica el punto (a0 , 0) donde a0 corresponde al extremo inferior del primer intervalo

(a0 ,0) = (
2.

Ahora identifica los puntos del tipo (ai, Fi) donde Fi corresponde a la frecuencia relativa acumulada de cada intervalo y a i corresponde al extremo superior de cada intervalo Por ejemplo: (a1, F1) corresponde al 1er intervalo y el punto es (400,0,019)
(a1, F1) (a2, F2) (400,0,019)

* Frecuencia acumulada corresponde a la suma de las frecuencias absolutas, es decir, las observaciones que se han realizado hasta ese momento. Corresponde a la frecuencia acumulada dividida por el total de datos.

Unidad: Estadstica y Probabilidad

121

3.

Ahora, grafica estos puntos en el siguiente plano

Calculando percentiles
Para calcular el percentil 50, realiza lo siguiente 1. 2. Traza una recta paralela al eje x que pase por el punto 0,5 del eje y (representa la ubicacin que divide a la muestra en el 50% bajo l y al 50% sobre l) Esta recta intercepta a la ojiva trazada anteriormente?

Este punto de interseccin corresponde al Percentil 50. 3. Entre que puntos, de los graficados, se presenta esta interseccin?

122

Unidad: Estadstica y Probabilidad

Para conocer el percentil 50, debes encontrar la ecuacin de la recta que pasa por estos puntos

Buscando la recta
Para encontrar la recta que pasa por dos puntos dados se tiene la siguiente formula:
y y1 =

(y2 y1 ) (x x ) 1 (x2 x1 )

1.

Reemplaza en la frmula los datos correspondientes y encuentra la recta.

2.

Cul es la recta que pasa por los dos puntos?

3.

Ya tienes la ecuacin de la recta, y sabes que el punto que buscas o percentil 50, corresponde a la interseccin de ella con la recta y = 0,5. Reemplaza el valor y = 0,5 en la recta encontrada.

4.

Cul es el percentil 50?

Ms percentiles
A partir de la ecuacin de la recta, podemos determinar la siguiente frmula, con la cual podemos determinar el valor de un percentil directamente.

Pm = a j 1 +
Donde:

j fj

( F j 1 )

= Corresponde al percentil a calcular, dividido por 100. Este valor es 0 < < 1 j = Corresponde al entero en el cual Fj 1 < y F j >
j = Corresponde al tamao del intervalo. F j ; F j 1 = Corresponde a la frecuencia Relativa acumulada en ese intervalo. a j 1 = Corresponde al lmite superior de ese intervalo. f j ; f j 1 Corresponde a la frecuencia absoluta en aquel intervalo.
Unidad: Estadstica y Probabilidad

123

Calcula el Percentil 10
Para utilizar esta formula debes hacer lo siguiente: 1. Registra el tamao de la muestra: n = 2. Calcula

3. Identifica al entero j de modo que Fj 1 < y F j >

4.

Identifica los valores correspondientes y completa la tabla:


Fj F j 1 = a j 1 = j = fj f j 1

5.

Ahora, reemplaza en la formula los valores encontrados, segn corresponda y calcula el Percentil 10

P 10 = a j 1 +

j fj

( Fj 1 )

P10 =

124

Unidad: Estadstica y Probabilidad

6.

Entonces, el 10% de los 212 puntajes observados son menores o iguales a:

7.

Considerando la misma distribucin de puntajes, calcula P45 y P90

8.

Como puedes interpretar el valor obtenido para P45?

Cuartiles y Deciles
Otras medidas de Posicin son los cuartiles y deciles.

Cuartiles
Los cuartiles (Qn) dividen a la muestra en 4 partes iguales, y son llamados Q1: primer cuartil; Q2: segundo cuartil y Q3 tercer cuartil.

Unidad: Estadstica y Probabilidad

125

Cada uno de ellos es equivalente a un percentil, por ejemplo: Primer Cuartil (Q1) representa al 25% de la muestra, por lo tanto equivale al percentil 25 P25 1. A que percentil equivale el segundo y el tercer cuartil?

2.

Calcula el primer, segundo y tercer cuartil del caso presentado anteriormente: El peso de los Peces

3.

Ubica los cuartiles y porcentajes de los pesos de los peces en la recta segn corresponda:

126

Unidad: Estadstica y Probabilidad

Deciles
Los deciles (Dn) dividen a la muestra en 10 partes iguales, y son llamados D1: primer decil; D2: segundo decil, hasta D9: noveno decil. Ubica en la recta los deciles y los porcentajes a los cuales representa.

Cada uno de ellos es equivalente a un percentil, por ejemplo: Primer Decil (D1) representa al 10% de la muestra, por lo tanto equivale al percentil 10 P10

1.

A que percentil equivale el cuarto y el sptimo decil?

2.

A que cuartil equivale el decil 5 o quinto decil?

3.

Haz equivalencias entre deciles, cuartiles y percentiles

4.

Calcula el primer decil del caso presentado anteriormente: Puntajes en la PSU

Unidad: Estadstica y Probabilidad

127

Pasando en limpio
Junto a tus compaeros y tu profesor, expresa o define las medidas de posicin y sus principales caractersticas. Percentiles (Pn) Definicin

Principales caractersticas

Cuartil (Qn) Definicin

128

Unidad: Estadstica y Probabilidad

Principales caractersticas

Deciles (Dn) Definicin

Principales caractersticas

Unidad: Estadstica y Probabilidad

129

GUA 15 APROPINDOSE DE LA TCNICA


Esta gua tiene como finalidad desafiar tus capacidades a travs de un conjunto de problemas. Para abordarlos debers comprender el contexto, realizar los clculos y responder algunas preguntas.

Fiesta de cumpleaos
Una Fundacin de acogida de personas de la tercera edad, realiz una fiesta en la cual celebraron 7 ancianos sus cumpleaos. La Sra. Rosa cumpli 102 aos, mientras que la guagua del grupo, la Sra. Rebeca, cumpli 62. La jornada cont con la presencia de familiares y amigos, hubo torta, regalos y muchas tonadas. Tambin se celebraron los cumpleaos del Sr. Gonzlez, que cumpla 75, la Sra. Teresita (84), el Sr. Prez (63), la Sra. Dominique (71) y la Sra. Cambiaso (63). 1. Registra la media aritmtica o promedio, la mediana y la moda de las edades de los festejados. Redondea la media al nmero entero ms cercano.

2.

Existe alguna edad muy alejada del promedio (dispersa)? Si lo hubiera, seala cul es y explica cmo afecta a los resultados.

En busca de la meta
Jessica desea alcanzar un promedio de 6,5 en matemtica, para mantener el promedio anual que tuvo el pasado perodo escolar. Sus notas hasta el momento han sido las siguientes: 6,2; 6,6; 6,0; 5,9 y 6,4. 1. Cul es su promedio actual?

2.

Para cerrar el promedio, todava falta la prueba de nivel que equivale a dos notas. Es posible que consiga el promedio deseado? Justifica la respuesta con algunos ejemplos.

130

Unidad: Estadstica y Probabilidad

Medicin en el Liceo
El tercero A del Liceo, realiz una medicin del peso de sus alumnos y se obtuvo 1281 kilos entre todos sus alumnos. 1. Si la media es de 51 kilos Cuntos estudiantes participaron del pesaje?

2.

Si la mediana es de 57 kilos y exactamente 3 alumnos tienen ese peso, Cuntos pesan ms de 57 kilos? Discute con tus compaeros.

Nmero de hijos por Familia


En una comuna se detectaron los siguientes nmeros de hijos por familia: 1 6 3 1 2 2 2 1. 2 5 3 2 3 0 1 3 4 2 1 4 1 0 0 6 5 6 5 2 2 1 5 2 1 3 3 1 0 2 3 5 2 2 1 1 0 1 1 3 5 2 0 2 4 1 0 4 3 1 3 0 4 1 5 2

Resume los datos en una tabla de frecuencia y calcula la media, moda y mediana de los datos.

Unidad: Estadstica y Probabilidad

131

2.

Calcula la desviacin estndar de los datos.

3.

Calcula el percentil 80, percentil 40 y percentil 20.

4.

Calcula el quintil segundo y el quintil tercero.

Reaccin de frenado
Una investigacin entreg las siguientes mediciones acerca del tiempo de reaccin, en segundos, que tiene un individuo al frenar en un vehculo ante un imprevisto. 0,113 0,113 0,124 0,127 0,108 0,110 0,098 0,118 0,111 0,120 0,126 0,122 0,132 0,112 0,099 0,112 0,105 0,108 0,101 0,102 0,117 0,103 0,115 0,112 0,129 0,113 0,119 0,120 0,111 0,115 0,135 0,100 0,107 0,119 0,121 0,107 0,117 0,123 0,103 0,130 0,122 0,113 0,109 0,100 0,134 0,118 0,106 0,128 0,094 0,114

132

Unidad: Estadstica y Probabilidad

1.

Calcula la desviacin estndar.

2.

Agrupa los datos en intervalos de 0,100 de amplitud de clase. Luego, calcula la media, moda y mediana de los datos.

3.

Calcula el percentil 85 y el segundo quintil.

Unidad: Estadstica y Probabilidad

133

Identificando las dueas de las notas


El promedio de notas de 2 alumnas es el siguiente: Andrea Xmena 1. Se consideran los siguientes grupos de notas: Grupo 1: 4,2 - 4,1 - 3,9 - 3,8 Grupo 2: 1,0 - 7,0 - 7,0 - 1,0 a. Es posible determinar qu grupo de notas corresponden a cada alumna? Justifica. Promedio 4,0 4,0

2.

Si se incorpora como dato la desviacin estndar en las notas de cada una: Promedio 4,0 4,0 S 1,6 3

Andrea Xmena

a. Podras indicar qu grupo de notas corresponde a cada una de las alumnas? Grupo 1: 4,2 - 4,1 - 3,9 - 3,8 Grupo 2: 1,0 - 7,0 - 7,0 - 1,0 Justificacin:

134

Unidad: Estadstica y Probabilidad

GUA 16 QU ES Y CMO SE USA LA DISTRIBUCIN NORMAL


1. Variable aleatoria

En este momento, recordaremos otro concepto importante, el de variable aleatoria. En el programa de tercer ao medio, se alude y define este concepto. Nuestra definicin dice que estamos frente a una variable aleatoria cuando en un experimento aleatorio se asocia un valor numrico a cada resultado del experimento. Comnmente se utilizan letras maysculas para designar variables aleatorias ( A, B, X, Y, Z ) y letras minsculas para los valores concretos de ellas mismas (a, b, x, y, z ). Por ejemplo, si la probabilidad de que la variable aleatoria discreta X tome el valor a es 1 , entonces esto se anota como P(X = a) = 1 . 2 2 2. Las distribuciones de probabilidades

Cuando se quiere estudiar un fenmeno, se escoge una muestra del mismo y se recoge una serie de observaciones sobre los valores que presenta. Se confecciona una tabla de frecuencias que nos permite conocer el comportamiento de los datos. Esta es una aproximacin del fenmeno basada en datos observados en la muestra. Las distribuciones de probabilidad son modelos tericos de como sera tal distribucin para la poblacin completa. Las tablas de frecuencias se construyen usando datos reales observados de la muestra, pero al construir distribuciones de probabilidad, usamos los posibles resultados y sus probables frecuencias. As por ejemplo, al contemplar el experimento "observar la suma obtenida al lanzar dos dados de seis caras", podemos hacer una distribucin de frecuencias relativas, resultante de realizar el experimento un nmero grande de veces, o por el contrario, una distribucin de probabilidad, en la que asignemos a cada resultado su probabilidad. En el primer caso utilizamos la frecuencia relativa de cada dato mientras en el segundo utilizamos la probabilidad de cada resultado.

Distribucin de frecuencias relativas observadas de la suma de caras en 200 lanzamientos de dos dados.

Distribucin de probabilidad terica de la suma de caras en infinitos lanzamientos de dos dados.

De esta forma, al utilizar distribuciones de probabilidad, usamos un modelo terico que correspondera a una distribucin perfecta de frecuencias de una poblacin, es decir, el que correspondera al fenmeno si este se realizara un nmero infinito de veces.
Unidad: Estadstica y Probabilidad

135

Por ejemplo, si consideramos la variable aleatoria X = valor de la suma de las caras de dos dados, entonces la probabilidad de obtener 11 en la suma de las caras es de 2 . Esto se anota 11 2 . P (X = 11) = 11 Lo que hace interesante el estudio de una distribucin, es que las probabilidades de ocurrencia de los resultados de un experimento aleatorio, se reparten en su grfica con una forma caracterstica, incluso en experimentos distintos del mismo tipo. A partir de esto es que los modelos tericos de las distribuciones permiten hacer predicciones de las probabilidades de los valores de la variable aleatoria sin necesidad de realizar el experimento. A continuacin, se muestran algunas grficas de ejemplo de distribuciones de probabilidad que se usan en estadstica:

Distribucin Uniforme

Distribucin Binomial

Distribucin Normal

Distribucin T de Student

Distribucin exponencial

Distribucin

( se lee chi)

3.

La distribucin normal

La distribucin normal es un modelo terico que sirve para representar, en forma aproximada, algunas distribuciones de datos continuos. La primera condicin para que una variable aleatoria siga una distribucin normal, es que sea cuantitativa y la segunda que sea continua, por lo que, tericamente, puede tomar todos los valores dentro de un intervalo dado (que incluso puede ser infinito). En la prctica, podemos tambin considerar el caso de variables discretas con un nmero muy grande de valores, que haga necesaria su agrupacin en intervalos, para tratarla como si fuese continua. Un ejemplo de distribucin normal El coeficiente intelectual de las personas (que comnmente se denomina CI) es utilizado para medir la capacidad lgica y se obtiene a partir de ciertos cuestionarios que han sido validados y probados con un gran nmero de personas. En estos cuestionarios, una puntuacin 100 corresponde al promedio, y se supone que se alcanza cuando el desarrollo intelectual de una persona es el promedio del correspondiente a su edad. Una puntuacin superior o inferior a 100 indica ms o menos capacidad intelectual que el promedio de su edad, respectivamente.

136

Unidad: Estadstica y Probabilidad

En las figuras siguientes se muestran los histogramas de frecuencias de la puntuacin obtenida en el cuestionario que mide el CI por grupos de personas seleccionadas aleatoriamente. Resultados obtenidos por 100 personas.
(Frecuencia absoluta)

Figura 1a.

Resultados obtenidos por 1000 personas.


(Frecuencia absoluta)

Figura 1b.

Resultados obtenidos por 10000 personas.


(Frecuencia absoluta)

Figura 1c.

Si siguiramos aumentando a millones o ms la cantidad de personas, el histograma adoptara una forma estable como la figura 2. Esta es la forma caracterstica de la distribucin normal que estudiaremos en esta y en las prximas guas. Figura 2 Recordemos que si recolectamos datos de un experimento aleatorio y graficamos el histograma de frecuencias relativas absolutas de ellos, la frecuencia relativa absoluta de cada uno se puede entender tambin como la probabilidad (experimental) de ocurrencia del mismo. De este modo, las frecuencias relativas acumuladas permiten determinar las probabilidades de mayoraciones o minoraciones. Por ejemplo, respecto de la figura 1b: Frecuencia relativa absoluta. La frecuencia absoluta de personas con un CI igual a 80 es 30. O sea, que de 1000 personas observadas, 30 de ellas tenan un CI igual a 80. En este caso, la frecuencia absoluta relativa ser 30 1000 = 0,03 . Este valor se puede interpretar como la probabilidad experimental de que una persona escogida al azar tenga un CI igual a 80 es del 3%. Frecuencia relativa acumulada. La frecuencia acumulada de personas con un CI menor a 80 es 30 + 20 + 18 + 12 + 7 + 8 = 95 (aproximadamente del grfico 1b). O sea, que de 1000 personas observadas, 95 de ellas tenan un 95 = 0,095 . Este valor se CI menor a 80. En este caso, la frecuencia absoluta acumulada ser 1000 puede interpretar como la probabilidad experimental de que una persona escogida al azar tenga un CI menor a 80 es del 9,5%.
Unidad: Estadstica y Probabilidad

137

Recordemos tambin que la distribucin normal es un modelo terico de una variable aleatoria continua, cuyo grfico de frecuencias relativas absolutas es similar a la figura 2. As, la figura 2 muestra la distribucin de frecuencias de infinitos datos observados. En este caso, no es posible determinar la frecuencia relativa absoluta (probabilidad de un dato) de un dato pues al dividir la frecuencia absoluta por el nmero de observaciones, que son infinitas, se obtiene cero. Por ello, es que se utiliza la frecuencia relativa acumulada (probabilidad de un intervalo) y slo se puede obtener informacin de intervalos de datos. Por esta razn es que utilizaremos slo probabilidades de desigualdades en adelante. Los parmetros de una distribucin normal Los parmetros en la distribucin normal son: la media, que llamaremos (usaremos en el modelo terico y x para el promedio de los datos observados) y la variabilidad que llamaremos 2, aunque por razones prcticas de manipulacin aritmtica, en esta y las guas siguientes, usaremos la desviacin estndar . Estos conceptos los usaremos respecto de una variable aleatoria continua que llamaremos X. Ms arriba se explic que la distribucin normal es un modelo terico de una variable aleatoria continua, cuyo histograma de frecuencias relativas absolutas es similar a la figura 2 y que este corresponde a la distribucin de frecuencias absolutas de infinitos datos observados. Por lo tanto, para obtener la frecuencia de uno de ellos se utiliza la llamada funcin de densidad normal. La funcin de densidad normal est definida por una frmula que depende de los parmetros y anteriormente mencionados que la determinan por completo. La funcin de densidad de la variable aleatoria normal X, con media y desviacin estndar , es:

f (x ) =

1 2

( ) e
1 x 2

Esta funcin tiene un aspecto complejo, pero NO se te pedir manipularla algebraicamente. Te proporcionaremos herramientas de software para trabajar con ella. En la figura 3 adjunta, se muestra la grfica de la funcin de densidad de la distribucin normal. Podemos ver que es simtrica respecto de la media y se muestra el punto que est desviado a una distancia de la media .

Grfica de la distribucin normal Figura 3.

Junto a las caractersticas anteriores, se puede observar que la grfica tiene forma de campana. Justamente, esta grfica es conocida como la campana de Gauss.

138

Unidad: Estadstica y Probabilidad

Una visin grfica de los parmetros y en la distribucin normal


Abre el applet Distribucin normal 01. Manipula las barras que controlan los valores de y para que veas cmo se comporta la grfica de la funcin de densidad de probabilidad normal. A continuacin, utilizando el applet, posiciona los parmetros en los siguientes valores y observa cmo se comporta la grfica de la distribucin normal: a. b. c. d. e.

=1y=2 = 2 y = 0,5 =0y=5 = 5 y = 0,1 = 0 y = 0,1 = 2 y = 0,1

Observacin 1: El applet no llega a = 0, pero es posible observar que, en este caso, todos los datos tericos cuya distribucin es normal, son iguales entre s y, por ende, iguales a la media . Observacin 2: Pasa lo mismo que en el punto anterior, solo que en este caso = 2.

f.

4.

Las probabilidades en la distribucin normal 4.1. Clculo de probabilidades en la distribucin normal Si tenemos una variable aleatoria X cuyos valores se distribuyen segn una distribucin normal de media y desviacin estndar entonces, podemos determinar las probabilidades asociadas a los valores de X. Supongamos que X tiene una distribucin
{

Entonces, la probabilidad de encontrar un valor cualquiera de X que sea menor o igual a 3 es de 0,747. La notacin para este clculo es P ( X 3)= 0,747. En las condiciones anteriores, la probabilidad representa el rea bajo la curva a la izquierda de 3. La figura 4 siguiente muestra la grfica de la situacin.

Figura 4.

Ejercicios: Utilizando el applet Distribucin normal 03, determina las siguientes probabilidades segn la distribucin dada:
Unidad: Estadstica y Probabilidad

normal de media = 3 y de desviacin estndar = 1,5. Esto lo anotaremos N 3 ; 1,5 .


139

1.

Si la variable aleatoria X tiene una distribucin N (2 ; 1,1): 1.1. Reconoce y anota los valores de y de la distribucin dada en el enunciado: = += + 2 = + 3 = = = 2 = 3 =

1.2. A partir de la distribucin dada, determina las siguientes probabilidades: 1.2.1. 1.2.2. 1.2.3. 1.2.4. 1.2.5. 1.2.6. 1.2.7. 1.2.8. 1.2.9. 1.2.10. 1.2.11. 1.2.12. 1.2.13. = = = = = = = = = = = = =

2.

Si la variable aleatoria X tiene una distribucin N (2 ; 0,5): 2.1. Reconoce y anota los valores de y de la distribucin dada en el enunciado: = += + 2 = + 3 = = = 2 = 3 =

140

Unidad: Estadstica y Probabilidad

2.2. A partir de la distribucin dada, determina las siguientes probabilidades: = = = = = = = = = = = = = 3. Si la variable aleatoria X tiene una distribucin N (0,5 ; 0,75) entonces: 3.1. Reconoce y anota los valores de y de la distribucin dada en el enunciado: = += + 2 = + 3 = = = 2 = 3 =

3.2. Dadas las siguientes probabilidades, determina el valor de x :

Unidad: Estadstica y Probabilidad

141

Considerando la misma distribucin, determina las siguientes probabilidades: = = = = = = En los tres ejercicios anteriores, se te pidi calcular las mismas probabilidades en los ejercicios 8 al 13. Si te fijas, a pesar de ser distribuciones distintas, estas probabilidades tienen el mismo valor. Esto ocurre as, porque las reas bajo la curva correspondientes a los intervalos [ , + ] , [ 2 , + 2 ] y [ 3, + 3 ] de cualquier distribucin, son siempre las mismas. Las siguientes figuras muestran esto grficamente.

) = P( X + ) P( X )= 0.682 P(x [ , + ]
Figura 5a.

P (x [ 2 , + 2 ] ) = P( X + 2 ) P( X 2)= 0.953

Figura 5b.

) = P( X + 3 ) P( X 3 )= 0.996 P(x [ 3 , + 3 ]
Figura 5c.

4.2. A continuacin te presentamos dos ejercicios, en los que debers seguir el procedimiento anterior para responder a las preguntas propuestas. Usa el applet Distribucin normal 03. 1. La talla media de 200 alumnos de un centro escolar es de 1,6m y su desviacin tpica 0,2m. Si las tallas siguen una distribucin normal. Cul es la probabilidad que un alumno elegido al azar pueda medir menos de 1,5m? La variable aleatoria es X = El problema supone que X tiene una distribucin

a. b.

142

Unidad: Estadstica y Probabilidad

c. El valor de es:

El valor de es:
;

d. La distribucin involucrada es N ( ; ) = N (

e. Utilizando el applet Distribucin normal 03, la probabilidad a determinar es P(X )= f. Describe en palabras y respecto del enunciado la probabilidad obtenida.

2.

En una fbrica de tuberas se construyen ductos para desage. Si se sabe que el dimetro se distribuye normalmente con una media de 2,5m y una desviacin estndar de 0,25m, cul es la probabilidad que el dimetro de un ducto mida menos de 2,4 metros? a. La variable aleatoria es X = b. El problema supone que X tiene una distribucin c. El valor de es: El valor de es:
;

d. La distribucin involucrada es N ( ; ) = N (
P( X

e. Utilizando el applet Distribucin normal 03, la probabilidad a determinar es

)=

f. Describe en palabras y respecto del enunciado la probabilidad obtenida.

Unidad: Estadstica y Probabilidad

143

5.

Cierre 5.1. En un experimento aleatorio, cul es la principal diferencia entre una tabla de frecuencias y una distribucin?

5.2. Cul es la forma caracterstica de la grfica de una distribucin normal? cul es la posicin donde se ubica siempre la media en su grfico?

5.3. La figura 6 es la grfica de una distribucin N(1,5 ; 1). Sobre el mismo grfico dibuja: 5.3.1. La media . 5.3.2. P ( X 1) = 0,308 5.3.3. P ( X 3) = 0, 068
Figura 6.

5.3.4. Explica el significado de la media . Adems, explica qu significa el rea bajo la curva de la figura 6 cuando P ( X 1) = 0,308 y P ( X 3) = 0,068 . Cundo el rea bajo la curva de una distribucin normal mide 1?

144

Unidad: Estadstica y Probabilidad

ANEXO 1
Algunas propiedades de la distribucin normal.
1. La funcin de densidad de probabilidad es:
1 f (x ) = e2 2 1 x
2

2. 3. 4.

El dominio de la funcin es el intervalo

] , + [

Su grfica tiene como asntota horizontal el eje de abscisas (Eje X). El rea total bajo la curva es igual a 1. De aqu se tiene que, por ejemplo, si z es un valor de una variable aleatoria Z que tiene una distribucin normal entonces:

P (z 0,7 )+ P (z 0,7 ) = 1
5. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de 0,5 (o un 50%) de observar un dato mayor que la media, y de 0,5 (o de un 50%) de observar un dato menor. La forma de la campana de Gauss depende de los parmetros y (ver applet Distribucin normal 01). La media indica la posicin del eje de simetra de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Cuanto mayor sea , ms aplanada ser la curva. La desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms dispersos estarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica que los datos estn muy prximos al valor medio de la distribucin. No existe una nica distribucin normal, sino una familia de distribuciones con una forma comn, diferenciadas por los valores de su media y su desviacin estndar.

6. 7. 8.

9.

10. Si seguimos la curva desde el centro hacia la izquierda y la derecha, podremos observar que la curva cambia de sentido, de cncava a convexa, o sea de una forma as a otra as . El punto en donde se produce este cambio de sentido est localizado a una distancia a cada lado de la media , o sea en y en + . La figura adjunta muestra esta situacin.

De entre todas las distribuciones normales, la ms utilizada es la distribucin normal estndar N(0,1), que corresponde a una distribucin de media = 0 y desviacin estndar = 1. Esta distribucin se estudia en la siguiente gua.
Unidad: Estadstica y Probabilidad

145

GUIA 17 LA DISTRIBUCIN NORMAL ESTNDAR


1. Las probabilidades en la distribucin Normal estndar Son muchos los fenmenos que se pueden modelar por una distribucin normal, por ejemplo, son muy tiles en controles de calidad de productos manufacturados. Por ello, son muy diversos los valores que pueden tomar la media ( ) y la desviacin estndar ( ). Esto, sumado a que muchas veces no es simple el clculo de y , hizo necesaria buscar alguna simplificacin. Persiguiendo la economa en los clculos, es que se ide un cambio de escala que permite transformar cualquier distribucin normal N( ; ) a una distribucin N(0 ; 1). Esta ltima es conocida como distribucin normal estndar. 1.1. La equivalencia de la distribucin N( ; ) con la distribucin N(0 ; 1). En los ejercicios del punto 3.1 de la gua anterior, te presentamos tres distribuciones normales: N ( 2 ; 1,1) , N ( 2 ; 0,5 ) y N (0,5 ; 0,75) y para determinar las probabilidades all pedidas, utilizamos el applet Distribucin normal 03, que permite calcular fcilmente las probabilidades. Pero antes de contar con applets o software, era complicado determinar las probabilidades o datos asociados a probabilidades en las distribuciones como las anteriores. Por ello, se acord utilizar una distribucin normal estndar de media 0 y desviacin estndar 1, o sea N(0 ; 1). Esta transformacin permite trabajar con todas las dems distribuciones, no importando los valores de y , si se llevan a N(0 ; 1) con una transformacin de los datos, economizando tiempo y recursos, pues slo se consulta una tabla o se utiliza un software como los applets. Cmo hacer la transformacin La transformacin consiste en sustituir la variable aleatoria original X (que sigue una distribucin N( ; )), por una nueva variable aleatoria Z que siga la distribucin X estndar N(0 ; 1), haciendo uso de la expresin: Z = . Es decir, si X distribuye N( ; ) entonces Z = Otra forma de decir esto es, si X ~ N ( ; )
X distribuye N(0 ; 1). entonces Z ~ N (0 ; 1 ) .

En la prctica, esto consiste en tomar los valores x de la variable X (que distribuye x de la variable Z (que distribuye N(0 ; 1) ). N( ; ) ) y transformarlos en valores z = Veamos un ejemplo de esta transformacin.

146

Unidad: Estadstica y Probabilidad

Supongamos que se tiene una mquina que rellena una botella de perfume con 10 ml siguiendo una distribucin N(10 ; 0,1). Se pide determinar la probabilidad que un frasco de perfume tenga un contenido menor a 10,15ml. Resolucin: a. b. c. d. La variable aleatoria es X = La cantidad de ml de llenado de un frasco de perfume La variable X distribuye N(10 ; 0,1) La probabilidad pedida es P ( X 10,15 ) Transformacin de la variable aleatoria X. Si X ~ N (10 ; 0,1 ) entonces Z ~ N (0 ; 1 ), donde
Z= X X 10 = 0,1

e.

La probabilidad de la buscada es
X 10 10,15 10 P ( X 10,15 ) = P = P ( Z 1,5 ) 0,1 0,1

f.

Segn el applet
P ( Z 1,5 ) = 0,932

En porcentaje sera: g.

93,2%

Segn la tabla del anexo 1


P ( Z 1,5 ) = 0,9332

En porcentaje sera: h. Entonces:

93,3%

- Segn el applet, la probabilidad de que un frasco tenga menos de 10,15 ml de perfume es del 93,2% - Segn la tabla del anexo 2, la probabilidad de que un frasco tenga menos de 10,15 ml de perfume es del 93,3%

Unidad: Estadstica y Probabilidad

147

1.2. A continuacin te presentamos tres ejercicios. Los dos primeros son los mismos de la gua anterior (en la parte 3.2) y el tercero es nuevo. En esta ocasin, te ayudaremos a seguir el procedimiento del ejemplo anterior para responder a las preguntas propuestas. 1. La talla media de 200 alumnos de un centro escolar es de 1,6m y su desviacin tpica 0,2m. Si las tallas siguen una distribucin normal. Cul es la probabilidad que un alumno elegido al azar pueda medir menos de 1,5m? a. La variable aleatoria es X= b. La variable X distribuye N( c. La probabilidad pedida es P ( X , )

d. Transformacin de la variable aleatoria X. Si X ~ N ( ; ) entonces Z ~ N (0 ; 1 ) , donde X X Z= = e. La probabilidad buscada es: x P ( X _____ ) = P f. Segn el applet
P ( Z ______ ) = ______

= P ( Z ______ )

En porcentaje sera: g. Segn la tabla del anexo 2


P ( Z ______ ) = ______

En porcentaje sera: h. Entonces: - Segn el applet,

. - Segn la tabla del anexo 2, .

148

Unidad: Estadstica y Probabilidad

2.

En una fbrica de tuberas se construyen ductos para desage. Si se sabe que el dimetro se distribuye normalmente con una media de 2,5m y una desviacin estndar de 0,25m, cul es la probabilidad que el dimetro de un ducto mida menos de 2,4 metros? Utiliza el mismo procedimiento esbozado en la pregunta 1 anterior para contestar.

Unidad: Estadstica y Probabilidad

149

3.

La resistencia a la rotura de cierto tipo de plstico se distribuye segn una distribucin normal. La media de la resistencia de rotura es de 1100 kilos y la desviacin estndar es de 75 kilos. Cul es la probabilidad de que el plstico resista hasta los 1500 kilos? Utiliza el mismo procedimiento esbozado en la pregunta anterior para contestar.

150

Unidad: Estadstica y Probabilidad

2.

Cierre 2.1. Cul es la utilidad de la distribucin normal estndar N(0 ; 1)?

2.2. Cualquier variable aleatoria X que tenga distribucin normal se puede llevar a una variable aleatoria Z que tenga distribucin normal N(0 ; 1) mediante la transformacin adecuada. Cul es la transformacin para la variable aleatoria X que distribuye N(5 ; 0,1) que la lleva a la variable aleatoria Z que distribuye N(0 ; 1)?

Unidad: Estadstica y Probabilidad

151

ANEXO 2
Se suele llamar Z a la distribucin normal con media = 0 y desviacin estndar = 1 y se le conoce como la distribucin N(0 , 1). Las diferentes reas encerradas por esta curva y el eje de abscisas, desde 0 hasta 3,49 vienen dadas en la siguiente tabla de centsima en centsima. Por ejemplo, para obtener la probabilidad de un valor z < 1,26, la cifra entera y la dcima de z se buscan en la primera columna, y la centsima en la primera fila. Entonces el valor de P ( Z < 1,26 ) se determina cruzando la fila del 1,2 con la columna del 0,06 obtenindose 0,8962 como se muestra. Por lo tanto, desde la tabla se tiene que P ( Z < 1,26 ) = 0,8962 .

Sugerencia: Como se vio en el anexo 1 de la gua 16, la distribucin normal es simtrica con respecto a su media . Esta propiedad nos permitir calcular la probabilidad de un valor z menor que un valor negativo: P( z < a ) = 1 P ( z < a ) Por ejemplo, si queremos calcular P( z < 0,48) , debemos buscar P( z < 0,48) = 0,6844 , luego P( z < 0,48) = 1 P ( z < 0,48) = 0,3156

152

Unidad: Estadstica y Probabilidad

GUA 18 DE LA DISTRIBUCIN BINOMIAL A LA DISTRIBUCIN NORMAL


La relacin entre la distribucin Binomial y la distribucin Normal
La distribucin normal es muy til, e incluso, dadas algunas condiciones, puede suplir a la distribucin binomial. A continuacin ilustramos esto con el ejemplo del peso de los paquetes de azcar. Como la tcnica presentada en este ejemplo es engorrosa para un nmero n grande, tambin mostraremos una forma ms econmica (en cuanto al nmero de clculos) de determinar si la distribucin binomial se puede estudiar con una distribucin normal.

La distribucin binomial se parece a la distribucin normal


Para averiguar si un conjunto de datos se ajusta a una distribucin normal, se calculan la media y desviacin tpica (o estndar) de dichos datos. Si con la normal de igual media y desviacin tpica, las frecuencias tericas de los valores se ajustan a las reales, podramos concluir que dichos datos siguen una distribucin normal. Un ejemplo puede aclarar ms las cosas. Imaginemos que tras analizar el peso de una muestra de 200 paquetes de azcar, hemos separado los resultados en intervalos de pesos, obteniendo los siguientes datos: Pesos (en kg) Frecuencia
4 16 34 45 49 38 14

[2,30 2,35 [ [2,35 2,40 [ [2,40 2,45 [ [2,45 2,50 [ [2,50 2,55 [ [2,55 2,60 [ [2,60 2,65 ]

A partir de estos datos, consideremos la variable aleatoria X como el peso de los paquetes de azcar. Se calculan la media y la desviacin estndar, obteniendo una media de 2,497 y una desviacin estndar de 0,0725. Luego, se comparan las frecuencias reales con las frecuencias tericas, que se obtienen de la distribucin normal con la misma media y la misma desviacin tpica (o estndar), o sea, N ( 2,497 ; 0,0725 ) . La siguiente tabla muestra esta comparacin:
Unidad: Estadstica y Probabilidad

153

Pesos (en kg)

Frecuencias reales
4 16 34 45 49 38 14

Probabilidades
P ( 2,3 X < 2,35) = 0,0183 P ( 2,35 X < 2,4) = 0,0701 P ( 2,4 X < 2,45 ) = 0,1693 P ( 2,45 X < 2,5 ) = 0,2549 P ( 2,5 X < 2,55 ) = 0,2513 P( 2,55 X < 2,6 ) = 0,1549 P ( 2,6 X 2,65 ) = 0,0604

Frecuencias tericas
3,66 14,02 33,86 50,98 50,26 30,98 12,08

[2,30 2,35 [ [2,35 2,40 [ [2,40 2,45 [ [2,45 2,50 [ [2,50 2,55 [ [2,55 2,60 [ [2,60 2,65 ]

Considerar aceptables las diferencias entre las frecuencias reales y las frecuencias tericas si estas son menores a 0,01. Por lo tanto, es posible hacer predicciones probabilsticas razonablemente precisas respecto del peso de los paquetes de azcar. Cmo determinar la distribucin normal que se ajusta a una distribucin binomial Si se tiene una variable aleatoria que distribuye binomialmente, y se tiene un nmero grande de datos de ella, entonces es posible utilizar la distribucin normal para aproximar a la distribucin binomial. Una distribucin binomial de n expermientos con probabilidad de xito p tiene como media a = n p y como desviacin tpica (o estndar) a = n p ( 1 p ) . Cuando el valor de n p (1 p ) sea mayor o igual a 10, la aproximacin de la distribucin normal a la distribucin binomial ser bastante buena. En estos casos, diremos que una binomial B( n, p ) es 1 p ) , o sea, equivalente1 a una distribucin normal con = n p y = n p ( B (n, p ) ~ N np , n p ( 1 p) .

Es decir, si se cumple que :


n p ( 1 p ) 10

entonces, la distribucin binomial es equivalente a una distribucin normal que tenga igual media ( = n p ) y misma desviacin tpica ( = n p ( 1 p ) ) que ella.
1 En esta unidad, entenderemos por distribuciones equivalentes a aquellas cuyos valores difieren poco entre ellas.

154

Unidad: Estadstica y Probabilidad

Veamos un ejemplo Supongamos que el porcentaje de fracaso escolar en la PSU es del 40%. Calcula la probabilidad de que no se superen los 380 fracasos, para una poblacin de 1000 estudiantes o sea P ( X 380) , donde X = Nmero de fracasos escolares en la PSU distribuye binomialmente. Solucin Supongamos que la variable aleatoria X = "nmero de fracasos escolares en la PSU" sigue una distribucin binomial B (1000 ; 0,4 ) . Entonces, para calcular P ( X 380 ) tendramos que disponer de una tabla que tuviese las probabilidades de fracaso de n = 1000 estudiantes (te imaginas el tamao de dicha tabla?). Adems, en estas condiciones, habra que calcular P ( X 380 ) como la suma de 381 probabilidades: P (0), P (1), ..., P (379), P (380) , es decir P ( X 380 ) = P (0) + P (1) + ... + P (379) + P (380) a mano (o con calculadora). Un trabajo largo, tedioso y muy susceptible de incorporar errores. En estas condiciones, es preferible utilizar una distribucin normal que se asemeje mucho a la binomial del problema, pues se facilitan mucho los clculos. Los pasos a seguir entonces son: a. Identifiquemos los valores que necesitamos: i. n = 1000 . b. ii. p = 0,4 .

1 p ) 10 . Luego debemos comprobar que n p ( n p ( 1 p ) = 1000 0,4 ( 1 0,4 ) = 1000 0,4 (0,6 ) = 1000 0,24 = 240 10

Como el resultado es mayor a 10 entonces podemos utilizar una distribucin normal equivalente a B (1000 ; 0,4 ) cuya media ser = n p = 1000 0,4 = 400 y su desviacin estndar = n p( 1 p ) = 1000 0,4 ( 1 0,4 ) = 1000 0,4 0,6 = 240 15,49 . Por lo tanto, la distribucin normal equivalente a B (1000 ; 0,4 ) ser N ( ; ) = N ( 400 ;15,49 ) i. Para transformar la distribucin N ( 400 ;15,49 ) en una distribucin normal estndar se utiliza la variable aleatoria Z = X . Para calcular P ( X 380 ) utilizaremos esta transformacin y el applet Distribucin normal 03 o la tabla en el Anexo 2 de la gua 17:
ii. P ( X 380 ) = P ( X 380

)= P (Z

380400 15, 49

)= P ( Z 1,29 ) = 0,1056

Por lo tanto, slo el 10,56% de los 1000 estudiantes tendrn, tericamente, menos de 380 fracasos.

Unidad: Estadstica y Probabilidad

155

Aplicaciones
En base a los pasos descritos en la pgina anterior determina las siguientes probabilidades: 1. Siguiendo el mismo contexto del ejemplo anterior, determina e interpreta las siguientes probabilidades: i. P ( X 400 ) a. n = ____________ ,
p = ____________

b. n p ( 1 p ) = _______________ Es mayor o igual a 10?

No

c. Si la respuesta es afirmativa en a. entonces calcula la media y desviacin estndar de la binomial equivalente:


= n p = __________________________________

= n p ( 1 p ) = ________________________________________________

d. Por lo tanto, en este caso, la distribucin normal equivalente a B (1000 ; 0,4 ) ser
N ( ; ) = N ( _______ ; ________ )

e. Transforma la distribucin normal obtenida en d. en una distribucin normal estndar y calcula la probabilidad:
P ( X 400 ) = P ( X 400

)= P (Z

400

)= P ( Z ______ ) = _______ = _______ %

f. Por lo tanto, . ii.


P ( X 700 )

a. n = ____________ ,

p = ____________

b. n p ( 1 p ) = _______________ Es mayor o igual a 10?

No

c. Si la respuesta es afirmativa en a. y b. entonces calcula la media y desviacin estndar de la binomial:


= n p = __________________________________

156

Unidad: Estadstica y Probabilidad

= n p ( 1 p ) = ________________________________________________

d. Por lo tanto, la distribucin normal equivalente a B (1000 ; 0,4 ) ser


N ( ; ) = N ( _______ ; ________ )

e. Transforma la distribucin normal obtenida en d. en una distribucin normal estndar y calcula la probabilidad:
P ( X 700 ) = P ( X 700

)= P (Z

700

)= P ( Z ______ ) = _______

f. Por lo tanto, . 2. Un proveedor de bolgrafos afirma que el 95% de ellos no tiene ningn defecto. Si t seleccionas 10 (n = 10) al azar y ves que slo 4 de ellos funcionan bien (p = 0,4). Calcula la probabilidad de que hayan 4 o menos bolgrafos que funcionen ( P ( X 4 ) ). Basndote en este resultado, di que opinas de la afirmacin del proveedor.

Unidad: Estadstica y Probabilidad

157

GUA 19 UN MTODO PARA APRENDER DE LA EXPERIENCIA


Introduccin
Uno de los principales objetivos en estadstica es usar informacin obtenida de una muestra de una poblacin, para tener una idea de lo que sucede en la poblacin completa. La razn de ello es que a veces las poblaciones son muy extensas o, en ocasiones, desconocidas. Por ejemplo, cul es el promedio de edad de TODOS los chilenos? En esta gua consideraremos que todas las observaciones de datos de las poblaciones consideradas distribuyen N (, ). Es comn en la estadstica encontrar inters en estudiar con ms detalle la media de una distribucin, como la normal. En su estudio, se puede determinar el promedio de la muestra de datos recolectada ( x ), con el propsito final de determinar el valor de la media en la poblacin ( ). Como en muchos casos esto ltimo es imposible, se trata de estimar un intervalo que contenga a con la mayor confianza1 posible. Los extremos del intervalo de confianza [a , b ] dependern del tamao n de la muestra escogida, de la confianza (probabilidad medida en porcentaje2) y de la variabilidad ( ) de la poblacin. Por ejemplo, supongamos que se logr determinar con una confianza del 95% ( = 0,05 ) que la media de una poblacin se encuentra en el intervalo [a , b ] . Esta afirmacin significa que en 95 de cada 100 intervalos estimados, la media de una poblacin se encuentra dentro de l. Grficamente se vera como la figura siguiente:

Figura 1.

En esta gua abordaremos la forma de determinar los valores de a y b del intervalo anterior, dados el tamao n de la muestra y el porcentaje de probabilidad que deseemos. O sea, construiremos un modelo terico del intervalo de confianza de la media de una poblacin. Los intervalos de confianza son entonces formas estadsticas de estimar por intervalos un parmetro de una poblacin con una determinada confianza. Su uso se explica en que si se toman distintas muestras de una poblacin entonces sus medias aritmticas diferirn, por lo que es mejor tener un rango en el que se encuentren las medias con una alta probabilidad. Los estadsticos han desarrollado muchas frmulas para determinar estos intervalos. En esta gua veremos el de la media cuando es conocida la desviacin estndar de la poblacin.

1 Entenderemos como mayor confianza a la mayor probabilidad de el intervalo estimado contenga a . 2 Para una confianza del 95% se toma = 0,05, pues 1 = 0,95 . Para una confianza del 99% = 0,01 y 1 = 0,99.

158

Unidad: Estadstica y Probabilidad

1.

Intervalo de confianza de la media En la gua 16, se mostr que las probabilidades (reas bajo la curva) correspondientes a los intervalos [ , + ] , [ 2 , + 2 ] y [ 3 , + 3 ] de cualquier distribucin normal, son siempre la misma en cada caso, es decir, la probabilidad de que un valor x est entre los extremos de cada intervalo es:
P(x [ , + ]) = P ( x + ) = 0.682 P( x [ 2 , + 2 ]) = P ( 2 x + 2 ) = 0.953 P( x [ 3 , + 3 ]) = P ( 3 x + 3 ) = 0.996

Podemos observar grficamente esta propiedad en las siguientes figuras:

P(x [ , + ]) = P ( x + ) = 0.682

P(x [ 2 , + 2 ]) = P ( 2 x + 2 ) = 0.953

O sea, aproximadamente el 68% Figura 2

O sea, aproximadamente el 95% Figura 3

P( x [ 3 , + 3 ]) = P ( x + ) = 0.996

O sea, aproximadamente el 99% Figura 4

El objetivo del intervalo de confianza de la media, es obtener un rango de valores en el que se encuentre el valor correcto de la media de la poblacin (o sea ), con un porcentaje alto de confianza. En una distribucin normal, el 95% de los casos se encuentran a una distancia de a lo ms 2 de la media ( P ( 2 x + 2 ) = 0.953 ), como se muestra en la figura 3. Si es la media de una poblacin y su desviacin estndar, la media muestral X es una variable aleatoria que sigue una distribucin aproximadamente normal N ; n siendo n el tamao de la muestra, para valores suficientemente grandes. Por ello, en el 95% de las muestras x de X , el promedio x estar a una distancia a lo ms de n de la verdadera media en la poblacin, o sea:

Unidad: Estadstica y Probabilidad

159

P x 2

x +2

) = 0.953

, que corresponde al 95% aproximadamente.

Recprocamente, podemos deducir que el 95% de las muestras la media en la poblacin estar dentro del intervalo x 2 n . Este es el intervalo de confianza del 95%. Por tanto, si x es el valor obtenido como candidato para la media, a partir de una muestra de tamao n, y es el valor desconocido de la media en la poblacin entonces, usando los intervalos en que se encuentran en el 95% y 99% de casos en la distribucin normal, podemos afirmar: a. Si P x 2 entonces

x +2
n

n n

[x 2
n

, x+2

)= 0.953 ] es el intervalo de confianza del 95% para .

b. Si P x 3

x +3
n

n n

entonces x 3

, x +3

)= 0.996 ] es el intervalo de confianza del 99% para .

2.

Aplicaciones del Intervalo de confianza de la media 2.1. Veamos un ejemplo. Supongamos que una fbrica produce y vende paquetes de azcar de 1 kilo. Al realizar un control de calidad, se observa que el peso medio de 100 paquetes es de 1050 grs. Si se sabe que la desviacin estndar es de 80 grs., calcula el intervalo de confianza del peso medio real ( ) de los paquetes de azcar. Solucin: Los datos del enunciado son: x = 1050 , n = 100 y = 80 . Como no nos entregan porcentaje de confianza requerido, lo supondremos en un 95%. Con estos datos, el intervalo de confianza de en este caso ser:

[x 2

, x+2

]= [1050 2

80 100

, 1050 + 2

80 100

]= [1050 16 , 1050 + 16 ]= [1034 , 1066 ]

Por lo tanto, en un 95% (95 de cada 100) de las muestras que se tomen, el verdadero valor de estar incluido en el intervalo [1034 , 1066 ]. En relacin con el contexto, podemos afirmar con un 95% de confianza que el peso promedio de TODOS los paquetes de azcar estar entre 1034 y 1066 gramos. Si aumentamos el porcentaje de confianza al 99% tendremos:

160

Unidad: Estadstica y Probabilidad

[x 3

, x +3

]= [1050 3

80 100

, 1050 + 3

80 100

]= [1050 24 , 1050 + 24 ]= [1016 , 1074 ]

Se aument el porcentaje de confianza, pero al mismo tiempo se agrand el intervalo. 2.2. Supongamos que en una muestra de 1000 estudiantes, el tiempo que usan un reproductor de msica en formato MP3 por da es de 2,5 horas, con una desviacin estndar de 0,5 horas. a. Determina el intervalo de confianza del 95% para la media del tiempo que usan un reproductor de msica en formato MP3 por da de TODOS los estudiantes.

b.

Determina el intervalo de confianza del 99% para la media del tiempo que usan un reproductor de msica en formato MP3 por da de TODOS los estudiantes.

c.

Escribe en palabras y en relacin al contexto del problema la interpretacin de los resultados obtenidos en a. y b.

Unidad: Estadstica y Probabilidad

161

2.3. Supongamos que en una muestra de 500 botellas de aceite de cierta marca, el contenido promedio de ellas es de 1,0 litros, con una desviacin estndar de 0,1 litros. a. Determina el intervalo de confianza del 95% para la media del contenido de TODAS las botellas de aceite.

b.

Si ahora la muestra es de 1000 botellas, determina el intervalo de confianza del 95% para la media del contenido de TODAS las botellas de aceite y compralo con el resultado de a.

c.

Escribe en palabras y en relacin al contexto del problema la interpretacin de los resultados obtenidos en a. y b.

162

Unidad: Estadstica y Probabilidad

Cierre
1. Qu es y de qu parmetros depende un intervalo de confianza?

2.

Es correcto afirmar que TODOS los estudiantes dueos de un MP3 usan su reproductor 2,5 horas al da para escuchar msica? Justifica tu respuesta.

3.

Bajo las condiciones del enunciado del ejemplo 2.1, se mostr que al aumentar el porcentaje de confianza del 95% al 99% tambin aument la longitud del intervalo. En estas mismas condiciones, si se aumenta el tamao n de la muestra aumenta o disminuye la longitud del intervalo? Prueba con n = 1000, n = 10000 y n = 100000.

Unidad: Estadstica y Probabilidad

163

Você também pode gostar