Escolar Documentos
Profissional Documentos
Cultura Documentos
Para construirlo basta separar en cada dato el ltimo dgito de la derecha (que constitu de cifras restantes (que formar el tallo).
Esta representacin de los datos es semejante a la de un histograma pero adems de ser fciles de elaborar, pr Ejemplos
Horarios de trenes
Tomamos como ejemplo un horario de trenes confeccionado a partir de un dptico de la lnea Castelldefels-Bar de Renfe. Originalmente el horario ocupa una tabla de 10 filas y 9 columnas ms una columna "viuda" con el tr con formato hh.mm cada uno. Dptico original Trayecto Castelldefels -> Barcelona-Sants
5.03 7.32 9.02 11.07 13.32 15.07 16.50 18.32 20.07 22.38 6.02 7.37 9.07 11.32 13.37 15.20 17.02 18.37 20.20 6.18 7.50 9.24 11.37 13.50 15.32 17.07 18.50 20.32 6.37 8.02 9.32 12.02 14.02 15.37 17.20 19.02 20.37 6.48 8.05 9.37 12.07 14.07 15.50 17.32 19.07 20.50 6.55 8.20 10.02 12.32 14.20 16.02 17.37 19.20 21.02 7.02 8.24 10.07 12.37 14.32 16.07 17.50 19.32 21.07 7.07 8.32 10.32 13.02 14.37 16.20 18.02 19.37 21.20 7.20 8.37 10.37 13.07 14.50 16.32 18.07 19.50 21.32 7.25 8.51 11.02 13.20 15.02 16.37 18.20 20.02 21.37
En el diagrama Stem & Leaf se representa la hora a la izquierda de la barra de separacin | y los minutos de la Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf
05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 | 02 07 32 37 11 | 02 07 32 37 12 | 02 07 32 37 13 | 02 07 20 32 37 50 14 | 02 07 20 32 37 50 15 | 02 07 20 32 37 50 16 | 02 07 20 32 37 50 17 | 02 07 20 32 37 50 18 | 02 07 20 32 37 50
19 | 02 07 20 32 37 50 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38
Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede reducir an Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido
05 | 03 06 | 02 18 37 48 55 07 | 02 07 20 25 32 37 50 08 | 02 05 20 24 32 37 51 09 | 02 07 24 32 37 10 11 12 | 02 07 32 37 13 14 15 16 17 18 19 20 | 02 07 20 32 37 50 21 | 02 07 20 32 37 22 | 38
Al final tenemos 59 campos de 2 dgitos, 118 caracteres ms los separadores, es decir 4 veces menos dgitos q
Esto nos da idea de que una disposicin apropiada de los datos puede ser doblemente informativa y que la re Edad de 20 personas Supongamos la siguiente distribucin de frecuencias
36 25 37 24 39 20 36 45 31 31 39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que vamos a representar mediante un diagrama Comenzamos seleccionando los tallos que en nuestro caso son las cifras de decenas, es decir 3, 2, 4, que reord A continuacin efectuamos un recuento y vamos aadiendo cada hoja a su tallo
Podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribucin
35 38 32 28 30 29 27 19 48 40 39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagrama de Tallos y Hojas y compararla con la anterior.
ultneamente una distribucin de frecuencias de la variable y su mo dgito de la derecha (que constituye la hoja) del bloque
n dptico de la lnea Castelldefels-Barcelona/Sants recogido en la estacin as ms una columna "viuda" con el tren de las 22:38. Un total de 91 campos
a de separacin | y los minutos de la salida de cada tren a la derecha. La frecuencia de los trenes se deduce fcilmente de la longitud de l
o de los trenes se puede reducir an ms el tamao del grfico, sin perder informacin y ganando en claridad.
res, es decir 4 veces menos dgitos que con el horario original, menos espacio y ms claridad.
doblemente informativa y que la representacin grfica puede contribuir enormemente a la percepcin de patrones y a la comprensin
a representar mediante un diagrama de Tallos y Hojas. e decenas, es decir 3, 2, 4, que reordenadas son 2, 3 y 4.
n la anterior.
deduce fcilmente de la longitud de las filas y es, adems, muy fcil ver en que minutos de cada hora pasan tpicamente los mismos.
Los diagramas de Caja-Bigotes (boxplots o box and whiskers) son una presentacin visual que describe varias c bigotesycajas Para su realizacin se representan los tres cuartiles y los valores mnimo y mximo de los datos, sobre un rect o verticalmente. Construccin:
Una grfica de este tipo consiste en una caja rectangular, donde los lados ms largos muestran el recorrido int dividido por un segmento vertical que indica donde se posiciona la mediana y por lo tanto su relacin con los c (recordemos que el segundo cuartil coincide con la mediana). Esta caja se ubica a escala sobre un segmento que tiene como extremos los valores mnimo y mximo de la var de la caja se llaman bigotes. Estos bigotes tienen tienen un lmite de prolongacin, de modo que cualquier dato encuentre dentro de este rango es marcado e identificado individualmente.
Utilizamos la ya usada distribucin de frecuencias (en tallos y hojas), que representan la edad de un colectivo d
Calculo de Cuartiles
cuartil es la media aritmtica de dicho valor y el siguiente: Q1=(24 + 25) / 2 = 24,5
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribucin. Como N = 20 resulta que N/
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribucin, es el valor de la variable que ocupa el l
un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmtica de dicho valor y el siguien me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribucin. En nuestro caso, como 3 Q2=(39 + 39) / 2 = 39
El bigote de la izquierda representa al colectivo de edades ( Xmn, Q1) La primera parte de la caja a (Q1, Q2), La segunda parte de la caja a (Q2, Q3) El bigote de la derecha viene dado por (Q3, Xmx).
Podemos obtener abundante informacin de una distribucin a partir de estas representaciones. Veamos algun
La parte izquierda de la caja es mayor que la de la derecha; ello quiere decir que las edades comprendidas en poblacin est ms dispersa que entre el 50% y el 75%. El bigote de la izquierda (Xmm, Q1) es ms corto que el de la derecha; por ello el 25% de los ms jvenes est que el 25% de los mayores. El rango intercuartlico = Q3 - Q1 = 14,5; es decir, el 50% de la poblacin est comprendido en 14,5 aos. Seguro que t podrs obtener ms informacin (Utiliza la mediana!)
La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.
Anlogamente a lo realizado con los diagramas de tallo y hojas, comparamos, mediante estos diagramas, esta d la del otro ejemplo de distribucin de edades.
35 38 32 28 30 29 27 19 48 40 39 24 24 34 26 41 29 48 28 22
Un corredor entrena para una determinada carrera y se toman los tiempos que necesita para recorrer los 100m (cada da se toman varios tiempos y se calculan mediana, cuartiles, valores mnimo y mximo)
Observamos que el desplazamiento de las grficas de caja hacia la izquierda indica que el entrenamiento ha da se tarda menos segundos en recorrer la misma distancia, siendo la diferencia entre el mximo y el mnimo men tambin la diferencia intercuartlica.
Comentarios: No hay datos muy atpicos, es decir que no hay equipo que se haya destacado por arriba o por ab Hay ms diferencia de puntos entre el primer y el ltimo clasificado para la liga 02/03 que en la liga anterior. Lo de la clasificacin estn ms apelotonados en la liga 02/03. Diagrama de Caja realizado con la hoja de calculo EXCEL para una, dos o tres variables
entacin visual que describe varias caractersticas importantes, mximo de los datos, sobre un rectngulo, alineado horizontal
ms largos muestran el recorrido intercuartlico. Este rectngulo est na y por lo tanto su relacin con los cuartiles primero y tercero
s valores mnimo y mximo de la variable. Las lineas que sobresalen ngacin, de modo que cualquier dato o caso que no se
s conjuntos de datos.
ambas distribuciones.
s que necesita para recorrer los 100m, durante 10 das consecutivos s mnimo y mximo)
da indica que el entrenamiento ha dado resultado, ya que cia entre el mximo y el mnimo menor, como as
e haya destacado por arriba o por abajo del resto de los equipos. a liga 02/03 que en la liga anterior. Los quipos del tercer cuarto
es variables