Você está na página 1de 19

UNIDAD I

ANLISIS DE DATOS UNIVARIADOS

Sesin 1
Aprendizaje Esperado: elaborar tablas de frecuencias y grficos estadsticos para resumir informacin de
variables cualitativas y cuantitativas discretas, correspondiente a datos propios del contexto de carreras del rea de
la mecnica, en un contexto de trabajo grupal colaborativo.

La Mecnica Automotriz puede describirse de una forma ms analtica y ms completa si en dicha descripcin se
incorpora un resumen que use tablas y grficos estadsticos.

Supongamos por ejemplo, que en un gran taller se encuentran presentes 27 autos, por diversos problemas. El
encargado de la recepcin del taller debe registrar el motivo general de la falla de cada auto. Tiene as la siguiente
informacin:

Visto el grfico, entonces ahora cabe hacerse la pregunta De qu forma puede resumirse la informacin aqu
presente?

Te invitamos a contestar a partir de la bsqueda que realices en internet.

Ahora, debemos entender que lo que se est analizando en este ejemplo son los motivos de ingreso de los autos
al taller. Esta corresponde a una variable que se denomina cualitativa, pues sus valores, las palabras anotadas,
corresponden a respuestas a la pregunta Cul es el motivo de ingreso del vehculo al taller?

El ordenamiento puede efectuarse en una tabla como la que se muestra a continuacin:

fi fi %
Operacin 3 11,11%
Instalacin 5 18,52%
Mantenimiento 10 37,04%
Partes defectuosas 9 33,33%
TOTAL 27 100,00%

Pero puede presentarse la informacin de otra forma? La respuesta es s, y eso es mediante la realizacin de
grficos estadsticos, que para el caso simple que estamos observando, requiere de un grfico de barras simples
y/o de un grfico circular.

1
A continuacin mostramos el grfico de barras

Investigue en internet cul es el grfico circular, o bsquelo en Excel.

De un tipo de variable cualitativa, como es la tratada en el reciente ejemplo, pueden obtenerse respuestas
numricas que tienen que ver con las cantidades sealadas de automviles, o con los porcentajes
correspondientes a cada una de ellas.

ACTIVIDAD: En grupos de cuatro personas, investiguen algn aspecto cualitativo de su inters de la


carrera que estn estudiando aqu, y renan datos como lo hizo el recepcionista. Elaboren la tabla y el
grfico circular correspondiente, y formule preguntas sencillas de entender y responder.
_____
______________________________
Qu tal ahora si el aspecto de su inters fuese por ejemplo la cantidad de neumticos sin aire de un automvil?
El recepcionista del taller toma nota de esto, y obtiene los siguientes resultados

Cul es entonces la tabla a elaborar? Qu detalles considera sta?


A continuacin veremos la estructura que tiene una tabla para una variable numrica como sta.

Nmero de neumticos sin aire fi fi % ni ni %


0 12 44,44% 12 44,44%
1 10 37,04% 22 81,48%
2 3 11,11% 25 92,59%
3 1 3,70% 26 96,30%
4 1 3,70% 27 100,00%
TOTAL 27 100,00%

La informacin que puede obtenerse de una tabla como sta es mucho ms detallada, ya que no slo se obtendrn
medidas porcentuales como estadsticas, sino que medidas que indicarn una tendencia mucho ms detallada,
como por ejemplo, un promedio.

2
Dado que aqu tenemos ahora una columna con frecuencias acumuladas, existe tambin una grfica para sta
denominada ojiva, que vemos a continuacin.

As, con el detalle de la tabla tal cual como se presenta ahora, se pueden realizar y contestar preguntas tales
como:

Cul es el nmero de neumticos sin aire que ms se repite?


Cul es el que menos?
Qu porcentaje de los autos del taller tiene 2 neumticos sin aire?
Qu porcentaje de los autos del taller no tiene ms de 1 neumtico sin aire?
Qu porcentaje de los autos del taller tiene al menos 1 neumtico sin aire?

Las mismas preguntas son realizables y contestables slo con la grfica de ojiva a la vista, aunque como sta
representa frecuencias acumuladas, algunas pueden requerir de un mayor grado de razonamiento.

Las preguntas planteadas terminaremos de resolverlas en esta clase.

ACTIVIDAD: Renanse en grupos de cuatro personas, y elijan una variable numrica como la anterior,
que no admita nmeros decimales, en el contexto de cualquier cosa que pueda ocurrir en un taller
mecnico. Registre los datos, y luego elabore preguntas en base a la tabla de frecuencias que construirn
de acuerdo a esos datos.

3
Sesin 2.

Aprendizaje esperado: elaborar tablas de frecuencia y grficos estadsticos para variables cualitativas y
cuantitativas discretas, usando para ello software EXCEL.

VARIABLE CUALITATIVA
I. Simulacin de la generacin de valores de una variable cualitativa

i. Genere en la columna A, usando la funcin ALEATORIO.ENTRE, 32 nmeros entre el 1 y el 5.

ii. Seleccione y copie los nmeros que se generaron, y luego, usando la opcin PEGADO ESPECIAL, pegue
slo los valores en la columna B, empezando por la fila 2.

iii. En la columna C, en la misma fila 2, plantee una funcin SI, de tal forma que cada uno de los 5 nmeros
generados tenga asociado un color, funcin, equipo, carrera, o valores de alguna variable cualitativa que usted
escoja. Arrastre esta funcin por la columna C, de tal forma que cada nmero generado anteriormente tenga a
su lado la palabra que usted ha definido.

II. Generacin de tabla de frecuencias para la variable cualitativa

i. En la primera columna de la tabla, ponga el nombre de la variable, por ejemplo, Color. Inmediatamente
debajo, liste los colores (equipos, carreras, etc.) con los que trabajar. Debe tener cuidado de escribirlos tal
cual como los escribi en la generacin de los valores de esta variable.

ii. En la segunda columna, se anotarn las frecuencias observadas, o sea, la cantidad de veces que aparece
cada color. Titule esta columna como ni . Siempre en esta columna, en la celda que est inmediatamente
debajo de este ttulo, use la funcin CONTAR.SI. A continuacin, siga las instrucciones que le dar el docente.

iii. La tercera y ltima columna ser la de frecuencias relativas porcentuales (n i %). Titule esta columna como tal,
y a continuacin siga las instrucciones que le dar el docente.

III. Generacin de grficos.

i. Seleccione la columna de los colores y al mismo tiempo, seleccione la columna de las frecuencias
observadas. Luego, en la pestaa INSERTAR, elija el grfico de columnas. Escoja el grfico de columnas ms
adecuado.

ii. Seleccione la columna de los colores y al mismo tiempo, presionando la tecla Ctrl, seleccione la columna de
las frecuencias relativas. Luego, en la pestaa INSERTAR, elija el grfico circular.

VARIABLE CUANTITATIVA: Datos discretos desagrupados

I. Generacin de valores de una variable cuantitativa discreta

i. Genere en la columna A, usando la funcin ALEATORIO.ENTRE, 32 nmeros entre el 0 y el 4.

ii. Seleccione y copie los nmeros que se generaron, y luego, usando la opcin PEGADO ESPECIAL, pegue
slo los valores en la columna B, empezando por la fila 2.

4
II. Generacin de tabla de frecuencias para la variable cuantitativa discreta

i. En la primera columna de la tabla, ponga el nombre de la variable, por ejemplo, N de hijos. Inmediatamente
debajo, ordene los valores con los que trabajar.

ii. En la segunda columna, se anotarn las frecuencias observadas, o sea, la cantidad de veces que aparece
cada nmero. Titule esta columna como ni . Siempre en esta columna, en la celda que est inmediatamente
debajo de este ttulo, use la funcin CONTAR.SI. A continuacin, siga las instrucciones que le dar el
docente.

iii. La tercera columna ser la de frecuencias relativas (ni %). Titule esta columna como tal, y a continuacin
siga las instrucciones que le dar el docente.

iv. La cuarta columna ser la de frecuencias acumuladas. Titule esta columna como Ni . Siga a continuacin las
instrucciones que le dar el docente.

v. La quinta y ltima columna ser la de frecuencias acumuladas relativas porcentuales. Titule esta columna
como Ni %. Siga a continuacin las instrucciones que le dar el docente.

III. Generacin de grficos.

i. Seleccione la columna de los valores y al mismo tiempo, seleccione la columna de las frecuencias
observadas. Luego, en la pestaa INSERTAR, elija el grfico de columnas. Escoja el grfico de columnas
ms adecuado.

ii. Seleccione la columna de los colores y al mismo tiempo, presionando la tecla Ctrl, seleccione la columna de
las frecuencias relativas. Luego, en la pestaa INSERTAR, elija el grfico circular. Escoja el grfico de
columnas ms adecuado.

iii. Seleccione la columna de los colores y al mismo tiempo, presionando la tecla Ctrl, seleccione la columna de
las frecuencias relativas acumuladas. Luego, en la pestaa INSERTAR, elija el grfico de lneas. ste
representar el grfico de ojivas.

5
Sesin 3

Aprendizaje esperado: elaborar tablas de frecuencia y grficos estadsticos para variables cuantitativas en
intervalos de frecuencias, usando para ello software EXCEL.

I. Generacin de valores de una variable cuantitativa

Para la generacin de los datos, el docente puede preguntar: Cunto tiempo se demoran los alumnos en
llegar a la sede?. La respuesta puede ser dada en horas o minutos por ti y tus compaeros. Por ejemplo, si
en la sala hay 22 alumnos, pueden darse las siguientes respuestas:

Tiempos en minutos Tiempos en horas


25 0,42
15 0,25
45 0,75
60 1,00
45 0,75
30 0,50
20 0,33
30 0,50
15 0,25
90 1,50
45 0,75
30 0,50
15 0,25
10 0,17
10 0,17
5 0,08
40 0,67
30 0,50
30 0,50
20 0,33
15 0,25
30 0,50

Para entonces generar la tabla de frecuencias, se seguir una serie de tres pasos previos.

Primero, se calcular el rango de los datos, restndole al mayor de los datos el dato menor:

= 1,50 0,08 = 1,42

Luego, usando la regla de Sturges, se calcular la cantidad de intervalos a generar para agrupar
los datos. Si la cantidad de datos se representa con la letra y la cantidad de intervalos con la
letra , entonces:

= 1 + 3,3 log = 1 + 3,3 log 22 = 5,43

Lo cual debe aproximarse a 6, pues la cantidad de intervalos es mayor que 5.

Finalmente, con la amplitud y la cantidad de intervalos, se calcular la amplitud de cada intervalo

1,42
= = = 0,237 0,24
6

6
La aproximacin se hizo pues el valor calculado superaba el valor 0,23.

II. Generacin de tabla de frecuencias para la variable cuantitativa

i. En la primera columna de la tabla, ponga el nombre de la variable, por ejemplo, costo de herramientas (dado el
rango de las cantidades generadas, es adecuado suponer que estn en unidades de dlares).
ii.

Inmediatamente debajo, genere los intervalos en los que se agruparn los valores, como se muestra a
continuacin.

Note que los extremos de la derecha de un intervalo se repiten en el extremo de la izquierda del intervalo
siguiente, por lo cual, de existir, cada uno de esos nmeros se repetira incorrectamente en dos intervalos.
Para evitar este problema, definiremos un criterio, que consiste en usar parntesis de corchete, de la forma
que se muestra a continuacin:

ii. En dos columnas a la izquierda de la tabla, escriba los lmites de cada intervalo, como se muestra a
continuacin:

7
iii. Titule la segunda columna de la tabla como Marcas de clase. En la celda de abajo a la de este ttulo,
escriba la frmula que le permitir encontrar la marca de clase, y cpiela a las celdas de ms abajo, de
acuerdo a las instrucciones que le dar el docente.

8
iv. En la tercera columna, se anotarn las frecuencias observadas, o sea, la cantidad de veces que aparece
un valor correspondiente al intervalo. Titule esta columna como fi . Siempre en esta columna, en la celda
que est inmediatamente debajo de este ttulo, use la funcin CONTAR.SI.CONJUNTO. A continuacin,
siga las instrucciones que le dar el docente.

Este cdigo slo sirve para la celda F2, contando entonces siete datos del primer intervalo.

Luego, el cdigo de la celda de abajo se crea y se copia hasta la ltima celda de la columna fi.

v. La cuarta columna ser la de frecuencias relativas porcentuales (fi %). Titule esta columna como tal, y a
continuacin siga las instrucciones que le dar el docente.
vi. La quinta columna ser la de frecuencias acumuladas. Titule esta columna como ni . Siga a continuacin las
instrucciones que le dar el docente.

9
vi. La sexta y ltima columna ser la de frecuencias acumuladas relativas. Titule esta columna como ni %.
Siga a continuacin las instrucciones que le dar el docente.

IV. Generacin de histograma.

i. Seleccione la pestaa de DATOS, y luego la pestaa ARCHIVO.

ii. En el men desplegado, seleccione la opcin OPCIONES.

10
iii. Seleccione ahora la opcin COMPLEMENTOS

iv. En la parte inferior de la pantalla desplegada, verifique que se encuentre el texto


COMPLEMENTOS DE EXCEL, y luego digite el botn IR.

v. Seleccione entonces el complemento HERRAMIENTAS PARA ANLISIS y luego el botn


ACEPTAR.

11
vi. Note que ahora en el extremo superior derecho se visualiza la pestaa ANLISIS DE DATOS.
Presinela, y luego en la lista generada, elija la opcin HISTOGRAMA.

vii. En RANGO DE ENTRADA, seleccione la columna donde anot la totalidad de los datos.
En RANGO DE CLASES, elija la columna en que se escribieron los extremos derechos de cada
intervalo. En RANGO DE SALIDA, elija cualquier conjunto de celdas para que se pegue el
histograma. Finalmente, seleccione la opcin CREAR GRFICO, y luego el botn ACEPTAR.

12
viii. Seleccione cualquiera de los valores en el eje horizontal con el botn derecho del mouse, y en el
men desplegado, seleccione la opcin SELECCIONAR DATOS.

ix. En la tabla que est al costado izquierdo del grfico, seleccione la frase Y MAYOR junto con el
nmero correspondiente, y presione el botn SUPRIMIR de su teclado.

13
x. Seleccione ahora con el botn derecho del mouse cualquiera de las barras del grfico, y luego la
opcin DAR FORMATO A SERIE DE DATOS. En la ventana que se despliega , disminuya el
ancho del intervalo a 0%.

Verifique entonces que se han juntado las barras. Incorpore bordes y agregue etiquetas de datos.

14
Sesin 4

Aprendizaje esperado: analizar variables cualitativas y cuantitativas a partir del clculo de medidas de tendencia
central, tales como la moda, la mediana y la media aritmtica.

Retomemos la tabla de la variable Motivos de ingreso de los autos al taller. Esta corresponda a una variable
cualitativa. Qu puede decirse de esta variable? Observando la tabla, podemos decir que tres de los autos
ingresaron al taller por problemas de operacin, cinco por problemas de instalacin, 10 por problemas de
mantenimiento y nueve por partes defectuosas. Inmediatamente debe llamar la atencin la principal causa por la
que ingresan los automviles al taller. En este caso, corresponde a problemas de mantenimiento.

Estadsticamente, se afirma que la Moda de la variable son los problemas de mantenimiento. La moda de un
variable est referida a aquel valor que ms veces se repite, marcando una tendencia por sobre los dems valores.
Recuerda que los valores son, en este caso, las palabras de la primera columna de la tabla.

fi fi %
Operacin 3 11,11%
Instalacin 5 18,52%
Mantenimiento 10 37,04%
Partes defectuosas 9 33,33%
TOTAL 27 100,00%

Analicemos tambin ahora la tabla correspondiente a la variable cuantitativa Nmero de neumticos sin aire.

Nmero de neumticos sin aire fi fi % ni ni %


0 12 44,44% 12 44,44%
1 10 37,04% 22 81,48%
2 3 11,11% 25 92,59%
3 1 3,70% 26 96,30%
4 1 3,70% 27 100,00%
TOTAL 27 100,00%

Podemos decir inmediatamente por mera inspeccin que (completa la oracin):

Hay autos con neumticos sin aire.


Hay autos con neumticos sin aire.
Hay autos con neumticos sin aire.
Hay autos con neumticos sin aire.
Hay autos con neumticos sin aire.

Cul de estos valores corresponde entonces a la moda de la variable? Cul es la razn de ello?

La MODA es la primera de las medidas de tendencia central de cualquier variable. En el caso de que la
variable sea cualitativa, es la nica posible de obtener.

15
La segunda medida de tendencia central, calculable u obtenible slo para variables cuantitativas, es la
mediana.

Para comprender el concepto de mediana, tomaremos nuevamente la tabla de frecuencia de la variable


Nmero de neumticos sin aire.

Nmero de neumticos sin aire fi fi % ni ni %


0 12 44,44% 12 44,44%
1 10 37,04% 22 81,48%
2 3 11,11% 25 92,59%
3 1 3,70% 26 96,30%
4 1 3,70% 27 100,00%
TOTAL 27 100,00%

Y anotaremos todos los datos, uno a uno, en una sola lnea:

0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 2 2 3 4

ACTIVIDAD: De la lista, encuentra el dato que est justo a la mitad de estos 27 datos. Realiza el
conteo de izquierda a derecha y tambin de derecha a izquierda. Qu ocurre?

Cmo relacionas lo encontrado con la columna de las frecuencias acumuladas de la tabla, o de las
frecuencias acumuladas relativas porcentuales? Cmo te ayudara esto si la cantidad de datos
fuese de, por ejemplo, 1647 datos?

La segunda medida de tendencia central, la mediana, se entiende de una manera prctica como aquel dato
de la variable que est justo al centro de los datos, cuando se ordena la totalidad de ellos desde el ms
pequeo al ms grande.

Observa ahora los siguientes datos numricos, repite el conteo solicitado anteriormente y elabora su
tabla de frecuencia en Excel o tu cuaderno.

3 3 4 4 4 5 6 6 6 7 7 7 7 8 8 8 9 9

Qu ocurre esta vez? Cmo podras solucionar el problema que se genera?

La definicin formal de mediana, y que puede servirte para contestar la pregunta anterior, es aquel dato de la
variable que no supera a ms del 50% de los datos, y que tampoco es superada por ms del 50% de los
datos.

16
La ltima medida de tendencia central es la denominada media aritmtica, tambin conocida como
promedio.

Te proponemos buscar su definicin en internet, y aplicarla nuevamente a los datos de la variable Nmero
de neumticos sin aire.

Nmero de neumticos sin aire fi fi % ni ni %


0 12 44,44% 12 44,44%
1 10 37,04% 22 81,48%
2 3 11,11% 25 92,59%
3 1 3,70% 26 96,30%
4 1 3,70% 27 100,00%
TOTAL 27 100,00%

Escribe el clculo que te permite obtener la media aritmtica de esta variable.

=
=

Finalmente, compara los valores de las medidas de tendencia central de la variable cuantitativa
analizada hoy en clases. Qu puedes concluir?

Sesin 5

17
Aprendizaje esperado: usar software Excel y la calculadora para determinar medidas de tendencia central.

Esta clase la dedicaremos a usar Excel para encontrar las medidas de tendencia central, tanto para
variables cualitativas como para variables cuantitativas.

Partiremos con la tabla de la variable Motivos de ingreso de los autos al taller.

fi fi %
Operacin 3 11,11%
Instalacin 5 18,52%
Mantenimiento 10 37,04%
Partes defectuosas 9 33,33%
TOTAL 27 100,00%

De acuerdo a lo visto, la moda es el valor Mantenimiento.

Esta tabla la llevaremos a Excel, y aplicamos el cdigo que se ve en la imagen, para que nos entregue
correctamente el valor de la moda.

ACTIVIDAD: Replique el cdigo para que Excel encuentre la moda de la variable Nmero de
neumticos sin aire, verificando que sta es el cero.

Nmero de neumticos sin aire fi fi % ni ni %


0 12 44,44% 12 44,44%
1 10 37,04% 22 81,48%
2 3 11,11% 25 92,59%
3 1 3,70% 26 96,30%
4 1 3,70% 27 100,00%
TOTAL 27 100,00%

18
19

Você também pode gostar