Você está na página 1de 10

1. ¿CÓMO DESCRIBIR UNA VARIABLE CUALITATIVA?

La información sin organizar no permite visualizar aspectos importantes sobre los datos que en general
permanecen ocultos. El valor informativo de los datos sólo es posible 0bservarlo luego de su
tratamiento mediante métodos que permitan su organización y posterior análisis.
Veremos a continuación como describir conjuntos de datos provenientes de variables cualitativas, es
decir, variables medidas en escala nominal u ordinal.

Objetivos de aprendizaje
 Organizar datos de variables cualitativas nominales u ordinales en tablas de frecuencias.
 Representar gráficamente datos de variables cualitativas mediante diagramas de barras y
diagrama circular.
 Identificar e interpretar la moda de un conjunto de datos de variable cualitativa.
 Calcular e interpretar una medida que permita observar la potencia descriptiva de la moda
(medida de dispersión).

Al momento de describir una variable cualitativa, sea esta nominal u ordinal, debemos tener en cuenta
los siguientes aspectos muy importantes: su distribución de frecuencias, su representación gráfica, su
tendencia central, que en este caso es la moda y su dispersión.

¿Qué es una variable cualitativa?

¿Cuándo una variable cualitativa es de nivel nominal?

¿Cuándo una variable cualitativa es de nivel ordinal?

Variable cualitativa: Una variables es una característica medible u observable presente en las
unidades de análisis que componen una población objeto de estudio, Si la característica es no
numérica, una cualidad, un rasgo, un atributo, que permita la clasificación de las unidades de análisis en
categorías mutuamente excluyentes, la variable se llama cualitativa. Las variables cualitativas también
se llaman categóricas. En términos sencillos, una variable cualitativa o categórica es aquella cuyos
valores finales son categorías.

El proceso de medir en una variable cualitativa no es más que la clasificación de las unidades de
análisis en categorías.

Ejemplo:

Variable Categorías Medida


Masculino
Sexo Nominal
Femenino
Soltero
Estado civil Casado Nominal
Unión libre
Sincelejo
Lugar de Corozal
Nominal
procedencia Sampués
Tolú
Luego de obtener la información para el desarrollo del estudio o investigación, estos
se disponen en una matriz de datos, en la cual las columnas representan variables y
en las filas se ubican los valores que asumen las variables en cada una de las
unidades elementales. Este proceso se llama tabulación de datos. Hoy día con el auge
de los computadores y los programas informáticos el trabajo de organizar y tabular
datos se ha facilitado enormemente. Una vez construida la matriz de datos se pueden
realizar los procedimientos estadísticos pertinentes para el análisis de los datos.

Cuando se tiene información de variables cualitativas es muy importante saber


cuántos hay en cada una de las categorías, para ello organizamos los datos en un
arreglo rectangular denominado distribución de frecuencias.

Distribución de frecuencias: Una distribución de frecuencias es una forma tabular


de organizar la información en clases o categorías mutuamente excluyentes, donde se
puede observar claramente el número de veces que se repite un dato o frecuencia
absoluta, también suele mostrar la frecuencia relativa, esta muestra la proporción del
número total de observaciones que hay en cada categoría.

Ejemplo 1: Se le preguntó a un grupo de estudiantes de cuarto semestre de Trabajo


Social de CECAR, año 2017, ¿cuál es su lugar de procedencia? Las respuestas
obtenidas son las siguientes:
Sincelejo Chinú Sincelejo Sincelejo Guaranda Sincelejo

Sincelejo Chinú Tolú Sincelejo Sincelejo Sincelejo

Sincelejo Majagual Chinú Sincelejo Sincelejo Sincelejo

Sincelejo Guaranda Ovejas Sincelejo Sincelejo Tolú

Guaranda Guaranda Majagual Guaranda Chinú Chinú

La distribución de frecuencias asociada a este conjunto de datos tiene la siguiente forma:

Tabla 1. Lugar de procedencia de 30 estudiantes de T. Social de CECAR 2017


Lugar de Frecuencia Frecuencia Frecuencia absoluta Frecuencia
procedencia absoluta relativa acumulada relativa acumulada
Chinú 4 4/30=0,133 4 4/30=0,133
Guaranda 6 6/30=0,200 10 10/30=0,333
Majagual 2 2/30=0,067 12 12/30=0,400
Ovejas 1 1/30=0,033 13 13/30=0,433
Sincelejo 15 15/30=0,500 28 28/30=0,933
Tolú 2 2/30=0,067 30 1
Fuente: Grupo de trabajo.

En este caso, la variable en estudio es el lugar de procedencia de los estudiantes, es una variable cualitativa
politómica, medida en escala nominal. En la primera columna de la tabla se ubica el nombre de la variable y las
diferentes categorías (valores que asume), que para el caso son los municipios de donde provienen los
estudiantes.
Frecuencia absoluta: La frecuencia absoluta es el número de veces que se repite un dato
en el conjunto de datos estudiado, se simboliza con (ni). En la tabla 1, la frecuencia absoluta
6 indica que son 6 los estudiantes procedentes de Guaranda.

Frecuencia relativa: La frecuencia relativa es el cociente entre la frecuencia absoluta y el


número total de datos estudiados, se simboliza con (hi), indica la fracción del total de cada
categoría y suele expresarse como porcentaje. Por ejemplo: del total de estudiantes del
grupo ¿qué proporción proviene de Sincelejo?
𝟏𝟓
Veamos: 𝐡𝐢 = 𝟑𝟎 = 𝟎, 𝟓

Expresado en porcentaje es el 50%, indicando que el 50% de los estudiantes provienen de


Sincelejo.
𝐧𝐢
Una fórmula de cálculo para la frecuencia relativa es 𝐡𝐢 = , donde n, es el número total de
𝐧
datos o tamaño de muestra y ni, es la frecuencia absoluta de la categoría. Si queremos
expresarla como porcentaje, basta multiplicar el resultado por 100%.

Frecuencia absoluta acumulada: La frecuencia absoluta acumulada de un valor específico


de la variable (de una categoría) es la suma del número de veces que se repite el valor (su
frecuencia absoluta) más las frecuencias absolutas anteriores a dicho valor. Por ejemplo, la
frecuencia absoluta acumulada de la categoría majagual es 12, que resulta de sumar la
frecuencia absoluta de dicha categoría (2) con las frecuencias absolutas de las categorías
anteriores, Guaranda y Chinú (2+6+4=12).

En la tabla 1 se puede observar que la suma de las frecuencias absolutas es igual al número
total de datos y la suma de las frecuencias relativas es igual a la unidad o al 100%, si se
expresan en porcentajes.

Para efectos de interpretación la frecuencia relativa es mucho más informativa que la


frecuencia absoluta puesto que su cálculo implica el uso del total de datos analizados,
mientras que la frecuencia absoluta no lo hace.

Resumiendo un poco podemos decir que una distribución de frecuencias es útil porque:

 Presenta los datos de una manera organizada. Proporciona un resumen cuantitativo


de información de variables cualitativas.
 La información que contiene puede ser usada para construir una representación
gráfica de los datos.
 Se puede identificar fácilmente la moda de la distribución o medida de tendencia
central, representado en la categoría de mayor frecuencia absoluta.
 Permite calcular un valor que indique que tan descriptiva es la moda para el conjunto
de datos (como la razón de variación por ejemplo).
No olvidar que una distribución de frecuencias debe llevar un título que indique de que se
trata la información contenida en ella y se debe especificar la fuente de donde se obtuvo la
información.

La tecnología disponible en la actualidad nos permite obtener estas tablas, representaciones


gráficas y también medidas numéricas, usando la computadora y programas informáticos
especializados en análisis de datos, restándole importancia a los procedimientos de cálculo y
el uso de algoritmos y fórmulas complicadas para la mayoría de los estudiantes. Lo
realmente importante es saber leer la información que ofrece la distribución de los datos,
poder interpretarla, comprenderla y usarla para la toma de decisiones.

Actividad: Teniendo en cuenta los conceptos estudiados hasta ahora y la tabla 1 del
ejemplo, responde las siguientes preguntas:

1. ¿Cuántos estudiantes del grupo son provenientes del municipio de Chinú?


2. ¿Qué porcentaje de estudiantes es proveniente del municipio Majagual?
3. ¿De dónde es proveniente la mayoría de los estudiantes participantes del estudio?

La distribución de frecuencias del ejemplo 1, generada por el programa estadístico spss es la


siguiente:

Lugar de procedencia

Frecuencia Porcentaje Porcentaje Porcentaje


válido acumulado

Sincelejo 15 50,0 50,0 50,0

Tolú 2 6,7 6,7 56,7

Ovejas 1 3,3 3,3 60,0

Válidos Majagual 2 6,7 6,7 66,7

Guaranda 6 20,0 20,0 86,7

Chinú 4 13,3 13,3 100,0

Total 30 100,0 100,0

Obsérvese que muestra la misma información de la tabla construida manualmente en el


ejemplo 1, exceptuando la columna de porcentaje válido, esta columna presenta la
frecuencia relativa teniendo en cuenta los valores perdidos, en caso de no haber valores
perdidos, los valores de esta columna coinciden con los valores proporcionados por la
columna porcentaje o frecuencia relativa.
2. REPRESENTACIÓN GRÁFICA DE VARIBLES CUALITATIVAS
La información contenida en una distribución de frecuencias también la podemos
representar gráficamente, los más adecuados para variables cualitativas son el gráfico
de barras y el gráfico de sectores o circular. El gráfico circular se recomienda cuando
hay pocas categorías (no más de cinco) y preferiblemente variables nominales.

2.1 GRÁFICO DE BARRAS


Es el gráfico más común, también se llama diagrama de barras o diagrama de
columnas, se usa para representar de manera gráfica un conjunto de datos, de
variables cualitativas o de variables cuantitativas discretas. Son útiles para hacer
comparaciones entre los valores que asume la variable de interés, las barras
pueden aparecer en forma vertical u horizontal.

Para su construcción se usa el primer cuadrante del plano cartesiano, en el eje


horizontal se deben ubicar las categorías de la variable, los valores para el caso
de variables discretas, y en el eje de ordenadas se ubican las respectivas
frecuencias, absolutas o relativas. Se debe tener en cuenta que todas las barras
tienen el mismo ancho y van separadas unas de otras, la altura de cada barra es
proporcional a su frecuencia.

Existen diferentes tipos de diagrama de barras: simple o sencillo, diagrama de


barras agrupadas, barras apiladas y la pirámide de población. El gráfico sencillo se
usa para representar un único conjunto de datos, en el de barras agrupadas y
apiladas se pueden representar dos o más conjuntos de datos. La pirámide de
población es un diagrama que muestra la población en términos de la edad y el
sexo en un momento específico, tiene una forma que muestra dos direcciones.

EJEMPLO 2: Consideremos la información contenida en la tabla sobre el lugar de


procedencia de 30 estudiantes del programa de Trabajo Social de Cecar en el año
2017. El diagrama de barras correspondiente es el siguiente:

Obsérvese en el gráfico 16
que las barras son 14
E
verticales, todas del s 12
mismo ancho y están t 10
separadas entre sí. El u 8
gráfico también se puede d
6
hacer con frecuencias i
a 4
relativas expresadas en
n 2
porcentaje.
t 0
e Chinú Guaranda Majagual Ovejas Sincelejo Tolú
s
Lugar de procedencia
Se aconsejan las barras paralelas
p Tolú cuando hay muchas categorías pero,
r
L
o Sincelejo puede ser útil para ahorrar espacio al
u
c momento de hacer un informe.
g
e Ovejas
a
d Los siguientes gráficos, ejemplo 3,
r Majagual
e
n Guaranda
corresponden al de barras agrupadas y
d
e
c barras apiladas, estos se usan cuando
i Chinú
a
queremos representar dos o más
0 5 10 15 20 conjuntos de datos al mismo tiempo en
Estudiantes el mismo gráfico.

EJEMPLO 3: La siguiente tabla muestra información sobre la cantidad de estudiantes y sexo


matriculados en cursos de estadística en una universidad en los años 2013, 2014, 2015 y
2016. Representar los datos con un diagrama de barras adecuado.

Año Masculino Femenino Total


2013 150 50 200
2014 180 70 250
2015 200 100 300
2016 300 100 400

Estudiantes matriculados en cursos de estafdísticas años


350 450
2013 a 2016 300 Estudiantes matriculados en cursos de
300 400 estadística años 2013 a 2016
350 100
250
200 300
200 180 250 100
150 70
200
150 50
100 100 150 300
100 70 100 200
50 150 180
50 50
0
0
2013 2014 2015 2016
2013 2014 2015 2016

Masculino Femenino Masculino Femenino

Diagrama de barras agrupadas Diagrama de barras apiladas

Ambos gráficos representan la misma información pero, uno es un diagrama de barras


agrupadas y el otro es de barras apiladas.
2.2 GRÁFICO CIRCULAR: El diagrama circular es un círculo dividido en partes o
sectores que representan las distintas categorías de la variable objeto de estudio.
Cada sector del círculo muestra el porcentaje que representa cada categoría
respecto del total de datos, este gráfico se usa para representar variables
nominales preferiblemente debido a que el objetivo principal del gráfico es mostrar
la proporción o porcentaje que corresponde a cada categoría, no interesa mostrar
orden ni hacer comparaciones.

EJEMPLO 4: Los 80 estudiantes del programa de Trabajo Social matriculados en el


curso de estadísticas descriptiva en el año 2016 se clasificaron como se muestra en la
tabla de acuerdo con su estilo de aprendizaje.

Estilo de aprendizaje Estudiantes Porcentaje


Pragmático 25 31,25
Reflexivo 5 6,25
Activo 30 37,5
Teórico 20 25

Estilo de aprendizaje de 80 estudiantes de T. S


Hoy día los gráficos se
matriculados en estadística descriptiva en 2016 realizan con la ayuda de la
tecnología, existen
programas informáticos muy
Teórico, 20, Pragmático,
25% potentes con los que los
25, 31%
podemos construir.
Activo, 30,
Se debe tener en cuenta que
Reflexivo, 5,
38% 6% el gráfico circular debe
mostrar el número de
elementos de la categoría y
el porcentaje respectivo.

Las variables categóricas pueden describirse mediante números que informan sobre
características de tendencia central y dispersión, estas medidas numéricas se basan
en las frecuencias absolutas o relativas, estudiaremos la moda como única medida de
tendencia central que se puede obtener en una variable cualitativa y la razón de
variación (RV) como medida de dispersión.

MODA (M0): Es la única medida de tendencia central que aplica para variables
categóricas, la representaremos con M0, la moda es la categoría que presenta la
mayor frecuencia absoluta en el conjunto de datos. En ocasiones la categoría más
común presenta baja frecuencia absoluta, lo que hace que la moda sea una medida
poco descriptiva del conjunto de datos, un conjunto de datos puede tener más de una
moda o puede que no tenga ninguna (cuando todas las categorías tienen igual
frecuencia absoluta, lo cual es un evento raro pero posible). La moda se puede
interpretar como la mayoría puesto que representa la categoría con mayor frecuencia
absoluta.

RAZÓN DE VARIACIÓN (RV): La dispersión nos informa acerca del grado de


variabilidad que existe entre los datos, nos indica que tan diferentes son los valores
que asume la variable, si un conjunto de datos categóricos (variable cualitativa) tiene
dispersión cero, significa que hay homogeneidad en el conjunto de datos, no hay
dispersión, es decir, todos los datos pertenecen a la misma categoría. Una medida de
dispersión para variables cualitativas es la razón de variación (RV), sirve para decidir
si la moda es un buen descriptor del conjunto de datos.

La razón de variación se define como el porcentaje de valores (frecuencia relativa) que


no pertenecen a la categoría modal.

𝐧𝐌𝟎
𝐑𝐕 = 𝟏 −
𝐧
Donde 𝐧𝐌𝟎 es la frecuencia absoluta de la categoría modal y n es el número total de
casos o tamaño de la muestra. La razón de variación nos indica que tanto coinciden
los valores que asume la variable con el valor de la moda. Si la frecuencia absoluta de
la categoría modal es baja, la razón de variación será alta, cercana a la unidad,
indicando mucha dispersión. En cambio, si la frecuencia absoluta de la categoría
modal es alta (comparada con el tamaño de la muestra), más baja o cercana a cero
será la razón de variación, indicando poca dispersión lo que indica a su vez que la
moda sería un buen descriptor del conjunto de datos en estudio.

EJEMPLO 5: Consideremos el ejemplo 4 relacionado con el estilo de aprendizaje de


80 estudiantes. La categoría modal es el estilo de aprendizaje activo, así que la moda
es 𝐌𝟎 = 𝐀𝐜𝐭𝐢𝐯𝐨. Entonces podemos interpretar este valor como la mayoría. Es decir,
al interpretar la moda diríamos: En la mayoría de los estudiantes de Trabajo Social
matriculados en el curso de estadística descriptiva en el año 2016 predomina un
estilo de aprendizaje activo.

¿Es realmente cierto eso? Si observamos los datos, sólo en 30 de los 80 estudiantes
predomina el estilo activo, en los restantes 50 estudiantes predominan otros estilos,
esto nos lleva a pensar que lo moda no es un buen descriptor del conjunto de datos,
aparentemente hay demasiada dispersión.

𝟑𝟎
Al calcular la razón de variación tenemos: 𝐑𝐕 = 𝟏 − 𝟖𝟎 = 𝟎, 𝟔𝟐𝟓 = 𝟔𝟐, 𝟓%
El valor de la razón de variación nos indica que sólo el 37,5% de los datos pertenecen
a la categoría modal y el 62,5% está distribuido en las demás categorías, indicando
dispersión en los datos, es decir, heterogeneidad en el grupo de estudiantes en cuanto
a su estilo de aprendizaje.

Veamos ahora un ejemplo de cómo analizar una variable cualitativa. Para describir
una variable cualitativa se tiene en cuenta tres aspectos importantes: sus frecuencias,
absolutas o relativas, la tendencia central y la dispersión.

EJEMPLO 6: Supongamos que debemos analizar la variable “estilo de aprendizaje”, la


cual hace parte del cuestionario que respondieron los alumnos de IV semestre de
Trabajo Social en el primer semestre del año 2017.
La distribución de frecuencias generada con el programa SPSS es la siguiente, para
su presentación se debe tener presente la norma o formato que se exige. La norma
APA exige que toda tabla debe llevar una numeración y un título.

Tu Estilo de Aprendizaje

Frecuencia Porcentaje Porcentaje Porcentaje


válido acumulado

Pragmático 11 18,3 18,3 18,3

Reflexivo 20 33,3 33,3 51,7

Válidos Activo 19 31,7 31,7 83,3

Teorico 10 16,7 16,7 100,0

Total 60 100,0 100,0

Según la norma APA la distribución de frecuencias tendría el siguiente aspecto:

Tabla 01. Estilo de aprendizaje de 60 estudiantes


de IV semestre T.S de CECAR año 2017
Estilo de
ni %
aprendizaje

Pragmático 11 18,3
Reflexivo 20 33,3
Activo 19 31,7
Teórico 10 16,7

Nota: Datos del grupo de estudio

En la tabla 01 se muestra la distribución de los 60 estudiantes de IV semestre de Trabajo


Social de CECAR en el año 2017 de acuerdo con su estilo de aprendizaje dominante. El
33,3% de los estudiantes presenta un estilo de aprendizaje dominante reflexivo, el 31,7% es
activo, el 18,3% es pragmático y el 16,7% es teórico.
La información contenida en la tabla 1 se puede representar en un diagrama de barras como
el que aparece a continuación.

Gráfico 1.Estilo de aprendizaje de 70 estudiantes de T.


Social
35 33.3
31.7
30
25
Porcentaje

20 18.3
16.7
15
10
5
0
Pragmatico Reflexivo Activo Teorico
Estilo de aprendizaje

En el gráfico 1 se puede observar que el 33.3% de los estudiantes tiene un estilo de


aprendizaje dominante reflexivo, en el 31.7% domina el estilo activo, 18.3% de los
estudiantes son activos y por último el 16.7% de los estudiantes es teórico.

La mayoría de los estudiantes de IV semestre de Trabajo Social de CECAR tiene como estilo
de aprendizaje dominante el reflexivo (Mo=33,3%). Es decir, de los 60 estudiantes sólo 20
tienen un estilo de aprendizaje reflexivo.

¿Se puede considerar a 20 estudiantes, de un total de 60, como la mayoría? Esta


afirmación hecha anteriormente es sólo la interpretación de la moda, debemos asegurarnos
si la moda es una medida de tendencia central que representa o describe bien al conjunto de
datos del estudio.

20
Al calcular la razón de variación tenemos: 𝑅𝑉 =1− = 0,6666 ≅ 0,667
60

𝑅𝑉 = 66,7%
Este valor significa que el 66,7% de los estudiantes no pertenece a la categoría modal, es
decir, 40 estudiantes, aproximadamente, no tienen un estilo de aprendizaje reflexivo. Ese
66,7% de estudiantes está distribuido en otras categorías, indicando que hay dispersión en el
conjunto de datos.

Você também pode gostar