Você está na página 1de 18

ESTADÍSTICA DESCRIPTIVA DEFINICIÓN Y CLASIFICACIÓN DE VARIABLES La

estadística descriptiva es la rama de las Matemáticas que recolecta, presenta


y caracteriza un conjunto de datos (por ejemplo, edad de una población,
altura de los estudiantes de una escuela, temperatura en los meses de
verano, etc.) con el fin de describir apropiadamente las diversas
características de ese conjunto. Al conjunto de los distintos valores
numéricos que adopta un carácter cuantitativo se llama variable estadística.
Las variables pueden ser de dos tipos: • Variables cualitativas o categóricas:
no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la
piel, sexo).

• Variables cuantitativas: tienen valor numérico (edad, precio de un


producto, ingresos anuales). Las variables también se pueden clasificar en:

• Variables unidimensionales: sólo recogen información sobre una


característica (por ejemplo: edad de los alumnos de una clase).

• Variables bidimensionales: recogen información sobre dos características


de la población (por ejemplo: edad y altura de los alumnos de una clase).

• Variables pluridimensionales: recogen información sobre tres o más


características (por ejemplo: edad, altura y peso de los alumnos de una
clase). Por su parte, las variables cuantitativas se pueden clasificar en
discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por
ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo,
nunca podrá ser 3.45).

• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por


ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.
Cuando se estudia el comportamiento de una variable hay que distinguir los
siguientes conceptos:

• Individuo: cualquier elemento que porte información sobre el fenómeno


que se estudia. Así, si estudiamos la altura de los niños de una clase, cada
alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es
un individuo.

• Población: conjunto de todos los individuos (personas, objetos, animales,


etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo,
si se estudia el precio de la vivienda en una ciudad, la población será el total
de las viviendas de dicha ciudad.

• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si


se estudia el precio de la vivienda de una ciudad, lo normal será no recoger
información sobre todas las viviendas de la ciudad Facultad de Contaduría y
Administración. UNAM Estadística descriptiva Autor: Dr. José Manuel Becerra
Espinosa 2 (sería una labor muy compleja), sino que se suele seleccionar un
subgrupo (muestra) que se entienda que es suficientemente representativo.
Las variables aleatorias son variables que son seleccionadas al azar o por
procesos aleatorios. DATOS. CLASIFICACIÓN, ORGANIZACIÓN Y
CONSTRUCCIÓN DE BLOQUES ESTADÍSTICOS Los datos son medidas y/o
números recopilados a partir de la observación. Los datos pueden concebirse
como información numérica necesaria para ayudar a tomar una decisión con
más bases en una situación particular. Existen muchos métodos mediante los
cuales se pueden obtener datos necesarios. Primero, se puede buscar datos
ya publicados por otras fuentes. Segundo, se puede diseñar un experimento.
En tercer lugar, se puede conducir un estudio. Cuarto, se pueden hacer
observaciones del comportamiento, actitudes u opiniones de los individuos
en los que se está interesado. Los datos se pueden clasificar en:

• Datos discretos. Son respuestas numéricas que surgen de un proceso de


conteo.

• Datos continuos. Son respuestas numéricas que surgen de un proceso de


medición.

ESCALAS DE MEDICIÓN

Medir en el campo de las ciencias exactas es comparar una magnitud con


otra, tomada de manera arbitraria como referencia, denominada patrón y
expresar cuántas veces la contiene. En el campo de las ciencias sociales medir
es “el proceso de vincular conceptos abstractos con indicadores empíricos”.
Al resultado de medir lo se le llama medida. La medición de las variables
puede realizarse por medio de cuatro escalas de medición: la nominal,
ordinal, de intervalo y de razón. Se utilizan para ayudar en la clasificación de
las variables, el diseño de las preguntas para medir variables, e incluso
indican el tipo de análisis estadístico apropiado para el tratamiento de los
datos. Una característica esencial de la medición es la dependencia que tiene
de la posibilidad de variación. La validez y la confiabilidad de la medición de
una variable depende de las decisiones que se tomen para operarla y lograr
una adecuada comprensión del concepto evitando imprecisiones y
ambigüedades, en caso contrario, la variable corre el riesgo inherente de ser
invalidada debido a que no produce información confiable. a) Medición
Nominal. En este nivel de medición se establecen categorías distintivas que
no implican un orden específico. Por ejemplo, si la unidad de análisis es un
grupo de personas, para clasificarlas se puede establecer la categoría sexo
con dos niveles, masculino (M) y femenino (F), los encuestados sólo tienen
que señalar su género, no se requiere de un orden real. Así, se pueden
asignar números a estas categorías para su identificación: 1=M, 2=F o bien, se
pueden invertir los números sin que afecte la medición: 1=F y 2=M. En
resumen en la escala nominal se asignan números a eventos con el propósito
de identificarlos. Facultad de Contaduría y Administración. UNAM Estadística
descriptiva Autor: Dr. José Manuel Becerra Espinosa 3

b) Medición Ordinal. Se establecen categorías con dos o más niveles que


implican un orden inherente entre si. La escala de medición ordinal es
cuantitativa porque permite ordenar a los eventos en función de la mayor o
menor posesión de un atributo o característica. Por ejemplo, en las
instituciones escolares de nivel básico suelen formar por estatura a los
estudiantes, se desarrolla un orden cuantitativo pero no suministra medidas
de los sujetos. Estas escalas admiten la asignación de números en función de
un orden prescrito. Las formas más comunes de variables ordinales son ítems
(reactivos) actitudinales estableciendo una serie de niveles que expresan una
actitud de acuerdo o desacuerdo con respecto a algún referente. Por
ejemplo, ante el reactivo: Pemex debe privatizarse, el respondiente puede
marcar su respuesta de acuerdo a las siguientes alternativas:

__ Totalmente de acuerdo

__ De acuerdo

__ Indiferente

__ En desacuerdo

__ Totalmente en desacuerdo

Las anteriores alternativas de respuesta pueden codificarse con números


que van del uno al cinco que sugieren un orden preestablecido pero no
implican una distancia entre un número y otro.

c) Medición de Intervalo

. La medición de intervalo posee las características de la medición nominal y


ordinal. Establece la distancia entre una medida y otra. La escala de intervalo
se aplica a variables continuas pero carece de un punto cero absoluto. El
ejemplo más representativo de este tipo de medición es un termómetro,
cuando registra cero grados centígrados de temperatura indica el nivel de
congelación del agua y cuando registra 100 grados centígrados indica el nivel
de ebullición, el punto cero es arbitrario no real, lo que significa que en este
punto no hay ausencia de temperatura.

d) Medición de Razón.

Una escala de medición de razón incluye las características de los tres


anteriores niveles de medición (nominal, ordinal e intervalo). Determina la
distancia exacta entre los intervalos de una categoría. Adicionalmente tiene
un punto cero absoluto, es decir, en el punto cero no existe la característica o
atributo que se mide. Las variables de ingreso, edad, número de hijos, etc.
son ejemplos de este tipo de escala. El nivel de medición de razón se aplica
tanto a variables continuas como discretas.
ORGANIZACIÓN DE DATOS

Muchas veces uno se pregunta, ¿para qué sirven las encuestas que a veces
se hacen en la calle?, ¿Cómo saber si una estación de radio se escucha más
que otra? , ¿Cuál candidato puede ganar? La respuesta se comienza con la
recaudación de datos. Los datos son información que se recoge, esto puede
ser opinión de las personas sobre un tema, edad o sexo de encuestados,
dónde viven, cuántas personas viven en una casa, qué tipo de sangre tiene un
grupo de personas, etc. Hay datos que pueden ser de mucha utilidad a
diferentes profesionales en la toma de decisiones, para resolver problemas o
para mostrar resultados de investigaciones. Una vez que se haya recogido
toda la información, se procede a crear una base de datos, donde se registran
todos los datos obtenidos. Algunas veces, si los datos son muy complicados,
se codifican, esto quiere decir que se le coloca una palabra clave que
identifica un título muy largo. Cuando ya está elaborada la base de datos se
parece a una tabla

Noción y utilidad de la estadística y probabilidad (definición y


objetivos)

Definición de Estadística
La Estadística es la ciencia cuyo objetivo es reunir una información
cuantitativa concerniente a individuos, grupos, series de hechos, etc. y
deducir de ello gracias al análisis de estos datos unos significados
precisos o unas previsiones para el futuro.

La estadística, en general, es la ciencia que trata de la recopilación,


organización presentación, análisis e interpretación de datos
numéricos con el fin de realizar una toma de decisión más efectiva.

Utilidad e importancia
Los métodos estadísticos tradicionalmente se utilizan para propósitos
descriptivos, para organizar y resumir datos numéricos. La estadística
descriptiva, por ejemplo trata de la tabulación de datos, su
presentación en forma gráfica o ilustrativa y el cálculo de medidas
descriptivas.

Ahora bien, las técnicas estadísticas se aplican de manera amplia en


mercadotecnia, contabilidad, control de calidad y en otras actividades;
estudios de consumidores; análisis de resultados en deportes;
administradores de instituciones; en la educación; organismos
políticos; médicos; y por otras personas que intervienen en la toma de
decisiones.

Definición básica de Probabilidad

La Probabilidad pertenece a la rama de la matemática que estudia


ciertos experimentos llamados aleatorios, o sea regidos por el azar, en
que se conocen todos los resultados posibles, pero no es posible tener
certeza de cuál será en particular el resultado del experimento.

Definicion de población y muestra


población: es la lista de los resultados que se obtendría de un
experimento si este se repitiera tantas veces como fuera posible.

Muestra: es la lista de los resultados que "de hecho" se obtienen al


hacer una cantidad determinada de experimentos en una
investigación.

Tipos de variable estadísticasVariable


cualitativa

Las variables cualitativas se refieren


a características o cualidades que no pueden ser
medidas connúmeros. Podemos distinguir dos tipos:
Variable cualitativa nominal

Una variable cualitativa


nominal presenta modalidades no
numéricas que no admiten un criterio de orden.

Ejemplo: El estado civil, con las siguientes


modalidades: soltero, casado, separado, divorciado y
viudo.

Variable cualitativa ordinal o variable


cuasicuantitativa

Una variable cualitativa


ordinal presenta modalidades no númericas,
en las que existe un orden. Ejemplos: La nota en
un examen: suspenso, aprobado, notable,
sobresaliente.

Puesto conseguido en una prueba deportiva: 1º,


2º, 3º, ...

Medallas de una prueba deportiva: oro, plata,


bronce.

Variable cuantitativa

Una variable cuantitativa es la que se expresa


mediante un número, por tanto se pueden
realizar operaciones aritméticas con ella.
Podemos distinguir dos tipos:
Variable discreta

Una variable discreta es aquella que solo puede


tomar un número finito de valores entre dos
valores cualesquiera de una caraterística.

Ejemplo:

El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.

Variable continua

Una variable continua es aquella que puede tomar


un número infinito de valores entre dos valores
cualesquiera de una caraterística.

Ejemplos:

La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69,


1.75.

En la práctica medimos la altura con dos


decimales, pero también se podría dar con tres
decimales.
Imaginemos que en una investigación nos interesa saber si son o no religiosos un
grupo determinado de sujetos. La variable objeto de estudio en este caso sería la
religiosidad. Para medir esta variable podríamos preguntar lo siguiente:

¿Es Usted religioso?

1. Sí
2. No

Pero también podríamos preguntarlo de la siguiente forma:

En su opinión, diría que Usted se considera:

1. Nada religioso
2. Poco religioso
3. Bastante religioso
4. Muy religioso

Y también podríamos medirlo así:

En una escala de 0 a 10 donde el 0 significa nada religioso y el 10 muy religioso, ¿dónde


se situaría Usted?

Nada religioso 0 1 2 3 4 5 6 7 8 9 10 Muy religioso

Como vemos, en los tres casos estamos midiendo la religiosidad de los sujetos,
pero de manera distinta. En el primer caso únicamente podemos distribuir a los
sujetos en relación a si se consideran religiosos o no, podemos por lo tanto
clasificarlos. En el segundo caso además de clasificar a los sujetos, podemos
ordenarlos en función de cuál es su grado de religiosidad de mayor a menor,
aunque no sabemos "cuánto" más religioso es el que se considera muy religioso
respecto del que se considera poco religioso. En el tercer caso, además de
clasificar y ordenar, podemos cuantificar la "distancia" entre los sujetos.
Podríamos, por ejemplo, saber que el sujeto que se ubica en un 7 de la escala, es
5 puntos más religioso que el que otro se ubique en el 2.

Debemos saber por lo tanto que una misma variable en ocasiones puede ser
medida de diferentes formas, otorgando un nivel de información distinto (sabemos
más sobre la religiosidad de los sujetos si preguntamos de la tercera forma que si
lo hacemos de la primera). Esto es lo que se llama NIVEL DE MEDICIÓN.

En investigación social las variables, según su nivel de medición pueden ser de


tres tipos:
Implican determinar la ausencia o presencia de una característica. Clasifica
a los individuos de acuerdo con la característica que poseen. Por lo tanto,
alcanzan un nivel de clasificación.

No poseen propiedades cuantitativas. El nivel nominal permite mencionar


NOMINALES
similitudes y diferencias entre los casos. Solo se pueden interpretar que
son diferentes entre sí, sin que se pueda afirmar que uno es superior a otro,
y por lo tanto, sin que se puedan ordenar.

Ejemplos: Sexo, Estado Civil, Nacionalidad


Los atributos de las variables ordinales no solo se diferencian unos de
otros (característica que define a las escalas nominales) sino que
mantienen una relación que permite ordenarlos lógicamente, generalmente
en términos de + o - o de > y <. Alcanzan un nivel de ordenación.
ORDINALES
No podemos cifrar o precisar la cercanía o la lejanía entre los grupos, es
decir, no podemos establecer las magnitudes de las distancias.

Ejemplos: Nivel de estudios, clase social


Variables en las que podemos significar o precisar el orden y la distancia
entre los atributos. Poseen propiedades cuantitativas.

Podemos distinguir dos tipos:

DE RAZÓN  De intervalo: carecen de origen, o cero natural, o ausencia de la


propiedad. Ejemplos: escala ideológica, escalas de actitudes.

 De proporción: el cero indica ausencia de la propiedad. Ejemplos:


Edad, años de escolarización, ingresos.

Siempre que sea posible y la naturaleza de la variable lo permita, hay que intentar
registrar el mayor nivel de medición, puesto que cuanto mayor sea el nivel de
medición más opraciones analíticas y estadísticas se podrán realizar con los
datos.

Toma de datos
La toma de datos es la obtención de una colección de los mismos que
no han sido ordenados numéricamente. Un ejemplo es el conjunto de
alturas de 100 estudiantes, sacados de una lista alfabética de
una universidad.
ORDENACIÓN
Una ordenación es una colocación de los datos numéricos tomados,
en orden creciente o decreciente de magnitud. La diferencia entre el
mayor y el menor de los números se llama recorrido o rango de los
datos. Por ejemplo, si la altura mayor de los 100 estudiantes es 74
pulgadas y la menor es de 60 pulgadas, el rango es 74 - 60 = 14
pulgadas.
Distribuciones de frecuencia
Cuando se dispone de gran número de datos, es útil el distribuirlos
en clases o categorías y determinar el número de individuos
pertenecientes a cada clase, que es la frecuencia de clase. Una
ordenación tabular de los datos en clases, reunidas las clases y con as
frecuencias correspondientes a cada una, se conoce como
una distribución de frecuencias o tabla de frecuencias. La Tabla 1 es
una distribución de frecuencias de alturas (registradas con
aproximación de pulgada) de 100 estudiantes de la Universidad XYZ.

La primera clase o categoría, por ejemplo, comprende las alturas de


60 a 62 pulgadas y viene indicada por el símbolo 60 - 62. Puesto que 5
estudiantes tienen una altura perteneciente a esta clase, la
correspondiente frecuencia de clase es 5.
Los datos ordenados y resumidos como en la distribución de
frecuencia anterior, se suelen llamar datos agrupados. Aunque con
el proceso de agrupamiento generalmente se pierde parte del detalle
original de los datos, tiene la importante ventaja de presentarlos
«todos» en un sencillo cuadro que facilita el hallazgo de las relaciones
que pueda haber entre ellos, puestas así de manifiesto.
Intervalos de clase y límites de clase
Un símbolo que define una clase, tal como 60 - 62 de la tabla anterior,
se conoce como intervalo de clase. Los números extremos, 60 y 62,
son los límites de clase; el número menor 60 es el límite inferior de la
clase y el mayor 62 es el límite superior. Los términos clase e intervalo
de clase se utilizan a menudo indistintamente, aunque el intervalo de
clase es realmente un símbolo para la clase.
Un intervalo de clase que, al menos teóricamente, no tiene límite
superior o inferior, se conoce como intervalo de clase abierto. Por
ejemplo, al referirse a la edad de grupos de individuos el intervalo de
clase, «mayores de 65 años» es un intervalo de clase abierto.
Límites reales de clases
Si las alturas se registran con aproximación de pulgada, el intervalo de
clase 60 - 62 teóricamente incluye todas las medidas desde 59,5000...
a 62,5000 … pulgadas. Estos números, representados brevemente por
los números exactos 59,5 y 62,5, se conocen como límites reales de
clase o límites verdaderos de clase; el menor de ellos, 59,5, es
el límite real inferior y el mayor de ellos, 62,5, es el límite real superior.
Prácticamente, los límites reales de clase se obtienen sumando al
límite superior de un intervalo de clase el límite inferior del intervalo de
clase contiguo superior y dividiendo por 2.
A veces, los límites reales de clase se utilizan para simbolizar las
clases. Por ejemplo, las diferentes clases de la primera columna de la
Tabla 1 podrían indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin
embargo, con tal notación aparece una ambigüedad, pues los límites
reales de clase no coincidirían con las observaciones reales. Así si
una observación fuese 62,5 no sería posible discernir si pertenece al
intervalo de clase 59,5 - 62,5 o al 62,5 - 65,5.
TAMAÑO O ANCHURA DE UN INTERVALO DE CLASE
El tamaño o anchura de un intervalo de clase es la diferencia entre los
límites reales de clase que lo forman y se conoce como anchura de
clase, tamaño de clase o longitud de clase. Si todos los intervalos de
clase de una distribución de frecuencias tienen igual anchura, esta
anchura común se representa por c. En tal caso, c es igual a la
diferencia entre dos sucesivos límites de clase inferiores o superiores.
Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c =
62,5 - 59,5 = 65,5 - 62,5 = 3.
Marca de clase
La marca de clase es el punto medio del intervalo de clase y se
obtiene sumando los límites inferior y superior de la clase y dividiendo
por 2. Así, la marca de clase del intervalo 60 - 62 es (60 + 62)/2 = 61.
La marca de clase se llama también punto medio de la clase.
Para análisis matemáticos posteriores, todas las observaciones
pertenecientes a un intervalo de clase dado se suponen coincidentes
con la marca de clase. Así, todas las alturas en el intervalo de clase 60
- 62 pulgadas se considerarán como de 61 pulgadas.
Reglas generales para formar las distribuciones de frecuencia
l. Determinar el mayor y el menor entre los datos registrados y así
encontrar el rango (diferencia entre el mayor y el menor de los datos).
2. Dividir el rango en un número conveniente de intervalos de clase del
mismo tamaño. Si esto no es posible, utilizar intervalos de clase de
diferente tamaño o intervalos de clase abiertos. El número de
intervalos de clase se toma generalmente entre 5 y 20 dependiendo de
los datos. Los intervalos de clase se eligen también de forma que
las marcas de clase o puntos medios coincidan con datos realmente
observados. Esto tiende a aminorar el llamado error de
agrupamiento, en los análisis matemáticos posteriores. Sin embargo,
los límites reales de clase no coincidirán con los datos observados.
3. Determinar el número de observaciones que caen dentro de cada
intervalo de clase, es decir, encontrar las frecuencias de clase. Lo
mejor para esto es utilizar una hoja de conteo.
HISTOGRAMAS Y POLIGONOS DE FRECUENCIA son dos
representaciones gráficas de las distribuciones de frecuencia.
1. Un histograma o histograma de frecuencias consiste en una serie
de rectángulos que tienen
(a) Sus bases sobre un eje horizontal (el eje X) con centros en las
marcas de clase y longitud igual al tamaño de los intervalos de clase.
(b) Superficies proporcionales a las frecuencias de clase.
Si los intervalos de clase tienen todos igual tamaño, las alturas de los
rectángulos son proporcionales a las frecuencias de clase y se
acostumbra en tal caso a tomar las alturas numéricamente iguales a
las frecuencias de clase. Si los intervalos de clase no son de igual
tamaño, estas alturas deberán ser calculadas.
2. Un polígono de frecuencias es un gráfico de línea trazado sobre las
marcas de clase. Puede obtenerse uniendo los puntos medios de los
techos de los rectángulos en el histograma.
El histograma y el polígono de frecuencias correspondiente a
la distribución de frecuencias de las alturas de los estudiantes se
muestran en el mismo sistema de ejes en la Fig.1. Se acostumbra a
prolongar el polígono con PQ y RS hasta las marcas de clase inferior y
superior inmediatas, que corresponderían a la clase de frecuencia
cero. En tal caso, la suma de las áreas de los rectángulos del
histograma es igual al e área total limitada por el polígono de
frecuencias y el eje X.

Distribuciones de frecuencia relativa


La frecuencia relativa de una clase es la frecuencia de la clase dividida
por el total de frecuencias de todas las clases y se expresa
generalmente como porcentaje. Por ejemplo, la frecuencia relativa de
la clase 66 - 68 de la Tabla 1 es 42/100 = 42 %. La suma de las
frecuencias relativas de todas las clases es evidentemente 1 ó 100 %.
Si las frecuencias en la anterior tabla de frecuencias se sustituyen por
las correspondientes frecuencias relativas, la tabla resultante se
llama distribución de frecuencias relativas, distribución
porcentual o tabla de frecuencias relativas.
Las representaciones gráficas de distribuciones de frecuencia relativa
pueden obtenerse del histograma o del polígono de frecuencias, sin
más que cambiar la escala vertical de frecuencia a frecuencia relativa,
conservándose exactamente el mismo diagrama. Los gráficos que
resultan se llaman histogramas de frecuencias relativas o histogramas
porcentuales y polígonos de frecuencias relativas o polígonos
porcentuales, respectivamente.
Distribuciones de frecuencia acumulada. Ojivas
La frecuencia total de todos los valores menores que el límite real
superior de clase de un intervalo de clase dado se conoce
como frecuencia acumulada hasta ese intervalo de clase inclusive. Por
ejemplo, la frecuencia acumulada hasta el intervalo de clase 66 - 68
inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando que 65
estudiantes tienen alturas menores que 68,5 pulgadas.
Una tabla que represente las frecuencias acumuladas se
llama distribución de frecuencias acumuladas, tabla de frecuencias
acumuladas o brevemente distribución acumulada, y se muestra en la
Tabla 2, para la distribución de la altura de los estudiantes.
Un gráfico que muestre las frecuencias acumuladas menores que
cualquier límite real superior de clase trazado sobre los límites reales
superiores de clase se llama polígono de frecuencias
acumuladas u ojiva y se muestra en la Fig. 2-2 para la distribución de
la altura de los estudiantes.
En algunos casos es preferible considerar una distribución de
frecuencias acumuladas de todos los valores mayores o iguales al
límite real inferior de clase de cada intervalo de clase. En este caso
consideramos las alturas de 59,5 pulgadas o más, 62,5 pulgadas o
más, etc., ésta se llama a veces distribución acumulada «o
más», mientras que la considerada anteriormente es la distribución
acumulada «menor que». De la una se obtiene fácilmente la otra. Las
correspondientes ojivas se llaman «o más» y «menor que». Siempre
que nos refiramos a distribuciones acumuladas u ojivas sin especificar,
se entenderá que son del tipo «menor que».
DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS.
OJIVAS PORCENTUALES
La frecuencia relativa acumulada o frecuencia porcentual
acumulada es la frecuencia acumulada dividida por la frecuencia total.
Por ejemplo, la frecuencia relativa acumulada de alturas menores que
68,5 pulgadas es 65/100 = 65 %, queriendo con ello decir que el 65 %
de los estudiantes tienen alturas menores de 68,5 pulgadas.
Si se utilizan en la Tabla 2, y Fig. 2, las frecuencias relativas
acumuladas en lugar de las frecuencias acumuladas, los resultados se
llaman distribuciones de frecuencias relativas
acumuladas o distribuciones porcentuales acumuladas y polígonos de
frecuencias relativas acumuladas u ojivas
porcentuales, respectivamente.
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS
El conjunto de datos puede considerarse normalmente como
perteneciente a una muestra extraída de una población grande. A
causa de las muchas observaciones que podemos realizar en la
población es posible teóricamente (para datos continuos) elegir los
intervalos de clase muy pequeños y todavía tener un número
adecuado de observaciones dentro de cada clase. Así se tiene que el
polígono de frecuencias o el de frecuencias relativas para una
población grande puede estar formado por muchos pequeños
segmentos rectos que aproximan el conjunto a una curva, las curvas
de este tipo pueden llamarse curvas de frecuencias o curvas de
frecuencias relativas, respectivamente.
Es razonable esperar que tales curvas teóricas provengan de la
suavización de los polígonos de frecuencias o de los polígonos de
frecuencias relativas de la muestra, la aproximación es tanto más
exacta conforme aumenta el tamaño de la muestra. Por esta razón
una curva de frecuencias se conoce como un polígono de frecuencias
suavizado.
De una forma análoga las ojivas suavizadas provienen de la
suavización de los polígonos de frecuencias acumuladas u ojivas.
Normalmente es más sencillo suavizar una ojiva que un polígono de
frecuencias.
Tipos de curvas de frecuencia

Las curvas de frecuencia presentan determinadas formas


características que les distinguen como se indica en la Figura 3.
(a) Las curvas de frecuencia simétricas o bien formadas se
caracterizan por el hecho de que las observaciones que equidistan del
máximo central tienen la misma frecuencia. Un ejemplo importante es
la curva normal.
(b) En las curvas de frecuencia moderadamente
asimétricas o sesgadas la cola de la curva a un lado del máximo
central es mayor que al otro lado. Si la cola mayor se presenta a la
derecha de la curva se dice que ésta está sesgada a la derecha o que
tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la
curva está sesgada a la izquierda o que tiene un sesgo negativo.
(c) En las curvas en forma de J o de J invertida, el máximo se presenta
en un extremo.
(d) Las curvas de frecuencias en forma de U tienen el máximo en
ambos extremos.
(e) Una curva de frecuencias bimodal tiene dos máximos.
(f) Una curva de frecuencias multimodal tiene más de dos máximos.

Você também pode gostar