Você está na página 1de 64

Estadstica General

Mg. Mara Vallejos Atalaya

Estadstica General
Mg. Mara Vallejos Atalaya

Estadstica General

Mg. Mara Vallejos Atalaya

PRESENTACIN
El mdulo de Estadstica General tiene la naturaleza terico- prctica, pertenece al rea de
Formacin Bsica, en el I ciclo, con un total de 4 horas y 3 crditos. Asimismo, responde a las
exigencias curriculares de los programas acadmicos y de los diseos curriculares de la Facultad de
Ciencias Empresariales y sus respectivas carreras acadmicas profesionales, en el contexto de los
perfiles, las visiones y las misiones institucionales educativas y profesionales.
Tiene el propsito de proporcionar al futuro profesional los conocimientos necesarios de la estadstica,
que le permitir investigar y resolver problemas con el quehacer de su carrera profesional. El mundo
actual que vivimos, ha provocado incertidumbre en las personas que tienen que tomar decisiones en
las diferentes funciones que les toca desempear, ya sea en las instituciones gubernamentales,
comerciales, de negocios pblicos y privados. La estadstica es una herramienta intelectual que ayuda
a tomar decisiones racionales, porque sabemos que El pasado puede evaluarse, el presente puede
ser descrito y el futuro puede ser previsto.
El sistema modular no es sino un encuentro de los alumnos y profesores en espacios diseados y
establecidos previamente, con mucha inteligencia, seleccin adecuada y pertinente de los contenidos,
instrumentos y metodologa, cuyos alcances de autoaprendizajes sern coronados en la grandeza de
los alumnos participantes, especialmente de quienes quedan inmersos en los programas acadmicos a
distancia, cuya dinmica acadmica se ha estandarizado y responde al uso de las tecnologas
modernas. En este sentido, el mdulo ha sido diseado para desarrollarlo en dos fases: una a distancia
y la otra presencial (tutorial) que comprende 10 tutoras presenciales.
Este mdulo contiene la sumilla, las competencias, los contenidos agrupados en 5 unidades. Unidad 1:
Conceptos fundamentales y la organizacin de la informacin, Unidad 2: Medidas de resumen: anlisis
e interpretacin de los resultados, Unidad 3: Nociones de probabilidad: propiedades, anlisis
combinatorio, Unidad 4: Distribuciones de probabilidad y Unidad 5: Distribuciones muestrales. Adems,
en el mismo mdulo se encuentra la metodologa, la evaluacin y la bibliografa. Por ejemplo, se
trabajar la metodologa activa, adems, se ejercer la evaluacin de acuerdo con los indicadores,
criterios y condiciones registrados en el desarrollo de cada unidad. Este mdulo comprende una
bibliografa bsica y especializada.

Estadstica General

Mg. Mara Vallejos Atalaya

NDICE

UNIDAD I: TEORA ESTADSTICA


Sesin N1
CONCEPTOS FUNDAMENTALES Y ORGANIZACIN DE LA INFORMACIN
1.1 Generalidades
1.1.1 Definicin de estadstica
1.1.2. Ramas de la estadstica
1.1.3. Poblacin
1.1.4. Muestra
1.1.5. Unidad estadstica
1.1.6. Dato estadstico
1.1.7. Parmetro
1.1.8. Estadstico o estadgrafo
1.1.9. Variable estadstica
Sesin N 2
ETAPAS DEL MTODO ESTADSTICO
2.1. Etapas del mtodo estadstico
2.1.1. Planificacin del estudio
2.1.2. Recoleccin de la informacin
2.1.2.1. Mtodo de recoleccin de la observacin
2.1.2.2. Muestreo
2.1.2.3. Determinacin del tamao de muestra
2.1.3. Presentacin u organizacin de la informacin
2.1.3.1. Revisin y correccin de la informacin recogida
2.1.3.2. Presentacin de la informacin mediante cuadros
2.1.3.3. Presentacin de la informacin mediante grficos
2.1.4. Anlisis e interpretacin de los resultados
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Sesin N 3
ORGANIZACIN DE LA INFORMACIN: TABLAS Y GRFICOS ESTADSTICOS
3.1. Tablas de frecuencias o distribucin de frecuencias
3.1.1. Distribucin de frecuencias de una variable discreta
2.1.2. Distribucin de frecuencias para datos agrupados
Sesin N 4
REPRESENTACIN DE LA INFORMACIN
4.1. Presentacin de la informacin mediante grficos
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

UNIDAD II: MEDIDAS ESTADSTICAS

Estadstica General

Sesin N5
MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
5.2. Medidas de tendencia central
5.2.1. La media o promedio aritmtico ( x )
5.2.1. Mediana (Me)
5.1.3. La moda (Mo)
Sesin N 6
MEDIDAS DE POSICIN
6.1. Medidas de posicin
6.1.1. Cuartiles (Qi )
6.1.2. Deciles (Di )
6.1.3. Percentiles (Pi )
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Sesin N 7
MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
7.1.1. Varianza (s2 )
7.1.2. Desviacin estndar (s )
7.1.3. Coeficiente de variacin (c.v. % )
Sesin N 8
MEDIDAS DE FORMA
8.1. Medidas de forma.
8.1.1. Asimetra (As)
8.1.2. Coeficiente de Kurtosis o apuntamiento (K)
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

UNIDAD III: PROBABILIDAD


Sesin N9
PROBABILIDAD
9.1. Introduccin
9.2. Anlisis combinatorio
9.2.1. Factorial de un nmero (!)
9.2.2. Permutaciones
9.2.3 variaciones
9.2.4. Combinaciones
9.2.5. Propiedad
Sesin N 10
ALGUNOS CONCEPTOS BSICOS DE PROBABILIDAD
10.1. Algunos conceptos bsicos de probabilidad
10.1.1. Experimento
10.1.2. Espacio muestral

Mg. Mara Vallejos Atalaya

Estadstica General

Mg. Mara Vallejos Atalaya

10.1.3. Suceso o evento

10.1.4. Operaciones con eventos


10.1.5. Eventos mutuamente excluyentes
10.2. Probabilidad de un evento
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Sesin N 11
PROBABILIDAD CONDICIONAL

11.1. Probabilidad condicional


11.2. Regla de la multiplicacin de eventos
11.4. Teorema de bayes
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN

UNIDAD IV: PROBABILIDAD Y DISTRIBUCIN


Sesin N12
PROBABILIDAD BSICA
12.1. Las distribuciones de probabilidades bsicas
12.2. Las variables aleatorias
12.3. Las distribuciones de probabilidad
12.3.1. La distribucin binomial
12.3.1.1.1. Propiedades de una distribucin binomial
12.3.1.1.2. Uso de tablas de la distribucin binomial
12.3.1.1.3. Media y desviacin estndar de una distribucin binomial
12.3.2. La distribucin de poisson
12.3.2.1. La frmula de poisson
12.3.2.2. Uso de tablas de la distribucin acumulada de poisson
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
Sesin N 13
DISTRIBUCIN NORMAL
13.1. Distribucin normal
13.1.1. Uso de tablas de distribucin acumulada normal estndar
EJERCICIOS PROPUESTOS
EVALUACIN
AUTOEVALUACIN

UNIDAD V: DISTRIBUCIONES DE MUESTREO


Sesin N14
DISTRIBUCIONES MUESTRALES
14.1. Distribuciones muestrales
14.2. Muestreo
14.3. Etapas del muestreo
14.4. Las distribuciones muestrales de probabilidad

Estadstica General

14.5. Distribuciones de muestreo de estadsticas


14.6. Distribucin muestral de la media
Sesin N 15
DISTRIBUCIN MUESTRAL DE UNA PROPORCIN
15.1. Distribucin muestral de una proporcin
15.2. Distribucin muestral de la diferencia de dos medias
EJERCICIOS PROPUESTOS
AUTOEVALUACIN
EVALUACIN
REFERENCIAS BIBLIOGRFICAS
APNDICES
Apndice N 1 Nmeros aleatorios
Apndice N 2 Tabla de la distribucin acumulada binomial
Apndice N 3 Distribucin de poisson - trminos acumulativos
Apndice N 4 Distribucin acumulativa normal

Mg. Mara Vallejos Atalaya

Mg. Mara Vallejos Atalaya

SUMILLA
La asignatura de Estadstica General tiene la naturaleza terico- prctico, pertenece al rea de
Formacin Bsica, con cuatro horas, tres crditos, corresponde al I ciclo de las Carreras Acadmico
Profesional de Administracin y Contabilidad. Pretende proporcionar los conocimientos necesarios de
la estadstica, que le permitir investigar, analizar y resolver problemas con el quehacer de su carrera
profesional, cuyo contenido son: conceptos fundamentales y la organizacin de la informacin, medidas
de resumen: anlisis e interpretacin de los resultados, nociones de probabilidad, distribuciones de
probabilidad y distribuciones muestrales.

15

Mg. Mara Vallejos Atalaya

UNIDAD I:
TEORA ESTADSTICA
Sesin N1:
Conceptos fundamentales y organizacin de la informacin
Sesin N2:
Etapas del Mtodo Estadstico
Sesin N3:
Organizacin de la informacin: tablas y grficos estadsticos
Sesin N4:
Representacin de la Organizacin

16

Mg. Mara Vallejos Atalaya

COMPETENCIAS
CONCEPTUAL

PROCEDIMENTAL

Reconoce los diferentes


conceptos
fundamentales y
construye tablas y
grficos de informacin
estadstica.

Reconocen y delimitan
la poblacin, muestra y
variables en estudio, y
adems utilizan tablas y
grficos adecuados.

17

ACTITUDINAL
Analizan e interpretan los
resultados obtenidos en
las tablas y grficos
estadsticos.

Mg. Mara Vallejos Atalaya

Sesin N 1

CONCEPTOS FUNDAMENTALES Y
ORGANIZACIN DE LA INFORMACIN
1.1 GENERALIDADES
1.1.1 Definicin de estadstica
La estadstica es una ciencia que nos proporciona un conjunto de mtodos y tcnicas para la
recoleccin, clasificacin, presentacin, anlisis e interpretacin de los datos, con la finalidad de
realizar una toma de decisin ms efectiva.
1.1.2. Ramas de la estadstica
Estadstica descriptiva
Consiste en recolectar, clasificar, presentar y describir los datos vlidos nicamente para la poblacin
objeto de estudio, utilizando tablas, grficos y algunas medidas de resumen. No se efectan inferencias
para un grupo mayor.
Estadstica inferencial
Se emplea para generalizar conclusiones vlidas para una poblacin a partir de datos obtenidos de
una muestra extrada de dicha poblacin.
1.1.3. Poblacin
Es el conjunto de todos los individuos, objetos u observaciones que poseen al menos una caracterstica
comn, que son objetos de estudio. Se representa con la letra N.
La poblacin se define de acuerdo a la caracterstica, unidad estadstica y extensin del problema
objeto de estudio.
Ejemplo:
1. Las edades de los estudiantes de la UPeU.
2. Los errores que presentan las facturas del supermercado La Unin.
Respecto a la caracterstica objeto de estudio se puede distinguir:
a)

Poblacin objeto. Considerada como el conjunto de elementos que son objeto de estudio.
Ejemplo.
1. Conjunto de los alumnos de la UPeU.
2. Conjunto de facturas del supermercado La Unin.

b)

Poblacin objetivo. Considerada como el conjunto de observaciones, medidas de la


caracterstica que es de inters para el estudio de la poblacin objeto.
Ejemplo.
1. Conjunto de edades.
2. Conjunto de errores.

La poblacin de acuerdo al nmero de elementos que la forman puede ser finita o infinita.
Poblacin finita: Es aquella que tiene un nmero limitado de elementos.
Ejemplo:
16

Mg. Mara Vallejos Atalaya

1.

Ventas efectuadas durante un ao en una tienda determinada.

2.

Edades de los alumnos de la UPeU.

Poblacin infinita: Es aquella que tiene un nmero indeterminado de elementos. No se refiere a que
no se puede contar, sino que es imposible ubicar a todos los elementos de la poblacin.
Ejemplo:
1. Los sntomas de los enfermos tuberculosos de Lima.
2. Evasin de impuestos de las empresas adscritas al RUC.
1.1.4. Muestra
Es un subconjunto o parte de la poblacin. Se examina una muestra cuando no es posible examinar
una poblacin, ya sea por factores econmicos, disponibilidad de personal o tiempo.
La muestra debe cumplir dos requisitos bsicos: Debe ser representativa y adecuada.
Es representativa cuando contiene todos los sectores o aspectos de la poblacin en la misma
proporcin en que se hallan en la totalidad del universo. La representatividad asegura la calidad de la
muestra.
Es adecuada cuando el tamao de la muestra tiene una magnitud suficiente que permita confiar en la
estabilidad de las caractersticas presentes en la muestra. La adecuacin asegura la confiabilidad de la
muestra.
1.1.5. Unidad estadstica
Es el elemento que pertenece a la poblacin objeto de estudio. Dicho elemento contiene las
caractersticas, atributos que el individuo o fenmeno puede poseer.
Ejemplo:
1. Para un ingeniero que verifica la calidad de productos elaborados por una empresa, la unidad
estadstica son los productos terminados.
2. Para un auditor que verifica los estados financieros de una empresa en el balance general, cuentas
clientes, la unidad estadstica son las facturas por cobrar.
1.1.6. Dato estadstico
Son nmeros o medidas que han sido recopilados como resultado de observaciones que pueden ser
comparados, analizados e interpretados.

Ejemplo:
1. Si la caracterstica de estudio es la variable X: edad de un grupo de 5 estudiantes. El conjunto de
datos estadsticos seran los siguientes:
x1 = 17, x2 = 18, x3 = 21, x4 = 22, x5 = 19
2. Si la caracterstica de estudio es la variable X: n de errores ubicados en 5 facturas. El conjunto de
datos estadsticos seran los siguientes:
x1 = 2, x2 = 5 , x3 = 0, x4 = 4, x5 = 2
1.1.7. Parmetro
Es una medida de resumen que describe alguna caracterstica de toda la poblacin objeto de estudio.
Para determinar el valor del parmetro se requiere informacin de toda la poblacin.
17

Mg. Mara Vallejos Atalaya

Las ms usadas son:


i) Media poblacional ()
ii) Varianza poblacional (2)
iii) Desviacin estndar poblacional ()
iv) Proporcin poblacional (P)
1.1.8. Estadstico o estadgrafo
Es una medida de resumen que describe alguna caracterstica de la muestra.
Las ms usadas son:
i) Media Muestral ( x )
ii) Varianza muestral (s2)
iii) Desviacin estndar muestral (s)
iv) Proporcin muestral (p)
1.1.9. Variable estadstica
Es una caracterstica de la poblacin que interesa al investigador y que toma diferentes valores.
Se denota con las letras: X, Y, Z, etc.
Ejemplo:
1. Edad
3. Ingreso familiar
5. Estatura

2. Profesin
4. Estado Civil
6. Nivel socioeconmico

Las variables se pueden clasificar de la siguiente manera:


a. Variables cualitativas
Son aquellas caractersticas que no se expresan cuantitativamente, constituidas por atributos.
Ejemplo:
- Lugar de procedencia (norte, centro sur, oriente)
- Estado civil (soltero, casado, viudo, divorciado, conviviente).
Estas variables a su vez pueden clasificarse segn la escala de medicin en:
i) Variable cualitativa nominal
Es aquella que no lleva ninguna ordenacin en sus posibles modalidades (datos estadsticos).
Ejemplo:
- Estado civil: soltero, casado, viudo divorciado, conviviente (en estas clasificaciones no hay
ordenacin jerrquica, si quisiramos forzar la ordenacin y pondramos al soltero en primer lugar,
quin ira segundo, el casado o el conviviente y luego el viudo o el divorciado).
- Filiacin religiosa: catlico, adventista, mormn,
ii) Variable cualitativa ordinal
Es aquella que busca ordenar sus casos en trminos del grado que posee una determinada
caracterstica.
Ejemplo:
- Nivel socio-econmico: alto, medio, bajo
- Rendimiento: excelente, bueno regular malo, psimo.
b. Variables cuantitativas
18

Mg. Mara Vallejos Atalaya

Es aquella cuyos datos estadsticos son numricos y se obtiene como resultado de mediciones o
conteos.
Ejemplo:
- Sueldos: 800, 1500, 935, 450,
- Notas: 12, 19, 16, 08, 10,
Las variables cuantitativas segn la escala de medicin pueden ser:
i) Variable cuantitativa de intervalo
Es aquella que se presenta en intervalos y no necesariamente empieza del cero racional.
Ejemplo:
- Temperatura corporal: 36, 37, 38 (una persona no puede tener 0 de temperatura, porque estara
muerta).
- Peso: 20kg, 35kg, 58kg.
Todos los signos vitales son variables cuantitativas de intervalo.
ii) Variable cuantitativa de razn
Es aquella que necesariamente empieza del cero racional.
Ejemplo:
- Notas: 0, 1, 2, 3, , 20 (empieza desde cero)
- Edad: 0, 1, 2,
Las variables cuantitativas segn su naturaleza pueden ser:

i) Variable discreta
Son aquellas que toman valores numricos aislados y no pueden tomar ningn valor entre dos
nmeros consecutivos fijados (slo asume nmeros enteros).
Ejemplo:
- N de hijos: 0, 1, 2, 3, (no puede existir 2.5 porque sera ilgico pensar en 2 hijos y medio)
- N de facturas que presentan errores: 0, 1, 2, 3,
ii) Variable continua
Son aquellas que pueden tomar infinitos valores entre dos nmeros, por muy prximos que los fijemos,
es decir, se presentan valores enteros as como decimales.
Ejemplo:
- Peso: 62.55 kg, 72.40 kg, 56.35 kg,...
- Talla: 1.50 mt, 1.65 mt, 1.85 mt,

19

Mg. Mara Vallejos Atalaya

Sesin N 2

ETAPAS DEL MTODO ESTADSTICO


2.1. ETAPAS DEL MTODO ESTADSTICO
De acuerdo con el orden de aplicaciones de la estadstica a un problema determinado, los mtodos
estadsticos se dividen en cuatro etapas:
1.
2.
3.
4.

Planificacin del estudio.


Recoleccin de la informacin.
Presentacin u organizacin de la informacin.
Anlisis e interpretacin de los resultados.

2.1.1. Planificacin del estudio


Estudia los detalles concernientes a la recoleccin, clasificacin y anlisis de la informacin. En base a
lo cual se definirn caractersticas de la poblacin o se negarn o confirmarn una hiptesis de trabajo.
En esta etapa se pueden considerar los siguientes aspectos:
-

Planteamiento del problema.


Bsqueda y evaluacin de la informacin existente.
Formulacin de hiptesis.
Verificacin de la hiptesis.
Anlisis y presentacin de los resultados.

2.1.2. Recoleccin de la informacin


Los principales puntos que deben considerarse al recoger la informacin son:
-

Los errores que puedan cometerse en la recoleccin de los datos y la manera de controlarlos.
Las ventajas y limitaciones de los diversos mtodos empleados en la recoleccin de la informacin.
Las condiciones que deben reunir los individuos que se estudian y los procedimientos ms
convenientes para su eleccin.
El diseo de los formularios que servirn para registrar la informacin que se recoja.

2.1.2.1. Mtodo de recoleccin de la observacin


a. Directa.- Cuando los datos son recolectados directamente de la fuente de origen. sta puede ser
mediante la observacin o el interrogatorio.
b. Indirecta.- Cuando los datos provienen de datos recogidos por otros individuos en este caso se
habla de fuentes secundarias.
En cuanto al tiempo, la recoleccin de datos puede clasificarse en:
Continuas: Cuando son registradas a medida que ocurren.
Ejemplo:
20

Mg. Mara Vallejos Atalaya

Registro civil de hechos vitales (nacimientos, defunciones y casamientos).


Peridicas: Cuando est hecho en determinados intervalos de tiempo (forma cclica).
Ejemplo:
Censos hechos en el Per cada 10 aos.
Ocasionales: Cuando se efecta en cualquier poca.
Ejemplo:
Estudios de investigacin realizados por algn investigador.
2.1.2.2. Muestreo
Es la tcnica mediante la cual se obtiene la muestra representativa y adecuada.
VENTAJAS Y LIMITACIONES DEL MUESTREO
a. Permite conocer con relativa aproximacin determinada caracterstica de una poblacin de gran
tamao, dentro de un costo razonable y en menor tiempo.
b. Permite mayor exactitud de los resultados, puesto que los factores artificiales de variacin pueden
controlarse.
c. Cuando la poblacin es infinita o muy grande, entonces, el estudio slo podr realizarse a travs de
una muestra.
d. Cuando se trata de ensayos destructivos o no recuperables, necesariamente se tendr que utilizar
una muestra.
e. Una limitacin de la muestra, es que, por buena que pueda ser la muestra y los cuidados puestos
en ella, siempre existe el sesgo debido a factores aleatorios. Dicho riesgo debe ser establecido a
priori por el investigador de modo que se tenga suficiente garanta de la muestra seleccionada.
2.1.2.3. Determinacin del tamao de muestra
Se determina el tamao de muestra utilizando la frmula siguiente, para una muestra sacada de una
poblacin finita cuya fuente es Arkin y Colton.

N
N 1 k 2 1

NOTAS
Donde:
n = tamao de la muestra (nmero de elementos de la muestra)
N = tamao de la poblacin (nmero de elementos de la poblacin)
k = error de muestreo.
Ejemplo:
Seleccionar el tamao de la muestra para la poblacin que est constituida por 1500 estudiantes de la
UPeU, utilizando un error de muestreo del 25% y 5%.
Solucin:
si: k = 25%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
25/100 = 0.25

1500

1500 1 0.25

15.84 16 alumnos
21

Mg. Mara Vallejos Atalaya

si: k = 5%, para reemplazar este valor en la frmula, primero debemos convertir a real, es decir, k =
5/100 = 0.05.

1500

1500 1 0.05

315.96 316 alumnos

2.1.3. Presentacin u organizacin de la informacin


Se consideran los tres pasos siguientes:
1. Revisin y correccin de la informacin recogida.
2. Presentacin de la informacin mediante cuadros.
3. Presentacin de la informacin mediante grficos.
2.1.3.1. Revisin y correccin de la informacin recogida
Se debe revisar y corregir:
a)
b)
c)
d)

La escritura.
Las respuestas inconsistentes.
Las respuestas incompletas.
Las unidades en las cifras son diferentes.

2.1.3.2. Presentacin de la informacin mediante cuadros


Despus de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos.
2.1.3.3. Presentacin de la informacin mediante grficos
Los grficos ms usados son:
a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo
2.1.4. Anlisis e interpretacin de los resultados
Para el anlisis e interpretacin de los resultados nos basamos en los cuadros y grficos, y en las
medidas de resumen de la serie de datos.

EJERCICIOS PROPUESTOS
1. Indique cules de los trminos u operaciones siguientes se relacionan con una muestra o con una
poblacin:
a) grupo de medidas llamados parmetros
b) uso de inferencia estadstica
c) hacer un censo
d) juzgar la calidad de un embarque de fruta inspeccionando varios de los bultos incluidos en el
22

Mg. Mara Vallejos Atalaya

embarque.
2. En los siguientes enunciados, indicar si se trata de una Muestra (M) o una Poblacin (P):
a)
b)
c)
d)

Nmero de estudiantes egresados del Instituto YI en el ao 2004


Estudio de personas con proceso judicial por trfico de drogas en el ao 2000
Nmeros de nios nacidos vivos en el hospital X
Estudio del 25% de pacientes con tuberculosis del distrito DF

3. Elabore una lista de 10 variables. Luego:


a.
b.
c.
d.

Identifique la poblacin objeto.


Identifique la poblacin objetivo.
Determine la unidad estadstica.
Mencione algunos datos estadsticos.

4. Clasificar las siguientes variables en cualitativas (nominal y ordinal) y cuantitativas (discreta y


continua).
a.
b.
c.
d.
e.
f.
g.
h.
i.
j.
k.
l.
m.
n.

rendimiento acadmico
velocidad de lectura
peso contenido en un paquete de cereales
categora de docente
nmero de artculos defectuosos producidos
nmero de unidades de un artculo en existencia
grado de desnutricin
asistencia a los cultos devocionales
patrn conductual
cultura organizacional
tipo de alimentacin
nmero de hermanos
grado de instruccin
estado civil.

5. Clasifique las variables e indique el tipo de escala en que estn medidas las siguientes
caractersticas:
a)
b)
c)
d)
e)
f)
g)
h)

Profesin
Ao de nacimiento
Nacionalidad
Grado de instruccin
ingreso mensual familiar promedio
Nmero de telfono
Grado de instruccin
Nmero de hijos

6. Utilizando la frmula determine el tamao de la muestra, considerando los datos que se mencionan
a continuacin.
a). N =
b) N =
c) N =
d) N =
e) N =

1 500
2 000
5 000
500
1 000

k = 3%
k = 10%
k = 2%
k = 10%
k = 5%

7. En el siguiente enunciado identifique: poblacin, muestra, unidad estadstica, parmetro,


estadstico, variable(s), tipo de variable(s) y d 2 ejemplos de dato estadstico.
Con la finalidad de mejorar el servicio de la Biblioteca de la UPeU" se decidi realizar un estudio
de investigacin, para lo cual se seleccion aleatoriamente a 45 estudiantes usuarios de la
biblioteca obtenindose los siguientes resultados:
-

En promedio un alumno dedica 1 hora a la lectura en sala.


23

Mg. Mara Vallejos Atalaya

El 80% afirma que la atencin es buena.


El 10% de los usuarios son recin ingresantes a la UPeU.
En promedio un alumno se lleva 1.5 libros a su casa.

8. Identifique en cada caso: unidad elemental, variable, tipo de variable


a)
b)
c)
d)
e)
f)

consumo mensual de electricidad


opinin acerca de la gestin de un ministro
peso de nios de 5 aos
estado civil
nmero de artculos defectuosos producidos por las mquinas de una fbrica
nacionalidad de personas que asisten a un congreso.

24

Mg. Mara Vallejos Atalaya

Autoevaluacin
CONCEPTUAL
1.

Seale con una V si es verdadero o F si es falso en los siguientes enunciados:


a) (
b) (
c) (
d) (
e) (

) Una muestra es representativa si sta contiene todas las


caractersticas de la muestra.
) La variable es una caracterstica que asume diferentes valores.
) Para que una poblacin est bien definida, debe contener la
caracterstica, unidad estadstica y extensin.
) Las ramas de la estadstica son: estadstica descriptiva e inferencial.
) Las variables cualitativas son aquellas que son numricas y se
obtiene como resultado del conteo

PROCEDIMENTAL
2.

Los mtodos de recoleccin de la informacin son: directa e indirecta. Cul


es la diferencia entre ambas?

3.

Dadas las siguientes variables, colocar en la tabla en el lugar donde le


corresponde de acuerdo a su naturaleza y escala de medicin.
a. Estudios diarios
b. Lugar de procedencia
c. Velocidad de lectura
d. Idiomas
i. Estado civil
k. Estatura
Variable cualitativa
Nominal
Ordinal

4.

e. Grado de instruccin
f. Sueldos
g. Gastos
h. Rendimiento
j. Edad
l. Categora de docente
Variable cuantitativa
Discreta
Continua

Utilizando la frmula determine el tamao de la muestra, considerando los


datos que se mencionan a continuacin.
a) N = 500 k = 10%
c) N = 1 500 k = 3%

b) N = 1 000
d) N = 2 000

k = 5%
k = 10%

ACTITUDINAL
5.

Considerando los conocimientos adquiridos en esta tutora identificar las


clases de variables estadstica, su naturaleza, y de esta manera poder realizar
un estudio estadstico.

28

Mg. Mara Vallejos Atalaya

Sesin N 3

ORGANIZACIN DE LA INFORMACIN:
TABLAS Y GRFICOS ESTADSTICOS
3.1. TABLAS DE FRECUENCIAS O DISTRIBUCIN DE FRECUENCIAS
Una distribucin de frecuencias (o tabla de distribucin de frecuencias) es una representacin de una
serie de datos. En ella se muestra cmo se distribuyen los valores de la variable estadstica junto a sus
frecuencias correspondientes a cada uno de ellos.
En estas tablas de distribucin de frecuencias, como producto de la operacin de tabulacin (conteo),
se observa cuantos elementos (frecuencia o repeticin) hay en cada categora, valor o intervalo de la
variable.
Luego de la revisin de los datos recopilados, es conveniente presentar la informacin, de acuerdo a
algn sistema de ordenacin, a fin de describirlos y analizarlos. A continuacin se presenta algunos
conceptos y procedimientos comunes para la presentacin de cuadros o tablas.

f i ): Se llama al nmero de veces que aparece repetido dicho valor, en


un conjunto de valores realizadas. La suma de todas las frecuencias es igual al total n de datos
Frecuencia absoluta simple (
observados.
Se denota mediante:

fi
m

Propiedad:

f1 f 2 ... f m f i n
i 1

Frecuencia absoluta acumulada (Fi): Es igual a la suma de las frecuencias absolutas simples
inferiores o iguales a las frecuencias acumuladas que se desea encontrar.
Se denota mediante:

Fi

Propiedad:

F1 f q
F2 f1 f 2
.
.
.

Fm f1 f 2 ... f m
Frecuencia relativa simple ( hi ): Es el cociente entre la frecuencia absoluta simple de su fila y el
nmero total de observaciones realizadas (n). La suma de todas las frecuencias relativas es igual a 1.
Su frmula es:

Se denota mediante:

hi

fi
n

hi
29

Mg. Mara Vallejos Atalaya

Propiedad:

h1 h2 ... hm

h
i 1

Frecuencia relativa acumulada ( H i ): Se llama al cociente entre la frecuencia absoluta acumulada de


su fila y el nmero de observaciones realizadas (n).

Hi

Su frmula es:
Se denota mediante:

Fi
n

Hi

Propiedad:

H1 hq
H 2 h1 h2
.
.
.

H m f1 h2 ... hm
Para presentacin de la informacin mediante cuadros o tablas, es necesario construir la tabla de
distribucin de frecuencias. La cual puede ser:
3.1.1. Distribucin de frecuencias de una variable discreta
Una distribucin de frecuencias es un arreglo de los valores observados x1,...xm de una variable X con
sus respectivas frecuencias, en una tabla de la forma:
Valores fi
de X
x1
f1
x2
f2

Fi

hi

Hi

F1
F2

h1
h2

H1
H2

xk
Total

Fm
fi=n

F m= n

Hm
hi=1

Hm = 1

Ejemplo:
Dadas las edades de 12 estudiantes de la UPeU, construir la tabla de distribucin de frecuencias.
EDAD (X): 19, 20, 23, 20, 18, 20, 25, 18, 18, 20, 25, 23.
Solucin
EDAD
18
19
20
23
25
Total

fi
3
1
4
2
2
12

Fi
3
4
8
10
12

hi
0.25
0.08
0.33
0.17
0.17
1.00

Hi
0.25
0.33
0.66
0.83
1.00

La suma de las frecuencias relativas simples (hi) siempre debe ser igual a uno, en caso de error de
redondeo no diera 1, hay que ajustar, es decir, hay que sumar o restar 1 dgito a cualquier nmero para
conseguir la suma de 1.
f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 4.
30

Mg. Mara Vallejos Atalaya

F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 10.
h3: Indica la fecuencia relativa absoluta simple de la tercera fila y corresponde al nmero 0.33. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza
multiplicando el nmero por 100, as 0.33x100 = 33%.
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.83. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando el nmero por 100, as 0.83x100 = 83%
Interpretacin:
f3: Existen 4 alumnos que tienen 20 aos de edad.
F4: Existen 10 alumnos cuyas edades varan de 18 a 23 aos.
h3: El 33% de los alumnos que tienen 20 aos de edad.
H4: El 83% de los alumnos tienen edades que varan de 18 a 23 aos.
Las frecuencias absolutas interpretan la variable en su fila, en cambio las frecuencias acumuladas
interpretan desde el principio hasta su fila.
Observacin:
Cuando se realiza una observacin en una muestra o en una poblacin, se puede presentar los
siguientes casos:

Que se hayan hecho pocas observaciones y por lo tanto, la variable estadstica tome pocos
valores.
Que se hayan hecho muchas observaciones y sin embargo, la variable estadstica toma muy pocos
valores diferentes.
Que se hayan hecho muchas observaciones y la variable toma muchos valores distintos.

(*) Los dos primeros casos caern dentro del estudio de variable discreta.
(*) El tercer caso se agrupar los valores de la variable en intervalos adecuadamente para no perder
mucha informacin.
2.1.2. Distribucin de frecuencias para datos agrupados
Es una tabla en donde los datos originales se clasifican en intervalos de clase.
Para la elaboracin de esta tabla se debe tener en cuenta las definiciones siguientes:
- Intervalos o lmites de clase: se identifica por tener su lmite superior y su lmite inferior. Los
extremos de los intervalos no se repiten.
Ejemplo:
15-19
20-24
25-29

LCI=15 y LCS=19

- Amplitud intervlica (c): Llamado tambin ancha de clase, es la cantidad de datos que estn
comprendidos en un intervalo de clase.
-

Marca de clase (Xi): Es el punto medio del intervalo de clase:

Xi

LCI LCS
2

31

Mg. Mara Vallejos Atalaya

Ejemplo:
La marca de clase para el primer intervalo ser:

Xi

15 19 17
2

REGLA GENERAL PARA LA CONSTRUCCIN DE UNA DISTRIBUCIN DE FRECUENCIAS DE


UNA VARIABLE CONTINUA AGRUPADA EN INTERVALOS
Dado n valores de una variable cuantitativa X continua, o discreta con ms de 20 valores
distintos, uno de los mtodos para construir la distribucin de frecuencias es:
1) Determinar el Rango: R
El rango de variacin de los datos se define por:

R X mx X mn
2) Determinar el Nmero de intervalos: k
Utilizando la regla de Sturges:

k 1 3.322log(n)

n: Nmero total de datos.


Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor.
Ejemplo:
Si k 6.32 entonces,
Si k 6.84 entonces,

k 7 (Nmero de intervalos igual a 7).


k 7 (Nmero de intervalos igual a 7).

3) Determinar la Amplitud del intervalo: c


La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.

R
k

4) Determinar los extremos de los intervalos


Ejemplo:
Los siguientes datos son puntajes del cociente de inteligencia (CI) de 50 alumnos de la UPeU. Con
base en estos puntajes, preparar la tabla de distribucin de frecuencias.
PUNTAJES DEL COCIENTE DE INTELIGENCIA (CI)
DE 50 ESTUDIANTES DE LA UPeU
91
114
118
119
89
128
114
112
97
106

104
105
100
95
113
107
106
103
104
93

113
101
111
106
118
89
105
92
105
89

125
89
125
120
127
122
115
125
95
100

32

101
126
109
129
129
89
98
107
91
115

Mg. Mara Vallejos Atalaya

1) Determinar el Rango: R
El rango de variacin de los datos se define por:

R X mx X mn
2) Determinar el Nmero de intervalos: k
Utilizando la regla de Sturges:

k 1 3.322log(n)
n: Nmero total de datos.
Observacin: El resultado que se obtenga de k ser redondeado al entero inmediato mayor.
Ejemplo:
Si k 6.32 entonces, k 7 (Nmero de intervalos igual a 7).
Si k 6.84 entonces, k 7 (Nmero de intervalos igual a 7).
3) Determinar la Amplitud del intervalo: c
La amplitud del intervalo se obtiene dividiendo el rango entre el nmero de intervalos.

R
k

4) Determinar los extremos de los intervalos

Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmite
de
clase
88 94
94 100
100 106
106 112
112 118
118 124
124 130

Yi

fi

Fi

hi

Hi

91
97
103
109
115
121
127

9
6
11
5
8
3
8
50

9
15
26
31
39
42
50

0.18
0.12
0.22
0.1
0.16
0.06
0.16
1.00

0.18
0.3
0.52
0.62
0.78
0.84
1.00

f3: Indica la frecuencia absoluta simple de la tercera fila y corresponde al nmero 11.
F4: Indica la frecuencia absoluta acumulada de la cuarta fila y corresponde al nmero 31.
h3: Indica la relativa absoluta simple de la tercera fila y corresponde al nmero 0.22. Para interpretar se
debe expresar los valores de las frecuencias relativas en porcentajes y esto se realiza multiplicando
al nmero por 100, as 0.22x100 = 22% .
H4: Indica la frecuencia relativa acumulada de la cuarta fila y corresponde al nmero 0.62. Para
interpretar se debe expresar los valores de las frecuencias relativas en porcentajes y esto se
realiza multiplicando al nmero por 100, as 0.62x100 = 62%
Interpretacin:
f3: Existen 11 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 100 a 106 puntos.

33

Mg. Mara Vallejos Atalaya

F4: Existen 31 estudiantes de la Universidad Peruana Unin que tienen un cociente intelectual que
vara de 106 a 112 puntos
h3: El 20% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
100 a 106 puntos
H4: El 62% de estudiantes de la Universidad Peruana Unin tienen un cociente intelectual que vara de
106 a 112 puntos
Las frecuencias relativas interpretan la variable en su fila, en cambio, las frecuencias acumuladas
interpretan la variable desde el principio hasta su fila.
CUIDADOS EN LA PRESENTACIN DE CUADROS ESTADSTICOS
A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante cuadros.
1. N de cuadro
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos
b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima
c. Cundo fue tomada la informacin?
Ej. ...Enero, 1995
3. Los encabezados: Corresponde a la identificacin de la variable y las frecuencias.
4. Columna matriz: corresponde a las categoras de clasificacin de la variable.
5. Cuerpo del cuadro: Corresponde a la informacin numrica, generalmente frecuencias absolutas y
relativas.
6. Fuente: Sealar el medio de informacin que condujo al conjunto de datos.
Ej. Test aplicado por los investigadores
7. Notas: son colocadas para esclarecimiento.
8. Comentarios: sirve para aclarar minucias en relacin a cada celda.
Para nuestro ejemplo visto anteriormente el cuadro ser:

CUADRO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA, 2004
COCIENTE
DE N
INTELIGENCIA
ALUMNOS
88 94
9
94 100
6
100 106
11
106 112
5
112 118
8
118 124
3
124 130
8
TOTAL
50
Fuente: Test aplicado por los investigadores.

DE %
18
12
22
10
16
6
16
100

34

Mg. Mara Vallejos Atalaya

Sesin N 4

REPRESENTACIN DE LA INFORMACIN
4.1. PRESENTACIN DE LA INFORMACIN MEDIANTE GRFICOS
Los grficos ms usados son:
a. Histograma de frecuencias
b. Polgono de frecuencias
c. Polgono de frecuencias acumuladas u ojiva
d. Barras
e. Bastones
f. Sectores
g. Series de tiempo

a. Histograma de frecuencias
Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos de clase,
mediante una serie de intervalos continuos.
Se usa:
Cuando se tiene una variable cuantitativa continua
Se construye:
1. Se coloca los intervalo de clase en el eje horizontal (eje de las abscisas o eje x).
2. Se levanta cada intervalo a la altura de la frecuencia absoluta simple o relativa simple.
Ejemplo:
Considere el ejemplo de tabla de distribucin de frecuencia para datos agrupados del Puntajes del
Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.

35

Mg. Mara Vallejos Atalaya

b. Polgono de frecuencias
Se usa:
Cuando se tiene una variable cuantitativa continua y econmica.
Se construye:
1. Se ubica en el eje x la marca de clase y se considera el punto medio,
2. Se levanta el punto de la marca de clase a la altura de la frecuencia absoluta simple o relativa
simple,
3. Luego de marcar los puntos, unirlos,
4. Finalmente, unir los extremos al eje de las abscisas.

Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
fi
10
9
8

11
8
9

7
3

5
4

3
2
1
x
91

97

103

109

115

121

127

c. Polgono de frecuencias acumuladas u ojivas


Se usa:
Cuando la frecuencia acumulada es de inters.
Se construye:
1. Se ubica en el eje x la marca de clase.
2. Se levanta el punto del extremo superior de cada lmite de intervalo de clase a la altura de la
frecuencia absoluta acumulada o relativa acumulada.
3. Luego de marcar los puntos, unirlos
4. Finalmente, unir los extremos al eje de las abscisas.

Ejemplo:
Considerando el ejemplo de la tabla de distribucin de frecuencias para datos agrupados, en el cual
estudiamos el Puntaje del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU

36

Mg. Mara Vallejos Atalaya

fi
50
50
45
40

42
39

35

31

30
25

26

20
15

15
10
5

9
x
88

94

100

106

112

118

124

130

d. Barras
Se representa mediante una serie de rectngulos separados
Se usa:
Para representar variables cualitativas.
Se construye:
1. Se ubica en el eje x las categoras de la variable, utilizando intervalos y separando
aproximadamente la mitad del intervalo entre una categora y otra.
2. Se levanta cada intervalo de la categora que corresponde a la variable, a la altura de la frecuencia
absoluta simple o relativa,
Ejemplo:
Facultad
1. Ciencias Contables y Administrativas
2. Teologa
3. Ciencias de la Salud
4. Educacin y Ciencias Humanas
5. Ingeniera
Total

N de alumnos
500
200
250
250
300
1500

fi
50
045
040
035

50
0

030
025
020
0
15
0
10
0 50

20
0

25
0

25
0

30
0

e. Bastones
Tiene la forma de alfileres.
Se usa:
37

Mg. Mara Vallejos Atalaya

Para representar una variable cuantitativa discreta.


Se construye:
1. Se ubica en el eje x los valores de la variable, separando equitativamente entre uno y otro valor,
2. Se levanta utilizando una lnea recta para cada valor de la variable, a la altura de la frecuencia
absoluta simple o relativa y se termina con un punto, en forma de alfiler.
Ejemplo:
No de Hijos (xi)
N de familias (fi)

0
3

1
7

2
12

3
20

4
15

5
5

NOTAS

fi

20

20

15

15
12
10

7
5

5
3
1

f. Sectores
Se representa mediante un crculo particionado.
Se usa:
Para representar una variable cualitativa cuyo principal inters es conocer su frecuencia relativa.
Se construye:
1. Se particiona a una circunferencia equitativamente, considerando que sta constituye el 100%,
2. Se efecta la particin, segn la frecuencia relativa simple lo considere y se ubican las categoras
de la variable en cada particin.
Ejemplo:

Rubro
Diezmo
Vivienda
Alimentacin
Vestido
Educacin
Recreacin
Otros
Total

hi %
10
20
30
10
20
5
5
100

VIVIENDA
20%
ALIMENTA
OTROS
CIN
5%
30%
VESTIDO
10%
EDUCACI
N
20%
DIEZMO
10%
RECREAC.
5%

38

Mg. Mara Vallejos Atalaya

g. Series de tiempo
Son curvas idnticas al del polgono de frecuencias pero sus extremos no tocan el eje de las abscisas.
Se usa:
Cuando la variable de inters es el tiempo.
Ejemplo:
N DE ALUMNOS INGRESANTES A LA UPeU DE TRES
COLEGIOS DIFERENTES 1991-1995
AOS
1991
1992
1993
1994
1995

N DE ALUMNOS INGRESANTES
COLEGIO 1 COLEGIO 2 COLEGIO 3
10
20
15
15
25
20
20
20
25
25
25
20
35
25
25

fi
40
35
30
25

COLEGIO 1

20

COLEGIO 2

15

COLEGIO 3

10
5
0
1991

1992

1993

1994

1995

X
AOS

CUIDADOS EN LA PRESENTACIN DE GRFICOS ESTADSTICOS


A continuacin sealamos los elementos necesarios que deben tenerse en cuenta para la presentacin
de informacin estadstica mediante grficos.
1. N de grfico
2. Ttulo: Debe responder las siguientes preguntas:
a. Qu informacin contiene el cuerpo del cuadro?
Ej. Cociente de inteligencia de 50 alumnos
b. Dnde fue tomada la informacin?
Ej. ...en la UPeU Lima
c. Cundo fue tomada la informacin?
Ej. ...Setiembre, 1994
3.
4.
5.
6.

Representacin grfica (sealar escalas).


Leyenda (si fuere necesario).
Fuente.
Nota (en caso de ser necesario).

39

Mg. Mara Vallejos Atalaya

Ejemplo:
La representacin grfica para el ejemplo de datos agrupados de los datos del Puntajes del Cociente
de Inteligencia (CI) de 50 Estudiantes de la UPeU.
GRFICO N 1
COCIENTE INTELECTUAL DE 50 ESTUDIANTES DE LA UNIVERSIDAD PERUANA UNIN - LIMA,
2001

Fuente: Test aplicado por los investigadores.

EJERCICIOS PROPUESTOS
1.

En una encuesta de opinin acerca de las preferencias de una marca de bebida gaseosa por sus
colores: Amarillo (A), Blanco (B), Rojo (R), 20 consumidores dieron las siguientes respuestas:

B, R, R, B, R, A, A, B, B, A
B, A, A, R, B, A, B, R, B, A
a) Construir la distribucin de frecuencias
b) Graficar la distribucin
2.

La tabla muestra la distribucin del ingreso familiar correspondiente a 80 familias:


Ingresos

160 170
170 180
180 190
190 200
200 210

fi

48

Fi

hi

60
0,125
0,075

a) Determinar el nmero de familias que ganan menos de 200 nuevos soles


3.

Para cada uno de los siguientes ejercicios construir:


a) La tabla de distribucin de frecuencias
b) El grfico adecuado
c) Interpretacin
3.1.
730
600

Los siguientes datos proporcionan las remuneraciones de 50 obreros.


470
700

672
650

820
700

670
570

610
850

800
590
40

670
700

Mg. Mara Vallejos Atalaya

570
730
378
730
650

3.2.

151
161
166
167
168
169
170
172
174
176
179
181
187

3.3

730
663
930
640
740

770
569
848
708

580
720
860
461

609
860
748
685

700
766
777
630

574
456
640
720

578
258
560
840

Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en
cm)
152
161
165
167
168
169
170
172
175
177
179
182
188

154
161
166
167
168
169
170
173
175
177
180
182
189

155
162
166
168
168
169
170
173
175
177
180
182
190

159
163
166
168
168
169
171
173
176
177
180
183

159
163
166
168
169
170
171
173
176
178
181
184

160
164
166
168
169
170
171
174
176
178
181
185

161
165
167
168
169
170
172
174
176
178
181
186

El gerente de una compaa registra el nmero de cierto trabajo, completados por los
empleados. Cincuenta empleados realizan el mismo trabajo, divididos en dos grupos de 25
y en salones diferentes.

En el saln A, el gerente registra el siguiente nmero de unidades completadas por da:


21
22
20
15
25
30
28
29
28
30
24
29
27
34
38
24
35
36
31
41
32
43
44
53
50
En el saln B los datos son los siguientes:
16
21
13
36
18
24
16
18
20
28
25
33
30
26
20
35
45
59
31
30
40
30

32
26
32

a) Combinar todos los puntajes y obtener la distribucin de frecuencias con tamao de clase
k=10.
b) Obtener la distribucin de frecuencias por cada saln y realice la grfica adecuada.
4.

Se tiene la siguiente tabla de frecuencias relativas de 300 empleados segn su edad.


EDADES
hi
19-21
0.15
22-24
0.25
25-27
0.40
28-30
0.10
31-33
0.10
a)
b)
c)
d)

80.6
53.2
76.9

Cuntos empleados tienen edades entre 22 y 30 aos?


Qu porcentaje de empleados tienen 25 aos o ms?
Qu porcentaje de empleados tienen 24 aos o menos?
Una empresa que se dedica a preparar dietas, proyecta lanzar al mercado una dieta rigurosa.
Los empleados de una compaa se presentaron como voluntarios para dicha promocin. Se
realiz un muestreo con 80 empleados elegidos aleatoriamente. Los resultados del chequeo
de los pesos (en Kg), fueron los siguientes:
65.8
60.2
77.4

49.6
91.2
67.9

79.1
74.8
63.7

84.4
78.6
49.9

66.2
81.4
46.4

79.3
58.6
68.8

59.4
68.2
67.3

72.9 73.6
67.4 55.6
72.3 75.8
41

Mg. Mara Vallejos Atalaya

88.3
75.6
65.2
54.2
80.2

94.6
41.8
62.1
75.3
60.2

57.3
73.6
44.8
50.1
71.6

87.3
71.4
82.9
61.1
77.1

74.3
83.2
81.7
42.3
94.9

73.2
67.4
70.4
68.6
61.4

90.4
99.3
74.6
56.2
82.1

76.3
62.3
76.9
70.8
78.3

52.7
89.2
85.7
47.3
51.2

71.7
86.8
40.9
66.9
79.3

a) Elaborar la distribucin de frecuencias


b) Cuntos empleados tienen pesos entre 45 y 60 kg?
c) Qu porcentaje de empleados tienen pesos mayores que 75.5 Kg?

42

Mg. Mara Vallejos Atalaya

Autoevaluacin

CONCEPTUAL
1. Seale con una V si es verdadero o F si es falso en los siguientes enunciados:
a)
b)
c)
d)
e)

(
(
(
(
(

)
)
)
)
)

Una tabla estadstica representa a la informacin en forma organizada.


La marca de clase es el punto medio de los intervalos de clases.
F3 indica la frecuencia acumulada relativa simple de la tercera fila.
La suma de las frecuencias relativas simples debe ser igual a uno.
El histograma de frecuencia se utiliza para una distribucin de frecuencias
agrupadas en intervalos de clase.

PROCEDIMENTAL
2. A continuacin se presentan las notas de 50 alumnos:
60
65
71
47
80

53
41
39
94
94

85
74
35
54
61

77
55
60
98
88

33
57
81
68
41

45
78
76
66
89

52
50
91
48
66

65
35
55
69
73

77
64
73
85
42

84
74
59
67
65

Se pide:
a)
b)
c)
d)

Determinar el rango.
Nmero de clases o filas.
Amplitud de las clases o filas.
Frecuencias absolutas y relativas simples, absolutas y relativas acumuladas.
Interpretar por lo menos 2 de cada fila.

3. Al investigar el nivel socioeconmico en los valores: Bajo (B), medio (M), alto (A), 20
familias dieron las siguientes respuestas:
M, B, B, M, A, B, B, M, M, B, M, B, B, A, M, B, M, A, M, B
Construir la distribucin de frecuencia y trazar su grfica.
4. Dibujar un diagrama de sectores para mostrar los gastos de un hospital de una gran
ciudad, siendo stos los siguientes: 73% en sueldos, honorarios profesionales
mdicos y bonificaciones a los empleados; 13% en suministros, equipo mdico y
quirrgico; 8% en mantenimiento, alimentacin y energa; y 6% en costos
administrativos.
ACTITUDINAL
5. Considerando los conocimientos adquiridos en la primera unidad, qu aconsejaras
a un empresario que necesita tomar decisiones acertadas para el buen
funcionamiento de su negocio?

42

Mg. Mara Vallejos Atalaya

UNIDAD II:
MEDIDAS ESTADSTICAS
Sesin N5:
Medidas de resumen
Sesin N6:
Medidas de posicin
Sesin N7:
Medidas de dispersin
Sesin N8:
Medidas de forma

43

Mg. Mara Vallejos Atalaya

COMPETENCIAS

CONCEPTUAL

PROCEDIMENTAL

ACTITUDINAL

Reconoce los conceptos


de las medidas de
resumen, como las de
tendencia central, de
posicin, de dispersin y
de forma, de una serie
de datos.

Calcular las diversas


medidas de resumen
para una serie de datos.

Identifican y reconocen
qu medidas de resumen
son adecuadas para el
anlisis de una serie de
datos.

44

Mg. Mara Vallejos Atalaya

Sesin N 5

MEDIDAS DE RESUMEN
5.1. Anlisis e interpretacin de los resultados
Se estudi los cuadros y grficos estadsticos en la unidad anterior como formas para ordenar y
describir un conjunto de datos para tomar decisiones. Sin embargo, el anlisis resulta incompleto, para
esto se utiliza ciertos indicadores.
Estos indicadores llamados medidas de resumen o ESTADGRAFOS permiten hallar un solo valor
numrico, el mismo que representa a toda la poblacin o muestra en estudio.
Los estadgrafos o medidas de resumen ms importante son:
De tendencia central: media, mediana y la moda.
De posicin: cuartiles, deciles y percentiles.
De dispersin: varianza, desviacin estndar, y coeficiente de variacin.
De forma: asimetra y el coeficiente de kurtosis.

5.2. MEDIDAS DE TENDENCIA CENTRAL


Son estadsticos que permiten hallar el valor numrico que indica el "centro" de un conjunto de datos;
sealando la caracterstica que destaca en la informacin.
5.2.1. La media o promedio aritmtico ( x )
Es la ms estable y se obtiene de acuerdo a lo siguiente:
a) Media aritmtica para datos simples (en serie):
Proceso: Sumar todos los valores de la variable y dividir entre el nmero de datos que se han sumado.
_

x
n

b) Media aritmtica para datos agrupados (en tablas):


Proceso: Sumar todos los valores de la variable o marca de clase multiplicados por la frecuencia
absoluta simple y dividir entre el nmero de datos o la suma de las frecuencias absolutas simples.

xf
f

Ventajas de la media aritmtica:


-

Es til cuando los datos estn distribuidos en forma normal o simtrica.


Es de gran estabilidad porque toma en cuenta todos los datos.
Nos permite probar parmetros en inferencia estadstica.

Desventajas de la media aritmtica:


67

Mg. Mara Vallejos Atalaya

Puede ser afectado por valores extremos.


Cuando los datos agrupados tienen clases abiertas en los extremos, no es recomendable calcular
el promedio.

5.2.2. Mediana (Me)


Es el estadstico que representa el punto medio de los datos en el cual cae el 50% de puntuaciones. Se
obtiene de acuerdo a lo siguiente:
a) Mediana para datos simples (en serie):
Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la serie
es par); del conjunto de datos previamente ordenados en forma creciente.
(*) La mediana se utiliza tambin en variables ordinales
Ej: Se tiene la siguiente informacin sobre el nmero de alumnos repitentes por aos de estudios de la
carrera de contabilidad en la UPeU.
fi 1
25
14
6
9
2
56

AOS
Primero
Segundo
Tercero
Cuarto
Quinto
Total

Fi 2
25
39
45
54
56

Clase
mediana.

Proceso:
1. Se calcula la suma de las frecuencias absolutas simples entre 2 as:

n
=
2

f
2

56
28
2

2. El valor inmediatamente superior o igual a 28 se busca en la columna de la tabla que corresponde


a la frecuencia absoluta acumulada Fi (en este ejemplo corresponde a 39, porque 25 es menor
que 28).
3. Luego se observa la primera columna donde se encuentra la variable, en la fila donde se observ el
nmero 39, el valor de la variable que se encuentra en esa fila corresponde a la mediana.
Me = Segundo.
Interpretacin: La mitad de los estudiantes repitentes lo hacen como mximo hasta segundo ao,
aproximadamente la otra mitad repiten categoras superiores al segundo ao.

b) Mediana para datos agrupados:


Cuando los datos se encuentran agrupados en una tabla de distribucin de frecuencias, la mediana se
encuentra utilizando la siguiente frmula:

Fi 1
2

Me Linf c
fi
Donde
1
2

fi : frecuencia absoluta simple


Fi : frecuencia absoluta acumulada.
68

Mg. Mara Vallejos Atalaya

Linf : Lmite inferior del intervalo que contiene a la mediana


c : Amplitud del intervalo
n : Nmero total de datos
Fi 1 : Frecuencia absoluta acumulada anterior a la clase mediana
f i : Frecuencia (o frecuencia absoluta) de la clase mediana.
n
Lugar de la Mediana, Me :
.
2
Ventajas de la mediana:
-

No est afectada por valores extremos, y por lo tanto es ms representativa que el promedio,
cuando las series son poco simtricas.
Es til cuando los datos agrupados tienen clases abiertas en los extremos (es decir, no tiene lmite
inferior en la primera clase ni lmite superior en la ltima clase).
Se aplica a variables que pertenecen a la escala ordinal.

5.2.3. La moda (Mo)


Nos indica el valor o cualidad que se repite con mayor frecuencia dentro de una informacin. Se
obtiene de acuerdo a lo siguiente:
a) Moda para datos simples (en serie):
Es el valor que ms se repite en una serie.
(*) Es til cuando la variable en estudio pertenece a la escala nominal.
Ejemplo:
Hallar la moda para la siguiente informacin que consiste en una muestra de 100 consumidores segn
preferencia por tipos de panes Unin.
TIPOS
DE
PANES
Integral
Americano
Fibra
Hamburguesa
Total

CONSUMIDORES
(fi)
25
20
40
15
100

Clase modal,
por ser el valor ms frecuente (f =40)

Entonces, la moda ser el valor que corresponde a la categora de la variable, en la clase o fila modal.
Mo = Fibra
Interpretacin:
La mayora de los consumidores de Productos Unin prefiere pan fibra.
b) Moda para datos agrupados:
En este caso la moda se halla mediante la frmula:

Mo Linf c
1 2
Donde
Linf : Lmite inferior del intervalo que contiene a la moda
69

Mg. Mara Vallejos Atalaya

c : Amplitud del intervalo


con
1 fi fi 1

2 fi fi 1

Ventajas de la moda:
-

No est afectada por valores extremos.


Puede usarse cuando los datos agrupados tienen clases abiertas en los extremos.
Se usa para variables que pertenecen a la escala nominal.

Desventajas de la moda:
-

No es representativa a menos que la distribucin contenga un gran nmero de datos y exista


significativa repeticin de alguno de ellos.
Muchas veces la serie no tiene moda porque ningn valor se repite, en ese caso se dice que la
informacin es unimodal.
Cuando la serie tiene 2 modas, se dice que la informacin es bimodal, y si tiene ms de 2 modas,
la informacin es multimodal. En estos casos se hace difcil su interpretacin y comparacin, por lo
tanto, no se considera una medida representativa

Ejemplo:
Correspondiente a datos simple (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad :
Xi: 18,

20,

23,

17,

18,

19,

23, 18

Calcular la media, mediana y moda e interpretar sus resultados.

Solucin:
Media

x 18 20 23 17 18 19 23 18 156 19.5 20
n

Interpretacin
La edad promedio de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
es de 20 aos.
Mediana
Me: Es el valor medio (cuando la serie es impar) o la semisuma de los dos valores medios (cuando la
serie es par); del conjunto de datos previamente ordenados en forma creciente.
En este caso la serie es par, por lo tanto, se procede del siguiente modo:
1 Se ordena la serie
17,
18,
18,
18,
2
17,

19,

20,

23,

23

20,

23,

23

Se particiona la serie por la mitad


18,

18,

18,

19,

70

Mg. Mara Vallejos Atalaya

3 la mediana ser la semisuma de los dos valores centrales, por ser la serie par, es decir 8 datos.

Me

18 19
18.5 19
2

Interpretacin:
La mitad de los de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas
tiene como mximo 19 aos, aproximadamente la otra mitad tienen ms de 19 aos.
Moda
Es el valor que ms se repite.
As, en nuestra base de datos.
1 Se ordena la serie
17,
18,
18,
18,
2

19,

20,

23,

23

Se toma el valor que ms se repite.

En nuestro ejemplo el 18 se repite 3 veces.


Mo = 18

Interpretacin:
La mayora de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas tiene de
20 aos de edad.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la media, mediana y moda para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites
de
clases
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total

Xi

fi

Fi

Xi fi

Xi 2fi

91
97
103
109
115
121
127

9
6
Mo 11
5
8
3
8
50

9
15
Me 26
31
39
42
50

819
582
1133
545
920
363
1016
5378

74529
56454
116699
59405
105800
43923
129032
585842

Solucin:
La columna de las marcas de clase denotada por Xi, se obtiene por la formula dada anteriormente en la
Unidad 1.

71

Mg. Mara Vallejos Atalaya

Xi

LCI LCS
2

88 94
91
2
94 100

97
2
100 106

103
2

X1
X2
X3
.
.

X7

124 130
127
2

La columna de Xi fi : se obtiene multiplicando valor por valor la columna de las marcas de clase
denotada por Xi por las frecuencias absolutas simple denotada por fi:
As:
X1 f1 = 91 x 9 = 819
X2f2 = 97 x 6 = 582
X3 f3 = 103 x 11 = 1133
X7 f7 = 127 x 8 = 1016
Observacin: Las sumas de cada columna se encuentran en la fila que corresponde al total (al final de
las columnas).
La clase mediana se ubica con las frecuencias absolutas acumuladas.
La clase modal se ubica con las frecuencias absolutas simples.
Media:

x f
f
i

819 582 1133 545 920 363 1016


9 6 11 5 8 3 8

5378

107.56 107
50

Interpretacin:
El cociente de inteligencia promedio de los alumnos de la Universidad Peruana Unin es de
aproximadamente 107 puntos.
Mediana:
Proceso:
1. Ubicamos la clase o fila mediana (intervalo que contenga la mediana):
Lugar de Me: n/2= 50/2= 25 (25 avo. lugar)
Analizando, la mediana se encuentra en la 4ta. Clase.
Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 25.
72

Mg. Mara Vallejos Atalaya

En nuestro ejemplo corresponde a la cuarta fila, pues su frecuencia acumulada es F4 = 31 y es el


inmediatamente superior a 25.
La cuarta fila es la clase mediana y de all se considera los datos que van a ser reemplazados en la
frmula.
2. Utilizando la frmula:

Fi 1
2

Me Linf c
fi
Linf : Lmite inferior del intervalo de la clase mediana = 100
n

: Nmero total de datos = 50

Fi-1 : Frecuencia absoluta acumulada anterior a la clase mediana = 15


fi

: Frecuencia absoluta simple de la clase mediana = 11

: Amplitud intervlica: 6

La mediana ser:

50

15
2
= 105.45
Me 100 6
11
Interpretacin:
La mitad de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 105 puntos, aproximadamente la otra mitad tienen ms de 105 puntos.
Moda
Proceso:
1. Se ubica la clase o fila modal (donde se encuentra la moda), ubicando en la columna de las
frecuencias absolutas simples (fi) el mayor valor.
En nuestro ejemplo el mayor valor de las frecuencias absolutas simples es f3 = 11,
En nuestro ejemplo, la clase modal o fila donde se encuentra la moda es la tercera fila porque en
ella se encuentra el mayor valor de las frecuencias absolutas simples.
2. Utilizando la frmula:

Mo Linf c
1 2
hallando:

1 fi fi 1 = 11- 6= 5
2 fi fi 1 = 11-5= 6

73

Mg. Mara Vallejos Atalaya

5
Mo 100 6
= 102.72
56
Interpretacin:
La mayora de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia de
103 puntos.

74

Mg. Mara Vallejos Atalaya

Sesin N 6

MEDIDAS DE POSICIN
6.1. MEDIDAS DE POSICIN
Son estadgrafos que dividen a una serie de datos en cuatro, diez o cien partes iguales.
Estas medidas son:
- Cuartiles
- Deciles
- Percentiles

6.1.1. Cuartiles (Qi )


Son estadgrafos que dividen a la informacin en cuatro partes iguales, donde cada uno de ellos es el
25% de la informacin.
Esquemticamente se tiene:
Q1

25%
25%

Q2

Q3

25%
25%
total

100%

Los cuartiles se calculan con la frmula siguiente:

( j )n

4 Fi 1
Q j Linf c

fi

Donde:
j
: 1,2 3
Linf : Lmite inferior del intervalo de la clase cuartlica.
n
: Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase cuartlica.
fi
: Frecuencia absoluta simple de la clase cuartlica.
c
: Amplitud intervlica.
6.1.2. Deciles (Di )
Son estadgrafos que dividen a la informacin en diez partes iguales, donde cada uno de ellos es el
10% de la informacin.
75

Mg. Mara Vallejos Atalaya

Esquemticamente se tiene:

D1

10%

D2
10%
. . .
10%

D9

10%
Total

100%

Los deciles se calculan con la frmula siguiente:

( j )n

10 Fi 1
D j Linf c

fi

Donde:
j
: 1,2, 3, 9
Linf : Lmite inferior del intervalo de la clase declica.
n
: Nmero total de datos.
Fi-1 : Frecuencia absoluta acumulada anterior a la clase declica.
fi
: Frecuencia absoluta simple de la clase declica.
c
: Amplitud intervlica.

6.1.3. Percentiles (Pi )


Son estadgrafos que dividen a la informacin en cien partes iguales, donde cada uno de ellos es el 1%
de la informacin.
Esquemticamente se tiene:
P1

1%
1%
. . .
1%

P2
P99

1%
total

100%

Los percentiles se calculan con la frmula siguiente:

( j )n

100 Fi 1
Pj Linf c

fi

Donde:

76

Mg. Mara Vallejos Atalaya

j
Linf
n
Fi-1
fi
c

:
:
:
:
:
:

1,2, 3, 99
Lmite inferior del intervalo de la clase percentlica.
Nmero total de datos.
Frecuencia absoluta acumulada anterior a la clase Percentlica.
Frecuencia absoluta simple de la clase percentlica.
Amplitud intervlica.

Observacin:
Generalmente se calculan las medidas de posicin para datos agrupados, pues se tiene una gran
cantidad de informacin.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas)
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos los cuartiles 1 y 3, los deciles 2 y 8 y los percentiles 10 y 90.

Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total

Xi
91
97
103
109
115
121
127

fi
9
6
11
5
8
3
8
50

Fi
9
15
26
31
39
42
50

P10
Q1,D2

Q3,D8
P90

Solucin
Cuartil 1 (Q1)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el primer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.

i f
4

(1)50
12.5
4

2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 12.5.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 12.5.
3. La segunda fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en
la frmula.

( j )n

4 Fi 1
Q j Linf c

fi

77

Mg. Mara Vallejos Atalaya

Linf
n
Fi-1

fi
c

: Lmite inferior del intervalo de la clase cuartlica = 94


: nmero total de datos = 50
: Frecuencia absoluta acumulada anterior a la clase cuartlica = 9
: Frecuencia absoluta simple de la clase cuartlica = 6
: amplitud intervlica: = 6

Cuartil 1 ser:

(1)50

4 9
Q1 94 6
97.5
6

Interpretacin:
El 25% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 98 puntos, aproximadamente el 75% restante tienen ms de 98 puntos.
Cuartil 3 (Q3)
Proceso
1. Se ubica la clase o fila cuartlica (donde se encuentra el tercer cuartil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2 3.

j (n) (3)50

37.5
4
4
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 37.5.
En nuestro ejemplo corresponde a la quinta fila, pues su frecuencia acumulada es F5 = 39 y es el
inmediatamente superior a 37.5.
3. La quinta fila es la clase cuartlica y de all se considera los datos que van a ser reemplazados en la
frmula.
Linf
n
Fi-1

fi
c

:
:
:
:

Lmite inferior del intervalo de la clase cuartlica = 112


nmero total de datos = 50
Frecuencia absoluta acumulada anterior a la clase cuartlica = 31
Frecuencia absoluta simple de la clase cuartlica = 8

: Amplitud intervlica: = 6

El cuartil 3 ser:

(3)(50)

4 31
Q3 112 6
116.87
8

Interpretacin:
El 75% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 117 puntos, aproximadamente el 25% restante tienen ms de 117 puntos.
78

Mg. Mara Vallejos Atalaya

Decil 2 (D2)
Proceso:
1. Se ubica la clase o fila declica (donde se encuentra el segundo decil), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu decil se desea encontrar; ya sea el 1, 2, , 9.

j (n) (2)50

10
10
10
2. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 15.
En nuestro ejemplo corresponde a la segunda fila, pues su frecuencia acumulada es F2 = 15 y es el
inmediatamente superior a 10.
3. La segunda fila es la clase declica y de all se considera los datos que van a ser reemplazados en
la frmula.
Li
n
Fi-1

fi
c

:
:
:
:

Lmite inferior del intervalo de la clase declica = 94


Nmero total de datos = 50
Frecuencia absoluta acumulada anterior a la clase declica = 9
Frecuencia absoluta simple de la clase declica = 6

: Amplitud intervlica: = 6

El decil 2 ser:

(2)(50)

10 9
D2 94 6
95
6

Interpretacin:
El 20% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 95 puntos, aproximadamente el 80% restante tienen ms de 95 puntos.
Percentil 10 (P10)
Proceso
a. Se ubica la clase o fila percentlica (donde se encuentra el percentil 10), utilizando la siguiente
frmula, el valor i, se reemplaza de acuerdo a qu cuartil se desea encontrar; ya sea el 1, 2, ,
99.

j (n) (10)50

5
100
100
b. Este valor se ubica en la columna de las frecuencias acumuladas (Fi) correspondiente a la tabla de
datos, considerando el inmediatamente mayor o igual a 5.
En nuestro ejemplo corresponde a la primera fila, pues su frecuencia acumulada es F2 = 9 y es el
inmediatamente superior a 5.
c.

La primera fila es la clase percentlica y de all se considera los datos que van a ser remplazados
79

Mg. Mara Vallejos Atalaya

en la frmula.

Li
n
Fi-1

fi
c

: Lmite inferior del intervalo de la clase percentlica = 88


: Nmero total de datos = 50
: Frecuencia absoluta acumulada anterior a la clase Percentlica = 0
: Frecuencia absoluta simple de la clase percentlica = 9
: Amplitud intervlica: = 6

El percentil 10 ser:

(10)(50)

100 0
P10 88 6
91.3
9

Interpretacin:
El 10% de los estudiantes de la Universidad Peruana Unin tiene un coeficiente de inteligencia
mximo de 91.3 puntos, aproximadamente el 90% restante tienen ms de 91.3 puntos.

EJERCICIOS PROPUESTOS
1)

Los datos siguientes corresponden al peso en Kg. de 10 alumnos.


40.8
52.5
49.2
40.8
62.2
52.5
58.0
60.0
40.8
52.5
Calcular:
a) La media, la mediana y la moda.
b) Cul de los 3 indicadores (en (a)) miden con mayor precisin el centro de los datos?

2)

El nmero de autos vendidos por cada uno de 10 vendedores de una distribuidora de


automviles en un mes particular, dispuestos en orden ascendente es: 2, 4, 7, 10, 10, 10,
12, 12, 14, 15.
Determine e interprete:
a) La media

b) La mediana

c) La moda

3)

La media mnima para aprobar una asignatura es 11. Si un estudiante obtiene la notas 13.5, 14,
9.5, 12, 8.5, 8, 11.5, 10 en los trabajos mensuales de la asignatura en cuestin, el estudiante
fue aprobado?

4)

A Continuacin se dan las notas de 50 alumnos.


60
77
71
64
80
73
41
85
94
42

85
84
35
74
61
59
55
67
98
65

33
65
81
47
41
53
78
39
66
94

52
74
50
54
91
77
48
60
66
88

65
57
35
68
55
45
69
76
73
89

Se pide:

80

Mg. Mara Vallejos Atalaya

a) Obtener la distribucin de frecuencias


b) Determinar: la media, mediana y moda
c) Determinar el 3er cuartil, 7mo decil y 55avo percentil.
5)

A continuacin tenemos la distribucin del nmero de accidentes por da durante 43 das, en


cierta autopista.
N de accidentes 0
N de das
10

1
15

2
10

3
5

4
3

a) Determinar: la media, mediana y moda


b) Cul es el porcentaje de das en que se tuvo dos o ms accidentes por da?

6)

Considere los datos obtenidos por las medidas de las alturas de 100 individuos (dados en cm)
151
152
154
155
159
159
160
161
161
161
161
162
163
163
164
165
166
165
166
166
166
166
166
167
167
167
167
168
168
168
168
168
168
168
168
168
168
169
169
169
169
169
169
169
169
170
170
170
170
170
170
170
171
171
171
172
172
172
173
173
173
173
174
174
174
175
175
175
176
176
176
176
176
177
177
177
177
178
178
178
179
179
180
180
180
181
181
181
181
182
182
182
183
184
185
186
187
188
189
190
Calcular las medidas de tendencia central, posicin, dispersin y de forma. Interpretar los
resultados.

7)

Obtenga la media y la mediana para cada uno de los siguientes conjuntos de nmeros:
1) 1, 5, 9, 13, 17 2) 1, 3, 9, 27, 81 3) 1, 4, 9, 16, 25
a)
b)
c)

8)

Para cul de estos conjuntos de datos son iguales la media y la mediana?


Cul medida es la misma para los 3 conjuntos?
Cul de estos conjuntos tiene una moda?

Los siguientes datos representan el nmero de obreros ausentes en cierta empresa


manufacturera, en 10 das consecutivos de trabajo:
5, 3, 0, 4, 3, 1, 4, 2, 20, 0
a) Encontrar la media, la mediana y la moda.
b) Interpretar sus resultados.

9)

El siguiente cuadro muestra la distribucin de edades de casos de una cierta enfermedad


reportada durante un ao en una ciudad del estado.

Total

EDAD

Nmero de casos

5
15
25
35
45
55

5
10
20
22
13
5

14
24
34
44
54
64
75

a) Determinar e interpretar las medidas de tendencia central: media, mediana, moda.


b) Determinar e interpretar las medidas de Posicin: Cuartiles (Q1 y Q3) Deciles (D3 y D4) y
Percentil (P14 y P94).

81

Mg. Mara Vallejos Atalaya

10)

En la tabla siguiente se muestra los puntajes obtenidos por 36 alumnos en una prueba de
razonamiento matemtico:
Yi-1 - Yi

fi

hi

Fi

Hi

Yi
42 - 51
51 - 60
60 - 69
69 - 78
78 87
87 - 96

11
10
2
5
3
5

0.35
0.28
0.055
0.14
0.08
0.14

a) Calcular la media aritmtica, mediana y moda e interprete los datos


b) Calcular Q1, P90, D9 e interprete
c) Graficar el histograma y polgono de frecuencia

82

Mg. Mara Vallejos Atalaya

Autoevaluacin
CONCEPTUAL
1.

Seale con una V si es verdadero o F si es falso en los siguientes


enunciados:
a) (
b) (
c) (
d) (
e) (

)
)
)
)
)

La mediana es una medida de tendencia central.


La moda indica el valor que se repite con mayor frecuencia.
Los cuartiles dividen a la informacin en 10 partes iguales.
La media se calcula sumando todos los valores de la variable.
Los percentiles dividen la informacin en cien partes iguales.

PROCEDIMENTAL
2.

Establezca las diferencias entre las medidas de tendencia central: media,


mediana y moda.

3.

El nmero de autos vendidos por cada uno de 10 vendedores de una


distribuidora de automviles en un mes particular, dispuestos en orden
ascendente es: 2, 4, 7, 10, 10, 10, 12, 12, 14, 15.
Determine e interprete:
a) La media

4.

b) La mediana

c) La moda

La siguiente tabla muestra la distribucin de edades de casos de una cierta


enfermedad informados durante un ao en una provincia.
Edad
[5 - 15>
[15 - 25>
[25 - 35>
[35 - 45>
[45 - 55>
[55 - 65>
total

Nmero de casos
5
10
20
22
13
5
75

a) Calcular la media, la mediana, la moda. Interprete.


b) Calcular el Q1, Q3, D2, D5, P8, P10
ACTITUDINAL
5.

Para conocer la edad ms frecuente de tus compaeros de clase, qu


medida de tendencia central utilizaras?, qu procedimiento efectuaras
para su clculo? y cmo ensearas a tus subordinados para conocer la
edad ms frecuente de los que siempre llegan tarde?

83

Mg. Mara Vallejos Atalaya

Sesin N 7

MEDIDAS DE DISPERSIN
7.1. Medidas de dispersin
Son estadgrafos que cuantifican el grado de concentracin o de dispersin de los valores de la
variable en torno a un promedio o valor central de la distribucin. Las medidas de dispersin se
necesitan para dos propsitos bsicos:
a) Para verificar la confiabilidad de los promedios y
b) Para que sirva como base para el control de la variacin de la misma.
Las principales medidas de dispersin o variabilidad son:
- Varianza
- Desviacin estndar
- Coeficiente de variacin
7.1.1. Varianza (s2 )
Es una medida que cuantifica el grado de dispersin o de variacin de los valores de una variable
cuantitativa con respecto a su media aritmtica.
Es el promedio de la suma de los cuadrados de las desviaciones de la variable respecto a su media.
Cuando el resultado de la varianza es un valor grande, se dice que los datos se encuentran bastantes
dispersos o alejados de la media aritmtica; si el resultado es bastante pequeo los datos estarn
bastante cercanos o concentrados alrededor de la media aritmtica.
Se obtiene de acuerdo a lo siguiente:
a) Varianza para datos simples (en serie):

n( x ) 2

n 1

Donde:

Cada valor de la muestra se eleva al cuadrado luego se suma todos los valores.

=
=

Tamao de la muestra. (nmero de datos).


Media para datos simples.

b) Varianza para datos agrupados:

f n(Y )2
n 1

Donde:

Y
n

f = Cada marca de clase elevado al cuadrado y multiplicado por su frecuencia absoluta simple,
=

luego se suman todos los valores.


Tamao de la muestra.
84

Mg. Mara Vallejos Atalaya

= Media para datos agrupados.


Y
Observacin: La varianza es una medida terica; no tiene interpretacin prctica.
7.1.2. Desviacin estndar (s )
Es la raz cuadrada de la varianza. Esta medida tiene interpretacin prctica.

s s2
Es uno de los estadsticos de mayor uso en el cual las unidades de la variable ya no estn elevados al
cuadrado sino estn en unidades originales.
7.1.3. Coeficiente de variacin (c.v. % )
Es el cociente de la desviacin estndar y la media aritmtica, expresado en porcentaje. As:

s
cv % .100
x
-

El coeficiente de variacin se usa para saber si un conjunto de datos es homogneo o heterogneo


(concentrados o dispersos). Para esto se utiliza el siguiente criterio:
Si C.V. < 0.33
Si C.V. 0.33

Datos HOMOGNEOS
Datos HETEROGNEOS

El coeficiente de variacin tambin se utiliza para comparar la variabilidad de 2 ms series de


datos que tengan unidades de medidas diferentes (por ejemplo, peso en kgs. y edad en aos).

Si C.V.A < C.V.B

Los datos de la serie A presentan una menor


datos de la serie B

variabilidad con respecto a los

Ejemplo:
Correspondiente a datos simples (informacin en serie):
Los datos presentados corresponden a las edades de 8 alumnos del 1er ao de la Facultad de
Ciencias Contables y Administrativas:
Edad:
Xi: 18, 20,

23, 17, 18, 19,

23, 18

Calcular la varianza, desviacin estndar y coeficiente de variacin e interpretar sus resultados.

Solucin:
La varianza (s2) :
Proceso:

x 18 20 23 17 18 19 23 18 156 19.5
n

182 202 232 172 182 192 232 182 3080

n = 8, pues hay 8 datos.


85

Mg. Mara Vallejos Atalaya

Entonces, la varianza es:

s2

n( x ) 2

n 1

3080 8(19.5) 2
5.43
8 1

No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.

La desviacin estndar (s):

s s 2 5.43 2.33 2
Interpretacin:
Las edades de los alumnos del 1er ao de la Facultad de Ciencias Contables y Administrativas se
dispersan respecto al valor central en aproximadamente 2 aos.
El coeficiente de variacin (cv%):

cv%

s
2.33
.100
.100 11.95% 12%
x
19.5

Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la UPeU.
Hallaremos la varianza, desviacin estndar y coeficiente de variacin para datos agrupados.

Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES DEL CI DE 50 ESTUDIANTES DE LA
UPeU
Lmites
de
clases
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total

Xi

fi

Fi

91
97
103
109
115
121
127

9
6

9
15
11

5
8
3
8
50

Xi fi

819
582
26 1133
31 545
39
920
42
363
50
1016
5378

Xi 2fi
74529
56454
116699
59405
105800
43923
129032
585842

Solucin:
La varianza (s2) :
Proceso:
86

Mg. Mara Vallejos Atalaya

Media

x f
f

819 582 1133 545 920 363 1016


9 6 11 5 8 3 8

5378
107.56 107
50

f 912 (9) 97 2 (6) 1032 (11) 1092 (5) 1152 (8)

1212 (3) 127 2 (8) 585842


Entonces, la varianza es:

f n( x ) 2
n 1

585842-50(107.56) 2
150.70
50 1

No tiene interpretacin prctica, slo se calcula para poder determinar la desviacin estndar.

La desviacin estndar (s):

s s 2 150.70 12.27
Interpretacin:
El cociente de inteligencia de los alumnos de la Universidad Peruana Unin se dispersa respecto al
valor central en aproximadamente 13 puntos.
El coeficiente de variacin (cv%):

cv%

s
12.27
.100
.100 11.40% 12%
x
107.56

Interpretacin:
Como cv% es menor que el 30%, entonces, la media es una medida representativa del conjunto de
datos.

87

Mg. Mara Vallejos Atalaya

Sesin N 8

MEDIDAS DE FORMA
8.1. Medidas de forma
Son aquellos que permiten identificar la distribucin de la informacin.
8.1.1. Asimetra (As)
Permite identificar hacia dnde se acumula la informacin. Se obtiene mediante la siguiente frmula:

As
S:

x Mo
s

As

Q3 Q1 2Q2
Q3 Q1

As = 0 La distribucin es simtrica
As > 0 La distribucin es positiva
As < 0 La distribucin es negativa

8.1.2. Coeficiente de Kurtosis o apuntamiento (K)


Indica el grado de aplastamiento que tiene la distribucin. De acuerdo a ello se clasifican en:
distribuciones platicrticas (Fig.1), mesocrticas (Fig.2) y leptocrticas (Fig.3).

PLATICRTICA
Fig.1

MESOCRTICA
Fig.2

LEPTOCRTICA
Fig.3

Para el grado de apuntamiento (deformacin vertical) utilizaremos el coeficiente denotado por:

Q3 Q1
2( P90 P10 )

Donde:

P90 = percentil 90;

Q1 = primer cuartil
88

Mg. Mara Vallejos Atalaya

P10 = percentil 10;

Q3 = tercer cuartil

Si k = 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es mesocrtica


(tiene igual apuntamiento que la normal o campana de Gauss).
si k < 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es platicrtica.
si k > 0,263, diremos que la curva correspondiente a la distribucin de frecuencias es leptocrtica.
Ejemplo:
Correspondiente a datos agrupados (informacin en tablas):
Considerando el ejemplo de distribucin de frecuencias para datos agrupados, en el cual estudiamos el
cociente intelectual de 50 alumnos. [Puntajes del Cociente de Inteligencia (CI) de 50 Estudiantes de la
UPeU].
Hallaremos la asimetra y el coeficiente de Kurtosis para datos agrupados.
Tabla N 1
DISTRIBUCIN DE FRECUENCIAS DE LOS PUNTAJES
DEL CI DE 50 ESTUDIANTES DE LA UPeU
Intervalo de clase
[88 94>
[94 100>
[100 106>
[106 112>
[112 118>
[118 124>
[124 130>
Total

Xi
91
97
103
109
115
121
127

fi
9
6
11
5
8
3
8

Fi
9
15
26
31
39
42
50

P10
Q1,D2
Q2
Q3
D8
P90

50

Solucin
La Asimetra (As):
Proceso:
Calcular los cuartiles 1, 2 y 3, como se hizo en el ejemplo de las medidas de posicin.

(1)50

4 9
Q1 94 6
97.5
6

(2)(50)

4 15
Q2 100 6
105.45
11

89

Mg. Mara Vallejos Atalaya

(3)(50)

4 31
Q3 112 6
116.87
8

Reemplazar en la frmula de la asimetra, entonces, la Asimetra es:

As

Q3 Q1 2Q2 116.87 97.5 2(105.45)

0.17
Q3 Q1
116.87 97.5

Interpretacin:
Como la asimetra tiende a cero, la informacin es simtrica.
El coeficiente de Kurtosis (k):
Proceso:
Calcular los cuartiles 1 y 3 y los percentiles 10 y 90, como se hizo en el ejemplo de las medidas de
posicin

(1)50

4 9
Q1 94 6
97.5
6

(3)(50)

4 31
Q3 112 6
116.87
8

(10)(50)

100 0
P10 88 6
91.3
9

(90)(50)

100 42
P90 124 6
126.25
8

Reemplazar en la frmula de la asimetra, entonces el coeficiente de Kurtosis es:

Q3 Q1
116.87 97.5

0.27
2( P90 P10 ) 2(126.25 91.3)

Interpretacin
Como k es igual 0.27 y este nmero es mayor que 0.263, entonces, la informacin es leptocrtica.

90

Mg. Mara Vallejos Atalaya

EJERCICIOS PROPUESTOS
1)

Analizar comparativamente la distribucin de los sueldos de los 45 trabajadores de la empresa


metal mecnica.
s
Directivos
70
Empleados 60
Obreros
90

C.V

C.V%

700
300
250

0,10
0,20
0,36

10%
20%
36%

2)

En una empresa, el salario medio de los hombres es de S/. 4000 con una desviacin estndar de
s/. 1500 y el de las mujeres es un promedio de s/. 3000 con desviacin estndar de s/. 1200.
Hallar el Coeficiente de Variacin de los salarios de los hombres y mujeres. Interprete.

3)

Determinar cul de las dos distribuciones A y B, tiene un mayor grado de dispersin


DISTRIBUCIN A
yj-1
nj

yj

(0-2
4

(2-4
6

(4-6
5

(6-8
3

(8-12
12

(12-16
14

(16-20
20

DISTRIBUCION B
yj-1
nj

4)

yj

(4-8
10

(20-24
21

Una prueba de conocimiento, A, se calific sobre 20 puntos dando una media de 12 y una
desviacin estndar de 2 puntos. Mientras que una prueba de aptitud, B, se calific sobre 100
puntos, dando una media de 70 y una desviacin estndar de 5.
a) En cul de las dos pruebas los puntajes son ms homogneos?
b) Si Juan tiene 14 en A y Luis 73 en B, quin tiene mejor puntuacin estndar.

5)

Multiplicando por 2 cada uno de los valores de la variable X: 3, 2, 0, 5, se obtiene la serie y: 6,


4, 0, 10. Comprobar que ambas series tienen el mismo coeficiente de variacin.

6)

Se toman las medidas de 80 personas, las que tiene estatura media de 1,70mt. y desviacin
estndar de 3.4cm. Posteriormente se verific que la medida usada en la medicin tena 4 cm.
menos. Rectifique los estadgrafos mencionados.

7)

Conteste lo siguiente:
a) Si la varianza de una distribucin de edades es 19.9809, entonces la desviacin estndar de
dicha distribucin es:
a1) 399.23636
a2) 9.99045
a3) 19.9809
a4) 4.47
b) Calcular el C.V. de: y=5x + 4 sabiendo x =240, V(x)=64
b1) 4.0%
b2) 3.2%
b3) 5.1%
b4) 3.0%

8)

Si la nota promedio en el curso de matemtica Bsica de la seccin A es 12 puntos y la


desviacin estndar es de 3 puntos y en la seccin B se tiene una nota promedio de 12 punto y
una desviacin estndar de 4 puntos podemos afirmar que:
a) La seccin B tiene mejor promedio
b) La seccin A tiene mejor promedio
c) Las notas de la seccin A son ms homogneas
d) Las notas de la seccin B son ms homogneas

91

Mg. Mara Vallejos Atalaya

Autoevaluacin
CONCEPTUAL
1.

Seale con una V si es verdadero o F si es falso en los siguientes


enunciados:
a) (
b) (
c) (
d) (

) La asimetra es una medida de forma.


) El C.V. permite determinar si la informacin es homognea.
) Kurtosis indica el grado de aplastamiento que tiene la
distribucin.
) La varianza no tiene interpretacin prctica.

PROCEDIMENTAL
2.

Un alumno obtuvo como promedio en estadstica 68.70 puntos con una


desviacin estndar de 15.40, y otro alumno obtuvo 50.90 puntos con
una desviacin estndar de 19.60. Diga Ud. cul de los dos alumnos
tiene un rendimiento homogneo.

3.

En la siguiente tabla se presenta la distribucin de los salarios en


dlares. De 50 trabajadores de una empresa. La longitud de los
intervalos de clase es constante e igual a 20.
( yj-1 - yj ]

yj

Nj

nj

23

yjnj
300
400
350

17
( 100 - 120]

440
50

a) Completar la tabla de distribucin de frecuencia y los datos que faltan


b) Determine la varianza, la desviacin estndar, el coeficiente de variacin
4.

Los siguientes datos muestran los calificativos de 20 personas


sometidos a una prueba de aptitud. Los 20 estudiantes fueron divididos
en dos grupos, al grupo 1 se calific de 0 a 100 y al grupo 2 se calific
de 0 a 20:

Grupo 1: 86, 81, 79, 73, 95, 86, 94, 90, 86, 88
Grupo 2: 16, 19, 13, 20, 14, 16, 19, 18, 17, 15
a) Calcule la media y la desviacin en cada grupo, cul de los grupos
es ms homogneo?
ACTITUDINAL

92

Mg. Mara Vallejos Atalaya

5.

En una empresa deseas saber cmo estn dispersos los valores de las
edades, con respecto a la media aritmtica, de todos los trabajadores,
qu medida de resumen utilizaras y porqu?

93

Mg. Mara Vallejos Atalaya

94

Você também pode gostar