Você está na página 1de 206

MA460

Estadstica Descriptiva
Cuaderno de trabajo

Las profesoras y los profesores del curso


rea de Ciencias

Contenido
Unidad 1 Organizacin de datos.................................................................................................... 7
Definicin de Estadstica ........................................................................................................... 9
Definiciones ........................................................................................................................... 10
Unidad elemental, variables y observacin ................................................................................................. 10
Dato .............................................................................................................................................................. 10
Poblacin y muestra ..................................................................................................................................... 11
Escalas de medicin de las variables ............................................................................................................ 13
Tipos de variables segn su naturaleza ........................................................................................................ 15
Parmetro y estadstico ................................................................................................................................ 16
Estudios estadsticos .................................................................................................................................... 17
Errores en la adquisicin de datos ............................................................................................................... 18
Fuentes de datos .......................................................................................................................................... 18

Estadstica Descriptiva ............................................................................................................ 19


Frecuencias absolutas, relativas y porcentuales .......................................................................................... 19
Distribucin de frecuencias .......................................................................................................................... 19
Elementos de un cuadro estadstico ............................................................................................................ 20

Distribucin de frecuencias de variables cualitativas................................................................ 21


Grficos estadsticos ............................................................................................................... 22
Recomendaciones sobre la presentacin de grficos .................................................................................. 22
Grfico de barras .......................................................................................................................................... 24
Diagrama circular ......................................................................................................................................... 24
Frecuencias acumuladas, absolutas relativas y porcentuales ...................................................................... 25
Diagrama de Pareto ...................................................................................................................................... 26

Tabulaciones cruzadas ............................................................................................................ 29


Grfico de barras agrupadas ........................................................................................................................ 29
Grfico de barras apiladas ............................................................................................................................ 30
Grfico de barras apiladas al 100% .............................................................................................................. 30

Resumen de datos cuantitativos ............................................................................................. 33


Distribucin de frecuencias de variables discretas ...................................................................................... 33
Grfico de bastones...................................................................................................................................... 33
Distribucin de frecuencias de variables continuas ..................................................................................... 35

Grficos de datos cuantitativos ............................................................................................... 42


Distribuciones acumuladas........................................................................................................................... 44
Ejercicios adicionales de la Unidad 1 ............................................................................................................ 46

Unidad 2 Medidas descriptivas ................................................................................................... 53


Datos simples y datos agrupados ................................................................................................................. 54

Medidas de tendencia central ................................................................................................. 55


Media ........................................................................................................................................................... 55
Mediana ....................................................................................................................................................... 59
Moda ............................................................................................................................................................ 62
Media ponderada ......................................................................................................................................... 66

Cuantiles ................................................................................................................................ 67
Deciles .......................................................................................................................................................... 67
Percentil ....................................................................................................................................................... 68

Medidas de variabilidad.......................................................................................................... 72
Varianza ........................................................................................................................................................ 73
Desviacin estndar ..................................................................................................................................... 73
Coeficiente de variacin ............................................................................................................................... 75
Rango............................................................................................................................................................ 77

Rango intercuartil ......................................................................................................................................... 77

Medidas de asimetra ............................................................................................................. 79


Coeficiente de asimetra de Pearson ............................................................................................................ 79

Diagrama de cajas................................................................................................................... 80
Ejercicios de la Unidad 2............................................................................................................................... 83

Unidad 3 Unidad 3: Teora de la probabilidad .............................................................................. 91


Experimentos, reglas de conteo y asignacin de probabilidades ............................................... 93
Experimento aleatorio .................................................................................................................................. 93
Espacio muestral .......................................................................................................................................... 93
Evento .......................................................................................................................................................... 93
Probabilidad de un evento ........................................................................................................................... 94
Definicin clsica de la probabilidad de un evento ...................................................................................... 96
Algunas relaciones bsicas de probabilidad ................................................................................................. 97
Complemento (AC) ........................................................................................................................................ 97
Unin de eventos (A B) ............................................................................................................................. 98
Interseccin de eventos (A B) ................................................................................................................... 98
Diferencia de eventos (A - B) ........................................................................................................................ 98
Diferencia simtrica de eventos (A B) ....................................................................................................... 99
Eventos mutuamente excluyentes ............................................................................................................. 100

Reglas de conteo y combinaciones .........................................................................................100


Axiomas de la probabilidad ........................................................................................................................ 101
Ley aditiva para eventos cualesquiera ....................................................................................................... 102

Probabilidad condicional........................................................................................................103
Ley multiplicativa para eventos cualesquiera ............................................................................................ 108
rbol de probabilidades ............................................................................................................................. 108
Particin del espacio muestral ................................................................................................................... 109
Probabilidad total ....................................................................................................................................... 109

Teorema de Bayes .................................................................................................................109


Eventos independientes.........................................................................................................113
Ley de la multiplicacin para eventos independientes .............................................................................. 113
Ejercicios de la Unidad 3............................................................................................................................. 115

Unidad 4 : Variables aleatorias ..................................................................................................119


Variable aleatoria ..................................................................................................................121
Rango o recorrido de una variable aleatoria .............................................................................................. 121
Tipos de variable aleatoria ......................................................................................................................... 121
Evento (X = a) ............................................................................................................................................. 121

Variable aleatoria discreta .....................................................................................................122


Distribucin de probabilidad de una variable aleatoria discreta ............................................................... 122
Valor esperado de una variable aleatoria discreta ..................................................................................... 125
Valor esperado de una funcin de variable aleatoria discreta ................................................................... 126
Varianza y desviacin estndar de una variable aleatoria discreta ........................................................... 126

Distribuciones de probabilidad de variables discretas .............................................................131


Distribucin binomial ................................................................................................................................. 131
Distribucin hipergeomtrica ..................................................................................................................... 135
Distribucin de Poisson .............................................................................................................................. 138

Variable aleatoria continua ....................................................................................................142


Funcin de densidad de una variable aleatoria continua .......................................................................... 142
Funcin de distribucin acumulada de probabilidad ................................................................................. 146
Valor esperado de una variable aleatoria continua ................................................................................... 149
Valor esperado de una funcin de variable aleatoria continua ................................................................. 149
Varianza y desviacin estndar de una variable aleatoria continua .......................................................... 150

Distribuciones de probabilidad de variable continua...............................................................151


Distribucin uniforme ................................................................................................................................ 151
Distribucin normal .................................................................................................................................... 154
Distribucin exponencial ............................................................................................................................ 160
Ejercicios de la Unidad 4............................................................................................................................. 162

Unidad 5 : Distribuciones muestrales .........................................................................................167


Propiedad reproductiva de la normal .....................................................................................168
Definiciones ..........................................................................................................................172
Muestreo con y sin reemplazo ................................................................................................................... 172
Poblacin finita e infinita............................................................................................................................ 172

Distribucin muestral de un estadstico ..................................................................................172


Distribucin de la media muestral ..........................................................................................173
Teorema central del lmite .....................................................................................................174
Ejercicios de la Unidad 5............................................................................................................................. 178

Unidad 6 : Muestreo..................................................................................................................181
Definiciones ..........................................................................................................................183
Ventajas y desventajas del muestreo frente al censo ................................................................................ 184

Muestreo probabilstico .........................................................................................................185


Muestreo aleatorio simple .....................................................................................................186
Muestreo sistemtico ............................................................................................................190
Muestreo estratificado ..........................................................................................................195
Tablas estadsticas ...................................................................................................................................... 203
ndice alfabtico ......................................................................................................................................... 205

Unidad 1 Organizacin de datos


Logro de la unidad 1

Al finalizar la unidad 1,
el estudiante interpreta con rigurosidad tablas y grficos,
a partir de datos reales dentro del mbito de su carrera.

Temario
La Estadstica y sus subdivisiones.
Definiciones de poblacin, muestra, variables, clasificacin de variables, parmetros y estadsticos.
La investigacin estadstica. Metodologa.
Mtodos de organizacin y presentacin de datos:
Datos cualitativos
Datos cuantitativos
Tablas de distribucin de frecuencias y representaciones grficas (circular, barras, Pareto)
Tablas de doble entrada

Notas importantes

Estadstica Descriptiva 201602

Unidad 1. Organizacin de Datos

Definicin de Estadstica
Es la ciencia que proporciona un conjunto de mtodos, tcnicas y procedimientos para
recopilar, organizar, presentar y analizar datos con el fin de describirlos o realizar generalizaciones vlidas.

Recoleccin

Organizacin

Presentacin

Anlisis

Subdivisin de la Estadstica
La Estadstica se puede dividir en Estadstica descriptiva y Estadstica inferencial.

Estadstica
descriptiva

Son mtodos y tcnicas de recoleccin, caracterizacin, resumen y


presentacin que permiten describir apropiadamente las caractersticas
de un conjunto de datos.
Comprende el uso de grficos, tablas, diagramas y criterios para el
anlisis.

Estadstica
inferencial

Son mtodos y tcnicas que hacen posible estimar una o ms


caractersticas de una poblacin o tomar decisiones sobre poblacin
basadas en el resultado de muestras.
Estas conclusiones no son totalmente vlidas y tienen cierto margen de
error.

Indique si los siguientes enunciados corresponden al uso de la Estadstica descriptiva o


de la Estadstica inferencial.
En la segunda vuelta de las elecciones 2016, el
50,12% de los votantes lo hizo por Peruanos por el
Kambio.

Descriptiva

Inferencial

En la segunda vuelta de las elecciones 2016, IPSOS, a


boca de urna, afirm que el 50,4% de los votantes lo
hizo por Peruanos por el Kambio.

Descriptiva

Inferencial

Segn el ltimo reporte de LatinFocus, la cotizacin


del dlar llegar a S/ 3.60 al cierre del 2016.

Descriptiva

Inferencial

En una muestra, el 15% de las personas afirmaron


que tenan contratado Netflix

Descriptiva

Inferencial

A nivel mundial, se calcula que la acondroplasia (una


causa del enanismo) tiene una incidencia de alrededor de 1/25.000 nacidos vivos.

Descriptiva

Inferencial

Notas importantes

10

Estadstica Descriptiva 201602

Definiciones
Unidad elemental, variables y observacin
Unidad elemental
es la entidad
acerca de la cual se
rene los datos

Variables son las


caractersticas de
inters de las
unidades
elementales

Observacin es el
conjunto de
mediciones
obtenido de una
unidad elemental
particular

se le pregunta su
gnero y edad.
(Variables)

Ella responde:
Soy mujer y tengo
19 aos
(Observacin)

Ejemplo 1

A una persona
(Unidad
elemental)

Dato
Es el resultado de medir una caracterstica observable de una unidad elemental.

Caso Aerolnea Wayra


Aerolnea Wayra S.A es una empresa peruana de transporte areo con vuelos nacionales
e internacionales, ofrece un servicio alta calidad a sus pasajeros y busca mejorar continuamente la eficiencia de sus operaciones, valorando el empeo diario de su personal.
Actualmente, la flota de la empresa est constituida por cuatro aviones Boeing, que
brindan una gran capacidad de empuje y autonoma. Sus aviones han sido remodelados
en su interior. Juan, gerente de la compaa, desea determinar si las remodelaciones en
la flota han servido para brindar un mejor servicio a los usuarios. Por esta razn, le ha
encargado a su asistente Felipe que realice un estudio.
Indique la unidad elemental en la investigacin que hizo Felipe, dos variables que seguramente pregunt y una posible observacin.
(Unidad elemental)

Notas importantes

(Variables)

(Observacin)

Unidad 1. Organizacin de Datos

11

Poblacin y muestra

Poblacin
Poblacin es el conjunto de todos las
unidades elementales de inters en
determinado estudio.
Es un conjunto de personas, objetos,
conceptos, etc. de los cuales se sacan
conclusiones a partir de una o ms
caractersticas observables de
naturaleza cualitativa o cuantitativa.

Muestra
Muestra es un subconjunto de la poblacin.
Ser representativa si se parece a la
poblacin de la que proviene.

Ejemplo 2
La Secretara Acadmica de una universidad est interesada en realizar un estudio sobre
los motivos por los cuales algunos alumnos del pregrado han decidido dar exmenes de
recuperacin ese ciclo. La universidad cuenta con quince facultades y un total de 7500
alumnos, de los cuales 830 han decidido rendir exmenes de recuperacin ese ciclo. De
la poblacin se va a entrevistar a una muestra aleatoria de 200 alumnos. Defina la poblacin y la muestra
Solucin

Poblacin
Los 830 alumnos que han decidido dar
exmenes de recuperacin ese ciclo.

Muestra
Los 200 alumnos que han decidido dar
exmenes de recuperacin ese ciclo.

El objetivo de una investigacin es estimar el porcentaje de alumnos de la UPC que trabajan. Indique la poblacin y la muestra.

Poblacin
Muestra

......................................................................
...........................................................................................................................................
...........................................................................................................................................

Notas importantes

12

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Actualmente, la flota de la empresa est constituida por aviones Boeing, que brindan
una gran capacidad de empuje y autonoma. Sus aviones han sido remodelados en su interior.
Juan, gerente de la compaa, desea determinar si las remodelaciones en la flota han
servido para que los pasajeros mejoren su percepcin acerca del servicio. Por esta razn,
le ha encargado a su asistente Felipe que realice un estudio. Indique la poblacin y la
muestra de dicha investigacin.

Poblacin
Muestra

......................................................................
...........................................................................................................................................
...........................................................................................................................................

Adems, Juan quiere determinar el porcentaje de pasajeros del ao 2015 que han reclamado ante Indecopi en contra de la aerolnea Wayra, con el fin de ver si es necesario
establecer polticas de mejora. Indique la poblacin y la muestra de dicha investigacin.

Poblacin
Muestra

......................................................................
...........................................................................................................................................
...........................................................................................................................................

Por otro lado, Juan quiere determinar la media del ingreso por vuelo a Cusco de la aerolnea Wayra. Indique la poblacin y la muestra de dicha investigacin.

Poblacin
Muestra

......................................................................
...........................................................................................................................................
...........................................................................................................................................

Notas importantes

Unidad 1. Organizacin de Datos

13

Escalas de medicin de las variables


Son los tipos de valores asignados a las unidades elementales para una variable definida.
La escala de medicin permite determinar la cantidad de informacin que contienen los
datos y el anlisis estadstico ms apropiado.
Escalas de
medicin

Nominal

Nominal

Ordinal

Intervalo

Razn

Notas importantes

Ordinal

Intervalo

Razn

Una variable est medida en escala nominal cuando los datos


son etiquetas que se emplean para definir un atributo del
elemento.

Una variable est medida en escala ordinal cuando los datos son
etiquetas y el orden es significativo.
Se pueden ordenar, de tal manera que puedan expresar grados
de la caracterstica medida.
No tiene sentido medir la distancia entre los valores de la
variable ni realizar operaciones aritmticas con ellos pues no
toman valores numricos especficos ni existe proporcionalidad
entre categoras vecinas.
Una variable est medida en escala de intervalo si los datos
tienen propiedades de datos ordinales y el intervalo entre
observaciones se expresa en trminos de una unidad fija de
medida.
Los datos de intervalo siempre son numricos.
El cero es relativo, es decir, no indica la ausencia de la
caracterstica medida.

Una variable est medida en escala de razn si los datos tienen


todas las propiedades de los datos de intervalo y se puede
realizar cualquier operacin aritmtica (suma, resta,
multiplicacin y divisin) y lgica (comparacin y
ordenamiento).
El cero es absoluto, es decir, indica la ausencia total de la
caracterstica medida.

14

Estadstica Descriptiva 201602

Ejemplo 3

Nominal

Ordinal

Intervalo

Razn

El gnero de las personas


El estado civil de los empleados de una empresa
Las carreras profesionales universitarias

El orden de mrito de los atletas en una competicin


El grado de instruccin de los clientes de un banco

Las escalas de temperatura. Las temperaturas en grados


centgrados 0C, y 20C equivalen a, en grados Fahrenheit, 32F,
y 68F

El sueldo de los empleados de una empresa


El tiempo en terminar un examen

Caso Aerolnea Wayra


Se realiz una encuesta a una muestra de 150 pasajeros de la aerolnea. Algunas de las
variables fueron las siguientes. Indique la escala de medicin de cada variable.
Variable

Peso de un pasajero, en kilogramos


Tipo de boleto (Primera, business,
econmica)

Nmero de dni del pasajero


Opinin respecto al servicio: malo
regular, bueno, muy bueno
Ciudad de destino del viaje
Altura sobre el nivel del mar de la
ciudad de destino del viaje
Nmero de viajes al mes del pasajero en la aerolnea Wayra
Precio del pasaje, en dlares
Nmero de asiento (1A, 1B,)
Gnero de la persona que capitanea un avin
Jerarqua en un avin (primer
piloto, copiloto, jefe de cabina)

Notas importantes

Nominal

Ordinal

Intervalo

Razn

Unidad 1. Organizacin de Datos

15

Tipos de variables segn su naturaleza


Las variables se pueden clasificar en cualitativas o cuantitativas.

Variable

Variable

cualitativa

cuantitativa

Es una variable que


puede ser expresada
en escala nominal u
ordinal.

Es una variable que


puede ser medida en
escala de intervalo o
de razn.

A su vez, la variable
cuantitativa se
clasifica en discreta o
continua.

Variable discreta
Tiene un nmero finito o infinito
numerable de posibles valores; es
decir, que en un intervalo solo
puede tomar ciertos valores.

Variable continua
Tiene un nmero infinito no
numerable de posibles valores; es
decir, que en un intervalo puede
tomar cualquier valor.

Ejemplo 4
Variables

Tipo de variable

Escala de medicin

Marca de computadora personal que utiliza

Cualitativa

Nominal

Tiempo que usa la computadora por semana

Cuantitativa continua

Razn

Nmero de perros en una casa

Cuantitativa discreta

Razn

Nmero de granos de arena en una gran playa

Cuantitativa discreta

Razn

Caso Aerolnea Wayra


Se tienen otras variables como las siguientes. Indique su escala de medicin y tipo.
Variable
Razn de eleccin de la aerolnea Wayra
Tiempo de retraso del ltimo vuelo, en horas.
Nmero de quejas por vuelo
Temperatura en la cabina, en grados Kelvin

Notas importantes

Tipo de variable

Escala de medicin

16

Estadstica Descriptiva 201602

Parmetro y estadstico
Parmetro

Es cualquier resumen de la poblacin.

Estadstico

Es cualquier resumen de la muestra.

Ejemplo 5
En un estudio entre alumnos de la UPC, se registr la edad de todos los alumnos de la
UPC. La media de la edad fue de 19,3 aos. Adems, de una muestra de aleatoria de 300
alumnos se encontr que el 12% trabaja. Indique lo siguiente.
Medida de resumen
Media
Porcentaje

Variable

Valor

Parmetro o estadstico

Edad

19,3 aos

Parmetro

Condicin de trabajo

12%

Estadstico

El objetivo de una investigacin es estimar el sueldo promedio de un obrero en la ciudad


de Lima. En una muestra aleatoria, se encontr una media de 1650 nuevos soles. Indique lo siguiente.
Poblacin: ..
Medida de resumen

Variable

Valor

Parmetro o estadstico

Caso Aerolnea Wayra


En una muestra de 200 vuelos, se determin que el 68% de los vuelos de la aerolnea
Wayra salan a tiempo. Indique lo siguiente.
Medida de resumen

Variable

Valor

Parmetro o estadstico

Usando el registro del aeropuerto Jorge Chvez, se encontr que la media del tiempo de
retraso de todos los vuelos de la aerolnea Wayra fue 25 minutos. Indique lo siguiente.
Medida de resumen

Notas importantes

Variable

Valor

Parmetro o estadstico

Unidad 1. Organizacin de Datos

17

Estudios estadsticos
Los datos se obtienen mediante la realizacin de un estudio estadstico. A esos estudios
se les clasifica como experimentales u observacionales.

Estudio
experimental

En un estudio experimental, se identifican las variables


de inters, las cuales son controladas por el investigador.
Luego, se identifican otras variables que influyan en las
variables de inters.

Estudio
observacional

En un estudio observacional, no se trata de controlar las


variables de inters, ni de influir sobre ellas, por ejemplo,
en una encuesta.

Indique a qu tipo de estudio, experimental u observacional, corresponden los siguientes ejemplos.

Tomado de http://elcomercio.pe/economia/peru/turistas-gastan-nuestra-gastronomia-us350-millones

Actualizado el 27 de julio de 2015 a: 03:54 p.m. Por: AFP

Estudio clnico confirma eficacia de vacuna contra el dengue


La vacuna contra el dengue del laboratorio Sanofi es eficaz en ms de 80% de los afectados de esta infeccin tropical transmitida por el mosquito, segn un nuevo anlisis independiente.

Notas importantes

18

Estadstica Descriptiva 201602

Errores en la adquisicin de datos


Un error en adquisicin de datos se presenta cuando el valor obtenido de los datos no
es igual al valor real que se hubiera obtenido con un procedimiento correcto.
Se debe comprobar la consistencia interna de los datos.
Tambin se analiza la existencia de valores demasiado grandes o demasiado pequeos,
conocidos atpicos, que son datos candidatos a posibles errores.

Fuentes de datos
Fuentes
primarias

Los datos se obtienen por medio de encuestas y


estudios experimentales realizados con el objeto de
recolectar nuevos datos.

Fuentes
secundarias

Los datos se han compilado y estn disponibles para el


anlisis estadstico.

Los siguientes sitios web son ejemplos donde conseguir datos de fuente secundaria.
Fuentes pblicas: bases de datos de ministerios y de oficinas gubernamentales de estadstica, como por ejemplo.
Instituto Nacional de Estadstica e Informtica
Banco Central de Reserva del Per
Ministerio de Salud del Per

www.inei.gob.pe
www.bcrp.gob.pe/
www.minsa.gob.pe

Fuentes privadas: bases de datos de las empresas, bases de datos que se compran a
empresas de estudios de mercado, bases de datos en Internet, como por ejemplo.
Datum Per
Ipsos Apoyo. Opinin y Mercado
Instituto de Opinin Pblica PUCP

www.datum.com.pe/
www.ipsos-apoyo.com.pe/
www.pucp.edu.pe/iop/

Caso Aerolnea Wayra


Luego de la encuesta realizada por Felipe se tiene una base de datos. Parte de los resultados se muestra en la siguiente tabla:
Pasajero Edad

Gnero

Nacionalidad Motivo de viaje

Destino

Nmero de
viajes realizados

Precio
pagado

Queja

20

Peruana

Negocios

Mxico DF

$899,00

Desinformacin

43

Chileno

Turismo

Cuzco

$399,00

Precio

..

Qu podemos hacer para resumir esta informacin?

Notas importantes

Unidad 1. Organizacin de Datos

19

Estadstica Descriptiva
Frecuencias absolutas, relativas y porcentuales

Frecuencia absoluta
(fi)

de una clase es la cantidad de elementos que pertenecen a esa


clase

Frecuencia relativa
(hi)

de una clase es la proporcin de elementos que pertenecen a


esa clase

Frecuencia
porcentual (pi)

de una clase es la frecuencia relativa multiplicada por 100%

Se tiene que:

frecuencia relativahi

frecuencia absoluta fi

nmero de casos
n

frecuencia porcentual pi hi %

frecuencia absoluta
f
100% i 100%
nmero de casos
n

Distribucin de frecuencias
Es un resumen, expresado en un cuadro, de un conjunto de datos que muestra las frecuencias absolutas, relativas y porcentuales en cada una de varias clases que no se traslapan.
Ttulo:
Categoras

Frecuencia absoluta fi

Frecuencia relativa hi

Categora 1

f1

Categora 2

f2

Categora k

fk

hk

f1
n
f
h2 2
n
h1

Frecuencia porcentual pi = hi%

f1
100%
n
f
p2 2 100%
n
p1

fk
n

pk

fk
100%
n

Fuente:
Es usual, usar en estos cuadros la frecuencia relativa en el mbito acadmico y la frecuencia porcentual fuera del mbito acadmico.

Notas importantes

20

Estadstica Descriptiva 201602

Elementos de un cuadro estadstico

Per: Distribucin de vctimas de feminicidio, segn departamento de ocurrencia. 2014


Departamento

Nmero de mujeres fi

Porcentaje de mujeres pi

Lima

29

Arequipa

10

Puno

Cusco

Junn

La Libertad

Ayacucho

Hunuco

Lambayeque

Callao

ncash

Piura

San Martn

Ucayali

Cajamarca

Ica

Loreto

Pasco

Tacna

31,87%
10,99%
7,69%
6,59%
6,59%
5,49%
4,40%
4,40%
4,40%
3,30%
2,20%
2,20%
2,20%
2,20%
1,10%
1,10%
1,10%
1,10%
1,10%

91
Fuente: Ministerio Pblico Per - Observatorio de Criminalidad.

Qu es un feminicidio?

Notas importantes

Unidad 1. Organizacin de Datos

21

Distribucin de frecuencias de variables cualitativas


Ttulo: ..
Categoras

Frecuencia absoluta fi

Frecuencia relativa hi

Categora 1

f1

Categora 2

f2

Categora k

fk

hk

f1
n
f
h2 2
n
h1

fk
n

Fuente:

En los Censos Nacionales 2007 ejecutados por el INEI se pregunt a todos los peruanos
el idioma o lengua con el que aprendi hablar, obtenindose los siguientes resultados.
Per. Distribucin de peruanos segn idioma o lengua con el que aprendi hablar. 2007
Idioma o lengua con que aprendi a hablar

Frecuencia absoluta fi

Castellano
Quechua
Aymar
Otra lengua nativa
Ashninka
Es sordomudo
Idioma extranjero
Total

Frecuencia relativa hi

21 713 165
3 360 331
443 248
174 410
67 724
30 019
21 434
25 810 331

Fuente .

Indique e interprete el valor de f2

Indique e interprete el valor de h2%.

Indique el nmero de peruanos que aprendieron a hablar en castellano.

Indique el porcentaje de peruanos que aprendieron a hablar en aymar.

Notas importantes

0,0068
0,0026
0,0012
0,0008
1,0000

22

Estadstica Descriptiva 201602

Grficos estadsticos
Un grfico puede valer ms que mil palabras,
pero puede tomar muchas palabras para hacerlo
John Wilder Tukey (1915-2000)
Gran estadstico del siglo XX, con gran influencia en la visualizacin de informacin

William Playfair (1759-1823), economista e ingeniero escocs es considerado el pionero


de la estadstica grfica. Fue el creador del grfico circular, de sectores y de barras. Los
principios de su trabajo fueron los siguientes:
El mtodo grfico
es una forma de
simplificar lo
tedioso y lo
complejo

Las personas
ocupadas
necesitan ayuda
visual

Un grfico es ms
accesible que una
tabla

El mtodo grfico
ayuda al cerebro,
ya que permite
entender y
memorizar mejor.

Recomendaciones sobre la presentacin de grficos


Descripcin del diagrama
El ttulo del grfico siempre debe ser
indicado.

En los ejes, siempre se debe indicar


explcitamente las variables que se est
representando y las respectivas unidades.

Las fuentes de donde se obtuvieron los datos que permitieron su construccin, as


como quines o qu entidad elabor el diagrama y cualquier otra informacin se
debe indicar siempre que sea relevante.

Notas importantes

Unidad 1. Organizacin de Datos

23

Eleccin de la base de comparacin

Si se va a representar
grficamente los datos de solo
una muestra, el mismo diagrama
sirve para representar las
frecuencias absolutas y relativas.

Si se va a comparar el comportamiento de una


variable en dos o ms poblaciones distintas, pero
solo se tiene muestras representativas de las
poblaciones, entonces es conveniente usar la
frecuencia relativa.

Si se va a comparar el comportamiento de
una variable en dos o ms poblaciones y se
tiene los datos de las poblaciones, entonces
se puede realizar la comparacin por
separado de las frecuencias absolutas y de
las relativas.

Si bien es totalmente factible comparar


grficamente dos o ms series de datos
que han sido agrupados en intervalos
distintos en amplitud y lmites, es
preferible para facilitar la comparacin
que todas las series de datos utilicen los
mismos intervalos.

Uso adecuado de la escala de los ejes


La escala utilizada en los
ejes debe mantenerse. El
cambio de proporciones
distorsiona el propsito de
usar grficos, el cual
consiste en ver
rpidamente la proporcin
con que se est
distribuyendo la variable.

Si se ha utilizado una escala


especial en alguno de los
ejes del diagrama, por
ejemplo, escala logartmica,
esta se debe indicar.

Debe hacer que los valores


de la variable abarquen
adecuadamente la longitud
de cada eje.

Eliminacin de ruido
Los excesivos adornos y la inclusin de
figuras, muchas veces, en lugar de
aclarar ms los diagramas, terminan
confundiendo o dificultando su rpida
comprensin.

El uso de algunas figuras en lugar de


barras o columnas puede distorsionar
visualmente la real proporcin de las
magnitudes que se estn
representando.

Uso del punto inicial del eje vertical

El punto de inicio del eje vertical debe


empezar con un cero para no
distorsionar la impresin visual respecto
de la magnitud.

Notas importantes

El cambio de punto de inicio distinto de


cero debe estar completamente
justificado.

24

Estadstica Descriptiva 201602

Grfico de barras
Es una forma de representar datos cualitativos resumidos en una distribucin de frecuencias.
En uno de los ejes, se representan las categoras o clases de la variable; para el otro eje,
se puede usar una escala de frecuencias absolutas, relativas o porcentuales. Se traza una
barra sobre cada indicador de clase de una altura proporcional a la frecuencia correspondiente.
Las barras deben estar separadas para enfatizar el hecho de que cada clase es diferente
de otra.

Diagrama circular
Cuando se utiliza el grfico circular, tambin llamado pastel, cada sector circular representa la frecuencia observada de una clase o categora.
El sector circular que representa a una determinada clase de la variable tiene un ngulo
en el centro proporcional a la frecuencia relativa de dicha clase. El ngulo que le corresponde a cada clase se obtiene multiplicando 360 por la respectiva frecuencia relativa.

Notas importantes

Unidad 1. Organizacin de Datos

25

Segn la Oficina Nacional de Procesos Electorales (ONPE) los resultados de la segunda


vuelta en las elecciones presidenciales en el Per fueron los siguientes:
Organizacin poltica

Peruanos por el Kambio

Fuerza Popular

Nmero de votantes

% votos vlidos

8,596,937

50,12

8,555,880

49,88

Realice un grfico circular.

Frecuencias acumuladas, absolutas relativas y porcentuales


Frecuencia
acumulada
absoluta (Fi)

de una clase es la cantidad de elementos que pertenecen


hasta esa clase

Frecuencia
acumulada relativa
(Hi)

de una clase es la proporcin de elementos que pertenecen


hasta esa clase

Frecuencia
acumulada
porcentual (Pi)

de una clase es la frecuencia acumulada relativa


multiplicada por 100%

Se tiene que:

frecuencia relativa acumulada Hi

frecuencia absoluta acumulada Fi

nmero de datos
n

frecuencia porcentual acumulada Pi

Notas importantes

frecuencia absoluta acumulada


F
100% i 100%
nmero de datos
n

26

Estadstica Descriptiva 201602

Diagrama de Pareto
El diagrama de Pareto permite ver que, en muchos casos, pocos factores pueden producir la mayora de las consecuencias, lo que se podra resumir como pocos factores son
vitales y muchos son triviales.
Por ejemplo, en control de calidad, se puede mostrar que la mayora de los defectos
surgen de un nmero pequeo de causas.

Los pasos para realizar un grfico de Pareto son los siguientes:

Construya la distribucin de
frecuencias, ordenando las
categoras en forma descendente
respecto de la frecuencia.

Dibuje dos ejes verticales y uno


horizontal.

En el eje horizontal: marque los


espacios donde estarn dibujadas
las barras para cada una de las
categoras, incluida la categora
Otros.

Notas importantes

La categora Otros es colocada


en la ltima posicin. No importa
cun grande sea.

En el eje vertical derecho, marque


este eje con una escala de 0% a
100%.
En el eje vertical izquierdo, marque
una escala de 0 hasta el nmero
total de observaciones o de 0% a
100%.

Elabore el diagrama de barras y


dibuje la lnea de frecuencias
acumuladas
(Curva de Pareto)

Unidad 1. Organizacin de Datos

27

Ejemplo 6
El gerente de produccin de una empresa, que produce asientos de fibra de vidrio, quiere identificar los problemas ms frecuentes reportados en la fabricacin de este producto, y planear soluciones de acuerdo con la recurrencia del problema. Al extraer una
muestra aleatoria de productos fallados, obtuvo los siguientes resultados:
Distribucin de productos segn problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado
Color inadecuado
Forma no simtrica
Medidas fuera de norma
Superficie rugosa
Bordes afilados
Desprendimiento de capa protectora
Otros

Nmero de ocurrencias (fi)


28
16
50
71
9
12
14

Fuente: Gerencia de Produccin

Elabore el diagrama de Pareto.

Solucin
Lo primero es ordenar los datos en orden descendente a la frecuencia fi. La categora
Otros va al final. Luego, se calcula las frecuencias relativas y las relativas acumuladas.
Distribucin de productos segn problemas reportados de asientos de fibra de vidrio
Tipo de problema reportado
Superficie rugosa
Medidas fuera de norma
Color inadecuado
Forma no simtrica
Desprendimiento de capa protectora
Bordes afilados
Otros

fi
71
50
28
16
12
9
14

hi
0,355
0,250
0,140
0,080
0,060
0,045
0,070

Fi
71
121
149
165
177
186
200

Hi
0,355
0,605
0,745
0,825
0,885
0,930
1,000

Fuente: Gerencia de Produccin

Se puede realizar el grfico usando las frecuencias relativas hi y las frecuencias relativas
acumuladas Hi.
Distribucin de productos segn problemas reportados de asientos de fibra de vidrio

Notas importantes

28

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo: Identificar las principales quejas de los pasajeros sobre el servicio que brinda
la aerolnea.
Teniendo en cuenta la siguiente informacin, elabore el diagrama de Pareto:
Distribucin de pasajeros segn principal queja del servicio de la aerolnea Wayra
Principal queja
Impuntualidad

Nmero de pasajeros
30

La comida no es buena

78

Mala limpieza del avin

Otros

Mucho tiempo en cola en el counter

52

Personal poco amable

Fuente: Wayra S.A

Construya la tabla completa para realizar un diagrama de Pareto.


Distribucin de pasajeros segn principal queja del servicio de la aerolnea Wayra
Principal queja

fi

hi%

Fuente: Wayra S.A

Construya el grfico completo y realice una conclusin al respecto.

Notas importantes

Fi

Hi%

Unidad 1. Organizacin de Datos

29

Tabulaciones cruzadas
Tambin llamadas tablas de contingencia o de doble entrada. Se usan para resumir de
manera simultnea los datos para dos variables.

En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se pregunt a las peruanas de 12 a ms aos por la cantidad de hijos que han
tenido vivos, obtenindose los siguientes resultados.
Per. Distribucin de madres segn edad de la madre y nmero de hijos nacidos vivos
Edad de la madre
Cero hijos
12 aos
298,985
13 aos
284,650
14 aos
285,732
15 aos
283,045
16 aos
247,888
17 aos
231,839
18 aos
216,999
19 aos
193,952
Total 2,043,090

Nmero total de hijos/a que ha tenido nacidos vivos


Un hijo
Dos hijos
Tres hijos Cuatro hijos
Total
1,028
300,013
1,162
285,812
1,638
734
288,104
4,909
994
288,948
12,358
922
576
261,744
24,243
2,280
636
258,998
38,938
5,089
586
481
262,093
52,797
9,273
1,118
496
257,636
137,073
19,292
2,916
977
2,203,348

Fuente: INEI - Censos Nacionales 2007: XI de Poblacin y VI de Vivienda

Rellene los espacios en blanco.


El nmero de peruanas entre 12 y 15 aos que tienen hijos es
El porcentaje de peruanas de 18 o 19 que tienen hijos es ...%

Grfico de barras agrupadas


Un grfico de barras agrupadas muestra todas las series en varias barras por cada categora. El alto de cada barra es proporcional a la frecuencia de cada categora.

Notas importantes

30

Estadstica Descriptiva 201602

Grfico de barras apiladas


Un grfico de barras apiladas muestra todas las series apiladas en una sola barra para
cada categora. El alto de cada barra es proporcional a la frecuencia de cada categora.
Per. Distribucin porcentual de peruanos segn gnero y grado de instruccin

Grfico de barras apiladas al 100%


Un grfico de barras apiladas 100% muestra todas las series apiladas en una sola barra
para cada categora. El alto de cada barra es el mismo para cada categora.

Distribucin porcentual de votantes segn candidato por regin


100%
90%

Porcentaje

80%
70%

No sabe/no contesta

60%

Ninguno, blanco viciado


Otros

50%

Alejandro Toledo

40%

Alan Garca

30%

Csar Acua
Pedro Pablo Kuczynski

20%

Keiko Fujimori
10%
0%
Lima

Norte

Fuente: Per 21 Encuesta nacional


urbano rural de Datum. 7 dic 2015

Notas importantes

Centro

Regin

Sur

Oriente

Unidad 1. Organizacin de Datos

31

Caso Aerolnea Wayra


Objetivo: Identificar el porcentaje de pasajeros que siendo de nacionalidad peruana viajan al extranjero y porcentaje de pasajeros que siendo de nacionalidad extranjera viajan
al interior de nuestro pas.
A continuacin, se muestra la informacin de una tabla de contingencia y un grfico incompleto para las variables lugar de destino y nacionalidad.
Distribucin de pasajeros segn su lugar de destino y nacionalidad
Lugar de destino

Nacionalidad
Peruana
Extranjero

Total

Arequipa

16

Cuzco

15

20

35

Miami

20

10

30

Mxico D.F

22

10

32

Piura

Ro de Janeiro

23

28

90

60

150

Total
Fuente: Wayra S.A

Complete todos los elementos del siguiente grfico.

Distribucin de pasajeros segn su lugar de destino y nacionalidad


18%
16%
14%
12%
10%
8%

Peruano

6%

Extranjero

4%
2%

0%
Arequipa

Notas importantes

Cuzco

Miami

Mxico D.F

Piura

Ro de
Janeiro

32

Estadstica Descriptiva 201602

Complete todos los elementos del siguiente grfico.

100%
17.9%

90%
80%
70%

33.3%

31.3%

50.0%
77.8%

60%
50%

Extranjero

40%

Peruana

30%
20%
10%

0%
Arequipa

Cuzco

Miami

Mxico
D.F

Piura

Ro de
Janeiro

Complete todos los elementos del siguiente grfico.


100%
90%

25.6%

80%
70%

60%

2.2%

Ro de Janeiro

24.4%

Piura
Mxico D.F

50%
40%

Miami

22.2%

Cuzco

30%
20%

Arequipa

16.7%

10%

13.3%

8.9%

0%
Peruana

Extranjero

Usando la informacin pertinente, de respuesta al objetivo propuesto

Notas importantes

Unidad 1. Organizacin de Datos

33

Resumen de datos cuantitativos


Distribucin de frecuencias de variables discretas
Es un resumen de un conjunto de datos que consiste en presentar para cada valor de la
variable el nmero de elementos (frecuencia) que la componen. Es un cuadro que se
calcula de la siguiente manera.
Ttulo: .
Valores de la variable
discreta

Frecuencia
absoluta fi

Frecuencia
relativa hi

x1

f1

x2

f2

xk

fk

hk

f1
n
f
h2 2
n
h1

Frecuencia absolu- Frecuencia relatita acumulada Fi


va acumulada Hi

F1 f1

H1 h1

F2 f2 F1

H2 h2 H1

fk
n

Fk fk Fk 1

Hk hk Hk 1

Fuente: ..

Grfico de bastones
En este caso, la variable se ubica en el eje de las abscisas y las frecuencias, absolutas, relativas o porcentuales, en el eje ordenado.

Distribucin de alumnos de pregrado segn nmero de veces


que postul a la universidad donde estudia
700,000
576,215

Nmero de alumnos

600,000
500,000
400,000
300,000
200,000

119,642
58,315

100,000

18,748 9,908

81

32

22

0
0

Nmero de veces que postul


Fuente: PER, II Censo Nacional Universitario 2010. INEI

Notas importantes

34

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo: Determinar el nmero de viajes ms frecuente realizados por los pasajeros.
Complete los valores de la tabla.
Ttulo:
Nmero de viajes

Nmero de pasajeros

15

pi

Pi

12%

38%

30

6
150
Fuente: .
Realice el grfico de bastones.

Nmero de viajes
Responda al objetivo.

Para Fiestas Patrias, la empresa est dispuesta a realizar una promocin en los pasajes
de su aerolnea siempre y cuando el porcentaje de pasajeros que hayan realizado como
mnimo cuatro viajes supere el 60%. La empresa debe realizar una promocin en los
pasajes para Fiestas Patrias para este grupo de pasajeros?

Notas importantes

Unidad 1. Organizacin de Datos

35

Distribucin de frecuencias de variables continuas


Es un resumen de un conjunto de datos que consiste en presentar para cada categora el
nmero de elementos (frecuencia) que la componen.
Los tres pasos necesarios para definir en una distribucin de frecuencias con datos cuantitativos son los siguientes:

Determine la cantidad

Determine el ancho

Determine los lmites

de clases

de cada clase

de cada clase

Cantidad de clases
Se recomienda usar entre 5 y 20 clases, inclusive.
La idea es emplear suficientes clases para mostrar la variacin de los datos, pero no tantas que varias contendran unos
cuantos elementos.
Para determinar el nmero de clases se usa la regla de Sturges. k=1+3,322 log n. Si la estimacin tiene decimales, se toma el entero ms prximo.

La regla de Sturges la
propuso Herbert
Sturges (1926). La
frmula trata de que
el histograma resultante se aproxime a la
distribucin normal.

Amplitud de cada clase


Se usa el mismo ancho para todas las clases.
Se calcula de la siguiente manera:

Amplitud

rango
k

La amplitud se redondea al nmero inmediato superior de acuerdo con la cantidad de


decimales que tienen los datos o segn la precisin con que se desea trabajar.

Lmites de cada clase


Los lmites de clase se escogen de tal manera que cada valor de dato pertenezca a una
clase y slo a una.
El lmite inferior de clase es el valor mnimo posible de los datos que se asigna a la clase.
El lmite superior de clase es el valor mximo posible de los datos que se asigna a la clase.
La marca de clase es el punto medio de los lmites de cada intervalo.

Notas importantes

36

Estadstica Descriptiva 201602

Ejemplo 7
El jefe de la Oficina de Rentas de una Municipalidad ha realizado un estudio sobre los
impuestos que pagan los vecinos del distrito. La tabla muestra los pagos de impuestos,
en nuevos soles, en el 2014 de 48 viviendas elegidas al azar.

145,1

216,3

252,5

303,6

196,9

234,8

265,2

317,2

206,5

242,9

289,1

331,7

151,0

225,9

257,1

305,8

202,6

238,4

271,0

320,2

208,0

244,0

291,0

344,6

159,0

227,1

259,2

315,4

204,9

239,9

286,7

324,8

208,0

247,7

291,9

346,7

195,6

231,2

262,5

315,5

206,1

241,1

288,1

331,1

209,3

249,5

294,5

351,1

Elabore la tabla de frecuencias para la variable: pago por impuestos municipales ao


2014.

Solucin
El rango r se calcula con:
r = valor mximo valor mnimo = 351,1 145, 1 = 206
Siguiendo la regla de Sturges, el nmero de intervalos es:
k 1 3,322log10 n 1 3,322log10 (48) 6,585 7

El ancho del intervalo es:

r 206

29,429 29,5 (Redondeo por exceso a un decimal)


k
7

Distribucin de frecuencias del pago de impuestos municipales del ao 2014

Pago de impuestos

Marca de clase

fi

hi

Fi

Hi

[145,1 ; 174,6]

159,85

0,0625

0,0625

]174,6 ; 204,1]

189,35

0,0625

0,1250

]204,1 ; 233,6]

218,85

10

0,2084

16

0,3334

]233,6 ; 263,1]

248,35

12

0,2500

28

0,5834

]263,1 ; 292,6]

277,85

0,1458

35

0,7292

]292,6 ; 322,1]

307,35

0,1458

42

0,8750

]322,1 ; 351,6]

336,85

0,1250

48

1,0000

48

1,0000

Total

Notas importantes

Unidad 1. Organizacin de Datos

37

Caso Aerolnea Wayra


Objetivo: Determinar el nmero de pasajeros que exceden el peso de equipaje de
mano.
Se seleccion una muestra al azar de pasajeros de la aerolnea Wayra que viajaron a diferentes destinos tursticos.
Peso del equipaje de mano por pasajeros, en kilogramos
5,2
7,6
8,6
9,7
10,5

5,6
7,7
8,8
9,7
10,6

5,9
7,9
8,9
9,7
10,7

6,7
8,0
9,0
9,8
11,0

6,9
8,0
9,0
9,8
11,5

7,3
8,1
9,1
9,9
12,0

7,3
8,3
9,4
9,9
12,0

7,5
8,4
9,4
9,9
12,3

7,5
8,4
9,4
9,9
12,4

7,5
8,5
9,5
10,0
12,8

Construya la tabla de frecuencia utilizando el mtodo de Sturges.

El valor mximo es ...


El valor mnimo es ...
Luego, el rango es ...
Siguiendo la regla de Sturges, la cantidad de intervalos es igual a k = 1 + 3,322 log(.)
esto es igual a ...
Como, la cantidad de intervalos es un nmero entero, entonces k = .
La amplitud es igual al rango entre la cantidad de intervalos, esto es, w = ..
El valor de la amplitud se redondea por exceso a decimal(es), pues los
datos tienen decimal(es), entonces la amplitud (w) es
Ttulo: .
Marca de
clase

Intervalo

Frecuencia
absoluta fi

Fuente: ..
Notas importantes

Frecuencia
relativa hi

Frecuencia absoluta
acumulada Fi

Frecuencia relativa acumulada Hi

38

Estadstica Descriptiva 201602

Indique e interprete el valor de las siguientes frecuencias para la distribucin de frecuencias anterior.
f4

F2

H2

Si el peso mximo permitido en equipaje de mano por persona es de 10 kilogramo y el


pago por cada kilogramo o fraccin adicional es de tres dlares. Cul fue el monto total
de dinero que recibi la compaa Wayra por exceso de peso de equipaje de mano?

Distribuciones de frecuencias de dos o ms grupos de datos con intervalos comunes


La idea bsica para distribuciones de frecuencias de dos o ms grupos de datos es tener
intervalos comunes, es decir, que los lmites de los intervalos para ambas distribuciones
sean iguales. Para ello, debemos seguir los siguientes pasos:

Hallar el mnimo de todos los datos y el mximo de todos los grupos de datos, y usarlos
para calcular el rango.
Calcular el nmero de categoras, el nmero de datos es el mximo nmero de datos de
cada grupo. Tener en cuenta que no es la suma de ambos tamaos muestrales.
Siguiendo la regla de Sturges, el nmero de intervalos es
k 1 3,322log10 n

Notas importantes

Unidad 1. Organizacin de Datos

39

Ejemplo 8
La empresa de investigacin de mercado Elctrico lleva a cabo un estudio para obtener indicadores que le permitan inferir respecto al consumo de energa elctrica mensual (medido en kilovatios, redondeado al entero ms prximo) de las familias en los
departamentos de Arequipa y Tacna. Dicho estudio, sustentado en el anlisis de muestras aleatorias tomadas en ambos departamentos, arroj los siguientes resultados:
Arequipa
227 231 261 270 291 351 359 369 371 382 387 392 393 395 396 413 420 422 424 436
453 461 463 471 495 498 510 512 533 534 541 542 584 589 591 628 630 630 657 666

Tacna
217 219 263 287 294 340 346 347 348 377 390 392 395 396 397 408 418 424 426 429
438 438 442 446 447 450 456 481 496 508 511 533 549 583 609 636

Usando la regla de Sturges, calcule intervalos comunes y marcas de clase de una tabla de
distribucin de frecuencias que permita comparar los datos.

Solucin
Hallar el mnimo de todos los datos (217) y el mximo de todos los datos (666) de ambas
ciudades, y usarlos para calcular el rango.
Calcular el nmero de categoras, el nmero de datos es el mximo nmero de datos
(40) entre ambas ciudades. Tener en cuenta que no es la suma de ambos tamaos
muestrales.
Siguiendo la regla de Sturges, el nmero de intervalos es:
k 1 3,322log10 n 1 3,322log10 (40) 6,322 6 (Redondeo simple)
Tabla 1. Distribucin de clientes segn consumo elctrico

Fuente: Empresa A

Notas importantes

Consumo de energa

Marca de clase

217 ; 292

254,5

292 ; 367

329,5

367 ; 442

404,5

442 ; 517

479,5

517 ; 592

554,5

592 ; 667

629,5

40

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo: Comparar las horas diarias trabajadas con y sin horas extras pagadas.
El jefe de recursos humanos de la aerolnea Wayra est interesado en analizar el impacto en los empleados al suprimir las horas extras de trabajo pagadas que anteriormente
se aplicaba. Con este fin se extraen dos muestras aleatorias. La primera de 80 empleados tomando de los datos histricos de un da al azar con el sistema anterior y la segunda de 60 empleados tomando los datos de un da al azar con el sistema vigente. Se
muestran las horas de trabajo por da por empleado.
Datos sobre horas diarias trabajadas con y sin horas extras pagadas
Horas diarias trabajadas con horas extras pagadas

Horas trabajadas sin horas extras pagadas

7,7

8,9

9,8

10,8

11,2

11,8

12,3

13,2

7,0

8,2

8,5

8,9

9,7

10,8

7,9

8,9

10,1

10,8

11,3

11,9

12,4

13,4

7,0

8,2

8,5

8,9

9,8

11,0

8,0

9,0

10,2

10,9

11,4

12,0

12,4

13,5

7,0

8,2

8,5

8,9

9,9

11,2

8,0

9,1

10,2

11,0

11,4

12,0

12,4

13,6

7,0

8,3

8,6

9,0

9,9

11,6

8,1

9,1

10,3

11,0

11,5

12,1

12,5

13,7

7,0

8,3

8,6

9,1

10,0

11,7

8,1

9,3

10,4

11,0

11,5

12,1

12,5

13,9

7,1

8,3

8,7

9,1

10,0

12,2

8,2

9,4

10,6

11,1

11,5

12,1

12,6

14,6

8,1

8,4

8,7

9,3

10,3

12,5

8,5

9,5

10,6

11,1

11,6

12,2

12,7

14,8

8,2

8,4

8,7

9,4

10,5

12,9

8,6

9,7

10,7

11,1

11,7

12,2

12,9

15,0

8,2

8,4

8,8

9,6

10,5

13,3

8,8

9,7

10,8

11,2

11,7

12,3

13,1

15,3

8,2

8,4

8,8

9,7

10,6

14,0

Fuente: Aerolnea Wayra

Determine los intervalos comunes de las distribuciones de frecuencias que permitan


comparar los datos de ambas muestras.

Notas importantes

Unidad 1. Organizacin de Datos

41

Caso Aerolnea Wayra


Objetivo: Comparar el exceso de peso del equipaje de los pasajeros segn su gnero.
Se realiz un estudio en el cual, se elabor bajo una muestra elegida al azar de 40 pasajeras y 110 pasajeros, obtenindose la siguiente grfica. Adems, se considera exceso de
peso cuando el pasajero lleva consigo maletas que sobrepasan los 32 kilogramos.

Porcentaje de pasajeros

Distribucin porcentual de los pasajeros


segn el peso de sus maletas por gnero
100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

93%

100%

83%
65%

74%

83%
Femenino

61%
31%

Masculino

20%
0%
20

Fuente: Aerolnea Wayra

13%
24

28
32
36
Peso, en kilogramos

40

44

Complete las siguientes afirmaciones, tenga en cuenta que se considera exceso de peso
cuando las maletas sobrepasan los 32 kilogramos.

a. El nmero de pasajeros hombres _______ que llevan consigo maletas que pesan
ms de 36 kilogramos pero a lo ms 40 kilogramos.
b. El _______ % de las pasajeras mujeres lleva consigo maletas que pesan hasta 36 kilogramos.
c. El _______% de los pasajeros hombres lleva consigo maletas con exceso de peso.
d. El gnero que presenta un mayor porcentaje de pasajeros con exceso de peso del
equipaje es _____________ y representa en __________ % superior con respecto al
otro gnero.

Notas importantes

42

Estadstica Descriptiva 201602

Grficos de datos cuantitativos


Histograma
Un histograma es una representacin grfica de una variable en forma de barras, donde
la altura de cada barra es proporcional a la frecuencia de los valores representados.

Se traza colocando
la variable
sobre el eje horizontal
y las frecuencias
sobre el eje vertical.

Cada frecuencia de clase se representa


trazando un rectngulo, cuya base es el
intervalo de clase sobre el eje horizontal
y cuya altura es proporcional a la
frecuencia correspondiente (absoluta,
relativa o porcentual).

Los rectngulos adyacentes


se tocan entre s.

Un ejemplo de histograma es el siguiente grfico.

Notas importantes

Unidad 1. Organizacin de Datos

43

Polgono de frecuencias
Un polgono de frecuencias es un grfico de lneas que une los puntos asociados a las
marcas de clase de una variable. La altura del punto asociado a cada marca de clase es
proporcional a la frecuencia de dicho valor.

Se realiza uniendo
con segmentos de recta
los puntos de interseccin
de las marcas de clase
con las frecuencias
(absolutas, relativas o porcentuales).

Los polgonos de frecuencias


se cierran creando
dos intervalos ficticios,
uno antes del primer intervalo
y uno despus del ltimo.

Si los intervalos creados


toman valores
que pueden no ser reales,
igual se crea el intervalo, como,
ejemplo, tiempos negativos.

Un ejemplo de polgono de frecuencias es el siguiente grfico.

Notas importantes

44

Estadstica Descriptiva 201602

Distribuciones acumuladas
La distribucin de frecuencias acumuladas muestra la cantidad de elementos con valores
menores o iguales al lmite superior para cada clase.

Ojiva
La ojiva es la grfica de una distribucin acumulada de frecuencias.

Se obtiene uniendo
con segmentos de recta
los puntos de interseccin
del lmite superior de cada intervalo
y la frecuencia acumulada
respectiva.

La ojiva
usa los limtes de los intervalos
y no las marcas de clase.

Con la ojiva
se puede estimar fcilmente
el nmero
o porcentaje de observaciones
que corresponden
a un intervalo determinado.

Un ejemplo de ojiva es el siguiente grfico.

Porcentaje acumulado

Distribucin porcentual de empleados


segn el tiempo de servicio
100.00%

100%
90%
80%
70%
60%
50%
40%
30%
20%
10%
0%

95.42%
84.75%
57.62%

19.82%

12
Nmero de aos

Fuente: Empresa A. Gerencia de RRHH

Notas importantes

16

20

Unidad 1. Organizacin de Datos

45

Caso Aerolnea Wayra


Objetivo: Determinar el porcentaje de pasajeros que exceden el peso de equipaje de
mano.
Grafique el histograma, el polgono de frecuencias y la ojiva con los datos de la muestra.

Use uno de los grficos para calcular, aproximadamente, porcentaje necesario para resolver el objetivo.

Notas importantes

46

Estadstica Descriptiva 201602

Ejercicios adicionales de la Unidad 1


1. El objetivo de una investigacin es estimar la media, en aos, de la edad de los egresados
de la UPC. Indique el elemento, una variable a medir y una posible observacin.
2. Segn el estudio Rumores de oficina, el 42% de los ejecutivos limeos considera que
los rumores influyen mucho en el clima laboral de la oficina. Indique el elemento, una variable a medir y una posible observacin.
3. En una investigacin, se quiere estimar el promedio del nmero de asistentes a los conciertos de artistas internacionales realizados en Lima durante el ao 2014. Indique el
elemento, una variable a medir y una posible observacin.
4. El objetivo de una investigacin en la ciudad de Lima es determinar la ocupabilidad en
hoteles de 4 y 5 estrellas en Cusco durante el da de ao nuevo del 2013, es decir, el porcentaje de habitaciones ocupadas durante ese da. Indique la poblacin y la muestra.
5. El objetivo de una investigacin en el Per es determinar el promedio de la edad de las
mujeres en edad frtil que usan mtodos anticonceptivos. Defina la poblacin, muestra,
elemento y variable. El INEI considera a la edad frtil en las mujeres desde los 15 hasta
los 49 aos.
6. Segn los Censos Nacionales XI de Poblacin y VI de Vivienda 2007 ejecutados por el INEI,
el 50,30% de los peruanos son mujeres. Indique si este dato es un parmetro o un estadstico.
7. La nueva lista roja de aves de 2014, confeccionada con datos de BirdLife, muestra que de
las 10.425 especies de aves identificadas en el mundo, el 13% estn amenazadas de extincin. Estas listas, dice Juan Carlos Atienza, de SEO BirdLife, contribuyen establecer
prioridades a la hora de favorecer polticas de conservacin y declarar nuevos espacios
protegidos. Indique si este valor corresponde a un parmetro o a un estadstico.
8. El grfico muestra la evolucin de la inflacin desde el ao 1980 al 2013. Indique si el ndice de precios al consumidor IPC que obtiene el INEI es un parmetro o un estadstico.

9. Segn el estudio Rumores de oficina realizado por la empresa Transearch publicado en


julio del 2014, el 42% de los ejecutivos limeos considera que los rumores influyen mucho en el clima laboral de la oficina. Indique los siguientes conceptos con respecto a dicho estudio: poblacin, muestra, elemento, variable, estadstico, valor del estadstico.
Por qu los encargados del estudio calcularon estadsticos y no parmetros?
Notas importantes

Unidad 1. Organizacin de Datos

47

10. El objetivo de una investigacin es estimar el porcentaje de peruanos que aprueban la


gestin de Ollanta Humala como presidente de la Repblica, para lo cual se tom una
muestra aleatoria de personas de 18 a 70 aos y se les pregunt por su opinin. Los resultados son los siguientes.
Desaprueba

Aprueba

Desaprueba

Aprueba

No sabe

Aprueba

Aprueba

Desaprueba

Aprueba

Aprueba

Aprueba

Aprueba

Aprueba

Desaprueba

No sabe

Desaprueba

Aprueba

Aprueba

Desaprueba Desaprueba

Desaprueba Desaprueba
Aprueba

Desaprueba

Desaprueba Desaprueba Desaprueba Desaprueba


Aprueba
Aprueba

Desaprueba Desaprueba Desaprueba

Aprueba

Aprueba

Desaprueba Desaprueba

Desaprueba Desaprueba

Aprueba

Desaprueba

No sabe

Desaprueba Desaprueba Desaprueba

Aprueba

Aprueba

Desaprueba

No sabe

Desaprueba Desaprueba Desaprueba


Aprueba

Desaprueba

No sabe

Aprueba

Aprueba

Aprueba

Aprueba
Aprueba

Aprueba

Desaprueba Desaprueba

Desaprueba Desaprueba

Aprueba

Desaprueba Desaprueba Desaprueba Desaprueba

Construya la distribucin de frecuencias de los datos. Interprete los valores f2 y h1.


11. Se tiene como objetivo mostrar la composicin porcentual de alumnos universitarios en
el Per por tipo de institucin educativa al final de la secubdaria, para lo cual se tom
como referencia los datos del II Censo Universitario 2010 realizado por el INEI, donde se
pregunt a los alumnos universitarios por el tipo de institucin educativa donde
terminaron su educacin secundaria. Los resultados se muestran en la siguiente tabla.
Tabla. .
Tipo de institucin

fi

hi

Estatal

256 060

0,5405

Particular

154 275

0,3256

Particular religioso

58 673

0,1238

No escolarizado

4 472

0,0094

309

0,0007

Otro
Total

473 789

Realice un diagrama circular con dichos datos.


12. Observe el siguiente grfico e indique un posible error.

Notas importantes

ngulo

48

Estadstica Descriptiva 201602

13. En la publicacin Revista Cientfica-Estudiantil de Ciencias Mdicas de Cuba se public el


artculo Pancreatitis aguda. Retos y perspectivas el cual contena el siguiente grfico.
Observe el grfico e indique un posible error.
Distribucin de pacientes segn hbito txico

Fuente: Datos tomados de HC del departamento de archivo del HDCQ 10 de Octubre


Tomado de http://www.16deabril.sld.cu/rev/228/articulo3.html

14. Observe los dos grficos siguientes e indique la posible diferencia de interpretacin entre
ambos.

15. En la agencia de viajes A se realiz una encuesta a 330 clientes respecto a las principales
quejas que tienen clientes acerca de los tours del tipo todo incluido al exterior. Las cuales
se detallan en el siguiente cuadro:
Agencia A. Distribucin de clientes segn principales quejas de clientes
Queja
Cambio de fecha de los vuelos
El hotel no era de la categora que se vea en el folleto
Los hoteles no incluyen bebidas premium
La comida de los hoteles no es de calidad excelente
Otros
Que les venden otros servicios como tiempo compartido

Nmero de quejas

Fuente: Direccin de Atencin al cliente. Agencia A

Realice el diagrama de Pareto correspondiente a estos datos.

Notas importantes

120
94
61
23
25
7

Unidad 1. Organizacin de Datos

49

16. Uno de los objetivos de una investigacin en la empresa A es mostrar la composicin


porcentual del nmero de cursos de capacitacin dadas a sus trabajadores. Los siguientes datos muestran el nmero de capacitaciones que 48 trabajadores han recibido en el
presente ao.
3

Complete el cuadro y construya el grfico de bastones de frecuencias porcentuales para


la variable nmero de capacitaciones.
17. El objetivo de una investigacin sobre la lcuma, de la empresa A en el presente mes, es
establecer la distribucin de su peso para la exportacin. La lcuma es originaria de las
regiones tropicales de Sudamrica. Es empleada, sobre todo, en la preparacin de dulces,
postres y helados. En el siguiente cuadro se muestra el peso, en gramos, de una muestra
de 60 frutos.
167
186
194
203
213

172
186
195
204
214

173
187
195
205
218

180
189
195
207
218

182
190
197
207
218

182
191
197
207
219

183
191
199
207
220

183
192
201
209
222

183
193
201
210
223

184
194
201
212
226

185
194
201
212
228

186
194
201
213
232

Realice la tabla de distribucin de frecuencias de los datos.


18. La siguiente tabla corresponde a la distribucin de frecuencias de los salarios, en nuevos
soles, del ltimo mes de los empleados de la empresa A. Complete la tabla.
Empresa. A. Distribucin de trabajadores segn salarios, en nuevos soles, del ltimo mes
Clase

Marca
de clase

1200 -

Frecuencia
absoluta fi

Frecuencia
relativa hi

Frecuencia absoluta acumulada


Fi

Frecuencia relativa acumulada


Hi

120
1 800

300

0,42
780

150

Fuente. Gerencia de Recursos Humanos. Agosto 2014. Empresa A

19. En economa, la prima de riesgo es el sobreprecio que paga un pas para financiarse en
los mercados en comparacin con otros pases. De esta forma, cuanto mayor es el riesgo
pas, ms alta ser su prima de riesgo. Significa la confianza de los inversores en la solidez
de una economa. La prima de riesgo de los pases de la Unin Europea se calcula respecto de Alemania porque se supone que su deuda pblica es la que tiene menor riesgo de
impago. Para el caso de Espaa, la agencia de calificacin de riesgos A ha medido la prima de riesgo durante 50 das desde junio del 2015.

Notas importantes

50

Estadstica Descriptiva 201602

Espaa. Distribucin de das segn prima de riesgo. Junio y julio del 2015
Prima de riesgo

Marca de clase

fi

hi

Fi

Hi

120

130

125

0,0200

0,0200

130

140

135

0,0600

0,0800

140

150

145

11

0,2200

15

0,3000

150

160

155

14

0,2800

29

0,5800

160

170

165

12

0,2400

41

0,8200

170

180

175

0,1200

47

0,9400

180

190

185

0,0600

50

1,0000

Fuente: Agencia de Calificacin de Riesgos A.

Grafique el histograma de frecuencias relativas, el polgono de frecuencias absolutas y la


ojiva de frecuencias relativas.
20. Indique el tipo y escala de medicin de las siguientes variables y su escala de medicin.
Variable
Nmero de personas que van a ver una pelcula
Gnero de una pelcula (drama, comedia, accin, etc.)
Duracin de una pelcula
Opinin sobre la pelcula (buena, regular, mala)

21. En el II Censo Nacional Universitario del ao 2010 realizado por el INEI se pregunt a los
alumnos de todo el Per por su tipo de universidad y su gnero. Los datos se muestran
en el siguiente cuadro.
Per. Distribucin de alumnos de pregrado por gnero y tipo de universidad. 2010
Gnero

Pblica

Privada

Total

Mujer

135 082

247 743

382 825

Hombre

174 093

226 052

400 145

309 175

473 795

782 970

Total

Fuente: INEI. II Censo Universitario. 2010

Interprete el valor 135 082 de la tabla.


Elabore un grfico comparativo que permita ver la composicin porcentual por gnero y
tipo de universidad.
Elabore un grfico comparativo que permita ver la composicin porcentual por gnero
segn tipo de universidad.
Elabore un grfico comparativo que permita ver la composicin porcentual por tipo de
universidad segn gnero.
Notas importantes

Unidad 1. Organizacin de Datos

51

22. Encuentre todos los errores del siguiente grfico, realizado a partir de la Encuesta Nacional de Hogares realizada por el Instituto Nacional Estadstica e Informtica del Per entre
los aos 2005 y 2011.

Tomado de http://www.inei.gob.pe/perucifrasHTM/inf-soc/cuadro.asp?cod=3718&name=edu14&ext=gif

23. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin
El valor de un parmetro se puede conocer solamente si se realiza un censo
En un estudio observacional se controlan las variables de inters
Solo las variables cuantitativas continuas pueden toman valores con decimales
Variable es el conjunto de mediciones obtenido de un elemento particular
Para graficar las ojivas se usan las marcas de clase
Con la ojiva se puede estimar el porcentaje de observaciones que corresponde a un intervalo
determinado
Para el polgono de frecuencias solamente se usa las frecuencias relativas
Los cuadros de doble entrada usan exclusivamente variables ordinales o nominales.
En un grfico circular, el ngulo que le corresponde a cada parte se obtiene multiplicando 360
por la respectiva frecuencia absoluta dividida entre la cantidad de datos.
La frecuencia porcentual de una clase es la proporcin de elementos que pertenecen a esa
clase.
En un grfico de barras apiladas al 100%, el alto de las barras es igual en cada categora.

Notas importantes

52

Estadstica Descriptiva 201602

24. Se ha tomado un examen a 100 personas y registrado el tiempo empleado en terminarlo.


Indique si son verdaderas o falsas las siguientes afirmaciones con respecto al grfico.

Frecuencia acumulada

Distribucin porcentual de alumnos


segn el tiempo en resolver un examen
100
100

80

80
72

60
40

40

30

20
0
0

20

40

60

80

100

Tiempo (en minutos)


Fuente: Calidad Educativa Universidad A

Afirmacin
El nmero de personas que tarda 20 minutos o menos es 30
El nmero de personas que tarda ms de 20 pero menos o igual a 70 minutos es 42
El porcentaje de personas que tarda ms de 60 minutos es 28%
El porcentaje de personas que tarda 25 minutos o menos es 40%
El porcentaje de personas que tarda 20 minutos es 30%

25. Por qu se usan los grficos de bastn para variables discretas en vez de un grfico de
barras?
26. Por qu se redondea por exceso la amplitud en las distribuciones de frecuencias de datos continuos?
27. A nivel nacional, se observa que la curva de frecuencia acumulada del ingreso real para el
ao 2012 se ha desplazado ligeramente hacia la derecha, lo que indica un ..
(aumento o decremento) del ingreso en todos los segmentos de la distribucin.

Notas importantes

Unidad 2. Medidas descriptivas

Unidad 2 Medidas descriptivas


Logro de la unidad 2

Al finalizar la unidad 2,
el estudiante analiza el comportamiento de datos reales
aplicando las medidas de resumen de datos.

Temario

Medidas de tendencia central: media aritmtica, mediana, moda, media ponderada

Medidas de posicin: cuartiles, deciles, percentiles

Medidas de dispersin: varianza, desviacin estndar, coeficiente de variacin

Medidas de asimetra

Diagramas de cajas

Notas importantes

53

54

Estadstica Descriptiva 201602

Datos simples y datos agrupados

Datos simples

Datos agrupados

Se denomina datos simples (datos no


agrupados) a los valores que no estn
agrupados en distribuciones de
frecuencia.

Se denomina datos agrupados a los


valores que estn agrupados en
distribuciones de frecuencia.

Si se tienen datos simples no se construye la distribucin de frecuencias


para calcular la media, la mediana o cualquier estadstico,
se prefiere el clculo con los datos simples.

Ejemplo de datos simples


10,6 14,5 17,2 12,8 13,6 11,6 11,3 13,0 13,5 10,8 13,9 14,2 15,3 14,3 14,3 14,3
11,8 16,1 16,8 18,8 14,8 14,0 16,4 14,2 16,5 12,1 13,3 12,0 14,3 14,9 15,1 14,4

Ejemplo de datos agrupados por intervalos


Empresa A. Distribucin de obreros segn descuentos en su planilla en el presente mes
Descuentos, en nuevos soles

Marca de
clase

fi

hi

Fi

Hi

[204,1 ; 233,6]

218,85

16

0,2084

16

0,3334

]233,6 ; 263,1]

248,35

12

0,2500

28

0,5834

]263,1 ; 292,6]

277,85

0,1458

35

0,7292

]292,6 ; 322,1]

307,35

0,1458

42

0,8750

]322,1;351,6]

336,85

0,1250

48

1,0000

48

1,0000

Total
Fuente: RRHH Empresa A

Luego de una investigacin se tiene muchos datos, con ellos se puede realizar algunos
grficos y distribuciones de frecuencias, pero cmo resumir alguna caracterstica de la
informacin en un solo nmero?

Notas importantes

Unidad 2. Medidas descriptivas

55

Medidas de tendencia central


Una medida de localizacin o de tendencia central se refiere al valor central que representa a los datos de una determinada variable.

Media
La media aritmtica (media o promedio) de un conjunto de valores de una variable es la
suma de dichos valores dividida entre el nmero de valores.

Notas importantes

56

Estadstica Descriptiva 201602

Clculo de la media aritmtica


La frmula para la media poblacional es
N

x
i 1

Las frmulas para la media muestral son:

Caso Aerolnea Wayra


A una muestra de tripulantes de la aerolnea Wayra se les pregunt el tiempo, en aos,
que trabajan en Wayra. Calcule e interprete la media muestral.
4,1

3,5

4,6

2,3

3,5

4,5

2,0

0,5

6,1

3,7

1,2

2,3

Si la media muestral es mayor a 3,5 aos, se implementar un programa de incentivo


para que los tripulantes postulen a ascensos. Indique lo que har la compaa

Notas importantes

Unidad 2. Medidas descriptivas

57

A una muestra de viajeros frecuentes se les pregunt por el nmero de veces que viaj
con Wayra en el ltimo mes. Calcule e interprete la media muestral.
Distribucin de viajeros frecuentes segn el nmero de veces que viaj en el ltimo mes

Nmero de veces

fi

71

133

346

85

15

hi%

Fuente: Wayra

A una muestra de 500 pasajeros premium se les pregunt por la cantidad de dinero que
estaran dispuestos a pagar por un men gourmet durante un vuelo nacional. Los datos
se muestran a continuacin. Calcule e interprete la media muestral.
Distribucin de viajeros premium segn lo que pagaran por men gourmet en vuelo nacional
Dinero (en soles)

Marca de clase

20

hi

Fi

Hi
0,05

225
30

Fuente: Wayra

Calcule e interprete la media muestral.

Notas importantes

fi

0,75

58

Estadstica Descriptiva 201602

Calcule la media de los siguientes grupos de nmeros.


Grupo 1

Grupo 2

700

Qu nota al calcular la media de cada grupo?

Caractersticas de la media
-

Se puede calcular para datos medidos en escala de intervalo o razn.

El clculo de la media es sencillo y es una medida muy conocida.

El valor de la media es sensible a los valores extremos, por lo que vara mucho con
valores muy grandes o muy pequeos con respecto a los dems.

Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes, entonces, la media de los n valores yi es:
y ax b

Caso Aerolnea Wayra


La empresa Wayra ha decidido hacer dos ofertas a su sindicato sobre el aumento de
sueldo anual a sus trabajadores:
-

Aumento general del 5%.

Aumento del 2% ms un bono de 130 soles.

Si el sueldo promedio es de 4100 soles, cul de las dos ofertas debe aceptar el sindicato
si lo que desea es hacer mximo el sueldo medio de los trabajadores?

Notas importantes

Unidad 2. Medidas descriptivas

59

Mediana
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a dicho conjunto.

Interprete alguna de las siguientes medianas.

Notas importantes

60

Estadstica Descriptiva 201602

Clculo de la mediana

Caso Aerolnea Wayra


A una muestra de pasajeros se les registr el tiempo, en minutos, que demoraron en la
cola hasta ser atendidos en los counters del aeropuerto. Calcule e interprete la mediana
muestral. Los datos se muestran en la tabla siguiente.
10

25

10

14

18

11

15

14

13

15

17

14

25

Si la mediana es mayor a 15 minutos se aumentar la cantidad de personas en los counters de atencin del aeropuerto. Indique lo que har la compaa.

Notas importantes

Unidad 2. Medidas descriptivas

61

De una muestra de 50 vuelos, se ha registrado el nmero de personas que pierden su


vuelo por presentarse tarde al counter del aeropuerto. Los datos se muestran a continuacin.
Distribucin de vuelos segn nmero de personas que pierden el vuelo por llegar tarde

Nmero de pasajeros

fi

19

13

hi%

Fuente: Wayra

Calcule e interprete la mediana muestral.

Calcule la mediana de los siguientes grupos de nmeros.


Grupo 1

11

12

13

14

15

16

Grupo 2

-70

11

12

13

14

15

700

Qu concluye al calcular la mediana de cada grupo?

Caractersticas de la mediana
-

Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.

La mediana no se ve afectada por valores extremos, por lo que se prefiere como


medida de tendencia central cuando hay datos extremos o la distribucin de frecuencias no es simtrica.

Notas importantes

62

Estadstica Descriptiva 201602

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta
con mayor frecuencia.

Interprete alguna de las siguientes modas.

En un examen apareci la siguiente pregunta La moda del ingreso mensual de los trabajadores es 1 850 nuevos soles. Interprete. Un alumno respondi La mayora de trabajadores gana 1 850 nuevos soles. Indique si es correcta o incorrecta tal respuesta.

Notas importantes

Unidad 2. Medidas descriptivas

63

Clculo de la moda

Para datos en distribuciones de frecuencia por intervalo,


- si la moda est en el primer intervalo, entonces d1 es igual a la primera frecuencia
- si la moda est en el ltimo intervalo, entonces d2 es igual a la ltima frecuencia.

Calcule la moda de los siguientes grupos de nmeros.


Grupo 1

Grupo 2

500

Qu concluye al calcular la moda?

Notas importantes

64

Estadstica Descriptiva 201602

Caractersticas de la moda
-

La moda se puede calcular para cualquier escala de medicin.


El valor de la moda no se ve afectada por valores extremos.
La moda no siempre es un valor nico. Una serie de datos puede tener dos modas
(bimodal) o ms modas (multimodal). Algunas series de datos no tienen moda.

Caso Aerolnea Wayra


Objetivo. Lanzar una campaa para los clientes de tipo grupos.
Distribucin de pasajeros segn precio de pasajes, en dlares, por tipo de cliente
Precios de
pasajes

Marca de
clase

hi%
Grupos

hi%
Ocasional

hi%
Premium

hi%
Viajero frecuente

[0

176]

88

50,0%

43,5%

39,4%

52,9%

]176

352]

264

12,5%

13,0%

21,2%

13,7%

]352

528]

440

0,0%

9,8%

18,2%

0,0%

]528

704]

616

37,5%

9,8%

18,2%

33,3%

]704

880]

792

0,0%

13,0%

3,0%

0,0%

]880

1056]

968

0,0%

7,6%

0,0%

0,0%

]1056 1232]

1144

0,0%

2,2%

0,0%

0,0%

]1232 1408]

1320

0,0%

1,1%

0,0%

0,0%

Fuente Aerolnea Wayra S.A.


La empresa desea lanzar una campaa de marketing directo a los clientes de tipo ocasional considerando el precio de pasaje ms frecuente que suelen pagar. Cul es ese
precio?

Notas importantes

Unidad 2. Medidas descriptivas

65

Objetivo: Comparar la media de los precios de pasajes por tipo de cliente.


Wayra lanzar una campaa de marketing a los dos tipos de clientes con los precios medios de pasajes ms altos. Indique los tipos de clientes a los que lanzar la campaa.

Objetivo: Establecer el costo medio de una campaa de fidelizacin de clientes.


Wayra lanzar una campaa de fidelizacin de clientes y rebajar 15% los precios de los
pasajes a Miami. Si la media del precio de estos pasajes es 740 dlares. Indique el nuevo
precio medio.

Wayra lanzar una campaa de fidelizacin de clientes y rebajar 10 dlares los precios
de los pasajes a Cusco. Si la media del precio de estos pasajes es 105 dlares. Indique el
nuevo precio medio.

Notas importantes

66

Estadstica Descriptiva 201602

Objetivo. Analizar un reclamo de clientes premium sobre el precio excesivo de pasajes.


Los clientes premium han expresado su malestar por los precios de los pasajes. Por ello,
se desea conocer el precio mnimo del 50% de los pasajes ms costosos de estos clientes, con el fin de dar un descuento en su prximo viaje Cul es este precio mnimo?

Media ponderada
Permite calcular el valor medio considerando la importancia o peso de cada valor sobre
el total.

Clculo de la media ponderada


La frmula es:
n

xw

xw
i 1
n

w
i 1

donde:
xi: Observacin individual
wi: Peso asignado a cada observacin

Las notas de un alumno de Estadstica Descriptiva son:


PC1

PC2

Promedio de
laboratorios

Promedio de
controles

Examen
parcial

Examen
final

Trabajo
final

12

12

13

15

13

15

Si las prcticas pesan de la nota final, los laboratorios ..,


los controles , el examen parcial ., el examen final y
el trabajo final. cul es el promedio final del alumno?

Notas importantes

Unidad 2. Medidas descriptivas

67

Cuantiles
Los cuantiles son valores de la distribucin que la dividen en partes iguales, es decir, en
intervalos, que comprenden el mismo nmero de valores. Los ms usados son:
- cuartiles, que dividen a la distribucin en cuatro partes,
- deciles, que dividen a la distribucin en diez partes,
- percentiles, que dividen a la distribucin en cien partes.

Deciles
Un decil se refiere a cada uno de los nueve valores que dividen un grupo de datos (clasificados con una relacin de orden) en diez partes iguales, de manera que cada parte representa un dcimo de la poblacin.

El siguiente grfico muestra la evolucin del ingreso real promedio per cpita en el Per
del ao 2013 al 2014. Qu grupo mejor porcentualmente ms sus ingresos, las personas con menores o con mayores ingresos?

Notas importantes

68

Estadstica Descriptiva 201602

Percentil
El percentil k-simo Pk es un valor tal que por lo menos k por ciento de las observaciones
son menores o iguales que este valor.

Interprete alguno de los siguientes percentiles.

Notas importantes

Unidad 2. Medidas descriptivas

69

Clculo del percentil

Calcule el percentil 75 de los siguientes grupos de nmeros.


Grupo 1

10

12

13

14

15

16

17

Grupo 2

10

12

13

14

15

16

17

Qu concluye al calcular dicho percentil?

Caractersticas de los percentiles


-

Se puede calcular en variables medidas en escala ordinal, de intervalo y razn.

El valor del percentil no se ve afectado por valores extremos.

Notas importantes

700

70

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo. Analizar un reclamo de clientes Premium sobre el precio excesivo de pasajes.
Distribucin de pasajeros segn precio de pasajes de clientes Premium, en dlares
Precios de pasajes

Marca de clase

hi%

[0

176]

88

39,4%

]176

352]

264

21,2%

]352

528]

440

18,2%

]528

704]

616

18,2%

]704

880]

792

3,0%

Fuente: Aerolnea Wayra S.A.

Calcule el precio mximo de un pasaje para estar en el 20% de los pasajes ms baratos.

Calcule el precio mnimo de un pasaje para estar en el 20% de los pasajes ms caros.

Calcule el porcentaje de clientes que pag como mximo 600 dlares.

Notas importantes

Unidad 2. Medidas descriptivas

71

Ejemplo 9
La siguiente tabla corresponde a la distribucin de frecuencias de los 200 trabajadores
de la empresa A segn salario, en nuevos soles, del ltimo mes.
Distribucin de empleados segn salario del ltimo mes
Salario (en nuevos soles)

fi

hi

Fi

Hi

450 - 650

32

0,160

32

0,160

650 - 850

40

0,200

72

0,360

850 1 050

60

0,300

132

0,660

1 050 1 250

48

0,240

180

0,900

1 250 1 450

20

0,100

200

1,000

Fuente: Empresa A

Calcule el sueldo mnimo para estar en el 15% de los trabajadores mejores pagados.
Solucin
Usando las frecuencias absolutas se tiene:

P85 Li

w n 85

200 200 85

F4 1 1050
132 1208,33

f4 100

48 100

nuevos soles

Usando las frecuencias relativas se tiene:

P85 Li

w 85
200 85

H4 1 1050
0,66 1208,33

h4 100

0,24 100
nuevos soles

El sueldo mnimo para estar en el 15% de los trabajadores mejores pagados es


S/.1208,33.

Notas importantes

72

Estadstica Descriptiva 201602

Medidas de variabilidad

Con las medidas de tendencia central es


posible determinar el valor central de una
distribucin, pero no indican qu tan
cercanos o lejanos estn los datos de dicho
valor central.

Las medidas de variabilidad indican cun


alejados estn los valores de una variable
del valor que los representa y, por lo tanto,
permiten evaluar la confiabilidad de ese
valor central.

Si la medida de dispersin:
- tiene un valor pequeo, los datos estn concentrados alrededor de la medida de tendencia
central,
- tiene un valor grande, los datos no estn concentrados alrededor de la medida de tendencia
central.

Notas importantes

Unidad 2. Medidas descriptivas

73

Varianza
La varianza es el promedio de los cuadrados de la diferencia de cada dato con la media.
Las unidades de la varianza son las unidades de los datos al cuadrado.

Clculo de la varianza
La frmula para la varianza poblacional es
N

x
i 1

La frmula para la varianza muestral es

Desviacin estndar
La desviacin estndar es la raz cuadrada positiva de la varianza.
La desviacin estndar poblacional se denota por y la muestral por s.

Calcule la desviacin estndar de los siguientes grupos de nmeros.


Grupo 1

Grupo 2

700

Qu concluye al calcular dicha medida de dispersin?

Notas importantes

74

Estadstica Descriptiva 201602

Caractersticas de la varianza y la desviacin estndar


-

La varianza y la desviacin estndar se ven afectadas por valores extremos.

La varianza y la desviacin estndar son nmeros reales no negativos.

Se pueden calcular para variables medidas en escala de intervalo o razn.

La varianza es expresada en unidades cuadrticas a las unidades de los datos, mientras que, la desviacin estndar es expresada en las mismas unidades de los datos.

Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes, entonces, la varianza de los n valores yi es:
sY2 a2 s2X

sY = a sX

Caso Aerolnea Wayra


La empresa Wayra ha decidido hacer dos ofertas a su sindicato sobre el aumento de
sueldo anual a sus trabajadores:
-

Aumento general del 5%.

Aumento del 2% ms un bono de 130 soles.

Si la desviacin estndar de los sueldos es de 350 soles, cul de las ofertas debe aceptar el sindicato si lo que desea es hacer mnima la desviacin estndar de los sueldos?

Calcule la desviacin estndar de los siguientes grupos de nmeros.


Grupo 1

Grupo 2

1001

1002

1003

1004

1005

1006

1007

Qu concluye al calcular dicha medida de dispersin?

Notas importantes

Unidad 2. Medidas descriptivas

75

Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica el porcentaje que es la
desviacin estndar en comparacin con la media.

Es til al comparar la
variabilidad de dos o
ms series de datos

que se expresan en distintas o iguales


unidades, pero difieren a tal punto que
una comparacin directa de las
respectivas desviaciones estndar no es
muy til,

por ejemplo,
cuando las medias
estn muy
distantes.

Observe las dos imgenes siguientes.

Tomado de http://gastronomiaycia.republica.com/

Complete los siguientes textos, con respecto a la variabilidad de los tamaos de las
manzanas en ambos grupos.
En el grupo de la izquierda hay mayor ... en el tamao de las manzanas.
En el grupo de la izquierda hay menor ... en el tamao de las manzanas.
En el grupo de la derecha hay mayor .. en el tamao de las manzanas.
En el grupo de la derecha hay menor .. en el tamao de las manzanas.

Clculo del coeficiente de variacin


La frmula para el coeficiente de variacin poblacional es CV

100%

s
x

La frmula para el coeficiente de variacin muestral es CV 100%

Caractersticas del coeficiente de variacin


-

El coeficiente de variacin se calcula en variables medidas en escala de razn.

Se debe calcular para valores positivos.

Notas importantes

76

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo: Analizar si la compra con promociones genera mayor variabilidad de los tiempos de espera en la compra de un pasaje.
Distribucin de pasajeros segn tiempos de espera para adquirir un
boleto por condicin de compra
Porcentaje de pasajeros

40%

36.3%

35%
30%

26.7%

25%

25.0%

23.3%

20%

Sin promocin
Con promocin

30.0%

20.0%
17.5%

15%

11.3%

10%
5%

3.8%

0.0%

0%
7.5
Fuente: Aerolnea Wayra S.A.

12.5

17.5

22.5

27.5

32.5

2.5%

1.3%
37.5

42.5

2.5%
47.5

52.5

Tiempos de espera, en minutos

Con la siguiente informacin compare la variabilidad en los tiempos de espera en la


compra de un pasaje entre pasajeros que compran con o sin promocin.

Ejemplo 10
Los siguientes datos representan resmenes del nmero de mediciones de resistencia
de cierto artculo que realizaron dos grupos de tcnicos.
Grupo 1: media = 3 y desviacin estndar = 1,10
Grupo 2: media = 5 y desviacin estndar = 1,66
En cul de los grupos el nmero de mediciones es ms disperso?
Solucin
Como los promedios son diferentes, se usa como indicador el coeficiente de variacin:
1,10
100% 36,67%
3
1,66
CV2
100% 33,20%
5

CV1

El nmero de mediciones es ms disperso en el grupo 1.


Notas importantes

Unidad 2. Medidas descriptivas

77

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados es la diferencia entre el dato mayor y el dato menor.

Clculo del rango


Rango = R = Xmax - Xmin

Mnimo valor

Mximo valor

Rango = Xmx - Xmn


donde Xmax y Xmin son los valores mximo y mnimo observados de la variable

Caractersticas del rango


-

Se puede calcular en variables medidas en escala de intervalo o razn

Se ve muy afectado por valores extremos.

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.

Clculo del rango intercuartil


Rango intercuartil = RIC = Q3 Q1= P75 P25

25%

50%

P25

RIC = P75- P25

25%
P75

Caractersticas del rango intercuartil


-

Se puede calcular en variables medidas en escala de intervalo o razn.

No se ve afectado por valores extremos.

Notas importantes

78

Estadstica Descriptiva 201602

Indique cul de los dos grupos tiene una mayor variabilidad en el 50% de los valores centrales.
Grupo 1

10 10 11 12 13 14

Grupo 2

9 10 11 12 15 15 17 89

En base a sus resultados, qu puede afirmar sobre los datos de cada grupo?

Calcule la mediana y desviacin estndar muestral de los siguientes grupos de datos.


Grupo 1

Grupo 2

En base a sus resultados, qu puede afirmar sobre los datos de cada grupo?

Notas importantes

Unidad 2. Medidas descriptivas

79

Medidas de asimetra
Coeficiente de asimetra de Pearson
Mide si los datos aparecen ubicados simtricamente o no respecto de la media.

Clculo del coeficiente de asimetra de Pearson


El coeficiente de asimetra para datos simples o agrupados se calcula con la siguiente
frmula:

x Mediana
As 3

Si el coeficiente de simetra As es:

positivo, indica sesgo a la


derecha (cola derecha)

igual a cero la
distribucin es simtrica
alrededor de la media

negativo indica sesgo a la


izquierda (cola izquierda)

Caso Aerolnea Wayra


Objetivo. Comparar el tiempo de espera de su equipaje de los pasajeros de los aeropuertos de dos ciudades.
Ciudad A
Media = 18,5 minutos, mediana = 16,1 minutos y desviacin estndar = 4,3 minutos
Ciudad B
Media = 16,7 minutos, mediana = 17,4 minutos y desviacin estndar = 3,8 minutos
El coeficiente de asimetra de la ciudad A es ..
El coeficiente de asimetra de la ciudad B es ..
Complete los siguientes textos, con respecto a la asimetra de los tiempos de espera del
equipaje en ambas ciudades.
Los datos de la ciudad A tiene asimetra .., es decir, hay una
mayor concentracin en los valores ...
Los datos de la ciudad B tiene asimetra .., es decir, hay una
mayor concentracin en los valores ...

Notas importantes

80

Estadstica Descriptiva 201602

Diagrama de cajas
Un diagrama de cajas es una grfica que describe la distribucin de un conjunto de datos
tomando como referencia los valores de los cuartiles como medida de posicin y el valor
del rango intercuartil como medida de referencia de dispersin. Adems, nos permite
apreciar visualmente el tipo de distribucin de los datos (simtrica o asimtrica) y la
identificacin de valores extremos (datos atpicos).

Dato atpico
Es un dato inusualmente grande o pequeo con
respecto a los otros datos. Se considera dato atpico a cualquier punto que est:
-

a ms de 1,5(RIC) por arriba (o a la derecha)


del tercer cuartil

a ms de 1,5(RIC) por debajo (o a la izquierda)


del primer cuartil

Pasos para trazar un diagrama de cajas

Se traza un rectngulo con los


extremos en el primer y tercer
cuartil

Se ubican los lmites mediante


el rango intercuartil,
el lmite superior est a 1,5 RIC
arriba (o a la derecha) de Q3
el lmite inferior est a 1,5 RIC
debajo (o ala izquierda) de Q1

Se marcan con un asterisco (*)


las localizaciones de los valores
atpicos

Notas importantes

En la caja se traza una recta


vertical en el lugar de la
mediana. As, la lnea de la
mediana divide los datos en
dos partes iguales

Se trazan los bigotes desde los


extremos de las cajas hasta los
valores mnimo y mximo
dentro de los lmites inferior y
superior

Unidad 2. Medidas descriptivas

81

Caso Aerolnea Wayra


Objetivo. Comparar el precio de los pasajes segn por promociones.
Complete el diagrama de cajas con la siguiente informacin:
Datos de precios de pasajes de clientes que compraron su pasaje con promocin
75 140 150 155 155 200 234 270 280 320 460 470 475 570 1150
Estadsticos

Con promocin

Sin promocin

Percentil 25

67,5

Percentil 50

355,0

Percentil 75

540,0

Rango intercuartil

472,5

Largo mximo del bigote = 1,5 RIC

708,75

Lmite inferior = P25 1,5 RIC

-641;25

Lmite superior = P75 + 1,5 RIC

1248,75

Mnimo

45

Mximo

950

La condicin de compra que presenta menor mediana en el precio de los pasajes es


... y este valor es ..
La condicin de compra que presenta mayor variabilidad en el precio del 50% de los valores centrales es ... pues ..
La condicin de compra que presenta valores atpicos en los precios de los pasajes es
... y dichos valores atpicos son ..
Notas importantes

82

Estadstica Descriptiva 201602

Ejemplo 11
Los registros policacos del distrito A muestran los siguientes nmeros de informes de
delitos diarios para una muestra de das durante los meses de invierno y una muestra de
das durante los meses de verano.
Invierno

12 14 15 15 17 17 18 18 20 21 21 21 21 22

Verano

10 12 18 20 20 20 24 24 26 27 27 27 28 28

Construya un grfico que permita comparar, entre invierno y verano, los valores medios,
la variabilidad y encontrar los valores atpicos del nmero de delitos diarios.
Solucin
Se debe calcular los percentiles con datos simples. No calcule la distribucin de frecuencias.
Calculemos los percentiles y los rangos intercuartiles.
Estadsticos

Invierno

Verano

Percentil 25

7,5

9,0

Percentil 50

16,0

20,0

Percentil 75

20,5

26,5

Rango intercuartil

20,5 7,5=13,0

26,5 9,0=17,5

Largo mximo del bigote = 1,5 RIC

1,5 x 13 = 19,5

1,5 x 17,5 = 26,25

Lmite inferior = P25 1,5 RIC

7,5 19,5 = -12,0

9,0 26,25 = -17,25

Lmite superior = P75 + 1,5 RIC

20,5 + 19,5 = 40

26,5 + 26,25 = 52,75

Para el invierno, de acuerdo con los datos, los bigotes llegan como mnimo a 5 y como
mximo a 22.
Para el verano, de acuerdo con los datos, los bigotes llegan como mnimo a 5 y como
mximo a 28.
No hay valores atpicos, pues ningn est fuera de los lmites.

Notas importantes

Unidad 2. Medidas descriptivas

83

Ejercicios de la Unidad 2
1. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de
hombres peruanos de 18 aos. Calcule e interprete la media de la estatura de la muestra.
1,67

1,70

1,83

1,65

1,70

1,65

1,60

1,70

1,61

1,69

2. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de


hombres peruanos de 18 aos.
Distribucin de una muestra de peruanos de 18 aos, segn su estatura
Estatura (en metros)

fi

hi

1,60

50

0,2778

1,63

78

0,4333

1,66

28

0,1556

1,70

14

0,0778

1,75

10

0,0556

Fuente: MINSA

Calcule e interprete la media de la estatura de la muestra.


3. Los datos siguientes corresponden a la estatura, en metros, de una muestra aleatoria de
hombres peruanos de 18 aos. Complete la distribucin de frecuencias.
Distribucin de una muestra de peruanos de 18 aos, segn su estatura
Estatura (en metros)

Marca de clase

fi

hi

Fi

155

Hi
0,48

0,32
167

0,95
600

Fuente: MINSA

Calcule e interprete la media de la estatura de la muestra. Use las frecuencias absolutas.


4. Una tienda rebaja los precios, en 12%, a toda su lnea de casacas. Si la media de los precios de las casacas antes de la rebaja era de 155 nuevos soles. Calcule la nueva media de
los precios.
5. En una empresa el sueldo medio es 2500 nuevos soles. La gerencia, luego de la negociacin con el sindicato, decide realizar un aumento del 3,5% y un bono de 150 nuevos soles
a cada trabajador. Calcule el nuevo sueldo medio.
6. Se registra los tiempos, en minutos, que se demora una cajera en atender a algunos
clientes del supermercado A.
5,3

2,7 10,7 8,2 3,0 5,4 5,6 10,2 11,3 2,6 2,6 5,4 3,5 7,0 11,5

Calcule e interprete el valor de la mediana.


Notas importantes

84

Estadstica Descriptiva 201602

7. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se pregunt a las madres peruanas que fueron menores de edad cuando naci
su primer hijo(a) nacido vivo, obtenindose los siguientes resultados.
Per. Distribucin de peruanas segn edad al nacer su primer hijo(a) vivo. 2007
Edad de la madre

fi

hi

Fi

Hi

12 aos

6,380

0,0054

6,380

0,0054

13 aos

13,840

0,0118

20,220

0,0173

14 aos

62,898

0,0537

83,118

0,0710

15 aos

210,250

0,1795

293,368

0,2505

16 aos

366,822

0,3132

660,190

0,5636

17 aos

511,133

0,4364

1,171,323

1,0000

Fuente: PER, INEI. Censos Nacionales 2007

Calcule e interprete la mediana de la variable en estudio.


8. En una ciudad, se tom una muestra aleatoria de 1000 personas y se les pregunt por su
ingreso mensual, en dlares, obtenindose los siguientes resultados.
Distribucin de personas segn ingreso mensual
Ingreso (en dlares)

300

700

700

1 100

1 100
1 500

1 500

1 900

1 900

2 300

Fuente: Empresa A

Marca de clase

fi

hi

Fi

Hi

500

104

0,104

104

0,104

900

224

0,224

328

0,328

1 300

437

0,437

765

0,765

1 700

151

0,151

916

0,916

2 100

84

0,084

1000

1,000

Calcule e interprete la mediana de la variable en estudio.


9. En la empresa A se tom un examen de conocimientos sobre los procesos administrativos. Los resultados se muestran en la siguiente tabla:
Distribucin de trabajadores segn resultados del examen de conocimientos
Puntaje del examen

Marca de clase

fi

hi

Fi

Hi

20
40

40

30

54

0,3103

54

0,3103

60

50

60

0,3448

114

0,6552

60

80

70

48

0,2759

162

0,9310

80

100

90

12

0,0690

174

1,0000

Fuente: Empresa A

Calcule e interprete la moda del puntaje.


10. Complete los siguientes textos:
La mediana de un conjunto de datos ordenados es el valor que divide en dos partes a
dicho conjunto. El .. son menores o igual a la mediana.
Usar la mediana como medida de tendencia central es preferible a usar la media cuando.
Notas importantes

Unidad 2. Medidas descriptivas

85

11. Calcule e interprete la moda de los siguientes datos, que corresponden al nmero de
errores ortogrficos por correo electrnico que cometen algunos gerentes de una empresa en una comunicacin escrita.
2

12. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

Verdadero

Falso

La mediana se puede calcular solo en variables cuantitativas


La media es un valor que siempre est entre el mnimo valor y el
mximo valor de los datos
Si se tienen datos simples se construye la distribucin de frecuencias para calcular la mediana.
La media se puede calcular solo en variables medidas en escala de
razn

13. Los siguientes datos corresponden a consumos, en nuevos soles, de alumnos en la cafetera de una universidad. Calcule la desviacin estndar y la varianza.
3,0

7,5

5,5

12,0

6,5

2,7

2,0

4,5

8,0

4,0

2,5

3,0

1,5

7,0

14. Los datos corresponden a las notas de 327 alumnos en la primera prctica de Estadstica
Descriptiva del ciclo anterior. Calcule la desviacin estndar muestral.
Distribucin de alumnos segn notas de la primera prctica de Estadstica Descriptiva
Nota

fi

hi

Fi

Hi

12

110

0,3364

110

0,3364

14

136

0,4159

246

0,7523

15

44

0,1346

290

0,8869

16

37

0,1131

327

1,0000

Fuente: Secretara Acadmica. Universidad A

15. Los datos muestran las ventas de 90 vendedores de una empresa en el ltimo mes.
Distribucin de vendedores segn volumen de venta en el ltimo mes
Ventas, en miles de dlares

Marca de clase

fi

hi

Fi

Hi

5,0

7,8

6,4

13

0,144

13

0,144

7,8

10,6

9,2

20

0,222

33

0,367

10,6

13,4

12,0

38

0,422

71

0,789

13,4

16,2

14,8

19

0,211

90

1,000

Fuente: Empresa A

Calcule la desviacin estndar muestral.


Notas importantes

86

Estadstica Descriptiva 201602

16. En una tienda, la desviacin estndar de los precios de los jeans es de 20 nuevos soles,
calcule la nueva desviacin estndar de los precios de los jeans si se realiza:
a. una rebaja del 6% de todos los precios,
b. una oferta y se rebaja ocho soles a cada precio.
17. El siguiente cuadro muestra la distribucin de los sueldos mensuales, en nuevos soles, de
los empleados de las empresas A y B.
Distribucin de empleados segn salario mensual de las empresas A y B
Sueldos

fi

Empresa A

Marca de
clase

[1 500 2 500]

2 000

]2 500 3 500]

Sueldos

fi

Empresa B

Marca de
clase

120

[3 000 3 500]

3 250

150

3 000

80

]3 500 4 000]

3 750

120

]3 500 4 500]

4 000

77

]4 000 4 500]

4 250

45

]4 500 5 500]

5 000

63

]4 500 5 000]

4 750

55

Fuente: Empresa A

Fuente: Empresa B

Cul de los grupos presenta mayor variabilidad de salarios?


Si en la empresa A hay un aumento de sueldo del 6%, mientras que en la empresa B se
da un aumento de sueldo del 4% y una bonificacin de 120 nuevos soles. Luego de los
aumentos, qu grupo presenta mayor variabilidad de salarios?
18. Los siguientes datos representan las notas de la primera prctica de alumnos de Estadstica Descriptiva. Calcule e interprete el percentil 25 de los siguientes datos.
Distribucin de alumnos segn notas de la primera prctica de Estadstica Descriptiva
xi

fi

hi

Fi

Hi

12

0,025

0,025

13

46

0,230

51

0,255

14

109

0,545

160

0,800

16

40

0,200

200

1,000

Fuente: Secretara Acadmica. Universidad A

19. Las notas de un curso de capacitacin sobre tributacin se muestran en la siguiente distribucin de frecuencias.
Distribucin de empleados segn notas del curso de capacitacin. Agosto 2015
Notas

Marca de clase

fi

hi

Fi

Hi

08 10

15

0,1056

15

0,1056

10 12

11

48

0,3380

63

0,4437

12 14

13

60

0,4225

123

0,8662

14 16

15

12

0,0845

135

0,9507

16 18

17

0,0493

142

1,0000

Fuente: Empresa A. Gerencia de RRHH


Notas importantes

Unidad 2. Medidas descriptivas

87

Calcule la nota mnima para estar en el quinto superior.


Calcule la nota mxima para estar en el 10% de las notas ms bajas.
Calcule el porcentaje de personas que tuvo notas menores o iguales a 13.
Calcule el porcentaje de personas que tuvo notas mayores a 12 y menores o iguales a
15,5.
20. Dados los siguientes datos, calcule e interprete el percentil 30 y el percentil 75.
38

45

20

20

10

12

18

28

18

23

11

15

21. En el artculo Estudios espaoles de crecimiento 2008. Nuevos patrones antropomtricos se muestra el siguiente grfico:

Tomado de http://www.sciencedirect.com/science/article/pii/S1575092208758455

Qu significa que para las jvenes de 18 aos el percentil 3 del peso sea 44 kilos?
Qu significa que para las jvenes de 19 aos el percentil 50 de la talla es 1,64 metros?
22. El tiempo, en meses, que viene laborando 51 trabajadores en una empresa se registra en
la siguiente tabla.
6

11

12

13

15

15

15

16

16

17

17

17

18

18

18

19

19

19

19

19

19

19

19

19

20

20

20

20

20

21

21

21

22

22

22

22

23

23

24

26

26

26

28

29

29

31

41

48

50

60

Calcule el rango y el rango intercuartil de los datos.


Notas importantes

88

Estadstica Descriptiva 201602

23. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

Verdadero

Falso

El percentil 90 es siempre mayor al percentil 10


El cuartil 2 es igual al decil 5
El percentil siempre se expresa en porcentaje
Si todos los pesos son iguales, la media ponderada es igual a la
media aritmtica
La media ponderada no tiene unidades

24. La siguiente tabla muestra informacin de los precios del artculo A (en nuevos soles) en
establecimientos elegidos al azar en el distrito de La Molina.
Distribucin de establecimientos de la Molina segn precios del artculo A
Intervalo de
clase

Marca de
clase

Frecuencia
absoluta

Frecuencia
relativa

Frecuencia absoluta acumulada

Frecuencia relativa acumulada

0,150

0,300

8,35

22

0,900

40

Fuente: Indecopi

Complete la tabla anterior si se sabe que el rango intercuartil es 0,8.


25. De datos sacados de la Intranet de la Universidad A, se desea comparar el resultado de la
primera prctica de tres horarios de un curso de estadstica, para lo cual, se tienen los siguientes resultados.
H1 10 11 11 12 12 12 12 13 13 13 14 15 15 16 16 17 18 18 19 19 19 20
H2

4 11 11 11 12 12 13 13 14 14 15 15 16 16 15 16 16 17 17 18

H3

9 10 10 10 11 12 12 12 12 13 13 13 13 14 14 15 15 15 17

Construya un diagrama de cajas que permita comparar el resultado de los horarios.


Indique el horario con mayor mediana de notas, el horario con mayor rango intercuartil
y el horario donde existen valores atpicos.
26. Complete el siguiente texto:
Los datos atpicos se define como ...
Se trazan los bigotes desde los ... de las cajas hasta los valores mnimo
y mximo ... de los lmites inferior y superior.
Notas importantes

Unidad 2. Medidas descriptivas

89

27. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

Verdadero

Falso

El coeficiente de asimetra tiene unidades las mismas unidades


que los datos
Si a cada valor de un grupo de datos se le aumenta en 10%, el
coeficiente de asimetra no vara
Si a cada valor de un grupo de datos se le aumenta 10 unidades, el
coeficiente de asimetra no vara
En un diagrama de cajas siempre se puede conocer el mximo y
mnimo de un grupo de datos

28. En un examen de Estadstica Descriptiva se tom la siguiente pregunta:


Con la intencin de conocer los hbitos y preferencias de los estudiantes acerca de los
productos naturales, se contrat los servicios de la consultora Data Mining Today S.A. la
cual elabor una encuesta para el estudio de mercado y se aplic a 400 estudiantes de
diferentes instituciones educativas. Algunos resultados fueron:
-

El 70% de los encuestados prefiere consumir productos naturales enlatados.


La fruta ms consumida es la manzana, seguida por el pltano y la pera.
El gasto promedio por semana en productos naturales es de 25 nuevos soles con
una desviacin estndar de 5 nuevos soles.
El 15% de los encuestados gasta ms de 28 nuevos soles semanales en productos
naturales.
El 50% de los encuestados tiene una edad superior a 20 aos.
El nmero promedio de vasos de yogurt consumidos durante la semana es de 6.

En base a esta informacin indique:

(1,5 puntos)

Poblacin
Variable cuantitativa continua
Variable cuantitativa discreta
Variable

Nombre del estadstico

Valor del estadstico

Tendencia central
Dispersin
Posicin

Lo siguiente es la respuesta de un alumno, pngale nota.


Poblacin

Los 400 estudiantes de diferentes instituciones educativas

Cuantitativa continua

Gasto promedio semanal en productos naturales

Cuantitativa discreta

Notas importantes

Nmero promedio de vasos de yogurt consumidos durante


la semana

90

Estadstica Descriptiva 201602

Variable
Tendencia
central
Dispersin

Nombre del estadstico

Fruta consumida

Moda

Manzana, pltano y

Gasto promedio semanal

Desviacin estndar

5 soles

Percentil

70

pera

en productos naturales
Tipo de producto prefe-

Posicin

Valor del estadstico

rido

29. El salario, en cientos de soles, de los trabajadores una empresa se presenta a continuacin:
13

12

13

14

15

15

15

18

23

24

24

25

25

36

42

48

60

Calcule el coeficiente de asimetra de Pearson


30. El siguiente cuadro muestra la distribucin de los sueldos mensuales de los empleados de
las empresas A y B.
Distribucin de empleados segn de sueldos mensuales en la empresa A y B
Sueldos
Empresa A

Marca de
clase

fi

[1 500 2 500]

2 000

]2 500 3 500]

Sueldos
Empresa B

Marca de
clase

fi

45

[3 000 3 500]

3 250

18

3 000

148

]3 500 4 000]

3 750

70

]3 500 4 500]

4 000

60

]4 000 4 500]

4 250

70

]4 500 5 500]

5 000

15

]4 500 5 000]

4 750

18

Verdadero

Falso

Fuente: Empresa A

Fuente: Empresa B

Calcule la asimetra de los dos grupos. Realice una conclusin


31. Indique si son verdaderas o falsas las siguientes afirmaciones.
Afirmacin
El coeficiente de variacin se puede calcular en escalas de intervalo y de razn
Si las unidades de los datos son minutos, la varianza se expresa
en minutos al cuadrado
El rango intercuartil se ve muy afectado por valores muy grandes o muy pequeos
El coeficiente de variacin tiene las mismas unidades que la
varianza

Notas importantes

Unidad 3 Unidad 3: Teora de la probabilidad


Logro de la unidad 3

Al finalizar la unidad 3,
el estudiante analiza situaciones reales de incertidumbre,
utilizando conceptos relacionados con probabilidades.

Temario

Reglas de conteo y combinaciones

Probabilidad: concepto, experimento aleatorio, espacio muestral y evento

Operaciones con eventos

Probabilidad condicional

Probabilidad total

Teorema de Bayes

Diagrama del rbol

Eventos independientes

Unidad 3. Teora de Probabilidad

93

Experimentos, reglas de conteo y asignacin de probabilidades


La probabilidad mide o cuantifica la posibilidad de ocurrencia de un evento.
La probabilidad es el lenguaje para describir y tratar la incertidumbre.

Marque con un aspa, asignando una opcin a la situacin descrita de acuerdo con su posibilidad de ocurrencia.
Situacin

Muy poco
probable

Poco
probable

Igualmente probable que ocurra


o que no ocurra

Bastante
probable

Muy
probable

El nuevo gobierno baje los


ndices de criminalidad
Aprobar este curso
Lanzo un dado y sale un
nmero par
El PBI del Per crecer 4%
este ao
Per se clasificar al
Mundial Rusia 2018

Experimento aleatorio
Es todo proceso que genera dos o ms resultados bien definidos sin que se pueda predecir con certeza cul de ellos ser observado u ocurrir en cada realizacin del proceso.
En cualquier repeticin simple de un experimento, ocurrir uno y solo uno de los posibles resultados experimentales.

Espacio muestral
Es el conjunto de todos los posibles resultados de todos los resultados experimentales.
Se le suele simbolizar por S o .

Evento
Un evento es un subconjunto del espacio muestral.
Al realizar un experimento, diremos que el evento A ha ocurrido si el resultado obtenido
es un elemento del evento A.

Notas importantes

94

Estadstica Descriptiva 201602

Probabilidad de un evento
La probabilidad es una medida numrica de la posibilidad de que ocurra un evento. Por
tanto, la probabilidad es una medida del grado de incertidumbre asociado con un evento.
Los valores de la probabilidad siempre se asignan en una escala de 0 a 1.
Una probabilidad cercana a 0 indica que es difcil que el evento ocurra, mientras que,
una probabilidad cercana a 1 indica que es casi seguro que el evento ocurra.
Poca probabilidad
de ocurrencia

Alta probabilidad
de ocurrencia

0,5

La ocurrencia del evento es


tan probable como improbable

Ejemplo 12
Sea el experimento aleatorio Una app se ofrece por App Store y se registra el nmero
de descargas en un da. Indique el espacio muestral definido, un evento y asigne una
probabilidad de ocurrencia a dicho evento.
Experimento
aleatorio
Una app se
ofrece por App
Store y se
registra el
nmero de
descargas en
un da

Espacio muestral

S = {0, 1, 2,
3, 4, 5, 6, 7,
...}

Evento

A = que el
nmero de
descargas
sea mayor a
5 = {6, 7, ....}

Probabilidad

P(A) = 0,10

Sea el experimento aleatorio El seleccionado femenino de voleibol del Per juega un


partido frente a su similar de Brasil y se registra el resultado. Indique el espacio muestral definido, un evento y asigne una probabilidad de ocurrencia a dicho evento.

Experimento
aleatorio

Notas importantes

Espacio muestral

S = {

Evento

A = {

Probabilidad

P(A) =

Unidad 3. Teora de Probabilidad

95

Sea el experimento aleatorio Una persona que tiene mucha experiencia invierte en la
Bolsa de Valores y se registra si tiene utilidades o no. Indique el espacio muestral definido, un evento y asigne una probabilidad de ocurrencia a dicho evento.

Experimento
aleatorio

Espacio muestral

S = {

Evento

A = {

Probabilidad

P(A) =

Sea el experimento aleatorio Leo Messi, jugando por su seleccin, va a disparar un penal en la definicin de penales de una copa y se registra el resultado, indique el espacio
muestral definido, un evento y asigne una probabilidad de ocurrencia a dicho evento.

Experimento
aleatorio

Espacio muestral

S = {

Evento

A = {

Probabilidad

P(A) =

Sea el experimento aleatorio Un sistema mide la actividad ssmica en la ciudad de Lima


y se registra si hay un terremoto en el ao 2017, indique el espacio muestral definido,
un evento y asigne una probabilidad de ocurrencia a dicho evento.

Experimento
aleatorio

Espacio muestral

S = {

Evento

A = {

Probabilidad

P(A) =

Sea el experimento aleatorio Una persona invierte en un negocio muy riesgoso y registra el nmero de veces que invirti hasta tener el primer xito. Indique el espacio
muestral definido, un evento y asigne una probabilidad de ocurrencia a dicho evento.

Experimento
aleatorio

Notas importantes

Espacio muestral

S = {

Evento

A = {

Probabilidad

P(A) =

96

Estadstica Descriptiva 201602

Definicin clsica de la probabilidad de un evento


Sea un experimento aleatorio cuyo correspondiente espacio muestral S est formado
por un nmero n finito de posibles resultados distintos y con la misma probabilidad de
ocurrir, entonces definimos la probabilidad de un evento como:

P(A)

nA nmero de casos favorables al evento A

nS
nmero total de casos

Ejemplo 13
Sea el experimento aleatorio Lanzar un dado y anotar el nmero de puntos de la cara
superior, indique el espacio muestral definido, un evento e indique su probabilidad de
ocurrencia.
Solucin
Experimento
aleatorio
Lanzar un
dado y anotar
el nmero de
puntos de la
cara superior

Espacio muestral

S = {1 2, 3, 4,
5, 6}

Evento

A = {1 , 3, 5}

Probabilidad

P(A) = n(A) /
n(S) = 3/6 =
0,5

Ejemplo 14
Sea el experimento aleatorio Lanzar dos dados y anotar el nmero de puntos de cada
cara superior, indique el espacio muestral definido, un evento e indique su probabilidad de ocurrencia.
Solucin
Experimento
aleatorio
Lanzar dos
dados y anotar
el nmero de
puntos de
cada cara
superior

Espacio muestral

S = {(1,1);
(1,2); (1,3);
.... (6,6)}

Evento

A = {(1,1);
(2,2); (3,3);
(4,4); (5,5);
(6,6)}

Probabilidad

P(A) =
n(A) / n(S) =
6/36 = 1/6

Sea el experimento aleatorio Lanzar dos monedas y anotar el resultado, indique el espacio muestral definido, un evento e indique su probabilidad de ocurrencia.
Solucin
Experimento
aleatorio
Lanzar dos
monedas y
anotar el
resultado

Notas importantes

Espacio muestral
S = {

Evento
A =

Probabilidad
P(A) =
n(A) / n(S) =

Unidad 3. Teora de Probabilidad

97

Algunas relaciones bsicas de probabilidad


Con frecuencia se construyen eventos mediante la combinacin de eventos ms sencillos. Es usual emplear la notacin de conjuntos para describir los eventos construidos de
esta forma.
Sea un experimento aleatorio y S el espacio muestral asociado. Si A y B son dos eventos definidos en S, se define las siguientes operaciones con eventos.

Complemento (AC)
Para un evento A cualquiera se define su complemento A C como el evento consistente
en todos los puntos de S que no estn en A.

Se tiene que:
P(AC) = 1 - P(A)
AC se expresa como: El evento A no ocurre

Diego invierte en un negocio. Escriba el evento complementario al evento A:= Diego tiene xito en el negocio.

Una gerente toma diez decisiones en su empresa. Escriba el evento complementario al


evento A:= La gerente tiene razn en menos de cuatro de las decisiones.

Complete los espacios en blanco.


La probabilidad de que una empresa gane una licitacin es 0,60, por lo tanto, la probabilidad de que no la gane .
La probabilidad de que una persona gane la Tinka con una jugada es del 0,0000123%,
por lo tanto, la probabilidad de que no la gane en una jugada es %.
Notas importantes

98

Estadstica Descriptiva 201602

Unin de eventos (A B)
Para dos eventos A y B, la unin del evento A con el evento B es el evento que contienen
todos los puntos de S que pertenecen a A o a B o a ambos.

A B se expresa como: Al menos uno de los eventos A o B ocurre.

Interseccin de eventos (A B)
Para dos eventos A y B, la interseccin de los eventos A y B es el evento que contienen
todos los puntos de S que pertenecen tanto a A como a B.

A B se expresa como: Ambos eventos, A y B ocurren a la vez.

Diferencia de eventos (A - B)
Para dos eventos A y B, la diferencia de los eventos A y B es el evento que contienen todos los puntos de S que pertenecen a A y no pertenecen a B.

A B se expresa como: Ocurre el evento A pero no el evento B

Notas importantes

Unidad 3. Teora de Probabilidad

99

Diferencia simtrica de eventos (A B)


Para dos eventos A y B, la diferencia simtrica de los eventos A y B es el evento que contienen todos los puntos de S que pertenecen solo a A o aquellos que solo pertenecen a
B.

A B se expresa como: Ocurre solamente uno de los eventos A o B

Una financista invierte en fondos mutuos y en la Bolsa de Valores. Se definen los eventos:
A:= que la financista tenga xito en la inversin de fondos mutuos
B:= que la financista tenga xito en la inversin en la Bolsa de Valores.
Escriba los siguientes eventos en funcin de los eventos A y B. Adems, grafique dicho
evento en un diagrama de Venn.
Evento
que la financista tenga xito en las dos
inversiones
que la financista no tenga xito en la Bolsa
de Valores
que la financista tenga xito en, al menos
una, de sus inversiones
que la financista tenga xito solamente en
una de sus inversiones
que la financista tenga xito en la Bolsa de
Valores, pero no en los fondos mutuos

Notas importantes

Notacin
A ... B

Diagrama de Venn

100

Estadstica Descriptiva 201602

Eventos mutuamente excluyentes


Dos eventos son mutuamente excluyentes o disjuntos si no tienen puntos de S en comn. Los eventos A y B son mutuamente excluyentes si y solo si A B = .

Indique si los siguientes eventos son mutuamente excluyentes.


A: Estudio mucho el curso Estadstica, B: Desapruebo el curso Estadstica .
A: Apruebo el curso Estadstica, B: Desapruebo el curso Estadstica.................
Tengo cinco soles, A: Compro un sndwich que cuesta cuatro soles, B: Compro una gaseosa que cuesta dos soles .

Reglas de conteo y combinaciones


Regla de la adicin
Si A y B son eventos mutuamente excluyentes, entonces
n(A U B) = n(A) + n(B)
Caso Aerolnea Wayra
En un da, una persona puede viajar de Lima a Cusco en cualquiera de los diez vuelos
diarios directos o en cualquiera de los tres vuelos con escala en Ayacucho. De cuntas
maneras diferentes puede viajar una persona de Lima a Cusco por dicha aerolnea?

Notas importantes

Unidad 3. Teora de Probabilidad

101

Regla de la multiplicacin
Si un experimento se realiza por una sucesin de k pasos, el primer paso tiene n1 resultados posibles, el segundo tiene n2 resultados posibles y as sucesivamente, entonces el
nmero total de resultados del experimento es n1 x n2 x x nk.
Caso Aerolnea Wayra
Un pasajero puede elegir, en el men de primera clase, una de tres entradas diferentes,
uno de cuatro segundos y uno de tres postres. De cuntas maneras diferentes puede
elegir un pasajero su men?

Regla de conteo para combinaciones


La cantidad de formas de seleccionar x objetos de un total de n objetos distinguibles sin
tomar en cuenta el orden es:
C xn

n!
x! n x !

Caso Aerolnea Wayra


Objetivo especfico: Establecer una poltica de inspeccin exhaustiva de pasajeros.
En cada vuelo se elegir al azar al 5% de los pasajeros para realizar una inspeccin exhaustiva, la cual detecta si una persona lleva sustancias ilegales. Si en un vuelo de 120
personas, hay tres personas que llevan sustancias ilegales. Calcule la probabilidad de detectar al menos a una de ellas.

Axiomas de la probabilidad
Sea un experimento aleatorio, S el espacio muestral asociado a dicho experimento aleatorio y A un evento definido en S, entonces la probabilidad del evento A, denotada por
P(A), es aquel nmero que cumple los siguientes axiomas:
Axioma 3
Axioma 1

Axioma 2

0 P(A) 1

P(S) = 1

Notas importantes

Si A y B son dos eventos


mutuamente excluyentes entonces:
P(A B) = P(A) + P(B)

102

Estadstica Descriptiva 201602

Ley aditiva para eventos cualesquiera


Sean A, B y C tres eventos cualesquiera, se cumple que:
P(A B) = P(A) + P(B) P(A B)

P(A B C)= P(A) + P(B) + P(C) - P(A B) - P(A C) - P(B C) + P(A B C)

Caso Aerolnea Wayra


La probabilidad que la aerolnea Wayra quiebre en los prximos dos aos es de 0,3 y que
su empresa rival quiebre en esos dos aos es de 0,5; mientras que la probabilidad de
que no quiebre ninguna de las dos empresas en esos dos aos es 0,4.
Defina los eventos necesarios para resolver este problema:
A:=
B:=
Calcule la probabilidad de que ocurran los siguientes eventos:
Evento
que quiebre alguna de las dos aerolneas

Probabilidad
P(A B)=

que quiebre solo una de las aerolneas

P(A B)=

que quiebre solo la aerolnea rival de


Wayra

P(A B)=

que no quiebre alguna de las dos aerolneas

P(A B)=

Notas importantes

Diagrama de Venn

Unidad 3. Teora de Probabilidad

103

Probabilidad condicional
La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo
cierta informacin (condicin).
P A B

P A B
P B

Ejemplo 15
En un grupo, conformado por hombres y mujeres, existen profesionales y no profesionales de acuerdo con la siguiente tabla.
Hombres (H)

Mujeres (M)

Total

Profesionales (P)

No profesionales (N)

10

17

12

20

Total

Si se elige una mujer al azar, calcule la probabilidad de que sea profesional.


Solucin
Primero, definamos los eventos necesarios para resolver este problema:
M:= Que la persona escogida sea mujer
P:= Que la persona escogida sea profesional mujer

Notas importantes

104

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo especfico: Analizar el comportamiento de los clientes considerando el destino
de viaje, el tipo de cliente y el modo de compra. Dentro de su proceso de creacin de
reportes, Felipe ha obtenido la siguiente tabla:
Destino de viaje nacional

Destino de viaje internacional

Compra
presencial

Compra por
Internet

Compra
presencial

Compra por
Internet

Premiun

12

28

38

13

Frecuente

25

12

23

Ocasional

15

10

Tipo de cliente

Total

Total

Calcule la probabilidad de que una persona elegida al azar no compre pasajes por Internet y tenga un destino de viaje nacional.
Si se elige al azar a un cliente ocasional, calcule la probabilidad de que compre pasajes
por Internet.
Si la probabilidad de que un cliente viaje dentro del pas supera a 0,6, se decidir participar del prximo Cyber Day. Qu decisin se tomar?
Solucin
Defina los eventos necesarios para resolver este problema:
:=
:=
:=
:=
:=
Pregunta
Calcule la probabilidad de que una persona
elegida al azar no compre pasajes por Internet y tenga un destino de viaje nacional.

Probabilidad
P() =

Si se elige al azar a un cliente ocasional,


calcule la probabilidad de que compre pasajes por Internet.

P() =

Si la probabilidad que un cliente viaje dentro


del pas supera a 0,6, se decidir participar
del prximo Cyber Day. Qu decisin se
tomar?

P() =

Notas importantes

Unidad 3. Teora de Probabilidad

105

Ejemplo 16
El gerente de Wallmarket al distribuir los productos en las diferentes tiendas toma una
muestra de 250 unidades de los tres productos y en los dos tipos de envases, del almacn con la idea de distribuirlos aleatoriamente en las tiendas. La distribucin de los productos es la siguiente:

Tipo de producto
Jugo
Mermelada
Esencia
Total

Tipo de presentacin
Frasco
Sachet
62
50
38
50
30
20
130
120

Total
112
88
50
250

Si se elige un producto al azar, para una de las tiendas,


a. Cul es la probabilidad de que sea jugo de maracuy y en frasco?
Lo primero es definir los eventos necesarios.
J:= que el producto elegido sea jugo
F:= que la presentacin elegida sea frasco
En la tabla observamos que lo pedido es:
Tipo de presentacin
Tipo de producto
Total
Frasco
Sachet
Jugo
62
50
112
Mermelada
38
50
88
Esencia
30
20
50
Total
130
120
250
62
( ) =
= 0,248
250
b. Cul es la probabilidad de que sea mermelada o el envase sea de sachet?
Sean los eventos
M:= que el producto elegido sea mermelada
S:= que la presentacin elegida sea sachet
En la tabla observamos que lo pedido es:
Tipo de presentacin
Tipo de producto
Frasco
Sachet
Jugo
62
50
Mermelada
38
50
Esencia
30
20
Total
130
120

( ) = () + () ( ) =

Notas importantes

Total
112
88
50
250

88 120 50
+

= 0,632
250 250 250

106

Estadstica Descriptiva 201602

c. Si el envase es sachet, cul es la probabilidad de que sea esencia?


Sean los eventos
E:= que el producto elegido sea esencia
S:= que la presentacin elegida sea sachet
En la tabla observamos que lo pedido es:
Tipo de presentacin
Tipo de producto
Frasco
Sachet
Jugo
62
50
Mermelada
38
50
Esencia
30
20
Total
130
120
20
(/) =
= 0,167
120

Total
112
88
50
250

Ejemplo 17
La mayora de las estaciones de servicio venden tres tipos de gasolina: 90 octanos, 95
octanos y 97 octanos. Con frecuencia, alguna de cada est enriquecida con un aditivo. La
tabla siguiente ilustra los porcentajes de clientes que prefieren cada tipo.
90 octanos (B)

95 octanos (C)

97 octanos (D)

Total

Con aditivo (A)

0,05

0,10

0,05

0,20

Sin aditivo (AC)

0,15

0,40

0,25

0,80

0,20

0,50

0,30

1,00

Total

Se selecciona al azar un cliente que ha comprado uno de estos tipos de gasolina.


Solucin
Cul es la probabilidad de que haya comprado gasolina con aditivo o no sea de 95 octanos?

P A C c PA P C c P A C c 0,20 0,50 (0,05 0,05) 0,60


Si el cliente no compr gasolina de 95 octanos, cul es la probabilidad de que hay comprado gasolina de 97 octanos?

P D Cc

P(D C c ) 0,30

0,60
0,50
P Cc

Si el cliente no compr gasolina de 90 0ctanos, cul es la probabilidad de que haya


comprado gasolina sin aditivo?

65
PA B 00,,80
0,8125
PB

P Ac Bc

Notas importantes

Unidad 3. Teora de Probabilidad

107

Ejemplo 18
Los productos de Exprtame, una empresa exportadora de producto agrcolas, tienen
buena acogida en el mercado nacional. El supermercado Sper adquiere un lote pero
conoce que algunos envases estn defectuosos. La distribucin de los productos en el lote se muestra en las siguientes grficas:
Distribucin de productos por tipo
Esencia
28%

Jugo
35%

Mermelada
37%
Fuente: Supermercados Sper

La distribucin de los productos en el lote que son defectuosos se muestran en la siguiente grfica
Distribucin de porudcutos segn estado del envase por
tipo de producto

Porcentaje

100%

80%
60%
40%
20%
0%
Jugo

Fuente: Supermercados Sper

98%

98,5%

96,0%

2,0%

1,5%

4,0%

Mermelada

Buen estado

Defectuoso

Esencia

Tipo de producto

Solucin
a. Si se elige un producto al azar y el porcentaje de envases defectuosos es menor al
4%, el gerente de supermercados Sper decidir adquirir un lote mayor al actual.
Qu decisin tomar el gerente de Sper?
Producto
Jugo
Mermelada
Esencia
Total

Defectuoso
0,007
0,006
0,011
0,024

Buen estado
0,343
0,364
0,269
0,976

Total
0,35
0,37
0,28
1,00

P(defectuoso) = 0,024. El gerente decidir adquirir un lote mayor de productos


b. Si el envase est en buen estado, qu tan probable es que sea de esencia?
P(Esencia /buen estado) = 0,269/0,976 = 0,2756

Notas importantes

108

Estadstica Descriptiva 201602

Ley multiplicativa para eventos cualesquiera


La ley multiplicativa se usa para calcular la probabilidad de una interseccin de eventos.

PA B PAPB / A PBPA / B
Caso Aerolnea Wayra
Un sistema de seguridad en un avin tiene dos componentes. La probabilidad de que el
primer componente falle es 0,5% y la probabilidad de que el segundo componente falle
si el primero ha fallado es 3%. El sistema falla si ambos componentes fallan. Calcule la
probabilidad de que falle el sistema de seguridad.

rbol de probabilidades

Si los eventos Ai y Bi son independientes, el rbol de probabilidades se simplifica dado


que las probabilidades condicionales seran iguales a las probabilidades simples correspondientes.

Notas importantes

Unidad 3. Teora de Probabilidad

109

Particin del espacio muestral


Sean los k eventos A1, A2, A3,..., Ak mutuamente excluyentes y tales que entonces constituyen una particin del espacio muestral S.

Probabilidad total
Sean los k eventos A1, A2, A3,..., Ak, mutuamente excluyentes y que constituyen una particin del espacio muestral S, entonces para cualquier evento B de S se cumple:

PB PB A1 PB A2 PB A3 ... PB Ak
Por la ley multiplicativa de eventos cualesquiera, se tiene finalmente que:

PB PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

Teorema de Bayes
Si los k eventos A1, A2, A3, ..., Ak, constituyen una particin del espacio muestral S, entonces para cualquier evento B de S tal que P(B) > 0, se cumple:
P Ai B

P Ai B
P B

Por definicin de probabilidad condicional y probabilidad total se tiene que:

PAi B

PAi PB / Ai
PA1 PB / A1 PA2 PB / A2 ... PAk PB / Ak

El teorema de Bayes establece una relacin muy importante en la teora de probabilidades y es la base para la revisin de la asignacin de probabilidades a la luz de informacin adicional.

Probabilidades
a priori

Notas importantes

Informacin
nueva

Teorema de
Bayes

Posibilidades
posteriores

110

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo especfico: Evaluar la situacin de incidentes mecnicos de los aviones y su reparacin dentro de las 24 horas con la finalidad de dar un bono de reconocimiento a los
mecnicos.
Se sabe que el 30% de los incidentes mecnicos ocurren con el avin 1, el 50% en el
avin 2 y el resto con el avin 3. Asimismo, la probabilidad que el avin 1 sea reparado
dentro de las 24 horas despus de ocurrido el incidente es 90%, de 73% para el avin 2 y
de 65% para el avin 3.
Si se elige en forma aleatoria un informe por incidente de un avin, cul es la probabilidad que el informe indique que el avin logr ser reparado dentro de las 24 horas?
Si el informe dice que el avin no fue reparado dentro de las 24 horas, de cul de los
aviones es ms probable que sea el informe?
Solucin
Los eventos y el rbol de probabilidades necesarios para resolver este problema son:
.:=
.:=
.:=

Si se elige en forma aleatoria un informe por incidente de un avin, cul es la probabilidad que el informe indique que el avin logr ser reparado dentro de las 24 horas?

Si el informe dice que el avin no fue reparado dentro de las 24 horas, de cul de los
aviones es ms probable que sea el informe?

Notas importantes

Unidad 3. Teora de Probabilidad

111

Ejemplo 19
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de los usuarios ha sufrido de algn tipo de robo durante el uso del Metropolitano.
a. Si se elige un usuario al azar, cul es la probabilidad de que haya sido vctima de robo?
Sean los eventos
R:= Que el usuario sea vctima de robo
H:= Que el usuario sea hombre.
M:= Que el usuario sea mujer
() = (). ( ) + (). ()= 0,0044 + 0,0045 = 0,0089
b. Si se elige un usuario al azar que no ha sido vctima de robo, calcule la probabilidad
de que sea hombre. Indique el resultado con cuatro decimales.
( ) =

0,55 0,992
10,0089

= 0,5505

Ejemplo 20
Exprtame, una empresa que exporta productos alimenticios, distribuye sus productos
de la siguiente manera: 45% en jugo, 35% en mermelada y el resto en esencia. Adems,
se sabe que la probabilidad de que un jugo est en mal estado es 4%, una mermelada es
2% y una esencia es 3%.
a. Si se selecciona un producto al azar, calcule la probabilidad de que el producto est
en mal estado.
Sean los siguientes eventos:
J:= que el producto elegido sea jugo
M:= que el producto elegido sea mermelada
E:= que el producto elegido sea esencia
B:= que el producto elegido est en buen estado
Completemos el cuadro con los datos del problema.
Producto
Jugo
Mermelada
Esencia
Total

Mal estado
0,018
0,007
0,006
0,031

Buen estado
0,432
0,343
0,194
0,969

Total
0,45
0,35
0,20
1,00

b. Si se selecciona un producto al azar, calcule la probabilidad de que est en buen estado.


Para resolver este problema usaremos el teorema de la probabilidad total.
() = ()() + ()() + ()( )
= 0,432 + 0,343 + 0,194 = 0,969

Notas importantes

112

Estadstica Descriptiva 201602

c. Si de los productos en mal estado se selecciona uno al azar, calcule la probabilidad de


que sea jugo.
Para resolver este problema usaremos el teorema de la probabilidad de Bayes.
( )
()( )
( ) =
=
( )
()( ) + ()( ) + ()( )
0,018
0,018
=
=
= 0,5806
0,018 + 0,007 + 0,006 0,031
Ejemplo 21
El departamento de crditos de una tienda comercial sabe que sus ventas se pagan con
dinero en efectivo, con cheque o al crdito, con probabilidades respectivas de 0,3; 0;3 y
0,4. La probabilidad de que una venta sea por ms de $50, es igual a 0,2 si sta es en
efectivo, es igual a 0,9 si sta es con cheque y es igual a 0,6 si sta es al crdito.
Cul es la probabilidad de que una persona compre por ms de $50?
Si compra por ms de $50, qu es ms probable que haya pagado en efectivo, con cheque o al crdito?
Solucin
Sean los eventos:
E: La compra se realiza con dinero en efectivo
CH: La compra se realiza con cheque
C: La compra se realiza al crdito
M: La compra es por ms de $ 50
MC: La compra no es por ms de $ 50
Con la informacin proporcionada, construimos el siguiente diagrama de rbol:

Se pide calcular:

PM 0,30 0,20 0,30 0,90 0,40 0,60 0,57


P E / M

0,30 0,20 2

0,57
19

P C / M

0,40 0,60 8

0,57
19

P CH / M

0,30 0,90 9

0,57
19

Se observa que es ms probable la compra se haya hecho con cheque.

Notas importantes

Unidad 3. Teora de Probabilidad

113

Eventos independientes
Si P A 0 , los eventos A y B son independientes si y solo si:

P A B P A

Ley de la multiplicacin para eventos independientes


Si dos eventos A y B son independientes se cumple que

PA B PAPB
Tres eventos A, B y C son independientes si se cumple que:

PA B PAPB
PA C PAPC
PB C PBPC
P(A B C ) P(A)P(B)P(C )
Caso Aerolnea Wayra
Objetivo especfico: Hacer un reporte sobre la compra de pasajes usando el canal de Internet considerando diferentes tipos de clientes.
La probabilidad que un cliente premium compre un pasaje usando Internet es 13% y,
que un cliente frecuente haga la compra por esta va es 46%. Si un da cualquiera, dos
clientes (uno de cada tipo) que no se conocen (por lo tanto la decisin de compra de
uno no influye en el otro), deciden comprar un pasaje:
Cul es la probabilidad que por lo menos uno de los clientes compre su pasaje va Internet?

Si la probabilidad de que exactamente uno de los clientes haya utilizado Internet en su


compra es inferior a 0,30, se rebajar el costo de los pasajes. Qu decisin se tomar?

Notas importantes

114

Estadstica Descriptiva 201602

Si se tiene un grupo de 30 clientes premium que no se conocen entre s, calcule la probabilidad de que al menos uno de ellos compre su pasaje por Internet.

Si se tiene un grupo de 30 clientes premium que no se conocen entre s, calcule la probabilidad de que al menos dos de ellos compren sus pasajes por Internet.

Notas importantes

Unidad 3. Teora de Probabilidad

115

Ejercicios de la Unidad 3
32. Indicar, para cara uno de los siguientes experimentos aleatorios, los respectivos espacios
muestrales: lanzar una moneda, jugar un partido de ftbol, jugar un partido de tenis, lanzar un dado, lanzar dos dados.
33. Un experimento consiste en lanzar primero un dado para despus lanzar una moneda,
siempre y cuando el nmero del dado sea par. Si el resultado del dado es impar, la moneda se lanza dos veces. Determine el espacio muestral de este experimento.
34. Se lanzan dos dados, calcule la probabilidad de que la suma de los dos dados sea mayor a
siete.
Rpta: 0,4167
35. Un fabricante de telfonos celulares acaba de lanzar dos modelos de smartphones
econmicos: el L720 y el L520. La probabilidad de que el modelo L720 tenga xito es 0,70
y en el modelo L520 es 0,60. La probabilidad de que al menos uno de los modelos tenga
xito es 0,90. Determine la probabilidad de que se tenga xito solo en uno de los
modelos.
Rpta: 0,5
36. En el presente ao, la probabilidad de que una persona viaje a Miami es 0,40; a Mncora
es 0,5 y Madrid es 0,37. Adems, la probabilidad de viajar a Miami y Mncora es 0,15; a
Miami y Madrid es 0,10 y de Mncora y Madrid es 0,12. Si la probabilidad de que la
persona viaje a por lo menos a una ciudad es 0,95; calcule la probabilidad de que la
persona viaje a una sola ciudad.
37. En un hogar hay diez personas y un encuestador necesita entrevistar a dos de ellas, sin
importar el orden. De cuntas maneras diferentes se puede elegir a esas dos personas?
38. Al fin del ciclo, los 30 alumnos de una seccin deben elegir a tres de ellos al azar para que
organicen un compartir. Cuntos grupos diferentes de tres personas se pueden elegir?
39. De 50 conductores, 9 nueve no tienen los papeles en regla. Si un polica escoge al azar a
cinco conductores y les pide sus papeles,
a. Calcule la probabilidad de que elija a dos que no tengan los papeles en regla.
b. Calcule la probabilidad de que elija al menos un conductor sin papeles en regla.
40. En un lote de polos, hay 70 polos rojos, 150 blancos y 90 azules. Si extrae un polo al azar.
a. Cul es la probabilidad de que el polo sea azul o blanco?
b. Cul es la probabilidad de que no sea azul?
41. Segn el II Censo Universitario, en el ao 2010, 63 900 alumnos ingresaron a las universidades pblicas y 194 151 a las universidades privadas. De ellos, en las universidades pblicas, 28 798 ingresantes fueron mujeres, mientras que en las privadas lo fueron 98 942.
Si se elige al azar a una ingresante, calcule la probabilidad de que estudie en una universidad privada.
Si se elige al azar a un ingresante de universidad privada, calcule la probabilidad de que
sea mujer.
Notas importantes

116

Estadstica Descriptiva 201602

42. En los Censos Nacionales 2007 ejecutados por el Instituto Nacional de Estadstica e Informtica se pregunt a todos los peruanos por los servicios de comunicacin con los que
contaba su hogar y su rea de residencia, obtenindose los siguientes resultados:
Servicios con que los cuenta el hogar
Hogares sin ningn tipo de servicio
Solo tienen telfono fijo
Solo tienen telfono celular
Solo tienen Internet
Solo tienen TV por cable
Tienen telfono fijo y telfono celular
Tienen telfono fijo e Internet
Tienen telfono fijo y TV por cable
Tienen telfono celular e Internet
Tienen telfono celular y TV por cable
Tienen Internet y TV por cable
Tienen telfono fijo, telfono celular e Internet
Tienen telfono fijo, telfono celular y TV por cable
Tienen telfono fijo, Internet y TV por cable
Tienen telfono celular, Internet y TV por cable
Los cuatro servicios
Total

Urbano
1 682 454
480 831
1 299 037
3 336
56 343
506 759
15 684
117 733
9 970
204 563
1 288
93 103
326 181
19 732
15 424
298 911
5 131 349

Rural
1 468 889
6 170
138 721
275
2 688
2 912
31
186
84
1 981
19
110
468
9
49
133
1 622 725

Total
3 151 343
487 001
1 437 758
3 611
59 031
509 671
15 715
117 919
10 054
206 544
1 307
93 213
326 649
19 741
15 473
299 044
6 754 074

a. Si se selecciona al azar un hogar de zona urbana, cul es la probabilidad de que


tenga cuatro servicios?
b. Si se selecciona al azar un hogar con tres servicios, cul es la probabilidad de que
sea de zona urbana?
c. Si se selecciona al azar un hogar de zona rural, cul es la probabilidad de que cuente con tres servicios por lo menos?
d. Si se selecciona al azar un hogar de zona urbana, cul es la probabilidad de que no
tenga ningn servicio?
e. Si se selecciona un hogar al azar, cul es la probabilidad de que sea de zona urbana
y los cuatro servicios?
f.

Si se selecciona un hogar al azar, cul es la probabilidad de que sea de zona rural o


no cuente con servicio alguno?

43. En una empresa hay 150 trabajadores; 25 de los hombres y 35 de las mujeres realizan actividades de responsabilidad social en la empresa. El total de mujeres en la empresa es
de 57.
a. Si elegimos al azar a un trabajador hombre, calcule la probabilidad de que realice actividades de responsabilidad social.
b. Si elegimos al azar a un trabajador que no realice actividades de responsabilidad social, calcule la probabilidad de que sea mujer.
c. Si elegimos al azar a un trabajador que realice actividades de responsabilidad social
y que sea mujer.
Notas importantes

Unidad 3. Teora de Probabilidad

117

44. Para elegir a una persona entre tres se prepara una bolsa con dos bolas negras y una bola
blanca. Los tres van sacando, por orden, una bola que no devuelven. Quien saque la bola
blanca gana. Quin lleva ms ventaja: el primero, el segundo o el tercero?
45. En una empresa el 35% de los trabajadores son mujeres y el 65% son hombres. Un da ha
llegado tarde a trabajar el 2% de las mujeres y el 4% de los hombres.
a. Si se elige, al azar, a un trabajador calcule la probabilidad de que haya llegado tarde.
b. Si se elige, al azar, a un trabajador que ha llegado tarde, calcule la probabilidad de
que sea elegido una mujer.
46. Una empresa que fabrica polos mediante tres mquinas, A, B y C, producen el 25%, 30%
y 45%, respectivamente, del total de los polos producidos en la fbrica. Los porcentajes
de produccin defectuosa de estas mquinas son del 2%, 4% y 3% respectivamente.
a. Si se elige un polo al azar; calcule la probabilidad de que sea no defectuoso.
b. Tomamos, al azar, un polo y resulta ser defectuoso; calcule la probabilidad de haber
sido producido por la mquina B.
47. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es independiente entre s.
a. Cul es la probabilidad de que al menos sea aceptado en uno de los trabajos?
b. Cul es la probabilidad de que solamente sea aceptado en uno solo de los trabajos?
48. El pulpo Paul es un octpodo que ha sido empleado como orculo para predecir los resultados de la seleccin alemana de ftbol en el Mundial de Ftbol 2010, acertando los
ocho emparejamientos que se le propusieron, los siete partidos de Alemania en la Copa
Mundial de Ftbol de 2010 y la final entre Espaa y Holanda.
Antes de cada partido, a Paul se le presentaron dos contenedores idnticos con comida:
uno de ellos estaba marcado con una bandera, usualmente la de Alemania y el otro con
la bandera del equipo oponente. La eleccin de Paul se interpretaba como el equipo que
lograra la victoria. Si el pulpo Paul, en realidad, escogi los contenedores al azar, calcule
la probabilidad de acertar en los resultados de los ocho los partidos que le propusieron.
Asuma independencia entre cada eleccin.
49. Una persona postula a dos trabajos. La probabilidad de que sea aceptado en el primer
trabajo es del 70% y que sea aceptado en el segundo es del 50%. Si ser aceptado en dichos trabajos es independiente entre s.
a. Cul es la probabilidad de que al menos sea aceptado en uno de los trabajos?
b. Cul es la probabilidad de que solamente sea aceptado en uno de los trabajos?
50. Un joven estima, por experiencias pasadas, que en una gran fiesta la probabilidad de que
en una chica acepte bailar con l es del 4%. Si en una fiesta saca a bailar a 40 chicas.
Asuma independencia entre la decisin de una chica y otra. Calcule la probabilidad de
que baile por lo menos con una de ellas.
Notas importantes

118

Estadstica Descriptiva 201602

51. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

El teorema de Bayes determina la probabilidad de un determinado evento se deba


a una causa especfica

La probabilidad condicional se refiere a hallar la probabilidad de un evento conociendo cierta informacin (condicin).

Si PA B 0,3 , entonces, se cumple que P A B c 0,7

Si dos eventos son independientes, entonces sern tambin mutuamente excluyentes

Si dos eventos son independientes, entonces P A B P B

Si dos eventos son independientes entonces la ocurrencia de uno de ellos no influye en la ocurrencia del otro evento

Si P A B P A esto implica que A y B son eventos mutuamente excluyentes

Si P A B P A esto implica que A y B son eventos independientes

El espacio muestral es el conjunto de todos los posibles eventos de un experimento


aleatorio

En un experimento aleatorio nunca aparece un modelo definido de regularidad

En algunos casos especiales la probabilidad de un evento podra ser mayor que uno

Un evento es un subconjunto del experimento aleatorio.

Si dos eventos son mutuamente excluyentes entonces la ocurrencia de uno de ellos


no influye en la ocurrencia del otro

El complemento del evento A no es mutuamente excluyente con el evento A

Si dos eventos son mutuamente excluyentes, entonces P(A) + P(B) = 1

Si PA B 0,3 , entonces, se cumple que P AC B 0,7

Si P A B 0 esto implica que A y B son eventos mutuamente excluyentes, si

P(B)>0

Notas importantes

Unidad 4 : Variables aleatorias


Logro de la unidad 4

Al finalizar la unidad 4,
el estudiante toma decisiones responsables
en un escenario real de investigacin,
aplicando conceptos de variable aleatoria, valor esperado y probabilidad.

Temario

Definicin de variable aleatoria discreta y continua.

Funcin de probabilidad de una variable aleatoria discreta.

Funcin de densidad y funcin de distribucin acumulada de una variable aleatoria continua.

Valor esperado y varianza de variables aleatorias discretas y continuas.

Estudio de propiedades de las siguientes distribuciones: binomial, hipergeomtrica, Poisson,


uniforme, continua, normal, t-Student

Unidad 4. Variables aleatorias

121

Variable aleatoria
Se denomina variable aleatoria a una descripcin numrica del resultado de un experimento.

La variable aleatoria
atribuye a cada evento
un nmero
que no es aleatorio o imprevisible,
sino fijo y predeterminado.

Lo que es aleatorio
es el experimento
sobre cuyo espacio muestral
se define la variable aleatoria.

Rango o recorrido de una variable aleatoria


Se llama rango o recorrido de una variable aleatoria X y lo denotaremos RX, al conjunto
de los valores reales que la variable aleatoria puede tomar.

Tipos de variable aleatoria


Una variable aleatoria es discreta si puede asumir un conjunto finito o infinito numerable de valores diferentes.
Una variable aleatoria es continua si puede asumir cualquier valor en un intervalo.

Caso Aerolnea Wayra


Indique el tipo de la variable aleatoria y su rango.
Variable aleatoria

Tipo

Rango

W = tiempo de vuelo de Lima a Cusco, en


minutos

RW =

X = nmero de maletas que una persona


lleva en un vuelo

RX =

Y = nmero de pasajeros que piden pollo


durante un viaje de 60 personas

RY =

Z = dinero gastado en las compras a bordo


por una persona, en dlares

RZ =

Evento (X = a)
El evento (X a) se define como ( X a) { w S / X (w) a }

Notas importantes

122

Estadstica Descriptiva 201602

Variable aleatoria discreta


Una variable aleatoria discreta asume cada uno de los valores con cierta probabilidad
que se denota P(X = x).
Por ejemplo: nmero de alumnos matriculados por curso, cantidad de preguntas correctamente contestadas en una evaluacin de personal, cantidad de clientes que visitan un
centro comercial en un da determinado.

Distribucin de probabilidad de una variable aleatoria discreta


La distribucin de probabilidad de una variable aleatoria discreta X se describe como
una funcin de probabilidad representada por f(x) que asigna a cada valor de la variable
aleatoria, la probabilidad de que X asuma ese valor, esto es:
f(x) = P(X = x)
Toda funcin de probabilidad debe cumplir que:
-

f(x) 0

f (x ) 1

i 1

Sea S el espacio obtenido al lanzar una moneda dos veces y observar si sale cara (c) o sello (s) cada vez.
Completar los espacios en blanco.
El espacio muestral es S = {( , ), ( , ), ( , ), ( , )}.
Sea X el nmero de caras obtenidas, luego el rango de la variable X es RX = { , , }.
El evento (X = 0) = {(, )}
El evento (X = 1) = {(, ), (, )}
El evento (X = 2) = {(, )}
Entonces, la probabilidad de cada evento es:
f(0) = P(..) = ..
f(1) = P(..) = ..
f(2) = P(..) = ..

Notas importantes

Unidad 4. Variables aleatorias

123

Se lanza un dado, sea la variable aleatoria X igual al nmero de la cara superior del dado.
Determine y grafique la funcin de probabilidad de la variable X.

Indique cules de las siguientes funciones puede ser funcin de probabilidad.

Notas importantes

124

Estadstica Descriptiva 201602

Indique cules de las siguientes funciones puede ser funcin de probabilidad.


x
x 4 , 5, 6
f x 15
0 en otro caso

C 2 p x (1 p)2 x
f x x
0

x 0, 1, 2
en otro caso

Ejemplo 22
Calcule a para que la siguiente funcin sea una funcin de probabilidad. Grafique f(x)

f x ax x 10, 15, 20, 25


Solucin
Tiene que cumplir dos condiciones:
La primera condicin, f(x) > 0, se cumple cuando a es mayor que cero, puesto que x > 0.
n

La segunda condicin,

f (x ) 1 , se cumple si a10 15a 20a 25a 1 , esto se cumi 1

f(x)

ple cuando 70a =1, luego a =1/70


0.5
0.4
0.3
0.2
0.1
0.0
0

Notas importantes

Unidad 4. Variables aleatorias

125

Ejemplo 23
Sea X el nmero de lanzamientos de un dado hasta que salga el primer seis. Determine
la funcin de probabilidad de la variable X y calcule P(X 3)
Solucin
Sea la variable aleatoria X:= nmero de lanzamientos de un dado hasta que salga el primer seis.
El rango o recorrido de X es RX = {1, 2, 3,} = Z+.
f(1) = P(X = 1) = 1/6
f(2) = P(X = 2) = 5/6 x 1/6
f(3) = P(X = 3) = 5/6 x 5/6 x 1/6
Luego, la funcin de probabilidad de la variable X es:

5
f x P X x
6

x 1

1
6

; Rx 1, 2, 3,....

25
1 5
P( X 3) 1 P( X 3) 1 f (1) f (2) f (3) 1

0,5787
6 36 216

Valor esperado de una variable aleatoria discreta


El valor esperado o esperanza matemtica de una variable aleatoria X o media de una
distribucin de probabilidad de X se denota E(X).
n

X E X x i f x i x1 f x1 x2 f x2 ... x n f x n
i 1

Caso Aerolnea Wayra


Objetivo especfico: Estimar la media del nmero de personas que no se presentan al
vuelo.
El nmero de personas que no se presentan a un vuelo se modela con una variable aleatoria X con la siguiente funcin de probabilidad.
x

f(x)

0,20

0,25

0,22

0,15

0,10

0,05

Calcule e interprete la media de X.

Notas importantes

126

Estadstica Descriptiva 201602

Valor esperado de una funcin de variable aleatoria discreta


Sea G(X) una funcin de la variable aleatoria X. El valor esperado de G(X) es:
n

E G X G xi f xi G x1 f x1 G x2 f x2 ... G xn f xn
i 1

Ejemplo 24
La demanda mensual de uno de los productos Exprtame vara grandemente de un mes
a otro. Con base a la informacin de los ltimos 24 meses se estim las probabilidades
para la demanda mensual del producto jugo en frasco.
Nmero de frascos vendidos
f(x)

80

90

100

120

130

140

0,15

0,25

0,35

0,10

0,10

0,05

a. Calcule el valor esperado del nmero de frascos de jugo demandados.


E(X) = 101,5
b. Cada frasco tres soles y lo vende cinco soles. Si en un mes determinado, ha solicitado
al distribuidor 140 frascos. Sea U(X) la utilidad del dueo de la tienda. Calcule la utilidad esperada.
x

80

90

100

120

130

140

f(x)

0,15

0,25

0,35

0,10

0,10

0,05

U(x)

-20

30

80

180

230

280

E(U(X)) = 87,5

Varianza y desviacin estndar de una variable aleatoria discreta


La varianza V(X) de una variable aleatoria discreta X con distribucin de probabilidad f(x)
se define por:

V X E X X x X f x
2

xRX

Se cumple V X E X 2 E X

La varianza de la variable aleatoria X, V(X), tambin se denota por X2 , o simplemente


como 2 .
La desviacin estndar de X es la raz cuadra de la varianza de X.

Notas importantes

Unidad 4. Variables aleatorias

127

Se lanza un dado, sea la variable aleatoria X igual al nmero de la cara superior del dado.
Calcule la media y desviacin estndar de X.

Propiedades del valor esperado en variables aleatorias


Si X1 y X2 son dos variables aleatorias, y a1 y a2 son dos constantes, entonces:

E a1 a1
E a1 X1 a2 X2 a1E X1 a2E X2
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, . . ., an son n constantes, entonces:

E a1 X1 a2 X2 an X n a1E X1 a2E X2 anE X n


Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma funcin de probabilidad, entonces se cumple que E X i y, por lo tanto:

E X1 X 2 ... X n n

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes, entonces Y2 a2 X2
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:

V a1 X1 a2 X2

an X n a12V X1 a22V X 2

an2V X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma funcin de
probabilidad, entonces se cumple que V X i 2 y, por lo tanto:

V X 1 X 2 ... X n n 2

Notas importantes

128

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo especfico: Comparar el grado de dispersin del nmero de cancelaciones en
vuelos, tanto nacional e internacional.
La distribucin de probabilidades de las variables X: nmero de cancelaciones en vuelo
nacional e Y: nmero de cancelaciones en vuelo internacional se muestran a continuacin:
x

f(x)

0,25

0,42

0,15

0,10

f(y)

0,27

0,37

0,18

0,12

La empresa implementar cambios en aquel tipo de vuelo, nacional o internacional, cuyo nmero de cancelaciones sea ms variable. En qu tipo de vuelo se harn los cambios?

Ejemplo 25
Sea la variable aleatoria X el nmero de frascos vendidos en un supermercado por semana, con la siguiente funcin de probabilidad:

f ( x) k

1
(x 3)2 para x 1 ,2 , 3 , 4 , 5 , 6
38

Solucin
a. Calcule el valor de k.
k = 0,25
x
f(x)

Notas importantes

12
0,1447

24
0,2237

36
0,25

48
0,2237

60
0,1447

72
0,01316

Unidad 4. Variables aleatorias

129

b. Calcule la probabilidad de vender por lo menos tres docenas de frascos


P(X 3) =1 - P(X 2) = 1 - 0.36842105 = 0,6316
c. Si la utilidad por docena de frascos vendido (en soles) viene dada por la funcin: U(X)
= 10X 5, expresada en nuevos soles, calcule la utilidad esperada mensual y su varianza?
E(X) = 3,0396
E(U(X)) = E(10X 5) = 10 E(X) - 5 = 25,396
Ejemplo 26
Sea X una variable aleatoria con la siguiente funcin de probabilidad. Calcular el valor
esperado de X2

ax
f ( x)
0

1, 2, 3, 4, 5
en otro caso

Solucin
5

Lo primero es determinar a, planteamos que

f x 1 , de donde a = 1/15.
i 1

Nos piden
E X 2 xi2 f xi 12
5

i 1

1
1
1
1
1
22
32
42
52
15
15
15
15
15
15

Ejemplo 27
Sea X una variable aleatoria con la siguiente funcin de probabilidad. Calcule la varianza
de X.

x
1, 2, 3, 4, 5

f (x) 15
0 en otro caso
Solucin
El esperado de X es
5

E X xi f xi 1
i 1

1
2
3
4
5 55
2 3 4 5
15
15
15
15
15 15

Se tiene que E X 2 15
2

2
55
Luego se tiene que V X E X 2 E X 15 1,556
15

Notas importantes

130

Estadstica Descriptiva 201602

Ejemplo 28
Se define la variable aleatoria X definida como el nmero de recargas de la tarjeta de los
usuarios del Metropolitano a la semana con la siguiente funcin de probabilidad.
X: Nmero de recargas
f(x)

0,10

4k

0,30

0,10

a. Determine el valor de k para que f(x) sea funcin de probabilidad


Para que f(x) sea una funcin de probabilidad debe cumplir que 40 () = 1
Por lo tanto, f(0) + f(1) + f(2) + f(3) + f(4) = 0,10 + 4k + 0,30 + k + 0,10 = 1, de donde k=
0,1
b. Calcule la probabilidad de que un usuario, elegido al azar, recargue su tarjeta ms de
una vez a la semana.
Se pide P(2 X 3) = f(2) + f(3) + f(4) =0,3 + 0,10 + 0,10 = 0,5
c. Si un usuario recarg una vez su tarjeta en una semana, calcule la probabilidad de
que dicho usuario recargue su tarjeta por lo menos una vez ms en esa semana.
(2)

0,50

Se pide ( 2 1) = (1) = 0,90 = 0,5556


d. Si el costo de una recarga es de cinco soles y el Metropolitano tiene 560 mil usuarios,
determine el monto esperado semanal por recargas.
Tenemos que () = 4=0 () = 1,7
El esperado del monto ser 1,7 x 5 x 560 000 = 4 760 000 nuevos soles

Notas importantes

Unidad 4. Variables aleatorias

131

Distribuciones de probabilidad de variables discretas


Distribucin binomial
Un experimento binomial consiste en una serie de n pruebas o ensayos, donde n se fija
antes de realizar el experimento.

Las pruebas son idnticas y


cada una de ellos puede
resultar en uno de dos
posibles resultados que
denotan xito o fracaso.

Las pruebas son


independientes entre s
por lo que el resultado de un
intento en particular
no influye en el resultado de
cualquier otro.

La probabilidad de xito
es constante
de una prueba a otra
y la denotamos como p.

Entonces para n intentos y la probabilidad p de xito en cualquier intento, la probabilidad de tener x xitos en los n intentos est dada por:
f x P X x C xn p x 1 p

n x

x = 0, 1, 2,..., n

La variable binomial cuenta el nmero de xitos en n repeticiones semejantes e independientes con probabilidad de xito constante.
Se dice que la variable aleatoria X sigue una distribucin binomial con parmetros n y p,
se denota X~B (n, p)
Es simtrica si p = 0,5. Para valores de p < 0,5 la distribucin tiene sesgo derecho y para
valores p>0,5 tiene sesgo izquierdo, independientemente de los valores de n.
Para valores de n suficientemente grandes (n > 50), y slo tomando en cuenta los valores relevantes de probabilidad, la distribucin es prcticamente simtrica.
Media

E X np

Varianza

2 V X np 1 p

En Excel 2010, use la funcin =DISTR.BINOM.N(Nm_xito, Ensayos, Prob_xito, acumulado)


Notas importantes

132

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo especfico: Estimar la probabilidad de tener una emergencia mdica durante el
viaje.
La aerolnea sabe por experiencias pasadas que el 0,5% de los pasajeros tendr alguna
emergencia mdica durante el vuelo.
Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que ningn pasajero tenga
una emergencia mdica durante el viaje. Asuma independencia entre un pasajero y otro.
La variable en estudio X es ....
El rango o recorrido de la variable X es .......
La distribucin de la variable es ..
Sus parmetros son .......
La probabilidad pedida es f() = P(X) = ....... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., .)

Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que, como mximo, un pasajero tenga una emergencia mdica durante el viaje.
La probabilidad pedida es P(X) = ......... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., .)

Si en un vuelo hay 120 pasajeros, calcule la probabilidad de que por lo menos dos pasajeros tengan una emergencia mdica durante el viaje.
La probabilidad pedida es P(X) = ......... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., .)

Calcule el valor esperado del nmero de pasajeros que tengan una emergencia mdica
durante un viaje de 160 pasajeros.
El valor pedido es E(X) = ......... = .

Notas importantes

Unidad 4. Variables aleatorias

133

Ejemplo 29
En el proceso de control de calidad se analiza 60 envases de los productos de Exprtame. Por investigaciones anteriores se sabe que la probabilidad de que un envase est en
mal estado es de 0,01.
Solucin
a. Se rechazarn los 60 productos si la probabilidad de seleccionar ms de dos envases
en mal estado es mayor al 30%, qu decisin se debe de tomar?
Lo primero es definir la variable que nos permitir resolver el problema.
Definamos la variable X:= nmero de envases en mal estado.
La variable X se tiene una distribucin binomial con parmetros: n= nmero de ensayos = 60 y p = probabilidad de xito = 0,01.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1,
2,, 60. Entonces, X B(n = 60; p = 0,01)
=1

( > 2) = 1 ( 2)
+ 160 0,011 0,9959 +260 0,012 0,9958 = 0,0224

060 0,010 0,9960

Como la probabilidad pedida es menor al 30%, entonces los productos no sern rechazados.
b. Calcule el valor esperado y varianza del nmero envases en mal estado.
E(X) = n p = 60 x 0,01 = 0,6
V(X) = n p (1-p) = 60 x 0,01 x (1 0,01) = 0,594
Ejemplo 30
El 45% de los usuarios del Metropolitano son mujeres. Se estima que el 1% de las usuarias y el 0,8% de los usuarios han sufrido de algn tipo de robo durante el uso del Metropolitano. Si el sistema tiene 560 mil usuarios, calcule el nmero esperado de usuarios
que han sido vctimas de robo durante el uso del Metropolitano. Defina la variable necesaria y determine su distribucin.
Solucin
Sean los eventos:
R:= Que el usuario sea vctima de robo
H:= Que el usuario sea hombre
M:= Que el usuario sea mujer
() = (). ( ) + (). ()= 0,0044 + 0,0045 = 0,0089
Sea la variable aleatoria Y:= nmero de usuarios que han sido vctima de robo.
Y B(n = 560 000; p = 0,0089)
E(Y) = np = 560 000 x 0,0089 = 4 984 usuarios

Notas importantes

134

Estadstica Descriptiva 201602

Ejemplo 31
Se sabe que el 12% de los usuarios del Metropolitano realizan conexiones de rutas. Si
elegimos al azar 80 usuarios.
a. Determine la probabilidad de que ocho o nueve usuarios, de los 80 escogidos, realicen conexiones. Defina la variable, indique su distribucin, parmetros y rango.
Solucin
Sea X = cantidad de usuarios del Metropolitano que realizan conexiones de rutas en
la muestra
X B(n = 80; p = 0,12)
El rango de X es Rx = {0,1,,80}
P(8 X 9) = f(8) + f(9) = 0,2623
b. Sea la variable Y definida como el nmero de usuarios que realizan conexiones de los
560 mil usuarios. Calcule el valor esperado y varianza de Y.
Solucin
Y B(n = 560 000; p = 0,12)
E(Y) = np = 560 000 x 0,12 = 67 000.
V(Y) = np(1-p) = 59 136

Notas importantes

Unidad 4. Variables aleatorias

135

Distribucin hipergeomtrica
Consideremos N elementos, de los cuales r son considerados xitos y por lo tanto N - r
como fracasos. Como en el caso de la distribucin binomial estamos interesados en saber la probabilidad de obtener x xitos en una muestra de n elementos.
El experimento hipergeomtrico consiste en extraer al azar y sin sustitucin n elementos
de un conjunto de N elementos, r de los cuales son xitos y N - r son fracasos.

La probabilidad de obtener de x xitos en la muestra de n elementos es:

f (x)

C xr CnNxr
,
CnN

x max{0, n (N r )},...,min{n, r }

El rango de X en la mayora de los casos va de 0 a n, pero no siempre, por lo que se debe


analizar en cada caso.
La variable hipergeomtrica cuenta el nmero de xitos en una muestra de tamao n,
tomada de una vez de una poblacin de tamao N donde hay r xitos.
Se dice que la variable aleatoria X sigue una distribucin hipergeomtrica con parmetros N, r y n y se denota X ~ H (n, r, N)

r
N

Media

EX n

Varianza

r
r N n
2 V X n 1

N N N 1

En Excel 2010, use la funcin =DISTR.HIPERGEOM.N(muestra_xito, nm_de_muestra,


poblacin_xito, nm_de_poblacin, acumulado)

Notas importantes

136

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


En un vuelo se van a servir 130 comidas. La oficina de control de calidad de los alimentos
durante el vuelo selecciona al azar cinco de ellas para verificar que en perfecto estado.
Dentro de las 130 comidas, hay seis que no estn en perfecto estado.
Calcule la probabilidad de no detectar a ninguna de las comidas que no estn en perfecto estado.
La variable en estudio X es ....
El rango o recorrido de la variable X es .......
La distribucin de la variable es ..
Sus parmetros son .......
La probabilidad pedida es f() = P(X) = ....... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., ., ..)
Calcule la probabilidad de detectar a una de las comidas que no estn en perfecto estado.
La probabilidad pedida es P(X) = ......... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., ., ..)
Calcule la probabilidad de detectar a ms de una de las comidas que no estn en perfecto estado.
La probabilidad pedida es P(X) = ......... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., .., ., ..)

Calcule el valor esperado del nmero de comidas que no estn en perfecto estado que
sern detectadas.
El valor pedido es E(X) = ......... = .

Notas importantes

Unidad 4. Variables aleatorias

137

Ejemplo 32
Luego de embalar un contenedor de envases de productos de Exprtame, se tienen 60
envases, de los cuales 25 son frascos. Si selecciona una muestra aleatoria de 20 envases
para el control de calidad.
Calcule la probabilidad de que ocho envases sean de frasco.
Solucin
Definamos la variable X:= nmero de envases de frasco seleccionados.
La variable X se tiene una distribucin hipergeomtrica con parmetros:
N= 60
tamao de la poblacin
r = 25
nmero de xitos en la poblacin
n = 20
tamao de la muestra.
El rango de X, es decir todos los valores que puede tomar la variable, es igual 0, 1, 2,,
20. Entonces, X H(n = 20, r = 25, N = 60) y Rx = {0, 1,,20}
La probabilidad pedida es ( = 8) =

35
825 12
60
20

= 0,2153

Calcule la variabilidad relativa de X respecto a la media.


Solucin
Lo que nos piden es calcular el coeficiente de variacin de X. Primero, hallemos el esperado y la varianza de X.

25
= () = = 20
= 8,333

60


25
25 60 25
() = (1 ) (
) = 20 (1 ) (
) = 2,8337

1
60
60 60 1
El coeficiente de variacin de X es () =

()
()

2,8337

100% = 8,3333 100% = 21,8%

Ejemplo 33
La actriz Magaly Solier es la dcima sptima mujer en denunciar una agresin sexual
ocurrida en un bus del Metropolitano, desde noviembre del 2012. Solo un proceso est
cerca de recibir sentencia, segn Silvia Loli, gerenta de la Mujer de la Municipalidad de
Lima. Explica que en este caso el agresor se acogi a la confesin sincera y podra recibir
de dos a cuatro aos de prisin suspendida, cumplir trabajos comunitarios o pagar reparacin civil. Si la Oficina de relaciones pblicas del Metropolitano, quiere darle seguimiento exhaustivo a tres de las denuncias y elige al azar entre los 17 casos existentes.
Calcule la probabilidad de elegir el caso que est cerca de recibir sentencia. Defina la variable necesaria y establezca su distribucin, rango y parmetros.
Solucin
Sea X = nmero de casos que estn cerca de recibir sentencia
X H(n = 3, r = 1, N= 17) y Rx = {0,1}
P(X = 1) = f(1) = 0,1765

Notas importantes

138

Estadstica Descriptiva 201602

Distribucin de Poisson
El experimento que origina una variable aleatoria que sigue una distribucin de Poisson
se denomina proceso de Poisson y posee las siguientes propiedades:
El nmero de resultados
que ocurre en un
intervalo o regin de
espacio cualquiera es
independiente
del nmero que ocurre
en cualquier otro
intervalo o regin del
espacio disjunto.

La probabilidad de que ocurra un


solo resultado durante el intervalo
muy corto o regin muy pequea
es proporcional a la longitud del
intervalo
o al tamao de la regin
y no depende del nmero de
resultados que ocurren fuera del
intervalo o regin.

La probabilidad de
que ocurra ms de un
resultado en tal
intervalo corto o caiga
en tal regin pequea
es insignificante.

La probabilidad de tener x resultados en un intervalo dado o en una regin especfica es:

e x
x = 0, 1, 2,...
x!
x = nmero de xitos por unidad de tiempo o regin.
f x P X x

= nmero esperado de xitos por unidad de tiempo o regin.


e = 2,71828
0.16
0.14
0.12

f(x)

0.10
0.08
0.06
0.04
0.02
0.00
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19

Se dice que la variable aleatoria X sigue una distribucin de Poisson con parmetro y
se denota X~P().
Siempre es una distribucin sesgada a la derecha. A medida que aumenta y tomando
en cuenta slo los valores relevantes de probabilidad, la distribucin tiende a hacerse
simtrica.
Media:
EX
Varianza: 2 V X
En Excel 2010, use la funcin =POISSON.DIST(x, media, acumulado)

Notas importantes

Unidad 4. Variables aleatorias

139

Caso Aerolnea Wayra


El nmero de llamadas hacia una azafata por los pasajeros durante un vuelo se modela
con una variable Poisson con una media de 0,5 llamadas cada diez minutos.
Calcule la probabilidad de que una azafata no reciba ninguna llamada durante un viaje
de 50 minutos.
La variable en estudio X es ....
El rango o recorrido de la variable X es .......
La distribucin de la variable es ..
Sus parmetros son .......
La probabilidad pedida es f() = P(X) = ....... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., ..,)
Calcule la probabilidad de que una azafata reciba ms de una llamada durante un viaje
de 50 minutos.
La probabilidad pedida es P(X) = ......... = .
Cul sera la expresin en Excel que calculara este problema?
En Excel 2010, use la funcin =(.., ., ..)
Si una azafata ya recibi una llamada durante los primeros minutos del viaje, calcule la
probabilidad de que reciba dos llamadas ms durante dicho viaje de 50 minutos.

Calcule la desviacin estndar del nmero de llamadas hacia la azafata en un vuelo de


dos horas.

Notas importantes

140

Estadstica Descriptiva 201602

Ejemplo 34
Suponga que el nmero de llamadas que llegan a una central telefnica es 0,5 por minuto en promedio.
Calcule la probabilidad de que en un minuto no lleguen llamadas
Solucin
X:= nmero de llamadas / minuto = 0,5 llamadas / minuto
P X 0

e 0.5 0,50
0,6065
0!

Calcule la probabilidad de que en un minuto lleguen ms de tres llamadas


Solucin
P(X > 3) = 1 P(X 3) = 1 (0,6065 + 0,3033 + 0,0758 + 0,0126) = 0,9982
Calcule la probabilidad de que en tres minutos lleguen menos de cinco llamadas
Solucin
Y:= nmero de llamadas / 3 minutos
= 1,5 llamadas / 3 minutos
P(Y < 5) = 0,2231 + 0,3347 + 0,2510 + 0,1255 + 0,0471 = 0,98142
Calcule la probabilidad de que en cinco minutos lleguen ms de dos llamadas
Solucin
W:= nmero de llamadas / 5 minutos
= 2,5 llamadas / 5 minutos
P(W > 2) = 1 P(W 2) = 1 (0,0821 + 0,2052 + 0,2565) = 0,45652
Ejemplo 35
El administrador de un almacn ha observado que en promedio ingresan al establecimiento 20 personas cada 30 minutos. Cul es la probabilidad de que en seis minutos
ingresen al almacn a lo ms 5 clientes pero ms de 3?
Solucin
Lo primero es definir la variable adecuada, sea X:= nmero de personas que entren al
establecimiento en un periodo de seis minutos.
Como nos dicen que la variable cuenta las llegadas por unidad de tiempo, se tiene que
X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribucin Poisson.
Si en 30 minutos llegan en promedio 20 personas, entonces en 6 minutos llegarn, en
promedio, ,= 4 personas.
Se tiene que X ~ P( = 4)
Nos piden P 3 X 5 P X 4 P X 5

Notas importantes

e 4 44 e 4 45

0,3517
4!
5!

Unidad 4. Variables aleatorias

141

Ejemplo 36
Si se sabe que en cada 100 metros de longitud de un cable hay un promedio de 80 puntos por los cuales este puede ser seccionado. Cul es la probabilidad de que en un
tramo de 13,5 metros se encuentren cinco puntos de seccionamiento?
Solucin
Sea X:= nmero de puntos de seccionamiento. Como nos dicen que la variable cuenta
puntos por unidad de longitud, se tiene que X ~ P().
Luego, debemos determinar el valor de , para lo cual vamos a hacer una regla de tres
simple, pues es una propiedad de la distribucin Poisson.
Si en 100 metros hay en promedio 80 puntos de seccionamiento, entonces en 13,5 metros hay, en promedio, ,= 10,8 puntos.
Se tiene que X ~ P( = 10,8)
Nos piden P X 5

e 10.8 10.85
0,025
5!

Observe que si lambda sale un valor que no es entero, no se debe redondear a un entero.
Ejemplo 37
El nmero de unidades envasados por una persona se modela con una variable Poisson
con un promedio 10 unidades por cada 20 minutos.
a. Cul es la probabilidad de que en 20 minutos se envasen 12 productos?
P(X = 12) = 0,095
b. Si la mquina funciona durante dos horas consecutivas, calcule la probabilidad de
que se hayan envasado 50 productos.
1 = 60 unidades en dos horas
P(X = 50) = 0,0233

Notas importantes

142

Estadstica Descriptiva 201602

Variable aleatoria continua


Una variable aleatoria continua es una variable cuyo rango es un conjunto infinito no
numerable de valores.
Por ejemplo: peso, en kilos, de una persona, tiempo en resolver la primera pregunta del
examen parcial de un curso o volumen, en decibeles, en una discoteca a una hora determinada.

Funcin de densidad de una variable aleatoria continua


Se denomina funcin de densidad de probabilidad f(x) de una variable aleatoria continua a la funcin que satisface:
f x 0 para todo x R

f x dx 1

Calculo de una probabilidad usando la funcin de densidad de una variable


aleatoria continua
b

Se tiene que P a X b f x dx
a

Adems, se cumple que:


P(a < X < b) = P(a X < b) = P(a < X b) = P(a X b)

Notas importantes

Unidad 4. Variables aleatorias

143

Una variable aleatoria continua tiene la siguiente funcin de densidad de probabilidad:

0 x6
ax
f x
0 en otro caso
Determine el valor de a.

Calcule la probabilidad de P(X < 3)

Calcule la probabilidad de P(X > 4)

Calcule la probabilidad de P(2 < X < 4)

Notas importantes

144

Estadstica Descriptiva 201602

Ejemplo 38
Para cierto negocio por correo electrnico la proporcin de los pedidos procesados en
24 horas tiene la funcin de densidad de probabilidad.

f (x) 2 (1 x) ; 0 x 1
Compruebe si f(x) es una funcin de densidad.
Solucin
Se debe comprobar que:
- f x 0 para todo x R. Este se cumple pues para

0 x 1,

es

f (x) 2 (1 x) 0

f x dx 1 . Existen dos formas de responder esta pregunta.

Integrando la funcin de densidad f(x) y verificando que el rea es igual a 1 y que cada
f(x) sea positivo

x2
f x dx 2 (1 x) dx 2 x 2
0
2

2x x 2

1
0

Ahora debemos evaluar en 0 y en 1


2 1 12 2 0 02 1

Calculando el rea del tringulo a partir de la grfica y verificando que el rea es igual a
1 y que cada f(x) sea positivo.

b h 1 2

1
2
2
Cul es la probabilidad que al menos el 80% de los pedidos sean procesados dentro de
24 horas?
rea

Solucin
Existen dos formas de responder esta pregunta.
Integrando la funcin de densidad f(x) de 0,8 a 1.

2 1 x 2 1 1 2 0,8 0,8 0,04


1

0,8

Calculando el rea de tringulo desde 0,8 a 1.

b h 1 0,8 2 1 0,8

0,04
2
2
Observe que para la segunda forma de resolucin, se us la funcin de densidad para
hallar la altura del tringulo.
rea

Si el porcentaje de pedidos procesados en 24 horas es mayor al 80%, calcular la probabilidad de que sea mayor a 90%.
Solucin
P(X > 0,9 / X > 0,8) = (0,1 x 0,2 / 2) / (0,2 x 0,4 / 2) = 0,25

Notas importantes

Unidad 4. Variables aleatorias

145

Ejemplo 39
La distancia, en metros, que recorre un usuario caminando para llegar a una estacin del
Metropolitano se modela con la variable aleatoria X con la siguiente funcin de densidad.

0 < < 500


() = { 250000

500 < 1000


250000

Calcule el esperado y la varianza de X.


Solucin
Primero hallemos a
500

1000

500

+
= 1
250000
250000

De donde a= 1/250.
Ahora calculemos el esperado y la varianza de X.
500

1000

500

() =
+

= 500
250000
250 250000
500

1000

() =
+ 2

5002 = 41 666,7
250000
250 250000
2

500

Calcule la probabilidad de que un usuario camine entre 300 y 700 metros para llegar a
una estacin.
Solucin
500

700

(300 < < 700) =


+

= 0,64
250000
250 250000
300

Notas importantes

500

146

Estadstica Descriptiva 201602

Funcin de distribucin acumulada de probabilidad


La funcin de distribucin acumulada de una variable aleatoria continua X con funcin
de densidad f(x) se define por:
F(x) = P(X x) para - < x < +

dF x
dx

f x

F(x) es una funcin que siempre est entre 0 y 1 (0 F(x) 1), pues es igual a una probabilidad.
F(x) es una funcin que nunca decrece, lim F x 0 y lim F x 1
x

F(x)

1.0
0.8
0.6
0.4
0.2
0.0

-2

-1

Calculo de una probabilidad usando la funcin de distribucin acumulada


Se tiene que:
P(a < X b) = F(b) F(a)

Marque la(s) grfica(s) que pueden ser funciones de distribucin acumulada.

Notas importantes

Unidad 4. Variables aleatorias

147

Indique la(s) funciones que pueden ser funcin de distribucin acumulada.


x 2
1

F x x 1 1 x 2
0
x 1

x 2
1
2
F x x 1 1 x 2
0
x 1

Sea X una variable aleatoria con la siguiente funcin de densidad


() =
02
Determine y grafique la funcin de distribucin acumulada de la variable aleatoria X.

Use la funcin de distribucin acumulada de la variable X para calcular P(0,5 < X < 1,7)

Notas importantes

148

Estadstica Descriptiva 201602

Ejemplo 41
Encuentre el rango intercuartil de X, si X es el tiempo de vida de un sistema es una variable aleatoria, en aos, cuya funcin de distribucin acumulada es:

x5
0

F x 25
1 x 2 x 5
Solucin
Sea X:= tiempo, en aos, de vida de un sistema. Para calcular el rango intercuartil, debemos hallar el cuartil 1 y el cuartil 3, para esto hay dos posibilidades: integrar la funcin
de densidad f(x) o reemplazar en la funcin de distribucin acumulada
Por definicin de cuartil 3, el 75% de los datos es menor o igual a l, es decir P(X Q3) =
0,75, o lo que es lo mismo F(Q3) = 0,75

F Q3 0,75 1

25
de donde Q3 = 10.
Q32

Haciendo lo mismo para el cuartil 1. F Q1 0,25 1

25
de donde Q1 = 5,77.
Q12

Luego el RIC = Q3 Q1 = 4,23.


Si se sabe que el tiempo de vida de un dispositivo se encuentra en el cuarto superior,
cul es la probabilidad que pertenezca al quinto superior?
Solucin
Como nos dicen que ya se sabe que est en el cuarto superior, es una probabilidad
condicional.

P X P80 X P75

Notas importantes

P X P80 0,20

0,80
P X P75 0,25

Unidad 4. Variables aleatorias

149

Valor esperado de una variable aleatoria continua


El valor esperado o esperanza matemtica de una variable aleatoria X o media de una
variable aleatoria X se denota E(X).

X E X

x f x dx

Valor esperado de una funcin de variable aleatoria continua


Sea G(X) una funcin de la variable aleatoria X. El valor esperado de G(X) es:
E G X

G x f x dx

Propiedades del valor esperado en variables aleatorias


E(b) = b
Si X1, X2, X3, . . ., Xn son n variables aleatorias, y a1, a2, a3, . . ., an son n constantes, entonces:
E a1 X1 a2 X2

an X n a1E X1 a2E X 2

anE X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias con la misma funcin de densidad, entonces se cumple que E X i y, por lo tanto:
E X1 X2 ... X n n

Caso Aerolnea Wayra


El tiempo, en minutos, que se tarda una persona en ser atendido en el counter del aeropuerto se modela con una variable aleatoria X:

0 x 2
kx

f (x) k 4 x 2 x 4
0
en otro caso

Determine la media de la variable aleatoria X.

Notas importantes

150

Estadstica Descriptiva 201602

Varianza y desviacin estndar de una variable aleatoria continua


X2 V X E X 2 E X

La desviacin estndar de X es la raz cuadrada de la varianza de X.

Propiedades de la varianza en variables aleatorias


Si Y = aX + b, con a y b son constantes, entonces Y2 a2 X2
Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes, y a1, a2, a3, . . ., an son n
constantes, entonces:

V a1 X1 a2 X2

an X n a12V X1 a22V X 2

an2V X n

Si X1, X2, X3, . . ., Xn son n variables aleatorias independientes con la misma funcin de
densidad, entonces se cumple que V X i 2 y, por lo tanto:

V X1 X2 ... X n n 2
Caso Aerolnea Wayra
El sobrepeso, en kilos, del equipaje de mano de un pasajero se modela con una variable
aleatoria X con la siguiente funcin de densidad de probabilidad:

k 6 - x 0 x 6
f (x)
0 otro caso
Determine la desviacin estndar de la variable aleatoria X.

Notas importantes

Unidad 4. Variables aleatorias

151

Distribuciones de probabilidad de variable continua


Distribucin uniforme
Funcin de densidad
1
a xb

f x b a
0
en otro caso

Se dice que X tiene una distribucin uniforme y se denota X ~ U (a, b)


La funcin de distribucin acumulada de una variable uniforme es:

0
x a

F x
b a

ab
2

Media:

Varianza:

b a

Notas importantes

12

x a
axb
x b

152

Estadstica Descriptiva 201602

Caso Aerolnea Wayra


Objetivo especfico: Determinar el nmero esperado de vuelos con retraso.
El tiempo en el que un avin llega a su destino con respecto a su hora programada se
modela con una variable aleatoria uniforme de parmetros -15 y 15. De tal manera que
los valores negativos indican que el avin lleg antes de la hora programada y los valores positivos indican que el avin lleg despus de la hora programada.
Calcule la probabilidad de que un avin llegue con un adelanto mayor a cinco minutos.

Calcule la probabilidad de que la diferencia entre la hora de llegada programada y la hora de llegada sea mayor a seis minutos.

Use la funcin de distribucin acumulada para calcular la probabilidad de que un avin


llegue con un retraso mximo de ocho minutos.

Si se escoge al azar 20 vuelos, calcule la probabilidad de que, como mximo, se tenga un


vuelo con retraso mayor a ocho minutos.

Notas importantes

Unidad 4. Variables aleatorias

153

Ejemplo 42
En ciertos experimentos, el error cometido al determinar la densidad de una sustancia
es una variable aleatoria cuya distribucin es uniforme con a = -0,025 y b = 0,025.
a. Cul es la probabilidad de que tal error est entre 0,010 y 0,015?
Solucin
Sea X:= error al determinar la densidad de una sustancia
La variable X ~ U(a = -0,025, b = 0,025) tiene la siguiente funcin de densidad
1

f (x) 0,025 (0,025)

f (x) 0,05
0

0,025 x 0,025
en otro caso
0,025 x 0,025
en otro caso

Nos piden P(0,010 X 0,015) . Existen dos formas de calcular esta probabilidad: integrando la funcin de densidad f(x) o calculndola a partir del rea del rectngulo.

P(0,010 X 0,015)

0,015

1
1
dx
0,015 0,010 0,10
0,050
0,050
0,010

b. Cul es el error esperado cometido?


Solucin
La variable X ~ U(a = -0,025, b = 0,025) tiene el siguiente nmero esperado de errores

a b 0,025+0,025 0
2

Ejemplo 43
La llegada de cada uno de los empleados a su centro de labores se produce independientemente, de acuerdo a la distribucin uniforme en el intervalo comprendido entre
las 8:00 y 8:25 am. De una muestra de 10 empleados, calcule la probabilidad de que cuatro de ellos hayan llegado entre las 8:15 y 8:20 AM.
Solucin
Sea X:= tiempo, en minutos, desde las 8 AM hasta la hora de llegada de los empleados al
centro de trabajo, luego XU (0, 25)
f (x)

1
; 0 x 25
25

Se define la variable Y:= nmero de empleados que llegan al centro de trabajo entre
8:15 y 8:20 AM. Debe calcularse la probabilidad de xito p de que un empleado llegue al
centro de trabajo entre 8:15 y 8:20 AM esto es:
p

20 15
0,20
25

Entonces Y B(10; 0,20)


f (y) C y10 (0,20)y (0,80)10 y , y 0, 1,

Se pide P(Y 4) f (4) C410 (0,2)4 (0,80)6 0,0881


Notas importantes

, 10

154

Estadstica Descriptiva 201602

Distribucin normal
Funcin de densidad
2

1 x


1
f x
e 2
2

Se dice que la variable aleatoria X sigue una distribucin normal con parmetros y .
Se denota X ~ N (, 2)

La funcin de densidad tiene forma de campana y es simtrica, por lo que las medidas
de tendencia central coinciden.
El rango de la variable normal es toda la recta real, esto es, de a + .
En Excel 2010, use la funcin =DISTR.NORM.N(x, media, desviacin estndar, acumulado)
En Excel 2010, use la funcin =INV.NORM(probabilidad, media, desviacin estndar)

Estandarizacin
Se toma como referencia una distribucin normal estndar ( = 0 y 2 = 1). Se trabaja
con la distancia entre x y en funcin de la desviacin estndar, tal como se muestra.

Notas importantes

Unidad 4. Variables aleatorias

155

Si Z ~ N 0, 2 1 , calcular
P(Z < 1,12) =

P(Z > 0,45) =

P(0,23 < Z < 1,25) =

P(Z < -4) =

Tabla de la distribucin normal estndar


z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646

1,0
1,1
1,2

0,84134
0,86433
0,88493

0,84375
0,86650
0,88686

0,84614
0,86864
0,88877

0,84849
0,87076
0,89065

0,85083
0,87286
0,89251

0,85314
0,87493
0,89435

0,85543
0,87698
0,89617

0,85769
0,87900
0,89796

0,85993 0,86214
0,88100 0,88298
0,89973 0,90147

Notas importantes

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891

156

Estadstica Descriptiva 201602

P(Z = 1,16) =

Hallar c para que P(Z < c) = 0,67003

Hallar c para que P(Z > c) = 0,0250

Hallar c para que P(-c <Z < c) = 0,950

Tabla de la distribucin normal estndar


z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646

1,0
1,1
1,2

0,84134
0,86433
0,88493

0,84375
0,86650
0,88686

0,84614
0,86864
0,88877

0,84849
0,87076
0,89065

0,85083
0,87286
0,89251

0,85314
0,87493
0,89435

0,85543
0,87698
0,89617

0,85769
0,87900
0,89796

0,85993 0,86214
0,88100 0,88298
0,89973 0,90147

Notas importantes

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891

Unidad 4. Variables aleatorias

157

La cantidad de dinero destinada al ahorro mensual de los clientes de un banco es una


variable aleatoria que tiene una distribucin normal con una media igual a 460 soles y
una desviacin estndar igual a 50 soles.
Calcule la probabilidad de que un cliente ahorre menos de 480 soles en un mes.

En Excel 2010, use la funcin =DISTR.NORM.N(, , , )


Calcule la probabilidad de que un cliente ahorre ms de 500 soles mensuales.

En Excel 2010, use la funcin =1-DISTR.NORM.N(, , , )


Calcule la probabilidad que el ahorro mensual de un cliente est entre 460 y 520 soles.

Notas importantes

158

Estadstica Descriptiva 201602

Cul es el ahorro mnimo para estar en el 15% de los clientes que ms ahorran?

En Excel 2010, use la funcin =INV.NORM(, , )


Cul es el ahorro mximo para estar en el 25% de los clientes que menos ahorran?

En Excel 2010, use la funcin =INV.NORM(, , )


Ejemplo 44
El gasto mensual de un usuario en el Metropolitano se modela con una variable normal
con media de 100 nuevos soles y una desviacin estndar de cinco nuevos soles. Se elige
un usuario al azar.
a.

Calcule la probabilidad de que gaste entre 90 y 110 nuevos soles.


Sea X = gasto mensual en nuevos soles. X ~ N(100; 52)

P(90 X 110) = P( X 110) - P(X 90) = 0,9772 0,0228 = 0,9545


b.

Cul es la probabilidad de que gaste ms de 105 nuevos soles?


P(X > 105) = 1 - P( X 105) = 1 - 0,8413 = 0,1587

c.

Determine el gasto mensual mnimo para que est en 10% de los que ms gastan.
( ) = (
Buscando en la tabla,

Notas importantes

100
5

100
)
5

= 0,9).

= 1,28. Luego, a = 106,4

Unidad 4. Variables aleatorias

159

Ejemplo 45
En Buck Caf, la mquina surtidora de refrescos est ajustada de tal forma que sirve en
promedio 250 mililitros por vaso. Si la cantidad de refresco servido en los vasos sigue,
aproximadamente, una distribucin normal con una desviacin estndar de 10 mililitros.
Qu proporcin de los vasos servidos contendrn entre 240 y 255 mililitros de refresco?
Solucin
Sea X:= cantidad de refresco servido por vaso, X ~ N( = 250, 2 = 102)
Se pide P(240 X 255). Estandarizando se tiene

255 250
240 X 255
240 250
P

Z
P


10
10

P 1 Z 0,5 0,5 1 0,6915 0,1587 0,5328


Ejemplo 46
Se informa que la cantidad X de azcar de los paquetes marcados con un kilo, tiene distribucin normal con media kilogramos y desviacin estndar 0,02 kilogramos. Hallar
el valor de si la cantidad de azcar que contiene cada paquete es menor o igual a 0,95
kilos con probabilidad 0,102.
Solucin
Sea X:= pesos de los paquetes de azcar, en kilogramoss. X ~ N( , 2 = 0,022)
Se pide P X 0,95 0,102

X 0,95

0,102
Estandarizando se tiene P

0,95

P Z
0,102
0,02

Usando la tabla normal estndar para calcular el valor z correspondiente.


0,95
1,27 . De donde = 0,9754
0,02

Notas importantes

160

Estadstica Descriptiva 201602

Distribucin exponencial
En variables que representan los tiempos de vida til, tiempos de sobrevivencia, en
tiempos de ocurrencia en procesos de Poisson se suele utilizar la distribucin exponencial.
La variable aleatoria X tiene una distribucin exponencial con parmetro ( > 0) si su
funcin de densidad de probabilidad es:

f ( x)

; x0

Se denota X ~ Exp() y se lee que la variable aleatoria X sigue una distribucin exponencial con parmetro .
La probabilidad de que la variable aleatoria X tome valores en el intervalo [c,d] es numricamente igual al rea sombreada, y se calcula de la siguiente manera:
Pc X d

Esperanza de X:

E X

Varianza de X:

2 V X 2

1 t

dt

Ntese que el parmetro es igual a la media de la variable aleatoria.

Funcin de distribucin acumulada de X

F ( x ) P X x

e
0

Se cumple que:
P X x e

P X k t / X k P X t

Notas importantes

dt 1 e

; x0

Unidad 4. Variables aleatorias

161

Caso Aerolnea Wayra


El tiempo de vida til de tipo de una llanta de avin se modela con una variable aleatoria
con distribucin exponencial, cuya media es 20 das.
Calcule la probabilidad de que la vida til de una llanta sea mayor a 20 das.

Calcule la probabilidad de que la vida til de una llanta est entre 20 y 25 das.

Si una llanta ya dur 20 das, calcule la probabilidad de que la vida til de esa llanta sea
menor a 25 das.

Notas importantes

162

Estadstica Descriptiva 201602

Ejercicios de la Unidad 4
52. En un lote de 30 polos hay tres con fallas. Se toma una muestra aleatoria de cinco polos y
se define la variable aleatoria X como el nmero de polos defectuosos en la muestra. Determine y grafique la funcin de probabilidad de la variable X.
Calcule la probabilidad de tener dos polos defectuosos en la muestra.
Calcule la probabilidad de tener al menos dos polos defectuosos en la muestra.
53. La demanda diaria de un producto es una variable aleatoria X cuya distribucin de probabilidades es simtrica y est dada por la tabla siguiente:
x

f(x)

0,20

0,05

La empresa obtiene por cada unidad demandada de producto 100 soles de utilidad. Si la
cantidad demanda en un da es mayor a dos unidades, se obtiene una utilidad adicional
de 15 soles por unidad demandada de producto.
Calcule el valor de a, b y c.
Determine la probabilidad que la demanda diaria sea de por lo menos tres productos.
Calcule el valor esperado de la utilidad por la demanda diaria de productos.
54. Indique si son verdaderas o falsas las siguientes afirmaciones.
Afirmacin
Se denomina variable aleatoria a una descripcin numrica del
resultado de un experimento
El valor esperado es el valor ms probable de ocurrencia
El valor esperado es un valor que puede ser mayor que el mximo
de los valores del rango de la variable aleatoria
El valor esperado es un valor que siempre es igual a uno de los
valores del rango de la variable
Variable aleatoria continua es una variable cuyo rango es un conjunto infinito numerable de valores
La funcin de distribucin acumulada es siempre mayor a la funcin de densidad para cualquier valor de la variable aleatoria
El esperado de la suma de dos variables aleatorias es igual a la
suma de los dos esperados de las variables aleatorias
La varianza de una variable aleatoria puede ser menor a cero

Notas importantes

Verdadero

Falso

Unidad 4. Variables aleatorias

163

55. Un examen de admisin consta de 100 preguntas. Cada una pregunta tiene cinco opciones para marcar y solamente una respuesta correcta Por cada respuesta correcta se le
otorga al postulante un punto, mientras que si la respuesta es incorrecta al postulante se
le resta un cuarto de punto. Si un postulante contesta todas las preguntas del examen al
azar, calcule el valor esperado del puntaje obtenido.
56. Se lanza un dado una vez, sea la variable aleatoria X igual al nmero de la cara superior.
Calcule la varianza y desviacin estndar de la variable X.
57. Se lanzan dos dados y sea la variable aleatoria X igual a la suma de los nmeros de las caras superiores. Calcule la varianza de la variable X.
58. Un restaurante pone a la venta diariamente diversas ensaladas. El nmero de ensaladas
demandadas diariamente se modela con una variable aleatoria X que tiene la siguiente
distribucin de probabilidad.
x

12

15

17

18

20

25

f(x)

0,12

0,35

2a

0,14

0,09

El costo de cada ensalada es de cuatro nuevos soles y las vende a seis soles. Toda ensalada no vendida en el da se desecha. Calcule la media y desviacin estndar de la utilidad diaria, si el restaurante prepara 20 ensaladas por da.
59. Una compaa de comida rpida sabe que el 90% de sus tiendas por franquicia tendrn
xito comercial. Si el xito de cada tienda se puede considerar independiente de las dems tiendas. Calcule la probabilidad de que al menos dieciocho tiendas tengan xito, si la
compaa va a instalar 20 tiendas el ao 2015.
60. Segn la Asociacin para el Fomento de la Infraestructura Nacional el 48% de los hogares
de Lima no tienen acceso a agua potable de calidad, por no contar con la dosificacin
adecuada de cloro o comprarla de manera informal a los camiones cisternas. Si se eligen
al azar a diez hogares de Lima, calcule la probabilidad de que cinco de ellos no tengan acceso agua potable de calidad.
61. La empresa San Fernando ha lanzado su campaa Plato calato no para salvar sus ventas de verano 2013. Si de un total de 60 personas, donde 34 recuerdan la campaa, se
eligen al azar a ocho personas para entrevistarlos, calcule la probabilidad de elegir al menos a tres personas que recuerden la campaa.
62. En una distribuidora hay 25 televisores de los cuales seis son de tecnologa OLED. Si se
seleccionan al azar diez televisores, calcule la probabilidad de que se haya seleccionado
por lo menos dos televisores de tecnologa OLED.
63. Un comerciante recibe un lote de 30 computadoras porttiles. Para protegerse de una
mala remesa, el comerciante revisar diez computadoras y rechazar todo el lote si encuentra una o ms computadoras defectuosas. Si en el lote hay seis computadoras defectuosas, cul es la probabilidad de que rechace el lote?
64. En una pastelera, el nmero demandado de un cierto tipo de torta se modela con una
variable Poisson con una media de tres tortas al da. La pastelera, siempre, produce tres
tortas diarias. Cada torta cuesta producirla 50 nuevos soles y se vende a 80 nuevos soles.
Toda torta no vendida en el da se remata en 20 soles y siempre las compran todas las
tortas a ese precio. Calcule el valor esperado de la utilidad por dicho concepto.
Notas importantes

164

Estadstica Descriptiva 201602

65. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

Verdadero

Falso

El mayor valor del rango de la variable hipergeomtrica es siempre


menor o igual a n
En un proceso de Poisson el nmero de resultados que ocurre en un
intervalo es independiente del nmero que ocurre en cualquier otro
intervalo del espacio disjunto
La variable binomial cuenta el nmero de xitos en n repeticiones
independientes con la misma probabilidad de fracaso en cada repeticin
La variable hipergeomtrica cuenta el nmero de xitos en una
muestra de tamao n de una poblacin N que tiene r xitos y donde
el muestreo es con reemplazo

66. La duracin (en minutos) de una llamada telefnica en la sala de profesores puede modelarse por una variable aleatoria X con la siguiente funcin de densidad
a 3 x
0 x 3
f x
en otro caso
0

Determine el valor de a.
Calcule la probabilidad de que una llamada dure menos de un minuto y medio.
Si una llamada ya dur un minuto, calcule la probabilidad de que dure ms de dos minutos.
67. La proporcin de personas que responden a una encuesta enviada por correo electrnico
se modela con una variable aleatoria X con la siguiente funcin de densidad
2x 9

f x 10

0 x 1
en otro caso

Determine y grafique la funcin de distribucin acumulada de la variable aleatoria X.


Use la funcin de distribucin acumulada para calcular la probabilidad de que respondan
entre 60% y 80% de las personas a la encuesta.
Use la funcin de distribucin acumulada para calcular la mediana de X.
68. El gerente comercial de la sucursal de Santiago de Surco informa que el gasto mensual,
en cientos de nuevos soles, por la venta de libros a sus clientes es una variable aleatoria
que tiene la siguiente funcin de densidad:
1
() = {8 + 2 6
0

Calcule el valor esperado del gasto mensual en libros.
Notas importantes

Unidad 4. Variables aleatorias

165

69. La variable X se distribuye uniformemente con media igual a 24 y varianza igual a 12, calcular los parmetros de la funcin de densidad.
70. La funcin de Excel =ALEATORIO() genera un nmero con distribucin uniforme con parmetros a igual a cero y b igual a uno. Sea X una variable aleatoria definida como el nmero generado por dicha funcin.
Calcule la probabilidad de que la funcin genere un nmero aleatorio entre 0,2 y 0,7.
Use la funcin de distribucin acumulada para calcular P(0,15 < X < 0,55).
71. El tiempo, en minutos, que demora un servicio de delivery en entregar una pizza puede
modelarse por una variable aleatoria uniforme con parmetros 10 y 38. Si la pizza se tarda ms de 30 minutos en ser entregada, el cliente no la pagar.
Si una familia pide una pizza, calcule la probabilidad de que le salga gratis.
Si la familia pide una pizza diaria durante diez das seguidos, calcule la probabilidad de
que por lo menos una de ellas le salga gratis.
Una familia pidi una pizza hace 25 minutos y an no ha llegado, cul es la probabilidad
de que le salga gratis?
72. Una compaa ha comprado una prueba para seleccionar personal. Los que han diseado la prueba saben que las notas siguen una distribucin normal con una media de 75
puntos y una desviacin estndar de diez puntos. Calcule la probabilidad de que una
persona que rinda esta prueba obtenga una nota superior a 90 puntos.
73. En una ciudad se estima que la temperatura mxima en un da del mes de enero puede
modelarse con una variable normal con media 30C y desviacin estndar 2C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima sea menor a 31C.
Si se escoge al azar un da del mes de enero, calcule la probabilidad de que la temperatura mxima est entre 28,5 y 32C.
Calcule el nmero esperado de das en el mes de enero en que la temperatura mxima
es mayor a 33C. Asuma independencia entre las temperaturas de un da y otro.
74. Marque la opcin correcta.
La moda de una variable aleatoria normal X es:
a. Igual a cero
b. El esperado de X
c. Aquel valor para el cual f(Me) = 0,5, donde f es la funcin de densidad de X
d. No se puede determinar sin saber la desviacin estndar.
e. Es el valor que acumula ms del 50% del rea
75. La vida til, en meses, de un artefacto elctrico es una variable aleatoria con distribucin
exponencial con parmetro . El fabricante afirma que el 90% de estos componentes
tienen una vida til que supera los 60 meses. Cul es la media de la vida til de estos
componentes?

Notas importantes

166

Estadstica Descriptiva 201602

76. Indique si son verdaderas o falsas las siguientes afirmaciones.


Afirmacin

La media de una variable normal puede ser negativa


Si Z es una variable normal estndar P(Z > c) = 0,025, entonces c = -1,96
Si X es una variable normal se cumple que
P(X < c) = P (X c)
Si Z es una variable normal estndar se cumple que
P(Z < -c) = 1 - P (Z < c)
Si X es una variable normal se cumple que
P(X < -c) = 1 - P(X < c)
El rango de toda variable normal es igual a toda la recta
real
La funcin de densidad de la distribucin normal toma su
mayor valor en X =
La funcin de densidad de la distribucin normal en algunos casos no es simtrica
El esperado de una variable normal es siempre igual a

Notas importantes

Verdadero

Falso

Unidad 5 : Distribuciones muestrales


Logro de la unidad 5

Al finalizar la unidad 5,
el estudiante toma decisiones frente a situaciones reales de incertidumbre,
utilizando las distribuciones muestrales en el clculo de probabilidades.

Temario

Propiedad reproductiva de la distribucin normal

Distribucin muestral de un promedio

Teorema central del lmite

168

Estadstica Descriptiva 201602

Propiedad reproductiva de la normal


Si X1, X2, X3,..., Xn son n variables aleatorias independientes, tales que Xi ~ N(i, i2), para
cada i = 1, 2, 3,..., n, entonces, la variable aleatoria
S c1 X1 c2 X 2 cn X n

donde c1, c2, c3,..., cn son constantes, entonces:

S ~ N c1 1 c2 2 cn n ; c12 12 c22 22 cn2 n2

La suma de
una
variable
aleatoria
normal

con otra
variable
aleatoria
normal

es una
variable
aleatoria
normal

Si X1, X2 son dos variables aleatorias normales independientes, tales que


X1 ~ N 1 , 12 ; X2 ~ N 2 , 22 , entonces, S X1 X 2 ~ N c1 1 c2 2 ; c12 12 c22 22

Si X1, X2, X3,..., Xk son n variables aleatorias normales independientes, tales que
Xi ~ N , 2 , para i = 1, 2, 3,..., n, entonces, S X 1 X 2 X n ~ N n ; n 2

Sea X1 ~ N(1 = 7, 12 = 8) y X2 ~ N(2 = 6, 22 = 24) variables aleatorias independientes.


Calcule la distribucin de las siguientes variables:
S = X1 + X2

S = X1 - X2

S = X1 - 3X2

Notas importantes

Unidad 5. Distribuciones muestrales

169

Caso Aerolnea Wayra


Objetivo especfico: Analizar el peso de los pasajeros.
El peso de los pasajeros adultos de un avin se modela con una variable normal:
en mujeres, con media 65 kilos y desviacin estndar 15 kilos.
en hombres, con media 80 kilos y desviacin estndar 20 kilos.
Calcule la probabilidad de que 20 pasajeros hombres pesen ms de 1700 kilos.

Calcule la probabilidad de que 10 pasajeras mujeres y 10 pasajeros hombres pesen ms


de 1500 kilos.

Si en un avin donde el 60% de los pasajeros son mujeres, se elige una persona al azar,
calcule la probabilidad de que esta persona pese entre 70 y 80 kilos.

Notas importantes

170

Estadstica Descriptiva 201602

Ejemplo 47
Dos supermercados compiten por tomar el liderazgo del mercado. Un estudio reciente
de una compaa de investigacin de mercados, estim que las ventas diarias (en miles
de dlares) de los dos supermercados se modelan con distribuyen normalmente con
medias de 15 y 17 y desviaciones estndar de 3 y 4 respectivamente.
Calcule la probabilidad de que el segundo supermercado obtenga mayores ventas que el
primer supermercado en el primer da.
Solucin
Sean las variables:
X: Ventas diarias del primer supermercado
Y: Ventas diarias del segundo supermercado
X N(15, 9);

Y N(17, 16)

Se pide: P(Y > X) o su equivalente: P(Y X > 0)


Sea W = Y X, por la propiedad reproductiva de la distribucin normal, se tiene:
W N(17 15, 16 + 9), es decir: W N(2, 25)
P(Y X > 0) = P(W > 0)

W 0 2
P(W 0) P

5

P(W 0) P Z 0,40
P(W 0) 0,6554
Calcule la probabilidad de que la diferencia entre las ventas diarias de ambos supermercados no supere los 1000 dlares.
Solucin
En este caso se pide calcular:

1 2 W 1 2
P W 1 P 1 W 1 P

P 0,6 Z 0,2 0,1465

5
5

Notas importantes

Unidad 5. Distribuciones muestrales

171

Ejemplo 48
El peso de un usuario hombre del Metropolitano se modela con una variable normal con
media de 75 kilos y desviacin estndar de 15 kilos, mientras que para una usuaria mujer con media de 60 kilos y desviacin estndar de 10 kilos. Si en un bus hay 50 hombres
y 30 mujeres.
a. Si se elige una persona al azar, calcule la probabilidad de que pese ms de 70 kilos.
Solucin
Sean los eventos
A: = una persona pese ms de 70 kilos
H:= Que el usuario sea hombre.
M:= Que el usuario sea mujer
Sean las variables aleatorias
X = peso de un hombre

X ~ N(75; 152)

Y = peso de una mujer

Y ~ N(60; 102)

Por teorema de la probabilidad total () = (). ( ) + (). ()


Calculemos cada una de las probabilidades condicionadas
( ) = ( > 70) = 1 ( < 0,33) = 0,6293
() = ( > 70) = 1 ( < 1) = 0,1587
Luego,
50

30

() = (). ( ) + (). () = 80 0,6293 + 80 0,1587 = 0,4528

b. Calcule la probabilidad de que el peso total de los 50 hombres y 30 mujeres supere


5500 kilos.
Solucin
Sea Y := el peso total de los 50 hombres y 30 mujeres
50

30

= +
=1

=1

Por propiedad reproductiva de la normal, ~(50 75 + 30 60; 50 152 +


30 102 ), es decir, ~(5 550; 14 250).
Nos piden ( > 5 500) = ( > 0,35) = 0,6623.

Notas importantes

172

Estadstica Descriptiva 201602

Definiciones
Debido a que, muchas veces, es imposible preguntarle o medir a toda la poblacin, un
estudio estadstico se inicia con la seleccin de una muestra.
El muestreo comprende por lo menos dos etapas:
La seleccin de las unidades
El registro de las observaciones

Muestreo con y sin reemplazo


Muestreo sin reemplazo
Las unidades se pueden seleccionar slo una vez.
Muestreo con reemplazo
Las unidades se puede seleccionar ms de una vez.

Poblacin finita e infinita


Muestreo aleatorio simple (poblacin finita)
Una muestra aleatoria simple de tamao n, de una poblacin finita de
tamao N, es una muestra seleccionada de tal manera que cada muestra
posible de tamao n tenga la misma probabilidad de ser seleccionada.
Muestreo aleatorio simple (poblacin infinita)
Una muestra aleatoria simple de tamao n, de una poblacin infinita es
aquella que se selecciona de tal forma que satisface las siguientes
condiciones:
cada elemento seleccionado proviene de la misma poblacin
cada elemento se selecciona de forma independiente.

Distribucin muestral de un estadstico


Es la lista de posibles valores de un estadstico y la probabilidad asociada a cada valor.

Notas importantes

Unidad 5. Distribuciones muestrales

173

Distribucin de la media muestral


Es la lista de todas las medias posibles de tamao n tomadas de una poblacin especfica
y sus probabilidades asociadas.
Se tiene que:
Media

EX

Varianza

V X

2
n

Factor de correccin por poblacin finita


Si el muestreo es sin reemplazo en poblaciones de tamao finito N, entonces debe usarN n
se el factor de correccin por poblacin finita
N 1
Varianza

V X

2 N n
n N 1

Distribucin muestral de la media de una poblacin con varianza conocida


Si la poblacin sigue una distribucin normal con media y desviacin estndar entonces:
2
Si el muestreo es con reemplazo X N ,
n

2 N n
Si el muestreo es sin reemplazo X N ,

n N 1

Segn un informe del INEI, en el trimestre julio-agosto-setiembre del 2015, en Lima Metropolitana, el ingreso promedio mensual proveniente del trabajo fue de 1557 nuevos
soles. Por investigaciones anteriores se sabe que la desviacin estndar es de 400 nuevos soles. Si se toma una muestra de 100 personas, calcule la probabilidad de que la
media muestral est entre 1500 y 1600 nuevos soles. Asuma normalidad.

Notas importantes

174

Estadstica Descriptiva 201602

Teorema central del lmite

Sean n variables
aleatorias X1, X2, X3,...Xn
independientes e
igualmente distribuidas
con media
y varianza 2

entonces la variable
aleatoria
S = X1 + X2 + X3 +...+ Xn
tiene una distribucin
aproximadamente
normal a medida que n
crece,

independientemente de la
distribucin de la
poblacin.

Por propiedades de esperado y varianza se tiene que:


E S n
V S n 2

Se considera una buena aproximacin a la distribucin normal si n 30.


Del teorema central del lmite, se deduce que la distribucin muestral de la media X se
aproxima a la distribucin normal si n 30.
Caso Aerolnea Wayra
Objetivo especfico: Analizar el peso del equipaje de los pasajeros.
El peso del equipaje de los pasajeros de un avin se modela con una variable uniforme
con parmetros 10 y 30 kilos. Calcule la probabilidad de que el peso total del equipaje
de 50 pasajeros supere los 1050 kilos.

Notas importantes

Unidad 5. Distribuciones muestrales

175

Objetivo especfico: Analizar el nmero de vuelos cancelados.


El nmero de vuelos nacionales cancelados en un da se modela con la siguiente funcin
de probabilidad:
x

f(x)

0,40

0,25

0,15

0,1

0,05

0,05

Se toma una muestra de 100 das, calcule la probabilidad de que se cancelen entre 125 a
135 vuelos nacionales.

Notas importantes

176

Estadstica Descriptiva 201602

Ejemplo 49
El Metropolitano cuenta con una cuenta de correo para cualquier consulta, sugerencia,
queja o reclamo. El nmero de correos electrnicos que llegan a la cuenta de correo se
modela como una variable aleatoria Poisson con una media de ocho correos por da.
Solucin
a. Calcule la probabilidad que en medio da llegue ms de tres correos con consultas,
sugerencias, quejas o reclamos. Defina la variable necesaria y establezca su distribucin, rango y parmetros.
Sea X = nmero de correos electrnicos que llegan a la cuenta de correo del Metropolitano en medio da

8
1

y t = 0,5 da

X ~ P( = 4 correos )
P(X > 3) = 1- P(X 3) = 1 0,4335 = 0,5665
b. Si se eligen al azar 100 das, calcule la probabilidad que la cantidad total de correos
recibidos en esos 100 das est entre 790 y 810.
Sea Xi = nmero de correos electrnicos que llegan a la cuenta de correo del Metropolitano en el da, i = 1,,100
Sea Y := cantidad total de correos en los 100 das
100

=
=1

Por teorema central del lmite, ( = 100 8; 2 = 100 8), es decir,


(800; 800).
Nos piden (790 < < 810) = (0,35 < < 0,35) = 0,2737.
Tambin se puede calcular usando la distribucin de la media muestral.
Nos piden (790 < < 810) = (7,9 < < 8,1)
2

8
Por teorema central del lmite, ( = 8, = 100), es decir, (8; 0,08).

Luego, (790 < < 810) = (7,9 < < 8,1) = 0,2737

Notas importantes

Unidad 5. Distribuciones muestrales

177

Ejemplo 50
Se define la variable aleatoria X: nmero de das a la semana que un usuario usa el Metropolitano. Esta variable presenta la siguiente funcin de probabilidad.
X: Nmero de das
f(x)

0,05

0,10

0,15

0,15

0,20

0,25

0,05

0,05

a. Calcule el esperado y la varianza de X.


Solucin
Usando la calculadora, E(X) = 3,55 y V(X) = 3,1475

b. Si se elige al azar una muestra de 1000 usuarios, calcule la probabilidad de que la


media muestral del nmero de das que usan el Metropolitana est entre 3,5 y 3,6
das.
Solucin
2

3,1475
Por teorema central del lmite, ( = 3,55, = 1000 ) , es decir, ,
(3,55; 0,0031475).

Nos piden (3,5 < < 3,6) = (0,89 < < 0,89) = 0,6272.
Ejemplo 51
El tiempo de espera para tomar un bus de un usuario se modela con una variable uniforme con parmetros 0 y 10 minutos.
a. Si se elige un usuario al azar, calcule la probabilidad de que su tiempo de espera sea
mayor a ocho minutos.
Solucin
X=: tiempo de espera para tomar un bus. X ~ U(0,10)
P(X > 8) = 0,20
b. Si se elige al azar a 500 usuarios, calcule la probabilidad de que la media del tiempo
de espera de esos 500 usuarios est en 4,8 y 5,2 minutos.
Solucin
= (a+b)/2 = (0+10)/2= 5
2= (10 - 0)2/12 = 8,3333
Por teorema central del lmite,
2

8,3333
( = 5, = 500 ), es decir, (5; 0,01667)

Nos piden (4,8 < < 5,2) = (1,55 < < 1,55) = 0,8789

Notas importantes

178

Estadstica Descriptiva 201602

Ejercicios de la Unidad 5
77. En un estudio de evaluacin de la atencin de un servicio de cafeteras, los tiempos, en
minutos, que tardan en atender a un cliente las cafeteras A y B se modelaron con las variables aleatorias X ~ N(4,9) y Y ~ N(5,16) respectivamente y de manera independiente.
Si en cada cafetera son atendidas 20 personas, halle la probabilidad de que el tiempo
total de atencin en la cafetera B sea mayor que el de la cafetera A.
78. Lima y El Cairo (Egipto) son las dos principales ciudades del mundo que estn situadas
en zonas desrticas y con extremo estrs hdrico. En Pars, Zurich o Berln, el consumo
promedio por persona de agua bordea los 130 litros por da. Sin embargo, segn una investigacin del Centro de Investigacin en Geografa Aplicada de la Pontificia Universidad Catlica del Per, en Lima, el consumo promedio por persona asciende a 250 litros
por da. Adems, la desviacin estndar del consumo por persona se estima en 60 litros
por da. Si se toma una muestra aleatoria en Lima de 100 personas, calcule la probabilidad de que el consumo total muestral en un da sea menor a 24 mil litros.
79. La cantidad de mango que exporta una empresa mensualmente se modela con una variable aleatoria con media de 25 toneladas y desviacin estndar de cuatro toneladas.
Encontrar la probabilidad de que la cantidad exportada en tres aos sea menor a 920
toneladas. Asuma independencia entre las cantidades mensuales exportadas.
80. El nmero de personas que llega a un concierto se modela con una variable Poisson con
una media de 3,1 personas por minuto. Calcule la probabilidad de que en una hora lleguen entre 180 y 190 personas.
81. La duracin, en minutos, de una llamada telefnica en la sala de profesores puede modelarse por una variable aleatoria X con la siguiente funcin de densidad
a 3 x
0 x 3
f x
en otro caso
0

Calcule la probabilidad de que el tiempo total de 100 llamadas sea mayor a 100 minutos.
82. Una familia tiene tres hijos. El monto de la propina semanal que se le da a cada hijo
puede modelarse como una variable normal. Al menor se le da en media 20 nuevos soles por semana con una desviacin estndar de 3 nuevos soles, al segundo hijo se le da
el doble que al menor y al mayor se le da el triple que al menor. Calcular la probabilidad
de que en cuatro semanas la suma total recibida en propinas por los tres sume ms de
500 nuevos soles.
83. Marque la afirmacin correcta.
El teorema del lmite central afirma que:
a. A medida que el tamao poblacional crece, la distribucin de la media poblacional
tiende a una distribucin normal
b. A medida que el tamao poblacional crece, la distribucin de la media muestral tiende a una distribucin normal
c. A medida que el tamao muestral crece, la distribucin de la media poblacional tiende a una distribucin normal
d. A medida que el tamao muestral crece, la distribucin de la media muestral tiende a
una distribucin normal
Notas importantes

Unidad 5. Distribuciones muestrales

179

84. Marque la afirmacin correcta.


El teorema del lmite central afirma que:
a. La suma de variables aleatorias normales independientes es una variable normal
b. La suma de ms de 30 variables aleatorias normales independientes es una variable
normal
c. La suma de ms de 30 variables aleatorias independientes es una variable normal
d. La suma de ms de 30 variables aleatorias independientes es aproximadamente
una variable normal

Notas importantes

Unidad 6 : Muestreo
Logro de la unidad 6

Al finalizar la unidad 6,
el estudiante analiza situaciones reales, relacionadas con su especialidad,
en donde aplica la teora de muestreo.

Temario

Muestreo: Conceptos y definiciones bsicas: Poblacin, marco muestral, muestra

Censo y muestreo ventajas y desventajas.

Diseo de la encuesta por muestreo.

Tipos de muestreo:

No probabilstico

Probabilstico (aleatorio simple, aleatorio estratificado y sistemtico)

Unidad 6. Muestreo

Definiciones
Elemento
Es el objeto sobre el cual se hace la medicin. Tambin llamada unidad
elemental.
Poblacin muestreada
Es la coleccin de todos los elementos posibles que podran extraerse en
una muestra.
Marco muestral
Es una lista de los elementos que estn disponibles para su eleccin en la
etapa de muestreo.
Censo
Es el estudio completo de todos los elementos de la poblacin.
Parmetro
Es un resumen de una caracterstica de una poblacin.
Estadstico
Es un resumen de una caracterstica de una muestra.

Ejemplo 52

Notas importantes

183

184

Estadstica Descriptiva 201602

Ventajas y desventajas del muestreo frente al censo


Ventajas del muestreo

Ahorro de dinero debido a que se consideran


menos unidades para trabajar

Ahorro de tiempo, dado que el nmero de


mediciones solo es de una parte
representativa de la poblacin

Mayor precisin, la muestra puede ser ms


precisa porque reduce la magnitud de los
errores no muestrales, debido a que:

Existe menos personal necesario para hacer


las mediciones (u observaciones)
Hay personal con mejor preparacin
Puede variar las condiciones del estudio si
se demora su ejecucin

Conveniencia, es conveniente el uso de una


muestra si el estudio ocasiona la destruccin
de la unidad estudiada

Desventajas del muestreo

Las estimaciones resultantes del muestreo


estn afectas al inevitable error de muestreo

La informacin proveniente de una muestra


no proporciona informacin tipo inventario
para cada uno de los elementos de la
poblacin

Las estimaciones no pueden subdividirse para


pequeos dominios de anlisis, considerando
que no todos ellos pueden estar
representados debidamente en la muestra

Requiere de personal especializado y


experimentado

Notas importantes

Unidad 6. Muestreo

185

Muestreo probabilstico
En el muestreo probabilstico, la seleccin de cada elemento de la muestra se hace siguiendo reglas matemticas de decisin. Todos los elementos de la poblacin tienen una
probabilidad real y conocida de ser seleccionados. Existen diversos mtodos de muestreo probabilstico, como por ejemplo:

Muestreo aleatorio simple


Se selecciona una muestra en forma aleatoria y sin reemplazo a n unidades de muestreo
de una poblacin que contiene un total de N unidades. Se garantiza que cada una de las
muestras posibles tiene la misma probabilidad de ser elegida.

Muestreo sistemtico
Se selecciona un primer elemento aleatoriamente y, luego, los dems elementos que
conformarn la muestra cada cierto intervalo. Este muestreo supone que se cuenta con
una enumeracin completa de los elementos de la poblacin.

Muestreo estratificado
Se selecciona la muestra de los diversos estratos. Un estrato es una parte de la poblacin, cuyos elementos tienen caractersticas similares. El objetivo de estratificar la poblacin es buscar homogeneidad entre los estratos.

Notas importantes

186

Estadstica Descriptiva 201602

Muestreo aleatorio simple


En este procedimiento, se selecciona una muestra en forma aleatoria y sin reemplazo a
n unidades de muestreo de una poblacin que contiene un total de N unidades.
Se garantiza que cada una de las muestras posibles tiene la misma probabilidad de ser
elegida.

Pasos a seguir para seleccionar una muestra simple aleatoria


1.
2.

Enumere las unidades del marco muestral con nmeros sucesivos.


Seleccione tantos elementos del marco muestral como sea el tamao requerido de
la muestra, usando una tabla de nmeros aleatorios.

El muestreo aleatorio simple presenta dos propiedades:


Representativo: Cada unidad tiene las mismas posibilidades de ser escogida.
Independencia: La seleccin de una unidad no influye en la seleccin de otras unidades.
Pero en el mundo real es difcil encontrar muestras completamente independientes y
representativas. Por ejemplo, hacer una encuesta a los votantes marcando nmeros de
telfono al azar es un mtodo no representativo pues no tiene en cuenta a los votantes
que no disponen de telfono y cuenta varias veces a los que tienen varios nmeros.

Una empresa de consumo tiene un total de 150 trabajadores y ha registrado en el cuadro siguiente, informacin acerca del ingreso mensual (en nuevos soles) y aos cumplidos en la empresa de cada uno de sus trabajadores.
Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de nmeros aleatorios.
Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las
columnas C11, C6, C1 y C9 de la tabla de nmeros aleatorios.

Notas importantes

Unidad 6. Muestreo

187

Trabajadores registrados
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

Ingreso
Aos en la empresa
(en soles)
2300
5
2800
11
2400
4
2500
2
2300
3
2100
2
1700
2
2000
0
2200
7
2100
4
1700
0
2500
2
2800
13
2400
9
1700
1
2400
9
2200
10
2200
4
2300
10
2800
11
2100
7
1700
1
2500
6
2400
9
2700
17
1700
0
1600
2
2600
17
2500
13
2500
16
2700
17
1700
1
1600
1
2400
11
1900
3
1800
5
1800
3
2400
14
2600
16
2700
18
2100
11
2300
14
1700
0
2200
13
2900
20
1800
5
2100
16
2000
12
2000
12
2900
20

Notas importantes

Ingreso
Aos en la empresa
(en soles)
51
2100
13
52
2100
9
53
1800
1
54
2000
9
55
2100
10
56
1900
4
57
2000
10
58
2300
11
59
2000
7
60
1700
1
61
1900
6
62
2000
9
63
2400
17
64
1700
0
65
1700
2
66
2400
17
67
2500
13
68
2600
16
69
2100
14
70
1900
7
71
2000
9
72
1800
7
73
2100
10
74
2300
12
75
2700
20
76
2800
20
77
1800
3
78
1700
5
79
1700
4
80
1700
0
81
1700
1
82
2100
6
83
2600
17
84
2400
9
85
2600
19
86
1900
7
87
1600
0
88
1900
3
89
2100
14
90
1700
0
91
2100
15
92
1700
1
93
2300
14
94
2500
16
95
2600
18
96
1900
3
97
2500
19
98
1800
6
99
1700
2
100
2000
10
N

N
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150

Ingreso Aos en la
(en soles) empresa
2400
16
1700
0
2500
12
1700
3
2400
17
2400
16
1900
7
1700
1
2100
6
2000
5
2000
3
2500
13
1700
0
2500
19
1700
3
2600
19
1600
1
1800
6
2100
10
1700
0
2400
16
2600
17
2100
10
2100
8
2400
17
1700
1
2600
20
2400
16
2700
17
2100
12
1600
0
2100
15
1900
5
2100
12
2200
12
2400
13
1800
4
2600
17
2700
20
2500
16
2500
16
1900
6
2100
15
1700
9
1500
0
1800
18
2100
10
2700
19
1800
9
2100
15

188

Estadstica Descriptiva 201602

Seleccione una muestra de 15 trabajadores usando muestreo simple aleatorio. Use las
columnas C4, C8, C11 y C15 de la tabla de nmeros aleatorios.
Solucin

C1
4
9
0
9
1
2
6
1
4
0
7
4
6
9
1
0
3
9
5
8
0
9
6
7
3
9
4
8
4
6

C2
8
2
2
6
6
9
1
3
5
0
2
9
1
3
8
2
6
4
9
1
5
7
9
4
8
9
8
6
7
5

Seleccionemos tantos elementos del marco muestral como sea el tamao requerido de
la muestra, usando una tabla de nmeros aleatorios. Como el marco muestral tiene 150
elementos usemos las columnas C4, C5 y C6, para elegir nmeros de tres cifras y luego C8,
C9 y C10.
C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
2
4
6
6
3
5
4
5
6
0
5
2
6
9
8
0
0
9
9
8
1
4
4
1
9
8
5
1
1
9
7
9
8
5
9
0
1
3
3
9
1
6
2
9
7
1
2
6
6
0
7
5
6
4
0
8
3
5
6
6
6
4
0
8
6
3
4
8
1
8
5
4
4
1
6
5
2
7
7
2
9
9
9
9
7
4
1
5
4
9
0
5
5
0
8
4
8
7
4
6
2
1
7
0
1
5
8
7
2
9
5
0
4
0
9
8
2
0
2
6
8
7
0
1
9
7
1
8
9
9
0
1
2
6
3
7
1
9
6
1
7
9
9
8
8
1
1
4
5
6
7
9
9
9
2
1
3
2
3
7
7
9
3
6
9
6
5
0
6
4
7
9
8
1
2
4
4
8
3
6
4
5
4
1
2
4
4
6
9
2
6
6
6
5
2
0
0
4
3
4
4
2
4
5
9
0
8
7
4
8
4
2
1
2
5
4
2
8
1
3
3
2
0
2
6
0
7
2
7
9
1
4
6
5
4
0
8
1
3
3
7
3
2
4
8
6
7
9
0
6
2
8
7
1
3
4
3
9
3
1
7
8
3
7
3
3
0
8
3
5
1
4
7
5
7
3
1
1
9
3
3
8
7
4
8
0
2
5
3
4
1
9
8
1
0
9
0
1
1
0
9
3
6
8
6
0
6
7
6
7
9
1
2
2
7
2
3
9
3
4
6
9
8
1
9
8
4
4
5
9
1
5
4
7
3
0
6
8
1
6
8
1
8
8
2
3
9
1
4
2
4
9
1
4
0
6
0
3
2
8
3
8
0
4
3
9
4
6
0
8
8
3
8
7
1
2
2
3
1
4
2
7
5
5
2
8
6
6
3
5
5
9
9
0
6
8
5
9
4
9
1
8
2
0
2
5
3
9
1
2
0
3
0
8
9
1
4
8
8
6
6
8
5
9
4
8
5
7
7
9
6
7
1
2
2
4
0
1
4
5
7
7
4
0
4
8
9
4
7
0
9
7
8
0
0
9
3
2
7
0
5
0
2
7
8
7
3
6
1
5
8
5
5
1
4
9
6
4
4
4
7
4
5
7
5
0
7
3
6
1
7
1
1
3
5
5
7
4
4
7
6
7
2
8
1
4
0
3
6
2
4
4
4
4
0
3
6
3
4
1
2
8
5
8
8
4
3
4
8
9
0
6
7
6
0
0
8
6
8
4

2
2
3
3
1
8
1
2
6
6
4
1
4
8
5
1
9
0
3
9
1
9
0
5
8
4
9
2
8
6
1
9
2
5
0
1
9
1
0
9
7
5
5
6
0
6
1
3
3
8
6
9
9
8
0
8
3
1
6
1
0
5
7
Los elementos seleccionados son:
Posicin

114

Notas importantes

81

134

148

9
1
6
2
0
1
5
1
5

8
0
1
3
7
2
2
8
7

39

97

4
6
7
9
9
7
1
2
0
105

2
0
8
8
0
1
0
6
6

8
1
8
5
0
9
1
6
3
98

5
3
2
9
7
4
9
8
0

2
4
8
5
4
8
2
4
4

126

64

8
0
0
7
5
4
8
0
1
109

1
9
7
8
4
8
0
7
4
122

7
1
8
4
8
9
2
8
0

6
2
4
9
6
6
6
2
3
142

4
8
8
9
2
6
6
5
0
145

6
6
0
4
3
9
3
1
8
149

Unidad 6. Muestreo

189

Seleccione una muestra de diez trabajadores usando muestreo simple aleatorio. Use las
columnas C3, C9, C12 y C4 de la tabla de nmeros aleatorios.
C1
4
9
0
9
1
2
6
1
4
0
7
4
6
9
1
0
3
9
5
8
0
9
6
7
3
9
4
8
4
6
9
1
3
9
1
2
6
3
0
4
7
2
2
5
9
8
8
3

C2
8
2
2
6
6
9
1
3
5
0
2
9
1
3
8
2
6
4
9
1
5
7
9
4
8
9
8
6
7
5
2
3
3
9
7
7
0
3
1
7
8
2
6
1
0
6
6
1

C3
2
9
1
0
4
0
2
1
8
3
4
3
2
4
7
1
3
6
9
8
3
1
5
9
1
9
1
7
1
5
0
7
2
9
5
1
9
6
9
1
9
3
6
9
5
1
9
6

C4
4
8
3
8
1
5
9
8
1
6
5
4
8
0
1
4
4
7
8
8
8
4
9
1
2
7
5
3
4
8
9
9
5
8
4
7
2
3
7
5
9
3
4
0
8
9
9
1

C5
6
1
3
3
6
5
5
9
1
9
4
4
1
8
3
7
1
6
4
2
0
2
4
4
2
8
8
6
0
8
8
4
6
2
0
8
6
4
9
3
6
1
1
3
4
2
8
0

C6
6
4
9
5
5
0
0
9
4
6
1
2
3
1
4
5
9
7
4
3
4
7
9
8
4
0
5
1
3
4
2
8
7
8
9
8
1
9
7
7
8
8
4
9
9
5
0
5

C7
3
4
1
6
2
8
4
0
5
5
2
4
3
3
3
7
8
9
5
9
3
5
1
8
0
0
5
7
6
3
8
3
6
8
5
3
5
6
9
0
5
1
8
1
2
0
8
7

C8
5
1
6
6
7
4
0
1
6
0
4
5
2
3
9
3
1
1
9
1
9
5
8
6
1
9
1
1
2
4
3
7
1
1
7
8
1
4
4
9
6
9
1
6
2
0
1
5

C9
4
9
2
6
7
8
9
2
7
6
4
9
0
7
3
1
0
2
1
4
4
2
2
6
4
3
4
1
4
8
4
0
6
9
8
6
2
4
4
2
8
8
0
1
3
7
8
7

Los elementos seleccionados son:


Posicin
Notas importantes

C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
5
6
0
5
2
6
9
8
0
0
9
8
5
1
1
9
7
9
8
5
9
0
9
7
1
2
6
6
0
7
5
6
4
4
0
8
6
3
4
8
1
8
5
4
2
9
9
9
9
7
4
1
5
4
9
7
4
6
2
1
7
0
1
5
8
7
8
2
0
2
6
8
7
0
1
9
7
6
3
7
1
9
6
1
7
9
9
8
9
9
9
2
1
3
2
3
7
7
9
4
7
9
8
1
2
4
4
8
3
6
6
9
2
6
6
6
5
2
0
0
4
0
8
7
4
8
4
2
1
2
5
4
2
6
0
7
2
7
9
1
4
6
5
3
2
4
8
6
7
9
0
6
2
8
1
7
8
3
7
3
3
0
8
3
5
1
9
3
3
8
7
4
8
0
2
5
9
0
1
1
0
9
3
6
8
6
0
2
7
2
3
9
3
4
6
9
8
1
5
4
7
3
0
6
8
1
6
8
1
2
4
9
1
4
0
6
0
3
2
8
6
0
8
8
3
8
7
1
2
2
3
8
6
6
3
5
5
9
9
0
6
8
0
2
5
3
9
1
2
0
3
0
8
8
5
9
4
8
5
7
7
9
6
7
5
7
7
4
0
4
8
9
4
7
0
2
7
0
5
0
2
7
8
7
3
6
9
6
4
4
4
7
4
5
7
5
0
3
5
5
7
4
4
7
6
7
2
8
4
4
4
0
3
6
3
4
1
2
8
9
0
6
7
6
0
0
8
6
8
4
3
2
8
9
4
8
7
9
4
9
4
8
6
6
6
8
4
1
1
3
1
3
6
1
7
6
5
8
1
6
2
2
7
1
6
2
7
5
1
8
6
1
4
4
7
5
0
8
6
6
2
5
3
2
3
9
9
2
7
4
5
9
5
6
6
6
3
1
8
1
2
0
8
6
4
4
0
9
8
5
7
3
3
4
2
3
2
8
1
6
6
7
7
0
7
9
8
6
8
5
2
1
0
0
4
0
4
6
8
8
1
9
2
7
5
1
7
0
1
5
5
4
2
8
5
2
8
1
7
6
4
6
6
0
1
3
4
0
9
1
2
8
6
7
8
8
2
8
0
7
8
4
8
0
9
8
5
9
5
7
8
4
9
9
4
9
0
0
7
4
5
4
8
6
2
3
2
6
6
8
4
0
7
8
2
5
1
0
6
3
0
4
1
4
0
3
0
8

190

Estadstica Descriptiva 201602

Muestreo sistemtico
En el muestreo sistemtico se elige un elemento del marco muestral cada cierto intervalo. Este muestreo supone que se cuenta con una enumeracin completa de los elementos de la poblacin.
Procedimiento para seleccionar una muestra sistemtica

N
. El valor de k se redondea al valor del entero
n

1.

Calcule el valor de k, donde k

2.

menor.
Seleccione aleatoriamente un nmero entero entre 1 y k llamado arranque aleatorio (A).

3.

A partir de este nmero elegido, seleccione el siguiente que ocupa la posicin (A +


k) del listado del marco muestral y as sucesivamente hasta completar la muestra.

Ejemplo 53
Se tiene una poblacin de 12 personas y se desea elegir a cuatro de ellas mediante un
muestreo sistemtico. Cul es el arranque aleatorio para este ejemplo? Use la columna
C3, C6 y C12.
Solucin
Calculemos el valor de k, donde k

N 12
3 . El valor de k se redondea al valor del
n 4

entero menor, luego k = 3.


Seleccionemos aleatoriamente un nmero entero entre 1 y k = 3, llamado arranque
aleatorio (A). Observando la columna C3 de la tabla de nmeros aleatorios tenemos que
A = 2.

Notas importantes

Unidad 6. Muestreo

191

Tabla de nmeros aleatorios


C1
4
9
0

C2
8
2
2

C3
2
9
1

C4
4
8
3

C5
6
1
3

C6
6
4
9

C7
3
4
1

C8
5
1
6

C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
4
5
6
0
5
2
6
9
8
0
0
9
9
8
5
1
1
9
7
9
8
5
9
0
2
9
7
1
2
6
6
0
7
5
6
4

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la quinta posicin (3 + 2 = 5) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 2, 5, 8 y 11.
Ejemplo 54
Se tiene una poblacin de 15 personas y se desea elegir a seis de ellas mediante un
muestreo sistemtico. Cul es el arranque aleatorio para este ejemplo? Use la columna
C4, C8 y C1.
Solucin
Calculemos el valor de k, donde k

N 15
2,5 . El valor de k se redondea al valor del
n 6

entero menor, luego k = 2.


Seleccionemos aleatoriamente un nmero entero entre 1 y k = 2, llamado arranque
aleatorio (A). Observando la columna C4 de la tabla de nmeros aleatorios tenemos que
A = 1.

Tabla de nmeros aleatorios


C1
4
9
0
9
1
2

C2
8
2
2
6
6
9

C3
2
9
1
0
4
0

C4
4
8
3
8
1
5

C5
6
1
3
3
6
5

C6
6
4
9
5
5
0

C7
3
4
1
6
2
8

C8
5
1
6
6
7
4

C9
4
9
2
6
7
8

C10
5
8
9
4
2
7

C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
6
0
5
2
6
9
8
0
0
9
5
1
1
9
7
9
8
5
9
0
7
1
2
6
6
0
7
5
6
4
0
8
6
3
4
8
1
8
5
4
9
9
9
9
7
4
1
5
4
9
4
6
2
1
7
0
1
5
8
7

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la tercera posicin (1 + 2 = 3) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 1, 3, 5, 7, 9 y
11.

Notas importantes

192

Estadstica Descriptiva 201602

Ejemplo 55
Se tiene informacin de 40 personas de un barrio de Lima Metropolitana. Obtenga una
muestra aleatoria de ocho personas usando el muestreo sistemtico y elabore una tabla
con los elementos seleccionados. Utilice las columnas C8; C10; C11 de la tabla de nmeros
aleatorios.
Individuos registrados
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14

Sexo
Mujer
Hombre
Hombre
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Mujer
Hombre
Hombre
Mujer
Hombre

Edad
15
16
21
31
21
24
32
26
21
22
18
25
29
25

Estatura
154
154
156
184
173
170
176
188
169
173
177
181
164
159

N
15
16
17
18
19
20
21
22
23
24
25
26
27
28

Sexo
Mujer
Mujer
Hombre
Mujer
Hombre
Hombre
Mujer
Hombre
Hombre
Hombre
Hombre
Mujer
Mujer
Hombre

Edad
19
30
29
25
29
25
16
31
18
21
31
28
19
31

Estatura
178
163
180
174
137
153
168
161
270
173
187
161
172
162

N
29
30
31
32
33
34
35
36
37
38
39
40

Sexo
Hombre
Hombre
Mujer
Mujer
Mujer
Hombre
Mujer
Hombre
Mujer
Hombre
Mujer
Mujer

Edad
33
17
34
20
26
25
23
20
34
35
30
29

Estatura
147
167
69
76
74
90
164
164
176
188
155
141

Solucin

N 40

5
n 8
El valor de k se redondea al valor del entero menor, luego k = 5.
Seleccionemos aleatoriamente un nmero entero entre 1 y k = 5, llamado arranque
aleatorio (A).
Observando la columna C8 de la tabla de nmeros aleatorios tenemos que A = 5.
Calculemos el valor de k, donde k

Tabla de nmeros aleatorios


C1

C2

C3

C4

C5

C6

C7

C8

C9

C10

4
9
0
9
1
2

8
2
2
6
6
9

2
9
1
0
4
0

4
8
3
8
1
5

6
1
3
3
6
5

6
4
9
5
5
0

3
4
1
6
2
8

5
1
6
6
7
4

4
9
2
6
7
8

5
8
9
4
2
7

C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
6
5
7
0
9
4

0
1
1
8
9
6

5
1
2
6
9
2

2
9
6
3
9
1

6
7
6
4
7
7

9
9
0
8
4
0

8
8
7
1
1
1

0
5
5
8
5
5

0
9
6
5
4
8

9
0
4
4
9
7

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k), es
decir la dcima posicin (5+5 = 10) del listado del marco muestral y as sucesivamente
hasta completar la muestra. Es decir, elegiremos los datos de las posiciones 5, 10, 15,
20, 25, 30, 35 y 40.
Los elementos seleccionados son:
Posicin

Notas importantes

10

15

20

25

30

35

40

Unidad 6. Muestreo

193

Una empresa de telecomunicaciones tiene un total de 150 empleados y ha registrado en


la tabla que se muestra a continuacin informacin acerca de las variables: ingreso mensual (en soles), nivel de educacin y aos cumplidos en la empresa.
Trabajadores registrados
N
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50

Ingreso
(soles)
2300
2800
2400
2500
2300
2100
1700
2000
2200
2100
1700
2500
2800
2400
1700
2400
2200
2200
2300
2800
2100
1700
2500
2400
2700
1700
1600
2600
2500
2500
2700
1700
1600
2400
1900
1800
1800
2400
2600
2700
2100
2300
1700
2200
2900
1800
2100
2000
2000
2900

Nivel de
Educacin
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Secundaria
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica

Notas importantes

Aos en
empresa
5
11
4
2
3
2
2
0
7
4
1
2
13
9
1
9
10
4
10
11
7
1
6
9
17
0
2
17
13
16
17
1
1
11
3
5
3
14
16
18
11
14
0
13
20
5
16
12
12
20

Ingreso
(soles)
51
2100
52
2100
53
1800
54
2000
55
2100
56
1900
57
2000
58
2300
59
2000
60
1700
61
1900
62
2000
63
2400
64
1700
65
1700
66
2400
67
2500
68
2600
69
2100
70
1900
71
2000
72
1800
73
2100
74
2300
75
2700
76
2800
77
1800
78
1700
79
1700
80
1700
81
1700
82
2100
83
2600
84
2400
85
2600
86
1900
87
1600
88
1900
89
2100
90
1700
91
2100
92
1700
93
2300
94
2500
95
2600
96
1900
97
2500
98
1800
99
1700
100 2000
N

Nivel de
Educacin
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica

Aos en
empresa
13
9
1
9
10
4
10
11
7
1
6
9
17
0
2
17
13
16
14
7
9
7
10
12
20
20
3
5
4
0
1
6
17
9
19
7
0
3
14
0
15
1
14
16
18
3
19
6
2
10

N
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150

Ingreso
(soles)
2400
1700
2500
1700
2400
2400
1900
1700
2100
2000
2000
2500
1700
2500
1700
2600
1600
1800
2100
1700
2400
2600
2100
2100
2400
1700
2600
2400
2700
2100
1600
2100
1900
2100
2200
2400
1800
2600
2700
2500
2500
1900
2100
1700
1500
1800
2100
2700
1800
2100

Nivel de
Educacin
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Tcnica
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior
Superior

Aos en
empresa
16
0
12
3
17
16
7
1
6
5
3
13
0
19
3
19
1
6
10
0
16
17
10
8
17
1
20
16
17
12
0
15
5
12
12
13
4
17
20
16
16
6
15
9
0
18
10
19
9
15

194

Estadstica Descriptiva 201602

Aplique el muestreo sistemtico para seleccionar una muestra de ocho empleados. Elabore un listado con el nmero seleccionado. Utilice la columna C3, C9, y C12 de la tabla de
nmeros aleatorios.
Solucin
Calculemos el valor de k, donde k

...

El valor de k se redondea al valor del entero menor, luego k = ....


Seleccionemos aleatoriamente un nmero entero entre 1 y k, llamado arranque aleatorio (A).
Observando la columna C3 y C4 de la tabla de nmeros aleatorios tenemos que A =
.....

Tabla de nmeros aleatorios


C1

C2

C3

C4

C5

C6

C7

C8

C9

C10

4
9
0
9
1
2
6
1

8
2
2
6
6
9
1
3

2
9
1
0
4
0
2
1

4
8
3
8
1
5
9
8

6
1
3
3
6
5
5
9

6
4
9
5
5
0
0
9

3
4
1
6
2
8
4
0

5
1
6
6
7
4
0
1

4
9
2
6
7
8
9
2

5
8
9
4
2
7
8
6

C11 C12
6
5
7
0
9
4
2
3

0
1
1
8
9
6
0
7

C13

C14

5
1
2
6
9
2
2
1

2
9
6
3
9
1
6
9

C15 C16
6
7
6
4
7
7
8
6

9
9
0
8
4
0
7
1

C17
8
8
7
1
1
1
0
7

C18 C19 C20


0
5
5
8
5
5
1
9

0
9
6
5
4
8
9
9

9
0
4
4
9
7
7
8

A partir de este nmero elegido, seleccionemos el dato que ocupa la posicin (A + k) del
listado del marco muestral y as sucesivamente hasta completar la muestra.
Los elementos seleccionados son:

Posicin

Notas importantes

Unidad 6. Muestreo

195

Muestreo estratificado
Estratificar significa dividir a la poblacin en varias partes de acuerdo con ciertas caractersticas de sus elementos.
El objetivo de estratificar la poblacin es buscar homogeneidad entre los estratos.
Pasos a seguir para seleccionar una muestra estratificada
1. Divida a la poblacin en estratos que sean mutuamente excluyentes. Esto es, que incluyan a todos los elementos de la poblacin y que cada elemento pertenezca solamente a un estrato.
2. Calcule la cantidad de elementos a seleccionar en cada estrato.
3. Seleccione muestras aleatorias simples para cada uno de los estratos.

Recomendaciones para el uso de muestras estratificadas


Si se tiene que usar ms de una variable para formar los estratos, cuidar que estas no estn relacionadas entre s.
No se deben considerar la formacin de muchos estratos, generalmente se usan entre
tres y ocho estratos.
Los estratos pequeos no contribuyen mucho a la reduccin del error, por lo tanto pueden no ser considerados.

Notas importantes

196

Estadstica Descriptiva 201602

Ejemplo 56
La empresa de telecomunicaciones RTV tiene 120 empleados de los cuales tiene informacin de las variables: ingreso en soles, nivel de educacin y aos en la empresa.
Aos
cumplidos
en la empresa

Ingreso
(en
soles)

Nivel de
educacin

Secundaria

41

2100

Tcnica

Aos
cumplidos
en la empresa
13

Secundaria

11

42

2100

Tcnica

2400

Secundaria

43

1800

Tcnica

2500

Secundaria

44

2000

2300

Secundaria

45

2100

2100

Secundaria

46

1700

Secundaria

2000

Secundaria

2200

Secundaria

10

2100

11

1700

12

Ingreso
(en
soles)

Nivel de
educacin

Ingreso
(en
soles)

Nivel de
educacin

2300

2800

81

2000

Superior

82

2500

Superior

13

83

1700

Superior

Tcnica

84

2500

Superior

19

Tcnica

10

85

1700

Superior

1900

Tcnica

86

2600

Superior

19

47

2000

Tcnica

10

87

1600

Superior

48

2300

Tcnica

11

88

1800

Superior

49

2000

Tcnica

89

2100

Superior

10

Secundaria

50

1700

Tcnica

90

1700

Superior

Secundaria

51

1700

Tcnica

91

2400

Superior

16

2500

Secundaria

52

2100

Tcnica

92

2600

Superior

17

13

2800

Secundaria

13

53

2600

Tcnica

17

93

2100

Superior

10

14

2400

Secundaria

54

2400

Tcnica

94

2100

Superior

15

1700

Secundaria

55

2600

Tcnica

19

95

2400

Superior

17

16

2400

Secundaria

56

1900

Tcnica

96

1700

Superior

17

2200

Secundaria

10

57

1600

Tcnica

97

2600

Superior

20

18

2200

Secundaria

58

1900

Tcnica

98

2400

Superior

16

19

2300

Secundaria

10

59

2100

Tcnica

14

99

2700

Superior

17

20

2800

Secundaria

11

60

1700

Tcnica

100

2100

Superior

12

21

2100

Secundaria

61

2100

Tcnica

15

101

1600

Superior

22

1700

Secundaria

62

1700

Tcnica

102

2100

Superior

15

23

2500

Secundaria

63

2300

Tcnica

14

103

1900

Superior

24

2400

Secundaria

64

2500

Tcnica

16

104

2100

Superior

12

25

2700

Secundaria

17

65

2600

Tcnica

18

105

2200

Superior

12

26

1700

Secundaria

66

1900

Tcnica

106

2400

Superior

13

27

1600

Secundaria

67

2500

Tcnica

19

107

1800

Superior

28

2600

Secundaria

17

68

1800

Tcnica

108

2600

Superior

17

29

2500

Secundaria

13

69

1700

Tcnica

109

2700

Superior

20

30

2500

Secundaria

16

70

2000

Tcnica

10

110

2500

Superior

16

31

2100

Tcnica

11

71

2400

Tcnica

16

111

2500

Superior

16

32

2300

Tcnica

14

72

1700

Tcnica

112

1900

Superior

33

1700

Tcnica

73

2500

Tcnica

12

113

2100

Superior

15

34

2200

Tcnica

13

74

1700

Tcnica

114

1700

Superior

35

2900

Tcnica

20

75

2400

Tcnica

17

115

1500

Superior

36

1800

Tcnica

76

2400

Tcnica

16

116

1800

Superior

18

37

2100

Tcnica

16

77

1900

Tcnica

117

2100

Superior

10

38

2000

Tcnica

12

78

1700

Tcnica

118

2700

Superior

19

39

2000

Tcnica

12

79

2100

Tcnica

119

1800

Superior

40

2900

Tcnica

20

80

2000

Tcnica

120

2100

Superior

15

Notas importantes

Aos
cumplidos
en la empresa

Unidad 6. Muestreo

197

Aplique el muestreo estratificado para seleccionar una muestra de 16 empleados. Use


como variable de estratificacin el nivel educacional. Elabore un listado identificando el
nmero de dato seleccionado.
Para el estrato 1 use las columnas C1, C3 y C5, para el estrato 2 use las columnas C8, C9,
C10 y C11 y para el estrato 3 use las columnas C4, C3, C5 y C7.
Solucin
Se divide a la poblacin en estratos que sean mutuamente excluyentes, luego los estratos 1, 2 y 3 son: secundaria, tcnica y superior, respectivamente. Para cada uno de los
estratos, seleccionamos muestras aleatorias simples.
Posiciones

Cantidad seleccionada por estrato nh Nh n


N

Estratos

Nmeros de elementos
en el estrato Nh

(desde hasta)

1. Secundaria

N1 = 30

1 30

n1

N1
30
n
16 4
N
120

2. Tcnica

N2 = 50

31 80

n2

N2
50
n
16 6,67 7
N
120

3. Superior

N3 = 40

81 120

n3

N3
40
n
16 5,33 5
N
120

N = 120

Total

n = 16

Para el estrato Secundaria, realizamos un muestreo aleatorio simple usando las columnas C1, C3 y C5. Observemos que las posiciones de los elementos a elegir estn entre el 1
y el 30.
Tabla de nmeros aleatorios
C1
4
9
0
9
1
2
6
1

C2
8
2
2
6
6
9
1
3

C3
2
9
1
0
4
0
2
1

C4
4
8
3
8
1
5
9
8

C5
6
1
3
3
6
5
5
9

C6
6
4
9
5
5
0
0
9

C7
3
4
1
6
2
8
4
0

C8
5
1
6
6
7
4
0
1

C9
4
9
2
6
7
8
9
2

C10
5
8
9
4
2
7
8
6

C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
6
0
5
2
6
9
8
0
0
9
5
1
1
9
7
9
8
5
9
0
7
1
2
6
6
0
7
5
6
4
0
8
6
3
4
8
1
8
5
4
9
9
9
9
7
4
1
5
4
9
4
6
2
1
7
0
1
5
8
7
2
0
2
6
8
7
0
1
9
7
3
7
1
9
6
1
7
9
9
8

Luego, el cuadro con los datos elementos seleccionados para el estrato Secundaria es:

Estrato Secundaria

Notas importantes

Posicin

16

29

13

198

Estadstica Descriptiva 201602

Para el estrato Tcnica, realizamos un muestreo aleatorio simple usando las columnas
C8, C9, C10 y C11. Observemos que las posiciones de los elementos a elegir estn entre el
31 y el 80.
Tabla de nmeros aleatorios
C1
4
9
0
9
1
2

C2
8
2
2
6
6
9

C3
2
9
1
0
4
0

C4
4
8
3
8
1
5

C5
6
1
3
3
6
5

C6
6
4
9
5
5
0

C7
3
4
1
6
2
8

C8
5
1
6
6
7
4

C9
4
9
2
6
7
8

C10
5
8
9
4
2
7

C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
6
0
5
2
6
9
8
0
0
9
5
1
1
9
7
9
8
5
9
0
7
1
2
6
6
0
7
5
6
4
0
8
6
3
4
8
1
8
5
4
9
9
9
9
7
4
1
5
4
9
4
6
2
1
7
0
1
5
8
7

Luego, el cuadro con los datos elementos seleccionados para el estrato Tcnica es:

Estrato Tcnica

Posicin

54

62

66

77

48

67

44

Para el estrato Superior, realizamos un muestreo aleatorio simple usando las columnas
C4, C3, C5 y C7. Observemos que las posiciones de los elementos a elegir estn entre el 81
y el 120.
Tabla de nmeros aleatorios
C1
4
9
0
9
1
2
6
1
4
0
7

C2
8
2
2
6
6
9
1
3
5
0
2

C3
2
9
1
0
4
0
2
1
8
3
4

C4
4
8
3
8
1
5
9
8
1
6
5

C5
6
1
3
3
6
5
5
9
1
9
4

C6
6
4
9
5
5
0
0
9
4
6
1

C7
3
4
1
6
2
8
4
0
5
5
2

C8
5
1
6
6
7
4
0
1
6
0
4

C9
4
9
2
6
7
8
9
2
7
6
4

C10
5
8
9
4
2
7
8
6
9
4
6

C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
6
0
5
2
6
9
8
0
0
9
5
1
1
9
7
9
8
5
9
0
7
1
2
6
6
0
7
5
6
4
0
8
6
3
4
8
1
8
5
4
9
9
9
9
7
4
1
5
4
9
4
6
2
1
7
0
1
5
8
7
2
0
2
6
8
7
0
1
9
7
3
7
1
9
6
1
7
9
9
8
9
9
2
1
3
2
3
7
7
9
7
9
8
1
2
4
4
8
3
6
9
2
6
6
6
5
2
0
0
4

Luego, el cuadro con los datos elementos seleccionados para el estrato Superior es:

Estrato Superior

Notas importantes

Posicin

114

81

97

105

83

Unidad 6. Muestreo

199

La siguiente tabla muestra a los 120 alumnos de la especialidad de Administracin, de la


universidad El Saber, a quienes se les pregunt por su emisora radial preferida y por la
cantidad de horas a la semana que la escucha.
Posicin

Radio

Horas

Posicin

Radio

Horas

Posicin

Radio

Horas

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40

Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Estudio 92
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno

6
10
4
2
3
6
7
6
8
9
11
3
4
2
6
4
9
5
2
7
4
6
7
8
9
10
5
4
7
8
4
6
7
5
8
9
4
5
2
9

41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80

Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno

6
6
8
9
4
6
7
9
8
10
12
9
9
8
4
6
7
8
7
3
6
9
2
5
1
4
7
6
7
8
4
5
3
6
5
8
7
9
10
3

81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120

Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Oxgeno
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta
Planeta

4
3
3
5
5
8
7
6
9
9
4
2
11
2
3
8
6
7
9
4
8
7
7
9
6
7
9
8
3
11
13
14
9
8
6
5
7
3
6
5

Notas importantes

200

Estadstica Descriptiva 201602

Seleccione una muestra aleatoria de tamao 12 mediante muestreo estratificado. Use la


variable radio de su preferencia como variable de estratificacin.
Elabore un listado con el alumno seleccionado. Para el estrato 1 use las columnas C7, C3
y C1, para el estrato 2 use las columnas C8, C3, C2 y C10 y para el estrato 3 use las columnas C1, C4, C10; C7, C12, y C13.

Nh

Estrato

Posicin

nh

(desde hasta)

Estudio 92

N1=

n1=

Oxgeno

N2=

n2=

Planeta

N3=

n3=

Total

Estrato 1:
Estudio 92

Posicin

Estrato 2:
Oxgeno

Posicin

Estrato 3:
Planeta

Posicin

Notas importantes

Nh
n
N

Unidad 6. Muestreo

201

Tabla de nmeros aleatorios


C1
4
9
0
9
1
2
6
1
4
0
7
4
6
9
1
0
3
9
5
8
0
9
6
7
3
9
4
8
4
6
9
1
3
9
1
2
6
3
0
4
7
2
2
5
9
8
1
5
8
3

C2
8
2
2
6
6
9
1
3
5
0
2
9
1
3
8
2
6
4
9
1
5
7
9
4
8
9
8
6
7
5
2
3
3
9
7
7
0
3
1
7
8
2
6
1
0
6
9
6
6
1

C3
2
9
1
0
4
0
2
1
8
3
4
3
2
4
7
1
3
6
9
8
3
1
5
9
1
9
1
7
1
5
0
7
2
9
5
1
9
6
9
1
9
3
6
9
5
1
1
0
9
6

C4
4
8
3
8
1
5
9
8
1
6
5
4
8
0
1
4
4
7
8
8
8
4
9
1
2
7
5
3
4
8
9
9
5
8
4
7
2
3
7
5
9
3
4
0
8
9
0
6
9
1

Notas importantes

C5
6
1
3
3
6
5
5
9
1
9
4
4
1
8
3
7
1
6
4
2
0
2
4
4
2
8
8
6
0
8
8
4
6
2
0
8
6
4
9
3
6
1
1
3
4
2
9
1
8
0

C6
6
4
9
5
5
0
0
9
4
6
1
2
3
1
4
5
9
7
4
3
4
7
9
8
4
0
5
1
3
4
2
8
7
8
9
8
1
9
7
7
8
8
4
9
9
5
7
3
0
5

C7
3
4
1
6
2
8
4
0
5
5
2
4
3
3
3
7
8
9
5
9
3
5
1
8
0
0
5
7
6
3
8
3
6
8
5
3
5
6
9
0
5
1
8
1
2
0
5
3
8
7

C8
5
1
6
6
7
4
0
1
6
0
4
5
2
3
9
3
1
1
9
1
9
5
8
6
1
9
1
1
2
4
3
7
1
1
7
8
1
4
4
9
6
9
1
6
2
0
1
5
1
5

C9
4
9
2
6
7
8
9
2
7
6
4
9
0
7
3
1
0
2
1
4
4
2
2
6
4
3
4
1
4
8
4
0
6
9
8
6
2
4
4
2
8
8
0
1
3
7
2
2
8
7

C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20
5
6
0
5
2
6
9
8
0
0
9
8
5
1
1
9
7
9
8
5
9
0
9
7
1
2
6
6
0
7
5
6
4
4
0
8
6
3
4
8
1
8
5
4
2
9
9
9
9
7
4
1
5
4
9
7
4
6
2
1
7
0
1
5
8
7
8
2
0
2
6
8
7
0
1
9
7
6
3
7
1
9
6
1
7
9
9
8
9
9
9
2
1
3
2
3
7
7
9
4
7
9
8
1
2
4
4
8
3
6
6
9
2
6
6
6
5
2
0
0
4
0
8
7
4
8
4
2
1
2
5
4
2
6
0
7
2
7
9
1
4
6
5
3
2
4
8
6
7
9
0
6
2
8
1
7
8
3
7
3
3
0
8
3
5
1
9
3
3
8
7
4
8
0
2
5
9
0
1
1
0
9
3
6
8
6
0
2
7
2
3
9
3
4
6
9
8
1
5
4
7
3
0
6
8
1
6
8
1
2
4
9
1
4
0
6
0
3
2
8
6
0
8
8
3
8
7
1
2
2
3
8
6
6
3
5
5
9
9
0
6
8
0
2
5
3
9
1
2
0
3
0
8
8
5
9
4
8
5
7
7
9
6
7
5
7
7
4
0
4
8
9
4
7
0
2
7
0
5
0
2
7
8
7
3
6
9
6
4
4
4
7
4
5
7
5
0
3
5
5
7
4
4
7
6
7
2
8
4
4
4
0
3
6
3
4
1
2
8
9
0
6
7
6
0
0
8
6
8
4
3
2
8
9
4
8
7
9
4
9
4
8
6
6
6
8
4
1
1
3
1
3
6
1
7
6
5
8
1
6
2
2
7
1
6
2
7
5
1
8
6
1
4
4
7
5
0
8
6
6
2
5
3
2
3
9
9
2
7
4
5
9
5
6
6
6
3
1
8
1
2
0
8
6
4
4
0
9
8
5
7
3
3
4
2
3
2
8
1
6
6
7
7
0
7
9
8
6
8
5
2
1
0
0
4
0
4
6
8
8
1
9
2
7
5
1
7
0
1
5
5
4
2
8
5
2
8
1
7
6
4
6
6
0
1
3
4
0
9
1
2
8
6
7
8
8
2
8
0
7
8
4
8
0
9
8
5
9
5
7
8
4
9
9
4
9
0
0
7
4
5
4
8
6
2
3
7
1
9
4
8
4
8
9
6
6
9
1
0
1
9
2
8
0
2
6
6
3
2
6
6
8
4
0
7
8
2
5
1
0
6
3
0
4
1
4
0
3
0
8

202

Notas importantes

Estadstica Descriptiva 201602

Tablas Estadsticas

203

Tablas estadsticas
Todas las tablas de este manual han sido calculadas usando el MS Excel.

Tabla de la distribucin normal estndar


rea bajo la curva normal: PZ z
z
-3,9
-3,8
-3,7
-3,6
-3,5
-3,4
-3,3
-3,2
-3,1
-3,0

-0,09
0,000033
0,000050
0,000075
0,000112
0,000165
0,000242
0,000349
0,000501
0,000711
0,001001

-0,08
0,000034
0,000052
0,000078
0,000117
0,000172
0,000251
0,000362
0,000519
0,000736
0,001035

-0,07
0,000036
0,000054
0,000082
0,000121
0,000178
0,000260
0,000376
0,000538
0,000762
0,001070

-0,06
0,000037
0,000057
0,000085
0,000126
0,000185
0,000270
0,000390
0,000557
0,000789
0,001107

-0,05
0,000039
0,000059
0,000088
0,000131
0,000193
0,000280
0,000404
0,000577
0,000816
0,001144

-0,04
0,000041
0,000062
0,000092
0,000136
0,000200
0,000291
0,000419
0,000598
0,000845
0,001183

-0,03
0,000042
0,000064
0,000096
0,000142
0,000208
0,000302
0,000434
0,000619
0,000874
0,001223

-0,02
0,000044
0,000067
0,000100
0,000147
0,000216
0,000313
0,000450
0,000641
0,000904
0,001264

-0,01
0,000046
0,000069
0,000104
0,000153
0,000224
0,000325
0,000466
0,000664
0,000935
0,001306

-0,00
0,000048
0,000072
0,000108
0,000159
0,000233
0,000337
0,000483
0,000687
0,000968
0,001350

-2,9
-2,8
-2,7
-2,6
-2,5
-2,4
-2,3
-2,2
-2,1
-2,0

0,00139
0,00193
0,00264
0,00357
0,00480
0,00639
0,00842
0,01101
0,01426
0,01831

0,00144
0,00199
0,00272
0,00368
0,00494
0,00657
0,00866
0,01130
0,01463
0,01876

0,00149
0,00205
0,00280
0,00379
0,00508
0,00676
0,00889
0,01160
0,01500
0,01923

0,00154
0,00212
0,00289
0,00391
0,00523
0,00695
0,00914
0,01191
0,01539
0,01970

0,00159
0,00219
0,00298
0,00402
0,00539
0,00714
0,00939
0,01222
0,01578
0,02018

0,00164
0,00226
0,00307
0,00415
0,00554
0,00734
0,00964
0,01255
0,01618
0,02068

0,00169
0,00233
0,00317
0,00427
0,00570
0,00755
0,00990
0,01287
0,01659
0,02118

0,00175
0,00240
0,00326
0,00440
0,00587
0,00776
0,01017
0,01321
0,01700
0,02169

0,00181
0,00248
0,00336
0,00453
0,00604
0,00798
0,01044
0,01355
0,01743
0,02222

0,00187
0,00256
0,00347
0,00466
0,00621
0,00820
0,01072
0,01390
0,01786
0,02275

-1,9
-1,8
-1,7
-1,6
-1,5
-1,4
-1,3
-1,2
-1,1
-1,0

0,02330
0,02938
0,03673
0,04551
0,05592
0,06811
0,08226
0,09853
0,11702
0,13786

0,02385
0,03005
0,03754
0,04648
0,05705
0,06944
0,08379
0,10027
0,11900
0,14007

0,02442
0,03074
0,03836
0,04746
0,05821
0,07078
0,08534
0,10204
0,12100
0,14231

0,02500
0,03144
0,03920
0,04846
0,05938
0,07215
0,08691
0,10383
0,12302
0,14457

0,02559
0,03216
0,04006
0,04947
0,06057
0,07353
0,08851
0,10565
0,12507
0,14686

0,02619
0,03288
0,04093
0,05050
0,06178
0,07493
0,09012
0,10749
0,12714
0,14917

0,02680
0,03362
0,04182
0,05155
0,06301
0,07636
0,09176
0,10935
0,12924
0,15151

0,02743
0,03438
0,04272
0,05262
0,06426
0,07780
0,09342
0,11123
0,13136
0,15386

0,02807
0,03515
0,04363
0,05370
0,06552
0,07927
0,09510
0,11314
0,13350
0,15625

0,02872
0,03593
0,04457
0,05480
0,06681
0,08076
0,09680
0,11507
0,13567
0,15866

-0,9
-0,8
-0,7
-0,6
-0,5
-0,4
-0,3
-0,2
-0,1
-0,0

0,16109
0,18673
0,21476
0,24510
0,27760
0,31207
0,34827
0,38591
0,42465
0,46414

0,16354
0,18943
0,21770
0,24825
0,28096
0,31561
0,35197
0,38974
0,42858
0,46812

0,16602
0,19215
0,22065
0,25143
0,28434
0,31918
0,35569
0,39358
0,43251
0,47210

0,16853
0,19489
0,22363
0,25463
0,28774
0,32276
0,35942
0,39743
0,43644
0,47608

0,17106
0,19766
0,22663
0,25785
0,29116
0,32636
0,36317
0,40129
0,44038
0,48006

0,17361
0,20045
0,22965
0,26109
0,29460
0,32997
0,36693
0,40517
0,44433
0,48405

0,17619
0,20327
0,23270
0,26435
0,29806
0,33360
0,37070
0,40905
0,44828
0,48803

0,17879
0,20611
0,23576
0,26763
0,30153
0,33724
0,37448
0,41294
0,45224
0,49202

0,18141
0,20897
0,23885
0,27093
0,30503
0,34090
0,37828
0,41683
0,45620
0,49601

0,18406
0,21186
0,24196
0,27425
0,30854
0,34458
0,38209
0,42074
0,46017
0,50000

204

Tablas Estadsticas

Tabla de la distribucin normal estndar


rea bajo la curva normal: PZ z
z
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9

0,00
0,50000
0,53983
0,57926
0,61791
0,65542
0,69146
0,72575
0,75804
0,78814
0,81594

0,01
0,50399
0,54380
0,58317
0,62172
0,65910
0,69497
0,72907
0,76115
0,79103
0,81859

0,02
0,50798
0,54776
0,58706
0,62552
0,66276
0,69847
0,73237
0,76424
0,79389
0,82121

0,03
0,51197
0,55172
0,59095
0,62930
0,66640
0,70194
0,73565
0,76730
0,79673
0,82381

0,04
0,51595
0,55567
0,59483
0,63307
0,67003
0,70540
0,73891
0,77035
0,79955
0,82639

0,05
0,51994
0,55962
0,59871
0,63683
0,67364
0,70884
0,74215
0,77337
0,80234
0,82894

0,06
0,52392
0,56356
0,60257
0,64058
0,67724
0,71226
0,74537
0,77637
0,80511
0,83147

0,07
0,52790
0,56749
0,60642
0,64431
0,68082
0,71566
0,74857
0,77935
0,80785
0,83398

0,08
0,53188
0,57142
0,61026
0,64803
0,68439
0,71904
0,75175
0,78230
0,81057
0,83646

0,09
0,53586
0,57535
0,61409
0,65173
0,68793
0,72240
0,75490
0,78524
0,81327
0,83891

1,0
1,1
1,2
1,3
1,4
1,5
1,6
1,7
1,8
1,9

0,84134
0,86433
0,88493
0,90320
0,91924
0,93319
0,94520
0,95543
0,96407
0,97128

0,84375
0,86650
0,88686
0,90490
0,92073
0,93448
0,94630
0,95637
0,96485
0,97193

0,84614
0,86864
0,88877
0,90658
0,92220
0,93574
0,94738
0,95728
0,96562
0,97257

0,84849
0,87076
0,89065
0,90824
0,92364
0,93699
0,94845
0,95818
0,96638
0,97320

0,85083
0,87286
0,89251
0,90988
0,92507
0,93822
0,94950
0,95907
0,96712
0,97381

0,85314
0,87493
0,89435
0,91149
0,92647
0,93943
0,95053
0,95994
0,96784
0,97441

0,85543
0,87698
0,89617
0,91309
0,92785
0,94062
0,95154
0,96080
0,96856
0,97500

0,85769
0,87900
0,89796
0,91466
0,92922
0,94179
0,95254
0,96164
0,96926
0,97558

0,85993
0,88100
0,89973
0,91621
0,93056
0,94295
0,95352
0,96246
0,96995
0,97615

0,86214
0,88298
0,90147
0,91774
0,93189
0,94408
0,95449
0,96327
0,97062
0,97670

2,0
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9

0,97725
0,98214
0,98610
0,98928
0,99180
0,99379
0,99534
0,99653
0,99744
0,99813

0,97778
0,98257
0,98645
0,98956
0,99202
0,99396
0,99547
0,99664
0,99752
0,99819

0,97831
0,98300
0,98679
0,98983
0,99224
0,99413
0,99560
0,99674
0,99760
0,99825

0,97882
0,98341
0,98713
0,99010
0,99245
0,99430
0,99573
0,99683
0,99767
0,99831

0,97932
0,98382
0,98745
0,99036
0,99266
0,99446
0,99585
0,99693
0,99774
0,99836

0,97982
0,98422
0,98778
0,99061
0,99286
0,99461
0,99598
0,99702
0,99781
0,99841

0,98030
0,98461
0,98809
0,99086
0,99305
0,99477
0,99609
0,99711
0,99788
0,99846

0,98077
0,98500
0,98840
0,99111
0,99324
0,99492
0,99621
0,99720
0,99795
0,99851

0,98124
0,98537
0,98870
0,99134
0,99343
0,99506
0,99632
0,99728
0,99801
0,99856

0,98169
0,98574
0,98899
0,99158
0,99361
0,99520
0,99643
0,99736
0,99807
0,99861

3,0
3,1
3,2
3,3
3,4
3,5
3,6
3,7
3,8
3,9

0,998650
0,999032
0,999313
0,999517
0,999663
0,999767
0,999841
0,999892
0,999928
0,999952

0,998694
0,999065
0,999336
0,999534
0,999675
0,999776
0,999847
0,999896
0,999931
0,999954

0,998736
0,999096
0,999359
0,999550
0,999687
0,999784
0,999853
0,999900
0,999933
0,999956

0,998777
0,999126
0,999381
0,999566
0,999698
0,999792
0,999858
0,999904
0,999936
0,999958

0,998817
0,999155
0,999402
0,999581
0,999709
0,999800
0,999864
0,999908
0,999938
0,999959

0,998856
0,999184
0,999423
0,999596
0,999720
0,999807
0,999869
0,999912
0,999941
0,999961

0,998893
0,999211
0,999443
0,999610
0,999730
0,999815
0,999874
0,999915
0,999943
0,999963

0,998930
0,999238
0,999462
0,999624
0,999740
0,999822
0,999879
0,999918
0,999946
0,999964

0,998965
0,999264
0,999481
0,999638
0,999749
0,999828
0,999883
0,999922
0,999948
0,999966

0,998999
0,999289
0,999499
0,999651
0,999758
0,999835
0,999888
0,999925
0,999950
0,999967

Tablas Estadsticas

205

ndice alfabtico

A
Axiomas de la probabilidad, 101

D
Deciles, 67
Desviacin estndar, 73
Distribucin
binomial, 131
de frecuencias, 19, 33, 35
de la media muestral, 173
de probabilidad, 121, 122
hipergeomtrica, 135
normal, 154
Poisson, 138
uniforme continua, 151

E
Escalas de medicin, 13
Espacio muestral, 93
Estadstica
Definicin, 9
Subdivisin, 9
estadstico, 16
Estadstico, 16
Evento, 93
Complemento, 97
Eventos
independientes, 113
Interseccin de, 98
mutuamente excluyentes, 100
Unin de, 98
Experimento aleatorio, 93

F
Funcin
de densidad, 142
de distribucin acumulada, 146

G
Grfico

circular, 24
de barras, 24
de barras agrupadas, 29
de barras apiladas, 30
de barras apiladas al 100%, 30
de cajas, 80
de Pareto, 26
Ojiva, 44
Polgono de frecuencias, 43

M
Media, 55
ponderada, 66
Mediana, 59
Moda, 62
Muestreo
aleatorio simple, 186
estratificado, 195
probabilstico, 185
sistemtico, 190

P
Parmetro, 16
Percentiles, 68
Poblacin, 11
Propiedad reproductiva de la normal, 168

T
Teorema
de Bayes, 109
del lmite central, 174

V
Valor esperado
de una funcin de una variable aleatoria, 126, 149
Variable, 15
aleatoria continua, 142
aleatoria discreta, 122
Varianza, 73
de una variable aleatoria, 126, 150

Você também pode gostar