Estadística Descriptiva

Estadística descriptiva
Inferencia estadística
Una introducción
básica, breve y elemental
Jorge Moretti
Mayo de 2009
SOCIEDAD DE EDUCACIÓN MATEMÁTICA URUGUAYA
Jornada de Educación Matemática (JEM 29)
Enseñanza de Estadística en el tercer año de bachillerato

Un enfoque posible
I - Introducción
En este documento presentamos algunos temas que son objeto de la Estadística

Descriptiva y de la Inferencia Estadística; la primera de esas ramas de la
Estadística se ocupa de construir métodos de descripción numérica de conjuntos
numerosos y la segunda de procedimientos para realizar estimaciones de ciertas
características de una población a partir de una muestra extraída de la misma.
En lo que se refiere a la Estadística Descriptiva nuestra atención se dirigirá hacia
algunas representaciones gráficas asociadas a variables estadísticas reales y a
ciertas características de tendencia central, dispersión y concentración de esas
variables. En lo que respecta a la Inferencia Estadística, nos preocuparemos por
algunos procedimientos de estimación y daremos un ejemplo de prueba de
hipótesis (esto último en un apéndice). En todos los casos nuestras variables
estarán definidas en conjuntos finitos.
II – Estadística Descriptiva
A – Un ejemplo
1 – Media, moda, mediana y mediala de una variable estadística cuantitativa
En la tabla que sigue aparecen los datos sobre el ingreso durante el último mes de
cincuenta hogares de un barrio de Montevideo.
Tabla 1 - Datos de ingresos de cincuenta hogares
Ingreso Ingreso Ingreso

Hogar (en miles de pesos) Hogar (en miles de pesos) Hogar (en miles de pesos)
1 4 18 18 35 9
2 10 19 4 36 18
3 8 20 20 37 22
4 12 21 17 38 10
5 7 22 9 39 12
6 15 23 4 40 13
7 9 24 7 41 15
8 13 25 13 42 18
9 17 26 15 43 10
10 6 27 18 44 20
11 8 28 10 45 15
12 18 29 10 46 13
13 20 30 15 47 10
14 16 31 16 48 16
15 21 32 8 49 6
16 6 33 12 50 7
17 10 34 22 Total 632
1
Lo anterior, que es una forma de ver una función real cuyo dominio es el conjunto
de los cincuenta hogares que se han investigado, puede resumirse en la próxima
tabla (esa función es un caso de variable estadística cuantitativa).
Tabla 2 - Un resumen de los ingresos de los cincuenta hogares
Frecuencia Frecuencia acumulada Ingreso acumulado

Ingreso Parte del
Absoluta Relativa Absoluta Relativa Valor ingreso total
4 3 0,06 3 0,06 12 0,02
6 3 0,06 6 0,12 30 0,05
7 3 0,06 9 0,18 51 0,08
8 3 0,06 12 0,24 75 0,12
9 3 0,06 15 0,30 102 0,16
10 7 0,14 22 0,44 172 0,27
12 3 0,06 25 0,50 208 0,33
13 4 0,08 29 0,58 260 0,41
15 5 0,10 34 0,68 335 0,53
16 3 0,06 37 0,74 383 0,61
17 2 0,04 39 0,78 417 0,66
18 5 0,10 44 0,88 507 0,80
20 3 0,06 47 0,94 567 0,90
21 1 0,02 48 0,96 588 0,93
22 2 0,04 50 1,00 632 1,00
Total 50 1,00
Nota : Los valores de la última columna han sido redondeados a dos cifras decimales.
Resulta útil la interpretación de nuestra segunda tabla. Por ejemplo, el renglón

correspondiente al ingreso 13 nos permite afirmar lo siguiente:
1) Cuatro de los cincuenta hogares tuvieron un ingreso mensual de trece mil
pesos y ellos son el 8 % del total de hogares.
2) Hay veintinueve hogares cuyo ingreso mensual no superó los trece mil pesos y
ellos son el 58 % del total de hogares.
3) La suma de los ingresos de los veintinueve hogares anteriores fue de
doscientos sesenta mil pesos, el 41 % del total de los ingresos de todos los
hogares. O sea que el 58 % de los hogares (los de menor ingreso) tuvieron el
41 % del total de los ingresos.
Y ahora vamos tras cuatro números que pretenden describir la tabla anterior,
resumiendo aún más los datos originales de los ingresos.
Media del ingreso

¿Cuál es el promedio del ingreso por hogar?
Debido a que el total de los ingresos de los 50 hogares asciende a 632 mil pesos,
632
resulta que el promedio del ingreso por hogar es de = 12,64 mil pesos. A este
50
número lo llamaremos media de la función ingreso.
Moda del ingreso

¿Cuál es el ingreso más frecuente?
Alcanza con recorrer la columna titulada “Frecuencia relativa” de la tabla 2 para
concluir que el ingreso más frecuente es diez mil pesos. A ese número lo
llamaremos moda de la función ingreso.
2
Mediana del ingreso
¿Hay algún ingreso tal que la mitad de los hogares tengan un ingreso que no lo
supera y la otra mitad un ingreso que sí lo supera?
Si ahora recorremos la columna titulada “Frecuencia acumulada relativa” de la
tabla 2, vemos que el ingreso que responde a la pregunta anterior es doce mil
pesos. A ese número lo llamaremos mediana de la función ingreso.
Mediala del ingreso

¿Hay algún ingreso tal que los hogares que tengan un ingreso que no lo supera
tienen un ingreso total igual al de los que sí lo supera?
La columna titulada “Ingreso acumulado, Parte del ingreso total” de la tabla 2 nos
indica que debemos responder negativamente ya que el número 0,50 no se
encuentra allí. Entre los números mayores a 0,50 que aparecen en esa columna
hay uno que es el menor; nos estamos refiriendo a 0,53 que corresponde a un
ingreso de quince mil pesos. A ese ingreso lo llamaremos mediala de la función
ingreso. Los hogares cuyo ingreso no supera a quince mil pesos son el 68 % del
total de hogares y, en conjunto, tienen un ingreso que es el 53 % del ingreso total.
Ejercicio 1
Interpreta el renglón correspondiente al ingreso 15 de la tabla 2.
Ejercicio 2
Un funcionario de una empresa de transporte visita una fábrica de neumáticos para
realizar una importante compra de neumáticos. Le pregunta al encargado de
ventas sobre la duración de los mismos y éste le comunica que puede darle
algunos indicadores estadísticos sobre tal duración. Concretamente le pregunta:
¿Prefiere que le informe sobre la media, la moda o la mediana?
¿Cuál indicador le conviene solicitar al comprador? (te sugerimos que no te apures
en la respuesta).
Ejercicio 3
La empresa del ejercicio anterior lleva estadísticas, desde hace varios años, de la
duración de dos marcas de neumáticos. Tiene los siguientes datos:
Neumático A: media 25.000 Km y mediana 27.000 Km
Neumático B: media 27.000 Km y mediana 25.000 Km
Se sabe que las dos marcas se veden al mismo precio. ¿Qué marca le
recomendarías a la empresa? ¿Por qué?
Ejercicio 4
Un supermercado tiene información sobre las ventas durante el último mes de cada
uno de sus productos y ha calculado la media, la moda, la mediana y la mediala de
la función ventas. ¿Cuál o cuáles de esos indicadores puede serle de más utilidad?
(nuevamente te pedimos que pienses atentamente tu respuesta).
Ejercicio 5
Consigue o elabora algo similar a la tabla 1 y calcula la media, la moda, la mediana
y la mediala de la correspondiente función.
2 – Función de cuantía, función de distribución y función de concentración de una

variable estadística cuantitativa
A partir de la variable ingreso de nuestro ejemplo podemos definir algunas

funciones útiles en Estadística, las funciones de cuantía, de distribución y de
concentración.
3
Función de cuantía
Los valores de la variable ingreso son los elementos del conjunto B = {4, 6, ..., 21,
22}. Para cada uno de esos ingresos hemos calculado en la tabla 2 la frecuencia
relativa de los correspondientes hogares. Podemos definir una función de dominio
B tal que la imagen de la función en cada elemento de B sea la respectiva
⎧ 0,06 si x = 4
⎪ 0,06 si x = 6
⎪⎪
frecuencia relativa. O sea, f : B → R tal que f(x) = ⎨ ... .
⎪ 0,02 si x = 21
⎪
⎪⎩ 0,04 si x = 22
A esta función f la llamaremos función de cuantía de la variable ingreso.
Función de distribución
A partir de las frecuencias relativas acumuladas que aparecen en la tabla 2
⎧0 si x < 4
⎪0,06 si 4 ≤ x < 6
⎪
⎪0,12 si 6 ≤ x < 7
⎪
definimos una segunda función así: F : R → R tal que F( x ) = ⎨... .
⎪0.94 si 20 ≤ x < 21
⎪
⎪0.96 si 21 ≤ x < 22
⎪1 si x ≥ 22
⎩
A esta función F la llamaremos función de distribución de la variable ingreso.
4
Función de concentración
La última función que definiremos con nuestra variable ingreso es la función de
concentración. Aquí necesitamos algo más que la tabla 2.
Ordenemos los cincuenta hogares según los valores crecientes de sus ingresos y
notemos que:
1
- El primero de esos hogares tiene una frecuencia relativa de y un ingreso de
50
4
cuatro mil pesos, lo cual es del ingreso total de los cincuenta hogares.
632
2
- Los dos primeros hogares tienen una frecuencia relativa de y en conjunto
50
8
acumulan un ingreso de ocho mil pesos, lo cual es del ingreso total de los
632
cincuenta hogares.
- Y así sucesivamente hasta llegar a los cincuenta hogares.
Lo anterior motiva la definición de nuestra tercera función:

⎧ 1
⎪0 si 0 ≤ x <
50
⎪
⎪ 4 si 1 ≤ x < 2
⎪ 632 50 50
⎪
⎪ 8 2 3
si ≤x<
⎪ 632 50 50
⎪
C : [0 ,1] → R tal que C( x ) = ⎨ ...
⎪ 588 48 49
⎪ si ≤x<
⎪ 632 50 50
⎪ 620 49
⎪ si ≤ x <1
⎪ 632 50
⎪ 632
⎪ 632 si x = 1
⎩
A esta función C la llamaremos función de concentración de la variable ingreso.
5
Con relación a la función de concentración, el estadístico italiano Corrado Gini ha
sugerido el cálculo de un índice que lleva su nombre y que definió como el doble
del área de la región del plano encerrada entre la función de concentración y la
recta de ecuación y = x.
Ejercicio 6
Para la variable ingreso con la que estamos trabajando:
1) Comprueba que la media del ingreso es ∑ x f ( x ) , donde B = {4, 6, ..., 21, 22}.
x ∈B
2) Comprueba que la moda del ingreso es el x (o los x) donde f toma su mayor
valor.
3) Comprueba que la mediana del ingreso es el menor x tal que F(x) ≥ 0,5.
4) ¿Cómo puedes obtener la mediala del ingreso a partir de la función de
concentración?
Ejercicio 7
1) Calcula el índice de Gini para la variable ingreso del ejemplo.
Con el fin de sistematizar ese cálculo te sugerimos que completes una tabla con
el siguiente cabezal:
Ingreso acumulado
Hogar Frecuencia relativa acumulada Valor Parte del ingreso total
2) ¿Cuál tendría que haber sido la variable ingreso de modo que el índice de Gini
fuera lo menor posible? ¿Cuánto vale el índice de Gini para tal variable?
Ejercicio 8
1) Selecciona los veinticinco hogares del ejemplo que tienen menor ingreso y para
ellos calcula la media, la moda, la mediana, la mediala y el índice de Gini de la
nueva variable ingreso. Representa gráficamente las funciones de cuantía, de
distribución y de concentración.
2) Igual que en la parte anterior para los veinticinco hogares de mayor ingreso.
3) ¿Hay algo que te haya sorprendido en los resultados anteriores?
6
B – Variables estadísticas cuantitativas definidas en conjuntos finitos
Y ya en el final de esta sección, generalizaremos los conceptos que hemos

desarrollado en el apartado anterior.
Nuestro punto de partida está integrado por un conjunto finito A = {a1 , a 2 , ... , a n } y
una función X : A → R a la que llamaremos variable estadística cuantitativa. Con
ello estamos en condiciones de establecer las notaciones y definiciones que
detallamos a continuación.
1 - Subconjuntos de A
A las imágenes de los elementos de A según la función X los representaremos así:

X(a1 ) = b1 , X(a 2 ) = b 2 , ... , X(an ) = bn .
Al recorrido de la función X, o sea al conjunto de los valores que toma esa función,
lo simbolizaremos mediante B = {x1 , x 2 , ... , x t }, donde x1 < x 2 < ... < x t .
Es claro que B tiene a lo sumo tantos elementos como A, pero puede ocurrir que
tenga menos (eso pasó en nuestro ejemplo debido a que la variable que allí
consideramos no era inyectiva).
Para cada i entre 1 y t, definimos el conjunto A i como aquél formado por los
elementos de A cuyo valor según X es x i , o sea A i = {a / a ∈ A , X(a) = x i } . Con el
fin de recordar este concepto usaremos la notación A i = ( X = x i ) .
Para cada i entre 1 y t llamaremos frecuencia relativa del conjunto ( X = x i ) al

# (X = xi )
número fr( X = x i ) = fi = (recordemos que n es el cardinal de A, o sea
n
n = #(A)).
2 - Función de cuantía, media, moda, varianza y desviación estándar
Definimos la función de cuantía de X asÍ: f X : B → R tal que f X ( x i ) = fi .
n
∑ bj t
j =1
La media de X es el número M( X) = = ∑ x i fi = ∑ x f X (x) .
n i =1 x ∈B
Una moda de X es un valor de X en el que f X toma su valor mayor (puede haber

una o varias modas).
La varianza de X es el número V( X) = M(( X − M( X))2 ) , o sea la media de los

cuadrados de las diferencias entre los valores de la variable X y la media de esa
variable.
La desviación estándar de X es el número σ( X) = V( X) .
Entre las propiedades de la media y la varianza se destacan las que enunciamos

en el próximo teorema.
7
Teorema 1 - Propiedades de la media y de la varianza
Sean:
♣ X e Y variables estadísticas cuantitativas definidas en A = {a1 , a 2 , ... , a n } .
♣ k un número.
♣ c un número positivo.
Entonces:
M1 M( X + k ) = M( X) + k
M2 M(k X) = k M( X)
M3 M( X + Y ) = M( X) + M( Y )
M4 M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2
V1 V( X) ≥ 0 y V( X) = 0 si y sólo si X es constante
V2 V( X + k ) = V( X)
V3 V(k X) = k 2 V( X)
V4 V( X + Y ) = V( X) + V( Y ) + 2 ( M( XY) − M( X) M( Y ) )
V5 V( X) = M( X 2 ) − (M( X))2
V6 V( X)
fr( | X − M( X) | ≥ c ) ≤ (desigualdad de Tchebycheff)
c2
Ejercicio 9
1) Calcula la varianza y la desviación estándar de la variable ingreso del ejemplo.
2) Igual al punto anterior para las dos variables con las que trabajaste en el
ejercicio 8
Te sugerimos que completes una tabla con el cabezal que aparece a continuación
(ten en cuenta la propiedad V5) y que verifiques tus resultados con una calculadora
con funciones estadísticas.
xi fi x i fi x i 2 fi
Ejercicio 10
Sea X la variable ingreso del ejemplo.
1) Usa la tabla 2 (página 2) para calcular fr(| X − M( X) | ≥ c ) para cada uno de los
siguientes valores de c: c = 5, c = 6 y c = 7.
2) ¿Qué te permite afirmar la desigualdad de Tchebycheff sobre cada una de las
tres frecuencias relativas del punto anterior?
Ejercicio 11
Sea X una variable estadística cuantitativa y k un número positivo. Usa la
1
desigualdad de Tchebycheff para probar que fr( | X − M( X) | < k σ( X)) ≥ 1 − .
k2
Ejercicio 12
Con el fin de resumir los valores de una variable estadística cuantitativa X en un
solo número puedes elegir cualquiera (por ejemplo la media, la moda, la mediana,
la mediala, o algún otro que sin duda tomarías entre el menor y el mayor valor de
X). Supone que has elegido un tal número k y que luego, para tener una idea de la
dispersión de los valores de X respecto a ese k, calculas la media de los cuadrados
de las diferencias entre los valores de X y k.
8
1) Atento a la propiedad M4, ¿cuál sería el “mejor” k que puedes elegir?
2) Para ese k, ¿cuánto vale la media de los cuadrados de las diferencias entre los
valores de X y k?
3 - Función de distribución y mediana
Definimos la función de distribución de X asÍ:

⎧0 si x < x1
⎪ q
⎪
FX : R → R tal que FX ( x ) = ⎨ ∑ fi si x q ≤ x < x q +1 (q = 1, 2 ,..., t − 1)
⎪ i =1
⎪
⎩1 si x ≥ x t
Lo anterior es lo mismo que FX : R → R tal que FX ( x ) = fr( X ≤ x ) .
El menor entre todos los x que verifican FX ( x ) ≥ 0,5 es la mediana de X.
4 - Función de concentración, mediala e índice de Gini
Para definir la función de concentración de X exigimos que X sea una variable no

negativa con al menos algún valor positivo (tal es el caso de la variable ingreso de
nuestro ejemplo).
Establecido lo anterior, ordenemos X(a1 ) = b1 , X(a 2 ) = b 2 , ... , X(an ) = bn en
forma creciente; obtenemos de esa manera una lista de n números (c 1 , c 2 ,..., c n ) ,
la cual vamos acumulando así: T1 = c 1, T2 = c 1 + c 2 , ..., Tn = c 1 + c 2 + ... + c n .
Ahora estamos en condiciones de definir la función de concentración de X:
⎧ 1
⎪0 si 0 ≤ x <
n
⎪
⎪ q
T q +1
C X : [0 ,1] → R tal que C X ( x ) = ⎨
q
si ≤x< (q = 1, 2 ,..., n − 1)
⎪ Tn n n
⎪1 si x = 1
⎪
⎩
Ejercicio 13
Sea X una variable estadística cuantitativa definida en A = {a1 , a 2 , ... , a n } tal que
es no negativa y tiene al menos algún valor positivo.
1) ¿Cómo definirías la mediala de X?
2) ¿Cómo definirías el índice de Gini?
3) Verifica que el índice de Gini puede calcularse con la siguiente fórmula:
2 2 n
1+ − ∑ Tq
n n Tn q = 1
4) ¿Cómo debe ser la variable X para que el índice de Gini sea lo menor posible?
¿Cuánto vale el índice de Gini para tal variable?
Ejercicio 14
Se lanzan dos monedas, cada una de las cuales tiene una C (cara) de un lado y
una N (número) del otro. El conjunto de los resultados posibles del experimento es
A = {(C, C), (C,N), (N, C), (N,N)} . Nos interesa el número de caras que se obtienen al
9
realizar dicho experimento, por lo que consideramos la variable estadística
X : A → R tal que X ((C, C)) = 2 , X ((C,N)) = 1, X ((N, C)) = 1 y X ((N,N)) = 0 .
1) Representa gráficamente la función de cuantía, la función de distribución y la
función de concentración de X.
2) Calcula la media, la moda, la mediana, la mediala y el índice de Gini de X.
III – Inferencia Estadística
A – Ejemplo 1: Un ejemplo del modelo binomial
Supongamos que tenemos una urna con ocho bolillas, dos de las cuales son rojas
y las otras seis blancas. O sea U = { r1 , r2 , b1 , b 2 , b 3 , b 4 , b 5 , b 6 }.
Estamos interesados en extraer tres bolillas de la urna, de a una y con reposición,
y en contar el número de bolillas rojas que obtenemos. Es claro que ese número
varía entre 0 y 3 (podemos obtener tres bolillas rojas a pesar de que sólo hay dos
en la urna debido al procedimiento que usamos para extraer las bolillas).
Cada resultado de nuestro experimento lo podemos representar mediante una
terna ordenada cuyas componentes son elementos de U. Así por ejemplo, el
resultado “salió la bolilla r2 en la primera extracción y la bolilla b 5 en la segunda y
en la tercera extracción” lo representamos así: (r2 , b 5 , b 5 ) . En ese resultado, el
número de bolillas rojas es uno.
Ahora bien:
♣ ¿Cuántos resultados distintos hay?
La respuesta es 8 3 = 512 .
El conjunto de todos los resultados posibles tiene 512 elementos, lo cual no
hace atractiva la tarea de escribirlos todos.
A ese conjunto lo representaremos con el símbolo Ω .
Estamos interesados en contar el número de bolillas rojas que obtenemos.
Pensamos pues en una función definida en Ω que a cada resultado le asocia
el número de bolillas rojas que allí hay. A esa función la representaremos
mediante la letra X.
♣ ¿En cuántos resultados el número de bolillas rojas es cero?
El subconjunto de Ω en el que X vale 0 tiene 216 elementos.
Ya sabemos que a ese subconjunto lo representamos con el símbolo (X = 0).
♣ ¿En cuántos resultados el número de bolillas rojas es uno?
La respuesta es C 13 . 2 . 6 2 = 216 .
Entonces (X = 1) tiene 216 elementos.
♣ ¿En cuántos resultados el número de bolillas rojas es dos?
La respuesta es C 32 . 2 2 . 6 = 72 .
♣ Finalmente, ¿en cuántos resultados el número de bolillas rojas es tres?
Es útil que observes que las respuestas a las cuatro últimas preguntas pueden
resumirse así: el número de elementos del subconjunto de Ω en el que la variable
X vale x, o sea el número de elementos de (X = x), es C x 2 x 6 3 − x ( x = 0, 1, 2, 3).
3
10
Debido a que es razonable admitir que los elementos de Ω son equiprobables,
podemos calcular la probabilidad de (X = x) para cada x. En efecto:
C x 2 x 6 3−x C x 2 x 6 3−x 3−x
3 3 x
3 ⎛2⎞ ⎛6⎞
Pr( X = x ) = = =Cx⎜ ⎟ ⎜ ⎟ para x = 0, 1, 2, 3.
83 8 x 8 3−x ⎝8⎠ ⎝8⎠
2
Lo anterior suele escribirse así: Pr( X = x ) = C 3x p x (1 − p) 3 − x , donde p = es la
8
proporción de bolillas rojas en la urna.
En este ejemplo nos encontramos con lo que se llama el modelo probabilístico

2
binomial de parámetros n = 3 y p = .
8
Para finalizar, aprovechemos los resultados que obtuvimos para hallar la media y la
varianza de la variable X.
X Pr( X = x ) x Pr( X = x ) x 2 Pr( X = x )

M( X) = 3/4
0 27/64 0/64 0/64
1 27/64 27/64 27/64
2 9/64 18/64 36/64 M( X 2 ) = 9/8
3 1/64 3/64 9/64
Total 1 3/4 9/8 V( X) = 9/8 – (3/4) 2 = 9/16
Ejercicio 15
1) Representa gráficamente la función de cuantía y la función de distribución de la
variable X del ejemplo que acabamos de analizar.
2) ¿Cuál es la moda y cuál la mediana de esa variable?
B – El modelo binomial
Diremos que una variable X tiene distribución binomial de parámetros p y n (p es

un real entre 0 y 1 y n es un natural mayor que 0) cuando:
♦ El recorrido de X es el conjunto B = {0,1, 2 ,..., n}.
♦ La función de cuantía de X es f X ( x ) = C nx p x (1 − p)n − x (x ∈ B).
Si pensamos en la urna del ejemplo 1, nos interesará referirnos a la variable X con
distribución binomial de parámetros r, b y n ( r, b y n son naturales mayores que 0).
C nx r x bn − x
En ese caso tenemos que f X ( x ) = (x ∈ B).
(r + b)n
A continuación presentamos algunas características del modelo binomial.
11
Tabla 3 - X tiene distribución binomial de parámetros p y n
Condición de p y n p ∈ R, 0 < p < 1 ; n ∈ N, n > 0
Recorrido de X 0, 1, ..., n
Función de cuantía f ( x ) = C n p x (1 − p)n − x
X x
Fórmula de recurrencia p (n − x )
f X ( x + 1) = f X (x)
(1 − p) ( x + 1)
x = 0, 1, ..., n -1
Media de X np
Varianza de X n p (1 − p)
Moda de X Caso 1: p (n + 1) no es entero
E ( p (n + 1) )
Caso 2: p (n + 1) es entero
p (n + 1) − 1 y p (n + 1)
Intervalo de confianza para p con nivel Extremo inferior
de confianza ϕ
n (2 X + k 2 ) − k 4 n X (n − X) + k 2 n 2
2 n (n + k 2 )
Extremo superior
n (2 X + k 2 ) + k 4 n X (n − X) + k 2 n 2
2 n (n + k 2 )
⎧ 10 si ϕ = 0,90
⎪⎪
k = ⎨ 20 si ϕ = 0,95
⎪ 10 si ϕ = 0,99
⎪⎩
Estimador máximo verosímil de p X
n
12
Tabla 4 - X tiene distribución binomial de parámetros r, b y n
Condición de r, b y n r, b y n son naturales positivos
Recorrido de X 0, 1, ..., n
Función de cuantía C nx r x bn − x
f X (x) =
(r + b)n
Fórmula de recurrencia r (n − x )
f X ( x + 1) = f X (x)
b ( x + 1)
x = 0, 1, ..., n -1
Media de X nr
r +b
Varianza de X nr b
(r + b) 2
Moda de X r (n + 1)
Caso 1: no es entero
r +b
⎛ r (n + 1) ⎞
E⎜ ⎟
⎝ r +b ⎠
r (n + 1)
Caso 2: es entero
r +b
r (n + 1) r (n + 1)
−1 y
r +b r +b
Intervalo de confianza para r con nivel Extremo inferior
de confianza ϕ
n (2 X + k 2 ) − k 4 n X (n − X) + k 2n 2
(r + b)
2 n (n + k 2 )
Extremo superior
n (2 X + k 2 ) + k 4 n X (n − X) + k 2n 2
(r + b)
2 n (n + k 2 )
⎧ 10 si ϕ = 0,90
⎪⎪
k = ⎨ 20 si ϕ = 0,95
⎪ 10 si ϕ = 0,99
⎪⎩
Estimador máximo verosímil de r x (r + b)
n
⎛ x (r + b) ⎞ ⎛ x (r + b) ⎞
E⎜ ⎟ y/o E ⎜ ⎟ +1
⎝ n ⎠ ⎝ n ⎠
Hay que calcular los correspondientes
valores de f X para decidir
x (r + b)
Caso 2: es entero
n
x (r + b)
n
13
Ejercicio 16
Sea X una variable con distribución binomial de parámetros r = 10, b = 5 y n = 6.
1) Calcula f X (0) y usa la fórmula de recurrencia de la tabla 4 (o de la tabla 3) para
calcular f X ( x ) para cada uno de los restantes x.
2) Verifica los resultados de la media, la varianza y la moda que consta en la tabla
4.
Ejercicio 17
Igual que el ejercicio anterior para la variable X con distribución binomial de
parámetros r = 10, b = 5 y n = 4.
C – Una aplicación del modelo binomial (estimación de un parámetro)
Supongamos que tenemos una urna con cien bolillas, cada una de las cuales es
roja o blanca, y que de allí hemos extraído veinte bolillas de a una y con reposición.
Obtuvimos seis bolillas rojas. ¿Qué podemos afirmar sobre el número de bolillas
rojas en la urna?
Veamos cómo contestar a la pregunta anterior.
1) La variable X que cuenta el número de bolillas rojas extraídas tiene distribución
binomial de parámetros r, b y n. No sabemos cuánto valen r y b pero sí
conocemos n (n = 20) y r + b (r + b = 100).
2) Al elegir k = 10 en el ejercicio 11 (página 8) llegamos a lo siguiente:
1
fr( | X − M( X) | < 10 σ( X)) ≥ 1 − = 0,90 .
10
Por lo tanto estamos casi seguros (nuestro nivel de confianza es de 90 %) que
al extraer veinte bolillas de la urna obtendremos un valor de X que verifica la
desigualdad | X − M( X) | < 10 σ( X) (*). El valor de X que obtuvimos fue seis.
3) Si en la desigualdad (*) sustituimos M(X) y σ(X) por sus valores y luego
despejamos r, llegamos a un intervalo cuyos extremos son los que figuran en la
tabla 4, renglón titulado “Intervalo de confianza para r con nivel de confianza ϕ”
(en nuestro caso es ϕ = 0,90).
4) Podemos calcular los extremos del intervalo del punto anterior ya que contamos
con todo lo necesario para hacerlo: r + b = 100, n = 20, X = 6 y k = 10 .
Después de dedicarle algo de tiempo a las cuentas obtuvimos los siguientes
resultados.
Extremo inferior del intervalo ≅ 9,38
Extremo superior del intervalo ≅ 63,95
5) Por lo tanto afirmamos que r verifica 10 ≤ r ≤ 63. No estamos seguros de ello
pero sí confiamos en que así sea. Hemos llegado a lo que en Estadística se
llama una estimación mediante un intervalo de confianza.
6) Un enfoque distinto al que hemos expuesto comienza considerando la
C 20 6
6 r (100 − r )
14
probabilidad de lo que obtuvimos, o sea Pr( X = 6) = f X (6) = .
100 20
Como esa probabilidad depende de r, la idea es hallar r de modo que sea lo
mayor posible. En el renglón titulado “Estimador máximo verosímil de r” de la
tabla 4 se da ese destacado r (o esos destacados r). En nuestro caso, haciendo
las cuentas claro está, obtenemos r = 30. Ahora estamos ante lo que en
Estadística se llama la estimación máximo verosímil.
14
Ejercicio 18
Usa el ejercicio 11 (página 8) para justificar el renglón titulado “Intervalo de
confianza para p con nivel de confianza ϕ” en la tabla 3.
D – Ejemplo 2: Un ejemplo del modelo hipergeométrico
Consideremos nuevamente la urna U del ejemplo 1.

Ahora extraeremos tres bolillas de la urna, de a una y sin reposición. Al igual que
en la primera parte del ejemplo 1, nos interesa contar el número de bolillas rojas
que obtenemos. En este caso ese número varía entre 0 y 2.
Cada resultado de nuestro experimento lo podemos representar mediante una
terna ordenada cuyas componentes son elementos de U distintos entre sí. Por
ejemplo, el resultado “salió la bolilla r2 en la primera extracción, la bolilla b 5 en la
segunda extracción y la bolilla b1 en la tercera extracción” lo representamos así:
(r2 , b 5 , b1 ) . En ese resultado, el número de bolillas rojas es uno.
Planteemos y contestemos algunas preguntas:
♣ ¿Cuántos resultados distintos hay?
La respuesta es A 83 = 8 x 7 x 6 = 336 .
El conjunto Ω de todos los resultados posibles tiene 336 elementos.
Estamos interesados en contar el número de bolillas rojas que obtenemos, o
sea en la función X definida en Ω que a cada resultado le asocia el número de
bolillas rojas que allí hay.
♣ ¿En cuántos resultados el número de bolillas rojas es cero?
La respuesta es A 36 = 120 .
El subconjunto de Ω en el que X vale 0, o sea (X = 0), tiene 120 elementos.
♣ ¿En cuántos resultados el número de bolillas rojas es uno?
La respuesta es 3 . 2 . A 62 = 180 .
♣ ¿En cuántos resultados el número de bolillas rojas es dos?
La respuesta es 3 . 2 . 6 = 36 .
Es interesante que notes que las respuestas a las tres últimas preguntas pueden
resumirse así: el número de elementos del subconjunto de Ω en el que la variable
X vale x, o sea el número de elementos de (X = x), es C 3x A 2x A 36 − x ( x = 0, 1, 2).
Debido a que es razonable admitir que los elementos de Ω son equiprobables,
podemos calcular la probabilidad de (X = x) para cada x. En efecto:
C 3x A 2x A 36 − x C 2x C 36 − x
Pr( X = x ) = = para x = 0, 1, 2.
8 8
A3 C3
En este ejemplo estamos ante el modelo probabilístico llamado hipergeométrico de

Usemos los resultados que obtuvimos para hallar la media y la varianza de la

variable X.
15
x Pr( X = x ) x Pr( X = x ) x 2 Pr( X = x )
M( X) = 3/4
0 10/28 0/28 0/28
1 15/28 15/28 15/28 M( X 2 ) = 27/28
2 3/28 6/28 12/28 V( X) = 45/112
Total 1 3/4 27/28
Para finalizar con el ejemplo, corresponde que destaquemos un hecho

C 2x C 36 − x
sorprendente. La fórmula Pr( X = x ) = nos muestra que el experimento
8
C3
de extraer de la urna tres bolillas de a una y sin reposición motiva una distribución
de probabilidades que es la del experimento de extraer de la urna tres bolillas
simultáneamente (en este experimento, cada resultado es un conjunto de tres
elementos de U).
Ejercicio 19
1) Representa gráficamente la función de cuantía y la función de distribución de la
variable X del ejemplo 2.
2) ¿Cuál es la moda y cuál la mediana de esa variable?
E – El modelo hipergeométrico
Diremos que una variable X tiene distribución hipergeométrica de parámetros r, b y

n (r, b y n son naturales mayores que 0 y n ≤ r + b) cuando:
♦ El recorrido de X es el conjunto B = {u, u + 1, ..., v} , donde u es el mayor entre los
números 0 y n – b y v es el menor entre los números r y n.
C rx Cnb− x
♦ La función de cuantía de X es f X ( x ) = (x ∈ B).
C rn+ b
En la próxima tabla resumimos algunas características de este modelo.
16
Tabla 5 - X tiene distribución hipergeométrica de parámetros r, b y n
Condición de r, b y n r, b y n son naturales positivos ; n ≤ r + b
Recorrido de X u , u + 1,..., v
u es el mayor entre 0 y n – b y v es el menor
entre r y n
Función de cuantía C rx Cnb− x
f X (x) =
C rn+ b
Fórmula de recurrencia (r − x ) (n − x )
f X ( x + 1) = fX (x)
( x + 1) (b − n + x + 1)
x = u, u + 1, ..., v -1
Media de X rn
r +b
Varianza de X r b n (r + b − n)
(r + b) 2 (r + b − 1)
Moda de X (r + 1) (n + 1)
r +b+2
⎛ (r + 1) (n + 1) ⎞
E⎜ ⎟
⎝ r +b+2 ⎠
(r + 1) (n + 1)
Caso 2: es entero
r +b+2
(r + 1) (n + 1) (r + 1) (n + 1)
−1 y
r +b+2 r +b+2
Intervalo de confianza para r con Extremo inferior
nivel de confianza ϕ
n (2 X + k 2 ρ 2 ) − k ρ 4 n X (n − X) + k 2 ρ 2 n 2
(r + b)
2 n (n + k 2 ρ 2 )
Extremo superior
n (2 X + k 2 ρ 2 ) + k ρ 4 n X (n − X) + k 2 ρ 2 n 2
(r + b)
2 n (n + k 2 ρ 2 )
r +b−n
k según la tabla 4 y ρ =
r + b −1
Estimador máximo verosímil de r x (r + b + 1)
n
⎛ x (r + b + 1) ⎞
E⎜ ⎟
⎝ n ⎠
x (r + b + 1)
Caso 2: es entero y x < n
n
x (r + b + 1) x (r + b + 1)
−1 y
n n
Caso 3: x = n
r+b
17
Ejercicio 20
X es una variable con distribución hipergeométrica de parámetros r = 10, b = 5 y n
= 6 y u es el menor valor del recorrido de X.
1) Calcula f X (u) y usa la fórmula de recurrencia de la tabla 5 para calcular f X ( x )
para cada uno de los restantes x.
2) Verifica los resultados de la media, la varianza y la moda que consta en la tabla
5.
Ejercicio 21
Igual que el ejercicio anterior para la variable X con distribución hipergeométrica de
Ejercicio 22
Redacta un apartado titulado “Una aplicación del modelo hipergemétrico
(estimación de un parámetro)” que sea similar al C.
F – La ley de los grandes números para la distribución binomial
Hay una importante propiedad, llamada la ley de los grandes números, que en el
caso de la distribución binomial tiene el enunciado que presentamos a
continuación.
Teorema 2 – Ley de los grandes números para la distribución binomial

Sean:
♣ X una variable con distribución binomial de parámetros n y p.
♣ c y ε números positivos.
Entonces existe algún número natural j tal que para cualquier n ≥ j y cualquier p se
⎛ X ⎞
cumple que Pr ⎜⎜ − p ≥ c ⎟⎟ < ε .
⎝ n ⎠
Ejercicio 23
1) Demuestra el teorema anterior (te sugerimos que apliques la desigualdad de
X 1
Tchebycheff a la variable y que tengas en cuenta que p (1 − p) ≤ ∀ p).
n 4
2) ¿Cómo interpretarías ese teorema?
18
Respuestas a algunos ejercicios
Ejercicio 7
3911 2) La variable ingreso tendría que ser constante; en ese
1) ≅ 0,25
15800 1
caso el índice de Gini vale = 0,02 .
50
Ejercicio 8
Los veinticinco hogares Los veinticinco hogares
Concepto de menor ingreso de mayor ingreso
Media 8,32 16,96
Moda 10 15 y 18
Mediana 9 17
Mediala 10 18
Índice de Gini 259 693
≅ 0,20 ≅ 0,13
1300 5300
Ejercicio 9
Desviación
Conjunto Varianza estándar
Los cincuenta hogares 25,1504 5,0150
Los veinticinco hogares de menor ingreso 5,5776 2,3617
Los veinticinco hogares de mayor ingreso 7,3984 2,7200
Ejercicio 10
Acotación de
Frecuencia Valor Tchebycheff
fr X − M( X) ≥ 5 0,40 1,01
fr X − M( X) ≥ 6 0,24 0,70
fr X − M( X) ≥ 7 0,18 0,51
Ejercicio 14
La media, la moda, la mediana y la mediala valen 1. El índice de Gini vale 5/8.
Ejercicio 15
Hay dos modas: 0 y 1. La mediana es 1.
19
Ejercicio 16 Ejercicio 17
x f X (x) x f X (x)
0 1 0 1
729 81
1 12 1 8
729 81
2 60 2 24
729 81
3 160 3 32
729 81
4 240 4 16
729 81
5 192
729
6 64
729
Ejercicio 19
La moda y la mediana valen 1.
Ejercicio 20 Ejercicio 21
x f X (x) x f X (x)
1 2 0 1
1001 273
2 45 1 20
1001 273
3 240 2 90
1001 273
4 420 3 120
1001 273
5 252 4 42
1001 273
6 42
1001
20
Apéndice 1 – Algunas demostraciones
A continuación presentamos la demostración de cada una de las propiedades que

constan en el teorema 1 (página 8) y de los resultados que aparecen en la Tabla 3
(página 12).
1 - Teorema 1
Con el fin de demostrar las tres primeras partes del teorema 1, tenemos en cuenta
que X e Y son variables estadísticas cuantitativas definidas en A = {a1 , a 2 , ... , a n }
y que k es un número. Escribimos, además, X(a j ) = b j y Y(a j ) = c j para j = 1, 2, ...,
n.
M1 – M( X + k ) = M( X) + k
Notemos, en primer lugar, que ( X + k ) (a j ) = b j + k .
Por lo tanto:
n n n n n
∑ (b j + k ) ∑ b j + ∑ k ∑ b j + n k ∑ b j
j =1 j =1 j =1 j =1 j =1
M( X + k ) = = = = + k = M( X) + k .
n n n n
M2 – M(k X) = k M( X)
Ahora observemos que (k X) (a j ) = k b j .
En consecuencia:
n n n
∑ kbj k ∑b j ∑b j
j =1 j =1 j =1
M(k X) = = =k = k M( X) .
n n n
M3 – M( X + Y ) = M( X) + M( Y )
Comencemos recordando que ( X + Y ) (a j ) = b j + c j .
Por lo tanto:
n n n n n
∑ (b j + c j ) ∑b j + ∑ c j ∑b j ∑c j
j =1 j =1 j =1 j =1 j =1
M( X + Y ) = = = + = M( X) + M( Y ) .
n n n n
M4 – M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2

Para demostrar esta propiedad comenzamos usando las tres anteriores, luego de
desarrollar ( X − k )2 .
M( ( X − k )2 ) = M( X 2 − 2 k X + k 2 ) = M( X 2 + ( −2 k X + k 2 )) .
M( ( X − k )2 ) = M( X 2 ) + M( −2 k X + k 2 ) . Aquí usamos M3
M( ( X − k )2 ) = M( X 2 ) + M( −2 k X) + k 2 . Aquí usamos M1
M( ( X − k ) 2 ) = M( X 2 ) − 2 k M( X) + k 2 . Aquí usamos M2
Ahora restamos y sumamos (M( X))2 en la expresión que aparece a la derecha en
la igualdad anterior. Con ello llegamos a lo siguiente:
M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X))2 − 2 k M( X) + k 2 .
21
Concluimos la demostración observando que (M( X))2 − 2 k M( X) + k 2 = (M( X) − k ) 2 .
V1 – V( X) ≥ 0 y V( X) = 0 si y sólo si X es constante
Recordemos que V(X) es la media de los cuadrados de las diferencias entre los
valores de la variable X y la media de esa variable, es decir V( X) = M(( X − M( X))2 ) .
En consecuencia, si X(a j ) = b j para j = 1, 2, ..., n, tenemos que:
n
∑ (b j − M( X))2
j =1
V( X) = ≥ 0 pues el numerador es una suma de números no
n
negativos y el denominador es un número positivo.
Además, V( X) = 0 si y sólo si cada uno de los n sumandos del numerador es cero,
o sea si b j = M( X) para j = 1, 2, ..., n. Esto significa que X es constante.
V2 – V( X + k ) = V( X)
En la demostración de esta propiedad sólo necesitamos recordar la definición de
varianza y la propiedad M1. En efecto:
Df M1 Df
V( X + k ) = M(( X + k − M( X + k ))2 ) = M(( X + k − (M( X) + k ))2 ) = M(( X − M( X))2 ) = V( X) .
V3 – V(k X) = k 2 V( X)
En este caso usaremos la definición de varianza y la propiedad M2.
Df M2 M2 y Df
V(k X) = M((k X − M(k X))2 ) = M((k X − k M( X))2 ) = M(k 2 ( X − M( X))2 ) = k 2 V( X) .
V4 – V( X + Y ) = V( X) + V( Y ) + 2 ( M( XY) − M( X) M( Y ) )
Y ahora, además de la definición de varianza, tendremos en cuenta las
propiedades M1, M2 Y M3 y haremos varias cuentas.
Df M3
V( X + Y ) = M(( X + Y − M( X + Y ))2 ) = M(( X + Y − (M( X) + M( Y )))2 ) .
V( X + Y ) = M(( X − M( X) + ( Y − M( Y )) 2 ) .
V( X + Y ) = M(( X − M( X)) 2 + ( Y − M( Y )) 2 + 2 ( X − M( X)) ( Y − M( Y )) .
M3
V( X + Y ) = M(( X − M( X)) 2 ) + M(( Y − M( Y )) 2 ) + M(2 ( X − M( X)) ( Y − M( Y )) .
Df y M2
V( X + Y ) = V( X) + V( Y ) + 2 M( ( X − M( X)) ( Y − M( Y )) .
V( X + Y ) = V( X) + V( Y ) + 2 M ( X Y − X M( Y ) − YM( X) + M( X) M( Y )) .
M1 , M2 y M3
V( X + Y ) = V( X) + V( Y ) + 2 (M ( X Y ) − M( X) M( Y ) − M( Y ) M( X) + M( X) M( Y )) .
V( X + Y ) = V( X) + V( Y ) + 2 (M ( X Y ) − M( X) M( Y )) .
V5 – V( X) = M( X 2 ) − (M( X))2
Ya sabemos que M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2 (propiedad M4).
Si en la igualdad anterior sustituimos k por M(X) nos queda:
V( X) = M( ( X − M( X))2 ) = M( X 2 ) − (M( X))2 .
22
V( X)
V6 – fr( | X − M( X) | ≥ c ) ≤ (desigualdad de Tchebycheff)
c2
Comenzamos partiendo en dos el conjunto A en el que está definida la variable X:
A 1 = (| X − M( X) | ≥ c ) y A 2 = (| X − M( X) | < c ) .
V( X)
La desigualdad de Tchebycheff afirma que fr( A 1 ) ≤ . Para convencernos de
c2
ello, razonamos de la siguiente manera:
∑ ( X(a) − M( X))2
a∈ A
V( X) = M(( X − M( X))2 ) = , donde n es el número de elementos de
n
A.
∑ ( X(a) − M( X))2 + ∑ ( X(a) − M( X))2 ∑ ( X(a) − M( X))2
a∈ A1 a∈ A 2 a∈ A1
V( X) = ≥ .
n n
Si a ∈ A 1 se cumple que | X(a) − M( X) | ≥ c , es decir ( X(a) − M( X))2 ≥ c 2 .

Por lo tanto resulta que:
∑ ( X(a) − M( X))2 ∑ c2 c 2. ∑1
a∈ A1 a∈ A1 a∈ A1
V( X) ≥ ≥ = = c 2 fr( A 1 ) .
n n n
V( X)
En resumen, V( X) ≥ c 2 fr ( A 1 ) . Esto último es lo mismo que fr( A 1 ) ≤ .
c2
2 - Tabla 3
En la tabla 3 presentamos algunas características de la distribución binomial. Aquí

nos ocuparemos en justificar los resultados que allí aparecen. En todo lo que sigue
X es una variable que tiene distribución binomial de parámetros p y n.
Fórmula de recurrencia
Hay una fórmula que permite calcular el valor de la función de cuantía de X en
cada número del recorrido de X, salvo el primero, a partir del valor de esa función
en el número anterior de ese recorrido. Esa fórmula es la siguiente:
p (n − x )
f X ( x + 1) = f X ( x ) para x = 0, 1, ..., n –1.
(1 − p) ( x + 1)
f ( x + 1) p (n − x )
A continuación verificaremos que X = para x = 0, 1, ..., n –1 (lo
fX (x) (1 − p) ( x + 1)
cual es lo mismo que la fórmula de recurrencia que nos interesa).
Ya que f X ( x ) = C nx p x (1 − p)n − x , tenemos que f X ( x + 1) = C nx +1 p x +1 (1 − p)n − x −1 .
Por lo tanto:
x +1
n
f X ( x + 1) C x +1 p (1 − p)n − x − 1 C nx +1 p
= = (*).
f X (x) C nx p x (1 − p)n − x C nx (1 − p)
C nx +1
Simplifiquemos ahora el cociente .
C nx
23
C nx +1 n! n! (n − x )! x ! n−x
= : = = (**) .
C nx (n − x − 1)! ( x + 1)! (n − x )! x ! (n − x − 1)! ( x + 1)! x + 1
f ( x + 1) p (n − x )
De las igualdades (*) y (**) deducimos que X = .
fX (x) (1 − p) ( x + 1)
Moda de X
La moda de X es el valor de X para el que se obtiene el mayor valor de la función
de cuantía de X (puede ocurrir que haya más de un valor de X con esa propiedad;
cuando eso ocurre tenemos que la moda de X no es única).
Nos interesa, pues, hallar el mayor de los valores de la función de cuantía de X, o
sea el máximo de f X . Con ese fin resolveremos la inecuación f X ( x + 1) > f X ( x ) , o
f ( x + 1)
lo que es lo mismo: X > 1 (pues los valores de f X son positivos).
fX (x)
f ( x + 1) p (n − x ) p (n − x )
Ya sabemos que X = , por lo cual planteamos >1.
fX (x) (1 − p) ( x + 1) (1 − p) ( x + 1)
p (n − x )
>1 ⇔ p (n − x ) > (1 − p) ( x + 1) Tuvimos en cuenta que
(1 − p) ( x + 1)
(1 − p) ( x + 1) > 0 .
p (n − x ) > (1 − p) ( x + 1) ⇔ p n − p x > x + 1 − p x − p ⇔ p (n + 1) > x + 1

Lo anterior nos permite afirmar lo que sigue:
1) Si x es tal que x + 1 < p (n + 1) resulta que f X ( x + 1) > f X ( x ) . O sea que para cada
uno de esos x el valor de f X es menor que el de f X en el siguiente x. Por lo
tanto, ninguno de esos x es la moda de X.
2) Si x es tal que x + 1 = p (n + 1) resulta que f X ( x + 1) = f X ( x ) . O sea que para ese
x el valor de f X es igual al de f X en el siguiente x. Estamos suponiendo que
hay un tal x, para lo cual necesitamos que p (n + 1) sea un número natural (si
eso no es así, concluimos que los valores de f X son distintos entre sí).
3) Si x es tal que x + 1 > p (n + 1) resulta que f X ( x + 1) < f X ( x ) . O sea que para
cada uno de esos x el valor de f X es mayor que el de f X en el siguiente x. Por
lo tanto, ninguno de los respectivos x + 1 es la moda de X.
La conclusión de lo que antecede es justamente lo que se establece en la Tabla 3
sobre la moda de X.
Media de X
Veremos cuatro formas de llegar a la media de X.
Primera demostración - Aplicación de habilidades con números combinatorios

Atentos a la definición de media de una variable (página 7), debemos calcular la
n n
siguiente suma: ∑ x f X ( x) = ∑ x C nx p x (1 − p)n − x .
x =0 x =0
n n
Notemos, en primer lugar, que ∑ x C nx p x (1 − p)n − x = ∑ x C nx p x (1 − p)n − x pues
x =0 x =1
el primer sumando de la primera suma es 0.
24
n
Al poner x = z + 1 en ∑ x C nx p x (1 − p)n − x nos queda lo siguiente:
x =1
n n −1
∑ x C nx p x (1 − p)n − x = ∑ (z + 1) C nz +1 p z +1 (1 − p)n − z −1 .
x =1 z=0
Ahora observemos que:
n! n (n − 1)!
( z + 1) C nz +1 = ( z + 1) = = n C nz −1 .
(n − z − 1)! ( z + 1)! (n − z − 1)! z !
Por lo tanto:
n −1 n −1
∑ ( z + 1) C nz +1 p z +1 (1 − p)n − z −1 = ∑ n p C nz −1 p z (1 − p)n − z −1
z=0 z=0
n −1 n −1
∑ (z + 1) C nz +1 p z +1 (1 − p)n − z −1 = n p ∑ C nz −1 p z (1 − p)n − z −1 = n p .
z=0 z=0
n −1
La última igualdad se debe a que ∑ C nz −1 p z (1 − p)n − z −1 = 1 ya que esa suma es
z=0
la de todos los valores de la función de cuantía de una distribución binomial cuyos
parámetros son n – 1 y p.
En resumen, M( x ) = n p .
Para finalizar importa que señalemos que en el razonamiento anterior supusimos
que n > 1 (si n fuera 1, es casi inmediato comprobar que M(X) = p).
Segunda demostración - Aplicación de la fórmula de recurrencia

n
Recordemos, para comenzar, que M( X) = ∑ x f X (x) .
x =0
La fórmula de recurrencia que ya conocemos nos lleva a escribir lo siguiente:
(1 − p) ( x + 1) f X ( x + 1) = p (n − x ) f X ( x ) para x = 0, 1, 2, ..., n –1.
Por lo tanto:
n −1 n −1
∑ (1 − p) ( x + 1) f X ( x + 1) = ∑ p (n − x) f X ( x) .
x =0 x =0
n −1 n −1
(1 − p) ∑ ( x + 1) f X ( x + 1) = p ∑ (n f X( x ) − x f X ( x )) .
x =0 x =0
n −1 ⎛ n −1 n −1 ⎞
⎜n ⎟.
(1 − p) ∑ ( x + 1) f X ( x + 1) = p
⎜ ∑ X( x ) ∑ X ⎟
f − x f ( x )
x =0 ⎝ x =0 x=0 ⎠
En la igualdad anterior aparecen tres sumas: la que está a la izquierda es “casi”
M(X) (le falta el primer sumando), la primera de las dos que están la derecha es
“casi” la suma de todos los valores de la función de cuantía de X (le falta el último
sumando) y la segunda es “casi” la media de X (también le falta el último
sumando). Debido a ello resulta que:
(1 − p) (M( X) − 0 f X (0)) = p ( n (1 − f X (n)) − (M( X) − n f x (n))) .
(1 − p) M( X) = p ( n − M( X)) ; M( X) = n p .
Tercera demostración - Aplicación de variables 0 - 1

Supongamos que tenemos una urna U con r bolillas rojas y b blancas y que de ella
extraemos n bolillas, de a una y con reposición. En el conjunto de todos los
25
resultados posibles de nuestro experimento, al que simbolizamos con Ω , definimos
una variable X que nos indica el número de bolillas rojas extraídas. Ya sabemos
r
que esa variable tiene distribución binomial de parámetros p y n, donde p =
r +b
(es conveniente que vuelvas a leer el ejemplo 1 en las páginas 10 y 11).
En Ω definimos otras n variables así:
⎧ 1 si en la extracción número i sale roja
X i (ω) = ⎨ (i = 1, 2, ..., n).
⎩ 0 en caso contrario
Es claro que X = X1 + X 2 + ... + Xn .
Debido a lo anterior tenemos que M( X) = M( X1 ) + M( X 2 ) + ... + M( X n ) .
Pasemos, pues, a calcular la media de cada variable X i .
M( X i ) = 1.Pr( Xi = 1) + 0 .Pr( X i = 0) = p + 0 = p .
En consecuencia, M( X) = M( X1 ) + M( X 2 ) + ... + M( X n ) = p + p + ... + p = n p .
Cuarta demostración - Aplicación de la derivación

n
Consideremos la función g definida así: g( t ) = ∑ e x t f X ( x) para cada t ∈ R.
x=0
n n
Entonces g ' ( t ) = ∑ x e x t f X ( x ) y g ' (0 ) = ∑ x f X ( x) = M( X) .
x=0 x =0
Ahora bien,
n n n
g( t ) = ∑ e x t fX (x) = ∑ e x t C nx p x (1 − p)n − x = ∑ C nx (e t p) x (1 − p)n − x .
x=0 x =0 x=0
La fórmula del binomio de Newton implica que g( t ) = (e t p + 1 − p)n .

Por lo tanto, g ' ( t ) = n (e t p + 1 − p)n −1 e t p y g ' (0) = n p .
Varianza de X
La justificación de la fórmula de la varianza de X puede hacerse por cualquiera de
las cuatro formas que hemos desarrollado en el caso de la media de X. Confiamos
en que intentarás trabajar, al menos, con una de esas formas y al respecto pueden
serte útiles los siguientes comentarios:
1) Salvo en la tercera forma, recuerda que V( X) = M( X 2 ) − (M( X))2 . Puesto que
M(X) ya la conoces, debes calcular M( X 2 ) .
2) En la tercera forma, es conveniente que uses la propiedad V4 (generalizada a
la suma de n variables), que observes que Xi 2 = Xi y que pruebes que
M( X i X j ) = p 2 si i ≠ j.
Intervalo de confianza para p

1
En el ejercicio 11 (página 8) te convenciste de que fr( | X − M( X) | < k σ( X)) ≥ 1 − ,
k2
donde X una variable estadística cuantitativa y k un número positivo.
⎧0,90 si k = 10
⎪⎪
En particular, fr( | X − M( X) | < k σ( X)) ≥ ⎨0,95 si k = 20 .
⎪0,99 si k = 10
⎪⎩
26
En el caso que X tenga distribución binomial de parámetros p y n tenemos que:
( | X − M( X) | < k σ( X)) = ( | X − np | < k n p (1 − p) ) .
Los cálculos que siguen justifican los extremos del intervalo que constan en la
Tabla 3. En efecto:
( | X − np | < k n p (1 − p) ) ⇔ (( X − np) 2 < k 2 n p (1 − p))
( | X − np | < k n p (1 − p) ) ⇔ ( X 2 − 2 X n p + n2 p 2 < k 2 n p − k 2 n p 2 )
( | X − np | < k n p (1 − p) ) ⇔ (n (n + k 2 ) p 2 − n (2 X + k 2 ) p + X 2 ) < 0
La resolución de la última inecuación nos lleva al resultado que estábamos
buscando.
Estimador máximo verosímil de p

La función de cuantía de la variable con distribución normal de parámetros p y n
es f X ( x ) = C nx p x (1 − p)n − x .
El problema que ahora nos planteamos es el siguiente: supuestos conocidos n y x,
¿cuál es el valor de p que maximiza f X ( x ) ?
Con el fin de contestar a la pregunta anterior, consideramos la función h definida
así: h(p) = C nx p x (1 − p)n − x para cada p entre 0 y 1.
h ' (p) = C nx ( x p x −1 (1 − p)n − x − p x (n − x ) (1 − p)n − x −1 ) .
h ' (p) = C nx p x −1 (1 − p)n − x −1 ( x (1 − p) − p (n − x )) .
h ' (p) = C nx p x −1 (1 − p)n − x −1 ( x − p n) .
El signo de esa derivada es el que presentamos en el esquema que sigue (tuvimos
en cuenta que p está entre 0 y 1 y supusimos que x no es 0 ni n).
+ + + + + + + + 0 - - - - - - - - - -
⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯|⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯⎯ Signo de h ' (p)
0 x/n 1
x
Lo anterior nos conduce a afirmar que el valor de p que maximiza f X ( x ) es .
n
Para finalizar este apéndice es útil que hagamos unos comentarios, previendo tu
interés en justificar los resultados que aparecen en la Tabla 5 (página 17):
1) La demostración de la fórmula de recurrencia sólo requiere hacer cuentas.
2) La justificación del resultado sobre la moda puede hacerse en forma similar a la
que desarrollamos en el caso de la distribución binomial.
3) La forma más “elegante” y “rápida” de demostrar los resultados sobre la media
y la varianza es similar a la tercera que vimos en el caso de la distribución
binomial (la cuarta resulta inoperante). Si optas por esa tercera forma, lo cual te
r r (r − 1)
sugerimos, deberás probar que M( X i ) = y que M( X i X j ) = si
r +b (r + b) (r + b − 1)
i ≠ j.
4) Para el intervalo de confianza para r hay que tener un poco más de paciencia
que en el caso de la distribución binomial, pero sólo se trata de hacer cuentas.
5) Finalmente, para el estimador máximo verosímil de r no es posible usar criterios
de maximización de funciones de una variable real; hay que razonar en forma
similar a la que justifica el resultado sobre la moda.
27
Apéndice 2 – Un ejemplo de prueba de hipótesis
Enunciado del problema del horticultor y el rabdomante
Pablo es un horticultor que desea regar sus cultivos y con ese fin debe encontrar
un lugar en sus tierras donde hacer un pozo. Pedro, un presunto experto de la
zona en esa tarea, le ofrece sus servicios (remunerados, claro está). Pablo duda
de las habilidades que Pedro manifiesta tener y decide someterlo a prueba.
Pablo ha ideado tres posibles experimentos para probar a Pedro y se da cuenta
que puede cometer dos errores al tomar una decisión: decidir que Pedro es un
experto cuando en realidad no lo es (en este caso lo contrata) o decidir que es un
farsante cuando realmente no lo es (en este caso no lo contrata). No tiene dudas
sobre que de esos dos errores posibles, el peor es el primero.
Decisión de Pablo
Hipótesis Pedro Lo contrata No lo contrata
H0 Farsante Error (el peor) Acierto
H1 Experto Acierto Error
Con el fin de optar por uno de los tres experimentos que se le han ocurrido, Pablo
nos pide que opinemos sobre el estudio que hizo de los mismos.
Resolución parcial del problema del horticultor y el rabdomante
Primer experimento
Definición del experimento

Pablo le presenta a Pedro diez barriles, de los cuales cinco tienen agua y los otros
no. Le informa de ello a Pedro y le pide que los clasifique.
Análisis del experimento

Pablo supone que Pedro clasifica los barriles al azar, observa que el posible
número de aciertos de Pedro varía entre 0 y 5 y calcula la probabilidad de cada
uno de esos aciertos.
Aciertos Probabilidad Comentario

0 1/252 Si X es la variable que indica el número
1 25/252 de aciertos de Pedro y P(X=x) es la
2 100/252 probabilidad de que Pedro acierte x
3 100/252 veces (x = 0, 1, 2, 3, 4, 5) se cumple que
4
5
25/252
1/252 P( X = x ) =
C 5x C 55 − x
=
(C )
5 2
x
Total 1 C 10
5 C 10
5
Criterio de decisión
Atento a lo anterior, Pablo decide contratar a Pedro si éste clasifica correctamente
al menos cuatro barriles. Con ello, la probabilidad de que se encuentre ante el peor
26
error es ≅ 0,103 .
252
28
Segundo experimento

Pablo agrupa los diez barriles de a pares, uno con agua y otro sin agua. Le informa
de ello a Pedro y le pide que indique cuál de los dos barriles de cada pareja tiene
agua.
Tercer experimento

Pablo le presenta a Pedro los diez barriles y le dice que cinco tienen agua y los
otros no. Le pide que vaya clasificando cada barril y le informa que la prueba
termina ante el primer acierto.
Y ya en el final, te planteamos algunas preguntas con la esperanza que las

contestes:
1) ¿Cuál sería un criterio de decisión razonable para el segundo experimento? ¿Y
cuál para el tercero?
2) ¿Cuál de los tres experimentos le recomendarías a Pablo?
jmoretti@ccee.edu.uy
jmoretti@hotmail.com
29

Estadística Descriptiva - Inferencia Estadística

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estadística Descriptiva - Inferencia Estadística

Enviado por

Direitos autorais:

Formatos disponíveis

Enseñanza de Estadística en el tercer año de bachillerato

En este documento presentamos algunos temas que son objeto de la Estadística

1 – Media, moda, mediana y mediala de una variable estadística cuantitativa

Tabla 1 - Datos de ingresos de cincuenta hogares

Ingreso Ingreso Ingreso

Tabla 2 - Un resumen de los ingresos de los cincuenta hogares

Frecuencia Frecuencia acumulada Ingreso acumulado

Resulta útil la interpretación de nuestra segunda tabla. Por ejemplo, el renglón

Media del ingreso

Moda del ingreso

Mediala del ingreso

2 – Función de cuantía, función de distribución y función de concentración de una

A partir de la variable ingreso de nuestro ejemplo podemos definir algunas

Lo anterior motiva la definición de nuestra tercera función:

Y ya en el final de esta sección, generalizaremos los conceptos que hemos

A las imágenes de los elementos de A según la función X los representaremos así:

Para cada i entre 1 y t llamaremos frecuencia relativa del conjunto ( X = x i ) al

2 - Función de cuantía, media, moda, varianza y desviación estándar

Definimos la función de cuantía de X asÍ: f X : B → R tal que f X ( x i ) = fi .

Una moda de X es un valor de X en el que f X toma su valor mayor (puede haber

La varianza de X es el número V( X) = M(( X − M( X))2 ) , o sea la media de los

La desviación estándar de X es el número σ( X) = V( X) .

Entre las propiedades de la media y la varianza se destacan las que enunciamos

3 - Función de distribución y mediana

Definimos la función de distribución de X asÍ:

El menor entre todos los x que verifican FX ( x ) ≥ 0,5 es la mediana de X.

4 - Función de concentración, mediala e índice de Gini

Para definir la función de concentración de X exigimos que X sea una variable no

III – Inferencia Estadística

A – Ejemplo 1: Un ejemplo del modelo binomial

En este ejemplo nos encontramos con lo que se llama el modelo probabilístico

X Pr( X = x ) x Pr( X = x ) x 2 Pr( X = x )

Diremos que una variable X tiene distribución binomial de parámetros p y n (p es

C – Una aplicación del modelo binomial (estimación de un parámetro)

D – Ejemplo 2: Un ejemplo del modelo hipergeométrico

Consideremos nuevamente la urna U del ejemplo 1.

En este ejemplo estamos ante el modelo probabilístico llamado hipergeométrico de

Usemos los resultados que obtuvimos para hallar la media y la varianza de la

Para finalizar con el ejemplo, corresponde que destaquemos un hecho

Diremos que una variable X tiene distribución hipergeométrica de parámetros r, b y

En la próxima tabla resumimos algunas características de este modelo.

F – La ley de los grandes números para la distribución binomial

Teorema 2 – Ley de los grandes números para la distribución binomial

A continuación presentamos la demostración de cada una de las propiedades que

M4 – M( ( X − k )2 ) = M( X 2 ) − (M( X))2 + (M( X) − k ) 2

Si a ∈ A 1 se cumple que | X(a) − M( X) | ≥ c , es decir ( X(a) − M( X))2 ≥ c 2 .

En la tabla 3 presentamos algunas características de la distribución binomial. Aquí

p (n − x ) > (1 − p) ( x + 1) ⇔ p n − p x > x + 1 − p x − p ⇔ p (n + 1) > x + 1

Primera demostración - Aplicación de habilidades con números combinatorios

Segunda demostración - Aplicación de la fórmula de recurrencia

Tercera demostración - Aplicación de variables 0 - 1

Cuarta demostración - Aplicación de la derivación

La fórmula del binomio de Newton implica que g( t ) = (e t p + 1 − p)n .

Intervalo de confianza para p

Estimador máximo verosímil de p

Enunciado del problema del horticultor y el rabdomante

Resolución parcial del problema del horticultor y el rabdomante

Definición del experimento

Análisis del experimento

Aciertos Probabilidad Comentario

Definición del experimento

Definición del experimento