Você está na página 1de 35

1 | P g i n a

Tema 1: ESTIMACIN DE PARMETROS Y CONTRASTE DE HIPTESIS.


1.1. I nt roduccin
1.2. Obj et ivos
1.3. Dist ribuciones muest rales
1.3.1. Dist ribucin muest ral de la media
1.3.2. Dist ribucin muest ral de la proporcin
1.3.3. Dist ribucin muest ral de la varianza
1.4. La est adst ica inferencial
1.4.1. Est imacin de parmet ros
1.4.1.1. I nt ervalo de confianza de la media
1.4.1.2. I nt ervalo de confianza para la proporcin
1.4.1.3. I nt ervalo de confianza para la varianza
1.4.2. Amplit ud del int ervalo de confianza y su relacin con el t amao muest ral
1.4.3. Cont rast e de hipt esis
1.4.3.1. Met odologa clsica del cont rast e de hipt esis
1.4.3.2. Errores al t omar una decisin en un cont rast e de hipt esis
1.5. Ej ercicios de aut oevaluacin


2 | P g i n a

1.1.- Introduccin
En la asignat ura de primer curso I nt roduccin al anlisis de dat os se han est udiado procedimient os
para organizar, represent ar y describir un conj unt o de dat os -bien mediant e la creacin de t ablas, grficos o
calculando medidas que nos informan de su t endencia cent ral, variabilidad, forma, relacin, et c.- de t al forma
que, de forma resumida, nos proporcionan un conocimient o eficaz y con sent ido de las caract erst icas de la
muest ra. En est a asignat ura de segundo vamos a dar un paso adelant e con el obj et ivo de ut ilizar est a
informacin para que, mediant e la inferencia y el cont rast e de hipt esis, podamos hacer generalizaciones
referidas a la poblacin a part ir del anlisis descript ivo de una, dos, o ms muest ras. Est e conocimient o
siempre ser aproximado o, dicho con ot ras palabras, est a inferencia siempre ser probabilst ica.
En est e primer capt ulo abordamos los fundament os de la inferencia est adst ica, rama de la
Est adst ica que permit e realizar afirmaciones sobre una poblacin a part ir de los dat os obt enidos en alguna de
las muest ras que se pueden ext raer de la misma. En el proceso de inferencia hay que seguir unas paut as
para que las afirmaciones que hagamos finalment e referidas a la poblacin, y las correspondient es decisiones
que t omemos respect o a ella, sean lo ms racionales posibles. En est e proceso inferencial se pueden
dist inguir bsicament e los siguient es pasos: ext raccin de la muest ra, medicin de la(s) caract erst ica(s)
obj et o de nuest ro int ers, clculo del est adst ico en la muest ra para inferir el parmet ro de la poblacin, y
evaluacin probabilst ica del error que podemos comet er al realizar dicha inferencia.
De manera resumida, explicaremos los fundament os t ericos y los aspect os prct icos del proceso de
inferencia, repasando un concept o fundament al, sin el cual no es posible comprender cmo se produce la
inferencia, y que se conoce como distribucin muestral, que ya fue t rat ado en el t ema 8 de la asignat ura
de I nt roduccin al anlisis de dat os y al cual remit imos al est udiant e que por algn mot ivo no ahond lo
suficient e en est e concept o. Post eriorment e abordamos los procedimient os de est imacin de parmet ros, as
como las propiedades que debe t ener un est imador para que cumpla bien su funcin de est imar el parmet ro
que se desea conocer en la poblacin
1
.
Finalment e, explicamos con ciert a amplit ud la met odologa del cont rast e de hipt esis sobre
parmet ros de una poblacin, proceso nt imament e relacionado con el proceso de est imacin. En los
epgrafes dedicados a los cont rast es de hipt esis, adems de la met odologa, se t rat an aspect os sust ant ivos
de los cont rast es t ales como los posibles errores que se pueden comet er al hacer una inferencia, y un
concept o que est en boga desde los aos ochent a del pasado siglo, como es el de la magnit ud o t amao del
efect o, y que ya es precept ivo referir en cualquier informe de invest igacin emprica.
En cualquier caso, el est udiant e debe saber que la t emt ica que se t rat a en est e t ext o asume
conocimient os previos t rat ados en la asignat ura de primer curso de t al forma que se supone adquiridos los
concept os bsicos de anlisis descript ivo de los dat os, probabilidad, el clculo de las probabilidades de las
dist ribuciones discret as y cont inuas e, nt imament e relacionadas con st as lt imas, el concept o de dist ribucin
muest ral. Adquiridos est os concept os a los que nos hemos referido, en est e primer t ema marcamos los
siguient es obj et ivos.
1.2.- Objetivos:
- Conocer cmo es la dist ribucin muest ral de los est adst icos media, varianza y proporcin.
- Calcular int ervalos de confianza de los parmet ros poblacionales media, varianza y proporcin.
- Calcular el t amao de la muest ra en funcin de la precisin de la est imacin deseada.

1
El concepto de parmetro se explica detenidamente en el tema 9 sobre contrastes no paramtricos.


3 | P g i n a

- Comprender e int erpret ar la lgica de la met odologa del cont rast e de hipt esis.
- Reconocer e ident ificar los errores y riesgos de t odo cont rast e de hipt esis.
1.3.- Distribuciones muestrales
La inferencia est adst ica es una forma de razonamient o que va de lo concret o a lo general. El
invest igador, para confirmar o refut ar las hipt esis t ericas que manej a, ext rae una muest ra represent at iva
de la poblacin obj et o de est udio y sobre ella realiza las mediciones de las caract erst icas relevant es para su
invest igacin. Para cada caract erst ica evaluada se obt iene uno, o ms, valores numricos que se conocen
como est adst icos, los cuales pueden ser cualquiera de los est udiados en la asignat ura de primer curso
(medidas de t endencia cent ral, de posicin, de variabilidad, de asimet ra, de relacin, de regresin, et c.). Y es
a part ir de los diversos est adst icos obt enidos en la muest ra (lo concret o) que t iene que realizar afirmaciones
sobre los valores de los parmet ros de la poblacin (lo general). Pero cmo se realiza ese salt o de lo
concret o a lo general? Para ent ender est e proceso es preciso, previament e, recordar lo que se conoce como
dist ribucin muest ral, y para ello hay que sit uarse en un plano hipot t ico en el que pudiramos t rat ar con
t odas las posibles muest ras del mismo t amao, n, que se pueden ext raer de una poblacin de t amao N
(siendo, obviament e, N > n).
Razonando en est e escenario hipot t ico en el que pudiramos ext raer mlt iples muest ras de la
poblacin, en cada una de est as muest ras se realizara la medicin de la o las variables de int ers y se
obt endra un est adst ico (media, proporcin, varianza, correlacin, et c.) cuyo valor ser diferent e (o igual) al
obt enido en cualquiera de las ot ras posibles muest ras ya que, obviament e, depende de los dat os que la
componen. Es decir, el est adst ico obt enido en cada una de las dist int as muest ras se comport a como una
variable aleat oria, y sus diferent es valores forman una dist ribucin de probabilidad que recibe el nombre de
dist ribucin muest ral. Como en t oda dist ribucin, t ambin de la dist ribucin muest ral de uno de est os
est adst icos obt enido para t odas las muest ras posibles, podemos obt ener su media y su desviacin t pica. Est a
lt ima, al est ar referida a la dist ribucin muest ral de un est adst ico, recibe el nombre de error tpico del
est adst ico.
De modo que el concept o de dist ribucin muest ral hay que dist inguirlo de ot ros t ipos de
dist ribuciones, como son, la distribucin poblacional que se refiera a la dist ribucin de los dat os
individuales en la poblacin y la distribucin en la muestra es la dist ribucin de una part e de est os dat os
individuales que const it uyen la muest ra.
Una vez que hemos repasado el concept o de dist ribucin muest ral, vamos a abordar de manera muy
resumida cmo son las dist ribuciones muest rales de t res est adst icos ampliament e ut ilizado en la invest igacin
social: la media, la proporcin y la varianza y recordando que las dos primeras ya fueron t rat adas en el curso
ant erior y veremos cmo la forma que adopt a la dist ribucin muest ral depende, ent re ot ras cosas, de la
forma que adopt e la dist ribucin poblacional.
1.3.1. Distribucin muestral de la media
Consideremos una poblacin formada por t odos los est udiant es universit arios de una det erminada
comunidad de los que podemos conocer, a part ir de sus dat os de la mat rcula, su edad. A part ir de est os
dat os podemos calcular su edad media y la varianza de est a misma variable (edad), valores que
represent amos por y
2
o , respect ivament e (si dispusiramos de ms de una variable, sera recomendable
indicar, mediant e subndices, a qu variable se corresponde cada media y varianza, de t al forma que en est e
caso podramos indicarlo como
edad
y
2
edad
o ). De est a poblacin podemos ext raer una muest ra de, por
ej emplo, 100 est udiant es y calcular su media y desviacin t pica que represent amos por Y y
Y
S si


4 | P g i n a

represent amos la variable por Y o por X y
X
S si la represent amos con la let ra X. Pero est a muest ra no es la
nica posible. Se pueden ext raer muchas ot ras muest ras diferent es, t odas ellas del mismo t amao (n= 100), y
en cada una de ellas calcular su media y desviacin t pica que variarn de una muest ra a ot ra de t al manera
que con las punt uaciones de t odas las medias muest rales (vase Figura 1.1) se origina ot ra dist ribucin que
se llama dist ribucin muest ral de la media. Con el mismo procedimient o se obt endra la dist ribucin muest ral
de la desviacin t pica o de cualquier ot ro est adst ico, como la proporcin, la correlacin de Pearson, et c. y
corresponde a la dist ribucin de probabilidad de un est adst ico al calcularlo en t odas las posibles muest ras del
mismo t ipo y t amao, n, ext radas de una poblacin de t amao N.

Figura 1.1: Proceso de const ruccin de la dist ribucin muest ral para el est adst ico media. A la izquierda aparece la represent acin de
una variable en una poblacin de t amao N. Est a variable es normal con media 100 y desviacin t pica 15. A la derecha se muest ra la
dist ribucin muest ral t erica del est adst ico Media calculado en t odas las muest ras posibles de t amao n. Obsrvese que ambas
dist ribuciones (la poblacional y la muest ral) t ienen la misma media pero la dist ribucin muest ral t iene una variabilidad muy inferior a la
variabilidad de la dist ribucin poblacional.
Como se est udi en el t ema 8 de la asignat ura I nt roduccin al anlisis de dat os , a la hora de
det erminar la forma de la dist ribucin muest ral de la media hay que dist inguir t res sit uaciones:
1.- Si la dist ribucin poblacional de la variable de est udio es normal con media y desviacin t pica conocida
o , ent onces la dist ribucin muest ral del est adst ico media es t ambin normal, con independencia del t amao
de la muest ra, y cuya media y desviacin t pica (o error t pico de la media) son, respect ivament e:
=
Y



n
Y
o
o =


5 | P g i n a

Obsrvese que para diferenciar los parmet ros poblacionales ( y o ) de los parmet ros de la
dist ribucin muest ral de la media (
Y
y
Y
o ) hemos incluido en est a lt ima un subndice que seala el
est adst ico sobre el que se ha calculado la dist ribucin muest ral.
Obviament e, si t ipificamos el valor del est adst ico

media Y que se dist ribuye normalment e, obt enemos
la variable Z:
n
Y Y
Z
Y
o

o

=

=

cuya dist ribucin ser normal,

( ) 1 , 0 N lo cual permit e conocer mediant e las t ablas de la curva normal la
probabilidad asociada a cada valor del est adst ico Y en la dist ribucin muest ral o la dist ancia, en t rminos
probabilst icos, desde la media de una muest ra concret a, Y , a la media de la poblacin (que coincide con
la media de la dist ribucin muest ral,
Y

).
2.- Si se desconoce la forma de la dist ribucin poblacional de la variable, la forma de la dist ribucin muest ral
de la media depende del t amao de la muest ra. El Teorema Cent ral del Lmit e (TCL) est ablece que sin
import ar la forma de la dist ribucin poblacional, la dist ribucin muest ral de la media se aproximar a la
normal a medida que aument a el t amao de la muest ra. Y el t amao que debe t ener la muest ra para que la
dist ribucin muest ral se considere normal depende de la forma que t enga la dist ribucin poblacional. Cuant o
ms se alej e st a de la dist ribucin normal mayor t endr que ser el t amao de la muest ra. Si asumimos que
la mayora de las variables que se ut ilizan en las ciencias sociales no se alej an en exceso de la dist ribucin
normal, vamos a considerar que una muest ra es grande cuando n> 30. Est o nos permit ir est ablecer, como
supuest o necesario para algunos t est s inferenciales o de cont rast e de hipt esis, que la dist ribucin muest ral
de la media es normal incluso aunque desconozcamos la dist ribucin poblacional pero el t amao muest ral
alcance o supere est e valor.
3.- Finalment e, en la prct ica invest igadora, no es frecuent e conocer la varianza de la poblacin o
2
. Est udios
realizados por W.S. Gosset al final del siglo XI X demost raron que en est as circunst ancias la dist ribucin
muest ral de la media es una dist ribucin diferent e de la normal, que se conoce con el nombre de dist ribucin
t de St udent (est e fue el pseudnimo que t uvo que ut ilizar Gosset para poder publicar sus invest igaciones
sobre la dist ribucin t ya que su cont rat o laboral con la cervecera Guinness le impeda publicar con su nombre
verdadero). En est as circunst ancias Gosset demost r que la dist ribucin de la variable
n
S
Y
T
n 1

=




sigue el modelo t de St udent con n-1 grados de libert ad, donde S
n-1
es la cuasi-desviacin t pica de la muest ra
ya vist a el curso ant erior. Por ot ra part e, la dist ribucin t de St udent se aproxima a la normal y est o supone
que cuando el valor de n es grande (a efect os prct icos por encima de 100 aunque ot ros aut ores ponen el
lmit e en n> 30) T se aproxima a Z, y por t ant o su dist ribucin ser muy parecida a la normal.

Ejemplo 1.1: Supongamos que en un det erminado Est ado la poblacin de escolares es evaluada sobre
conocimient os mat emt icos bsicos. Las punt uaciones en la poblacin t ienen media y desviacin
t pica , Si de est a poblacin se ext rae una muest ra aleat oria de 121 suj et os: cul es la probabilidad
de obt ener una media de 52 punt os o superior?; cul es la probabilidad de obt ener una media que est
comprendida ent re 48 y 51 punt os?
50 =
12 o =


6 | P g i n a

Part imos de una dist ribucin poblacional, de forma desconocida, con media 50 y desviacin t pica 12
pero al t rat arse de una muest ra grande, consideramos que, por el TCL la dist ribucin muest ral de la media es
t ambin normal (con media igual a 50 y desviacin t pica igual a
121
12
) , independient ement e de la
dist ribucin de las punt uaciones de la muest ra.
Calculamos la punt uacin t pica correspondient e al valor 52, de est a dist ribucin muest ral de medias:

y de acuerdo a la dist ribucin normal t ipificada la probabilidad de obt ener punt uaciones t picas de 1,83 o
superior, o lo que es igual, de obt ener una media de 52 punt os o superior es igual a 0,0336. Es decir, es poco
probable encont rar de esa poblacin una muest ra de 121 element os y que t enga 52 punt os de media o
superior. En la Figura 1.2(a) se represent a el rea correspondient e a est a probabilidad.
Figura 1.2 (a). Probabilidad de encont rar valores iguales o
mayores de 52 en la dist ribucin muest ral de media 50 y
desviacin t pica


Figura 1.2 (b). Probabilidad de encont rar valores
comprendidos ent re 48 y 51 en la dist ribucin muest ral de
media 50 y desviacin t pica
Para la segunda cuest in hay que calcular las punt uaciones t picas correspondient es a 48 y 51, y
det erminar la probabilidad asociada a sus correspondient es valores z.

De acuerdo a la dist ribucin normal t ipificada la probabilidad, comprendida ent re est as dos punt uaciones que
se represent an en la Figura 1.2 (b), son:
P(-1,8S Z u,92) = P(Z u,92) -P(Z -1,8S) = u,8212 -u,uSS6 = u,7876
52 50
1, 83
12
121
z

= =
12
121
12
121
48 50 51 50
1, 83 ; 0, 92
12 12
121 121
z z

= = = =


7 | P g i n a

1.3.2. Distribucin muestral de la proporcin
En el mbit o de las Ciencias Sociales es habit ual dirigir nuest ra at encin a sit uaciones en la que no
est amos int eresados en la media de la muest ra sino que queremos invest igar la proporcin de personas que
vot arn a un det erminado part ido polt ico, que present an un det erminado snt oma, o que, en definit iva,
cumplen una det erminada condicin a la que genricament e llamaremos xit o . En est as sit uaciones
t enemos que apoyarnos en la dist ribucin muest ral de la proporcin, la cual se genera con la misma lgica
que la dist ribucin muest ral de la media, con la nica diferencia de que al ext raer t odas las posibles muest ras
de t amao n de la poblacin, el est adst ico que se calcula en cada una de ellas es la proporcin p= x/ n
donde x es el nmero de dat os de la muest ra que cumplen la condicin designada como xit o y n es el
t amao de la muest ra.
Ent onces, si llamemos t a la proporcin de casos que cumplen una det erminada condicin en una
poblacin de t amao N y ext raemos t odas las posibles muest ras aleat orias de t amao n, en la que definimos
la variable P = Proporcin de aciert os , la dist ribucin muest ral de la proporcin es la dist ribucin de
probabilidad del conj unt o de t odas las proporciones, P, obt enidas en t odas las muest ras posibles de t amao
n, ext radas de una poblacin de t amao N. La variable aleat oria P, sigue el modelo de probabilidad binomial,
cuya media y desviacin t pica son, respect ivament e:
N
p
p
) 1 ( t t
o
t

=
=

Como sabemos por los t emas ya est udiados en el primer curso, las probabilidades asociadas a cada
valor de P se pueden buscar en la dist ribucin binomial con parmet ros n y t.
Por ot ra part e, la dist ribucin binomial -igual que la , la t de St udent o la F de Snedecor-Fischer- se
aproxima a la normal a medida que aument a el t amao de la muest ra, y por t ant o se puede generar una
nueva variable:
P
P
Z
o
t
=

cuya dist ribucin es la normal t ipificada.

Ejemplo 1.2: Una escuela de educacin primaria est compuest a por un 40% de nios y un 60% de
nias. Si se elige una muest ra aleat oria de 20 alumnos, cul ser la probabilidad de que haya ms de 9
nios?
La probabilidad de que en una muest ra de 20 alumnos haya ms de 9 nios, siendo la proporcin de
st os en la poblacin t = 0,40, se obt iene recurriendo a la distribucin binomial con parmet ros n= 20 y
40 , 0 = t la probabilidad pedida es, ut ilizando la expresin de su funcin de dist ribucin, la siguient e
2
:

2
Valor que t ambin podramos obt ener recurriendo a la t abla de la dist ribucin binomial como se est udi en el Tema 6 de
la asignat ura de I nt roduccin al Anlisis de Dat os.
2
_


8 | P g i n a

2447 , 0 7553 , 0 1 60 , 0 40 , 0
20
1 ) 9 ( 1 ) 9 (
20
9
0
= =
|
|
.
|

\
|
= s = >

=

y y
y
y
y P y P
Y ut ilizando la dist ribucin normal, t ipificamos la proporcin de nios obt enida en la muest ra P= 9/ 20= 0,45
46 , 0
1095 , 0
05 , 0
20
60 , 0 40 , 0
40 , 0 45 , 0
= =

=
P
P
Z
o
t

3228 , 0 6772 , 0 1 ) 46 , 0 ( 1 ) 46 , 0 (
6772 , 0 ) 46 , 0 (
= = s = >
= s
Z P Z P
Z P

Los result ados obt enidos por los dos procedimient os no coinciden pero la diferencia encont rada va
desapareciendo a medida que aument a el t amao de la muest ra, ya que el aj ust e de la dist ribucin binomial
a la normal es ms exact o. Est a diferencia ent re la probabilidad calculada mediant e la dist ribucin binomial
(discret a) y la calculada mediant e la curva normal (de parmet ros media igual a n p y varianza igual a n p
(1-p)) se debe a que est a lt ima es cont inua. Si en vez de ut ilizar el punt o P = 0.45 correspondient e a 9
xit os ut ilizamos el punt o medio ent re 9 y 10 xit os (P = 9.5 / 20 = 0.475) y repet imos los pasos ant eriores
obt endramos un valor de 0.2483, bast ant e cercano al inicial (0.2447). En la Figura 1.3 se muest ra la
diferencia ent re ambas perspect ivas. Parece obvio que la segunda es ms aproximada, aunque dependa de
int roducir como aproximacin un valor (y = 9.5) que no puede producirse j ams en la dist ribucin binomial ya
que est a exige valores ent eros.

Figura 1.3: efect o de ut ilizar y = 9 o y = 9.5 sobre las probabilidades para calcular la aproximacin de la normal a la binomial. La curva
cont inua es la curva normal con la misma media y desviacin t pica que la binomial. Las lneas vert icales represent an la funcin de
probabilidad de la binomial.

1.3.3. Dist ribucin muest ral de la varianza
La varianza es una medida de dispersin que permit e det erminar la variabilidad que present an los
dat os recogidos en una variable obj et o de est udio.


9 | P g i n a

Recuerde que en la muest ra podemos ut ilizar dos expresiones para el clculo de la varianza, que reciben los nombres
de:
Varianza muest ral:
2
2 2
2
) (
Y
n
Y
n
Y Y
S
n
=

=


Cuasivarianza muest ral o varianza insesgada:
1
) (
2
2
1

n
Y Y
S
n

Obsrvese, sin embargo que ent re varianza y cuasi-varianza de la muest ra exist e la siguient e relacin:
2 2
1
2
1
2
2
2
1
2 2
2
2
) 1 (
) 1 ( ) (
1
) (
) (
) (
n n
n n
n n
S n S n
S n Y Y
n
Y Y
S
S n Y Y
n
Y Y
S
=

=
=


Por lo que la cuasi-varianza de la muest ra se puede calcular a part ir de la varianza de la muest ra de acuerdo con la
siguient e expresin:
2 2
1
1
n n
S
n
n
S

No obst ant e, el proceso de const ruccin de una dist ribucin muest ral de varianzas no es t an
inmediat o como el de la media o el de la proporcin, de modo que aqu nos limit aremos a describir cul es la
variable aleat oria, su dist ribucin de probabilidad, sus medias -o valor esperado- as como su varianza y
desviacin t pica.
La variable aleat oria que permit e realizar afirmaciones sobre la varianza poblacional se puede generar a
part ir de cualquiera de las siguient es dos expresiones que part en de la cuasi-varianza o de la varianza de la
muest ra respect ivament e:
2
2
2
2
2
1 2
) 1 (
o
o
n
n
S n
X
S n
X

=

=


que se dist ribuyen segn (j i-cuadrado con n-1 grados de libert ad). Es decir, mient ras que en el primer
caso de est e capt ulo calculbamos como est adst ico de cada muest ra, su media ( Y ), en est e caso para cada
muest ra calculamos el valor de X
2
, para el cual necesit amos calcular la varianza (o cuasi-varianza) muest ral
as como el valor de o en la poblacin. La dist ribucin de los valores de X
2
en t odas las muest ras posibles se
dist ribuir segn
2
1 n
_ Teniendo en cuent a est e modelo de probabilidad de la variable aleat oria as definida,
su media y desviacin t pica son, respect ivament e:
2
1 n
_



10 | P g i n a

) 1 ( 2
1
2
2
=
=
n
n
X
X
o


I gual que suceda ant es, la dist ribucin se aproxima a la dist ribucin normal a medida que
aument an sus grados de libert ad, por lo que se puede const ruir, de nuevo, una variable aleat oria t ipificada Z
que siga una dist ribucin normal t ipificada, y cuya expresin es:

=



=

) 1 ( 2
) 1 (
) 1 ( 2
) 1 (
) 1 (
2
2
2
2
1
2
2
2
n
n
S n
Z
n
n
S n
Z
X
Z
n
n
X
X
o
o
o


Ejemplo 1.3: Supongamos que la alt ura (en cent met ros) de los recin nacidos en Mj ico se dist ribuye
N(48,6). Si se selecciona una muest ra de 25 recin nacidos, cul es la probabilidad de que la
desviacin t pica de la muest ra t ome un valor inferior a 4,75 cent met ros?
Ut ilizando la desviacin t pica de la muest ra, el valor de la variable aleat oria es:
66 , 15
6
75 , 4 25
2
2
2
2
2
=

=
o
n
S n
X
que es un valor de una dist ribucin con 24 grados de libert ad. Si buscamos en la t abla de probabilidades
de la dist ribucin , se observa que el valor 15,6587 que aparece en la t abla (el ms aproximado a
nuest ro result ado) dej a por debaj o una probabilidad de 0,10. Por t ant o, la probabilidad de que una muest ra
de 25 recin nacidos t enga una desviacin t pica inferior a 4,75 cent met ros (o una varianza inferior a 4,75
2
)
es aproximadament e de 0,10.
1.4. La estadstica inferencial
Como se ha coment ado en la int roduccin de est e t ema, la inferencia est adst ica nos va permit ir
inferir los parmet ros de una, dos o ms poblaciones a part ir de la informacin recogida en las muest ras. Est a
inferencia o generalizacin de lo part icular a lo general, la vamos a realizar mediant e dos procedimient os
nt imament e relacionados: la estimacin de parmetros y el contraste de hiptesis. En ambos casos se
t rat a de generalizar la informacin obt enida en una muest ra a una poblacin. Con la est imacin t rat amos de
conocer el valor de uno o ms parmet ros correspondient es a una variable aleat oria poblacional, Y, a part ir
de los dat os recogidos en una muest ra. De forma alt ernat iva, los procedimient os para el cont rast e de
hipt esis (que son los ms ut ilizados en la experiment acin cient fica en el campo de las ciencias sociales y de
la salud), nos permit en t omar una decisin sobre un valor hipot t ico que se formula como parmet ro
poblacional. El procedimient o se lleva a cabo analizando si det erminadas caract erst icas que hipot t icament e
formulamos para definir la poblacin pueden ser ciert as a part ir de la informacin proporcionada por una
muest ra represent at iva de la misma.
2
_
2
_
2
24 . . g l
_


11 | P g i n a

Los procedimient os de cont rast e de hipt esis en los diseos de una, dos o ms muest ras que se
vern en est e curso se apoyan en el supuest o de que la muest ra se ha seleccionado mediant e muest reo
aleat orio simple. Para ello, se t ienen que cumplir dos condiciones: la muest ra t iene que seleccionarse por
algn procedimient o aleat orio y, en segundo lugar, t odos los element os de la poblacin t iene la misma
probabilidad de formar part e de la muest ra. De est a forma, una muest ra represent at iva es una reproduccin
a escala de la poblacin a la que pert enece respect o a la o las variables que t rat amos de est udiar. Por
ej emplo si en la poblacin de est udiant es de la UNED, el 60% son muj eres y de st as el 40% t ienen cargas
laborales frent e al 75% en los est udiant es varones y queremos est udiar cmo las variables sexo y cargas
laborales influyen en el rendimient o acadmico es necesario que la muest ra recoj a est e mismo repart o de
proporciones respect o al sexo y cargas laborales. De no cumplirse est a condicin, de los result ados
observados en la muest ra no se podran hacer ext rapolaciones vlidas a la poblacin general.
Aunque la est imacin por int ervalos y el cont rast e de hipt esis se t rat an a cont inuacin en epgrafes
separados, veremos que son procedimient os complement arios de forma que los int ervalos pueden aplicarse
para el cont rast e de hipt esis y el cont rast e de hipt esis es una t oma de decisin respect o al parmet ro
poblacional formulado.
1.4.1.- Estimacin de parmetros
Un est imador es un est adst ico calculado en una muest ra que se ut iliza para est imar un parmet ro
poblacional. Para cada parmet ro (v.g la media poblacional) pueden exist ir diferent es est imadores (v.g. la
media arit mt ica, la media cuadrt ica, la mediana, la moda). Para que un est imador realice buenas
est imaciones del parmet ro poblacional es preciso que t enga las cuat ro propiedades que de forma muy
resumida expondremos en las siguient es lneas. Para desvincular las propiedades de los est imadores de un
parmet ro concret o, designaremos de forma genrica con U al parmet ro poblacional, con U

a su valor
est imado y con u a cualquier est adst ico de la muest ra que puede ut ilizarse como est imador. Por ej emplo,
es el parmet ro media poblacional y su valor est imado. En est e caso concret o, el est imador que se ut iliza
para est imar la media poblacional es el est adst ico media arit mt ica de la muest ra, Y =

. Es import ant e
observar que, como hemos sealado al comienzo, podramos haber elegido ot ros est adst icos muest rales
como est imadores del parmet ro media poblacional (v.g., la mediana, por cit ar algn ot ro de t endencia
cent ral). La cuest in es cul de los posibles est imadores deberamos ut ilizar? Est o depender de la bondad
de los mismos. Por lo t ant o, es preciso saber qu hace que un est adst ico, u, sea un buen est imador del
parmet ro
3
.
Insesgado. Un buen est imador t iene que ser insesgado, lo cual supone que su valor esperado, E(u), o media
de su dist ribucin muest ral,
u
,debe coincidir con el parmet ro que est ima. La media muest ral, t al como
hemos vist o, es un est imador insesgado de la media poblacional, y lo mismo ocurre con la proporcin, la
cuasi-varianza muest ral y ot ros est adst icos que veremos a lo largo del curso. Sin embargo la varianza
muest ral es un est imador sesgado de la varianza poblacional ya que
2 2
) ( o =
n
S E (sin embargo, como
veremos ms adelant e,
2 2
1
) ( o =
n
S E por lo que la cuasivarianza muest ral es un est imador insesgado de la

3
Obsrvese que para denotar que un estadstico concreto es estimador de un parmetro, lo denotamos poniendo el
acento circunflejo sobre el parmetro a estimar. De esta forma, conceptualmente no es lo mismo la media como
estadstico de una muestra ( Y ) que la media muestral como estimador de la media poblacional, es decir, Y = .
Aunque numricamente valgan lo mismo, en el primer caso se la considera un simple ndice descriptivo mientras que en
el segundo se la considera un representante de la media poblacional y, adems, un buen representante ya que nos
sirve para inferir el valor desconocido.


12 | P g i n a

varianza poblacional). Expresado, pues, de manera formal diremos que u es un estimador insesgado de
U, si su valor esperado o media coincide con el parmetro: U
u
=

Eficiente o precisin. Adems de que un est imador coincida, en promedio, con su parmet ro, es bueno que
la dist ribucin del est imador t enga poca variabilidad para que, de est a forma, se alej e poco del parmet ro y
en consecuencia sea ms preciso. Por t ant o, ent re dos est imadores de un mismo parmet ro, es ms preciso
el que t enga varianza ms pequea.

Consistente. Como hemos vist o al t rat ar la dist ribucin muest ral, rarament e coincidirn los valores que el
est imador adopt a en muest ras concret as con el parmet ro debido a las fluct uaciones del muest reo. Si
pensamos en la dist ribucin muest ral de la media es fcil observar que al aument ar ms y ms el t amao de
la muest ra el est imador se va aproximando al parmet ro a la vez que su varianza t iende a cero. Con est a
idea, decimos que un est imador consist ent e es aquel que se concent ra en un rango cada vez ms est recho
alrededor de su parmet ro a medida que aument a el t amao de la muest ra. Tomando como referencia las
dos propiedades ant eriores, se puede afirmar que una de las condiciones que hace consist ent e un est imador
es que t ant o su sesgo como su varianza t iendan a cero a medida que aument a n.
Suficiencia. Un est imador es suficient e si al est imar el parmet ro ut iliza t oda la informacin de la muest ra
relacionada con el parmet ro. La media, la varianza y la proporcin son est imadores suficient es de sus
respect ivos parmet ros, porque en t odos ellos se ut iliza la informacin de t odos los element os de la muest ra.
No as la mediana que solo ut iliza en su clculo los valores cent rales de la dist ribucin.
Los est adst icos que hemos est udiado en cursos ant eriores, cuando se aplican a los valores de las
muest ras que ext raemos de la poblacin -y que habit ualment e se represent an con let ras del alfabet o lat ino-
son los est imadores que podemos ut ilizar para est imar los parmet ros poblacionales represent ados con
let ras del alfabet o griego- y los que mej or cumplen con est as condiciones se muest ran en la Tabla 1, de t al
forma que en cada lnea aparece el mej or est imador muest ral de cada parmet ro:
Estadsticos de la muestra Parmetros en la poblacin
Media: Y
Media:
Cuasi-varianza:
2
1 n
S Varianza:
2
o
Proporcin: P Proporcin: t
Correlacin:
XY
r Correlacin:
XY

Ecuacin de regresin: X b b Y + =
1 0
Ecuacin de regresin: X Y + =
1 0
| |
Tabla 1
Considerando est as propiedades que deben t ener los (buenos) est imadores, la est imacin de
parmet ros se realiza siguiendo dos procedimient os: la est imacin punt ual y la est imacin por int ervalos.
La estimacin puntual consist e en ut ilizar el valor del est adst ico calculado en la muest ra como valor del
parmet ro que se desea est imar. Mediant e est e mt odo se ut iliza el est adst ico obt enido en la muest ra y se
at ribuye t al cual como parmet ro de la poblacin.
Sin embargo es poco probable que el valor del est adst ico calculado en la muest ra concret a coincida
exact ament e con el verdadero valor del parmet ro y por ello es ms int eresant e const ruir alrededor del
est adst ico de la muest ra un int ervalo, definido por su lmit e inferior y superior, que t enga en cuent a la
precisin del est imador (su error t pico) de forma que nos asegure, con una ciert a probabilidad que el
verdadero valor del parmet ro se encuent ra en esa franj a de valores. A est e mt odo se le conoce como el
clculo de los intervalos de confianza en el mbit o de la est adst ica inferencial.


13 | P g i n a

Por ej emplo, suponga que deseamos conocer el t iempo medio semanal que los est udiant es de
psicologa de la UNED dedican al est udio de una det erminada asignat ura. Mediant e una encuest a realizada a
una muest ra represent at iva se obt iene una media de 6h/ semanales. Est e valor sera la est imacin punt ual
para la media de t odos los est udiant es. En ot ro caso, y mediant e procedimient os que veremos ms adelant e
podremos det erminar que el t iempo medio que dedican los est udiant es al est udio es un valor comprendido
ent re 4,7h/ semanales y 7,3 h/ semanales con una probabilidad del 95%. Para llegar a est os result ados
habremos ut ilizado los dat os obt enidos en la muest ra que ha sido encuest ada y del conocimient o de las
dist ribuciones muest rales de los est adst icos, con el doble obj et ivo t ant o de asignar un valor del est adst ico en
la muest ra que ext raemos de la poblacin, como est imacin punt ual de su parmet ro, como para la
est imacin por int ervalos.
1.4.1.1- Intervalo de confianza para la media
Para el clculo del int ervalo de confianza de la media hay que considerar las circunst ancias baj o la
cuales la dist ribucin muest ral de la media es una dist ribucin normal o una dist ribucin t de St udent con n-1
grados de libert ad. Para ilust rar el procedimient o nos apoyaremos en varios ej emplos dist inguiendo, por
t ant o, las siguient es t res sit uaciones:
1.- Distribucin poblacional normal y varianza poblacional conocida
2
o . En est as circunst ancias
sabemos que la dist ribucin muest ral de la media es normal con media , y error t pico igual a la desviacin
t pica poblacional dividida por la raz de n: .
Se t rat a, por t ant o, de det erminar dos valores que definen un int ervalo dent ro del cual est imamos
que se encont rar la media poblacional, p, con una det erminada probabilidad, que represent amos por 1 -o,
y se denomina nivel de confianza. Teniendo en cuent a las propiedades de la dist ribucin normal, si fij amos
un nivel de confianza del 95 , 0 1 = o o del 95%, sabemos que a 1,96 desviaciones t picas a izquierda y
derecha de la media de la dist ribucin muest ral, =
Y
, se encuent ra el 95% de las medias de cualquier
muest ra, como se muest ra en la Figura 1.4.

, N
n
o

| |
|
\ .


14 | P g i n a

Figura 1.4. Dist ribucin muest ral de medias con int ervalo del 95% alrededor del valor esperado
Es decir, en 95 de cada 100 muest ras su media se encont rar dent ro del int ervalo
) 96 . 1 , 96 . 1 (
n n
o

o
+ . Expresado formalment e el int ervalo alrededor del parmet ro, con un nivel de
confianza del 95% (0,95) es:
95 . 0 96 . 1 96 . 1 = |
.
|

\
|
+ s s
n
Y
n
P
o

o

Resolviendo est a desigualdad se llega a la siguient e expresin que afirma que la probabilidad de que
en un int ervalo const ruido alrededor de la media de una muest ra se encuent ra el parmet ro de la
poblacin con una probabilidad del 0,95 se calcula segn:
95 . 0 96 . 1 96 . 1 = |
.
|

\
|
+ s s
n
Y
n
Y P
o

o

En general, el int ervalo de confianza para la media poblacional, est imado a part ir de la media de la
muest ra y con un nivel de confianza de o 1 , es:
o o o
o o
= + s s

1 ) (
2
1
2
y y
Z Y Z Y P

Siendo el error t pico de la media:

n
Y
o
o =
Efect ivament e, la Figura 1.4 es la represent acin de las medias de t odas las muest ras de t amao n
que se pueden ext raer de una poblacin. De t odas est as muest ras, en el 95% de ellas su media se encont rar
de la zona cent ral delimit ada por los valores:
n
o
96 . 1 y
n
o
96 . 1 + y slo un 5% est arn fuera de
ese zona. Por lo t ant o, part iendo de la media de muest ra que se encuent re dent ro de la zona cent ral -aunque
no necesariament e en la media poblacional ya que vara de una muest ra a ot ra- const ruimos un int ervalo con
la misma amplit ud que t endr una probabilidad del 95% de cont ener la media poblacional. Si part imos de la
media de una muest ra que se encuent ra fuera de la zona cent ral del 95%, el int ervalo de confianza que
const ruyamos sobre ella no podr incluir ent re sus valores a la media de la poblacin. Est o lt imo suceder,
en promedio, en 5 de cada 100 muest ras que ext raigamos de la poblacin. La represent acin grfica de lo
que acabamos de explicar se puede ver en la Figura 1.5.


15 | P g i n a


Figura 1.5. I nt ervalo de confianza de la media con un NC del 95%
2.- Varianza poblacional desconocida en muestras pequeas. En la prct ica est adst ica no es
frecuent e que se conozca la varianza poblacional. Lo habit ual es desconocer t al dat o que t endremos que
est imar a part ir de la varianza o cuasi-varianza de la muest ra como un est imador de la varianza poblacional.
En est as circunst ancias la dist ribucin muest ral de la media es la dist ribucin t de St udent y, por t ant o, el
int ervalo de confianza para la media poblacional, est imado a part ir de la media de la muest ra, Y , y con un
nivel de confianza de o 1 es:
o o o
o o
= + s s

1 ) (
2
1
2
Y Y
t Y t Y P

donde los valores de t son los que dej an un int ervalo cent ral correspondient e a una probabilidad de
95 , 0 1 = o .
En est as circunst ancias, es decir, cuando la varianza poblacional es desconocida, hay que est imarla a
part ir de su est imador (sesgado o insesgado) por lo que el error t pico de la media, es:
1
1

= =

n
S
n
S
n n
Y
o
Segn se ut ilice la cuasi-desviacin t pica de la muest ra (su est imador insesgado), en el primer caso,
o la desviacin t pica de la muest ra (est imador sesgado) en el segundo caso.
3.- Varianza poblacional desconocida en muestras grandes. El razonamient o es similar al ant erior,
pero conociendo las propiedades de la dist ribucin t de St udent , sabemos que si el t amao de la muest ra es
grande la dist ribucin t se aproxima a la normal. Aunque muchos aut ores consideran que a part ir de 30 g.l la
aproximacin de la dist ribucin t a la normal es bast ant e buena, la t abla de la dist ribucin t que ut ilizamos en
est e curso recoge hast a 100 grados de libert ad. Para valores mayores que est e las diferencias ent re los
valores Z y t son prct icament e despreciables.
Ejemplo 1.4. En un experiment o sobre at encin, un psiclogo present a durant e 300 mseg un grupo de 16
let ras del alfabet o (con una disposicin de 4 filas y 4 columnas). Cada uno de los 12 suj et os que part icipan
en el experiment o debe verbalizar t ant as let ras como recuerde de cada present acin est imular. El promedio
de let ras bien recordadas es de 7 y la desviacin t pica insesgada (cuasi-desviacin t pica) es de 1,3. Ent re


16 | P g i n a

qu lmit es se encont rar el verdadero promedio de palabras bien recordadas, con una probabilidad de 0,95?
Se desconoce la varianza poblacional y, adems, la muest ra es pequea, por lo que la dist ribucin de
referencia es la t de St udent . En la dist ribucin t de St udent con 11 gl, (Figura 1.6) buscamos los valores que
dej an en la zona cent ral una probabilidad de 0,95. Est os valores son -2,201 y + 2,201 que se incluyen en la
expresin general:

o o o
o o
= + s s

1 ) (
2
1
2
Y Y
t Y t Y P

95 , 0 )
12
3 , 1
201 , 2 7
12
3 , 1
201 , 2 7 ( = + s s P
95 , 0 ) 826 , 7 174 , 6 ( = s s P

Figura 1.6. I nt ervalo de confianza de la media en la dist ribucin t
La int erpret acin correct a del int ervalo de confianza es que dent ro de l se encont rar, o no, el
verdadero valor del parmet ro, pero nos permit e afirmar que si repit isemos el proceso con muchas muest ras
del mismo t ipo y t amao, el )% 1 ( o de los int ervalos as const ruidos cont endr al verdadero valor del
parmet ro (promedio de palabras recordadas en la poblacin). Y est a int erpret acin es la que hay que
mant ener para t odo int ervalo de confianza de cualquier ot ro parmet ro poblacional que vayamos a est imar,
no cayendo en el error de int erpret arlo en el sent ido de que el )% 1 ( o de las personas en est e ej emplo,
el 95% de las personas- t ienen un promedio de palabras recordadas comprendido ent re 6,17 y 7,82.
1.4.1.2. Intervalo de confianza para la proporcin
Sabemos que la dist ribucin muest ral de la proporcin es una dist ribucin binomial que se aproxima a
la normal cuando se ut ilizan muest ras grandes. Baj o est as condiciones, la dist ribucin muest ral de la
proporcin es normal con media y error t pico iguales a:
t =
p

n
p
) 1 ( t t
o

=
Como la proporcin poblacional, t , es un valor desconocido hay que est imarlo a part ir de su est imador
insesgado, la proporcin muest ral, p, y el error t pico de la dist ribucin muest ral de la proporcin queda de la
siguient e forma:
n
p p
n
p
) 1 ( ) 1 (
=

=
t t
o


17 | P g i n a

Teniendo en cuent a las propiedades de la dist ribucin normal, si fij amos un nivel de confianza del o 1 y
siguiendo el mismo razonamient o ut ilizado para el caso de la media, part imos de la siguient e expresin:
o o t o t
o o
= + s s

1 ) (
2
1
2
P P
Z p Z P
Resolviendo est a desigualdad se llega a la siguient e expresin que afirma que la probabilidad de que en un
int ervalo de confianza const ruido alrededor de la proporcin de una muest ra se encuent ra el parmet ro de la
poblacin es de o 1 .
o o t o
o o
= + s s

1 ) (
2
1
2
P P
Z p Z p P
O de forma ms desarrollada:

o t
o o
=
|
|
.
|

\
|

+ s s



1
) 1 ( ) 1 (
2
1
2 n
p p
Z p
n
p p
Z p P

Ejemplo 1.5: Para dej ar const ancia real de las preferencias de los padres sobre la lengua vehicular en la
que prefieren que se eduque a sus hij os, una det erminada asociacin de padres realiza una encuest a sobre
una muest ra de 800 familias resident es en una det erminada aut onoma bilinge, encont rando que 280
familias son part idarios de que t odas de las asignat uras se enseen en Cast ellano. Con un nivel de confianza
del 95% ent re que valores se encont rar la proporcin de padres que en esa Comunidad son part idarios de
que t odas las asignat uras se impart an en Cast ellano?
La proporcin de familias part idarias de la enseanza en Cast ellano obt enida en la muest ra es
p= 280/ 800 = 0,35. Al t rat arse de una muest ra grande, la dist ribucin binomial se aproxima a la normal.
Buscamos en la t abla de la dist ribucin normal los valores Z que dej an una probabilidad cent ral del 95% y son
-1,96 y + 1,96 (Figura 1.7) y aplicamos la siguient e expresin:
I
n]
= p -Zu
2
,
. _
p.(1-p)
n
= u,SS -1,96. _
0,35.0,65
800
= u,S17
I
sup
= p +Z
1-
u
2
,
.
_
p. (1 -p)
n
= u,SS +1,96.
_
u,SS.u,6S
8uu
= u,S8S


18 | P g i n a


Figura 1.7. I nt ervalo de confianza de la proporcin sobre una dist ribucin normal.
En consecuencia, podemos decir que la proporcin poblacional, t , es un valor comprendido ent re
0,317 (31,7%) y 0,383 (38,3%) con una probabilidad, o nivel de confianza, del 95% (Figura 1.7).
1.4.1.3. Intervalo de confianza para la varianza
Cuando t rat amos la dist ribucin muest ral de la varianza vimos que la variable aleat oria
se dist ribua segn con n-1 g.l., cuya forma genrica se puede ver en la Figura 1.8.

Figura 1.8. Dist ribucin con n-1 grados de libert ad

En la Figura 1.8 se represent a grficament e el hecho de que la probabilidad de que un valor de esa variable
aleat oria, t omado al azar, se encuent re en la zona no marcada vale 1- o. Es decir:
( )
2 2
1
2 2
1
n n
n S nS
o o

=
2



19 | P g i n a

o _
o
_
o o
=
|
|
.
|

\
|
s

1
2
1
2
1
2
2
2
1
2
n
n
n
S n
P
Resolviendo las desigualdades, y despej ando la varianza poblacional o
2
, se llega a la siguient e expresin:
o
_
o
_
o o
=
|
|
|
.
|

\
|

> >

1
2
1
2
1
2
2
2
1
2
2
n
n
n
n
S n S n
P
De aqu se sigue que los lmit es del int ervalo de confianza para la varianza poblacional son:
2
1
2
1
2
inf

=
n
n
S n
l
_
o

2
1
2
2

=
n
n
Sup
S n
l
_
o

Con las pert inent es modificaciones, se puede usar t ambin la varianza insesgada (cuasi-varianza) siendo en
est e caso los lmit es inferior y superior los siguient es:
2
1
2
1
2
1
inf
) 1 (


=
n
n
S n
l
_
o

2
1
2
2
1
) 1 (


=
n
n
Sup
S n
l
_
o

Cuando el t amao de la muest ra est por encima de 100 suj et os, la dist ribucin muest ral de la varianza se
puede aproximar a la normal, siendo los lmit es en est e caso:
n
S Z S l
2
2
2
2
inf
=
o

n
S Z S l
Sup
2
2
2
1
2
+ =

o

Ejemplo 1.6: Un grupo de 30 alumnos de enseanza secundaria seleccionados al azar en una det erminada
Comunidad realizan un t est de comprensin verbal de su lengua aut noma. Las punt uaciones obt enidas se
dist ribuyen normalment e con media 120 y varianza 36. Con una probabilidad de 090, ent re que valores se
encont rar la varianza en comprensin verbal de t odos los alumnos de secundaria de esa Comunidad?
Buscamos en la t abla de la dist ribucin chi-cuadrado y con n-1= 29 grados de libert ad, los dos valores de la
variable chi-cuadrado que dej an una probabilidad de 0,90 cent ral. Est os valores son 17,708 y 42,557 t al y
como se represent an en la Figura 1.9.


20 | P g i n a


Figura 1.9. Dist ribucin chi-cuadrado con 29 g.l y valores que delimit an una probabilidad de 0,90 cent ral
37 , 25
56 , 42
36 30
2
1
2
1
2
inf
=

n
n
S n
l
_
o
98 , 60
71 , 17
36 30
2
1
2
2
=

=
n
n
Sup
S n
l
_
o

Al mismo result ado llegaramos ut ilizando la cuasi-varianza de la muest ra. En est e ej emplo, la varianza es 36
por lo que la cuasi-varianza vale:
24 , 37
29
36 30
1
2
2
1
=

n
S n
S
n
n

Y los lmit es son:

37 , 25
56 , 42
24 , 37 29 ) 1 (
2
1
2
1
2
1
inf
=

=

=

n
n
S n
l
_
o
98 , 60
71 , 17
24 , 37 29 ) 1 (
2
1
2
2
1
=

=

=

n
n
Sup
S n
l
_
o

1.4.2.- Amplitud del intervalo de confianza y su relacin con el tamao muestral
La amplit ud de un int ervalo de confianza depende de dos fact ores: el nivel de confianza y el error t pico
de la dist ribucin muest ral del est adst ico. Est e segundo fact or est en proporcin inversa al t amao de la
muest ra, de t al forma que cuant o mayor es el t amao de la muest ra, menor es el error t pico del est adst ico.
Est a relacin es fundament al, pues permit e dar al int ervalo de confianza el grado de precisin que se desee.
Para que el lect or vea el proceso, vamos a ej emplificarlo con la media. El error t pico de est e est imador,
cuando se desconoce la varianza poblacional, es , y para obt ener el error mximo de est imacin se
mult iplica por el valor de la dist ribucin t de St udent (o la Z de la dist ribucin normal si el t amao muest ral es
elevado) correspondient e al nivel de confianza que se haya est ipulado. Es decir, la dist ancia desde la media
muest ral a cualquiera de los lmit es, que vamos a llamar error mximo de estimacin y lo designamos con
E es:
n-1
S
n


21 | P g i n a

,
Si despej amos el t amao de la muest ra, n, y lo ponemos en funcin del rest o de element os el result ado es:
Si el t amao de la muest ra es grande, ent onces la dist ribucin muest ral de referencia es la normal y la
expresin ant erior se t ransforma en:
Siguiendo un razonamient o similar, en el Cuadro 1.1 se resume el clculo del t amao de la muest ra para los
t res est adst icos bsicos: media, varianza y proporcin en funcin del nivel de confianza y del error mximo
de est imacin, E, que se quiera fij ar.
Cuadro 1.1. Calculo del t amao de la muest ra en funcin de la precisin de la est imacin
Media
Varianza poblacional conocida
Varianza poblacional desconocida y muest ra grande
Varianza poblacional desconocida y muest ra
pequeas
Varianza
Error t pico calculado para t amaos muest rales
grandes
n = 2S
n-1
4
Zu
2
,
2
E
2

Proporcin
Error t pico calculado para t amaos muest rales
grandes
2
2
2 /
) 1 (
E
Z
p p n
o
=
Veamos la aplicacin con un sencillo ej emplo:
Ejemplo 1.7.Se desea calcular el t amao de la muest ra que se requiere ut ilizar en una encuest a elect oral
de manera que la precisin en la proporcin de vot o est imada, o error mximo de est imacin, con un nivel
de confianza del 95%, sea de 0,02.
n-1
2 n-1
S
E = t
n
( )
2
2 n-1
2
n-1
2
t
n = S
E
2
2 2
n-1
2
z
n = S
E
o
2
2 2
2
z
n =
E
o
o
2
2 2
n-1 2
z
n = S
E
o
( )
2
2 n-1
2
n-1 2
t
n = S
E


22 | P g i n a

Sit undonos en la sit uacin ms desfavorable respect o del error t pico de la proporcin
4
, se t iene que
p = 1-p = 0,5. De acuerdo con est o, t endremos:

Con est e nmero de suj et os, el invest igador se asegura de que la amplit ud del int ervalo de confianza
ser 0,04 (cuat ro punt os porcent uales) con un nivel de confianza del 95%.
Si la precisin de la est imacin fuera de 0,01 ent onces el t amao de la muest ra pasara a ser de
9604 suj et os.
1.4.3. Contraste de hiptesis
Una hipt esis est adst ica es una conj et ura que se formula sobre una poblacin y que puede somet erse
a prueba, o cont rast acin emprica, a part ir de la informacin proporcionada por una muest ra represent at iva
de esa poblacin. Una vez que la hipt esis se ha contrast ado con los dat os de la muest ra es el moment o de
t omar alguna decisin respect o a su result ado. El cont rast e de hipt esis es, pues, una part e esencial del
mt odo cient fico.
En general, siempre se part e de algn int errogant e que se plant ea en el mbit o de una invest igacin, a
la luz de un det erminado marco t erico, y debera formularse de una manera sencilla y clara: vot an las
muj eres en mayor proporcin a part idos de cent ro izquierda que a los de cent ro derecha?; en el proceso de
t rabaj o manual es ms eficaz verbalizar las acciones durant e la t area que hacerlas en silencio?; es ms
eficaz una t erapia A que ot ra B para el t rat amient o de la fobia de los nios a mont ar en ascensores?; los
salarios de hombres y muj eres son iguales por un mismo t rabaj o?
Una vez plant eada la cuest in, hay que buscar una solucin que adopt e la forma de afirmacin
empricament e verificable, es decir, debemos ser capaces de operat ivizar nuest ras pregunt as para que t engan
ent idad de hipt esis cient ficas. La mej or manera de hacerlo es plant earla en t rminos est adst icos; est o
significa que las afirmaciones que se realicen est n relacionadas de alguna manera con una o ms
dist ribuciones de probabilidad. Por ej emplo, el salt o ent re una hipt esis cient fica como los salarios de
hombres y muj eres son iguales por un mismo t rabaj o? , se puede sust anciar como hipt esis est adst ica
pregunt ando: Es igual la media de salario de hombres y muj eres para un mismo t rabaj o? ; o t ambin se
podra pregunt ar en t rminos de ot ro est adst ico t al como la Mediana, o en t rminos de una funcin de
dist ribucin. Es decir, una hipt esis cient fica se pueden plant ear con diferent es hipt esis est adst icas, las
cuales, al cont rast arse dan respuest a a dicha hipt esis cient fica.
Las hiptesis estadsticas plant eadas para dar respuest a a la hipt esis cient fica son: la hiptesis
nula y la hiptesis alternativa. La hipt esis nula se represent a por E
0
, y puede cont ener afirmaciones
como las siguient es:

Hiptesis Hiptesis estadstica. Hiptesis Nula

4
Si observa la frmula del error tpico de la distribucin muestral de la proporcin deducir que alcanzar su valor
mximo cuando p=q=0,5
2
2
1, 96
n = 0,5 0, 5 2401
0,02
=


23 | P g i n a

La media de salario de hombres y mujeres
para un mismo trabajo son iguales
MUJERES HOMBRES
H = :
0

La proporcin de mujeres que votan a partidos
de centro-izquierda es del 60%.
6 , 0 :
0
= t H
La varianza, respecto a un valor previo
establecido, es al menos de 12 puntos?
12 :
2
0
> o H
Las puntuaciones de un test de razonamiento
numrico tienen distribucin normal con
media 50 y desviacin tpica 5.
H
0
: la variable Y t iene dist ribucin normal N(50,5).
En general, la hipt esis nula afirma que no exist e diferencia ent re el valor del est adst ico obt enido en
la muest ra y el que formulamos como parmet ro poblacional o, en ot ras palabras, que la diferencia observada
ent re est os dos valores es nula. Como la realidad es que est os valores casi nunca van a coincidir, lo que
est amos afirmando es que la diferencia observada puede explicarse como result ado del azar. De ot ra forma,
si se repit iese la invest igacin un nmero suficient e de veces con diferent es muest ras del mismo t ipo y
t amao ext radas aleat oriament e de la misma poblacin, las diferencias observadas ent re est os el est adst ico
y el formulado en la hipt esis nula como parmet ro poblacional, seran unas veces grandes, ot ras pequeas,
unas posit ivas, ot ras negat ivas, pero en conj unt o t enderan a neut ralizarse para finalment e ser cero.
Para cada hipt esis nula plant eada, es preciso plant ear ot ra, denominada hiptesis alternativa,
represent ada por H
1
, y que es la negacin de la hipt esis nula, de t al forma que si la hipt esis nula es falsa la
hipt esis alt ernat iva t iene que ser verdadera o viceversa. Por t ant o, est as dos hipt esis t ienen que ser
exhaust ivas y mut uament e excluyent es. Para el conj unt o de hipt esis nulas ant eriores, las alt ernat ivas seran:
Hiptesis cientfica Hiptesis estadstica. Hiptesis Nula
La media de salario de hombres y mujeres
para un mismo trabajo NO son iguales
MUJERES HOMBRES
H = :
1

La proporcin de mujeres que votan a partidos
de centro-izquierda NO es del 60%.
6 , 0 :
1
= t H
La varianza respecto al valor anterior
establecido es menor de 12 puntos?
12 :
2
1
< o H
Las puntuaciones de un test de razonamiento
numrico NO tienen distribucin normal con
media 50 y desviacin tpica 5.
H
0
: la variable Y NO t iene dist ribucin normal
N(50,5).
Dependiendo de cmo est formulada la hipt esis nula se marca la direccin del contraste. Si, por
ej emplo, la H
0
est plant eada como igualdad de las medias de hombres y muj eres, mient ras que la alt ernat iva
es simplement e su negacin (las medias no son iguales) se dice que es un contraste bilateral porque H
1

admit e que la diferencia pueda ser favorable a los hombres (un ext remo de las posibles punt uaciones con
respect o a la igualdad) o a las muj eres (el ext remo cont rario) Si, por el cont rario, conocemos la direccin en
que H
0
puede ser falsa, como por ej emplo en la hipt esis 12 :
2
0
> o H , o, en general, cuando en la
invest igacin se plant ea que un mt odo de aprendizaj e, un frmaco, un det erminado proceso indust rial, et c.
t iene efect o posit ivo (o negat ivo) sobre lo que est amos est udiando, ent onces t enemos un contraste
unilateral en la medida en que indicamos la direccin esperada segn H
1
de ese efect o. I gualment e en est os
casos, para una hipt esis alt ernat iva El mt odo A, favorece el aprendizaj e , la hipt esis nula, su negacin,
sera: El mt odo A no favorece el aprendizaj e .


24 | P g i n a

En cualquier caso las hipt esis nula y alt ernat iva son exhaust ivas y mut uament e excluyent es, de t al
forma que la negacin de una conlleva la confirmacin de la ot ra.
Una vez que se ha plant eado la hipt esis, es preciso definir lo que se conoce como medida de la
discrepancia y que, en general, cuando se t rat a de hacer cont rast es sobre parmet ros poblacionales, es una
medida est andarizada dent ro de alguna dist ribucin de probabilidad, a semej anza de las vist as en los
epgrafes de dist ribuciones muest rales. La medida de discrepancia no depende de las unidades en que est
medida la variable y su formulacin habit ual es:
Adems de definir la discrepancia es preciso considerar qu cant idad de st a consideramos admisible
para no ser at ribuible al azar. Es decir, debemos det erminar, a priori, cul ser la diferencia mxima ent re el
est imador y el parmet ro que est amos dispuest os a considerar compat ible con la H
0
, y est a decisin
depender t ant o de la dist ribucin de probabilidad de la medida de discrepancia como de la direccin del
cont rast e, como del riesgo que est amos dispuest os a asumir.
Como veremos en prximos apart ados, est e valor de la discrepancia se est ablece, t ambin, en
t rminos de probabilidad de obt ener una diferencia ent re el est adst ico obt enido en la muest ra y el parmet ro
formulado en la hipt esis igual o mayor que la observada. Est a probabilidad es la que se conoce como nivel
crtico p, y en la mayor part e de las invest igaciones se rechazar H
0
si est e valor es menor de 0,05 o 0,01.
1.4.3.1 Metodologa clsica del contraste de hiptesis
La met odologa del cont rast e es frut o de los t rabaj os de Fisher, Neyman y Pearson y su lgica
recuerda a la de un j uicio en un est ado de derecho, en el cual el acusado siempre es inocent e (la hipt esis
nula) hast a que las pruebas no demuest ren lo cont rario (la hipt esis alt ernat iva). En los cont rast es de
hipt esis las pruebas son las evidencias recogidas en los dat os muest rales provenient es de una invest igacin
bien diseada
5
y se part e de que la hipt esis nula es verdadera (presuncin de inocencia). Si los dat os
aport an result ados significat ivament e diferent es de los plant eados en la hipt esis nula, st a es rechazada, y
en caso cont rario, no podremos hacerlo por no t ener evidencias cont ra ella, de modo que la mant endremos
como provisionalment e verdadera hast a que se encuent ren nuevas evidencias.
Los procedimient os para el clculo de int ervalos de confianza -y buena part e de los cont rast es de
hipt esis que veremos en los siguient es t emas- se basan en una serie de supuest os (v.gr., que la muest ra
procede de una poblacin de punt uaciones que se dist ribuyen segn una funcin de dist ribucin poblacional
conocida, como la curva normal, o sobre el nivel de medida de la variable, et c). Est os procedimient os y ot ros
que no se han present ado t odava (ANOVA, regresin mlt iple, et c.), se engloban en lo que se conoce como
mtodos paramtricos cuya denominacin procede de la bsqueda de los parmet ros subyacent es a
unos dat os asumiendo que st os se dist ribuyen segn una funcin de dist ribucin poblacional concret a. Todos
las pruebas paramt ricos asumen una det erminada forma (normal, binomial, F, et c.) para la dist ribucin

5
Tratado en la asignatura de Fundamentos de Investigacin


25 | P g i n a

poblacional de los dat os observados en la muest ra. Pero a veces nos encont ramos con sit uaciones en las que
no podemos asumir los supuest os subyacent es a las pruebas paramt ricos y necesit amos procedimient os
cuya validez no dependa de esos supuest os. En est e caso se nos hace necesario acudir a ot ro conj unt o de
t cnicas que no exij an est os supuest os t an rest rict ivos. Por cont raposicin a los ant eriores mt odos, se los
conoce como mtodos no paramtricos . Los cont rast es de hipt esis no paramt ricos se realizan con
dat os procedent es de una poblacin en la que la variable de est udio no t iene una dist ribucin de probabilidad
conocida.
Teniendo en consideracin est a primera dist incin ent re las pruebas paramt ricas y no paramt ricas
que se aplicarn en t odo cont rast e, las et apas de un cont rast e de hipt esis las vamos a resumir en los
siguient es punt os:
1.- Condiciones de la investigacin y supuestos que cumplen los datos observados. A lo largo de
est e curso veremos que al disear cualquier invest igacin se puede t rabaj ar con una, dos, t res o ms
muest ras, las cuales pueden ser independient es o relacionadas, seleccionadas por muest reo aleat orio o no y
en las que se recoge informacin sobre una o ms variables medidas con la misma o con diferent es escalas
de medida (nominal, ordinal, de int ervalo o de razn). Por ot ra part e, est os dat os pueden provenir de
poblaciones en las que la variable de est udio t iene una dist ribucin de probabilidad conocida o desconocida.
Todas est as caract erst icas t ant o del diseo como de los dat os condicionan t ant o la hipt esis que se puede
somet er a cont rast acin emprica como el procedimient o de anlisis de dat os ms adecuado para somet er a
cont rast acin emprica la hipt esis.
2.- Formulacin de la hiptesis nula y de la alternativa. Conforme al cont ext o de la invest igacin se
formulan las hipt esis nula y alt ernat iva, de las cuales se deriva un cont rast e bilat eral o unilat eral en funcin
de sus obj et ivos. Por lo general la hipt esis cient fica, dirigida a encont rar result ados significat ivos, es la
hipt esis alt ernat iva que se acept ar como verdadera si la invest igacin aport a evidencias cont ra la hipt esis
nula que es la que se somet e a cont rast acin emprica.
3.- Estadstico de contraste. Represent a una medida de la discrepancia ent re la informacin
proporcionada por los dat os empricos recogidos en la muest ra y la proposicin t erica plant eada en la
hipt esis nula. Est a medida es una variable aleat oria con una det erminada dist ribucin de probabilidad
(normal, t , chi-cuadrado, et c.) que va a aport ar informacin emprica sobre la afirmacin formulada en H
0

4.- Regla de decisin. Una vez calculado el est adst ico de cont rast e o discrepancia ent re los dat os
empricos observados en la muest ra y los dat os t ericos que plant eamos en la hipt esis nula queda t omar una
decisin respect o al rechazo o no de la hipt esis nula. Para ello, el invest igador est ablece previament e el
nivel de significacin,

o . Segn Fisher, el nivel de significacin, o , represent a el mximo riesgo que el
invest igador est dispuest o a comet er de t omar la decisin errnea de rechazar una hipt esis nula verdadera.
Por t ant o, a la luz de sus result ados y del est adst ico de cont rast e, el invest igador calcula la probabilidad de
obt ener unos result ados como los observados en la muest ra o ms ext remos. Est a probabilidad recibe el
nombre de nivel crtico p. Si el nivel crt ico p es muy pequeo en comparacin con el nivel de significacin,
o , rechazamos la H
0
y en caso cont rario la mant enemos.

El nivel de significacin que suele ut ilizarse en la mayora de las invest igaciones es del 0.05, aunque
en invest igaciones ms rigurosas se t rabaj a con un nivel de significacin de 0.01. En cualquiera de los casos,
se rechazara la hipt esis nula siempre que la probabilidad de explicar los result ados obt enidos en relacin a
la hipt esis nula sea menor que el nivel de significacin.
Ot ra alt ernat iva a la hora de t omar la decisin de rechazar o no la hipt esis nula consist e en fij ar el
nivel de significacin o , por lo que aut omt icament e se fij a el valor o valores crticos de la dist ribucin
muest ral que marcarn la mxima diferencia que podemos admit ir, por simple azar, ent re el valor t erico


26 | P g i n a

plant eado en H
0
y el valor obt enido en la muest ra. Est e valor, o valores crt icos, definen -en la dist ribucin
muest ral del est adst ico de cont rast e- los lmit es ent re la zona de rechazo o no de la H
0
.
La zona de rechazo depende del nivel de significacin, o , y es el rea de la dist ribucin muest ral
que corresponde a un valor de la discrepancia t an alej ado de H
0
que la probabilidad de que se produzca es
muy baj a, si efect ivament e H
0
es verdadera. En ot ras palabras, es aquella zona de la dist ribucin muest ral
const it uida por el conj unt o de muest ras para las cuales se rechaza la hipt esis nula .
La regin de no rechazo, complement aria a la ant erior, depende del nivel de confianza, o 1 , y es
el rea de la dist ribucin muest ral que corresponde a valores pequeos de la discrepancia t an poco alej ados
del valor formulado en la H
0
que la probabilidad de que se produzca es alt a si efect ivament e la H
0
es
verdadera, por lo que no represent a evidencia suficient e para rechazarla. En ot ras palabras, es aquella zona
de la dist ribucin muest ral const it uida por el conj unt o de muest ras para las cuales se mant iene la hipt esis
nula .
Por t ant o, el valor o valores crt icos corresponden a la mxima diferencia que cabe esperar por simple
azar ent re los dat os empricos obt enidos en la muest ra y los dat os t ericos que formulamos para la poblacin,
de t al forma que si el est adst ico de cont rast e se sit a en la zona de NO rechazo, podemos concluir que la
diferencia observada no es significat iva y se debe a los errores aleat orios por lo que no podemos rechazar la
hipt esis nula con un det erminado nivel de confianza.
De forma similar si el est adst ico de cont rast e alcanza la zona de rechazo indicara que la diferencia
observada ent re los dat os empricos y los dat os t ericos es muy poco probable que pueda at ribuirse a errores
aleat orias y concluimos que la diferencia observada es significat iva, lo que nos lleva a rechazar la hipt esis
nula con un det erminado nivel de confianza.
En general y con independencia de la forma de la funcin de dist ribucin del est adst ico de cont rast e,
si el cont rast e es bilat eral t endremos t res zonas delimit adas por los dos valores crt icos que se sit an en el ej e
horizont al de la dist ribucin muest ral como las esquemat izadas en el siguient e grfico:

Si el cont rast e es unilat eral izquierdo solo t endremos dos zonas, siendo la regin de rechazo la
sit uada en la part e izquierda de la dist ribucin, como se represent a en el siguient e grfico esquemt ico:

0
H
0
H


27 | P g i n a

De forma similar, si el cont rast e es unilat eral derecho, la regin de rechazo se sit uar en la part e
derecha de la dist ribucin muest ral como se represent a en el siguient e grfico esquemt ico:

En cualquier caso, ya sea comparando el est adst ico de cont rast e con el valor crt ico o comparando el
nivel crt ico p con el nivel de significacin o , la decisin que se t oma respect o a la H
0
es la misma. Puest o
que no hay verdades absolut as y siempre exist e un riesgo de error, formalment e la hipt esis nula NUNCA se
acept a, sino que la est rat egia de la invest igacin es buscar evidencias para rechazarla.
5.- Conclusin. Formulada la hipt esis nula, que es la que somet emos a cont rast acin emprica asumiendo
que es provisionalment e verdadera y una vez calculado el est adst ico de cont rast e, se concluye rechazando o
no la hipt esis nula (no hay un punt o int ermedio
6
). Si no t enemos evidencia suficient e para rechazarla, se
est sealando que la hipt esis se mant iene porque es compat ible con la evidencia muest ral (el acusado en el
j uicio es inocent e), y si se rechaza se quiere significar que la evidencia muest ral no avala la hipt esis (las
pruebas est n en cont ra del acusado) y por t ant o se rechaza.
6.- Interpretacin. La conclusin simple y llana en t rminos de rechazo o no de la hipt esis nula t iene su
correspondient e int erpret acin dent ro del cont ext o de la invest igacin y de la hipt esis y obj et ivos que el
invest igador formula en su t rabaj o.
I lust remos est e razonamient o con un sencillo ej emplo, similar al que plant ea R.A. Fisher en su libro El
Diseo de Experiment os, en el cual refera la afirmacin de una dama segn la cual, cuando t omaba el t ,
poda det ect ar si se haba vert ido ant es la leche o la infusin en la t aza. Para refut ar est a facult ad de la
dama podramos realizar un cont rast e con los siguient es dat os fict icios.
Ejemplo 1.8. Para cont rast ar la presunt a habilidad det ect ora de la dama se preparan 16 t azas de t ,
siguiendo ambos procedimient os: en ocho se viert e primero la leche, y en ot ros ocho se viert e primero la
infusin. La present acin se realiza al azar y la dama slo t iene que decir cul ha sido el procedimient o.
Supongamos, por ej emplo, que la dama aciert a en 12 ocasiones. Es compat ible est e result ado muest ral con
la afirmacin de la dama?. Como nivel de significacin, t omaremos o = 0,05.
Seguiremos los 6 pasos del proceso pero ut ilizando slo el nivel crt ico p como regla de decisin,
dej ando el clculo del est adst ico de cont rast e para los siguient es t emas.
1.- Condiciones y supuestos. 16 ensayos independient es con dos result ados posibles en cada uno: aciert o
o error, y la probabilidad del result ado permanece const ant e en t odos ensayos.
2.- Formulacin de las hiptesis nula y alternativa: Plant eamos un cont rast e unilat eral en el que la
hipt esis nula presupone que la dama, en principio, no t iene dicha habilidad, y por t ant o la proporcin de

6
Cuando la medida de discrepancia cae justo en la regin crtica de la zona de aceptacin o rechazo, es difcil tomar una decisin sobre
H
0
. En estas circunstancias se suele coger nueva evidencia y proceder a un nuevo contraste.


28 | P g i n a

veces que acert ara sera la mit ad (es decir, t endra la misma habilidad que el rest o de lo mort ales). La
hipt esis alt ernat iva plant ea que la dama si t iene esa habilidad y por t ant o es capaz de acert ar en ms del
50% de los ensayos.
5 , 0 :
0
s t H

5 , 0 :
1
> t H
3.- Estadstico de contraste. Como est amos cont rast ando una proporcin cuya dist ribucin de probabilidad
es la dist ribucin binomial que est udiamos el curso pasado, vamos a calcular la probabilidad de que, baj o el
supuest o de que la dama no t iene esa ext raa facult ad (y por t ant o su proporcin de aciert os es la de
cualquier persona normal del 50% que se formula en la H
0
) la dama haya sido capaz de det ect ar la diferencia
en ms de la mit ad de la veces, concret ament e en 12 o ms ocasiones de los 16 ensayos realizados
(formulado en la H
1
):
0384 , 0 9616 , 0 1 5 , 0 5 , 0
16
1 ) 12 ( 1 5 , 0 5 , 0
16
) 12 (
11
0
16
12
= =
|
|
.
|

\
|
= < =
|
|
.
|

\
|
= >

=

x
x n x
x
x n x
x
X P
x
X P

x p
1 0,0002
2 0,0018
3 0,0085
4 0,0278
5 0,0667
6 0,1222
7 0,1746
8 0,1964
9 0,1746
10 0,1222
11 0,0667
12 0,0278
13 0,0085
14 0,0018
15 0,0002
16 0,0000
Cuadro 1.2. Tabla de la dist ribucin
binomial para N= 16 y p= 0,5



Figura 1.10. Represent acin grfica del ej emplo 1.6

4.- Regla de decisin. Est e result ado quiere decir que, baj o el supuest o de que la hipt esis nula es ciert a y
la probabilidad de aciert o de la dama es de 0,5, la probabilidad de que en 16 ensayos la dama aciert e en 12
ocasiones o ms es de 0,0384, o que hay un 3,84% de probabilidades de que la dama, sin t ener esa ext raa
habilidad, aciert e por puro azar en 12 ocasiones o ms. Como regla de decisin para rechazar o no la
hipt esis nula comparamos est a probabilidad con el nivel de significacin (0,05) y puest o que la probabilidad
encont rada es menor que 0,05, rechazamos la H
0
,
En la Figura 1.10 se represent a la dist ribucin binomial del cuadro 1.2 del ej emplo con el nivel crt ico p
represent ado por valores escrit os y represent ados por barras roj as cuya suma es menor de 0,05. Por t ant o, la
regla de decisin baj o la int erpret acin de Fisher consist e en calcular la probabilidad de obt ener unos


29 | P g i n a

result ados como los observados en la muest ra (nivel crt ico p). Si est a probabilidad es muy pequea en
comparacin con o , pueden ocurrir dos cosas: o bien la hipt esis nula es ciert a (la dama no goza de t al
habilidad) y se ha producido una sit uacin muy poco probable (pero no imposible) o bien la hipt esis nula es
falsa. Parece ms lgico (o probable) inclinarse por est a segunda opcin que descart a el azar como
explicacin del result ado obt enido y ant e la evidencia que proporciona est e result ado, el invest igador opt a por
rechazar la hipt esis nula, asumiendo que est a afirmacin t iene un ciert o riesgo o probabilidad de error, que
ha est ablecido en el 5%. Si, por el cont rario, la probabilidad hubiese sido mayor que el nivel de significacin,
ent onces no se podra descart ar el azar, como explicacin de la diferencia y se opt a por no rechazar la
hipt esis nula.
5.- Conclusin: Rechazamos la hipt esis nula, ya que el nivel crt ico p es menor que 0,05. El nivel crt ico p=
0,0384, nos indica la probabilidad de acert ar por simple azar en 12 o ms de las 16 ocasiones. Es un valor lo
suficient ement e pequeo que nos conduce a descart ar el azar como explicacin de est e nmero de aciert os
t an alt o. En consecuencia, si descart amos el azar como explicacin de que la dama aciert e en 12 o ms de los
16 ensayos es porque la dama si t iene realment e esa capacidad.
6.- Interpretacin: Rechazar la hipt esis nula quiere decir que la dama t iene esa habilidad para dist inguir si
en una t aza de t se ha puest o primero la leche o la infusin con un nivel de confianza del 95%.
Observe el lect or que si se est ablece el nivel de significacin en 0,01 la conclusin sera ot ra y sera
necesario obt ener evidencias ms fuert es o una probabilidad mucho menor para descart ar el azar como
explicacin de est a ext raa habilidad de la seora.
En los siguient es t emas seguiremos est a met odologa pero ut ilizando, no solo el nivel crt ico p, sino
t ambin y fundament alment e el est adst ico de cont raste como medida de la discrepancia ent re los valores
t ericos que formulamos en la poblacin y la informacin emprica que nos proporcionan los dat os recogidos
en la muest ra, para los diseos de invest igacin que ut ilizan una, dos o ms muest ras. Y part ir de est os
est adst icos de cont rast e podremos calcular t ambin el nivel crt ico p.
1.4.3.2.- Errores al tomar una decisin en un contraste clsico de hiptesis
Hemos vist o que el cont rast e de hipt esis es un proceso por el cual se t oma una decisin acerca de lo
que se afirma en la hipt esis nula. No obst ant e, una cosa es la decisin que se adopt a sobre H
0
y ot ra es la
propia nat uraleza de H
0
. Tenemos dos opciones posibles acerca de la decisin sobre H
0
: o se Acept a o se
Rechaza, y dos opciones sobre la nat uraleza de H
0
: o es verdadera o es falsa.
El error que supone rechazar una hipt esis nula cuando en realidad es verdadera se denomina Error
Tipo I, y su probabilidad asociada es o . El error que supone acept ar una hipt esis nula cuando en realidad
es falsa, siendo verdadera la hipt esis alt ernat iva, se conoce como Error Tipo II, y su probabilidad asociada
es | Su complement ario es | 1 y corresponde a la potencia del contraste que es la decisin correct a
de rechazar la hipt esis nula cuando es falsa.
Puede observarse que los errores y las decisiones correct as est n probabilst icament e relacionados
(cuant o menor es o mayor es o 1 , por ej emplo). Est as ideas pueden verse reflej adas en el siguient e
cuadro o t abla de doble ent rada con dos alt ernat ivas en cada ent rada como puede verse en el cuadro 1.3.
Nat uraleza de H
0

Verdadera Falsa


30 | P g i n a

Decisin
sobre H
0

No rechazar
Decisin correct a.
Nivel de confianza
o 1
Decisin errnea
Error tipo II
|
Rechazar
Decisin errnea
Error tipo I
o
Decisin correct a
Potencia del
contraste
| 1
Cuadro 1.3. Decisiones sobre la hipt esis nula
En t odo cont rast e de hipt esis el invest igador fij a a priori el nivel de significacin (error t ipo I ) y su
complement ario, el nivel de confianza, o decisin correct a de no rechazar una hipt esis nula que puede ser
verdadera. En el t ema siguient e veremos cmo se calcula el error t ipo I I y la pot encia del cont rast e (pero
exclusivament e para el cont rast e sobre la media y la proporcin en los diseos de una muest ra) y veremos
t ambin cmo est e valor depende del nivel de significacin, del t amao de la muest ra, n, y del t amao del
efect o.
Cul de est os errores es ms grave? Vamos a ilust rarlo con dos ej emplos. Suponga que comparamos
un t rat amient o nuevo, A, con ot ro ant iguo, B, ya exist ent e. La hipt esis nula dir que los dos t rat amient os
son, al menos, igual de eficaces frent e a la hipt esis alt ernat iva segn la cual el t rat amient o A es mej or que el
B:
B A H s :
0

B A H > :
1

I magine que rechazamos la hipt esis nula cuando en realidad es ciert a, es decir, que concluimos que
el t rat amient o nuevo, A, es ms eficaz cuando en realidad son iguales. En est a sit uacin est aramos
comet iendo el error t ipo I con una probabilidad o .
Si por el cont rario, y como result ado del cont rast e de hipt esis, concluimos que los dos t rat amient os
son iguales (es decir, no rechazamos la hipt esis nula que es falsa) cuando en realidad el nuevo t rat amient o
es mej or que el ant erior, est aramos comet iendo un error t ipo I I con una probabilidad | . Es evident e que el
error t ipo I I result a ms grave por cuant o impide beneficiarse de un t rat amient o que es ms eficaz. Mient ras
que el error t ipo I , (sin ent rar a considerar las consecuencias econmicas de la decisin de cambiar a algo
que es igual de eficaz) t iene consecuencias menos grave, al menos en el campo del progreso del
conocimient o.
La realidad de la H
0

Verdadera Falsa
Decisin
sobre H
0

No rechazar
Correcto
El t rat amient o no t iene
efect o y as se decide.

Probabilidad o 1
Error de tipo II
El t rat amient o si t iene efect o
pero no lo percibimos.
Probabilidad
Rechazar
Error de tipo I
El t rat amient o no t iene
efect o pero se decide que s.
Probabilidad
Correcto
El t rat amient o t iene efect o y
el experiment o lo confirma.
Probabilidad | 1


31 | P g i n a

Esta valoracin puede cambiar dependiendo del contexto en el que nos situemos. Por ejemplo,
aplicando el mismo razonamiento sobre la inocencia o culpabilidad de un imputado, las hiptesis nula y
alternativa son::
Inocente H :
0

Culpable H :
1

Partimos del supuesto de que la hiptesis nula es verdadera (el imputado es inocente) mientras no se
tenga evidencia suficiente para condenarle (rechazar la H
o
y aceptar la H
1
). En este contexto se introducen
otras razones de ndole moral para valorar qu es ms grave: si tener un inocente en la crcel o un culpable
en la calle.


La realidad de la H
0

Inocente Culpable
Decisin
sobre H
0

No rechazar
Ho
Inocente
Correcto
Es inocente.

Probabilidad o 1
Error de tipo II
Es culpable y no se le
condena.
Probabilidad
Rechazar Ho
Culpable
Error de tipo I
Es inocente y se le
condena.
Probabilidad
Correcto
Es culpable.
Probabilidad | 1
En cualquier caso, el hecho de no rechazar la H
0
puede deberse o bien a que sea realment e
verdadera o sea falsa pero el experiment o no t ena suficient e pot encia para det ect arlo. Debido a est o, aunque
el anlisis de los dat os de nuest ro diseo de invest igacin no produzca result ados significat ivos, nunca
podremos acept ar la H
0
como verdadera. Como siempre, exist e la posibilidad de que la H
0
sea falsa, pero el
diseo de nuest ra invest igacin no t iene la suficient e sensibilidad para det ect arlo, t an solo podremos concluir
que nuest ros result ados no han aport ado evidencia suficient e para rechazar la hipt esis nula. El anlisis de la
pot encia del cont rast e nos proporciona informacin sobre el grado de confianza en los result ados no
significat ivos que no ha permit ido rechazar la hipt esis nula formulada en el diseo de nuest ra invest igacin.
Por ot ra part e, y como veremos en t emas post eriores, t ant o en la invest igacin aplicada en el mbit o
de la psicologa, como en ot ras ciencias, un result ado est adst icament e significat ivo sobre la eficacia de un
nuevo t rat amient o puede no t ener una significacin prct ica en el sent ido de no represent ar un valor
t eraput ico real o import ant e. De aqu la recomendacin, casi ineludible, de conocer adicionalment e el
tamao del efecto que expresa la magnit ud de la diferencia observada ent re la hipt esis nula (el valor
t erico) y la hipt esis alt ernat iva (el valor observado) expresado en una mt rica comn y que, por su
import ancia met odolgica de cara la validez de conclusin est adst ica de la invest igacin que hemos diseado,
expondremos con algo ms de det alle en t emas post eriores.


32 | P g i n a

1.5. EJERCICIOS DE AUTOEVALUACIN.

1. Cul de las siguient es afirmaciones referidas a la dist ribucin muest ral de la media es FALSA: a) Es
normal cuando conocemos la varianza poblacional; b) Tiende a la normal cuando desconocemos la
varianza poblacional pero t rabaj amos con muest ras grandes; c) Siempre es normal con media igual a la
media poblacional.
2. El nivel crt ico p represent a la probabilidad de: a) que la hipt esis nula sea verdadera; b) que siendo
verdadera la hipt esis nula obt engamos unos dat os como los observados en la muest ra; c) rechazar la
hipt esis nula siendo verdadera.
3. A una muest ra de 122 est udiant es universit arios, de los cuales 74 son muj eres se les pasa una prueba de
memoria de palabras sin sent ido, obt eniendo una media de 15 palabras recordadas, con una varianza de
9. Trabaj ando con un nivel de confianza del 95%, ent re que valores se encont rar la media poblacional?
4. A una muest ra de 122 est udiant es universit arios, de los cuales 74 son muj eres se les pasa una prueba de
memoria de palabras sin sent ido, obt eniendo una media de 15 palabras recordadas, con una varianza de
9. Si queremos est imar la varianza poblacional con un nivel de confianza del 95% y un error mximo de
est imacin que no supere los cuat ro punt os, ent re qu valores se encont rar la varianza poblacional?
5. A una muest ra de 122 est udiant es universit arios, de los cuales 74 son muj eres se les pasa una prueba de
memoria de palabras sin sent ido, obt eniendo una media de 15 palabras recordadas, con una varianza de
9. Si queremos est imar la varianza poblacional con un error mximo de est imacin que no supere los
cuat ro punt os, Cul debera ser el t amao de la muest ra que debemos ut ilizar fij ando el nivel de
confianza en el 95%?.
6. A una muest ra de 122 est udiant es universit arios, de los cuales 74 son muj eres se les pasa una prueba de
memoria de palabras sin sent ido, obt eniendo una media de 15 palabras recordadas, con una varianza de
9. Trabaj ando con un nivel de confianza del 95%, ent re que valores se encont rar la proporcin
poblacional de muj eres universit arias?.
7. En un cont rast e de hipt esis es habit ual que el invest igador fij e a priori el valor de o que represent a la
probabilidad de: a) conservar la hipt esis nula cuando no se encuent ra en los dat os de la muest ra
suficient e evidencia para rechazarla; b) rechazar la hipt esis nula siendo ciert a; c) acept ar la hipt esis
alt ernat iva siendo ciert a.
8. La probabilidad de rechazar la hipt esis nula siendo falsa, es: a) un valor conocido y fij ado a priori por el
invest igador; b) un valor desconocido que represent a el error t ipo I I ; c) la pot encia del cont rast e que es
un valor desconocido a priori.
9. La amplit ud del int ervalo es ms est recho a medida que; a) aument a el t amao de la muest ra; b) aument a
el nivel de confianza; c) aument a el error t pico del est adst ico.
10. Se llama error t pico de un est adst ico a la desviacin t pica de: a) El parmet ro poblacional; b) La
dist ribucin muest ral de est e est adst ico; c) Los dat os recogidos en la muest ra.
11. En una muest ra aleat oria de 100 personas se mide el pulso obt eniendo una media de 65 ppm con
desviacin t pica 5 ppm. Sabiendo que est a variable se dist ribuye normalment e en la poblacin, Cunt o
vale el error mximo de est imacin de la media poblacional con un nivel de confianza del 95%?: a)
0.5025; b) 0,997; c) 25.25


SOLUCIONES:
1.- De las t res afirmaciones la c) es FALSA. La dist ribucin muest ral de la media es normal cuando se conoce
la varianza poblacional o cuando la dist ribucin poblacional es normal. Si la varianza poblacional es
desconocida ent onces la dist ribucin muest ral de la media es la t de St udent , que t iende a la normal cuando
la muest ra es grande.
2.- El nivel p-crt ico es la probabilidad asociada al est adst ico de la muest ra e indica la probabilidad de que,
siendo ciert a la hipt esis nula, encont rar valores t an ext remos como los obt enidos en la muest ra.


33 | P g i n a

3.- Sabiendo que, en est as condiciones, la dist ribucin muest ral de la media es la t de St udent , con n-1
grados de libert ad, buscamos los valores t correspondient es a ese nivel de confianza y g.l y son: 1,96. Los
lmit es inferior y superior del int ervalo son:
I
n]
=

-t
2
,
.
S
n -1
= 1S -1,96.
S
122 -1
= 1S -u,SS4 = 14,466
I
sup
=

+t
1-

2
,
.
S
2
n -1
= 1S +1,96.
S
122 -1
= 1S +u,SS4 = 1S,SS4
4.- Al t rat arse de una muest ra grande, la dist ribucin muest ral de la varianza se aproxima a la normal y los
lmit es inferior y superior del int ervalo de confianza para la varianza poblacional, son:
I
n]
= S
2
-Z
u2
. S
2
_
2
n
= 9 -1,96. 9
_
2
122
= 9 -2,2S8 = 6,742
I
n]
= S
2
+Z
u2
. S
2
_
2
n
= 9 +1,96. 9
_
2
122
= 9 +2,2S8 = 11,2S8
Obsrvese que en est e caso el error mximo de est imacin que comet emos al est imar la varianza poblacional
es de 2,258 punt os. De ah que si queremos mej orar la precisin de nuest ra est imacin, uno de los
procedimient os puede ser aument ar el t amao de la muest ra, como veremos en el siguient e ej emplo.
5.-El t amao de la muest ra para un error mximo de est imacin de 4 punt os, es
2
2
2 4
2
E
Z
n
o
o =

La desviacin t pica poblacional,

o , se est ima a part ir de la cuasi-desviacin t pica de la muest ra. Conociendo
la varianza de la muest ra que en est e ej emplo es 9, la cuasi-varianza y cuasi-desviacin t pica valen:
012 , 3 07 , 9 9
121
122
1
1
2 2
1 .
= = =

=
n n n
S S
n
n
S

40 54 , 39
4
96 , 1
012 , 3 2 2
2
2
4
2
2
2 4
~ = = =
E
Z
n
o
o
6.- El gnero es una variable dicot mica con dist ribucin binomial siendo la proporcin de muj eres obt enida
en la muest ra: p= 74/ 122= 0,6065. Al t rat arse de una muest ra grande, est a dist ribucin se aproxima a la
normal y los lmit es del int ervalo de confianza para n, son:
I
n]
= p -Z.
_
p. (1 -p)
n
= u,6u6S -1,96.
_
u,6u6S.u,S9SS
122
= u,S198


34 | P g i n a

I
sup
= p +Z.
_
p. (1 -p)
n
= u,6u6S +1,96.
_
u,6u6S.u,S9SS
122
= u,69S2
7.- El nivel de significacin se represent a por o y es un valor fij ado a priori por el invest igador como crit erio
de decisin. Los valores habit uales son 0,05 y 0,01 y represent an la probabilidad que desde un inicio asume
el invest igador de comet er el error t ipo I , es decir, de rechazar una hipt esis nula que es verdadera. Su
complement ario o 1 , es el nivel de confianza o probabilidad de t omar la decisin correct a de no rechazar
una hipt esis nula cuando no hay evidencia suficient e para hacerlo.
8.- La probabilidad de rechazar una hipt esis nula que es falsa es la pot encia del cont rast e, cuyo valor es
desconocido a priori pero se puede calcular, ya que depende del nivel de significacin, o , del t amao de la
muest ra y la magnit ud del efect o.
9.- La amplit ud del int ervalo de confianza depende del t amao de la muest ra y del nivel de confianza, de
forma que al aument ar el nivel de confianza el int ervalo es ms amplio y al aument ar el t amao de la muest ra
disminuye el error t pico del est adst ico y con ello el int ervalo de confianza, como puede deducirse al ver sus
expresiones de clculo.
10.- La opcin A es incorrect a por varias razones: se refiere a la dist ribucin poblacional, no a la dist ribucin
muest ral; puede ser cualquier parmet ro, no solo la desviacin t pica. La opcin B es correct a. La opcin C es
incorrect a porque el error t pico se refiere a la variabilidad de la dist ribucin muest ral del est adst ico mient as
que la desviacin t pica se refiere a la variabilidad de los valores recogidos en la muest ra.
11.- Sabemos que en la poblacin la dist ribucin es normal pero no conocemos la varianza (o la desviacin
t pica). El valor de
o
es 0.05 Nos piden el Error Mximo de est imacin. El int ervalo de confianza de la media
se obt iene sumando y rest ando a la media de la muest ra (est imacin punt ual del parmet ro) el error mximo
de est imacin que corresponde a Z o t veces (segn el caso) el error t pico de la media:
Est imador punt ual [ (Z o t ) * (Error t pico)]
Luego el valor que nos est n pidiendo es el valor que est ent re corchet es y que represent a el error mximo
de est imacin:
Si no conocemos la varianza poblacional, la dist ribucin muest ral de la media es la dist ribucin t de St udent
con n-1 grados de libert ad y la varianza poblacional hay que est imarla a part ir de la varianza o cuasi-varianza
de la muest ra. Por ot ro lado, los valores crt icos de la dist ribucin t con n-1= 100-1= 99 grados de libert ad son
984 . 1
975 . 0 025 . 0
= = t t

Hemos buscando con 100 grados de libert ad (el ms cercano a 99, ya que est e no exist e en la t abla y hemos
elegido una probabilidad de 0.975 que es la suma de 025 , 0 2 = o y el Nivel de Confianza = 0.95 (0.025 +
0.950 = 0.975).


35 | P g i n a



El error t pico de la media, es:
1
1

= =

n
S
n
S
n n
Y
o
Si ut ilizamos la cuasi-desviacin t pica de la muest ra, primero debemos calcularla:


02519 . 5 2525 . 25 2525 . 25
99
100 5
1
1
2 2
2
1
= = =

=
n n
S
n
n S
S

Luego:
502519 . 0
100
02519 . 5
1
= = =

n
S
n
Y
o

Y si ut ilizamos la desviacin t pica de la muest ra:
502519 . 0
1 100
5
1
=

=
n
S
n
Y
o
Y el error mximo solicit ado es:
1 9969 . 0 502519 . 0 984 . 1
max
~ = = E

Você também pode gostar