Escolar Documentos
Profissional Documentos
Cultura Documentos
de Estadstica
Fundamentos Conceptuales
de Estadstica
Indice general
1 Introducci
on
1.1
1.1.1
Saber Cotidiano . . . . . . . . . . . . . . . . . . . . . .
1.1.2
Saber Cientfico . . . . . . . . . . . . . . . . . . . . . . .
1.2.1
1.2.2
Investigaci
on y su Procedimiento . . . . . . . . . . . . .
1.3
La Estadstica y la Investigaci
on . . . . . . . . . . . . . . . . .
1.4
Rese
na hist
orica de la Estadstica . . . . . . . . . . . . . . . . .
1.2
2.1
Definiciones de Estadstica . . . . . . . . . . . . . . . . . . . . .
2.2
10
2.3
Clasificaci
on de los metodos estadsticos . . . . . . . . . . . . .
11
2.4
Sistema conceptual b
asico . . . . . . . . . . . . . . . . . . . . .
11
2.4.1
11
2.4.2
Las Variables . . . . . . . . . . . . . . . . . . . . . . . .
12
2.4.3
Escalas de Medici
on o Clasificacion . . . . . . . . . . . .
12
2.4.4
El Censo o Enumeraci
on Completa . . . . . . . . . . . .
19
iv
INDICE GENERAL
2.4.5
El Muestreo . . . . . . . . . . . . . . . . . . . . . . . . .
20
2.4.6
Los Par
ametros y las Estadsticas . . . . . . . . . . . . .
21
3 Metodologa de la Estadstica
22
3.1
Definici
on de Objetivos . . . . . . . . . . . . . . . . . . . . . .
22
3.2
Definici
on del colectivo o poblaci
on . . . . . . . . . . . . . . . .
23
3.3
Determinaci
on de la cobertura . . . . . . . . . . . . . . . . . .
23
3.4
Determinaci
on del marco de muestreo . . . . . . . . . . . . . .
23
3.4.1
Definici
on . . . . . . . . . . . . . . . . . . . . . . . . . .
23
3.4.2
24
3.4.3
Soluciones Generales . . . . . . . . . . . . . . . . . . . .
24
Definici
on de unidades . . . . . . . . . . . . . . . . . . . . . . .
25
3.5.1
Unidad Poblacional
. . . . . . . . . . . . . . . . . . . .
25
3.5.2
Unidad Muestral . . . . . . . . . . . . . . . . . . . . . .
25
3.5.3
Unidades de Observaci
on . . . . . . . . . . . . . . . . .
25
Determinaci
on del dise
no muestral . . . . . . . . . . . . . . . .
26
3.6.1
Muestreo No Probabilstico . . . . . . . . . . . . . . . .
26
3.6.2
Muestreo Probabilstico . . . . . . . . . . . . . . . . . .
27
3.7
Recolecci
on de informaci
on . . . . . . . . . . . . . . . . . . . .
27
3.8
Tratamiento de la informaci
on
. . . . . . . . . . . . . . . . . .
28
3.8.1
Distribuciones de Frecuencias . . . . . . . . . . . . . . .
28
3.8.2
Clasificaci
on Unidimensional . . . . . . . . . . . . . . .
29
3.8.3
Clasificaci
on Bi y Pluridimensional . . . . . . . . . . . .
31
An
alisis e Interpretaci
on . . . . . . . . . . . . . . . . . . . . . .
33
3.5
3.6
3.9
4 An
alisis de variables no cuantitativas
35
4.1
Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
35
4.2
An
alisis b
asico en tablas 2 x 2 . . . . . . . . . . . . . . . . . . .
35
4.2.1
Notaci
on y Consistencia . . . . . . . . . . . . . . . . . .
35
4.2.2
Independencia y Correspondencia . . . . . . . . . . . . .
36
4.2.3
Clasificaci
on Multivariada Dicotomica . . . . . . . . . .
41
Clasificaci
on m
ultiple . . . . . . . . . . . . . . . . . . . . . . . .
42
4.3
INDICE GENERAL
vi
5 An
alisis descriptivo de una variable cuantitativa
5.1
44
44
5.1.1
La Media Aritmetica . . . . . . . . . . . . . . . . . . . .
44
5.1.2
La Varianza . . . . . . . . . . . . . . . . . . . . . . . . .
46
5.1.3
La desviaci
on est
andar y el coeficiente de variacion . . .
48
5.1.4
Los Percentiles . . . . . . . . . . . . . . . . . . . . . . .
49
5.1.5
La Moda . . . . . . . . . . . . . . . . . . . . . . . . . .
49
6 Estudios de relaci
on entre variables cuantitativas
51
6.1
La regresi
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51
6.2
La explicaci
on de la variaci
on del modelo . . . . . . . . . . . .
53
55
Teoremas b
asicos de Probabilidad . . . . . . . . . . . . . . . . .
55
7.1.1
Definici
on cl
asica . . . . . . . . . . . . . . . . . . . . . .
55
7.1.2
Teoremas b
asicos . . . . . . . . . . . . . . . . . . . . . .
55
7.2
Funci
on de probabilidades . . . . . . . . . . . . . . . . . . . . .
56
7.3
Funci
on de distribuci
on . . . . . . . . . . . . . . . . . . . . . .
57
7.4
Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
7.5
La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
58
7.6
59
7.6.1
Bernoulli o bipuntual
. . . . . . . . . . . . . . . . . . .
59
7.6.2
Binomial . . . . . . . . . . . . . . . . . . . . . . . . . .
59
7.6.3
Binomial negativa . . . . . . . . . . . . . . . . . . . . .
60
7.6.4
Geometrica . . . . . . . . . . . . . . . . . . . . . . . . .
60
7.6.5
Hipergeometrica . . . . . . . . . . . . . . . . . . . . . .
60
7.6.6
Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . .
61
7.6.7
La multinomial . . . . . . . . . . . . . . . . . . . . . . .
62
7.6.8
Hipergeometrica generalizada . . . . . . . . . . . . . . .
62
7.6.9
La normal . . . . . . . . . . . . . . . . . . . . . . . . . .
63
63
64
INDICE GENERAL
8.1
8.2
8.3
vii
64
8.1.1
Inferencia Matem
atica . . . . . . . . . . . . . . . . . . .
65
8.1.2
Inferencia f
actica . . . . . . . . . . . . . . . . . . . . . .
65
8.1.3
Inferencia Estadstica . . . . . . . . . . . . . . . . . . .
65
8.1.4
Inferencia Reductiva . . . . . . . . . . . . . . . . . . . .
66
Inferencia estadstica . . . . . . . . . . . . . . . . . . . . . . . .
66
8.2.1
Inferencia Cl
asica . . . . . . . . . . . . . . . . . . . . . .
67
8.2.2
Inferencia bayesiana . . . . . . . . . . . . . . . . . . . .
67
Distribuciones en el muestreo . . . . . . . . . . . . . . . . . . .
67
9 La estimaci
on estadstica
72
9.1
Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . .
72
9.2
73
9.2.1
Insesgamiento . . . . . . . . . . . . . . . . . . . . . . . .
73
9.2.2
Consistencia
. . . . . . . . . . . . . . . . . . . . . . . .
74
9.2.3
Eficiencia relativa . . . . . . . . . . . . . . . . . . . . . .
74
9.2.4
Suficiencia . . . . . . . . . . . . . . . . . . . . . . . . . .
75
75
9.3
10 Pruebas de hip
otesis estadsticas
78
10.1 Hip
otesis nula Hip
otesis alternativa . . . . . . . . . . . . . . .
78
79
81
viii
INDICE GENERAL
CAPITULO
Introduccion
1.1.
1.1.1.
Saber Cotidiano
CAPITULO 1. INTRODUCCION
1.1.2.
Saber Cientfico
1.2.
M
etodo cientfico e investigaci
on
Entre un tipo del saber y otro existe una separacion que no es cualitativa
sino de grado; lo diferenciador no est
a dado por la naturaleza del objeto de
estudio, ni por la veracidad de lo conocido sino por la forma de su adquisicion
y los instrumentos del conocer. En tanto que el saber vulgar no es sistematico,
1.2. METODO
CIENTIFICO E INVESTIGACION
1.2.1.
Caractersticas de un M
etodo Cientfico
1.2.2.
Investigaci
on y su Procedimiento
CAPITULO 1. INTRODUCCION
procedimientos
metodologicos
para
realizar
la
Obtenci
on de la informaci
on necesaria para el estudio.
Tratamiento de tal informaci
on.
An
alisis e interpretaci
on de la informaci
on.
Conclusiones del proceso investigativo.
1.3.
La Estadstica y la Investigaci
on
HISTORICA
1.4. RESENA
DE LA ESTADISTICA
1.4.
Rese
na hist
orica de la Estadstica
Como toda tecnica, toda disciplina y toda ciencia, la Estadstica tuvo como
principio el ser un medio de satisfacer alguna necesidad del ser humano. Ahora
bien, desde sus orgenes, este ha sentido la necesidad de cualificar hechos
numerosos, u
nica forma en muchos casos, de tener alguna idea acerca del
comportamiento generalizado de tales hechos, objetivo este que solo se logra
por medio de procesos de sntesis, de reduccion, de compendio de la informacion
numerica que la citada clasificaci
on produce.
Las estadsticas son tan antiguas como las sociedades humanas, afirma
Cansado y contin
ua anotando que desde que ellas existen se han producido
censos, relaciones, catastros, etc., con informacion sobre recursos humanos,
econ
omicos o de otra ndole. Se tienen referencias historicas acerca de los datos
recogidos por los israelitas y egipcios en relacion con la medida de la poblacion.
Parece ser que los datos m
as antiguos son los censos ordenados por el emperador
Tao, 2.200 a.C.
Tambien tuvieron importancia los censos romanos hacia el a
no 555 a.C.,
de sumo interes dada la organizaci
on eminentemente poltica y guerrera de
Roma; unos cien a
nos despues fueron implantados los censores. El Breviarium
de Carlomagno, el Digest Book de Guillermo de Orange, Descripciones
de Espa
na mandadas por el Califato de Cordoba al de Bagdad, Actividades
demogr
aficas de la Rep
ublica veneciana, son ejemplos de bosquejos de procesos
estadsticos, obviamente rudimentarios, pero que muestran la necesidad de, por
lo menos, describir numericamente fen
omenos colectivos.
Se puede concluir entonces que la Estadstica, se origina como un medio
para ayudar al ser humano a comprender en forma sencilla y abreviada grandes
masas de informaci
on numerica, sin que esto quiera decir que la Estadstica
como ciencia, se limite hoy en da a tan elemental proceso.
En realidad la Estadstica como ciencia organizada y formalizada, aparece
en epocas menos remotas, aproximadamente a finales del siglo XVII y
durante el XVIII, con sus principales exponentes en Alemania, donde existe
en la universidad de Gottinga una c
atedra y curso de Estadstica. En ella
se ense
nan y se ponen en pr
actica una serie de metodos numericos para
hacer descripciones de hechos relacionados con el funcionamiento del Estado.
Estos metodos despues de recibir la aceptacion academica del encuadramiento
sistem
atico, empiezan a gozar del favor del p
ublico. Su objeto es la descripci
on
cuantitativa de las cosas del estado, pero a
un le faltaba el contenido cientfico
m
as formal de la b
usqueda de leyes generales del fenomeno colectivo
estudiado, que es el objeto de la disciplina, razon por la cual algunos tratadistas
CAPITULO 1. INTRODUCCION
HISTORICA
1.4. RESENA
DE LA ESTADISTICA
CAPITULO 1. INTRODUCCION
CAPITULO
2.1.
Definiciones de Estadstica
10
hechos.
2.2.
Caractersticas del m
etodo estadstico
Es LOGICO
y su l
ogica est
a basada en la llamada ley de los grandes
n
umeros, la cual, expresada en terminos no formales, dice que entre mayor sea
el n
umero de hechos que se observan, mas exactas seran las conclusiones que se
obtengan y en la llamada ley de regularidad de frecuencias referida al hecho
de que si se realizan repeticiones u observaciones sucesivas e incrementadas
de un fen
omeno, la frecuencia relativa de alg
un suceso de interes, tiende a
estabilizarse alrededor de un valor, el cu
al correspondera a la probabilidad de
tal suceso. Es conveniente anotar, a prop
osito de esta caracterstica, que la
Estadstica no es exacta y como sucede en este tipo de ciencias, trata de lograr
la mayor exactitud posible o sea el mayor acercamiento a la verdad.
El proceso de razonamiento que utiliza la Estadstica para alcanzar sus
objetivos de aplicabilidad es el INDUCTIVO y para su desarrollo propio el
DEDUCTIVO.
Est
a referido siempre a FENOMENOS
COLECTIVOS o como algunos
autores sugieren, a AGREGADOS; como en un Metodo Cientfico, solo le
interesa el hecho individual como componente de un hecho numeroso, los
resultados que se obtienen no se pueden aplicar en forma particular o individual;
siempre es GENERALIZANTE.
Naturalmente el metodo estadstico es OBJETIVO, en la misma forma en
que se habla de objetividad en un Metodo Cientfico. Es esta una caracterstica
que algunos usuarios de supuestos procesos estadsticos, han desacreditado
al manipular, en el peor sentido de la palabra, informacion numerica para
comprobar o demostrar as, verdades predeterminadas o mostrar realidades
distorsionadas.
Como conclusi
on de esta caracterizaci
on de la Estadstica y siguiendo
a Mood, es conveniente tener presente que el fin u
ltimo de la Estadstica,
su objetivo mediato, es colaborar con el Metodo Cientfico en procesos de
TOMA DE DECISIONES, cuando prevalecen condiciones de RIESGO
Y/O INCERTTDUMBRE.
DE LOS METODOS
2.3. CLASIFICACION
ESTADISTICOS
2.3.
11
Clasificaci
on de los m
etodos estadsticos
METODOS
DESCRIPTIVOS: cuando las conclusiones que se obtienen
de las experiencias o datos en estudio, no rebasan los lmites de los mismos.
Tienen como objetivo fundamental su presentacion y analisis como paso previo
a los procesos inferenciales.
METODOS
INDUCTIVOS O INFERENCIA ESTAD
ISTICA:
cuando las conclusiones que se obtienen de los datos en estudio, rebasan los
lmites de los mismos. Implica en general, el tomar decisiones en el caso mas
universal del cual forman parte los datos. El proceso de tomar decisiones en
situaciones generales, sobre la base de una informacion incompleta contenida
en algunos datos, es arriesgado y no puede realizarse con certeza absoluta sino
con incertidumbre. Sin embargo esta u
ltima no es total, pueden controlarse
sus niveles, puede medirse su magnitud, lo cual se lleva a cabo con base en el
CALCULO
DE PROBABILIDADES.
METODOS
TEORICOS
O TEOR
IA ESTAD
ISTICA: se esta ante
la misma cuando se aborda el estudio de los fenomenos estadsticos, utilizando
los metodos matem
aticos en toda su plenitud. Esto no supone, sin embargo,
que la Estadstica sea una rama de las Matematicas, sino que al igual que
otras ciencias (Fsica, Economa, Qumica, etc.), la utiliza como instrumento, y
as mientras en la Matem
atica Pura se permanece en el terreno de lo conceptual,
en estas ciencias es preciso que las conclusiones se ajusten a la realidad, pues
de lo contrario no sirven.
2.4.
2.4.1.
Sistema conceptual b
asico
El Colectivo, Agregado, Poblaci
on, Universo
Como POBLACION,
se define a un conjunto de medidas obtenidas al
12
2.4.2.
Las Variables
2.4.3.
Escalas de Medici
on o Clasificaci
on
2.4.3.1.
La Medici
on
2.4. SISTEMA CONCEPTUAL BASICO
13
Lundberg
Cuando uno puede medir y expresar numericamente lo que dice, conoce
algo de ello; pero mientras no pueda uno medir ni expresarse en n
umeros, su
conocimiento es escaso y poco satisfactorio: Lord Kelvin
Contar hechos observables es la operacion basica de la medicion. Contar
o computar es establecer una correspondencia biunvoca entre el conjunto de
objetos que hay que contar y un subconjunto de los enteros positivos... Para
que una colecci
on de hechos sea empricamente contable, tiene que consistir en
miembros empricamente distinguibles: (Bunge 1972)
Las citas anteriores, algunas de ellas demasiado extremas, son evidencia de
la importancia que para los tratadistas de la ciencia, la metodologa cientfica y
la investigaci
on, tienen la medici
on y la cuantificaci
on. Pero es conveniente
tratar de responder a la inquietud relativa a si estos conceptos significan lo
mismo, si tienen la misma acepci
on y aplicacion.
En el sentido m
as corriente y elemental, el concepto de medir es utilizado
para significar la asignaci
on de valores num
ericos o dimensiones a un objeto
u objetos mediante la utilizaci
on de determinados procedimientos. En terminos
m
as estrictamente metodol
ogicos, la medicion consiste sustancialmente
en una observaci
on cuantitativa, atribuyendo un n
umero a determinadas
caractersticas o rasgos del hecho o fen
omeno observado. Esto no presenta
mayores inconvenientes si se trata de medir aspectos materiales y morfologicos
de los objetos de estudio; la dificultad aparece cuando se desean expresar
numericamente aspectos m
as evanescentes e intangibles.
Cuando un fsico habla acerca de la medicion, se refiere generalmente a
la asignaci
on de n
umeros a observaciones, de modo que los n
umeros sean
susceptibles de an
alisis por medio de manipulaciones u operaciones de acuerdo
con ciertas reglas. Este an
alisis por manipulacion, en el mejor sentido de la
palabra, dar
a nuevas informaciones de los objetos que se estan midiendo. En
otras palabras, la relaci
on entre los objetos que se estan observando y los
n
umeros, es tan directa que mediante la manipulacion de los n
umeros el fsico
obtiene nueva informaci
on acerca de los objetos. Por ejemplo, puede determinar
el peso de una masa de material homogeneo que haya sido partida por la mitad,
dividiendo su peso por dos.
En las ciencias sociales, el cientfico social, que toma al fsico como modelo,
suele intentar algo parecido a la calificaci
on o medicion de las variables sociales;
pero, en sus escalas, el investigador social muy a menudo menosprecia un
fundamento de la teora de la medici
on.
Pasa por alto que, para hacer ciertas operaciones con los n
umeros que ha
asignado a las observaciones, la estructura del metodo de correspondencia de
los n
umeros (puntajes) a las observaciones debe ser isom
orfica con respecto a
alguna estructura numerica que incluya estas operaciones. Si los dos sistemas
son isom
orficos, sus estructuras son las mismas en las relaciones y operaciones
14
2.4. SISTEMA CONCEPTUAL BASICO
15
16
Aunque se acepta que los elementos presentados por (Bunge 1972) son
necesarios, sin embargo no son suficientes para emprender una operacion de
medici
on y consecuentemente tratar de establecer las diferentes escalas o niveles
de medici
on, concepto este que se adoptar
a, mas como proceso de observacion,
que como proceso de an
alisis.
El proceso de medici
on tiene como prop
osito inicial distinguir y por ende
clasificar objetos, casos, fen
omenos y debe responder a una serie de principios
o requisitos que se enuncian a continuaci
on.
En primer lugar el proceso de medici
on debe ser v
alido, entendiendose
que cumple este requisito cuando mide de alguna manera demostrable aquello
que trata de medir, libre de distorsiones sistematicas. Cabe anotar que existen
diferentes metodos de validaci
on, a saber: La validez pragm
atica, consistente
en encontrar un criterio exterior al instrumento de medida, para relacionarlo
con las puntuaciones obtenidas. La validez predictiva, que se comprueba por
los resultados obtenidos en el futuro, y la validez concurrente, que contrasta
resultados de otros elementos de juicio, con tipos de validez pragmatica. Otro
procedimiento de validaci
on es el an
alisis factorial, aunque su aplicacion se
limita principalmente a los aspectos psicosociales.
El segundo principio deseable en la medici
on es la fiabilidad. Una medicion
es confiable o segura cuando aplicada repetidamente a un mismo individuo o
grupo, o al mismo tiempo por investigadores diferentes, proporciona resultados
iguales o por lo menos parecidos. La determinacion de la confiabilidad consiste
pues, en establecer si las diferencias de resultados se deben a inconsistencias en
la medida.
El problema de la fiabilidad se presenta en el instrumental que se utiliza,
cuando la validez de las mediciones ofrece dudas en relacion con lo que se
quiere medir. Los procedimientos m
as usuales para la determinacion de la
fiabilidad son el an
alisis de la estabilidad de los resultados, mediante la
aplicaci
on de mediciones repetidas y la equivalencia de los resultados cuando
los instrumentos son administrados por diferentes personas.
Finalmente se tiene el principio de la precisi
on. Se puede decir que una
medici
on es precisa cuando localiza con exactitud satisfactoria, en relacion con
el prop
osito que se busca, la posici
on del fen
omeno que se estudia.
El nivel de medida o escala de medida, expresiones aceptadas casi
universalmente, est
a formado por un conjunto de numerales distintos y un
conjunto de modalidades distintas relacionadas biunvocamente. Se suelen
distinguir cuatro niveles de medici
on que dan lugar a cuatro niveles de escalas:
nominal ordinal o de orden jer
arquico, de intervalos y de razon o cociente.
Ahora bien, el tipo de escala estar
a dado, seg
un sea verificable uno u otro tipo
de relaci
on.
2.4. SISTEMA CONCEPTUAL BASICO
2.4.3.2.
17
La Escala Nominal
2.4.3.3.
La Escala Ordinal
18
La Escala de Intervalo
2.4. SISTEMA CONCEPTUAL BASICO
19
la escala de intervalo es
unica hasta una transformacion linea1. La escala
de intervalo es la primera escala verdaderamente cuantitativa. Las estadsticas
parametricas, son las aplicables a estudios en estas escalas.
2.4.3.5.
La Escala de Raz
on
Cuando una escala tiene todas las caractersticas de una escala de intervalo
y adem
as un punto cero real en su origen, se llama escala de razon. Ademas
de distinci
on, orden y distancia, esta es una escala que permite establecer en
que proporci
on es mayor una categora de una escala que otra. El cero absoluto
o natural representa la nulidad de lo que se estudia.
Las operaciones y relaciones hechas con los valores numericos en una escala
de raz
on son correspondientes a una escala isomorfica de la estructura de la
aritmetica. Por consiguiente las operaciones de la aritmetica son permisibles en
los valores numericos asignados a los objetos mismos, as como tambien en los
intervalos entre los n
umeros como sucede en las escalas de intervalo. Implican
que las relaciones de equivalencia, relaci
on de mayor a menor, proporcion
conocida de dos intervalos y proporci
on conocida de dos valores de la escala,
sean posibles de obtener operacionalmente.
Los n
umeros asociados con los valores de la escala de razon son verdaderos
n
umeros con un verdadero cero; solo la unidad de medida es arbitraria. As la
escala de raz
on es
unica hasta la multiplicacion por una constante positiva.
Adem
as de los procesos parametricos b
asicos de las escalas de intervalo, en las
de raz
on pueden utilizarse estadsticas como la media geometrica, el coeficiente
de variaci
on, las que requieren el conocimiento del verdadero valor cero.
2.4.4.
El Censo o Enumeraci
on Completa
Un censo o enumeraci
on completa consiste en desarrollar los estudios
estadsticos, identificando y ubicando a TODOS los elementos del colectivo
o agregado, para obtener de ellos la informacion necesaria sobre las variables
de interes, con el fin de analizarla e interpretarla.
Este metodo presenta las siguientes caractersticas:
No requiere de procesos de inferencia estadstica
Sus resultados sirven de marco muestral a otros estudios
Facilita la realizaci
on de estudios en subcolectivos
Produce costos demasiado altos, en todo tipo de recursos
Implica un complicado proceso de planeacion, organizacion y control
20
2.4.5.
El Muestreo
2.4. SISTEMA CONCEPTUAL BASICO
21
2.4.6.
Los Par
ametros y las Estadsticas
CAPITULO
Metodologa de la Estadstica
3.1.
Definici
on de Objetivos
3.2. DEFINICION
3.2.
23
Definici
on del colectivo o poblaci
on
Tan fundamental para lograr buenos resultados del estudio, como la fase
anterior, lo es la de definici
on del colectivo o poblacion, la cual, a ser realizada
en forma clara, concreta, concisa y unificada, debe hacer referencia al contenido,
las unidades, la extensi
on y momento de consideracion de la misma.
La naturaleza de los elementos que forman el colectivo, su estructura y
configuraci
on temporo espacial, son aspectos que determinan hasta cierto
punto, el tipo de muestreo m
as conveniente a utilizar, el marco adecuado, los
metodos de obtenci
on de la informaci
on y otros conceptos similares.
En m
ultiples ocasiones se diferencia la Poblaci
on Objetivo, que es aquella
a la cual se refiere en terminos generales la investigacion, de la Poblaci
on
de Estudio, Maestreo o An
alisis, definida como la poblacion objetivo con
una serie de restricciones, generadas por la misma naturaleza del estudio,
falta de cobertura del marco de muestreo, problemas de no respuesta, etc.
En sentido estricto, solo queda representada en la muestra la poblacion de
estudio o de encuesta, pero su descripci
on puede ser difcil si se quiere hacerlo
especficamente, por lo que es m
as frecuente hacer referencia a la poblacion
objetivo definida.
3.3.
Determinaci
on de la cobertura
3.4.
3.4.1.
Determinaci
on del marco de muestreo
Definici
on
24
3.4.2.
Los problemas m
as comunes en la determinacion del marco muestral son:
Unidades vacas, llamado tambien elementos faltantes, falta de cobertura
o marco incompleto y que consiste en que algunos elementos del agregado,
no aparecen en el marco
Blancos y extra
nos, corresponde este problema a situaciones en las cuales
el marco contiene elementos que ya no pertenecen a la poblacion por
haber cambiado su estructura o porque definitivamente desaparecieron
de la misma.
Conglomerados de unidades muestrales, pueden aparecer juntas asociadas
con un listado aislado.
Un elemento del marco representa a m
as de una unidad muestral
Unidades duplicadas, problema que se presenta cuando una unidad
aparece m
as de una vez en el marco.
3.4.3.
Soluciones Generales
DE UNIDADES
3.5. DEFINICION
25
3.5.
Definici
on de unidades
3.5.1.
Unidad Poblacional
3.5.2.
Unidad Muestral
Se constituye en el elemento b
asico para la seleccion de la muestra de
unidades poblacionales. Pueden ser estas mismas o grupos de ellas, como sucede
en el muestreo por conglomerados. Deben estar definidas en forma tal que cada
unidad poblacional pertenezca a una y solo una unidad de muestreo.
Se subdividen en unidades parciales, que son aquellas que aparecen en razon
del proceso de selecci
on y constituyen siempre subdivisiones de la poblacion a
traves de las cuales ha de pasarse, antes de llegar a las unidades finales, definidas
estas u
ltimas como aquellas que tienen caractersticas definidas de permanencia
y son f
acilmente distinguibles en perodos mas o menos largos de tiempo.
3.5.3.
Unidades de Observaci
on
26
3.6.
Determinaci
on del dise
no muestral
3.6.1.
Muestreo No Probabilstico
DE INFORMACION
3.7. RECOLECCION
27
3.6.2.
Muestreo Probabilstico
3.7.
Recolecci
on de informaci
on
28
3.8.
Tratamiento de la informaci
on
3.8.1.
Distribuciones de Frecuencias
3.8. TRATAMIENTO DE LA INFORMACION
29
3.8.2.
Clasificaci
on Unidimensional
m
P
nj = n
j=1
En la mayora de estudios, m
as que saber el n
umero de casos por clase,
interesa mucho m
as su proporci
on respecto al total de casos considerados,
pues en general las cifras relativas son mas analticas que los datos
absolutos. Se definen as las llamadas frecuencias relativas o simplemente
frecuencias, como el cociente entre la frecuencia absoluta de cada clase y
el total de casos, simb
olicamente:
fj =
nj
n
30
m
P
fj = 1
j=1
Para el an
alisis de t
opicos importantes dentro de los procesos estadsticos, es
necesario, especialmente en el caso de variables cuantitativas, adicionar clase
por clase, las frecuencias tanto absolutas como relativas. El resultado de tal
operaci
on es conocido como las frecuencias acumuladas, las cuales en el
caso relativo corresponden a la imagen emprica de la Funcion de Distribucion
de una variable aleatoria.
Estas frecuencias, se representan generalmente por Nj y Fj , absolutas y
relativas respectivamente y dada alguna clase de la variable, por ejemplo la p
esima, se tendr
a:
p
p
X
X
Np =
nj ;
Fp =
fj
j=1
j=1
Tabular y simb
olicamente el proceso la siguiente forma:
CLASES
C1
C2
..
.
Cj
..
.
Cm
TOTAL
FRECUENCIAS
ABSOLUTAS
n1
n2
..
.
nj
..
.
nm
N
FRECUENCIAS
RELATIVAS
f1
f2
..
.
fj
..
.
fm
1
El agrupamiento de la informaci
on permite ir detectando propiedades o
comportamientos regularizados de los datos, si existen, y como se anoto, es
fundamental para visualizar la relaci
on entre la probabilidad y los metodos
estadsticos.
3.8. TRATAMIENTO DE LA INFORMACION
31
3.8.3.
Clasificaci
on Bi y Pluridimensional
Son m
ultiples los estudios en los cuales interesa analizar el comportamiento
conjunto de dos o m
as variables, especialmente con miras a tratar de establecer
la posible relaci
on existente entre ellas y primer paso tras tal objetivo, es
clasificar los datos con relaci
on a dos (o mas) variables simultaneamente.
Las siguientes anotaciones del caso bidimensional, se pueden facilmente hacer
extensibles para m
as de dos variables.
Determinadas las clases para cada una de las dos variables, estas se disponen
en una tabla de doble entrada en la cual las filas y columnas principales
se destinan para presentar dichas clases. Las casillas al interior de la tabla,
constituyen las clases bidimensionales o clases conjuntas, correspondiendo a
la intersecci
on de una clase de alguna de las variables, con una clase de la otra.
Es usual, sobretodo en computaci
on, referirse en estos casos a clases o tablas
cruzadas.
Las frecuencias, resultado del conteo del total de casos en cada clase
conjunta, se llaman por extensi
on l
ogica frecuencias bidimensionales y las
de tipo relativo se asocian, a nivel emprico, con el concepto de probabilidad
conjunta o probabilidad de la intersecci
on de dos eventos.
Si se denota por Cj alguna de las m clases de una de las caractersticas,
generalmente la ubicada en la columna, y por Bk algo similar para alguna de las
w clases de la otra variable, las frecuencias absolutas bidimensionales presentan
las siguientes caractersticas y propiedades:
njk =frecuencia de casos en la clase j esima de C y la k esima de B.
nj = frecuencia de casos en la j esima clase de C, sin tener en cuenta a la
variable B (marginales de C)
nk = frecuencia de casos en la k esima clase de B, sin tener en cuenta a la
variable C (marginales de B)
con las siguientes propiedades l
ogicas:
a. njk 0
b. njk n
c. njk nj
d. njk nk
e.
m P
w
P
j=1 k=1
njk = n
32
f.
w
P
njk = nj
k=1
g.
m
P
njk = nk
j=1
Las dos u
ltimas propiedades indican que al sumar las frecuencias
bidimensionales, sobre el recorrido de una de las variables, se obtienen
las unidimensionales de la otra, conocidas com
unmente como frecuencias
marginales. Los puntos en la notaci
on simbolica de estas u
ltimas se refieren
a la variable que no se est
a considerando.
Las frecuencias relativas, tienen las siguientes propiedades logicas:
n
fjk = jk = P (Cj Bk )
n
a. fjk 0
b. fjk 1
c.
m P
w
P
fjk = 1
j=1 k=1
d.
w
P
fjk = nj
k=1
e.
m
P
fjk = nk
j=1
33
3.9. ANALISIS
E INTERPRETACION
La presentaci
on tabular de las frecuencias absolutas, tendra la siguiente
forma:
CLASES
C1
C2
..
.
Cj
..
.
Cm
TOTAL
B1
n11
n21
..
.
nj1
..
.
nm1
n1
B2
n12
n22
..
.
nj2
..
.
nm2
n2
...
...
...
..
.
...
..
.
...
...
Bk
n1k
n2k
..
.
njk
..
.
nmk
nk
...
...
...
..
.
...
..
.
...
...
Bw
n1w
n2w
..
.
njw
..
.
nmw
nw
TOTAL
n1
n2
..
.
nj
..
.
nm
n
Cuando se consideran m
as de dos variables simultaneamente, el proceso se
denomina clasificaci
on m
ultiple o pluridimensional y a partir de la consideracion
conjunta de todas las variables, es posible deducir todas las situaciones de orden
menor. No es muy com
un presentar cuadros conjuntos para mas de tres o cuatro
variables, pero los aspectos conceptuales se pueden desarrollar por partes, de
una manera relativamente sencilla.
3.9.
An
alisis e Interpretaci
on
34
CAPITULO
4.1.
Introducci
on
4.2.
4.2.1.
An
alisis b
asico en tablas 2 x 2
Notaci
on y Consistencia
En esta secci
on se presenta el caso en que se consideran dos
variables clasificadas cada una dicot
omicamente (dos categoras mutuamente
excluyentes), produciendo cuatro clases conjuntas, como en la siguiente tabla:
35
36
CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS
CLASES
A1
A2
TOTAL
B1
n11
n21
n1
B2
n11
n21
n2
TOTAL
n1
n2
n
4.2.2.
Independencia y Correspondencia
Para el an
alisis b
asico de los datos, desde el punto de vista de la posible
existencia de relaci
on entre las caractersticas, el punto de partida consiste en
suponer que tal relaci
on no existe, lo cual en el caso absoluto, implica que
no existe relaci
on alguna entre cada una de las clases de una de las variables
y cada una de las de la otra. La no existencia de alg
un tipo de relacion o
correspondencia de comportamiento entre las dos variables se conoce como
INDEPENDENCIA.
4.2. ANALISIS
BASICO
EN TABLAS 2 X 2
37
El supuesto o Hip
otesis de independencia se puede plantear para las dos
variables en su conjunto o solamente entre algunas de las clases, situacion esta
u
ltima en la cual, el supuesto implica que la distribucion de casos en alguna clase
de una de las variables, debe presentar la misma proporcion en las dos clases
de la otra. Simb
olicamente este criterio de independencia, se expresa de
la siguiente forma para el caso de la clase A1 con respecto a las clases B1 y B2 :
n
n11
= 12
n1
n2
De esta relaci
on se deducen inmediatamente las similares:
n21
n
= 22 ;
n1
n2
n12
n
= 22 ;
n1
n2
n11
n
= 21
n1
n2
n12
n
= 2
n1
n
De manera similar.
n12
n
n n
n
n n
= 1 n12 = 1 2 12 = 1 2
n2
n
n
n
n n
Esta u
ltima forma obtenida aqu descriptivamente, corresponde al criterio de
independencia probabilstica entre dos eventos cualesquiera, que para el caso
de la intersecci
on de los mismos expresa que:
P (A1 B2 ) = P (A1 )P (B2 )
lo cual equivale a que si entre dos clases de dos variables existe independencia,
la proporci
on de casos en la clase conjunta, con respecto al total de casos, es
igual al producto entre las proporciones de casos, con respecto al total, de cada
clase.
Si la anterior relaci
on se verifica, relaciones analogas se verificaran para las
otras tres clases conjuntas y por tanto se puede encontrar otra forma del criterio
de independencia, considerando que:
n12 n21 =
n1 n2 n2 n1
n2
38
CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS
n1 n1
n
los casos de la clase conjunta son menos de los esperados, situacion que lleva
a hablar de asociaci
on negativa o disociaci
on, en el sentido de que las clases
positivas tienden a no concordar. De acuerdo con lo anotado, se debe hablar
m
as bien en terminos de clases correspondientes o no correspondientes.
n11 <
4.2. ANALISIS
BASICO
EN TABLAS 2 X 2
39
40
CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS
22
Se deduce que:
2Y
1+Y2
Los anteriores indicadores son fundamentalmente descriptivos, pero no implican
necesariamente la existencia de independencia o de relacion, ya que para
rechazar el supuesto de independencia, es necesario desarrollar pruebas de
hip
otesis estadsticas, tema que se presentar
a posteriormente en estas notas.
Q=
41
4.2. ANALISIS
BASICO
EN TABLAS 2 X 2
4.2.3.
Clasificaci
on Multivariada Dicot
omica
C1
B1
n111
n211
n11
C2
B2
n121
n221
n21
B1
n112
n212
n12
B2
n122
n222
n22
TOTAL
n1
n2
n
42
CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS
A1 y B2 ser
an concordantes o correspondientes en el subcolectivo de los C1 ,
si:
n121 >
n11 n21
n1
n121
n21
>
n11
n1
2.
n121
n11
>
n21
n1
3.
n121
n21
>
n111
n11
4.
n121
n11
>
n221
n21
4.3.
Clasificaci
on m
ultiple
43
MULTIPLE
4.3. CLASIFICACION
nj nk
n
njk njke
=0
j=1 k=1
El ndice com
unmente propuesto corresponde a una variable Chi cuadrado,
que se utiliza fundamentalmente dentro de un proceso de prueba de hipotesis
de independencia, similar a la presentada en el caso 2 x 2 y que es:
2 =
2
m X
w
njk njke
X
j=1 k=1
njke
w
m X
X
n2jk
j=1 k=1
njke
CAPITULO
5.1.
5.1.1.
La Media Aritm
etica
45
M (x) = x
=
1X
x
n i=1 i
M (x) = x
=
X
1X
x j nj =
x j fj
n j=1
j=1
m
P
j=1
!
xj
m
P
M xj
j=1
6. M (x k) = M (x) k
7. M (kx) = kM (x)
8. M (k1 k2 x) = k1 k2 M (x)
!
m
m
Q
Q
xj =
M xj si las variables son independientes.
9. M
j=1
j=1
46
CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA
m
X
Mj (x)
j=1
nj
n
5.1.2.
La Varianza
700
698
50
700
699
100
700
700
350
700
701
1000
700
702
2000
Se puede comprobar f
acilmente que en los tres casos el promedio es 700,
pero no por esto se puede decir que los datos se comportan igual, en terminos
generales.
Evidentemente, mientras en el conjunto I los valores se concentran
exactamente en 700, en el II tienden a agruparse, en forma bien marcada,
alrededor de tal n
umero, pero no tiene sentido alguno hablar en el caso III,
de que realmente los datos muestren alguna tendencia y menos que ella sea
alrededor de 700. No se puede creer con fe ciega, en la representatividad del
promedio.
47
Retomando el primer p
arrafo de este subcaptulo, por definicion de la media,
la suma de las diferencias entre los datos y esta, es siempre nula. Para obviar
el problema, se toman los cuadrados de tales diferencias y se promedian,
gener
andose as una de las medidas de dispersion mas importantes dentro
de los an
alisis estadsticos, conocida como la varianza, con la siguientes
expresiones simb
olicas:
n
V (x) = S 2 =
1X 2
1X
2
(xi x
) =
x x
2
n i=1
n i=1 i
m
m
n
X
2
2
1X 2
1X
x j x
fj =
x j x
nj =
x i nj x
2
n j=1
n
j=1
i=1
m
P
j=1
!
xj
m
P
V xj si las variables son independientes.
j=1
4. V (x k) = V (x)
5. V (kx) = k 2 V (x)
6. V (k1 k2 x) = k22 V (x)
7. Sea x sobre un conjunto particionado en m subconjuntos y sean: nj ,
Mj (x) y Vj (x) la parte de datos y la media aritmetica y la varianza de la
48
CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA
m
X
j=1
Vj (x)
2 nj
nj X
Mj (x) MT (x)
+
n
n
Esta u
ltima propiedad es conocida como descomposicion elemental de
la varianza y es la base, entre otros, de los llamados estudios de dise
no
experimental y muestra que en estos casos la medida resulta de promediar
las varianzas de los subconjuntos y adicionarle la varianza de las medias de los
mismos.
Al promedio de las varianzas se le denomina INTRAVARIANZA y a la
varianza de las medias INTERVARIANZA o sea que:
Varianza del total = Intravarianza + Intervarianza
Como cada varianza mide la dispersi
on dentro de cada subgrupo, la
intravarianza es una medida promedio de la variacion DENTRO de los
mismos. La media de cada subgrupo, representa su tendencia, por lo que la
intervarianza mide la dispersi
on entre ellas y por tanto ENTRE aquellos, de
tal manera que la dispersi
on del total de datos se debe en parte a la dispersion
dentro de los subgrupos y en parte a la dispersion entre ellos.
Esta propiedad y su an
alisis, llamado por ello Analisis de Varianza,
corresponde a una visi
on muy reducida y simple de multitud de variantes y
aplicaciones que descomposiciones similares, pueden hacer de esta importante
medida.
5.1.3.
La desviaci
on est
andar y el coeficiente de variaci
on
49
5.1.4.
Los Percentiles
5.1.5.
La Moda
50
CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA
La determinaci
on de la moda corresponde a un proceso eminentemente
observacional asociado con su concepci
on: detectar cual es el valor de la variable
que m
as se repite o que tiene mayor frecuencia. Para datos agrupados en forma
continua este proceso se realiza mediante la forma:
nk nk1
Md = x k1 + ck
2nk nk1 nk+1
correspondiendo k, a la clase con mayor frecuencia.
El sentido de esta medida es el mismo que tiene el concepto en su utilizacion
vulgar y presenta la mismas caractersticas de inestabilidad, no unicidad y
naturaleza de comportamiento frecuencial de tal concepcion.
CAPITULO
6.1.
La regresi
on
En m
ultiples estudios estadsticos, aparece como una gran necesidad
pr
actica, el considerar simult
aneamente dos o mas variables, con el fin de
analizar si entre ellas existe alguna relaci
on, si la misma se puede formalizar
y que tan intensa es la misma. Se trata de establecer fundamentalmente, con
respecto a la relaci
on:
la existencia
la forma
la intensidad
Los metodos estadsticos utilizados para estos analisis son conocidos como
Metodos de Regresi
on y Correlaci
on y el supuesto de partida para su desarrollo,
considera que algunas de las variables explican en parte, el comportamiento
de otras. Este supuesto establece una division general entre las variables
consideradas, clasific
andolas en dos grupos constituidos por las variables
explicativas y las variables explicadas.
El objetivo de este tipo de procesos es tratar de estimar o predecir
o conjeturar valores de las variables explicadas, con base en valores
dados o supuestos de las explicativas. Por tal razon son llamadas tambien
estas, variables explicativas o predictoras y las anteriores variables
estimadas o predictando. Otros nombres no muy adecuados, son los de
51
52
DE LA VARIACION
DEL MODELO
6.2. LA EXPLICACION
53
6.2.
La explicaci
on de la variaci
on del modelo
REGRESION,
que fundamentalmente consiste en la siguiente descomposicion
de la suma de cuadrados de valores corregidos por la media para la variable
explicada:
2 X
2
X
2 X
Y Y =
Y Y +
Y Y
i
54
R2 , o sea:
R2 =
Variaci
on explicada
Variaci
on total
Como se anot
o anteriormente, esta descomposicion es trascendental en el
an
alisis e interpretaci
on del modelo, as como en los procesos inferenciales
correspondientes y aunque no es la u
nica, si es fundamental para otros analisis
similares m
as complejos.
CAPITULO
7.1.
Teoremas b
asicos de Probabilidad
7.1.1.
Definici
on cl
asica
n
P Aj = j
n
nj =resultados favorables; n =resultados posibles
7.1.2.
Teoremas b
asicos
7.1.2.1.
P Aj Ak = P (Aj ) + P (Ak ) P (Aj Ak );
si
Aj Ak 6=
Generalizaci
on
!
m
m
m
X
X
[
Ai =
P (Ai )
P (Ai Aj )
P
i=1
i=1
i<j
m
X
P (Ai Aj Ak ) + (1)
m1
m
\
i=1
i<j<k
si Ai Aj 6=
55
i 6= j
!
Ai
56
7.1.2.2.
P Ai Aj =
m
\
si Ai y Aj son independientes
P (Ai ) P Aj |Ai ;
si Ai y Aj no son independientes
!
Ai
i=1
m
\
P (Ai ) P Aj ;
m
Y
i=1
!
Ai
i=1
Probabilidad condicional
P (Aj |Ai ) =
7.1.2.4.
P (Aj Ai )
; con P (Ai ) > 0
P (Ai )
7.1.2.5.
7.2.
Funci
on de probabilidades
DE DISTRIBUCION
7.3. FUNCION
ii.
fX (x) = 1
en el caso discreto
fX (x)dx = 1
en el caso continuo
57
si la variable es discreta
P (X = xj ) = fX (xj )
xj
R
P
(x
x
)
=
fX (x)dx
i
j
si la variable es continua
xi
7.3.
Funci
on de distribuci
on
x=
FX (xj ) =
xj
es la funci
on de distribuci
on o funci
on acumulativa de probabilidades de la
variable alatoria X, con ella se obtiene:
P (X xj )
7.4.
Valor esperado
E(X) = =
xfX (x)
x=
si la variable es discreta
xfX (x)dx
si la variable es continua
PROPIEDADES
1. E(X)
2. E(X ) = 0
58
3. E(X )2 = mn
4. E(k) = k
5. E
m
P
!
=
Xj
j=1
m
P
E Xj
j=1
6. E(X k) = E(X) k
7. E(kX) = kE(X)
8. E(k1 k2 X) = k1 k2 E(X)
!
m
m
Q
Q
9. E
Xj =
E Xj si las variables son independientes.
j=1
j=1
m
X
Ej (X)fj (x)
j=1
7.5.
La varianza
V (X) = 2 =
P
2
(x ) fX (x) =
x2 fX (x) 2
x=
x=
si la variable es discreta
R
R 2
(x ) fX (x)dx =
x fX (x)dx 2
si la variable es continua
PROPIEDADES
1. V (X) 0
2. V (k) = 0
3. V
m
P
j=1
!
Xj
m
P
V Xj si las variables son independientes.
j=1
4. V (X k) = V (X)
5. V (kX) = k 2 V (X)
6. V (k1 k2 X) = k22 V (X)
59
m
X
Vj (X)fj (x) +
2
Ej (X) ET (X) fj (x)
j=1
7.6.
7.6.1.
a. Fen
omeno o experimento que puede resultar en uno solo de dos posibles
resultados, llamados genericamente ACIERTO (A) o FRACASO (F).
b. La probabilidad de acierto P es conocida y por ende la de fracaso que
ser
a (1 P ) = Q.
c. Se define la variable aleatoria X, tal que:
7.6.2.
V (X) = P Q
Binomial
60
7.6.3.
Binomial negativa
7.6.4.
k
;
P
V (X) =
kQ
P2
Geom
etrica
7.6.5.
1
;
P
V (X) =
Q
P2
Hipergeom
etrica
a. De un conjunto o poblaci
on de N elementos, se seleccionan al azar y sin
Reemplazamiento n de ellos.
b. En los N elementos existen M con cierta caracterstica de interes.
c. Se quiere determinar la probabilidad de encontrar x elementos con la
caracterstica de interes, en los n que se seleccionen.
61
M
x
N M
nx
N
n
7.6.6.
nM
;
N
V (X) =
nM (N M ) N n
N2
N 1
Poisson
exp{}x
x!
62
7.6.7.
La multinomial
m
P
xj = n
j=1
7.6.8.
m
P
n!
P x1 P x2 Pmxm
x1 !x2 ! xm 1 2
Pj = 1
j=1
Hipergeom
etrica generalizada
a. De un conjunto o poblaci
on de N elementos, se seleccionan al azar y sin
reemplazamieno n de ellos.
b. En los N elementos existen M1 , M2 , . . . , Mm que pertenecen a
subpoblaciones con algunas caractersticas de interes.
c. Se quiere determinar la probabilidad de encontrar xj elementos de la
subpbblaci
on con la caracterstica j, en los n que se seleccionen. j =
1, 2, 3, . . . , m
d. Las variables correspondiente son:
Xj = n
umero de elementos de la subpoblacion con la caracterstica j, en los n
xj = dependen de la relaci
on entre N, n y Mj .
La funci
on es de la forma: con
f (x1 , x2 , . . . , xm ) =
M1
x1
M2
x2
N
n
con
m
P
j=1
Mj = N
m
P
j=1
xj = n
Mm
xm
7.6.9.
63
La normal
Funci
on fundamental de m
ultiples procesos aplicados y teoricos de la
Estadstica, asociada con variables de muy diversa ndole.
Se define:
< x <
para la cual:
(
2 )
1 x
1
exp
n(x; , ) =
2
2
2
siendo:
E(X) = ;
7.6.10.
V (X) = 2
por consiguiente:
< z < ;
E(Z) = 0;
V (Z) = 1
con funci
on de probabilidad:
2
1
z
n(z; 0, 1) = exp
2
2
CAPITULO
8.1.
8.1.1.
65
Inferencia Matem
atica
8.1.2.
Inferencia f
actica
Que se utiliza para evidenciar los juicios mixtos, es decir, elaborados sobre
objetos ideales, pero con antecedente y referencial existencial.
Aqu la verdad de estos juicios, es la conformidad del pensamiento con la
realidad (concepto trascendente de verdad). La certeza con que se poseen estos
juicios es f
actica y se apoya en una necesidad de hecho entre el predicado y
el sujeto del juicio. No es que repugne a la mente pensar el juicio contrario, lo
que sucede es que haciendo esto se ira contra los hechos de la naturaleza.
8.1.3.
Inferencia Estadstica
66
8.1.4.
Inferencia Reductiva
Que es la m
as difcil de definir y discutir. No solamente consiste en observar
datos y hacer experimentos, sino tambien en descubrir mecanismos y relaciones,
as como elaborar modelos y teoras que los expliquen. Constituye la fase mas
importante de la invenci
on o del descubrimiento que tiene lugar mediante la
combinaci
on de ideas que con un esfuerzo constante y profundo transmite el
consciente al subconsciente, en donde estas ideas se multiplican dando lugar
a un gran n
umero de combinaciones de las cuales es preciso extraer las mas
u
tiles.
Por ello es difcil establecer reglas para esta clase de inferencia, ya que no
es f
acil comprenderla completamente, de aqu que en los esquemas teoricos se
haga siempre enfasis en las inferencias deductiva e inductiva.
8.2.
Inferencia estadstica
8.2.1.
67
Inferencia Cl
asica
8.2.2.
Inferencia bayesiana
Es la concepci
on en la cual se da entrada formal a la informacion a
priori. La inferencia se basa en esta informacion y en la que proporcionan los
datos de la muestra Esta concepci
on supone admitir que los parametros que
figuran en las distribuciones poblacionales son susceptibles de aleatorizacion
con distribuciones subjetivas a priori, las cuales se van revisando a la luz de las
nuevas informaciones muestrales pasando a las distribuciones de probabilidad
a posteriori a traves de las cuales se plantean los problemas de inferencia.
En estas notas, nos limitaremos a discutir algunos aspectos de la inferencia
cl
asica, para lo cual es conveniente recordar algunas ideas relativas a las
distribuciones muestrales.
8.3.
Distribuciones en el muestreo
68
x2 ,
x02 ,
x002 ,
..
.
x3 ,
x03 ,
x003 ,
..
.
x4 , . . . , xn
x04 , . . . , x0n
x004 , . . . , x00n
..
..
..
.
.
.
Por ser el muestreo aleatorio, los primeros valores en cada una de las posibles
muestras son una variable aleatoria e igual sucede con los segundos, terceros,
hasta los n esimos, constituyendose el manejo de las muestras al nivel de la
teora, en el manejo de una variable aleatoria n dimensional conformada por
cada variable asociada con cada uno de los valores muestrales.
Es trivial que cada variable que se refiere a un valor muestral, tiene la
misma distribuci
on de la variable en la poblacion, con sus mismos parametros,
particularmente con la misma media o valor esperado y la misma varianza. Si
adem
as el muestreo es aleatorio simple, los valores muestrales son variables
aleatorias independientes y su funci
on de probabilidad conjunta sera el
producto de las funciones de cada una de las variables valores muestrales. Tal
funci
on de probabilidad conjunta de los valores muestrales es conocida como la
funci
on de verosimilitud de una muestra.
O sea que al nivel poblacional, X es una v.a. con una distribucion
poblacional, un valor esperado y una varianza expresados por
f (x; ),
V (X) = 2
E(X) = ,
Por consiguiente el j esimo valor muestral (Xj ) es una variable aleatoria con:
f (xj ; ),
V (Xj ) = 2
E(Xj ) = ,
Y la funci
on de verosimilitud de una muestra sera:
n
Y
f (x1 , x2 , x3 , . . . , xn ) =
f (xj ; )
j=1
69
E(T ),
V (T )
= ,
E(X)
=
V (X)
2 N n
n N 1
70
Valores muestrales
20 25 20 35
20 25 20 25
20 25 20 20
20 25 20 30
20 25 35 25
20 25 35 20
20 25 35 30
20 25 25 20
20 25 35 30
20 25 20 30
20 20 35 25
20 20 35 20
20 20 35 30
20 20 25 20
20 20 25 30
20 20 20 30
20 35 25 20
20 35 25 30
20 35 20 30
20 25 20 30
25 20 35 25
25 20 35 20
25 20 35 30
25 20 25 20
25 20 25 30
25 20 20 30
25 35 25 20
25 35 25 30
25 35 20 30
25 25 20 30
20 35 25 20
20 35 25 30
20 35 20 30
20 25 20 30
35 25 20 30
Media
25,00
22,50
21,25
23,75
26,25
25,00
27,50
22,50
25,00
23,75
25,00
23,75
26,25
21,25
23,75
22,50
25,00
27,50
26,25
23,75
26,25
25,00
27,50
22,50
25,00
23,75
26,25
28,75
27,50
25,00
25,00
27,50
26,25
23,75
27,50
Proporcion
0,50
0,50
0,25
0,50
0,75
0,50
0,75
0,50
0,75
0,50
0,50
0,25
0,50
0,25
0,50
0,25
0,50
0,75
0,50
0,50
0,75
0,50
0,75
0,50
0,75
0,50
0,75
1,00
0,75
0,75
0,50
0,75
0,50
0,50
0,75
71
21,25
0,057
22,5
0,114
23,75
0,2
25
0,257
26,25
0,171
27,5
0,171
28,75
0,028
DE LA PROPORCION
MUESTRAL
DISTRIBUCION
Proporci
on muestral
Probabilidad
0,25
0,114
0,5
0,514
0,75
0,343
1
0,029
Se comprueba f
acilmente que:
= ,
E(X)
2
= N n
V (X)
n N 1
y adem
as que:
PQ N n
n N 1
Como se anot
o anteriormente, en la pr
actica estos procedimientos para deducir
la distribuci
on de una estadstica y sus propiedades basicas, es objeto de estudio
de la Teora Estadstica y aunque actualmente se cuenta con muchas de tales
distribuciones, es todava muy extenso el camino por recorrer en este sentido, lo
que se convierte en una gran cantea a
un por explotar en la ciencia, estadstica.
E(P ) = P,
V (P ) =
CAPITULO
La estimacion estadstica
9.1.
Generalidades
73
9.2.
9.2.1.
Insesgamiento
74
ESTADISTICA
CAPITULO 9. LA ESTIMACION
9.2.2.
Consistencia
9.2.3.
Eficiencia relativa
Es esta una propiedad asociada con el error del estimador o mejor con su
error cuadr
atico medio:
i
h
2
ECM (T ) = E (T )
9.2.4.
75
Suficiencia
9.3.
76
ESTADISTICA
CAPITULO 9. LA ESTIMACION
/ n
+
P X
X
=1
n
n
Como se aprecia en el estimador por intervalo anterior, este vara seg
un
vare la media muestral y la estructura presentada se puede mantener hasta
77
tanto se calculen los valores de los lmites con base en una muestra dada, caso
en el cual solo se puede decir que el obtenido es un intervalo de tal nivel
de confianza para estimar la media muestral.
La buena utilizaci
on de los procesos de estimacion, tanto puntual, como mas
usualmente por intervalo, solo se logra en la medida que se tenga la suficiente
claridad conceptual sobre la filosofa que sustenta tales procesos.
CAPITULO
10
10.1.
Hip
otesis nula Hip
otesis alternativa
probar o hip
otesis de investigaci
on, es llamada com
unmente la HIPOTESIS
ALTERNATIVA. Para hacerlo, se prueba alguna hipotesis contraria, a la
79
de pruebas de hip
otesis estadsticas conduce a una de dos decisiones respecto a
la hip
otesis planteada consistentes en rechazarla o no rechazarla, concepto
este u
ltimo muy diferente al de aceptarla. Cuando la hipotesis nula no es
rechazada, el estadstico prefiere decir que reserva su juicio (en hogar de decir
que la acepta). Lo que quiere decir con reserva su juicio es que, con base en
la informaci
on muestral reunida, no tiene evidencia suficiente para rechazar
la hip
otesis nula. Sin embargo, para todo efecto practico, un estadstico que
reserva su juicio est
a en cierto modo aceptando la hipotesis nula sin decirlo y
sin comprometerse.
En terminos m
as usuales se denomina hipotesis nula, representada por H0 ,
a aquella sobre la cual se centra el proceso de prueba conducente a rechazarla
o no, y se denomina hip
otesis alterna, cuyo smbolo mas utilizado es H1 , a
cualquier forma de contradicci
on de la hipotesis nula. Por costumbre se suele
hablar de la hip
otesis, para referirse a la nula y de la alternativa, para mencionar
a la alterna, utilizaci
on que se adoptara en esta presentacion.
De acuerdo con la forma como se planteen la hipotesis y la alternativa, se
tendr
an las siguientes situaciones generales:
a. una simple contra una simple (poco com
un)
b. una compuesta contra una simple (poco com
un)
c. una simple contra una compuesta (bastante usual)
d. una compuesta contra una compuesta (muy utilizada)
10.2.
HIPOTESIS
Verdadera
Falsa
DECISION
No rechazarla Rechazarla
Correcto
Error tipo I
Error tipo II
Correcto
80
81
cola.
Una prueba de hip
otesis consiste entonces, en terminos muy simples, en
observar si entre el supuesto que.la hip
otesis nula contenga y la informacion
proporcionada por la muestra, existe diferencia significativa que lleve al rechazo
de aquella, o si tal diferencia es insignificante y se debe a las fluctuaciones
propias del azar, caso en el cu
al se considera que no existe evidencia suficiente
para rechazarla. Por esta visi
on del proceso se habla tambien de PRUEBAS
DE SIGNIFICANCIA, y de all el nombre de nivel de significancia asociado
con la probabilidad de cometer error tipo I.
El concepto del nivel de significancia implica establecer los puntos de
referencia, denominados puntos crticos, hasta los cuales se consideran
insignificantes las diferencias y los cuales a su vez, generan las llamadas zona
de rechazo y zona de no rechazo de la hipotesis.
La base te
orica del nivel de significancia o probabilidad de cometer error
tipo L, hace corresponder a esta con la proporcion de muestras de un tama
no
dado, que pueden llevar a rechazar la hipotesis siendo cierta y por ser su
valor en general muy peque
no (1 %, 5 %, 10 %), conlleva la confianza de que al
rechazar la hip
otesis con base en la informacion de una muestra dada, no se
habr
a cometido el error I.
Es necesario enfatizar que la preocupaci
on por el error I, solo se presentara si
la decisi
on ha sido de rechazar la hip
otesis, en tanto que al no rechazarla,
quedar
a la incertidumbre respecto a si era falsa o sea de haber cometido error
tipo II.
10.3.
82
Bibliografa
1979.
Sage
84
Bibliografa