Você está na página 1de 92

Fundamentos Conceptuales

de Estadstica

Fundamentos Conceptuales
de Estadstica

Oscar F. Soto Bocanegra

Universidad Nacional de Colombia


Facultad de Ciencias
Departamento de Estadstica
Sede Bogota

Indice general

1 Introducci
on
1.1

Formas del saber . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1.1

Saber Cotidiano . . . . . . . . . . . . . . . . . . . . . .

1.1.2

Saber Cientfico . . . . . . . . . . . . . . . . . . . . . . .

Metodo cientfico e investigaci


on . . . . . . . . . . . . . . . . .

1.2.1

Caractersticas de un Metodo Cientfico . . . . . . . . .

1.2.2

Investigaci
on y su Procedimiento . . . . . . . . . . . . .

1.3

La Estadstica y la Investigaci
on . . . . . . . . . . . . . . . . .

1.4

Rese
na hist
orica de la Estadstica . . . . . . . . . . . . . . . . .

1.2

2 Conceptos fundamentales de Estadstica

2.1

Definiciones de Estadstica . . . . . . . . . . . . . . . . . . . . .

2.2

Caractersticas del metodo estadstico . . . . . . . . . . . . . .

10

2.3

Clasificaci
on de los metodos estadsticos . . . . . . . . . . . . .

11

2.4

Sistema conceptual b
asico . . . . . . . . . . . . . . . . . . . . .

11

2.4.1

El Colectivo, Agregado, Poblacion, Universo . . . . . . .

11

2.4.2

Las Variables . . . . . . . . . . . . . . . . . . . . . . . .

12

2.4.3

Escalas de Medici
on o Clasificacion . . . . . . . . . . . .

12

2.4.4

El Censo o Enumeraci
on Completa . . . . . . . . . . . .

19

iv

INDICE GENERAL

2.4.5

El Muestreo . . . . . . . . . . . . . . . . . . . . . . . . .

20

2.4.6

Los Par
ametros y las Estadsticas . . . . . . . . . . . . .

21

3 Metodologa de la Estadstica

22

3.1

Definici
on de Objetivos . . . . . . . . . . . . . . . . . . . . . .

22

3.2

Definici
on del colectivo o poblaci
on . . . . . . . . . . . . . . . .

23

3.3

Determinaci
on de la cobertura . . . . . . . . . . . . . . . . . .

23

3.4

Determinaci
on del marco de muestreo . . . . . . . . . . . . . .

23

3.4.1

Definici
on . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.4.2

Problemas del Marco . . . . . . . . . . . . . . . . . . . .

24

3.4.3

Soluciones Generales . . . . . . . . . . . . . . . . . . . .

24

Definici
on de unidades . . . . . . . . . . . . . . . . . . . . . . .

25

3.5.1

Unidad Poblacional

. . . . . . . . . . . . . . . . . . . .

25

3.5.2

Unidad Muestral . . . . . . . . . . . . . . . . . . . . . .

25

3.5.3

Unidades de Observaci
on . . . . . . . . . . . . . . . . .

25

Determinaci
on del dise
no muestral . . . . . . . . . . . . . . . .

26

3.6.1

Muestreo No Probabilstico . . . . . . . . . . . . . . . .

26

3.6.2

Muestreo Probabilstico . . . . . . . . . . . . . . . . . .

27

3.7

Recolecci
on de informaci
on . . . . . . . . . . . . . . . . . . . .

27

3.8

Tratamiento de la informaci
on

. . . . . . . . . . . . . . . . . .

28

3.8.1

Distribuciones de Frecuencias . . . . . . . . . . . . . . .

28

3.8.2

Clasificaci
on Unidimensional . . . . . . . . . . . . . . .

29

3.8.3

Clasificaci
on Bi y Pluridimensional . . . . . . . . . . . .

31

An
alisis e Interpretaci
on . . . . . . . . . . . . . . . . . . . . . .

33

3.5

3.6

3.9

4 An
alisis de variables no cuantitativas

35

4.1

Introducci
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

35

4.2

An
alisis b
asico en tablas 2 x 2 . . . . . . . . . . . . . . . . . . .

35

4.2.1

Notaci
on y Consistencia . . . . . . . . . . . . . . . . . .

35

4.2.2

Independencia y Correspondencia . . . . . . . . . . . . .

36

4.2.3

Clasificaci
on Multivariada Dicotomica . . . . . . . . . .

41

Clasificaci
on m
ultiple . . . . . . . . . . . . . . . . . . . . . . . .

42

4.3

INDICE GENERAL

vi

5 An
alisis descriptivo de una variable cuantitativa
5.1

44

Medidas caractersticas unidimensionales . . . . . . . . . . . . .

44

5.1.1

La Media Aritmetica . . . . . . . . . . . . . . . . . . . .

44

5.1.2

La Varianza . . . . . . . . . . . . . . . . . . . . . . . . .

46

5.1.3

La desviaci
on est
andar y el coeficiente de variacion . . .

48

5.1.4

Los Percentiles . . . . . . . . . . . . . . . . . . . . . . .

49

5.1.5

La Moda . . . . . . . . . . . . . . . . . . . . . . . . . .

49

6 Estudios de relaci
on entre variables cuantitativas

51

6.1

La regresi
on . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

6.2

La explicaci
on de la variaci
on del modelo . . . . . . . . . . . .

53

7 Algunos conceptos de Probabilidad


7.1

55

Teoremas b
asicos de Probabilidad . . . . . . . . . . . . . . . . .

55

7.1.1

Definici
on cl
asica . . . . . . . . . . . . . . . . . . . . . .

55

7.1.2

Teoremas b
asicos . . . . . . . . . . . . . . . . . . . . . .

55

7.2

Funci
on de probabilidades . . . . . . . . . . . . . . . . . . . . .

56

7.3

Funci
on de distribuci
on . . . . . . . . . . . . . . . . . . . . . .

57

7.4

Valor esperado . . . . . . . . . . . . . . . . . . . . . . . . . . .

57

7.5

La varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

7.6

Funciones especiales de probabilidad . . . . . . . . . . . . . . .

59

7.6.1

Bernoulli o bipuntual

. . . . . . . . . . . . . . . . . . .

59

7.6.2

Binomial . . . . . . . . . . . . . . . . . . . . . . . . . .

59

7.6.3

Binomial negativa . . . . . . . . . . . . . . . . . . . . .

60

7.6.4

Geometrica . . . . . . . . . . . . . . . . . . . . . . . . .

60

7.6.5

Hipergeometrica . . . . . . . . . . . . . . . . . . . . . .

60

7.6.6

Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

7.6.7

La multinomial . . . . . . . . . . . . . . . . . . . . . . .

62

7.6.8

Hipergeometrica generalizada . . . . . . . . . . . . . . .

62

7.6.9

La normal . . . . . . . . . . . . . . . . . . . . . . . . . .

63

7.6.10 La normal estandarizada o tipificada o reducida . . . . .

63

8 Conceptos de inferencia estadstica

64

INDICE GENERAL

8.1

8.2

8.3

vii

Generalidades acerca de inferencia . . . . . . . . . . . . . . . .

64

8.1.1

Inferencia Matem
atica . . . . . . . . . . . . . . . . . . .

65

8.1.2

Inferencia f
actica . . . . . . . . . . . . . . . . . . . . . .

65

8.1.3

Inferencia Estadstica . . . . . . . . . . . . . . . . . . .

65

8.1.4

Inferencia Reductiva . . . . . . . . . . . . . . . . . . . .

66

Inferencia estadstica . . . . . . . . . . . . . . . . . . . . . . . .

66

8.2.1

Inferencia Cl
asica . . . . . . . . . . . . . . . . . . . . . .

67

8.2.2

Inferencia bayesiana . . . . . . . . . . . . . . . . . . . .

67

Distribuciones en el muestreo . . . . . . . . . . . . . . . . . . .

67

9 La estimaci
on estadstica

72

9.1

Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . .

72

9.2

Algunas propiedades de un buen estimador . . . . . . . . . . .

73

9.2.1

Insesgamiento . . . . . . . . . . . . . . . . . . . . . . . .

73

9.2.2

Consistencia

. . . . . . . . . . . . . . . . . . . . . . . .

74

9.2.3

Eficiencia relativa . . . . . . . . . . . . . . . . . . . . . .

74

9.2.4

Suficiencia . . . . . . . . . . . . . . . . . . . . . . . . . .

75

Formas de hacer estimaciones . . . . . . . . . . . . . . . . . . .

75

9.3

10 Pruebas de hip
otesis estadsticas

78

10.1 Hip
otesis nula Hip
otesis alternativa . . . . . . . . . . . . . . .

78

10.2 Error tipo I Error tipo II . . . . . . . . . . . . . . . . . . . .

79

10.3 Proceso general de prueba . . . . . . . . . . . . . . . . . . . . .

81

viii

INDICE GENERAL

CAPITULO

Introduccion

1.1.

Formas del saber

Los seres humanos poseen mayores o menores conocimientos, seg


un el modo
y grado de participaci
on en la totalidad de la cultura, pero las formas y tipos
de conocimientos generan dos modos principales del saber que son el Saber
Cotidiano y el Saber Cientfico.
Se sabe de manera natural por el solo hecho de vivir, y se sabe
cientficamente cuando existe disposici
on de conocer con arreglo a ciertos
procedimientos.

1.1.1.

Saber Cotidiano

Es el saber o conocimiento que se adquiere en la experiencia cotidiana. Se


trata de conocimientos inconexos entre si, a veces superficiales, constituidos por
una yuxtaposici
on de casos y hechos. Es el modo com
un y corriente, espontaneo
de conocer.
Este saber cotidiano, tambien llamado el conocimiento vulgar, se caracteriza
por ser superficial, en el sentido de que se conforma con lo aparente, con lo que
comprueba al pasar junto a las cosas. Ademas es no sistematico, tanto en el
proceso de adquisici
on y vinculaci
on, como en el modo de establecer canones de
validaci
on; se limita a percibir lo inmediato a traves de experiencias, vivencias,
estados de
animo y emociones de la vida diaria, permaneciendo a nivel de
certeza sensorial.
1

CAPITULO 1. INTRODUCCION

Otra caracterstica propia de este saber es la de ser acrtico puesto que


est
a apoyado solo en la evidencia inmediata y solo percibe entonces la epidermis
de la realidad; puede decir acerca de lo que pasa, pero no porque pasa lo que
pasa.

1.1.2.

Saber Cientfico

Se acepta actualmente como definici


on de conocimiento cientfico o en
general Ciencia, a un conjunto de conocimientos racionales, ciertos o probables,
que obtenidos de manera met
odica y verificados empricamente, se sistematizan
org
anicamente, haciendo referencia a objetos de una misma naturaleza, cuyos
contenidos son susceptibles de ser transmitidos.
Es racional puesto que exige el uso de la razon y ello tiene exigencias
met
odicas que conforman una serie de elementos basicos, tales como un sistema
conceptual, hip
otesis, definiciones, etc.
Es cierto o probable; en la ciencia no existe la certeza absoluta, sino solo
la probabilidad inductiva; se trata de verdades parciales, sujetas a correccion
cuando nuevos datos o experiencias demuestran la necesidad de rectificacion.
Los conocimientos de la ciencia no se adquieren al azar o en la vida
cotidiana, sino mediante reglas l
ogicas que acompa
nadas de procedimientos
tecnicos se organizan seg
un ciertas convenciones cientficas; por esto la ciencia
es met
odica.
Tambien requiere la confrontaci
on con la realidad y la sistematizaci
on
org
anica, ya que no se trata de conocimientos inconexos sino de un saber
ordenado l
ogicamente constituyendo un sistema de generalizaciones y principios
que relacionan los hechos entre s, deduciendo leyes y teoras.
Lo anterior implica que el saber cientfico se refiera a objetos de una
misma naturaleza, objetos pertenecientes a un determinado ambito de la
realidad, que guardan entre s caracteres de homogeneidad, acerca de los cuales
se afirma algo de sus propiedades estructurales y relaciones.
Finalmente, los conocimientos de una ciencia deben ser transmisibles por
medio, de un lenguaje que le es propio y que debe responder a todas las
exigencias de claridad y precisi
on.

1.2.

M
etodo cientfico e investigaci
on

Entre un tipo del saber y otro existe una separacion que no es cualitativa
sino de grado; lo diferenciador no est
a dado por la naturaleza del objeto de
estudio, ni por la veracidad de lo conocido sino por la forma de su adquisicion
y los instrumentos del conocer. En tanto que el saber vulgar no es sistematico,

1.2. METODO
CIENTIFICO E INVESTIGACION

el cientfico lo es, requiere de un proceso formal es decir de un METODO.


Se entiende por un Metodo Cientfico un camino a seguir mediante una
serie de operaciones, reglas y procedimientos fijados de antemano de manera
voluntaria y reflexiva, para alcanzar un determinado fin que puede ser material
o conceptual.

1.2.1.

Caractersticas de un M
etodo Cientfico

Es FACTICO, en el sentido de que los hechos son fuente de informacion y


de respuesta. Se dice que un Metodo Cientfico parte de la observacion de los
hechos, est
a basado en los hechos, tiene un referencial emprico.
TRASCIENDE LOS HECHOS; si bien un Metodo Cientfico parte de
los hechos particulares no se detiene en ellos, sino que mediante un salto del
nivel observacional al te
orico los trasciende, los problematiza y establece leyes,
teoras, etc. La interpretaci
on de los hechos se realiza desde un determinado
marco de referencia te
orico que, a su vez, se apoya en supuestos meta teoricos.

Se atiene a REGLAS METODOLOGICAS


formalizadas (operaciones,
procedimientos establecidos de antemano), pero no por eso deshecha la intuicion
y la imaginaci
on.
EMP
Se vale de la VERIFICACION
IRICA para formular respuestas
a los problemas planteados y para apoyar sus propias afirmaciones, exigiendo
una constante confrontaci
on con la realidad que lleva a la problematizacion de
lo ya adquirido y admitido.
Esta permanente confrontaci
on hace que un Metodo Cientfico sea
AUTOCORRECTIVO Y PROGRESIVO. Es autocorrectivo en cuanto va
rechazando, corrigiendo o ajustando las propias conclusiones en la medida que
algunos hechos demuestren la existencia de alg
un error u omision. Es progresivo
ya que, al no tomar sus conclusiones como infalibles o finales, esta abierto a
nuevos aportes y a la utilizaci
on de nuevas tecnicas y procedimientos.
Es GENERALIZANTE. La cosa en particular o el hecho individual o
singular interesa en la medida en que es miembro de una ley o clase. No es que se
ignore la cosa individual o el hecho irrepetible, lo que ignora es el hecho aislado,
puesto que sus enunciados son universales y expresan el comportamiento o
relaci
on que guardan determinados fen
omenos de una manera regular.
Es OBJETIVO ya que busca alcanzar la verdad que los hechos muestran,
independientemente de la escala de valores y creencias del cientfico.

1.2.2.

Investigaci
on y su Procedimiento

El proceso especfico para aplicar un Metodo Cientfico es llamado en

terminos generales, INVESTIGACION.


Formalmente se define como un

CAPITULO 1. INTRODUCCION

procedimiento reflexivo, sistem


atico, controlado y crtico que tiene por finalidad
descubrir o interpretar los hechos y fen
omenos, relaciones y leyes en un
determinado
ambito de la realidad.
El procedimiento implica una serie de etapas o fases ordenadas logicamente,
que pueden ser resumidas de la siguiente forma:
Formulaci
on correcta del problema a investigar.
Definici
on concreta de los objetivos que se persiguen.
Elecci
on de los
investigaci
on.

procedimientos

metodologicos

para

realizar

la

Obtenci
on de la informaci
on necesaria para el estudio.
Tratamiento de tal informaci
on.
An
alisis e interpretaci
on de la informaci
on.
Conclusiones del proceso investigativo.

1.3.

La Estadstica y la Investigaci
on

Aunque no siempre los estudios o investigaciones lo requieren, en un


gran n
umero de ellos la cuantificaci
on y medicion de hechos numerosos es
imprescindible para la obtenci
on de los objetivos planteados. Es en estos casos,
cuando la Estadstica aparece como una valiosa ciencia auxiliar de procesos de
investigaci
on y estudio.
La formulaci
on correcta de un problema a investigar, solo se puede lograr
en muchos casos, con base en el an
alisis, a veces simplemente exploratorio, de
datos referentes al problema. La definici
on de objetivos, la determinacion de
procedimientos metodol
ogicos, en fin, pr
acticamente todas las etapas de un
proceso investigativo, requieren para su mejor desarrollo de la Estadstica, en
las circunstancias anotadas anteriormente.
Los metodos propios de la Estadstica estan ntimamente relacionados
con las caractersticas de un Metodo Cientfico. La Estadstica con sus
metodos descriptivos, permite la observaci
on de los hechos y con sus metodos
inferenciales colabora con el proceso de transcenderlos, de generalizar el
comportamiento o relaci
on de fen
omenos, aportando ademas formas de medir
la confianza y validez de tales generalizaciones, con base en su soporte
probabilstico.
Se puede entonces ubicar a la Estadstica como un valioso auxiliar de un
Metodo Cientfico, ubicaci
on esta que implica una visualizacion de esta Ciencia
en el aspecto de su aplicaci
on pr
actica, sin considerar su ubicacion formal, el

HISTORICA

1.4. RESENA
DE LA ESTADISTICA

objeto formal de su conocimiento desde el punto de vista filosofico y por ende


epistemol
ogico.

1.4.

Rese
na hist
orica de la Estadstica

Como toda tecnica, toda disciplina y toda ciencia, la Estadstica tuvo como
principio el ser un medio de satisfacer alguna necesidad del ser humano. Ahora
bien, desde sus orgenes, este ha sentido la necesidad de cualificar hechos
numerosos, u
nica forma en muchos casos, de tener alguna idea acerca del
comportamiento generalizado de tales hechos, objetivo este que solo se logra
por medio de procesos de sntesis, de reduccion, de compendio de la informacion
numerica que la citada clasificaci
on produce.
Las estadsticas son tan antiguas como las sociedades humanas, afirma
Cansado y contin
ua anotando que desde que ellas existen se han producido
censos, relaciones, catastros, etc., con informacion sobre recursos humanos,
econ
omicos o de otra ndole. Se tienen referencias historicas acerca de los datos
recogidos por los israelitas y egipcios en relacion con la medida de la poblacion.
Parece ser que los datos m
as antiguos son los censos ordenados por el emperador
Tao, 2.200 a.C.
Tambien tuvieron importancia los censos romanos hacia el a
no 555 a.C.,
de sumo interes dada la organizaci
on eminentemente poltica y guerrera de
Roma; unos cien a
nos despues fueron implantados los censores. El Breviarium
de Carlomagno, el Digest Book de Guillermo de Orange, Descripciones
de Espa
na mandadas por el Califato de Cordoba al de Bagdad, Actividades
demogr
aficas de la Rep
ublica veneciana, son ejemplos de bosquejos de procesos
estadsticos, obviamente rudimentarios, pero que muestran la necesidad de, por
lo menos, describir numericamente fen
omenos colectivos.
Se puede concluir entonces que la Estadstica, se origina como un medio
para ayudar al ser humano a comprender en forma sencilla y abreviada grandes
masas de informaci
on numerica, sin que esto quiera decir que la Estadstica
como ciencia, se limite hoy en da a tan elemental proceso.
En realidad la Estadstica como ciencia organizada y formalizada, aparece
en epocas menos remotas, aproximadamente a finales del siglo XVII y
durante el XVIII, con sus principales exponentes en Alemania, donde existe
en la universidad de Gottinga una c
atedra y curso de Estadstica. En ella
se ense
nan y se ponen en pr
actica una serie de metodos numericos para
hacer descripciones de hechos relacionados con el funcionamiento del Estado.
Estos metodos despues de recibir la aceptacion academica del encuadramiento
sistem
atico, empiezan a gozar del favor del p
ublico. Su objeto es la descripci
on
cuantitativa de las cosas del estado, pero a
un le faltaba el contenido cientfico
m
as formal de la b
usqueda de leyes generales del fenomeno colectivo
estudiado, que es el objeto de la disciplina, razon por la cual algunos tratadistas

CAPITULO 1. INTRODUCCION

la consideraban como disciplina descriptiva y no como ciencia.


El hecho de estar los metodos asociados a hechos del estado y simplemente
describir el status quo, parece originar la palabra Estadstica, a partir de
la raz latina status o de la griega statera o de la palabra alemana staat,
todas relativas al concepto de Estado como ente gubernamental. Esta acepcion
de la palabra Estadstica, desafortunadamente la u
nica que tiene un gran
porcentaje de opini
on p
ublica en nuestro medio acerca de lo que es esta ciencia,
aparece recalcada en el prefacio de Una vision poltica del estado actual
de Europa, por E. A. W. Zimmermann, publicada en 1787, donde anota:
Hace cerca de cuarenta a
nos que esta rama del conocimiento poltico, que
tiene como objeto estudiar la potencia real y relativa de los distintos estados
modernos, la capacidad derivada de sus condiciones naturales, la industria
y la civilizaci
on de sus habitantes y la sabidura de sus gobernantes, se ha
constituido, principalmente por obra de escritores alemanes, en una ciencia
independiente... Por la forma m
as conveniente que ahora ha tomado, esta
ciencia, conocida por el recien inventado nombre de Estadstica, ha llegado
a ser un estudio favorito en Alemania.
Las tecnicas descriptivas en boga, se diversifican a fenomenos no
necesariamente estatales, como la industria, la economa, etc. por lo que,
se define entonces a la Estadstica como un M
etodo para describir
num
ericamente, caractersticas de fen
omenos colectivos. Hoy en da
los procesos descriptivos de la Estadstica, son una parte esencial de tal ciencia,
pero no los u
nicos; corresponderan al proceso inicial del Metodo Cientfico,
anteriormente citado, o sea a la observaci
on de los hechos.
Aproximadamente, por la misma epoca en que se presenta la citada acepcion
de Estadstica, est
a en auge una rama de las Matematicas, con sus principales
exponentes en Francia e Inglaterra, que trata de controlar el comportamiento de
los juegos de azar y por ende de todo fen
omeno afectado por este, dando origen
al C
alculo de Probabilidades, que se constituir
a en un gran aporte para el mayor
desarrollo de la Estadstica. Se requiere de un procedimiento estructurado,
sistematizado, formalizado, es decir cientfico, para manejar la incertidumbre,
que adem
as permita cuantificar los diversos niveles de esta.
Filos
oficamente no se est
a descubriendo o desarrollando la probabilidad,
pues ella es inherente al ser humano, sino que se la est
a cuantificando. Al
respecto es conveniente considerar dos tipos de fenomenos a los que se enfrenta
el ser humano en su vida com
un y corriente y por consiguiente en su vida
tecnica y cientfica. Ellos son los llamados fen
omenos determinsticos y
los fen
omenos aleatorios, caracterizados los primeros por ser de naturaleza
tal que, al observados o realizarlos bajo las mismas condiciones generales,
presentan siempre el mismo resultado, en tanto que los segundos no presentan
tal caracterizaci
on.
La distinci
on la origina el determinismo causal, que implica para los
fen
omenos determinsticos un conocimiento y control absoluto de todos los

HISTORICA

1.4. RESENA
DE LA ESTADISTICA

factores que determinan el comportamiento del fenomeno, lo cual no sucede


en el caso aleatorio, donde se supone que adicionalmente act
uan factores de
casualidad o del azar, debidos a conocimiento de factores causales pero con
la imposibilidad de controlarlos o desconocimiento de algunas de las causas.
Ciertos fil
osofos aseguran que todo fen
omeno esta constituido por factores de
causalidad y factores de casualidad, solo que en algunos casos la influencia
de estos u
ltimos es tan poca, que se puede despreciar y se acepta entonces el
concepto de determinismo absoluto.
Frecuentemente se diferencian los dos tipos de fenomenos, anotando que
en los determinsticos se conocen los posibles resultados y en los aleatorios
no. Esto no es cierto, pues en general en las dos situaciones se conocen los
posibles resultados, lo que sucede es que en el caso determinstico se puede
predecir o determinar con certeza cual resultado se presentara o como
se comportar
a el fen
omeno, mientras que en el caso aleatorio solo se puede
predecir con incertidumbre lo que ocurrira. Por consiguiente, el ser humano
siempre ha tratado de medir su nivel de incertidumbre, es decir siempre ha
convivido con la probabilidad, en su sentido conceptual de ser una medida
de la verosimilitud de los resultados de fenomenos aleatorios. La palabra
verosimilitud es sin
onima de potencia, fuerza, posibilidad (siendo un poco
circular) de ocurrencia o suceso.
Palabras, frases y actitudes, han sido utilizadas por el ser humano
para referirse a, o manejar lo incierto, constituyendose aquellas en formas
elementales de medida (l
ogicamente no numerica) de la verosimilitud. Quien,
en situaciones inciertas, no ha dicho o ha odo decir: yo creo que..., a
lo mejor..., posiblemente..., inclusive un muy usual lo mas seguro es
que...? Pues bien, estas formas de medir son poco formales, muy inciertas,
no sistematizadas, nada cientficas y se requiere un proceso que si posea estas
cualidades; es lo que se empieza a desarrollar en la Matematica, especialmente
en Francia e Inglaterra, como se anot
o anteriormente. La idea es cuantificar
la probabilidad.
Simult
aneamente, con este desarrollo matematico de la probabilidad,
se empiezan a detectar en las estadsticas descriptivas, comportamientos
regularizados, tendenciosos, generalizados de los fenomenos que se describen. Se
detecta la regularidad estadstica, que se enunciara posteriormente, dando
lugar los dos procesos al nacimiento de una serie de metodos que permiten,
siempre con incertidumbre, predecir, proyectar, estimar, inferir fenomenos en
diferentes campos de la actividad humana corriente y sobretodo tecnica y
cientfica.
Aparece entonces el concepto Estadstica, para referirse a una Rama de
las matem
aticas, que permite realizar inferencias en situaciones de
incertidumbre, lo que constituye hoy una parte esencial de la Estadstica,
llamada la Inferencia Estadstica, pero que no corresponde exactamente a una
definici
on de lo que es esta ciencia.

CAPITULO 1. INTRODUCCION

Una tercera acepci


on de la palabra Estadstica se encuentra, mas o menos
en las mismas epocas citadas anteriormente, en Suecia e Inglaterra para hacer
referencia a tecnicas de Estudio num
erico de sociedades humanas, lo
que hoy llamamos Demografa, pero que es erroneamente conocido en muchos
crculos, como definici
on u
nica y exhaustiva, de Estadstica.
Como origen de la Estadstica formalizada y debido a estas tres acepciones
de la palabra, nos cita Cansado tres n
ucleos o corrientes diferentes:
La escuela administrativa, alemana, que considera los problemas
de informaci
on del estado; sus principales representantes son: Vito de
Seckendorff, Herman Conring y Godofredo de Achenwall.
La
escuela
probabilstica, originalmente italiana, aunque
primordialmente francesa, que estudia problemas relacionados con
los juegos de azar, sus principales exponentes son: Pascal, Fermat,
Laplace, Poisson, los Bernoulli y Gauss.
La escuela demogr
afica, inglesa sueca, preocupada con problemas
actuariales; sus principales integrantes son Petty, Halley, King, Davenant
y John Graunt.
Finalmente y solo a principios del siglo XX, una segunda escuela inglesa,
principalmente preocupada con problemas de estudio e investigacion en
agronoma y biometra, inicia y pone los cimientos de la ciencia a la que
nos referimos actualmente con la palabra Estadstica. Son sus principales
componentes: Galton, Karl Pearson, W. Gosset (Student), R. A. Fisher.

CAPITULO

Conceptos fundamentales de Estadstica

2.1.

Definiciones de Estadstica

Alexander M. Mood profesor universitario norteamericano, define a la


Estadstica como la tecnologa del Metodo Cientfico, ya que le proporciona
instrumentos para la toma de decisiones cuando prevalecen condiciones de
incertidumbre. Deber
a adoptarse esta definicion, mas que como de Estadstica,
de Estadstica Aplicada.
El profesor escandinavo, Harald Cr
amer, presenta la siguiente definicion:
La Estadstica es una Ciencia basada en el calculo de probabilidades, cuyo
objetivo fundamental consiste en investigar la posibilidad de extraer de los
datos estadsticos, inferencias v
alidas, elaborando los metodos mediante los
cuales puedan ser obtenidas dichas inferencias.
Leo Dugue de Bernonville, profesor frances, la define como La ciencia
que se aplica al estudio numerico de fenomenos colectivos. Estudio que
comprende la observaci
on de los hechos, su correcta ordenacion y adecuada
clasificaci
on y su an
alisis y tiene como fin principal el descubrimiento de
caractersticas o propiedades de tipo general, para la mayora del colectivo,
pero no necesariamente a todos y cada uno de los casos.
Como es deducible, estas definiciones y otras similares, no se contradicen,
por el contrario se complementan y permiten apreciar la gran relacion entre
esta ciencia y el Metodo Cientfico. As, se hace referencia a la observacion de
los hechos, observaci
on que por ser numerica genera los datos estadsticos y que
est
a asociada con el referencial f
actico del Metodo Cientfico; pero al igual que
en este, en la Estadstica se pretende inferir, generalizar, es decir trascender los
9

10

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

hechos.

2.2.

Caractersticas del m
etodo estadstico

A partir de las definiciones anteriores, se pueden colegir las siguientes


caractersticas del metodo estadstico:

Es LOGICO
y su l
ogica est
a basada en la llamada ley de los grandes
n
umeros, la cual, expresada en terminos no formales, dice que entre mayor sea
el n
umero de hechos que se observan, mas exactas seran las conclusiones que se
obtengan y en la llamada ley de regularidad de frecuencias referida al hecho
de que si se realizan repeticiones u observaciones sucesivas e incrementadas
de un fen
omeno, la frecuencia relativa de alg
un suceso de interes, tiende a
estabilizarse alrededor de un valor, el cu
al correspondera a la probabilidad de
tal suceso. Es conveniente anotar, a prop
osito de esta caracterstica, que la
Estadstica no es exacta y como sucede en este tipo de ciencias, trata de lograr
la mayor exactitud posible o sea el mayor acercamiento a la verdad.
El proceso de razonamiento que utiliza la Estadstica para alcanzar sus
objetivos de aplicabilidad es el INDUCTIVO y para su desarrollo propio el
DEDUCTIVO.

Por su misma naturaleza, el metodo estadstico es NUMERICO.


Todo estudio estadstico siempre conlleva alg
un tratamiento numerico de la
informaci
on, as sea el elemental de contar.

Est
a referido siempre a FENOMENOS
COLECTIVOS o como algunos
autores sugieren, a AGREGADOS; como en un Metodo Cientfico, solo le
interesa el hecho individual como componente de un hecho numeroso, los
resultados que se obtienen no se pueden aplicar en forma particular o individual;
siempre es GENERALIZANTE.
Naturalmente el metodo estadstico es OBJETIVO, en la misma forma en
que se habla de objetividad en un Metodo Cientfico. Es esta una caracterstica
que algunos usuarios de supuestos procesos estadsticos, han desacreditado
al manipular, en el peor sentido de la palabra, informacion numerica para
comprobar o demostrar as, verdades predeterminadas o mostrar realidades
distorsionadas.
Como conclusi
on de esta caracterizaci
on de la Estadstica y siguiendo
a Mood, es conveniente tener presente que el fin u
ltimo de la Estadstica,
su objetivo mediato, es colaborar con el Metodo Cientfico en procesos de
TOMA DE DECISIONES, cuando prevalecen condiciones de RIESGO
Y/O INCERTTDUMBRE.

DE LOS METODOS

2.3. CLASIFICACION
ESTADISTICOS

2.3.

11

Clasificaci
on de los m
etodos estadsticos

Para su desarrollo y aplicaci


on la Estadstica utiliza diversos
procedimientos, los cuales pueden clasificarse de la siguiente manera, no
exhaustiva ni necesariamente excluyente:

METODOS
DESCRIPTIVOS: cuando las conclusiones que se obtienen
de las experiencias o datos en estudio, no rebasan los lmites de los mismos.
Tienen como objetivo fundamental su presentacion y analisis como paso previo
a los procesos inferenciales.

METODOS
INDUCTIVOS O INFERENCIA ESTAD
ISTICA:
cuando las conclusiones que se obtienen de los datos en estudio, rebasan los
lmites de los mismos. Implica en general, el tomar decisiones en el caso mas
universal del cual forman parte los datos. El proceso de tomar decisiones en
situaciones generales, sobre la base de una informacion incompleta contenida
en algunos datos, es arriesgado y no puede realizarse con certeza absoluta sino
con incertidumbre. Sin embargo esta u
ltima no es total, pueden controlarse
sus niveles, puede medirse su magnitud, lo cual se lleva a cabo con base en el

CALCULO
DE PROBABILIDADES.

METODOS
TEORICOS
O TEOR
IA ESTAD
ISTICA: se esta ante
la misma cuando se aborda el estudio de los fenomenos estadsticos, utilizando
los metodos matem
aticos en toda su plenitud. Esto no supone, sin embargo,
que la Estadstica sea una rama de las Matematicas, sino que al igual que
otras ciencias (Fsica, Economa, Qumica, etc.), la utiliza como instrumento, y
as mientras en la Matem
atica Pura se permanece en el terreno de lo conceptual,
en estas ciencias es preciso que las conclusiones se ajusten a la realidad, pues
de lo contrario no sirven.

2.4.
2.4.1.

Sistema conceptual b
asico
El Colectivo, Agregado, Poblaci
on, Universo

El objeto de estudio de la Estadstica son los llamados fenomenos colectivos


para los cuales, el comportamiento de una serie de caractersticas, esta afectado
por la casualidad o la aleatoriedad; tambien se les conoce con el nombre de
agregados, poblaciones o universos.
Como COLECTIVO o AGREGADO deben entenderse no solo los
colectivos humanos, sino cualquier conjunto de hechos numerosos de la misma
naturaleza, cualquiera que ella sea, que presentan ciertas caractersticas
o modalidades distintivas, cuyo comportamiento generalizado y/o posible
relaci
on son objeto de estudio.

Como POBLACION,
se define a un conjunto de medidas obtenidas al

12

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

observar alguna caracterstica de interes en los elementos del colectivo, lo que


indica que con un mismo colectivo pueden, en general, estar asociadas varias
poblaciones.
Algunos autores definen el concepto de UNIVERSO, como un colectivo
te
orico, b
asico para el desarrollo de la Teora Estadstica. Es necesario anotar
que casi siempre se utilizan los terminos citados como sinonimos, sin que se
tenga un consenso aceptado en general, sobre el uso de los mismos.

2.4.2.

Las Variables

Se define como una VARIABLE, a una caracterstica observable o a un


aspecto discernible en un objeto de estudio, que puede adoptar diferentes
valores o expresarse en varias categoras, o a una caracterstica observable
ligada, con una relaci
on determinada, a otros aspectos observables.
Desde el punto de vista de su naturaleza, se habla de variables
CUALITATIVAS para referirse a aquellas cuyos elementos de variacion
tienen un car
acter cualitativo, no susceptible de observacion medible
numericamente y de variables CUANTITATIVAS como aquellas cuyas
propiedades pueden presentarse en diversos grados o intensidades de caracter
numerico.
De acuerdo con su naturaleza matem
atica, se diferencian las variables
cuantitativas en DISCRETAS y CONTINUAS, siendo las primeras aquellas
que est
an definidas sobre recorridos finitos o infinitos numerables; no pueden
tomar valores intermedios entre dos valores dados. Las continuas son aquellas
definidas sobre recorridos infinitos no numerables; pueden tomar cualquier valor
dentro de un recorrido dado.
Para clasificar o categorizar variables, se utilizan diferentes tipos de escalan,
siendo las m
as comunes las NOMINALES, las ORDINALES, las DE

INTERVALO, y las DE RAZON,


cuyo uso depende basicamente de los
objetivos del estudio y de la naturaleza de la variable.

2.4.3.

Escalas de Medici
on o Clasificaci
on

2.4.3.1.

La Medici
on

El papel que desempe


nan la medida y la cantidad en la Ciencia es muy
grande, pero creo que a veces se ha exagerado. La tecnica matematica es
poderosa, y los hombres de ciencia est
an naturalmente ansiosos de aplicarla
siempre que sea posible; pero una ley puede ser muy cientfica sin ser
cuantitativa: Russell, Dorta, and Serna.
La generalizaci
on cientfica es siempre y necesariamente cuantitativa:


2.4. SISTEMA CONCEPTUAL BASICO

13

Lundberg
Cuando uno puede medir y expresar numericamente lo que dice, conoce
algo de ello; pero mientras no pueda uno medir ni expresarse en n
umeros, su
conocimiento es escaso y poco satisfactorio: Lord Kelvin
Contar hechos observables es la operacion basica de la medicion. Contar
o computar es establecer una correspondencia biunvoca entre el conjunto de
objetos que hay que contar y un subconjunto de los enteros positivos... Para
que una colecci
on de hechos sea empricamente contable, tiene que consistir en
miembros empricamente distinguibles: (Bunge 1972)
Las citas anteriores, algunas de ellas demasiado extremas, son evidencia de
la importancia que para los tratadistas de la ciencia, la metodologa cientfica y
la investigaci
on, tienen la medici
on y la cuantificaci
on. Pero es conveniente
tratar de responder a la inquietud relativa a si estos conceptos significan lo
mismo, si tienen la misma acepci
on y aplicacion.
En el sentido m
as corriente y elemental, el concepto de medir es utilizado
para significar la asignaci
on de valores num
ericos o dimensiones a un objeto
u objetos mediante la utilizaci
on de determinados procedimientos. En terminos
m
as estrictamente metodol
ogicos, la medicion consiste sustancialmente
en una observaci
on cuantitativa, atribuyendo un n
umero a determinadas
caractersticas o rasgos del hecho o fen
omeno observado. Esto no presenta
mayores inconvenientes si se trata de medir aspectos materiales y morfologicos
de los objetos de estudio; la dificultad aparece cuando se desean expresar
numericamente aspectos m
as evanescentes e intangibles.
Cuando un fsico habla acerca de la medicion, se refiere generalmente a
la asignaci
on de n
umeros a observaciones, de modo que los n
umeros sean
susceptibles de an
alisis por medio de manipulaciones u operaciones de acuerdo
con ciertas reglas. Este an
alisis por manipulacion, en el mejor sentido de la
palabra, dar
a nuevas informaciones de los objetos que se estan midiendo. En
otras palabras, la relaci
on entre los objetos que se estan observando y los
n
umeros, es tan directa que mediante la manipulacion de los n
umeros el fsico
obtiene nueva informaci
on acerca de los objetos. Por ejemplo, puede determinar
el peso de una masa de material homogeneo que haya sido partida por la mitad,
dividiendo su peso por dos.
En las ciencias sociales, el cientfico social, que toma al fsico como modelo,
suele intentar algo parecido a la calificaci
on o medicion de las variables sociales;
pero, en sus escalas, el investigador social muy a menudo menosprecia un
fundamento de la teora de la medici
on.
Pasa por alto que, para hacer ciertas operaciones con los n
umeros que ha
asignado a las observaciones, la estructura del metodo de correspondencia de
los n
umeros (puntajes) a las observaciones debe ser isom
orfica con respecto a
alguna estructura numerica que incluya estas operaciones. Si los dos sistemas
son isom
orficos, sus estructuras son las mismas en las relaciones y operaciones

14

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

que permiten. Por ejemplo, si un investigador recoge datos compuestos de


puntajes numericos y luego manipula estos puntajes por adicion y division
(que son operaciones necesarias para obtener medias y varianzas), supone que
la estructura de su medici
on es isom
orfica a la estructura numerica conocida
como aritmetica. Es decir, supone que ha logrado un alto nivel de medida.
La teora de la medici
on est
a formada por un conjunto de teoras separadas
y distintas, cada una referida a un nivel diferente de medicion. Las operaciones
permitidas con un conjunto de puntajes dado, dependen del nivel de medida
que se logre. Parece ser que el problema radica esencialmente en la experiencia
que se tenga de los n
umeros y el concepto que de ellos se posea.
Haber, Runyon, and Mozo, en su texto de Estadstica General, presentan
como elemento de cuestionamiento la siguiente discusion: Al preguntar a un
ni
no y quiz
as, agregaramos nosotros, a muchos adultos, que es un n
umero, la
posible respuesta es que los n
umeros son smbolos que representan cantidades
de cosas y que pueden sumarse, restarse, multiplicarse y dividirse. Los
anteriores son conceptos aritmeticos conocidos, pero expresan en realidad
todos los posibles usos de los n
umeros? Al respecto se podra preguntar: El
smbolo 10 colocado en la espalda de la camiseta de un jugador de f
utbol,
es un n
umero como el que acaba de definir? Que puede decir acerca del
n
umero de su casa? Que opina de la programacion del canal 7 de television?
Estos n
umeros indican cantidades de cosas? Pueden ser sumados, restados,
multiplicados y divididos? Es l
ogico multiplicar el n
umero de la camiseta de
un jugador, por cualquier otro n
umero y obtener un resultado que tenga alg
un
significado?
Si se analiza cuidadosamente el empleo de los n
umeros en la vida cotidiana se
descubre un hecho muy importante: La mayora de los n
umeros que se emplean
no poseen las propiedades aritmeticas que ordinariamente se les atribuyen. Por
esta raz
on, vale la pena diferenciar dos terminos, n
umero y numeral. Los
numerales son smbolos como Y, 10, IX, $. Los n
umeros son tipos de numerales
especficos que guardan una relaci
on fija con otros numerales. De este modo,
dos numerales, como 4 y 7 son n
umeros si, y solo si pueden sumarse, restarse,
multiplicarse y dividirse, con resultados significantes.
As, siguiendo a Wehl, el u
nico aspecto decisivo de la medicion es la
representaci
on simb
olica, los n
umeros no son de ninguna manera los u
nicos
smbolos utilizables, aplicables a objetos de acuerdo con normas. Partiendo
de esta concepci
on podra afirmarse que lo cualitativo puede expresarse por
smbolos y que, por tanto, los fen
omenos que no admiten la expresion numerica
pueden ser mesurables en forma simb
olica.
En general, la medici
on puede definirse como un proceso mediante el
cual se asignan de un modo sistem
atico smbolos a las observaciones, entre
los cuales se definen, con base en alguna convencion, como legtimas ciertas
relaciones determinadas. As los procedimientos de medicion consisten siempre
en la comparaci
on de una observaci
on con una serie de smbolos abstractos


2.4. SISTEMA CONCEPTUAL BASICO

15

(tales como palabras, n


umeros, letras, colores, sonidos, etc.) y en la asignacion
a la observaci
on de uno o m
as de tales smbolos, de acuerdo con una regla
previa, seg
un lo anota Walter Wallace.
Con este alcance, la medici
on no es otra cosa que una forma de
observaci
on; en otras palabras, la ciencia es cuantitativa porque se basa
en observaciones registradas y representadas en smbolos. En consecuencia,
medici
on y cuantificaci
on no es lo mismo; la cuantificacion es una de las
modalidades de la medici
on. Lo que debe interesar acerca de los numerales
o smbolos es la manera como pueden ser utilizados para alcanzar diferentes
objetivos. En la mayora de los casos, estas metas no incluyen la representacion
de una cantidad o importe. De hecho, existen tres modos fundamentales de
utilizar numerales o smbolos:
Para nombrar (numerales nominales)
Para representar posici
on (numerales ordinales)
Para representar numericamente una cantidad o magnitud (numerales
cardinales).
Como conclusi
on, aceptemos la definicion que presenta Stevens sobre lo
que es medir, la cual precisa suficientemente esta cuestion: Medir es algo
relativo. Vara en grado y genero, en tipo y precision. En su sentido mas
amplio medir es asignar numerales a objetos o acontecimientos de acuerdo
con ciertas reglas. El hecho de que se lo puede hacer de acuerdo con diferentes
reglas origina diferentes tipos de escalas y diferentes tipos de medici
on. Las
reglas mismas se relacionan en parte con las operaciones empricas concretas de
nuestros procedimientos experimentales los que, mediante sus diversos grados
de precisi
on, ayudan a determinar cuan adecuado es el ajuste entre el modelo
matem
atico y aquello que representa.
(Bunge 1972) distingue cuatro elementos necesarios de toda medicion:
El mesurandum, o propiedad del sistema concreto que se ha de medir.
El concepto cuantitativo (metrico) del mesurandum, o sea, la magnitud
que se supone representa la propiedad objetiva; en la medida de lo
posible este concepto debe estar sumido en alguna teora cientfica y debe
analizarse l
ogicamente con base en variable(s) numerica(s), con objeto de
no perder de vista alg
un aspecto relevante.
Una escala conceptual y una escala material sobre las cuales puede
registrarse o medirse la magnitud,
Una unidad de medici
on que pertenezca a alg
un sistema de unidades
coherente.

16

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

Aunque se acepta que los elementos presentados por (Bunge 1972) son
necesarios, sin embargo no son suficientes para emprender una operacion de
medici
on y consecuentemente tratar de establecer las diferentes escalas o niveles
de medici
on, concepto este que se adoptar
a, mas como proceso de observacion,
que como proceso de an
alisis.
El proceso de medici
on tiene como prop
osito inicial distinguir y por ende
clasificar objetos, casos, fen
omenos y debe responder a una serie de principios
o requisitos que se enuncian a continuaci
on.
En primer lugar el proceso de medici
on debe ser v
alido, entendiendose
que cumple este requisito cuando mide de alguna manera demostrable aquello
que trata de medir, libre de distorsiones sistematicas. Cabe anotar que existen
diferentes metodos de validaci
on, a saber: La validez pragm
atica, consistente
en encontrar un criterio exterior al instrumento de medida, para relacionarlo
con las puntuaciones obtenidas. La validez predictiva, que se comprueba por
los resultados obtenidos en el futuro, y la validez concurrente, que contrasta
resultados de otros elementos de juicio, con tipos de validez pragmatica. Otro
procedimiento de validaci
on es el an
alisis factorial, aunque su aplicacion se
limita principalmente a los aspectos psicosociales.
El segundo principio deseable en la medici
on es la fiabilidad. Una medicion
es confiable o segura cuando aplicada repetidamente a un mismo individuo o
grupo, o al mismo tiempo por investigadores diferentes, proporciona resultados
iguales o por lo menos parecidos. La determinacion de la confiabilidad consiste
pues, en establecer si las diferencias de resultados se deben a inconsistencias en
la medida.
El problema de la fiabilidad se presenta en el instrumental que se utiliza,
cuando la validez de las mediciones ofrece dudas en relacion con lo que se
quiere medir. Los procedimientos m
as usuales para la determinacion de la
fiabilidad son el an
alisis de la estabilidad de los resultados, mediante la
aplicaci
on de mediciones repetidas y la equivalencia de los resultados cuando
los instrumentos son administrados por diferentes personas.
Finalmente se tiene el principio de la precisi
on. Se puede decir que una
medici
on es precisa cuando localiza con exactitud satisfactoria, en relacion con
el prop
osito que se busca, la posici
on del fen
omeno que se estudia.
El nivel de medida o escala de medida, expresiones aceptadas casi
universalmente, est
a formado por un conjunto de numerales distintos y un
conjunto de modalidades distintas relacionadas biunvocamente. Se suelen
distinguir cuatro niveles de medici
on que dan lugar a cuatro niveles de escalas:
nominal ordinal o de orden jer
arquico, de intervalos y de razon o cociente.
Ahora bien, el tipo de escala estar
a dado, seg
un sea verificable uno u otro tipo
de relaci
on.


2.4. SISTEMA CONCEPTUAL BASICO

2.4.3.2.

17

La Escala Nominal

Consiste en clasificar objetos o fen


omenos, seg
un ciertas caractersticas,
tipologas o nombres, d
andoles una denominacion o smbolo, sin que implique
ninguna relaci
on de orden, distancia o proporcion entre los objetos o fenomenos.
La medici
on se da a un nivel elemental cuando los n
umeros u otros smbolos
se usan para la distinci
on y clasificaci
on de objetos, persona o caractersticas.
Cuando se utilizan n
umeros para representar las diferentes clases de una escala
nominal, estos no poseen propiedades cuantitativas y sirven solamente para
identificar las clases.
Todas las escalas tienen ciertas propiedades formales. De estas propiedades
se deducen, definiciones exactas de las caractersticas de la escala mas precisas
de lo que pueden darse en terminos verbales. Estas propiedades pueden
formularse en forma m
as abstracta de lo que aqu se ha hecho, mediante un
conjunto de axiomas que delinean las operaciones para elaborar las escalas
y las relaciones entre los objetos a que se aplican. En una escala nominal,
la operaci
on de escalamiento consiste en partir de una caracterstica dada y
formar un subconjunto de clases que se excluyen mutuamente. La u
nica relacion
implicada es la de equivalencia. Esto es, los miembros de cualquier clase deben
ser equivalentes en la propiedad medida.
La relaci
on de equivalencia es reflexiva (x = x para todo x), simetrica (x = y
luego y = x) y transitiva (x = y y y = z luego x = z).
Puesto que en una escala nominal la clasificacion puede presentarse
igualmente por cualquier conjunto de smbolos, se dice que es
unica hasta una
transformaci
on de uno a uno. Los smbolos que representan a las diversas clases
de la escala pueden intercambiarse, llevando esto a cabo en forma consistente
y completa. Tales transformaciones son llamadas a veces grupos simetricos
de transformaciones. Los smbolos que designan a los diferentes grupos en
una escala nominal pueden intercambiarse sin alterar la informacion esencial
de la escala; debido a esto, las estadsticas de tipo descriptivo admisibles
son aquellas que no se alteran por este proceso: el modo, la frecuencia, el
conteo, la proporci
on, etc. Se pueden desarrollar procesos analticos acerca
de la distribuci
on de las categoras, as como la posible relacion entre dos o
m
as caractersticas clasificadas mediante este tipo de escala que llamaremos
variables no cuantitativas.

2.4.3.3.

La Escala Ordinal

Llamada tambien escala de orden jerarquico, con ella se establecen


posiciones relativas de los objetos o fen
omenos en estudio, respecto a alguna
caracterstica de interes, sin que se reflejen distancias entre ellos. Puede suceder
que los objetos de una categora de las escala no sean precisamente diferentes
a los objetos de otra categora de la escala, sino que estan relacionados entre

18

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

s. Los numerales empleados en las escalas ordinales no son cuantitativos, sino


que indican exclusivamente la posici
on en la serie ordenada y no cual es la
diferencia entre posiciones sucesivas de la escala.
Las relaciones entre los elementos en clasificacion, pueden formularse con el
signo >, mayor que, o sea que axiom
aticamente la diferencia fundamental entre
una escala nominal y una ordinal es que esta u
ltima incorpora no solamente
la relaci
on de equivalencia (=) sino tambien la relacion mas grande que
(>). Esta relaci
on es irreflexiva (no es verdad para ninguna x tal que x > x),
asimetrica (x > y luego x < y) y transitiva (x > y y y > z luego x > z).
Puesto que cualquier transformaci
on tendiente a conservar el orden no altera
la informaci
on contenida en una escala ordinal, se dice que la escala es
unica
hasta una transformaci
on monot
onica. Esto es, no importa que n
umeros se
den a una pareja de clases o a los miembros de esas clases, siempre que el
n
umero mayor sea dado a los miembros de la clase mayor o mas preferida. Por
supuesto, pueden usarse n
umeros menores para grados mas preferidos (...de
primera clase, de segunda clase, etc.); en tanto se sea consecuente, es indiferente
el uso del n
umero mayor o menor para denotar mayor o mas preferido.
Fundamentalmente, las escalas ordinales se estudian en Estadstica, con base
en las llamadas estadsticas de orden o estadsticas de rango.
2.4.3.4.

La Escala de Intervalo

Representa un nivel de medici


on m
as preciso, matematicamente hablando,
que las anteriores; no solo se establece un orden en las posiciones relativas de los
objetos o individuos, sino que se mide tambien la distancia entre los intervalos
o las diferentes categoras o clases. En este caso, la medicion se ejecuta en
el sentido de una escala de intervalo; esto es, si la asignacion de n
umeros a
varias clases de objetos es tan precisa que se sabe la magnitud de los intervalos
(distancias) entre todos los objetos de la escala, se ha obtenido una medida de
intervalo. Una escala de intervalo est
a caracterizada por una unidad de medida
com
un y constante que asigna un n
umero real a todos bs pares de objetos en
un conjunto ordenado. En esta clase de medida, la proporcion de dos intervalos
cualesquiera es independiente de la unidad de medida y del punto cero. En una
escala de intervalo, el punto cero y la unidad de medida son arbitrarios.
Axiom
aticamente se puede ver que las operaciones y las relaciones en que se
origina la estructura de una escala de intervalo son tales que las diferencias en
la escala son isom
orficas a la estructura de la aritmetica. Los n
umeros pueden
asociarse con las posiciones de los objetos de tal manera que las operaciones de
la aritmetica puedan realizarse significativamente con las diferencias entre los
n
umeros.
La consecuencia de cualquier cambio de los n
umeros asociados con los
objetos medidos en una escala de intervalo debe preservar no solamente el
orden de los objetos sino tambien las diferencias relativas entre ellos. Esto es,


2.4. SISTEMA CONCEPTUAL BASICO

19

la escala de intervalo es
unica hasta una transformacion linea1. La escala
de intervalo es la primera escala verdaderamente cuantitativa. Las estadsticas
parametricas, son las aplicables a estudios en estas escalas.
2.4.3.5.

La Escala de Raz
on

Cuando una escala tiene todas las caractersticas de una escala de intervalo
y adem
as un punto cero real en su origen, se llama escala de razon. Ademas
de distinci
on, orden y distancia, esta es una escala que permite establecer en
que proporci
on es mayor una categora de una escala que otra. El cero absoluto
o natural representa la nulidad de lo que se estudia.
Las operaciones y relaciones hechas con los valores numericos en una escala
de raz
on son correspondientes a una escala isomorfica de la estructura de la
aritmetica. Por consiguiente las operaciones de la aritmetica son permisibles en
los valores numericos asignados a los objetos mismos, as como tambien en los
intervalos entre los n
umeros como sucede en las escalas de intervalo. Implican
que las relaciones de equivalencia, relaci
on de mayor a menor, proporcion
conocida de dos intervalos y proporci
on conocida de dos valores de la escala,
sean posibles de obtener operacionalmente.
Los n
umeros asociados con los valores de la escala de razon son verdaderos
n
umeros con un verdadero cero; solo la unidad de medida es arbitraria. As la
escala de raz
on es
unica hasta la multiplicacion por una constante positiva.
Adem
as de los procesos parametricos b
asicos de las escalas de intervalo, en las
de raz
on pueden utilizarse estadsticas como la media geometrica, el coeficiente
de variaci
on, las que requieren el conocimiento del verdadero valor cero.

2.4.4.

El Censo o Enumeraci
on Completa

Un censo o enumeraci
on completa consiste en desarrollar los estudios
estadsticos, identificando y ubicando a TODOS los elementos del colectivo
o agregado, para obtener de ellos la informacion necesaria sobre las variables
de interes, con el fin de analizarla e interpretarla.
Este metodo presenta las siguientes caractersticas:
No requiere de procesos de inferencia estadstica
Sus resultados sirven de marco muestral a otros estudios
Facilita la realizaci
on de estudios en subcolectivos
Produce costos demasiado altos, en todo tipo de recursos
Implica un complicado proceso de planeacion, organizacion y control

20

CAPITULO 2. CONCEPTOS FUNDAMENTALES DE ESTADISTICA

En general los resultados se obtienen a mediano o largo plazo, perdiendo


oportunidad y actualidad
No permite la realizaci
on de estudios con altos niveles de especificidad y
desagregaci
on
En algunos casos, la naturaleza del estudio impide la realizacion del
censo, por requerir procesos de observacion de caractersticas de estudio,
mediante metodos parcial o totalmente destructivos de los elementos del
agregado.
Las desventajas del metodo censal, no implican necesariamente que nunca
se puedan realizar estudios censales, por el contrario cuando las circunstancias
lo permitan por existir objetivos de tipo muy global, agregados relativamente
peque
nos y f
acilmente ubicables, recursos suficientes, etc., se debe utilizar este
tipo de enumeraci
on.

2.4.5.

El Muestreo

Para resolver los problemas que en general se presentan para realizar


censos, se ha desarrollado el metodo de muestreo, el cual de manera sencilla
puede definirse como un metodo cientfico que pone en practica principios
estadstico matem
aticos, que permiten obtener informacion de una PARTE
de los elementos del agregado y hacer inferencias acerca de las caractersticas
estudiadas, para todo el colectivo de origen.
Las principales caractersticas del metodo son:
Costos en general m
as bajos que en el censo
Planeaci
on, organizaci
on y control m
as sencillos y detallados
Resultados a corto plazo y oportunos
Posibilidad de realizar estudios m
as detallados, al permitir la obtencion
de informaci
on a nivel mas especfico
Soluci
on de los problemas ocasionados por procesos de medicion
destructivos
Flexibilidad, que permite utilizar diferentes formas de medicion, analisis
e inferencia
Requiere de procesos de inferencia estadstica
Dificulta, en algunos casos, los estudios desagregados en subcolectivos
No es aceptado, en algunas instancias, sobre todo por la falta de
conocimiento de sus bondades.


2.4. SISTEMA CONCEPTUAL BASICO

21

La parte de elementos que es seleccionada para el estudio, es conocida


como LA MUESTRA y para que el proceso tenga validez, esta debe tener
caractersticas de confiabilidad con respecto al agregado del cual procede. En

procura de tal confiabilidad, se han desarrollado diferentes tipos de DISENO


MUESTRAL, que consiste en:
Determinar el tama
no de la muestra
Determinar el proceso de selecci
on de la misma
Determinar los procesos de inferencia

2.4.6.

Los Par
ametros y las Estadsticas

Los resultados de estudios y an


alisis estadsticos, se reflejan basicamente
en un conjunto de diversas medidas de diferente ndole y naturaleza. Cuando
tales medidas son resultado de una enumeracion completa o sea que se refieren

a todo el agregado, reciben el nombre de PARAMETROS


y cuando son de

nivel muestral se les conoce como ESTADISTICAS o ESTAD


IGRAFOS.
Por ser las muestras seleccionadas en general por metodos de azar, las
estadsticas o estadgrafos se constituyen en variables aleatorias, para cuyo
manejo ser
a necesario conocer o deducir, el comportamiento probabilstico de
las mismas.
Constituyen los anteriores conceptos, el conjunto basico del lexico
estadstico, especialmente relativos a lo que debe ser una introduccion
a cualquier curso Inicial de Estadstica. Conceptos mas especficos, van
apareciendo en la medida en que se presenten otros metodos, tecnicas y procesos
analticos de esta ciencia.

CAPITULO

Metodologa de la Estadstica

Sin pretender ser exhaustivo, se esbozaran a continuacion las fases generales


que se deben llevar a cabo para realizar un estudio utilizando las tecnicas
estadsticas.

3.1.

Definici
on de Objetivos

Indudablemente esta etapa constituye el punto de partida de todo estudio


y su importancia y trascendencia, para las fases posteriores, son innegables. Lo
esencial en este momento, es responder a preguntas como Que?, Para que?,
Por que? y las respuestas a las mismas deben ser presentadas de manera clara,
concreta, concisa y unificada.
Cabe distinguir en este aspecto, al objetivo (u objetivos) general, que
corresponde a una definici
on a grandes rasgos del problema o tema de
estudio, de los objetivos especficos, que son definiciones en detalle y altamente
desagregadas de los fines del mismo. Los objetivos especficos, son subtemas en
que se divide el objetivo general y que una vez alcanzados, llevan en conjunto
al logro de este.
Desde el punto de vista estadstico, la definicion de los objetivos especficos
es de gran importancia, ya que ellos permiten clarificar el tipo de variables a
considerar, la informaci
on que se requiere sobre ellas y los procedimientos de
muestreo y an
alisis necesarios.
22

DEL COLECTIVO O POBLACION

3.2. DEFINICION

3.2.

23

Definici
on del colectivo o poblaci
on

Tan fundamental para lograr buenos resultados del estudio, como la fase
anterior, lo es la de definici
on del colectivo o poblacion, la cual, a ser realizada
en forma clara, concreta, concisa y unificada, debe hacer referencia al contenido,
las unidades, la extensi
on y momento de consideracion de la misma.
La naturaleza de los elementos que forman el colectivo, su estructura y
configuraci
on temporo espacial, son aspectos que determinan hasta cierto
punto, el tipo de muestreo m
as conveniente a utilizar, el marco adecuado, los
metodos de obtenci
on de la informaci
on y otros conceptos similares.
En m
ultiples ocasiones se diferencia la Poblaci
on Objetivo, que es aquella
a la cual se refiere en terminos generales la investigacion, de la Poblaci
on
de Estudio, Maestreo o An
alisis, definida como la poblacion objetivo con
una serie de restricciones, generadas por la misma naturaleza del estudio,
falta de cobertura del marco de muestreo, problemas de no respuesta, etc.
En sentido estricto, solo queda representada en la muestra la poblacion de
estudio o de encuesta, pero su descripci
on puede ser difcil si se quiere hacerlo
especficamente, por lo que es m
as frecuente hacer referencia a la poblacion
objetivo definida.

3.3.

Determinaci
on de la cobertura

Teniendo en cuenta los objetivos del estudio, la estructura poblacional,


los recursos disponibles y las caractersticas de los metodos de enumeracion
completa (censo) o parcial (muestreo) se determina cual de los dos se
deber
a utilizar.
Considerando que en general los estudios se realizan mediante muestreo,
se enunciaran a continuaci
on las fases siguientes, bajo el supuesto de que el
estudio se realizar
a utilizando el metodo de muestreo.

3.4.
3.4.1.

Determinaci
on del marco de muestreo
Definici
on

Se entiende por Marco de Muestreo o Marco Muestral, todo artificio


o conjunto de artificios, que permita la identificacion y ubicacion de todos y
cada uno de los elementos de la poblaci
on o en su defecto, de todas y cada
una de las unidades muestrales, ya que es la base del proceso de seleccion de
la muestra.
Los factores relevantes de la naturaleza del marco disponible o factible,

24

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

incluyen los tipos de unidades muestrales que contenga, la extension de


la cobertura, la exactitud y completez del mismo, la cantidad y calidad
de informaci
on auxiliar en el y es determinante para el dise
no de la
muestra. Algunos ejemplos de marcos son listas de elementos, archivos,
mapas, cartogramas, k
ardex, dispositivos de entrada salida en sistemas de
computaci
on, etc.
Lo ideal es que el marco a utilizar sea ACTUALIZADO, lo que equivale a
que tenga una cobertura completa, no contenga elementos repetidos, ni blancos,
ni extra
nos. Todos y cada uno de los elementos del marco deben representar a
una y solo una unidad muestral y cada unidad muestral debe estar representada
por uno y solamente uno de los elementos del marco.
Sin embargo, en la mayora de los casos practicos, estas caractersticas
son bastante difciles de encontrar, lo cual genera uno de los problemas ms
complejos de solucionar en este tipo de estudios.

3.4.2.

Problemas del Marco

Los problemas m
as comunes en la determinacion del marco muestral son:
Unidades vacas, llamado tambien elementos faltantes, falta de cobertura
o marco incompleto y que consiste en que algunos elementos del agregado,
no aparecen en el marco
Blancos y extra
nos, corresponde este problema a situaciones en las cuales
el marco contiene elementos que ya no pertenecen a la poblacion por
haber cambiado su estructura o porque definitivamente desaparecieron
de la misma.
Conglomerados de unidades muestrales, pueden aparecer juntas asociadas
con un listado aislado.
Un elemento del marco representa a m
as de una unidad muestral
Unidades duplicadas, problema que se presenta cuando una unidad
aparece m
as de una vez en el marco.

3.4.3.

Soluciones Generales

Aunque para cada problema del marco se requieren soluciones especficas,


que dependen en gran parte de la situaci
on particular en que se encuentre el
investigador, se mencionan tres soluciones generales para tratar de solucionar
problemas:

DE UNIDADES
3.5. DEFINICION

25

Ignorarlos, si son relativamente peque


nos comparados con otros errores
y el costo de soluci
on es muy alto. Se debera en este caso, referenciar la
circunstancia bajo la cual se est
a utilizando el marco.
Redefinir la poblaci
on con base en el marco, si el error que se comete
es despreciable y si no cambia el sentido de los objetivos del estudio. Se
debe tambien comentar la situaci
on.
Corregir el marco, soluci
on que es la ideal, pero en ocasiones la menos
factible.

3.5.

Definici
on de unidades

En terminos generales son normas o patrones de conteo, medicion, seleccion


u observaci
on y su definici
on es fundamental en el estudio, por lo cual deber
hacerse tambien muy clara, concreta y unificadamente. Se distinguen y es
necesario definirlas en los correspondientes casos, los tipos de unidades que
a continuaci
on se presentan.

3.5.1.

Unidad Poblacional

Tambien conocidas como las unidades elementales, corresponden al


elemento o hecho individual que se cuenta y/o mide y que unido a los demas
de su misma naturaleza, forma el colectivo que se estudia. Su naturaleza y
caractersticas se determinan seg
un los objetivos del estudio.

3.5.2.

Unidad Muestral

Se constituye en el elemento b
asico para la seleccion de la muestra de
unidades poblacionales. Pueden ser estas mismas o grupos de ellas, como sucede
en el muestreo por conglomerados. Deben estar definidas en forma tal que cada
unidad poblacional pertenezca a una y solo una unidad de muestreo.
Se subdividen en unidades parciales, que son aquellas que aparecen en razon
del proceso de selecci
on y constituyen siempre subdivisiones de la poblacion a
traves de las cuales ha de pasarse, antes de llegar a las unidades finales, definidas
estas u
ltimas como aquellas que tienen caractersticas definidas de permanencia
y son f
acilmente distinguibles en perodos mas o menos largos de tiempo.

3.5.3.

Unidades de Observaci
on

Son aquellos elementos de los cuales se obtiene la informacion, por lo cual se


les conoce tambien con los nombres de fuentes de informacion. Pueden coincidir

26

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

o no con la unidad poblacional y son determinantes para la calidad de la


informaci
on y para el proceso de recolecci
on de la misma.

3.6.

Determinaci
on del dise
no muestral

Definidos claramente los objetivos del estudio y la poblacion, determinado


el marco muestral y los recursos disponibles y definidas as mismo las diversas
unidades del proceso, se puede pasar a la fase de seleccion del tipo de dise
no
muestral a utilizar, aunque en la pr
actica todas estas etapas se desarrollan
paralelamente.
Para determinar el tipo de selecci
on se tienen en cuenta principalmente, los
objetivos del estudio, la estructura de la poblacion, el marco y los recursos
disponibles (humanos, financieros, materiales, de disponibilidad de tiempo,
etc.). Para el tama
no de la muestra se deben considerar los siguientes aspectos:
tipo de selecci
on, grado de confiabilidad de los procesos inferenciales, errores
de muestreo, recursos disponibles, caractersticas basicas a analizar y tama
no
de la poblaci
on.
Se suele hacer una gran clasificaci
on de los tipos de dise
no muestral, en
dos categoras que son el Muestreo No Probabilstico y el Muestreo
Probabilstico.

3.6.1.

Muestreo No Probabilstico

Se caracteriza porque el dise


no se realiza en forma subjetiva, arbitraria,
seg
un el criterio del investigador o del entrevistador de campo. No existe
una oportunidad real de que un elemento en particular de la poblacion,
sea seleccionado. No es posible, por lo tanto, calcular error de muestreo, ni
la confiabilidad de las inferencias. Se est
a simplemente en el campo de las
especulaciones y las suposiciones. Algunas modalidades de este tipo de muestreo
son:
El muestreo de conveniencia, que se caracteriza porque en general
la unidad de muestreo se auto selecciona o se ha seleccionado debido
a su f
acil disponibilidad. En estos casos no se especifica claramente la
poblaci
on de la cual se ha tomado la muestra, por lo cual se desconoce la
diferencia entre el valor de interes de la poblacion y el valor de la muestra,
en terminos de tama
no y direcci
on. Desafortunadamente es un muestreo
utilizado extensivamente en la pr
actica.
Muestreo de comparaci
on, para el cual los elementos son seleccionados
con base en lo que alg
un experto piensa acerca de lo que esas unidades
pueden aportar a la investigaci
on, por lo cual se les conoce tambien como

DE INFORMACION

3.7. RECOLECCION

27

muestras por expertos. En este caso se desconoce tambien el error de


muestreo y la confianza, pero si el criterio y etica del experto son validos,
la muestra puede resultar mejor que la de conveniencia. Se utiliza este
tipo de muestreo moderadamente en la practica.
El muestreo por cuotas, que puede considerarse mas un metodo de
selecci
on que un tipo de dise
no. El tama
no de la muestra y los procesos
de inferencia se realizan en forma tecnica, pero los elementos para la
muestra son seleccionados en forma subjetiva, pero con arreglo a ciertas
caractersticas de control previamente determinadas. Es un metodo de
selecci
on muy u
til en las etapas previas de la investigacion y si se elabora
con cuidado, puede suministrar informacion mas definitiva. Se utiliza muy
extensamente en la pr
actica.

3.6.2.

Muestreo Probabilstico

Se fundamenta en la probabilidad que tiene cada elemento del agregado


para hacer parte de la muestra. Dadas ciertas condiciones de confiabilidad,
error m
aximo admisible y tama
no poblacional, se deja al azar el dise
no de la
muestra. El muestreo se realiza mediante reglas estadsticas que no permiten
ning
un elemento de juicio al investigador, generando muestras mas objetivas.
Permite medir la confiabilidad de los procesos de inferencia y el error
de muestreo que por su naturaleza conlleva. Presenta tambien diversas
modalidades, siendo las m
as cl
asicas el muestreo aleatorio simple, el muestreo
estratificado y el muestreo por conglomerados.

3.7.

Recolecci
on de informaci
on

Se define como el proceso estadstico mediante el cual se obtiene toda la


informaci
on pertinente a un problema dado. Para llevar a cabo esta tarea
de recopilaci
on de datos e informaci
on, existen m
ultiples procedimientos y la
utilizaci
on de uno u otro, depende de la naturaleza del problema a estudiar,
del equipo de investigaci
on disponible y de la estructura y caractersticas de
las unidades de observaci
on.
En terminos globales se consideran dos situaciones basicas, que dependen
del estado de la informaci
on y que implican dos tipos de tareas diferentes a
saber:
Recopilaci
on de datos sobre el terreno (informacion primaria)
Identificaci
on y recolecci
on de datos ya disponibles para ulterior
utilizaci
on (informaci
on secundaria).

28

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

En el primer caso el procedimiento se basa en la utilizacion de


formularios estadsticos, definidos como un instrumento de recopilacion de
datos, rigurosamente estructurado, que traduce y operacionaliza determinados
problemas que son objeto de estudio. Aunque existen diferentes formas de
aplicarlo, estas se pueden resumir fundamentalmente en dos que son: la
entrevista personal y el formulario postal; modificaciones de estas
dos formas b
asicas, generan otras.
En la segunda situaci
on, el proceso se reduce a la llamada recopilaci
on
documental, para lo cual lo importante es la determinacion de la calidad y
confiabilidad de la informaci
on a ser utilizada en estudio.
Al igual que todas las anteriores, esta fase es de gran importancia para
la investigaci
on, pues ella va a generar la materia prima para su desarrollo,
cual son los datos. Existen diversas tecnicas y recomendaciones respecto a la
manera de realizar este proceso, que hacen referencia desde la forma y tipos
de preguntas, hasta la presentaci
on personal del encuestador en el caso de la
entrevista personal.

3.8.

Tratamiento de la informaci
on

Cuando un investigador conduce un estudio, de ordinario re


une una gran
cantidad de informaci
on numerica o datos acerca del problema en cuestion.
Los datos podr
an tener variedad de formas y su expresion original, tal cual
son recopilados, son usualmente un enredo de recuentos, mediciones, etc. Al
realizar la funci
on descriptiva, la Estadstica formula reglas y procedimientos
para la depuraci
on, clasificaci
on, presentaci
on y reduccion de los datos, de tal
manera que sean u
tiles para su an
alisis e interpretacion.
Es necesario depurar los datos, ordenarlos, clasificarlos y reducirlos a cifras
relativas como los porcentajes, los promedios, los coeficientes estadsticos y en
general las medidas b
asicas de interes.

3.8.1.

Distribuciones de Frecuencias

Suponiendo que se han realizado n observaciones de las variables en estudio,


el proceso que genera un conjunto de n resultados observacionales, denominado
datos originales, que ser
an de igual dimension al n
umero de variables
consideradas.
Esta masa o acopio de informaci
on es difcil de manejar e interpretar
y no permite detectar, en primera instancia, hechos relevantes acerca del
comportamiento generalizado de las variables, en los n casos observados.
Un primer paso en logro de este u
ltimo objetivo, consiste en agrupar la
informaci
on, clasificando los datos seg
un los diferentes valores que puedan


3.8. TRATAMIENTO DE LA INFORMACION

29

presentar una o un conjunto de caractersticas, valores que constituiran las


diferentes categoras o clases para la clasificacion. Dependiendo de la naturaleza
de las variables y de los objetivos propuestos, se utilizaran adecuadamente las
diferentes escalas de clasificaci
on ya enunciadas.
El proceso contin
ua con el conteo (o recuento como lo llaman popularmente)
del n
umero de observaciones o casos que se presentan en cada clase, generandose
de esta manera las llamadas frecuencias de clase, lo que da inicio al proceso
conocido como la reducci
on del dato.
De acuerdo con el n
umero de variables que se tengan en cuenta cada
vez para la clasificaci
on, se presentan fundamentalmente las clasificaciones
simples o unidimensionales, las de doble entrada o bidimensionales y
la clasificaci
on m
ultiple, seg
un que se consideren simultaneamente una dos o
m
as variables para el proceso, respectivamente.

3.8.2.

Clasificaci
on Unidimensional

Considerada cada variable por separado, se establecen adecuadamente las


diferentes clases o categoras para ella; simbolizando alguna de las clases como
Cj , se supone que se han generado m clases; entonces: j = 1, 2, 3, 4, . . ., m.
Los n
umeros que resultan directamente del proceso de conteo de casos en
cada clase, o sea la frecuencia, se acostumbra denominarlo mas especficamente
la frecuencia absoluta, la cual se simboliza por nj y presenta las
propiedades siguientes:
a. nj 0
b. nj n
c.

m
P

nj = n

j=1

En la mayora de estudios, m
as que saber el n
umero de casos por clase,
interesa mucho m
as su proporci
on respecto al total de casos considerados,
pues en general las cifras relativas son mas analticas que los datos
absolutos. Se definen as las llamadas frecuencias relativas o simplemente
frecuencias, como el cociente entre la frecuencia absoluta de cada clase y
el total de casos, simb
olicamente:
fj =

nj
n

El estudio del comportamiento de las frecuencias relativas, ha sido


fundamental en el desarrollo del c
alculo de probabilidades y es trascendental
para el establecimiento de la relaci
on existente entre los metodos

30

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

observacionales de la Estadstica y los inductivos y el soporte probabilstico de


tal relaci
on. Las frecuencias relativas son medidas empricas de probabilidad.
Considerando las siguientes propiedades logicas de estas frecuencias,
se establece un claro paralelo con aquellas asociadas con la medida de
probabilidad:
a. fj 0
b. fj 1
c.

m
P

fj = 1

j=1

Para el an
alisis de t
opicos importantes dentro de los procesos estadsticos, es
necesario, especialmente en el caso de variables cuantitativas, adicionar clase
por clase, las frecuencias tanto absolutas como relativas. El resultado de tal
operaci
on es conocido como las frecuencias acumuladas, las cuales en el
caso relativo corresponden a la imagen emprica de la Funcion de Distribucion
de una variable aleatoria.
Estas frecuencias, se representan generalmente por Nj y Fj , absolutas y
relativas respectivamente y dada alguna clase de la variable, por ejemplo la p
esima, se tendr
a:
p
p
X
X
Np =
nj ;
Fp =
fj
j=1

j=1

Tabular y simb
olicamente el proceso la siguiente forma:
CLASES
C1
C2
..
.
Cj
..
.
Cm
TOTAL

FRECUENCIAS
ABSOLUTAS
n1
n2
..
.
nj
..
.
nm
N

FRECUENCIAS
RELATIVAS
f1
f2
..
.
fj
..
.
fm
1

El agrupamiento de la informaci
on permite ir detectando propiedades o
comportamientos regularizados de los datos, si existen, y como se anoto, es
fundamental para visualizar la relaci
on entre la probabilidad y los metodos
estadsticos.


3.8. TRATAMIENTO DE LA INFORMACION

31

Los cuatro tipos de frecuencias citados, son susceptibles de representaciones


gr
aficas, algunas de las cuales son de naturaleza analtica y otras de caracter
simplemente de presentaci
on.

3.8.3.

Clasificaci
on Bi y Pluridimensional

Son m
ultiples los estudios en los cuales interesa analizar el comportamiento
conjunto de dos o m
as variables, especialmente con miras a tratar de establecer
la posible relaci
on existente entre ellas y primer paso tras tal objetivo, es
clasificar los datos con relaci
on a dos (o mas) variables simultaneamente.
Las siguientes anotaciones del caso bidimensional, se pueden facilmente hacer
extensibles para m
as de dos variables.
Determinadas las clases para cada una de las dos variables, estas se disponen
en una tabla de doble entrada en la cual las filas y columnas principales
se destinan para presentar dichas clases. Las casillas al interior de la tabla,
constituyen las clases bidimensionales o clases conjuntas, correspondiendo a
la intersecci
on de una clase de alguna de las variables, con una clase de la otra.
Es usual, sobretodo en computaci
on, referirse en estos casos a clases o tablas
cruzadas.
Las frecuencias, resultado del conteo del total de casos en cada clase
conjunta, se llaman por extensi
on l
ogica frecuencias bidimensionales y las
de tipo relativo se asocian, a nivel emprico, con el concepto de probabilidad
conjunta o probabilidad de la intersecci
on de dos eventos.
Si se denota por Cj alguna de las m clases de una de las caractersticas,
generalmente la ubicada en la columna, y por Bk algo similar para alguna de las
w clases de la otra variable, las frecuencias absolutas bidimensionales presentan
las siguientes caractersticas y propiedades:
njk =frecuencia de casos en la clase j esima de C y la k esima de B.
nj = frecuencia de casos en la j esima clase de C, sin tener en cuenta a la
variable B (marginales de C)
nk = frecuencia de casos en la k esima clase de B, sin tener en cuenta a la
variable C (marginales de B)
con las siguientes propiedades l
ogicas:
a. njk 0
b. njk n
c. njk nj
d. njk nk
e.

m P
w
P
j=1 k=1

njk = n

32

f.

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

w
P

njk = nj

k=1

g.

m
P

njk = nk

j=1

Las dos u
ltimas propiedades indican que al sumar las frecuencias
bidimensionales, sobre el recorrido de una de las variables, se obtienen
las unidimensionales de la otra, conocidas com
unmente como frecuencias
marginales. Los puntos en la notaci
on simbolica de estas u
ltimas se refieren
a la variable que no se est
a considerando.
Las frecuencias relativas, tienen las siguientes propiedades logicas:
n
fjk = jk = P (Cj Bk )
n
a. fjk 0
b. fjk 1
c.

m P
w
P

fjk = 1

j=1 k=1

d.

w
P

fjk = nj

k=1

e.

m
P

fjk = nk

j=1

Con base en las frecuencias absolutas marginales de cada una de las


variables (totales por filas y columnas), es factible tener una primera idea del
comportamiento de una de ellas en las diferentes clases de la otra.
Para esto, por ejemplo, se dividen las frecuencias absolutas de cada fila, por
el total de la misma, obteniendo de esta forma los porcentajes de cada casilla,
con respecto al total de la correspondiente fila. Estos porcentajes indican como
se distribuyen los casos de Cj con respecto a cada una de las clases de B. Una
discusi
on similar se presenta trabajando por columnas.
Este procedimiento equivale a nivel observacional, al concepto de
las probabilidades condicionales y es fundamental en los estudios
estadsticos sobre relaci
on entre variables, especialmente cuando estas son de
naturaleza no cuantitativa.
Simb
olicamente el resultado sera el siguiente, considerando la j esima
clase de C y la k esima de B:
n
fk|j = jk = P (Bk |Cj )
nj

33

3.9. ANALISIS
E INTERPRETACION

La presentaci
on tabular de las frecuencias absolutas, tendra la siguiente
forma:
CLASES
C1
C2
..
.
Cj
..
.
Cm
TOTAL

B1
n11
n21
..
.
nj1
..
.
nm1
n1

B2
n12
n22
..
.
nj2
..
.
nm2
n2

...
...
...
..
.
...
..
.
...
...

Bk
n1k
n2k
..
.
njk
..
.
nmk
nk

...
...
...
..
.
...
..
.
...
...

Bw
n1w
n2w
..
.
njw
..
.
nmw
nw

TOTAL
n1
n2
..
.
nj
..
.
nm
n

Cuando se consideran m
as de dos variables simultaneamente, el proceso se
denomina clasificaci
on m
ultiple o pluridimensional y a partir de la consideracion
conjunta de todas las variables, es posible deducir todas las situaciones de orden
menor. No es muy com
un presentar cuadros conjuntos para mas de tres o cuatro
variables, pero los aspectos conceptuales se pueden desarrollar por partes, de
una manera relativamente sencilla.

3.9.

An
alisis e Interpretaci
on

Obtenida, depurada y clasificada la informacion, siguen en orden


metodol
ogico las aplicaciones de las tecnicas estadsticas correspondientes para
su an
alisis y solo el conocimiento del soporte conceptual de estas, permitira la
interpretaci
on de los resultados.
Considerando que los metodos estadsticos aplicados y el desarrollo de
la Estadstica en s misma, tienen una fuerte fundamentacion probabilstica,
es necesario el conocimiento de los conceptos metodos del calculo de
probabilidades, de las variables aleatorias, de las funciones y distribuciones
de probabilidad, tanto generales como especiales, as como de las medidas
caractersticas de una variable aleatoria.
Los llamados metodos descriptivos, que quizas se deberan llamar empricos
u observacionales, son as mismo importantes y se deberan presentar siempre,
en relaci
on con los te
oricos.
Las tecnicas de estudio de asociacion entre variables, sean estas
cuantitativas o no, se han constituido en los u
ltimos tiempos en valiosos
auxiliares para la pr
actica y desarrollo de otras ciencias; algo similar sucede
con el an
alisis de series de tiempo, con el dise
no de experimentos, los metodos
no parametricos, el an
alisis multivariado, en fin, con todos los procedimientos
de an
alisis estadstico.

34

CAPITULO 3. METODOLOGIA DE LA ESTADISTICA

Es de destacar el hecho de que, en los tiempos modernos, la inferencia


estadstica, con sus procesos b
asicos de estimaci
on y pruebas de hip
otesis,
constituye elemento fundamental no solo para la aplicacion del Metodo
Cientfico, sino para su desarrollo y como consecuencia logica, para la aplicacion
y desarrollo de pr
acticamente todas las disciplinas y ciencias en el diario
transcurrir del ser humano.
De all la gran importancia que actualmente ha adquirido y
seguir
a adquiriendo la Estadstica, importancia que sera mejor apreciada
en tanto que los docentes en esta ciencia, nos interesemos en darle enfasis a la
presentaci
on conceptual de la misma, m
as que a sus procesos operacionales.

CAPITULO

Analisis de variables no cuantitativas

4.1.

Introducci
on

En general cuando se observan variables no cuantitativas en los elementos


de una poblaci
on o de una muestra, el interes posterior a este proceso se centra
no solo en analizar comportamientos generalizados de las mismas, sino, mas
com
unmente, en establecer si existen relaciones de correspondencia, coligacion
o asociaci
on entre dos o m
as de tales variables. Las variables no cuantitativas se
generan por escalas de medici
on nominal u ordinal, a diferencia de las variables
cuantitativas generadas por escalas de intervalo o de razon.
Los metodos para analizar las variables no cuantitativas son de
diversa ndole, siendo los m
as preponderantes hoy en da el Analisis de
Correspondencias, la Clasificaci
on Autom
atica, la Estadstica Textual, metodos
que superan los alcances de estas notas, en las cuales solo se presentan
fundamentos de tipo esencialmente descriptivo, para el tratamiento de tales
variables.

4.2.
4.2.1.

An
alisis b
asico en tablas 2 x 2
Notaci
on y Consistencia

En esta secci
on se presenta el caso en que se consideran dos
variables clasificadas cada una dicot
omicamente (dos categoras mutuamente
excluyentes), produciendo cuatro clases conjuntas, como en la siguiente tabla:
35

36

CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS

CLASES
A1
A2
TOTAL

B1
n11
n21
n1

B2
n11
n21
n2

TOTAL
n1
n2
n

En esta tabla donde cada entrada en el cuerpo de la misma es llamada una


celda, es conveniente tener en cuenta la notacion. Simbolicamente, A1 y A2
representan las dos clases de una de las variables y B1 y B2 las de la otra.
Es costumbre llamar primera variable a aquella en la vertical y segunda
a la ubicada en la horizontal. La primera clase de cada una de las variables
corresponde, generalmente, a una de sus modalidades de especial interes en un
estudio y la segunda clase a la negaci
on de tal modalidad por lo que algunos
autores se refieren a la clase positiva y a la negativa de cada variable.
Las frecuencias, tanto conjuntas o bidimensionales como marginales, son
un caso particular de las discutidas en el Captulo 3 y poseen entonces
las propiedades l
ogicas, que permiten en un primer analisis determinar la
consistencia de los datos y la condici
on necesaria y suficiente es que ninguna
frecuencia es negativa.
A partir de esta condici
on b
asica, se deducen otras formas del criterio de
consistencia, de las cuales se presentan a continuacion algunos casos:
a. n12 0
b. n12 n2
c. n12 n1
d. n11 + n12 + n21 + n22 = n
e. n12 n1 + n2 n
Formas similares se pueden deducir para las otras frecuencias y, en general,
es conveniente hacer antes de todo proceso una comprobacion de la consistencia
de las mismas.

4.2.2.

Independencia y Correspondencia

Para el an
alisis b
asico de los datos, desde el punto de vista de la posible
existencia de relaci
on entre las caractersticas, el punto de partida consiste en
suponer que tal relaci
on no existe, lo cual en el caso absoluto, implica que
no existe relaci
on alguna entre cada una de las clases de una de las variables
y cada una de las de la otra. La no existencia de alg
un tipo de relacion o
correspondencia de comportamiento entre las dos variables se conoce como
INDEPENDENCIA.

4.2. ANALISIS
BASICO
EN TABLAS 2 X 2

37

El supuesto o Hip
otesis de independencia se puede plantear para las dos
variables en su conjunto o solamente entre algunas de las clases, situacion esta
u
ltima en la cual, el supuesto implica que la distribucion de casos en alguna clase
de una de las variables, debe presentar la misma proporcion en las dos clases
de la otra. Simb
olicamente este criterio de independencia, se expresa de
la siguiente forma para el caso de la clase A1 con respecto a las clases B1 y B2 :
n
n11
= 12
n1
n2
De esta relaci
on se deducen inmediatamente las similares:
n21
n
= 22 ;
n1
n2

n12
n
= 22 ;
n1
n2

n11
n
= 21
n1
n2

Existen otras formas del criterio de independencia que son mas u


tiles, desde el
punto de vista te
orico. As, a partir de la primera forma expuesta anteriormente,
se tiene:
n n11
n11
= 1
n1
n n1
por tanto:
n n1
n n12
= 1
n1
n12
y finalmente:

n12
n
= 2
n1
n

De manera similar.
n12
n
n n
n
n n
= 1 n12 = 1 2 12 = 1 2
n2
n
n
n
n n
Esta u
ltima forma obtenida aqu descriptivamente, corresponde al criterio de
independencia probabilstica entre dos eventos cualesquiera, que para el caso
de la intersecci
on de los mismos expresa que:
P (A1 B2 ) = P (A1 )P (B2 )
lo cual equivale a que si entre dos clases de dos variables existe independencia,
la proporci
on de casos en la clase conjunta, con respecto al total de casos, es
igual al producto entre las proporciones de casos, con respecto al total, de cada
clase.
Si la anterior relaci
on se verifica, relaciones analogas se verificaran para las
otras tres clases conjuntas y por tanto se puede encontrar otra forma del criterio
de independencia, considerando que:
n12 n21 =

n1 n2 n2 n1
n2

38

CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS

obviamente n11 n22 es igual a la misma fracci


on, por consiguiente:
n
n
n
n11
= 12 11 = 21
n21
n22
n12
n22
Estas u
ltimas formas indican que, en el caso de independencia, la razon de los
A1 a los A2 entre los B1 , es igual a la raz
on entre las dos clases de A en los B2
y an
alogamente para la raz
on de las clases de B entre las de A. Esta manera de
expresar el criterio de independencia permite reconocer con las solas frecuencias
bidimensionales, si las dos variables en estudio son o no independientes.
Todas las igualdades anteriores son rgidas a nivel de la teora, pero en la
pr
actica se asumen como aproximadamente o relativamente iguales o lo que es
equivalente, como no significativamente diferentes, conceptos que implican
la utilizaci
on de los metodos estadsticos inferenciales, para determinar cuando
las diferencias pueden considerarse significativas o no.
Si las anteriores igualdades no se cumplen, en el sentido relativo expresado
antes, las clases o variables correspondientes, seran independientes, lo que
implica por lo menos la sospecha de la existencia de alg
un tipo de relacion, que
se llama en algunos casos asociaci
on, pero que corresponde mas al concepto de
concordancia o correspondencia entre las clases o variables.
La concordancia o correspondencia es a menudo considerada como una
forma especial de asociaci
on, pero en realidad existen diferencias entre los
conceptos. En general, con respecto a la correspondencia, lo mas importante
es la similitud de comportamiento (en un sentido amplio) entre clases, con el
objetivo de determinar el grado de identidad de tal comportamiento. En el
caso de la asociaci
on, se investiga la intensidad y forma de la relacion, con el
fin de predecir valores de una variable, con base en los de otra, proposito que
en general no se persigue en el an
alisis de correspondencias.
La posible existencia de concordancia entre clases, se puede entonces
expresar de la siguiente manera:
n n
n11 > 1 1
n
lo que indica que son m
as los casos obtenidos en la clase conjunta A1 B1 que los
esperados si existiera independencia. Para los usuarios de los terminos clases
positivas y negativas, esto indicara que generalmente la clase positiva de una
variable concuerda mas con la positiva de la otra, razon por la cual se habla de
asociaci
on positiva o simplemente asociaci
on.
Si por el contrario:

n1 n1
n
los casos de la clase conjunta son menos de los esperados, situacion que lleva
a hablar de asociaci
on negativa o disociaci
on, en el sentido de que las clases
positivas tienden a no concordar. De acuerdo con lo anotado, se debe hablar
m
as bien en terminos de clases correspondientes o no correspondientes.
n11 <

4.2. ANALISIS
BASICO
EN TABLAS 2 X 2

39

El caso extremo, llamado correspondencia absoluta o completa, implica que


todos los A1 deben ser B1 y viceversa, criterio este que es muy rgido y que se
puede flexibilizar al exigir solo que todos los A1 sean B1 o que todos los B1
sean A1 , seg
un la clase que sea m
as peque
na.
Las formas anteriores y sus similares, para tratar los casos de relacion son
los m
as naturales, desde el punto de vista teorico, pero es mas logico, sencillo
y claro en la pr
actica comparar proporciones, por ejemplo la proporcion de los
A1 entre los B1 con la proporci
on de los A1 en los B2 .
Seg
un lo observado en el caso de independencia, existen muchas formas de
comparaci
on, por lo que se debe preguntar cual sera la mejor. Dos principios
deciden la cuesti
on: el primero indica que de dos comparaciones es mejor la que
muestre con mayor claridad la identidad de la correspondencia y el segundo
que de dos comparaciones disponibles ser
a mejor la que ponga de manifiesto el
aspecto m
as importante del problema que se estudia.
El primer principio indica que las comparaciones de la forma:
n
n11
> 12
n1
n2
son mejores que las de tipo:
n
n11
> 1
n1
n
porque es evidente que si la mayora de casos considerados son B1 , esto
es que se aproximan a n entonces la relacion de los A1 a los B1 se
aproximar
a necesariamente a su relaci
on con el total de casos, aunque la
diferencia de relaci
on con los B2 sea considerable, por lo que la segunda forma
se presta a confusiones.
Las comparaciones que se basan en proporciones respecto al total de filas y/o
columnas, son conocidas como perfiles fila y perfiles columna respectivamente, y
constituyen la base de metodos m
as avanzados del analisis de correspondencias.
En el caso esencialmente descriptivo, ademas de valorar la relacion de
concordancia entre clases, algunos autores han propuesto indicadores de
la intensidad de la relaci
on, que involucre no solo a algunas clases de las dos
variables, sino a estas en su conjunto.
En la determinaci
on de tales indicadores, son deseables las siguientes
caractersticas:
a. El ndice tendr
a un valor m
aximo fijo (usualmente 1) para todos los casos
de correspondencia completa y un valor fijo (generalmente 0) si existe
independencia (esto no excluye la posibilidad de que ocasionalmente el
indicador sea negativo)

40

CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS

b. El ndice debe ser independiente del n


umero de observaciones y del n
umero
de clases.
c. La permutaciones de las categoras no influiran en su valor.
d. El ndice ser
a simetrico.
e. Para efectos inferenciales, deber
a tener una distribucion muestral conocida
y deber
a ser robusto.
Con las anteriores bases pueden idearse indicadores de diversas formas,
siendo el m
as sencillo, aunque no siempre el mas ventajoso, el que corresponde
a la expresi
on:
n n n12 n21
Q = 11 22
n11 n22 + n12 n21
Es evidente que Q valdr
a cero cuando las variables sean independientes, pues el
numerador ser
a cero; tomar
a el valor +1 si existe completa concordancia entre
A1 y B1 y/o entre A2 y B2 puesto que el segundo termino del numerador y
denominador ser
a cero; an
alogamente valdr
a 1 cuando la concordancia sea
completa entre A1 y B2 y/o entre A2 y B1 . A este coeficiente se le conoce,
con una terminologa un poco errada, como coeficiente de asociacion entre
atributos.
Otro coeficiente similar en cuanto a sus propiedades es el llamado coeficiente
de coligaci
on:
qn n
1 n12 n21
q n11 n22
Y =
1 + n12 n21
11

22

Se deduce que:
2Y
1+Y2
Los anteriores indicadores son fundamentalmente descriptivos, pero no implican
necesariamente la existencia de independencia o de relacion, ya que para
rechazar el supuesto de independencia, es necesario desarrollar pruebas de
hip
otesis estadsticas, tema que se presentar
a posteriormente en estas notas.
Q=

Sin embargo se expone la prueba m


as conocida, para el supuesto de
independencia entre dos variables de naturaleza no cuantitativa clasificadas
dicot
omicamente, basada en una variable Chi cuadrado, con distribucion Chi
cuadrado con un grado de libertad. La variable tiene la forma:
2
n |n11 n22 n12 n21 | n2
2
=
(n11 + n12 ) (n21 + n22 ) (n11 + n21 ) (n12 + n22 )
Esta variable resulta de comparar las frecuencias observadas en las clases
conjuntas, con las correspondientes esperadas si la hipotesis de independencia
se cumpliera. La prueba es unilateral a la derecha y requiere que las frecuencias
esperadas no sean muy peque
nas (no menores que cinco).

41

4.2. ANALISIS
BASICO
EN TABLAS 2 X 2

4.2.3.

Clasificaci
on Multivariada Dicot
omica

En la mayora de las aplicaciones pr


acticas se consideran simultaneamente
m
as de dos caractersticas o variables en el estudio y particularmente puede
desearse analizar la posible relaci
on entre algunas de ellas, cuando se tienen
en cuenta otras. En las anotaciones siguientes, se presentan los metodos para
llevar a cabo estos procesos, considerando el caso de tres variables, clasificadas
todas en forma dicot
omica. La extensi
on al caso de mas de tres variables es
inmediato.
Llamando C1 y C2 a cada una de las clases de la tercera variable en estudio,
se generan ahora clases conjuntas y frecuencias tridimensionales, de las cuales se
pueden derivar las bi y uni dimensionales, lo cual preservando el orden asignado
a cada variable, produce formas simb
olicas como las siguientes:
n121 =n
umero de casos que pertenecen a la primera clase de A, la segunda de
B y la primera de C.
n11 =n
umero de casos que pertenecen a la primera clase de A y a la primera
de C, sin tener en cuenta a B
n1 = n
umero de casos que pertenecen a la primera clase de C, sin considerar
a A, ni a B. Tabular y simb
olicamente se tendra:
CLASES
A1
A2
TOTAL

C1
B1
n111
n211
n11

C2
B2
n121
n221
n21

B1
n112
n212
n12

B2
n122
n222
n22

TOTAL
n1
n2
n

Existen entonces ocho frecuencias tridimensionales, doce bidimensionales y


seis unidimensionales, que poseen propiedades intuitivas de consistencia, como
las expuestas en el caso bidimensional, algunas de ellas son:
1. n121 0
2. n121 n21 ; n121 n11 ; n121 n12
3. n121 n1 ; n121 n2 ; n121 n1
4. n111 + n112 + n121 + n122 + n211 + n212 + n221 + n222 = n
Los an
alisis de relaci
on en este tipo de clasificacion pretenden estudiar la
independencia o no entre dos clases de dos de las variables, dada alguna clase de
la tercera, utiliz
andose el termino asociaci
on en subcolectivos para referirse
a este tipo de metodos, tambien conocidos como el estudio de asociaciones
parciales.
La base de los criterios de independencia o concordancia son similares al
caso bidimensional y como caso particular se presentan algunas formas de tales
criterios al estudiar la relaci
on entre A y B, dentro del subgrupo de los C.

42

CAPITULO 4. ANALISIS
DE VARIABLES NO CUANTITATIVAS

A1 y B2 ser
an concordantes o correspondientes en el subcolectivo de los C1 ,
si:
n121 >

n11 n21
n1

o, utilizando comparaciones entre proporciones, se presenta alguna de estas


formas:
1.

n121
n21

>

n11
n1

2.

n121
n11

>

n21
n1

3.

n121
n21

>

n111
n11

4.

n121
n11

>

n221
n21

De manera similar el ndice de concordancia o asociacion parcial, tendra la


forma:
n n n121 n211
QAB.1 = 111 221
n111 n221 + n121 n211
al conservar el mismo ndice del caso bidimensional, pero especificando el
subcolectivo donde la asociaci
on parcial se quiere estudiar.
Para tres variables se estudiaran tres asociaciones totales a saber: la de A
con B, la de A con C y la de B con C y seis parciales, las de A con B en cada
clase de C, las de A con C en cada clase de B y las de B con C en cada clase
de A.

4.3.

Clasificaci
on m
ultiple

Las situaciones analizadas en los numerales anteriores, son la base de


aquellas m
as complejas en las cuales, como se anoto en 3.8.3, las dos o
m
as variables consideradas se clasifican cada una en mas de dos categoras,
manteniendose el interes en el an
alisis de la independencia o en su defecto, de
la correspondencia entre ellas.
Es conveniente recordar que en la presentacion de esta clasificacion (3.8.3)
se convino considerar m clases para una variable y w para la otra
y se discutieron los conceptos b
asicos referentes a las propiedades de las
frecuencias tanto absolutas como relativas, as como tanto bidimensionales,
como marginales y condicionales. En el lexico del analisis de correspondencias,
se les denomina a estas u
ltimas perfiles fila y perfiles columna.
Los criterios de independencia mencionados en el caso de tablas 2 x 2, se
generalizan, en este caso y as, por ejemplo si Aj (alguna clase de la primera

43

MULTIPLE

4.3. CLASIFICACION

variable), es independiente de Bk (una clase cualquiera de la segunda), entonces:


njke =

nj nk
n

donde la e del primer miembro de la igualdad, se refiere a los esperado


bajo el supuesto de independencia.
Si la igualdad anterior se cumple para todo j y todo k, las variables A y B
ser
an independientes completa o absolutamente. De no ser as, las diferencias
njk njke , ser
an un primer indicador de posible concordancia o discordancia
entre las clases comparadas y deber
an ser resumidas en un solo indicador, que
deber
a ser independiente del signo de las diferencias, puesto que:
m X
w 
X

njk njke

=0

j=1 k=1

El ndice com
unmente propuesto corresponde a una variable Chi cuadrado,
que se utiliza fundamentalmente dentro de un proceso de prueba de hipotesis
de independencia, similar a la presentada en el caso 2 x 2 y que es:

2 =


2
m X
w
njk njke
X
j=1 k=1

njke

w
m X
X
n2jk
j=1 k=1

njke

La variable es no negativa y su valor tendera a infinito en tanto las diferencias


entre las frecuencias bidimensionales observadas sean muy diferentes de las
esperadas en caso de independencia, por lo que la prueba de hipotesis
correspondiente es unilateral a la derecha y utiliza como referencial teorico
una funci
on Chi cuadrado con (m 1)(k 1) grados de libertad.
No sobra recalcar que los metodos hasta aqu expuestos son
fundamentalmente descriptivos y deber
an ser utilizados con arreglo a los
requerimientos te
oricos que los sustentan.

CAPITULO

Analisis descriptivo de una variable cuantitativa

5.1.

Medidas caractersticas unidimensionales

Se ha comprobado que, en general, los colectivos estadsticos tienden a


comportarse respecto a los aspectos en estudio, de una manera variable,
pero con ciertas tendencias o regularidades, comportamientos que se
describen con base en una serie de medidas llamadas caractersticas o
caracterizadoras de los mismos.
Tales medidas estudian entonces la tendencia y la variabilidad o dispersion
de los diferentes factores en observaci
on dentro de un estudio y son la base
para procesos analticos m
as profundos que el de simplemente describir el
comportamiento de las variables. Se presentan a continuacion algunas de tales
medidas, enfatizando m
as su conceptualizaci
on, que sus procesos de calculo.

5.1.1.

La Media Aritm
etica

Conocida tambien como el promedio aritmetico o simplemente la media


o el promedio, se define como el cociente entre la suma de todos los valores
observados de la variable en cada elemento considerado y el total de estos o sea
que es una raz
on entre el total de la variable y el total de elementos en que ha
sido observada.
La f
ormula para calcular esta medida tiene la siguiente forma, cuando se
44

5.1. MEDIDAS CARACTERISTICAS UNIDIMENSIONALES

45

trabaja con los dalos originales:


n

M (x) = x
=

1X
x
n i=1 i

que se transforma en el caso de datos agrupados en:


m

M (x) = x
=

X
1X
x j nj =
x j fj
n j=1
j=1

De acuerdo con su definici


on y naturaleza, la media aritmetica es el valor
alrededor del cual la variable tiende preferencialmente a agruparse; implica
que los elementos del colectivo o de la muestra presentaron para la variable,
valores que est
an alrededor del promedio.
Por ser una medida estadstica, su interpretacion y por ende su utilizacion
debe hacerse en terminos generales y no es aplicable a escala individual o
particular, error este muy usual de cometer. Es conveniente insistir en que
el promedio es un punto de referencia de la tendencia al agrupamiento, por
lo cual se le interpreta como el momento de inercia de las magnitudes de la
variable.
Corresponde, a nivel descriptivo, al concepto de Valor Esperado o Esperanza
Matem
atica de una variable aleatoria, cuyo significado se intuye facilmente del
nombre asignado a la medida.
Posee adem
as propiedades de tipo matematico, con aplicaciones tanto
para desarrollos te
oricos como pr
acticos, algunas de las cuales se presentan
a continuaci
on:
1. M (x)
2. M (x x
) = 0
3. M (x x
)2 = mn
4. M (k) = k
5. M

m
P
j=1

!
xj

m
P

M xj

j=1

6. M (x k) = M (x) k
7. M (kx) = kM (x)
8. M (k1 k2 x) = k1 k2 M (x)
!
m
m

Q
Q
xj =
M xj si las variables son independientes.
9. M
j=1

j=1

46

CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA

10. Sea x sobre un conjunto particionado en m subconjuntos y sean: nj y


Mj (x) la parte de datos y la media aritmetica de la variable en cada
parte de la partici
on, entonces:
MT (x) =

m
X

Mj (x)

j=1

nj
n

Para complementar los anteriores conceptos, se presentan las caractersticas


generales del promedio, que son:
Ser una medida de tendencia central (en el sentido de centro de equilibrio)
de base matem
atica, susceptible por tanto de tratamiento algebraico.
Tener un sentido claro como valor de tendencia del agrupamiento de los
datos.
Requerir, para su c
alculo, de todos los valores de la variable.
Verse afectada por valores extremos o raros, lo cual puede distorsionar
el concepto de regularidad o tendencia.

5.1.2.

La Varianza

Partiendo del hecho de que la tendencia generalizada de los datos se


ha representado o sintetizado por el promedio, sera pertinente observar la
diferencia entre los datos (representados) y la media (representante), para tener
alguna idea de que tan buena es tal representacion. Si en suma tales diferencias
son peque
nas, se deber
a a buena representaci
on o sea que los datos realmente
tienen alguna tendencia. En caso contrario, esto u
ltimo debera descartarse.
Para corroborar lo anterior, observense los tres conjuntos de dalos siguientes:
Conjunto I
Conjunto II
Conjunto III

700
698
50

700
699
100

700
700
350

700
701
1000

700
702
2000

Se puede comprobar f
acilmente que en los tres casos el promedio es 700,
pero no por esto se puede decir que los datos se comportan igual, en terminos
generales.
Evidentemente, mientras en el conjunto I los valores se concentran
exactamente en 700, en el II tienden a agruparse, en forma bien marcada,
alrededor de tal n
umero, pero no tiene sentido alguno hablar en el caso III,
de que realmente los datos muestren alguna tendencia y menos que ella sea
alrededor de 700. No se puede creer con fe ciega, en la representatividad del
promedio.

5.1. MEDIDAS CARACTERISTICAS UNIDIMENSIONALES

47

Retomando el primer p
arrafo de este subcaptulo, por definicion de la media,
la suma de las diferencias entre los datos y esta, es siempre nula. Para obviar
el problema, se toman los cuadrados de tales diferencias y se promedian,
gener
andose as una de las medidas de dispersion mas importantes dentro
de los an
alisis estadsticos, conocida como la varianza, con la siguientes
expresiones simb
olicas:
n

V (x) = S 2 =

1X 2
1X
2
(xi x
) =
x x
2
n i=1
n i=1 i

en el caso de los originales, y:


V (x) = S 2 =

m
m
n
X
2
2
1X 2
1X
x j x
fj =
x j x
nj =
x i nj x
2
n j=1
n
j=1
i=1

para los datos agrupados.


Se puede comprobar que las varianzas de tos tres conjuntos de
datos ejemplarizantes, son respectivamente 0, 2, y 537.000, indicando
comparativamente, nula dispersi
on en el I, peque
na en el II y muy grande
en el III, lo que intuitivamente y por simple observacion, era de esperar.
La varianza es en consecuencia, una medida de la dispersion entre los valores
de una variable y el promedio que representa su supuesta tendencia. Aunque no
puede interpretarse en terminos m
as tangibles, especialmente relacionandola
directamente con los datos y su media, debido a su expresion en unidades
cuadr
aticas, se constituye en base primordial para el desarrollo y aplicacion de
muchos de los principales procesos de an
alisis estadstico.
De manera similar a la media aritmetica, posee propiedades de tipo
matem
atico, algunas de las cuales son:
1. V (x) 0
2. V (k) = 0
3. V

m
P
j=1

!
xj

m
P


V xj si las variables son independientes.

j=1

4. V (x k) = V (x)
5. V (kx) = k 2 V (x)
6. V (k1 k2 x) = k22 V (x)
7. Sea x sobre un conjunto particionado en m subconjuntos y sean: nj ,
Mj (x) y Vj (x) la parte de datos y la media aritmetica y la varianza de la

48

CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA

variable en cada parte de la partici


on, entonces:
VT (x) =

m
X
j=1

Vj (x)

 2 nj
nj X
Mj (x) MT (x)
+
n
n

Esta u
ltima propiedad es conocida como descomposicion elemental de
la varianza y es la base, entre otros, de los llamados estudios de dise
no
experimental y muestra que en estos casos la medida resulta de promediar
las varianzas de los subconjuntos y adicionarle la varianza de las medias de los
mismos.
Al promedio de las varianzas se le denomina INTRAVARIANZA y a la
varianza de las medias INTERVARIANZA o sea que:
Varianza del total = Intravarianza + Intervarianza
Como cada varianza mide la dispersi
on dentro de cada subgrupo, la
intravarianza es una medida promedio de la variacion DENTRO de los
mismos. La media de cada subgrupo, representa su tendencia, por lo que la
intervarianza mide la dispersi
on entre ellas y por tanto ENTRE aquellos, de
tal manera que la dispersi
on del total de datos se debe en parte a la dispersion
dentro de los subgrupos y en parte a la dispersion entre ellos.
Esta propiedad y su an
alisis, llamado por ello Analisis de Varianza,
corresponde a una visi
on muy reducida y simple de multitud de variantes y
aplicaciones que descomposiciones similares, pueden hacer de esta importante
medida.

5.1.3.

La desviaci
on est
andar y el coeficiente de variaci
on

Para obviar el problema de interpretaci


on tangible de la varianza, se define
una medida adicional de dispersi
on, como la raz cuadrada positiva de la
varianza, denominada desviaci
on est
andar o tipo o tpica.
Es una medida que est
a expresada en las mismas unidades de la variable,
lo que permite darle una interpretaci
on directamente relacionada con ella, que
la considera como la dispersi
on promedio entre los datos y la media que los
representa.
Aunque la desviaci
on tipo tiene una interpretacion mas accesible que la
varianza, no dar
a una idea concreta de la magnitud, de la dispersion si no se
referencia simult
aneamente el correspondiente promedio. Esta relacion entre las
dos medidas se concreta en el llamado Coeficiente de Variacion, que se obtiene
como el cociente entre la desviaci
on tipo y la media aritmetica.
Es el coeficiente de variaci
on, una expresi
on de la proporcion o porcentaje
de dispersi
on que tienen los datos con respecto a su promedio, o sea:
s
CV (x) =
x

5.1. MEDIDAS CARACTERISTICAS UNIDIMENSIONALES

49

y, por ser una medida relativa, permite comparaciones de diversas series de


datos, a
un de aquellas que sean de diferente naturaleza.

5.1.4.

Los Percentiles

Se definen como tales a valores del recorrido de la variable, que delimitan


superiormente, determinados porcentajes de casos, dividiendolos en dos
subconjuntos, uno de ellos con una determinada proporcion de menores valores
de la variable y el otro con la proporci
on restante de valores mayores.
El porcentaje relacionado con el subconjunto de menores, se utiliza para
hacer referencia al orden del correspondiente percentil.
En terminos de porcentajes enteros, existen 99 percentiles y la utilizacion
simult
anea de varios de elfos, crea subconjuntos de elementos que se
caracterizan por presentar para la variable, valores mas o menos homogeneos.
Es costumbre denominar Mediana al percentil 50 y Cuartiles inferior
y superior a los percentiles 25 y 75 respectivamente.
La naturaleza de estas medidas, que implica un ordenamiento ascendente
previo de los datos, est
a relacionada con el concepto de localizacion o de
posici
on.
Para ubicar un percentil determinado, simplemente se determina la posicion
que debe ocupar dentro de los datos y se observa el valor de la variable que se
encuentre en tal posici
on. Se les denomina tambien estadsticas de orden.
Para datos agrupados en una distribuci
on de frecuencias, de forma continua,
el percentil t esimo se localiza mediante la siguiente expresion:


0.01tn Nk1
Pt = x k1 + ck
nk
siendo k, la clase percentlica.
Estas medidas son de gran importancia en procesos de clasificacion de casos,
en el recientemente desarrollado an
alisis exploratorio de datos, en los estudios
no parametricos y, en su modalidad te
orica, asociados con variables aleatorias
y sus distribuciones de probabilidad, son trascendentales en los procesos de
estimaci
on y pruebas de hip
otesis estadsticas, de la inferencia estadstica.

5.1.5.

La Moda

Conocida tambien con los nombres de Modo, Promedio Tpico o Valor


Modal se define como el valor de la variable que mas se repite o sea el que
aparece con mayor frecuencia En terminos de probabilidad corresponde al valor
m
as probable.

50

CAPITULO 5. ANALISIS
DESCRIPTIVO DE UNA VARIABLE CUANTITATIVA

La determinaci
on de la moda corresponde a un proceso eminentemente
observacional asociado con su concepci
on: detectar cual es el valor de la variable
que m
as se repite o que tiene mayor frecuencia. Para datos agrupados en forma
continua este proceso se realiza mediante la forma:


nk nk1
Md = x k1 + ck
2nk nk1 nk+1
correspondiendo k, a la clase con mayor frecuencia.
El sentido de esta medida es el mismo que tiene el concepto en su utilizacion
vulgar y presenta la mismas caractersticas de inestabilidad, no unicidad y
naturaleza de comportamiento frecuencial de tal concepcion.

CAPITULO

Estudios de relacion entre variables cuantitativas

6.1.

La regresi
on

En m
ultiples estudios estadsticos, aparece como una gran necesidad
pr
actica, el considerar simult
aneamente dos o mas variables, con el fin de
analizar si entre ellas existe alguna relaci
on, si la misma se puede formalizar
y que tan intensa es la misma. Se trata de establecer fundamentalmente, con
respecto a la relaci
on:
la existencia
la forma
la intensidad
Los metodos estadsticos utilizados para estos analisis son conocidos como
Metodos de Regresi
on y Correlaci
on y el supuesto de partida para su desarrollo,
considera que algunas de las variables explican en parte, el comportamiento
de otras. Este supuesto establece una division general entre las variables
consideradas, clasific
andolas en dos grupos constituidos por las variables
explicativas y las variables explicadas.
El objetivo de este tipo de procesos es tratar de estimar o predecir
o conjeturar valores de las variables explicadas, con base en valores
dados o supuestos de las explicativas. Por tal razon son llamadas tambien
estas, variables explicativas o predictoras y las anteriores variables
estimadas o predictando. Otros nombres no muy adecuados, son los de
51

52

ENTRE VARIABLES CUANTITATIVAS


CAPITULO 6. ESTUDIOS DE RELACION

variables independientes para las explicativas y variables dependientes para


las explicadas.
Para poder alcanzar el objetivo citado, es necesario darle alguna forma
funcional a la relaci
on, lo cual se logra mediante el ajuste de funciones de base
estadstico matem
atica, que est
an compuestas por una parte determinstica
y una parte aleatoria o no determinstica. A tales funciones se les denomina
Modelos de Regresi
on.
La componente aleatoria solo se puede manejar por medio de la
probabilidad, por lo cu
al en la pr
actica no se puede incluir en el modelo,
lo que imposibilita el poder determinar valores de las variables explicadas,
limit
andose el proceso a la estimaci
on de los mismos. La natural diferencia
entre los verdaderos valores de las variables explicadas y los que se estiman
por medio del modelo, constituye la llamada variable aleatoria de error y
el principio fundamental para construir un modelo, indica que este debe, ser
tal, que minimice la suma de los cuadrados de tal variable, principio que es
entonces denominado como de mnimos cuadrados.
Uno de los modelos b
asicos, es el que esta asociado con la consideracion
de una variable explicada y su relaci
on lineal con un conjunto de p variables
explicativas y la variable de error, que formalmente se expresa como:
Y = 0 + 1 x1 + 2 x2 + + +p xp + u = E(Y ) + u
y que en la pr
actica es: E(Y ) = 0 + 1 x1 + 2 x2 + + +p xp
de tal manera que:
U = Y E(Y )
y el principio de minimizaci
on implica que el modelo se ajuste de tal forma
que:
X
X
2
U2 =
[Y E(Y )] = mn
El anterior modelo es conocido como MODELO GENERAL DE
LINEAL, y en el mismo Y representa a la variable explicada,
REGRESION
xj alguna de las variables explicativas y U a la variable aleatoria de error.
Los coeficientes beta que acompa
nan a cada una de las variables
estimadoras, as como el independiente son llamados los parametros del modelo
y ser
a necesario estimarlos mediante informacion muestral. Lo anterior se hace
con base en el proceso de minimizaci
on de cuadrados, ya que esta genera un
sistema de p+1 ecuaciones, cuya soluci
on permite encontrar las p+1 incognitas.
Los coeficientes asociados con cada variable explicadora reciben el nombre
PARCIAL, e indica cada uno de
de COEFICIENTES DE REGRESION
ellos la modificaci
on que se opera en la estimacion de Y , por cada modificacion
que se haga en una unidad de la correspondiente X, cuando las demas se supone
que permanecen invariables.

DE LA VARIACION
DEL MODELO
6.2. LA EXPLICACION

53

Al coeficiente independiente se le denomina VALOR AUTONOMO,


por
estar asociado con la estimaci
on de Y , cuando todas las variables explicativas
presentan el valor cero.
Es innegable la importancia que en los estudios de relacion entre variables,
tiene el an
alisis correcto de los coeficientes de regresion y al respecto es
conveniente advertir que la interpretaci
on de los mismos, se debe hacer siempre
sin perder el punto de referencia del modelo que se este trabajando, en cada
situaci
on especfica.
Los metodos de regresi
on permiten analizar varios modelos, a partir de un
conjunto dado de variables explicativas, con el fin de determinar cuales de estas
se deben incluir finalmente para que se logren los mejores resultados. De estos
procedimientos, los m
as comunes son los conocidos como Stepwise, Forward
y Backward.

6.2.

La explicaci
on de la variaci
on del modelo

Siendo el punto de partida del ajuste de modelos de regresion, la aceptacion


del error que contienen, son necesarios procedimientos que indiquen en cada
caso, que tan grande es este o equivalentemente, que tan bien explican
las variables explicativas, el comportamiento de la explicada y que ademas
permiten el desarrollo de los procesos de inferencia en regresion.
La base para tales fines, est
a determinada por el analisis de sumas de

cuadrados de la variable explicada o por el ANALISIS


DE VARIANZA EN

REGRESION,
que fundamentalmente consiste en la siguiente descomposicion
de la suma de cuadrados de valores corregidos por la media para la variable
explicada:
2 X 
2
X
2 X 
Y Y =
Y Y +
Y Y
i

El termino a la izquierda de la igualdad, se conoce como la SUMA DE


CUADRADOS TOTAL (SCT), el primer sumando de la derecha es la
(SCR) y el segundo
SUMA DE CUADRADOS DE LA REGRESION
es la SUMA DE CUADRADOS DEL ERROR (SCE).
Idealmente lo deseable es que la suma de cuadrados total, sea igual a la
suma de cuadrados de la regresi
on y que la suma de cuadrados del error sea
cero, ya que esto indicara que el modelo es perfecto. Esto en la practica es
imposible de lograr, pero sirve como punto de referencia para analizar, en una
situaci
on determinada, la bondad del modelo.
Uno de tales an
alisis, consiste en comparar la cantidad de variacion
explicada por el modelo, con la cantidad de variacion total que ha debido
explicar, mediante el cociente entre ellas, indicador que recibe el nombre de
y cuyo smbolo mas usual es
COEFICIENTE DE DETERMINACION

54

ENTRE VARIABLES CUANTITATIVAS


CAPITULO 6. ESTUDIOS DE RELACION

R2 , o sea:
R2 =

Variaci
on explicada
Variaci
on total

Como se anot
o anteriormente, esta descomposicion es trascendental en el
an
alisis e interpretaci
on del modelo, as como en los procesos inferenciales
correspondientes y aunque no es la u
nica, si es fundamental para otros analisis
similares m
as complejos.

CAPITULO

Algunos conceptos de Probabilidad

7.1.

Teoremas b
asicos de Probabilidad

7.1.1.

Definici
on cl
asica

 n
P Aj = j
n
nj =resultados favorables; n =resultados posibles

7.1.2.

Teoremas b
asicos

7.1.2.1.

Teorema aditivo. Probabilidad de la uni


on de eventos


P Aj Ak = P (Aj ) + P (Ak ) P (Aj Ak );

si

Aj Ak 6=

Generalizaci
on
!
m
m
m
X
X
[
Ai =
P (Ai )
P (Ai Aj )
P
i=1

i=1

i<j

m
X

P (Ai Aj Ak ) + (1)

m1

m
\
i=1

i<j<k

si Ai Aj 6=
55

i 6= j

!
Ai

56

CAPITULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD

7.1.2.2.

Teorema multiplicativo. Probabilidad de la intersecci


on de
eventos

P Ai Aj =

m
\

si Ai y Aj son independientes

P (Ai ) P Aj |Ai ;

si Ai y Aj no son independientes

!
Ai

i=1
m
\

P (Ai ) P Aj ;

m
Y

P (Ai ); si los eventos son independientes dos a dos

i=1

!
Ai

= P (A1 )P (A2 |A1 )P (A3 |A1 A2 ) P (Am |A1 A2 . . . Am1 )

i=1

si los eventos no son independientes dos a dos.


7.1.2.3.

Probabilidad condicional

P (Aj |Ai ) =

7.1.2.4.

P (Aj Ai )
; con P (Ai ) > 0
P (Ai )

Teorema de probabilidad total

Sea A un evento cualquiera, definido sobre un espacio muestral particionado,


entonces:
m
X
P (A) =
P (Ei )P (A|Ei )
i=1

7.1.2.5.

Teorema de Bayes. Probabilidad a posteriori


P (Ek )P (A|Ek )
P (Ek |A) = P
; siendo 1 k m
m
P (Ei )P (A|Ei )
i=1

7.2.

Funci
on de probabilidades

Sea X una variable aleatoria y fX (x) una funcion tal que:


i. fX (x) 0 para todo x

DE DISTRIBUCION

7.3. FUNCION

ii.

fX (x) = 1

en el caso discreto

fX (x)dx = 1

en el caso continuo

57

entonces fX (x) es llamada la funci


onn de probabilidades de X, si con ella
puede obtenerse:

si la variable es discreta

P (X = xj ) = fX (xj )

xj
R

P
(x

x
)
=
fX (x)dx

i
j

si la variable es continua

xi

7.3.

Funci
on de distribuci
on

Sea X una variable aleatoria y fX (x) su funcion de probabilidades,


x
j
P

fX (x) para variable discreta

x=
FX (xj ) =

xj

fX (x)dx para variable continua

es la funci
on de distribuci
on o funci
on acumulativa de probabilidades de la
variable alatoria X, con ella se obtiene:
P (X xj )

7.4.

Valor esperado

E(X) = =

xfX (x)

x=

si la variable es discreta

xfX (x)dx

si la variable es continua

PROPIEDADES
1. E(X)
2. E(X ) = 0

58

CAPITULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD

3. E(X )2 = mn
4. E(k) = k
5. E

m
P

!
=

Xj

j=1

m
P

E Xj

j=1

6. E(X k) = E(X) k
7. E(kX) = kE(X)
8. E(k1 k2 X) = k1 k2 E(X)
!
m
m

Q
Q
9. E
Xj =
E Xj si las variables son independientes.
j=1

j=1

10. Sea X sobre un espacio muestral particionado y sean: fj (x) y Ej (X) la


parte de funci
on y el valor esperado de la variable en cada parte de la
partici
on, entonces:
ET (X) =

m
X

Ej (X)fj (x)

j=1

7.5.

La varianza

V (X) = 2 =

P
2

(x ) fX (x) =
x2 fX (x) 2

x=
x=

si la variable es discreta

R
R 2

(x ) fX (x)dx =
x fX (x)dx 2

si la variable es continua

PROPIEDADES
1. V (X) 0
2. V (k) = 0
3. V

m
P
j=1

!
Xj

m
P


V Xj si las variables son independientes.

j=1

4. V (X k) = V (X)
5. V (kX) = k 2 V (X)
6. V (k1 k2 X) = k22 V (X)

7.6. FUNCIONES ESPECIALES DE PROBABILIDAD

59

7. Sea X sobre un espacio muestral particionado y sean: fj (x), Ej (X) y


Vj (X) la parte de funci
on de probabilidad, el valor esperado y la varianza
de la variable en cada parte de la particion, entonces:
VT (X) =

m
X

Vj (X)fj (x) +

2
Ej (X) ET (X) fj (x)

j=1

7.6.
7.6.1.

Funciones especiales de probabilidad


Bernoulli o bipuntual

a. Fen
omeno o experimento que puede resultar en uno solo de dos posibles
resultados, llamados genericamente ACIERTO (A) o FRACASO (F).
b. La probabilidad de acierto P es conocida y por ende la de fracaso que
ser
a (1 P ) = Q.
c. Se define la variable aleatoria X, tal que:

0 si el experimento resulta fracaso


x=

1 si el experimento resulta acierto


La funci
on de probabilidad correspondiente es:
B(x; P ) = P x Q1x
con:
E(X) = P ;

7.6.2.

V (X) = P Q

Binomial

a. Se realizan n repeticiones independientes de un proceso Bernoulli.


b. Interesa determinar la probabilidad de que se presenten x aciertos en las
n repeticiones,
c. Se define:
X = n
umero de aciertos en las n repeticiones
x = 0, 1, 2, 3, . . . , n
La correspondiente funci
on de probabilidad es:
 
n
B(x; n, P ) =
P x Qnx
x
con:
E(X) = nP ;
V (X) = nP Q

60

CAPITULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD

7.6.3.

Binomial negativa

a. Se realizan repeticiones independientes de un proceso Bernoulli, hasta


obtener k aciertos.
b. Interesa determinar la probabilidad de que se requieran x repeticiones
para obtener los k aciertos;
c. Se define:
X = n
umero de repeticiones para los k aciertos
x = k, (k + l), (k + 2)v(k + 3), . . .
El modelo de probabilidad asociado tiene la forma:


x1
BN (x; k, P ) =
P x Qxk
k1
Las medidas b
asicas son:
E(X) =

7.6.4.

k
;
P

V (X) =

kQ
P2

Geom
etrica

En la binomial negativa se quiere que k = 1, por tanto:


X = repeticiones necesarias para lograr el primer acierto
x = l, 2, 3, 4, 5, . . .
La funci
on adquiere entonces la forma:
BN (x; P ) = P Qx1
Y adem
as:
E(X) =

7.6.5.

1
;
P

V (X) =

Q
P2

Hipergeom
etrica

a. De un conjunto o poblaci
on de N elementos, se seleccionan al azar y sin
Reemplazamiento n de ellos.
b. En los N elementos existen M con cierta caracterstica de interes.
c. Se quiere determinar la probabilidad de encontrar x elementos con la
caracterstica de interes, en los n que se seleccionen.

7.6. FUNCIONES ESPECIALES DE PROBABILIDAD

61

d. La variable correspondiente es:


X = n
umero de elementos con la caracterstica, en los n
x = depende de la relacion entre N, n y M
La funci
on es de la forma:
H(x; N, n, M ) =

M
x

N M
nx

N
n

Con valor esperado y varianza:


E(X) =

7.6.6.

nM
;
N

V (X) =

nM (N M ) N n
N2
N 1

Poisson

a. Se asocia con fen


omenos o sucesos definidos en determinados intervalos de
tiempo y/o regiones de espacio.
b. La probabilidad de que el fen
omeno suceda por lo menos una vez, es
directamente proporcional al tama
no del intervalo de tiempo y/o region
espacial.
c. La probabilidad de que el fen
omeno ocurra mas de una vez, en intervalo y/o
regiones relativamente peque
nos es tan peque
na que se puede despreciar.
d. La ocurrencia del suceso en determinado intervalo y/o region es
independiente de su ocurrencia en otros.
e. Interesa la probabilidad de que el suceso se presente x veces en el intervalo
y/o regi
on determinados.
f. Se tendr
a entonces:
X = n
umero de veces que ocurre o se presenta el suceso
x = 0, 1, 2, 3, . . .
El modelo Poisson es:
P oisson(x; ) =

exp{}x
x!

con la particularidad de que:


E(X) = V (X) =

62

CAPITULO 7. ALGUNOS CONCEPTOS DE PROBABILIDAD

7.6.7.

La multinomial

a. Se realizan n repeticiones independientes de un proceso que puede resultar


en alguna de m categoras.
b. La probabilidad de que el proceso resulte en cada una de las categoras es
conocida e igual a Pj , j = l, 2, 3, . . . , m).
c. Interesa determinar la probabilidad de que se presenten xj casos de la
categora j en las n repeticiones.
d. Se define
Xj = n
umero de casos j en las n repeticiones
x = 0, 1, 2, 3, . . . , nj
La correspondiente funci
on de probabilidad es:
f (x1 , x2 , . . . , xm ) =
con

m
P

xj = n

j=1

7.6.8.

m
P

n!
P x1 P x2 Pmxm
x1 !x2 ! xm 1 2

Pj = 1

j=1

Hipergeom
etrica generalizada

a. De un conjunto o poblaci
on de N elementos, se seleccionan al azar y sin
reemplazamieno n de ellos.
b. En los N elementos existen M1 , M2 , . . . , Mm que pertenecen a
subpoblaciones con algunas caractersticas de interes.
c. Se quiere determinar la probabilidad de encontrar xj elementos de la
subpbblaci
on con la caracterstica j, en los n que se seleccionen. j =
1, 2, 3, . . . , m
d. Las variables correspondiente son:
Xj = n
umero de elementos de la subpoblacion con la caracterstica j, en los n
xj = dependen de la relaci
on entre N, n y Mj .
La funci
on es de la forma: con
f (x1 , x2 , . . . , xm ) =

M1
x1

M2
x2


N
n

con

m
P
j=1

Mj = N

m
P

j=1

xj = n

Mm
xm

7.6. FUNCIONES ESPECIALES DE PROBABILIDAD

7.6.9.

63

La normal

Funci
on fundamental de m
ultiples procesos aplicados y teoricos de la
Estadstica, asociada con variables de muy diversa ndole.
Se define:
< x <
para la cual:
(

2 )
1 x
1
exp
n(x; , ) =
2

2
2

siendo:
E(X) = ;

7.6.10.

V (X) = 2

La normal estandarizada o tipificada o reducida

Sea X una variable con distribuci


on normal, se define:
z=

por consiguiente:
< z < ;

E(Z) = 0;

V (Z) = 1

con funci
on de probabilidad:
 2
1
z
n(z; 0, 1) = exp
2
2

CAPITULO

Conceptos de inferencia estadstica

8.1.

Generalidades acerca de inferencia

Como la verdad y el conocimiento se dan en el juicio, una ciencia no es


m
as que un conjunto sistem
atico de juicios. Pero todo juicio esta sujeto a la
disyuntiva verdad falsedad y como la ciencia se forma con juicios verdaderos
se hacen precisos criterios que permitan estar en posesion de la verdad. Esta
verdad se adquiere a traves de diversas etapas y se posee con distintos grados
de certeza y por eso son necesarios criterios de verdad o de certeza.
La predicci
on y la toma de decisiones, ntimamente relacionadas, han jugado
desde tiempos antiqusimos, papel muy importante en la vida del hombre tanto
en aspectos de la vida com
un y corriente, como en la vida y el desarrollo tecnico
y cientfico.
Lo anterior ha requerido del ser humano la elaboracion de inferencias,
basadas en informaci
on relevante, que en algunos casos es abundante, a
veces inconsistente, en ocasiones abrumadora, pero generalmente parcial, lo
que consecuentemente hace de las predicciones y decisiones, poco menos que
adivinanzas.
Es deseable entonces, especialmente a nivel tecnico y cientfico, un sistema
para hacer inferencias que tengan ciertos grados de validez.
Un juicio se puede evidenciar por intuici
on (tal como sucede con los juicios
que se elaboran sobre objetos concretos) y por inferencia. Esta u
ltima supone
el uso del razonamiento y puede ser:
64

8.1. GENERALIDADES ACERCA DE INFERENCIA

8.1.1.

65

Inferencia Matem
atica

La cual se aplica a los juicios ideales que se elaboran sobre entes de la


raz
on y constituyen el saber de esencias, puro, teorico o metafsico, cuya raz
se encuentra en ese sentimiento intencional o de admiracion hacia lo que cada
objeto tiene de tpico e independiente de su manera de darse en el marco espacio
tiempo.
El campo de estos juicios tambien es de orden ideal, es decir ausente de
contradicci
on o sea su conformidad con las leyes del pensamiento. Es el concepto
inmanente de verdad, significa algo puramente formal, coincidiendo con la
correcci
on l
ogica.
En esta inferencia juega todo su papel el principio de contradiccion, el cual
constituye el esqueleto de nuestro pensamiento y cuya ausencia implicara la
del pensar.
Aunque esta inferencia deductiva juega un importante papel en la
ciencia, sin embargo hay que reconocer que por s sola no es suficiente en las
aplicaciones biol
ogicas, econ
omicas, sociales, etc., en donde la mayor dificultad
no est
a en obtener conclusiones de un modelo sino en elaborar el mismo. Es
decir resulta insuficiente en la fase inductiva del metodo cientfico que cobra,
en estos campos, toda su importancia.

8.1.2.

Inferencia f
actica

Que se utiliza para evidenciar los juicios mixtos, es decir, elaborados sobre
objetos ideales, pero con antecedente y referencial existencial.
Aqu la verdad de estos juicios, es la conformidad del pensamiento con la
realidad (concepto trascendente de verdad). La certeza con que se poseen estos
juicios es f
actica y se apoya en una necesidad de hecho entre el predicado y
el sujeto del juicio. No es que repugne a la mente pensar el juicio contrario, lo
que sucede es que haciendo esto se ira contra los hechos de la naturaleza.

8.1.3.

Inferencia Estadstica

La cual es un caso particular de la anterior, en donde la certeza fsica se


sustituye por otra que admite grados medidos numericamente. La causa en
virtud de la cual se adhiere a la verdad de un juicio con certeza estadstica ya no
radica en una necesidad absoluta (como sucede en la inferencia matematica),
ni en una necesidad de hecho (como en la factica) si no que a lo mas es una
necesidad probabilstica.
Esta inferencia inductiva es muy importante ya que el progreso cientfico
constituye un aprendizaje basado en la experiencia

66

8.1.4.

CAPITULO 8. CONCEPTOS DE INFERENCIA ESTADISTICA

Inferencia Reductiva

Que es la m
as difcil de definir y discutir. No solamente consiste en observar
datos y hacer experimentos, sino tambien en descubrir mecanismos y relaciones,
as como elaborar modelos y teoras que los expliquen. Constituye la fase mas
importante de la invenci
on o del descubrimiento que tiene lugar mediante la
combinaci
on de ideas que con un esfuerzo constante y profundo transmite el
consciente al subconsciente, en donde estas ideas se multiplican dando lugar
a un gran n
umero de combinaciones de las cuales es preciso extraer las mas
u
tiles.
Por ello es difcil establecer reglas para esta clase de inferencia, ya que no
es f
acil comprenderla completamente, de aqu que en los esquemas teoricos se
haga siempre enfasis en las inferencias deductiva e inductiva.

8.2.

Inferencia estadstica

Lo que se llama inferencia estadstica es un razonamiento que consiste


en inducir propiedades de la poblaci
on (formas distribucionales, valor de
par
ametros, verdad o no de hip
otesis) a partir de ciertas informaciones de
tal forma que la verdad de tales propiedades venga dada con un cierto grado
de confianza, bas
andose para ello en teoremas del calculo de probabilidades.
As, estadsticamente hablando, en muchas ocasiones se desconocen hechos
poblacionales, lo que implica realizar especulaciones, predicciones, conjeturas
o estimaciones respecto de tales hechos. La Estimaci
on Estadstica provee
metodos para llevar a cabo estos procesos.
En otras circunstancias se hacen aseveraciones o supuestos sobre los mismos
hechos poblacionales, cuya veracidad es cuestionable, por estar basadas, como
ya se anot
o, en informaci
on parcial. Se requiere entonces examinar la posible
certeza o falsedad de tales hip
otesis, a lo cual contribuye la Estadstica con los
metodos de Pruebas de Hip
otesis Estadsticas.
Aunque los procesos enunciados est
an ntimamente ligados, es conveniente
conservar las dos categoras, sobretodo en referencia al objetivo de la toma de
decisiones que se pueda perseguir al utilizarlos en la practica.
Es necesario insistir en que esta forma de proceder (metodo estadstico
inductivo) no proporciona certeza, sino grado de confianza expresado
numericamente (certeza estadstica). No obstante dos personas que admitan
esta forma de razonar (l
ogica estadstica) y se basen en los mismos supuestos
obtendr
an las mismas conclusiones.
Seg
un la informaci
on que sea empleada (datos muestrales, informacion a
priori, consecuencias de las acciones alternativas), se tienen:

8.3. DISTRIBUCIONES EN EL MUESTREO

8.2.1.

67

Inferencia Cl
asica

La cual se trata de una inferencia que utiliza, en principio, solamente como


fuente de informaci
on los datos muestrales. Fue originada por R. A. Fisher,
J. Neyman y E. S. Pearson. Est
a ligada a una concepcion objetivista de la
probabilidad e incluye las tecnicas de estimacion (por punto y por intervalo)
y contrastes de hip
otesis que se apoyan en criterios basados en las llamadas
distribuciones en el muestreo (teora de muestras). Tambien se le conoce
como aproximaci
on frecuencialista, est
andar, ortodoxa o muestral.
En esta concepci
on no se da entrada a la informacion a priori que se pueda
tener sobre los par
ametros desconocidos. No obstante hay que reconocer que
el estadstico debe utilizar muchas veces informacion a priori (forma de la
distribuci
on, hip
otesis interesantes) aunque no lo haga de manera formal.

8.2.2.

Inferencia bayesiana

Es la concepci
on en la cual se da entrada formal a la informacion a
priori. La inferencia se basa en esta informacion y en la que proporcionan los
datos de la muestra Esta concepci
on supone admitir que los parametros que
figuran en las distribuciones poblacionales son susceptibles de aleatorizacion
con distribuciones subjetivas a priori, las cuales se van revisando a la luz de las
nuevas informaciones muestrales pasando a las distribuciones de probabilidad
a posteriori a traves de las cuales se plantean los problemas de inferencia.
En estas notas, nos limitaremos a discutir algunos aspectos de la inferencia
cl
asica, para lo cual es conveniente recordar algunas ideas relativas a las
distribuciones muestrales.

8.3.

Distribuciones en el muestreo

La referencia a estudios realizados y resultados obtenidos con base en UNA


muestra determinada de un tama
no dado, seleccionada de una cierta poblacion,
deja la idea intuitiva de que existen varias muestras de tal tama
no, que se
pueden seleccionar de tal poblaci
on.
En efecto y desde el punto de vista te
orico, dados los valores de una variable
en una poblaci
on, en los procesos de muestreo probabilstico cualquiera de ellos
tiene alguna probabilidad de ser seleccionado para hacer parte de la muestra
y en el caso del llamado muestreo aleatorio simple, al cual se limitaran estas
notas, tal probabilidad es igual para todos los valores y por tanto las posibles
muestras de un mismo tama
no tendr
an entre s igual probabilidad de seleccion.
Simb
olicamente, expresemos los valores de alguna variable de interes (X)

68

CAPITULO 8. CONCEPTOS DE INFERENCIA ESTADISTICA

en los N elementos que forman la poblaci


on como:
x1 , x2 , x3 , x4 , . . . , xN
Se supone que estos valores tienen alg
un comportamiento poblacional el que
estadsticamente hablando se refleja en la forma distribucional, valor de algunos
par
ametros, relaci
on con otras variables, pero tal comportamiento en general
no se conoce y no se puede llegar a conocer con certeza absoluta, a no ser que
se realicen estudios censales. Como estos son difciles y en ocasiones imposibles
de realizar, ser
a necesario recurrir al muestreo.
Sea n el tama
no de la muestra que se ha determinado seleccionar, (con base
en alg
un error m
aximo admisible, nivel de confianza, tama
no de la poblacion,
recursos disponibles), para tratar de inferir hechos poblacionales de interes en
el estudio de la variable X.
Te
oricamente imaginemos todas las posibles muestras de tal tama
no que se
podran seleccionar, las que se pueden expresar como:
x1 ,
x01 ,
x001 ,
..
.

x2 ,
x02 ,
x002 ,
..
.

x3 ,
x03 ,
x003 ,
..
.

x4 , . . . , xn
x04 , . . . , x0n
x004 , . . . , x00n
..
..
..
.
.
.

Por ser el muestreo aleatorio, los primeros valores en cada una de las posibles
muestras son una variable aleatoria e igual sucede con los segundos, terceros,
hasta los n esimos, constituyendose el manejo de las muestras al nivel de la
teora, en el manejo de una variable aleatoria n dimensional conformada por
cada variable asociada con cada uno de los valores muestrales.
Es trivial que cada variable que se refiere a un valor muestral, tiene la
misma distribuci
on de la variable en la poblacion, con sus mismos parametros,
particularmente con la misma media o valor esperado y la misma varianza. Si
adem
as el muestreo es aleatorio simple, los valores muestrales son variables
aleatorias independientes y su funci
on de probabilidad conjunta sera el
producto de las funciones de cada una de las variables valores muestrales. Tal
funci
on de probabilidad conjunta de los valores muestrales es conocida como la
funci
on de verosimilitud de una muestra.
O sea que al nivel poblacional, X es una v.a. con una distribucion
poblacional, un valor esperado y una varianza expresados por
f (x; ),

V (X) = 2

E(X) = ,

Por consiguiente el j esimo valor muestral (Xj ) es una variable aleatoria con:
f (xj ; ),

V (Xj ) = 2

E(Xj ) = ,

Y la funci
on de verosimilitud de una muestra sera:
n
Y
f (x1 , x2 , x3 , . . . , xn ) =
f (xj ; )
j=1

8.3. DISTRIBUCIONES EN EL MUESTREO

69

En las anteriores expresiones el smbolo theta representa el (o los) parametro(s)


que caracterizan la distribuci
on poblacional.
De acuerdo con las anteriores consideraciones, cualquier funcion de los
valores muestrales es decir cualquier estadstica o estadgrafo es, por
consecuencia l
ogica, una variable aleatoria de la cual en algunos casos es posible
obtener su distribuci
on probabilstica, as como sus medidas basicas tales como
valor esperado y varianza. Es esta precisamente la tarea de la teora estadstica
y m
as especficamente de la llamada teora de muestras y de aqu el termino
distribuciones muestrales o mejor distribuciones en el muestreo, ya que
este u
ltimo se escucha como distribuci
on de las medidas estadsticas calculadas
en el muestreo.
Se tiene entonces que si:
T = g(x1 , x2 , x3 , . . . , xn )
La estadstica T es una variable aleatoria y por tanto es factible pensar en:
f (T ; ),

E(T ),

V (T )

En particular para el caso de la media muestral es relativamente sencillo


demostrar que esta variable aleatoria tiene un valor esperado igual al de la
variable en la poblaci
on y una varianza igual a la varianza de la variable en la
poblaci
on dividida por el tama
no de la muestra (y en el caso de poblaciones
finitas, multiplicada por un factor de correccion conocido como el c.p.f) e
inicialmente la misma distribuci
on poblacional con los cambios logicos en la
forma de los par
ametros, o sea que:
f (
x; ),

= ,
E(X)

=
V (X)

2 N n
n N 1

Sin embargo, por las leyes de los grandes n


umeros y mas concretamente por
el Teorema del Lmite Central (TLC), para grandes muestras, la media
muestral tiene una distribuci
on asint
oticamente normal con el valor esperado
y la varianza citados, independientemente de la distribucion poblacional.
Algo similar sucede con la variable aleatoria proporci
on muestral, que en
el fondo es una media muestral para una variable Bernoulli cuyo valor esperado
es P y cuya varianza es PQ, siendo P la proporcion de interes en la poblacion.
Las anteriores nociones y conceptos, se pueden apreciar en el siguiente
ejemplo, totalmente did
actico.
Para una poblaci
on de siete (7) empresas se analizan sus gastos mensuales
de publicidad en millones de pesos, obteniendose:
A = 20; B = 25; C = 20; D = 35; E = 25; F = 20; G = 30
Evidentemente algunas medidas en la poblacion, para la variable X =gastos
mensuales en publicidad son: N = 7; E(X) = 25; V (X) = 28, 57 y la proporcion

70

CAPITULO 8. CONCEPTOS DE INFERENCIA ESTADISTICA

de empresas que gastaron m


as de 20 millones de pesos es P = 0, 571428 y que
son las medidas que en general no se conocen.
Supongamos que se ha determinado seleccionar una m.a.s de cuatro
empresas, que ser
a alguna de las siguientes:
Muestra
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

Valores muestrales
20 25 20 35
20 25 20 25
20 25 20 20
20 25 20 30
20 25 35 25
20 25 35 20
20 25 35 30
20 25 25 20
20 25 35 30
20 25 20 30
20 20 35 25
20 20 35 20
20 20 35 30
20 20 25 20
20 20 25 30
20 20 20 30
20 35 25 20
20 35 25 30
20 35 20 30
20 25 20 30
25 20 35 25
25 20 35 20
25 20 35 30
25 20 25 20
25 20 25 30
25 20 20 30
25 35 25 20
25 35 25 30
25 35 20 30
25 25 20 30
20 35 25 20
20 35 25 30
20 35 20 30
20 25 20 30
35 25 20 30

Media
25,00
22,50
21,25
23,75
26,25
25,00
27,50
22,50
25,00
23,75
25,00
23,75
26,25
21,25
23,75
22,50
25,00
27,50
26,25
23,75
26,25
25,00
27,50
22,50
25,00
23,75
26,25
28,75
27,50
25,00
25,00
27,50
26,25
23,75
27,50

Proporcion
0,50
0,50
0,25
0,50
0,75
0,50
0,75
0,50
0,75
0,50
0,50
0,25
0,50
0,25
0,50
0,25
0,50
0,75
0,50
0,50
0,75
0,50
0,75
0,50
0,75
0,50
0,75
1,00
0,75
0,75
0,50
0,75
0,50
0,50
0,75

71

8.3. DISTRIBUCIONES EN EL MUESTREO

Se generan entonces las siguientes distribuciones:


DE LA MEDIA MUESTRAL
DISTRIBUCION
Media
Probabilidad

21,25
0,057

22,5
0,114

23,75
0,2

25
0,257

26,25
0,171

27,5
0,171

28,75
0,028

DE LA PROPORCION
MUESTRAL
DISTRIBUCION
Proporci
on muestral
Probabilidad

0,25
0,114

0,5
0,514

0,75
0,343

1
0,029

Se comprueba f
acilmente que:
= ,
E(X)

2
= N n
V (X)
n N 1

y adem
as que:
PQ N n
n N 1
Como se anot
o anteriormente, en la pr
actica estos procedimientos para deducir
la distribuci
on de una estadstica y sus propiedades basicas, es objeto de estudio
de la Teora Estadstica y aunque actualmente se cuenta con muchas de tales
distribuciones, es todava muy extenso el camino por recorrer en este sentido, lo
que se convierte en una gran cantea a
un por explotar en la ciencia, estadstica.
E(P ) = P,

V (P ) =

El modelo de probabilidad de las estadsticas, o sea su distribucion muestral,


es la base te
orica para medir la confianza y los errores de los procesos
inferenciales, determinar cu
al debe ser el estimador de un parametro, pero a
un
mas cual es el mejor o mas bondadoso estimador del mismo y consecuentemente
la base de sustentaci
on de las pruebas o contrastes de hipotesis estadsticas.
Preguntas como: que tan probable es que la informacion muestral
este reflejando bastante bien la situaci
on poblacional; que tanto se puede
confiar en tal informaci
on?, cu
al ser
a la probabilidad de que ante una hipotesis
planteada, la informaci
on muestral permita llegar a una buena decision en
el sentido de rechazar el supuesto si es falso o no rechazarlo si es cierto?;
que tan grande ser
a la probabilidad de llegar a conclusiones erradas? y otras
similares, solo pueden ser respondidas si se conoce la distribucion muestral de
las estadsticas y sobre todo si se tiene claridad conceptual sobre la filosofa de
tales distribuciones.

CAPITULO

La estimacion estadstica

9.1.

Generalidades

En terminos bastante descriptivos, se define la Estimaci


on Estadstica,
como un proceso que permite decir algo de los hechos poblacionales
(par
ametros), utilizando para ello la informacion proporcionada por una (o
unas) muestra (s), seleccionada(s) de la poblacion de interes, generalmente por
metodos aleatorios.
A la funci
on de los valores muestrales que permite ese decir algo del hecho
poblacional se le denomina EL ESTIMADOR, y corresponde entonces con
las medidas que se presentaron inicialmente con el nombre de estadsticas o
estadgrafos. Por ser funci
on de tales valores, que dependen del azar, todo
estimador se constituye en una variable aleatoria.
El problema de la estimaci
on consiste en hacer inferencias acerca de la
distribuci
on poblacional, valor de par
ametros, existencia y forma de relacion
entre caractersticas de la poblaci
on y seg
un que la informacion utilizada, para
hacer estas inferencias, sea la contenida en los datos muestrales o tambien la
informaci
on a priori, se tendr
a la estimaci
on clasica, objeto de este curso, o la
estimaci
on bayesiana.
Para que el proceso sea v
alido, los estimadores deben poseer una serie de
caractersticas o propiedades relacionadas con tal validez, que son conocidas
como propiedades deseables de un buen estimador, tales como el insesgamieno,
la consistencia, la suficiencia, propiedades que le seran propias al estimador, no
as a alguna estimaci
on que con el se haga en alguna instancia particular.
72

9.2. ALGUNAS PROPIEDADES DE UN BUEN ESTIMADOR

73

Como se ha insistido en que de una poblacion es factible seleccionar muchas


muestras de un tama
no determinado, aunque para un parametro exista un solo
estimador, se podr
an realizar muchas estimaciones de aquel. No obstante en
las aplicaciones pr
acticas, generalmente solo se hace una, pero es importante
tener muy presente este aspecto conceptual y referirse entonces a UNA
ESTIMACION, lo cu
al deja implcito que existen muchas mas.
Por consiguiente la teora dice por ejemplo, que un estimador toma valores
que tienden a agruparse alrededor del parametro que estima, pero, a no ser
que se conozca el valor de tal par
ametro, no se sabra por lo menos en primera
instancia, si una estimaci
on esta cerca o lejos de dicho valor.
En forma similar no se podr
a conocer cual fue exactamente el error que una
estimaci
on tuvo con respecto al par
ametro, pero la teora proporciona formas
de establecer, por lo menos en promedio, que tan grandes pueden ser aquellos.
Es conveniente por tanto recalcar la diferencia conceptual entre la
estimaci
on estadstica, el estimador de un parametro y una estimacion que
se haga de este.

9.2.

Algunas propiedades de un buen estimador

De acuerdo con lo discutido en el literal anterior, ante la imposibilidad de


saber si una estimaci
on en particular es buena o no, la teora estadstica provee
al investigador de una serie de procedimientos para generar estimadores que
posean propiedades de bondad que garanticen de alguna forma, la posibilidad de
utilizar con fines pr
acticos tales estimaciones. La fundamentacion del proceso
es eminentemente probabilstica, lo cu
al implica utilizar procedimientos que
siempre est
an enmarcados por la incertidumbre. Se citan a continuacion,
prescindiendo bastante de su presentacion formal, algunas propiedades
deseables que debe poseer un buen estimador.

9.2.1.

Insesgamiento

Tambien conocida como imparcialidad, se refiere a que la variable estimador


para ser insesgada o imparcial, debe tomar valores que tiendan a agruparse
alrededor del valor del par
ametro que se estima. En otras palabras, el
valor esperado del estimador debe ser igual al parametro que se estima.
Simb
olicamente:
E(T ) =
donde T es la estadstica estimador y theta el parametro a estimar.
Es conveniente hacer hincapie, que el insesgamiento es del parametro y que
no tiene ning
un sentido hablar de que una estimacion sea insesgada o no.

74

ESTADISTICA
CAPITULO 9. LA ESTIMACION

As, en el ejemplo presentado en 8.3, se comprobo en forma emprica


el insesgamiento de la media y de la proporcion muestral, pero algunas
estimaciones est
an muy alejadas del verdadero valor poblacional, como
sucede en los casos de las muestras 3, 23 y 28 por citar algunas.
Lo que produce el insesgamiento de un estimador, es cierta confianza en
el hecho de que si la variable estimador tiende a tomar valores cercanos al
estimado, en una estimaci
on particular es de esperar que ella corresponda a
alguno de estos.

9.2.2.

Consistencia

Llamada tambien conciliabilidad, es una propiedad que si se presenta para


un estimador, implica que este debe acercarse al parametro que estima, a
medida que el tama
no de la muestra aumenta. La presentacion formal de esta
propiedad, alude a que el estimador converge en probabilidad al parametro que
estima; de una manera sencilla:
lm P {|T | < } 1

Intuitivamente, es evidente que la media muestral es un estimador consistente


o conciliable de la media poblacional, ya que al ir aumentando el tama
no de
la muestra, llegar
a un momento en que esta sea igual al tama
no de toda la
poblaci
on y en tal caso se estar
a calculando la media poblacional.

9.2.3.

Eficiencia relativa

Es esta una propiedad asociada con el error del estimador o mejor con su
error cuadr
atico medio:
i
h
2
ECM (T ) = E (T )

Si existen dos posibles estimadores T1 y T2 de un mismo parametro, la


eficiencia relativa se define como el cociente entre sus errores cuadraticos
medios. Con base en ella, se trata de seleccionar el mejor estimador, que
obviamente ser
a el de menor error. Este concepto se extiende al caso de mas
de dos posibles estimadores.
Si un estimador es insesgado, su error cuadratico medio equivale a su
varianza y si en el anterior proceso todos los estimadores son insesgados, el
seleccionado es conocido como un estimador minivar.

9.3. FORMAS DE HACER ESTIMACIONES

9.2.4.

75

Suficiencia

Implica que el estimador solo requiere, para el proceso de estimacion, de la


informaci
on proporcionada por la muestra Es decir esta u
ltima le es suficiente
para hacer la estimaci
on, no requiere de algo mas.
Esta propiedad de una evidencia intuitiva muy simple, no tiene una
formulaci
on formal sencilla para presentar en estas notas. A grandes rasgos,
si es posible descomponer la funci
on de verosimilitud de una muestra, en el
producto de una funci
on del estimador condicionada al parametro, por una
funci
on de los solos valores muestrales, el estimador es suficiente.

9.3.

Formas de hacer estimaciones

Existen en Estadstica dos formas b


asicas de hacer estimaciones, llamadas
PUNTUAL o POR PUNTO y ESTIMACION POR
ESTIMACION
INTERVALO DE CONFIANZA.
La primera de ellas consiste en calcular con base en una muestra
determinada, un u
nico valor del estimador, que obviamente dependera de
los valores que presente, en esa muestra particular, la variable estudiada.
La denominaci
on de puntual o por punto, esta asociada con el hecho de
corresponder a un punto del recorrido de la variable estimador y la confianza
en ella solo se sustenta en las propiedades de bondad de este.
Sin embargo, la anterior forma de estimacion, presenta el inconveniente de
que la probabilidad de coincidencia con el hecho poblacional que estima es
pr
acticamente nula Por esta raz
on, casi siempre se establece un intervalo al
cu
al de alguna forma, se le puede asociar un grado de confianza o probabilidad
de que el par
ametro desconocido, se encuentre dentro de dicho intervalo.
Tal procedimiento constituye la estimacion por intervalo e implica calcular
dos valores lmite, dentro de los cuales se estima que esta el verdadero valor del
estimado. Los lmites se basan en informaci
on muestral, por lo que son variables
aleatorias.
Es necesario considerar m
as detenidamente este detalle, pues constituye la
base de la claridad conceptual respecto a lo que es un intervalo de estimacion.
Si los lmites del intervalo se calculan con la informacion muestral variaran
de muestra a muestra y se podr
an calcular tantos, como posibles muestras
diferentes de un tama
no determinado se puedan seleccionar de la poblacion.
Por consiguiente, la anotaci
on probabilstica asociada con un estimador por
intervalo, se refiere a los lmites y obviamente no al estimado, o sea que en un
estimador de la forma:
P (L U ) = 1

76

ESTADISTICA
CAPITULO 9. LA ESTIMACION

la probabilidad se refiere a los lmites L y U , que son las variables aleatorias,


en el sentido de que tal es la probabilidad de que ellos contengan el verdadero
valor del par
ametro.
A la probabilidad de que el intervalo contenga al parametro se le denomina
NIVEL DE CONFIANZA de la estimacion y esta determinada por la
distribuci
on muestral del estimador base de los lmites.
El sentido conceptual del nivel de confianza, corresponde a un porcentaje de
muestras de un tama
no determinado, que generan intervalos que contienen el
verdadero valor del par
ametro. En primera instancia no se sabra si un intervalo
dado cumple este requisito o no, pero se tendra una gran confianza en que si,
ya que generalmente los niveles m
as usados son del 90 %, 95 % y 99 %.
La idea intuitiva es que, una vez determinados los errores maximo admisibles
de la estimaci
on y el nivel de confianza, la teora establece un tama
no de
muestra y fabrica una urna conceptual, en la cual un porcentaje de tales
muestras, igual al nivel de confianza, generan buenos intervalos, en el sentido
de que contienen el verdadero valor del parametro y las restantes generan
malos intervalos en tal sentido.
Al seleccionar al azar de la urna conceptual, uno de los intervalos (o lo que
es lo mismo una muestra de ese tama
no), no se sabe si es de los correcto o no,
pero se tendr
a tanta confianza de que sea correcto, como se haya establecido
al determinar su nivel.
Ahora bien, calculado un intervalo de estimacion con base en una muestra
determinada, este contendr
a o no el valor del parametro, por lo que las u
nicas
asignaciones probabilsticas asociadas a tal intervalo seran 1 o 0, seg
un que lo
contenga o no. Por esto es un error conceptual asociar a un intervalo calculado,
una probabilidad igual al nivel de confianza, ya que como se ha anotado este
significa otra cosa.
Los estimadores por intervalo se generan a partir de estadsticas de
trabajo o cantidades pivotales, que son funciones de vatores muestrales que
contienen el par
ametro a estimar y cuya distribucion probabilstica no depende
de otros par
ametros desconocidos.
As, en el caso de la media, a partir de la variable:
Z=

/ n

que es la variable normal estandarizada asociada con la media muestral, se llega


a:


z
z

+
P X
X
=1
n
n
Como se aprecia en el estimador por intervalo anterior, este vara seg
un
vare la media muestral y la estructura presentada se puede mantener hasta

9.3. FORMAS DE HACER ESTIMACIONES

77

tanto se calculen los valores de los lmites con base en una muestra dada, caso
en el cual solo se puede decir que el obtenido es un intervalo de tal nivel
de confianza para estimar la media muestral.
La buena utilizaci
on de los procesos de estimacion, tanto puntual, como mas
usualmente por intervalo, solo se logra en la medida que se tenga la suficiente
claridad conceptual sobre la filosofa que sustenta tales procesos.

CAPITULO

10

Pruebas de hipotesis estadsticas

10.1.

Hip
otesis nula Hip
otesis alternativa

En este captulo se abordar


a el importante problema de inferencia llamado
contraste o test de hip
otesis estadsticas, el cual consiste en disponer de
criterios que permitan rechazar o no, hip
otesis formuladas sobre la poblacion
y ello con base en cierta informaci
on disponible.
Las hip
otesis no solo sirven para mejorar nuestro conocimiento sino que
tambien su rechazo o no lleva consigo ciertas consecuencias, relacionadas con
la necesidad de tomar decisiones de diversa ndole, seg
un el campo donde se
este utilizando este procedimiento.
Una Hip
otesis Estadstica se define como cualquier supuesto que se haga
sobre alguno o algunos hechos poblacionales. Cuando tal supuesto se ha
formulado en forma exhaustiva y univoca, se dice que la hipotesis es simple,
en caso contrario se denomina hip
otesis compuesta.
El procedimiento que se emplea en la prueba estadstica de una hipotesis,
es contrario a la forma usual de pensar. De hecho es semejante al metodo
matem
atico de prueba por contradicci
on. La hipotesis que el investigador quiere

probar o hip
otesis de investigaci
on, es llamada com
unmente la HIPOTESIS
ALTERNATIVA. Para hacerlo, se prueba alguna hipotesis contraria, a la

que se denomina HIPOTESIS


NULA, generalmente tratando de rechazarla.
El investigador espera que los datos apoyen su rechazo, porque esto implica el
apoyo de la alternativa.
Por esta raz
on es de gran importancia tener muy en claro que el proceso
78

10.2. ERROR TIPO I ERROR TIPO II

79

de pruebas de hip
otesis estadsticas conduce a una de dos decisiones respecto a
la hip
otesis planteada consistentes en rechazarla o no rechazarla, concepto
este u
ltimo muy diferente al de aceptarla. Cuando la hipotesis nula no es
rechazada, el estadstico prefiere decir que reserva su juicio (en hogar de decir
que la acepta). Lo que quiere decir con reserva su juicio es que, con base en
la informaci
on muestral reunida, no tiene evidencia suficiente para rechazar
la hip
otesis nula. Sin embargo, para todo efecto practico, un estadstico que
reserva su juicio est
a en cierto modo aceptando la hipotesis nula sin decirlo y
sin comprometerse.
En terminos m
as usuales se denomina hipotesis nula, representada por H0 ,
a aquella sobre la cual se centra el proceso de prueba conducente a rechazarla
o no, y se denomina hip
otesis alterna, cuyo smbolo mas utilizado es H1 , a
cualquier forma de contradicci
on de la hipotesis nula. Por costumbre se suele
hablar de la hip
otesis, para referirse a la nula y de la alternativa, para mencionar
a la alterna, utilizaci
on que se adoptara en esta presentacion.
De acuerdo con la forma como se planteen la hipotesis y la alternativa, se
tendr
an las siguientes situaciones generales:
a. una simple contra una simple (poco com
un)
b. una compuesta contra una simple (poco com
un)
c. una simple contra una compuesta (bastante usual)
d. una compuesta contra una compuesta (muy utilizada)

10.2.

Error tipo I Error tipo II

El proceso de pruebas de hip


otesis estadsticas se basa, nuevamente, en
informaci
on muestral por lo cual, as como se puede llegar a una buena decision
en el sentido de rechazar la hip
otesis nula cuando es falsa o no hacerlo cuando
es cierta, tambien se pueden cometer errores que consistiran en rechazar la
hip
otesis nula cuando es cierta o en no rechazarla cuando es falsa. El
primero de ellos es conocido como el ERROR DE TIPO I y el segundo el
ERROR TIPO II.
En resumen las decisiones que podra tomar el investigador con respecto a
la hip
otesis y las consecuencias posibles son:

HIPOTESIS
Verdadera
Falsa

DECISION
No rechazarla Rechazarla
Correcto
Error tipo I
Error tipo II
Correcto

80

CAPITULO 10. PRUEBAS DE HIPOTESIS


ESTADISTICAS

Lo deseable entonces es desarrollar el proceso de tal manera que la


probabilidad de error sea lo m
as peque
na posible, pero los dos tipos de errores
no son independientes probabilsticamente sino, que por el contrario, tienen
una relaci
on inversa de tal manera que, el disminuir la probabilidad de uno
de ellos lleva involucrado un aumento de la probabilidad de cometer el otro,
problema que solo se resuelve mediante la utilizacion de muestras de tama
no
pr
acticamente inmanejable.
La forma, quiz
as un poco extra
na, de desarrollar un proceso de prueba
de hip
otesis estadstica, se basa en problemas para evaluar las probabilidades
de las decisiones incorrectas, siendo en general mas facil resolver el asociado
con la de cometer error tipo I, probabilidad llamada el NIVEL DE
SIGNIFICANCIA de la prueba y que generalmente se predetermina, que
el de la de tipo II, ya que esta corresponde a una funcion, conocida como
CARACTER
FUNCION
ISTICA OPERANTE.
Sin embargo, desde el punto de vista de sustentacion teorica, esta u
ltima
funci
on y mejor su complemento, correspondiente a la probabilidad de no

cometer error tipo II y denominada FUNCION


DE POTENCIA, es de
gran utilidad.
Ahora bien, supongamos una hip
otesis simple que supone que un parametro
es igual a un valor dado, contra una alternativa que asegura que el valor del
par
ametro es diferente del propuesto. Con base en la informacion muestral y la
estadstica m
as conveniente para desarrollar el proceso de prueba (determinada
por las caractersticas de las distribuciones muestrales), la hipotesis se rechaza,
no si tal informaci
on muestra diferencia con el valor propuesto, si no si muestra
mucha diferencia, por ser o mucho m
as peque
na o mucho mas grande.
Lo anterior implica que, con base en la teora de las distribuciones
muestrales, se determinen puntos de referencia a partir de los cuales se
considerar
a que lo muestral es mucho m
as peque
no o mucho mas grande que
lo hipotetico, y si la informaci
on proporcionada por una muestra seleccionada
para realizar la prueba, queda ubicada a partir de tales puntos, se rechaza la
hip
otesis. Es en estas zonas del recorrido de la estadstica de prueba, donde se
corre el riesgo de rechazar la hip
otesis siendo cierta y por consiguiente el nivel
de significancia deber
a repartirse, generalmente igualmente, en tales extremos
de la distribuci
on muestral correspondiente. Se llama a este tipo de situacion
prueba bilateral o de dos colas.
Si solo interesa al investigador el tratar de determinar si el valor del
par
ametro es mayor que un valor supuesto, solo analizara si lo muestral
es mucho m
as grande que lo hipotetico y solo requerira de un punto de
referencia para determinar que se considera mucho mas grande. A partir de
all rechazar
a la hip
otesis y el nivel de significancia quedara concentrado en la
zona superior de la distribuci
on muestral correspondiente. Algo similar ocurre
cuando la alternativa se refiere a que el parametro es menor que el valor
supuesto. En este tipo de casos se habla de pruebas unilaterales o de una

10.3. PROCESO GENERAL DE PRUEBA

81

cola.
Una prueba de hip
otesis consiste entonces, en terminos muy simples, en
observar si entre el supuesto que.la hip
otesis nula contenga y la informacion
proporcionada por la muestra, existe diferencia significativa que lleve al rechazo
de aquella, o si tal diferencia es insignificante y se debe a las fluctuaciones
propias del azar, caso en el cu
al se considera que no existe evidencia suficiente
para rechazarla. Por esta visi
on del proceso se habla tambien de PRUEBAS
DE SIGNIFICANCIA, y de all el nombre de nivel de significancia asociado
con la probabilidad de cometer error tipo I.
El concepto del nivel de significancia implica establecer los puntos de
referencia, denominados puntos crticos, hasta los cuales se consideran
insignificantes las diferencias y los cuales a su vez, generan las llamadas zona
de rechazo y zona de no rechazo de la hipotesis.
La base te
orica del nivel de significancia o probabilidad de cometer error
tipo L, hace corresponder a esta con la proporcion de muestras de un tama
no
dado, que pueden llevar a rechazar la hipotesis siendo cierta y por ser su
valor en general muy peque
no (1 %, 5 %, 10 %), conlleva la confianza de que al
rechazar la hip
otesis con base en la informacion de una muestra dada, no se
habr
a cometido el error I.
Es necesario enfatizar que la preocupaci
on por el error I, solo se presentara si
la decisi
on ha sido de rechazar la hip
otesis, en tanto que al no rechazarla,
quedar
a la incertidumbre respecto a si era falsa o sea de haber cometido error
tipo II.

10.3.

Proceso general de prueba

Para terminar estas breves, anotaciones sobre los procesos basicos de la


inferencia estadstica, se esquematizan a continuacion las fases del proceso
cl
asico para realizar una prueba de hip
otesis estadstica:
a. Plantear las hip
otesis, tanto la nula como lo alternativa.
b. Ubicar estadsticamente el problema en referencia a la claridad sobre cual
es el par
ametro al que hace referencia la prueba, el tipo de prueba (si esta
es bilateral o unilateral a izquierda o derecha), que informacion adicional a
la muestral se posee.
c. Con base en los resultados del literal b, se selecciona una estadstica de
prueba, que contenga al par
ametro que se prueba y cuya distribucion no
dependa de otros par
ametros desconocidos. Es de notar la importancia que
para esta fase tiene el conocimiento de las distribuciones muestrales.

82

CAPITULO 10. PRUEBAS DE HIPOTESIS


ESTADISTICAS

d. Con base en el nivel de significancia (predeterminado), el tipo de prueba


y la distribuci
on probabilstica de la estadstica de prueba, se determinan
los puntos crticos y se establecen las zonas de rechazo y no rechazo de la
hip
otesis.
e. A partir de la informaci
on proporcionada por una muestra determinada, se
calcula un valor de la estadstica de prueba, aceptando para este proceso el
valor del par
ametro propuesto en la hip
otesis.
f. Se compara el valor anterior con las zonas establecidas en la fase d y seg
un
su ubicaci
on se decide sobre si rechazar o no la hipotesis.

Bibliografa

Ander-Egg, Ezequiel. 1985. Metodologa del trabajo social. El Ateneo.


Azorn, Francisco. 1972. Curso de muestreo y aplicaciones. Aguilar.
Black, Max, A.G. Su
arez, J.L. Mackie, P. Casa
n, and R. Beneyto. 1979.
Inducci
on y probabilidad. Ediciones C
atedra.
Bunge, Mario. 1972. La ciencia: su metodo y su filosofa. Siglo veinte.
Cansado, Enrique. 1975. Curso de estadstica general. Centro Interamericano
de Ense
nanza de Estadstica.
Cochran, William. 1977. Sampling techniques. John Wiley & Sons.
Cramer, Harald. 1970. Metodos Matem
aticos en Estadstica. Aguilar.
Fienberg, S.E. 1982. Chapter Contingency Tables of Encyclopedia of Statistical
Science, edited by S. Kotz and N.L. Johnson, Volume Vol. 2, 161 171.
John Wiley & Sons.
Good, I. J. 1988. Chapter Scientific method and statistics of Encyclopedia of
Statistical Sciences, edited by S. Kotz and N.L. Johnson, Volume Vol. 8,
291304. John Wiley & Sons.
Goode, W.J., P.K. Hatt, and R. Palaz
on. 1970. Metodos de investigaci
on
social. Trillas.
Haber, A., R.P. Runyon, and R.L. Mozo. 1973. Estadstica general. Fondo
Educativo Interamericano.
Hartwig, F., and B.E. Dearing.
Publications, Inc.

1979.

Exploratory data analysis.

Hessen, Juan. 1976. Teora del conocimiento. Espasa - Calpe.


Kish, Leslie. 1975. Muestreo de encuestas. Trillas.
83

Sage

84

Bibliografa

Lindgren, B. W. 1971. Statistical Theory. The Macmillan Company.


McNeil, D.R. 1977. Interactive data analysis: a practical primer. John Wiley
& Sons.
Mood, A.M.F., F.A. Graybill, and D.C. Boes. 1974. Introduction to the theory
of statistics. McGraw-Hill.
Nieto de Alba, Ubaldo. 1973. Introducci
on a la Estadstica. Aguilar.
Ostle, Bernard. 1965. Estadistica aplicada: tecnicas de la estadistica moderna,
cuando y donde aplicarias. Limusa-Wiley.
Pearson, E.S., and M.G. Kendall. 1970. Studies in the history of statistics
and probability: Pearson , M. G. Kendall. Griffin.
Popper, K.R., and V.S. de Zavala. 1967. La l
ogica de la investigaci
on cientfica.
Tecnos.
Popping, Roel. 1988. Chapter Nominal scale agreement of Encyclopedia of
Statistical Sciences, edited by S. Kotz and N.L. Johnson, Volume Vol. 6,
261264. John Wiley & Sons.
Prawda, Juan. 1981. Metodos y modelos de investigaci
on de operaciones I.
Limusa.
Reynolds, H. T. 1982. Chapter Nominal data of Encyclopedia of Statistical
Sciences, edited by S. Kotz and N.L. Johnson. John Wiley & Sons.
Ros, Sixto. 1969. Metodos estadsticos. Edic. del Castillo.
Russell, B., A. Dorta, and J.G. Serna. 1984. Historia de la filosofa occidental.
Espasa - Calpe.
Siegel, S., and J.A. Villalobos. 1978. Estadstica no parametrica: aplicada a
las ciencias de la conducta. Trillas.
Spurr, W.A., and C.P. Bonini. 1980. Toma de decisiones en administraci
on
mediante metodos estadsticos. Limusa.
Takane, Yoshio. 1982. Chapter Nonmetric data analysis of Encyclopedia of
Statistical Sciences, edited by S. Kotz and N.L. Johnson. John Wiley &
Sons.
Upton, G. J. 1982. Chapter Categorical Data of Encyclopedia of Statistical
Sciences, edited by S. Kotz and N.L. Johnson. John Wiley & Sons.
Velleman, P.F., and D.C. Hoaglin. 1981. Applications, basics, and computing
of exploratory data analysis. Duxbury Press.
Yule, G.U., M.G. Kendall, and J.R. Jimeno. 1967. Introducci
on a la estadstica
matem
atica. Aguilar.

Você também pode gostar