Você está na página 1de 304

ESTADISTICA BASICA PARA

PLANIFICACIN
por
ARTURO NEZ DEL PRADO BENAVENTT.

900044515
900044515 - BIBLIOTECA CEPAL

MXICO
ESPAA
ARGENTINA
COLOMBIA

_______________________________

siglo veintiuno editores, sa de cv


CERRO DEL AQUA 248. DELEGACIN COTOACN. 04310 MXICO. D F

siglo veintiuno de espaa editores, sa


C0PLAZA5, MADRID 33, ESPAA

siglo veintiuno argentina editores, sa


siglo veintiuno de colombia, ltda
AV. 3a. 17-73 PRIMER PISO. BOGOTA. D E COLOMBIA

prim era edicin, 1971


decimocuarta edicin, corregida y aum entada, 1987
s ig lo xxi editores, s.a. de c.v.
ISBN 968-23-1384-8
derechos reservados conform e a la ley
impreso y hecho en m xico/printed and m ade in m exico

C/vX

economa
y

demtyrafa

Textos

dei

INSTITUTO LATINOAMERICANO
DE PLANIFICACIN ECONMICA
Y SOCIAL

B Instituto Larinm m aiono de Planificacin Econmica y Social ( i l p e s ) es un orga


n isa awdwna creado bajo la gida de la Comisin Econmica para Amrica Latina
(orear.) y establecido d 1 de julio de 1962 en Santiago de Chile como proyecto del
Fondo ffaprcU de las Naciones Unidas con amplio apoyo de los paises de la regin
de d en u a g a m a a internacionales y privados.
Sa objeto principal re proporcionar, a solicitud de los gobiernos, servicios de capa m u y j j n a r MB en Amrica Latina y realizar investigaciones sobre desarrollo
y fb n ifi riia Desde so fundacin, el Instituto ha venido ampliando y haciendo ms
proCunda la obra de la cepal en el campo de la planificacin, merced al esfuerzo conj a de rm grupo de economistas y socilogos distinguidos de Amrica Latina, entre
gados por mplcnre al anadio y solucin de los problemas fundamentales que preocu
pan en b anualidad a los p a in de esta parte del mundo.
Desde sa creacin d Instituto ha realizado una labor de gran significacin dentro
le las fsmcinnrs que se b encomendaron. A fin de difundirla debidamente en el mbito
lasjuana-titano, se ha llegado a un acuerdo con Siglo XXI de Mxico, para que vaya
publicando y distribuyendo los trabajos del Instituto.

NDICE

V II
1
3

PR LOGO A LA Q U IN TA ED ICION
PR LO GO , POR FRA N CISC O AZORN
INTRODUCCIN
P R IM E R A P A R T E : ESTA D STICA D ESCR IPTIV A

ESTA D STICA Y P LA N IFIC A C I N

Las necesidades de informacin, 9; b . Mtodos de obtencin de


informaciones, 15; c. La disponibilidad de informacin en Amrica
Latina, 18; d. El control de la calidad de las informaciones esta
dsticas, 20; E . Estadstica para planificacin, 22; f . Plan nacional
de estadstica, 25

a.

II

27

ESTAD GRAFO S D ESC R IPTIV O S EST T IC O S

Distribucin de frecuencia, 27; B . Estadgrafos de tendencia cen


tral, 33; c. Evaluacin de los estadgrafos de tendencia central,
51; D. Estadgrafos de dispersin, 52; E . Utilizacin de indicadores
de la programacin, 64; Temas de discusin, 64; Problemas pro
puestos, 67; Ejercicios, 68; Solucin de ejercicios, 71; Anexo: distri
bucin normal, 85
A.

III

90

N M ERO S N D ICE

El problema general, 90; b . Clases de nmeros ndice, 90; c.Frmulas de clculo, 91; Pruebas sobre los nmeros ndice, 97;
e . Base de un nmero ndice, 100; f . Utilizacin de los nmeros
Indice, 103; c. Indices de comercio exterior, 117; h . Algunos indi
cadores econmicos, 119; i. Etapas de la construccin de nmeros
ndice, 126; Temas de discusin, 129; Problemas propuestos, 130;
Ejercicios, 132; Solucin de ejercicios, 135
a.

SEGUNDA P A R T E : A N A LISIS DE R EG RESIO N Y CORRELACIN

145

A N LISIS DE R EG RESI N

Mtodo de los mnimos cuadrados, 145;


ticas, 157

A.

II

b.

Consideraciones prc

160

CO RRELACI N

Objetos del anlisis de correlacin, 160; b . Tipos de correlacin,


161; c. El coeficiente de correlacin, 162; d . Limitaciones de la co-

a.

[V]

VI

INDICE
rrelacin, 163; e . Correlacin rectilnea, 164; f . Correlacin no rec
tilnea, 177; c. Correlacin mltiple, 182; h . Etapas de la construc
cin de un modelo de regresin y correlacin, 187; i. Mtodo de
estimacin por medio del coeficiente de elasticidad, 190; Temas
de discusin, 205; Problemas propuestos, 207; Ejercicios, 208; So
lucin de ejercicios, 213

T ER C ER A P A R T E : E L E M E N T O S DE M U E S T R E O

237

A SPEC TO S T E R IC O S

Introduccin, 237; b . Fundamentos tericos del muestreo, 238;


Determinacin del tamao de muestra, 245; d . La estimacin
de proporciones, 250
a.

c.

II

262

EN CUESTAS IN D U STR IA LES

Determinacin clara y precisa de los objetivos, 262; b . Delimi


tacin del marco muestra!, 263; c. Eleccin del diseo muestral,
265; D. Clculo del tamao de muestra, 266; E . Seleccin de las
unidades mustrales, 270; f . Entrenamiento de enumeradores, 270;
c . Colaboracin de la poblacin informante, 271; h . Organizacin
del trabajo en el terreno, 272; i. Sistematizacin de datos, 272; j.
Determinacin del costo total, 273; k . Publicacin de resultados, 274
A.

III

D EM O STRA CIO N ES M A T E M T IC A S DE M U E ST R E O A LEA TO R IO

275

S IM P L E

283

FO R M U L A R IO SO B R E M U E ST R E O A L EA T O R IO S IM P L E

Variable cuantitativa, 283;


ras), 285

a.

b.

Variable cualitativa (dos catego

FO R M U L A R IO SO B R E M U E ST R E O A L EA T O R IO ESTR A T IFIC A D O

Variables cuantitativas, 287;


goras), 290
a.

B IB L IO G R A F A

b.

Variable cualitativa

287

(dos cate

293

PRLOGO A LA QUINTA EDICIN

La naturaleza de los trabajos que me correspondi realizar primero


en el ilpes, luego como funcionario de gobierno y actualmente
en la cepal, me ha brindado la oportunidad de verificar en el
terreno que los objetivos que se tuvieron en mente al preparar la
primera edicin de este libro se han visto holgadamente cumpli
dos. No soy el ms indicado para evaluar sus bondades, si es que
las tuviera. Pero no me parece falta de modestia destacar que el
objetivo que ms gravit en la concepcin del texto nal fue
el de inculcar en el lector y, principalmente, en el alumno de los
cursos del ilpes un espritu crtico guiado por la bsqueda le
coherencias cuantitativas es cada vez ms legtimo.
En mis conversaciones con profesores universitarios, funciona
rios de oficinas de planificacin y ex alumnos del i l p e s disemina
dos en Amrica Latina, invariablemente se toca el tema de la fi
delidad de la informacin cuantitativa. La informacin estadstica
disponible en Amrica Latina no siempre, por decir lo mote,
satisface las pruebas bsicas de coherencia. Es muy frecuente en
contrar estimaciones que, debiendo guardar ciertos grados de
consistencia con otras variables, aparecen publicadas contravinien
do elementales pruebas de compatibilidad.
A medida que se progresa en los trabajos cuantitativos en la
regin, resulta ms necesario realizar diversas pruebas de coheren
cia de las estimaciones que se han de utilizar en los trabajos so
bre planificacin. Por mucho que ellas provengan de listados de
computadoras o de sofisticados modelos matemticos, es prudente
someterlas a los contrastes indispensables. Slo una vez que hayan
resistido y pasado la prueba de formar parte de esquemas cuan
titativos razonablemente admisibles e integrados, puede pensarse
en utilizarlas en los trabajos que la planificacin implica en sus
distintos plazos y niveles de agregacin.
Los diversos grados y sentidos de interdependencia entre las
variables que conforman los procesos de planificacin y poltica
econmica facilitan la configuracin de esquemas cuantitativos
coherentes. Las ventas de un sector son compras de otros, los in
gresos de ciertos grupos provienen de otros, los excesos de gasto
de los menos merman el consumo de los ms, etc. No resulta di
fcil vincular una estimacin sobre cierta variable a otras ron las
cuales, dado el funcionamiento de la actividad econmica, debiera
mantener ciertas relaciones razonables.

CviO

VIII

PR L O G O A LA Q U IN T A ED IC I N

Estas reflexiones dirigidas principalmente a quienes ensean


la estadstica bsica tienen su sustento en reiteradas comproba
ciones de lo indispensable que resulta dudar de estimaciones ais
ladas. Cuntas horas de esfuerzo, cunto dinero, cuntas decisio
nes errneas no se hubieran evitado si se tuviera como inclina
cin permanente someter a pruebas de coherencia las estimaciones
que te utilizan. Esta prctica no slo favorece el trabajo cuanti
tativo, tambin tiene enormes ventajas en la interpretacin de los
fenmenos econmicos. Interpretar magnitudes que se relacionan
con otras es ms fcil y ms til en la identificacin de sus im
plicaciones que considerarlas aisladamente. De la misma manera
que en medicina el conocer la temperatura o la cantidad de gl
bulos blancos no es suficiente para aventurar un diagnstico,
en economa las estimaciones aisladas apenas sugieren la existen
cia de eventuales fenmenos, y en todo caso no son ms que el
inicio de una investigacin que en su desarrollo debe alcanzar
niveles de rigor que avalen sus conclusiones.
A la larga, los economistas que trabajan con instrumentos cuan
titativos desarrollan capacidades, muchas veces sobre la base de
una aguda intuicin, que les permiten calibrar las estimaciones
y, utilizando su experiencia, establecer las pruebas pertinentes.
Sin embargo, si en la etapa de formacin de un planificador pue
de desarrollarse esa tendencia de manera que su inquietud natu
ral sea la de verificar coherencias, se habr ganado tiempo y se
habr conseguido aumentar su productividad potencial.
La lectura de los distintos captulos de este libro y especialmen
te de los ejercicios, prblemas y temas de discusin, permite com
probar la intencin permanente de acicatear al lector para que se
incline, antes de utilizar una informacin, por la verificacin de
consistencias fundamentales.
ARTURO NEZ D EL PRADO

agosto de 1976

PRLOGO
FRA N CISC O

AZORN

Mucho me honra y complace presentar una obra de tan sobre


saliente mrito como es la Estadstica bsica para planificacin,
del profesor Arturo Nez del Prado. Es evidente la necesidad
de informacin estadstica para la planificacin del desarrollo
econmico y social; no lo es menos la conveniencia de planificar
a su vez las operaciones estadsticas, para que sirvan a su fina
lidad con eficacia. Este libro viene a satisfacer con suma opor
tunidad tan urgentes requerimientos.
Es grande el nmero de publicaciones disponibles sobre esta
dstica matemtica o aplicada e incluso de las dedicadas a las
investigaciones econmicas y sociales, pero apenas existen obras
que tengan en cuenta el aspecto especfico de la planificacin.
El profesor Nez del Prado ha estado en posicin privilegiada
para preparar esta obra, por su extensa experiencia en las di
versas fases de la planificacin y por haber dirigido cursos y
seminarios para planificadores, lo que no le ha impedido man
tenerse fiel a su vocacin original de estadstico. As ocurre que
el planificador incipiente o experto que consulte este libro se
encuentra ante un estadstico que le habla en su propio len
guaje. Desde el comienzo se trata del diagnstico y de la prog
nosis, de la delimitacin de la estrategia, as como de los proce
dimientos censales, mustrales y de experimentacin numrica,
y partiendo, como es ineludible, de los elementos del estudio,
se procede con ritmo mesurado a recorrer el trecho desde los
estadgrafos descriptivos estticos a los problemas bidimensionales de correlacin y regresin, pero siempre atendiendo al ob
jetivo principal de la tarea. Por ejemplo, en la primera parte
se destaca la utilizacin de los indicadores de la programacin
y de los nmeros ndices, y en la segunda el empleo de los coefi
cientes de elasticidad.
Atencin especial merecen los temas de discusin, que con los
problemas y ejercicios facilitan la comprensin y el dominio de
las tcnicas y suscitan el inters por nuevos caminos, distintos

[1]

PRLOGO

de los que se siguen en las ciencias fisicoqumicas o en la inge


niera clsica.
Este libro tendr sin duda un efecto positivo y fecundo en la
integracin de los estudios de planificacin y de estadstica, y
ser una buena herramienta para quienes trabajan unidos por el
comn deseo de acelerar el desarrollo c los pueblos.

Circula, tanto en castellano como en otros idiomas, una profusa


bibliografa sobre estadstica; la conocen, frecuentan y utilizan,
provechosamente por cierto, los interesados. Por ello, qiz cabra
preguntarse qu sentido tiene aumentar, con un nuevo trabajo,
el nmero ya abundante de publicaciones sobre la materia. Sin
embargo, las siguientes consideraciones parecen justificar el es
fuerzo.
En primer trmino, la bibliografa sobre estadstica, en su gran
mayora, presenta mtodos estadsticos puros, ya sea por su tra
tamiento matemtico o desde un punto de vista descriptivo, me
nos riguroso, aunque ms accesible a los investigadores en gene
ral. Por ello no es fcil encontrar un texto que resuma un
conjunto de mtodos estadsticos necesarios para el investigado:
en materia de planificacin. Uno de los propsitos de este tra
bajo consiste, precisamente, en realizar una seleccin de temas,
los ms tiles, que permitan al planificador disponer de un ins
trumental indispensable. Por otra parte, es necesario advertir que
el texto fue concebido para estudiantes de cursos intensivos de
planificacin, donde a la estadstica como asignatura se le con
cede un nmero reducido de clases y seminarios. Los diferentes
temas presentados en el texto, se complementan con una serie
de ejercicios de seminarios, a travs de los cuales se pretende mos
trar problemas y soluciones concretas sobre aspectos que, habi
tualmente, se presentan durante la realizacin de planes de des
arrollo.
Tampoco puede dejar de considerarse la gran heterogeneidad
de alumnos que asisten a estos cursos, pues el tema de la plani
ficacin econmica y social compete a muchas disciplinas. El
tratamiento de los diferentes temas, en consecuencia, debe ha
cerse accesible a esta especial categora de alumnado. La anterior
observacin se refiere principalmente a los mtodos matemticos
utilizados. Para la comprensin de los planeamientos metodol
gicos ofrecidos, es necesario un manejo gil del lgebra superior
y una cabal comprensin de los conceptos bsicos de geometra
analtica y clculo diferencial e integral.
Otro aspecto que se tuvo en cuenta al redactar este texto es
que la asignatura estadstica brinda un instrumental previo que
[3 ]

INTRODUCCIN

permite un mejor tratamiento de otras asignaturas de los cursos


de planificacin. S hizo, por lo tanto, un esfuerzo de compatibilizacin con las necesidades de instrumental que tienen asig
naturas como anlisis econmico, contabilidad social, evaluacin
de proyectos, planificacin, etc
Los puntos anteriores constituyen un conjunto de condicio
nes, en funcin d las cuales se ha estructurado un curso espe
cial y se redact un texto bsico; para exponer todos y cada
uno de los temas presentados, se tuvieron en cuenta las mencio
nadas restricciones.
Este libro corresponde a una versin revisada de los apuntes
de clase utilizados en los cursos que se dictan en el Instituto La
tinoamericano de Planificacin Econmica y Social, cuya amplia
acogida corroboran sus varias ediciones mimeografiadas y el in
ters que suscit su publicacin en forma de Cuadernos. De todas
maneras parece necesario advertir que el trabajo que se pre
senta en modo alguno pretende ser un manual de estadstica
econmica. Tiene tan slo un propsito didctico y constituye
un texto de iniciacin para el estudio de esta tcnica cuantita
tiva. Est destinado a facilitar el dominio de un instrumental
mnimo indispensable en materia de planificacin, proporcio
nando un conjunto de conceptos que aseguren al planificador
la posibilidad de percibir tanto las ventajas como las limitacio
nes del empleo de indicadores estadsticos, y permitan interpretar
cabalmente los estadgrafos de uso ms frecuente. Interesa al mis
mo tiempo que el planificador pueda establecer, en estudios ms
profundos, relaciones de trabajo eficientes con estadsticos y econometristas.
Es preciso destacar que este texto est constituido en buena
parte por resmenes y adaptaciones de temas tratados en otros,
como los A p u n tes d e estadstica del profesor Pedro Vuskovic, el
Curso gen eral d e estadstica del profesor Enrique Cansado, la I n
troduccin a la estadstica de G. V j Yule y M. G. Kendall, y
la Estadstica gen eral aplicada de F. Croxton y D. Cowden. El
objetivo perseguido no es la originalidad conceptual; antes bien,
se pretende brindar un texto didctico, que incluya un conjunto
de temas ntimamente relacionados con la planificacin, com
plementados con ejercicios que ilustren conceptos de manejo co
tidiano en la prctica.
Debo hacer constar aqu mi reconocimiento a los seores Jorge
Carvajal, Sergio Chaigneau, Leonardo Navarro, Jacinto Vaello y
Max Vildsola, quienes como profesores de seminario han cola
borado conmigo en las clases de estadstica para planificacin

INTRODUCCIN

dictadas en el curso bsico del Programa de Capacitacin del


Instituto. Este libro recoge sus valiosas sugerencias. Varios cap
tulos, especialmente aquellos que tienen estrecha vinculacin con
planificacin y contabilidad nacional, han sido discutidos con el
seor Pedro Sainz, quien ha hedi aportes de inestimable utili
dad. El seor Gregorio Weinberg ha revisado con mudha padencia el texto de esta primera eddn. Su colaboracin y la
de otras personas cuyo enunciado sera interminable comprometen
mi gratitud.
A R TU RO NEZ D E L PRADO

PRIMERA PARTE

ESTAD ISTICA D ESCRIPTIV A

ESTADISTICA Y PLANIFICACIN

A.

LA S NECESIDADES DE IN FO R M A C IO N

Tomar decisiones racionales supone disponer de informaciones


fieles, en cantidad suficiente, y con la oportunidad debida. Las
decisiones errneas se deben tanto a la falta de informacin como
a deficientes evaluaciones de sta. Cabe reconocer, desde un co
mienzo, que una buena proporcin de las informaciones que debe
manejar un planificador son de tipo cuantitativo. La estadstica
convencional presenta mtodos que facilitan el anlisis sobre va
riables cuantitativas; para el anlisis de variables cualitativas, la
estadstica no paramtrica ya alcanz un grado de desarrollo que
permite tratamientos serios y de verdadera utilidad. Existe, por
lo tanto, un cuerpo de conocimientos que posibilita el anlisis
tanto de variables cuantitativas como de las cualitativas. Sin em
bargo, las decisiones en planificacin implican evaluaciones no
estadsticas para ciertos aspectos del complejo problema. Con
viene tener presente, por lo que antes se ha dicho, que la esta
dstica es un instrumento til que permite analizar una parte
de los fenmenos que condicionan las decisiones en planificacin,
donde intervienen aspectos econmicos, sociales y polticos con
todas sus interacciones. Puede lograrse el conocimiento de la es
tructura de importaciones, la distribucin del ingreso y la com
posicin de fuerzas polticas, empleando instrumentos estads
ticos; pero estimar la reaccin de las clases populares ante una
cierta tasa de crecimiento del consumo, exige una evaluacin sub
jetiva e implica, en parte, juicios no cuantitativos.
Ha surgido una falsa controversia sobre las necesidades de in
formacin. Por una parte, reducir los problemas que aparecen
en planificacin a trminos puramente cuantitativos, sera sim
plificar en exceso el problema; por otra, desconocer la utilidad
de los instrumentos, significara circunscribir la discusin a un
marco muy general y peligrosamente confuso. Estas dos posicio
nes no constituyen alternativas; y tampoco es posible encontrar
defensores de una u otra. Identificarse con alguna de estas posi
ciones extremas, significara no comprender realmente qu sigt J ]

10

ESTADSTICA Y

PLA N IFIC A C I N

nifica la planificacin. Por lo dems, tampoco parece posible


disociar el planteamiento de problemas generales, de una necesa
ria cuantificacin. As, por ejemplo, proponer una cierta redistri
bucin del ingreso, supone conocer con bastante detalle cuantita
tivo, la distribucin existente y la redistribucin deseada; sealar
la necesidad de distribuir ingresos, es apenas indicar vagamente
un problema y un objetivo, cuya factibilidad y profundidad no
pueden juzgarse si se desconocen cuantitativamente los tramos de
ingreso y las proporciones de la poblacin que los capta. Este ejem
plo en modo alguno pretende postular que las informaciones
deben ser necesariamente precisas; en planificacin se puede tra
bajar con estimaciones, que en general suponen aproximaciones.
Tampoco es indispensable una precisin rigurosa; saber, por ejem
plo, que el coeficiente de inversin es del 10 o del 12 por ciento
no establece una significativa diferencia para calificar esta situa
cin. Vale decir, se pueden tolerar desvos razonables, mas es
preciso tener conciencia de qu significa un orden de magnitud,
un intervalo razonable o, en general, la utilidad de una aproxi
macin. Es indispensable, cuando se trabaja con estimaciones,
plantear un intervalo donde, con una probabilidad cercana al
100 por ciento, se encuentre el valor verdadero; ahora bien, este
intervalo tendr una amplitud razonable, siempre que las con
clusiones no sean significativamente distintas en uno y otro ex
tremo de dicho intervalo. Admitido en planificacin este criterio
puede permitirse, y a veces no hay otra alternativa, la cuantifi
cacin aproximada, sobre la base de estimadores. Juicios de valor
y opiniones generales no bastan; es preciso que las justificacio
nes obedezcan a deducciones lgicas, identificando magnitudes,
proporciones e indicadores en general, pues todos ellos ayudan, y
a veces en forma insustituible, a calificar fenmenos y obtener
conclusiones objetivas y consistentes.
Dentro de este contexto general la acumulacin de informacio
nes y su uso racional es inherente a un proceso de planificacin.
A continuacin se detalla el empleo de los mtodos estadsticos
durante las diversas etapas de un proceso de planificacin.
1] En el diagnstico
Identificar los principales problemas de un sistema socioecon
mico implica, por una parte, la investigacin de una perspectiva
histrica, la identificacin de la estructura de poder, el comporjtamiento de estos grupos y los resultados que producen en las
principales variables de evaluacin: distribucin del ingreso, es

NECESIDADES DE INFORM ACI N

11

tructura del comercio exterior, estructura y magnitud de la in


versin, estructura del consumo, etc. Ahora bien, puede ser til,
aunque no suficiente, conformarse con impresiones cualitativas
sobre los aspectos citados; esta clase de informacin, si bien ad
mite cierto tipo de calificaciones, no permite una comprensin
cabal del funcionamiento del sistema considerado. Un diagnsti
co completo debera incluir una descripcin de su funciona
miento.
Para responder a este punto, resulta casi innecesario insistir
sobre la urgencia de contar con informacin bsica y con mtodos
estadsticos que permitan tratar y evaluar dicha informacin; se
necesitan tanto los anlisis de corte transversal, como los de pro
cesos dinmicos. En otras palabras, la estadstica descriptiva, vale
decir, los indicadores de posicin, dispersin y asimetra hacen
posible caracterizar situaciones en el tiempo desde diferentes pun
tos de vista. Adems el anlisis de series cronolgicas, los anli
sis de regresin y correlacin se utilizan para analizar el com
portamiento y la interrelacin de las variables en el tiempo. Como
es evidente se trata de anlisis parciales, por etapas, que nece
sariamente deben compatibilizarse para obtener conclusiones con
sistentes. Cada estadgrafo o indicador muestra un aspecto, una
faceta del problema; es necesario disponer, pues, de un conjunto
de indicadores, estticos y dinmicos, para as poder analizar el
problema desde ngulos diferentes que den un marco integral
al estudio.
Sin embargo, aun disponiendo de indicadores estticos y di
nmicos, tampoco es posible dar por terminada esta etapa sin
antes disponer de una descripcin detallada del funcionamiento
de la actividad socioeconmica; y esta descripcin puede ser li
teral o matemtica. Esta ltima forma tiene evidentes ventajas,
en cuanto a consistencia, claridad, precisin y el planteamiento
explcito de supuestos. La estadstica juega un papel fundamen
tal en la determinacin de funciones y en la especificacin de
valores de los parmetros que intervienen en las diferentes re
laciones.
,
2] En la prognosis
En las proyecciones de las variables socioeconmicas resulta par
ticularmente importante la aplicacin de mtodos de regresin y
correlacin y las estimaciones por razn, proporcin y elasticidad,
cuando se acepta el cumplimiento de los supuestos implcitos en
las tendencias histricas, y se admiten reacciones similares a las

12

ESTADSTICA Y

PLA N IFICA CI N

dd pasados frente a cambios en determinados factores cuyo com


portamiento futuro pueda preverse, o sobre el cual pueda influirse
deliberadamente. Esta visin anticipada del futuro permite com
prender la magnitud de los problemas en una dimensin poten
cial. En los diagnsticos suelen percibirse graves problemas, pero
una proyeccin deja ver el empeoramiento de esas situaciones, y
los efectos que tendran, si no se adoptan decisiones que cambien
el sonido de esas tendencias. Las extrapolaciones estadsticas son
ptedsamcnte las instrumentos apropiados para establecer prog
nosis.
3] En la configuracin de la imagen
S par la imagen a largo plazo que se puede hacer ele un pas se
entiende un conjunto de intenciones condicionadas por expec
tativas de variables no controlables, que refleje los cambios desea
bles para las situaciones percibidas en el diagnstico, parece lcito
convenir que dicha imagen no slo debiera incluir caractersti
cas cualitativas sino que admitira y sera beneficioso que en la
imagen se precisen hasta donde la informacin permita caracterizaconex cuantitativas de importancia. Si en el diagnstico, por
ejemplo!, se advierte que la estructura de exportaciones e impor
taciones es perniciosa y por lo tanto debe ser modificada, pos
tular que se debe cambiar esa situacin en favor de una estructura
de exportaciones que conceda mayor importancia al rubro manufarturas a expensas de una menor participacin de materias
primas es slo formular una intencin g<neral, que no puede
ser calificada por su factibilidad ni por 1; importancia del ob
jetivo y su compatibilidad con otros objetivos que plantea la
imagen. Para cumplir con los requisitos mencionados, no se puede
negar la necesidad de disponer de un conjunto de datos cuantita
tivos y cualitativos que pueden obtenerse aplicando mtodos esta
dsticas idneos. La imagen debera ser la culminacin de un plan
a Lugo plazo, y como tal, factible y consistente. Cmo calificar
factibilidad y consistencia en un plano muy general de ideas?
Mo se pretende justificar la caracterizacin de una imagen bajo
una maraa de datos que haran perder la visin central de las
metas propuestas. Es a todas luces evidente que una imagen, por
d plazo dentro del cual se la sita y por las informaciones que
se disponen on el momento de configurarla, no puede abarcar
detalles si se desea hacer un trabajo serio y honesto. Pero s debe
contener un conjunto de variables que permtan juzgar la auda
cia o la cautela en el planteamiento de objetivos y su compatibi

NECESIDADES DE IN FO RM A CI N

13

lidad intrnseca. El estudio de series cronolgicas, las proyecciones


por elasticidad, los modelos de regresin y correlacin y, en ge
neral, los modelos de planificacin, constituyen Iicrrameaias de
enorme utilidad.

4] En la delimitacin de la estrategia
Constituye la estrategia el vnculo entre diagnstico e imagen;
que en la prctica significa decidirse por alternativas referentes
a medidas muy generales de poltica econmica que conducen al
logro de los objetivos planteados en la imagen.
Naturalmente existe una relacin intima entre diagnstico,
imagen y estrategia; y estos conceptos del proceso de planifica
cin estn mutuamente condicionados. A los efectos de su pre
sentacin se los considera por separado, pero eso no debe hacer
suponer que se trata de elementos disociados; antes bien, apone
un encadenamiento de acciones en el tiempo. Se dijo antes que
la eleccin de una estrategia resulta de tomar en cuenta alter
nativas; supuesto esto, es necesario evaluar dichas alternativas
en la medida que las informaciones lo permitan. Necesariamente
es indispensable definir grandes proyectos ligadas a las alterna
tivas de estrategia e imagen planteadas. Es fundamental un m
nimo de cuantificaciones. proyecciones y estimaciones que susten
ten las evaluaciones. Cambios sustantivos y concretos, implcitos
o explcitos, en la imagen y estrategia deberan evaluarse tanto
desde puntos de vista cualitativos, como cuantitativos.. Muevamente parece oportuno insistir sobre el hecho que es indispensable
un mnimo conocimiento de mtodos estadsticos para enfrentar
este complejo problema. Es evidente que la base de sustentation
de imgenes y estrategias realistas est constituida por el aco
pio de informaciones respecto de perspectivas" en el avance tec
nolgico, en las prospecciones de recursos naturales, en las
variaciones de las estructuras sociales, econmicas, institucionales,
polticas, en la composicin de la estructura de poder, etc. Su
pone, por lo tanto, mecanismos giles de captacin de informa
ciones que permitan anticipar la toma de decisiones, de acuerdo
a las expectativas que se tengan.
La obtencin de informaciones durante un proceso de planifi
cacin, debera ser una tarea continua y no espordica; y por
otra parte, la informacin primaria que se obtenga debe ser
depurada, clasificada, resumida y analizada, aplicando adecuadas
tcnicas estadsticas.

14

ESTADSTICA Y

PLA N IFIC A C IO N

5] En el plan a m ediano plazo


Consiste, por una parte, en la actualizacin de la imagen a un
plazo que media entre los tres y diez aos, con mucho mayores
detalles y especificaciones..Por otra, implica un conjunto de deci
siones de poltica econmica mucho ms concretas e individua
lizadas que en el plan a largo plazo; se definen proyectos secto
riales y regionales que dan contenido fsico a la estrategia; se
hace indispensable una evaluacin ms precisa de objetivos y
metas. Las tcnicas de proyeccin y los modelos de programacin
constituyen los instrumentos cuantitativos ms utilizados durante
esta etapa. Estimaciones por regresin y elasticidad, la utilizacin
de matrices de insumo producto, los balances de materiales, etc.,
son instrumentos a los cuales nuevamente se apela, por lo gene
ral, en forma intensiva. La confeccin de una matriz de insumo
producto exige el manejo de una serie de mtodos estadsticos;
las actualizaciones de matrices obsoletas implican correcciones de
coeficientes que suponen una racional utilizacin de nmeros
ndices y de tcnicas mustrales. Proyecciones a precios constantes
y a precios variables que alcancen una estructura deseada, justi
fican una cabal comprensin de los temas, sealados. Parece pues
innecesario destacar las necesidades de estimacin estadstica de
parmetros que suponen descripciones ms detalladas del funcio
namiento del sistema socioeconmico necesarias a mediano plazo.
6] En el plan a corto plazo
Para esta etapa es necesario concretar medidas especficas de po
ltica econmica; pues parece que debera haber una superpo
sicin entre las intenciones y las actuaciones. Los mecanismos de
evaluacin que permitirn calificar la transformacin de las in
tenciones en acciones, requieren una descripcin muy detallada
del funcionamiento del sistema econmico. Es fundamental dis
poner, en un plano sectorial, institucional, y sociopoltico, ms
detallado, de funciones que expresan el comportamiento de va
riables trascendentes, por ejemplo funciones de produccin, fun
ciones de ingreso, funciones de consumo, funciones de precios,
etctera. Todo esto supone que se dispone de una cantidad de
informaciones y se utilizan mtodos estadsticos que permiten
determinar los valores de los parmetros.
7] En el control de avance y en la reform ulacin de los planes
Sabido es que el proceso de planificacin constituye una continua
revisin de alternativas a la luz de las nuevas informaciones que

O BTEN CIN DE IN FO RM ACIO NES

15

se van obteniendo a medida que transcurre el tiempo. Por otra


parte, es indispensable estar informado sobre la realidad de la
actividad socioeconmica para compararla con las intenciones que
reflejan los diferentes tipos de plan. Estos dos hechos, entre otros,
obligan a realizar sondeos peridicos para ir percibiendo las
posibles distorsiones y para cerciorarse del grado de avance en el
cumplimiento de las metas y objetivos del plan. Adems es nece
sario subrayar que el acopio de informacin debe ser oportuno;
verificar hechos histricos siempre ser interesante para una serie
de propsitos; pero verificar hechos en el momento que se pro
ducen es indispensable para las tareas de planificacin. El empleo
dt tcnicas mustrales, aplicadas tanto a la estimacin de varia
bles cuantitativas como a la de variables cualitativas, por sus
indudables ventajas, parece ser una herramienta verdaderamente
til, y esto sobre todo si se piensa en el costo y la oportunidad
con que se entregan los resultados. As, entre los estudios coyunturales que se realizan en Francia, figuran encuestas mensuales
sobre el desarrollo de la actividad industrial, sobre las condi
ciones de vida de las familias, etc., informaciones stas que se
recogen con extraordinaria frecuencia y periodicidad. En los
pases latinoamericanos, donde las ideas de cambio y reforma, en
lo social y en lo econmico, implican tareas reflejadas en una
cantidad de planes, es fundamental plantear mtodos oportunos
para captar informacin y sistemas que permitan evaluarla.

B.

M TOD OS DE O BTEN C I N

DE

IN FO R M A C IO N ES

Para las distintas etapas del proceso de planificacin enumera


das en pginas anteriores, es posible mencionar los siguientes
mtodos que permiten recoger la informacin necesaria.
1] Censo
Como es sabido constituye una indagacin completa, sobre las
variables que interesa investigar, de los elementos que compo
nen una poblacin claramente definida. El conocimiento censal
de una poblacin asegura la posibilidad de obtener datos feha
cientes, siempre que no se cometan errores en la recopilacin y
en el tratamiento de la masa de datos. En general es muy difcil
que un censo, sobre todo cuando la poblacin es muy amplia
y diversa, est exento de alguno de los errores sealados. Mien
tras stos no distorsionen significativamente las caractersticas
reales de las poblaciones censadas, pueden pasarse por alto, des

16

ESTADSTICA Y

PLA N IFIC A C I N

de el punto de vista de la planificacin, desviaciones razonables


respecto de los valores verdaderos.
Determinan las desventajas ms serias de este mtodo, el ele
vado costo que significa trabajar con volmenes de informacin
muy grandes y la demora consiguiente en obtener resultados con
cretos. Sin embargo, son indispensables investigaciones censales,
pese a estas desventajas, por lo menos cada cierto nmero de
aos, para posibilitar la utilizacin de otros mtodos durante los
perodos intermedios y para disponer peridicamente de infor
maciones completas.
2] T cnica m uesiral
Debe entenderse como una indagacin parcial sobre las variables
que interesa investigar, de los elementos que componen una po
blacin. Es parcial, puesto que se considera una fraccin, una
muestra, de la poblacin; sin embargo esta fraccin poblacional
debe ser calificada por su representatividad, es decir, debe ase
gurar que refleja, con alguna aproximacin, las caractersticas
poblacionales que interesa investigar. Este mtodo, en cierta me
dida debe ser considerado como un complemento de las inves
tigaciones censales; y complemento en un doble sentido: para
intercalar estimaciones entre los perodos censales y para desglo
sar y agregar otras variables a la$ investigadas por mtodos
censales.
Sus grandes ventajas radican en el costo que, en general, es
muy inferior al de un censo; en la oportunidad con que se entre
gan las estimaciones, y tambin en la posibilidad de realizar
indagaciones exhaustivas sobre fenmenos concretos. T a l vez la
mayor desventaja de esta tcnica la determine la necesidad de
trabajar con mrgenes de probabilidad inferiores al 100 por cien
to, es decir, sin la certeza absoluta que las estimaciones son vli
das. Ahora bien, esta desventaja implica riesgos que, por lo
general, tienen una probabilidad de ocurrencia inferior al 10
por ciento y muchas veces menores al 5 por ciento. Esta proba
bilidad puede ser tan pequea como se quiera; pero su reduccin
tiene como contrapartida un crecimiento del tamao de la mues
tra. El objetivo es trabajar con probabilidades pequeas de error
y con tamaos de muestra que no conviertan en prohibitiva la
investigacin por razones de costo y tiempo.

OBTEN CIN DE IN FO RM ACIONES

17

3] Estudios de casos tpicos


Puede considerarse este mtodo como un lmite de muestras
pequeas dirigidas. Consiste en seleccionar algunos elementos re
presentativos de grupos homogneos de la poblacin estudiada.
El anlisis de estos casos, que constituyen puntos importantes
del abanico completo de la poblacin, puede entregar informa
ciones que aunque incompletas, representen por lo menos un
punto de partida para indagaciones ms precisas. Este mtodo
debe ser interpretado como una investigacin preliminar, como
una prueba de factibilidad de posteriores investigaciones mus
trales o censales. Sus ventajas en materia de costo y tiempo son
evidentes. Y su gran desventaja estriba en el hecho que incorpora
cierta dosis de arbitrariedad en la calificacin de lo que es un
caso tpico o representativo; pero como se dijo, su principal apli
cacin responde a su factibilidad. Pinsese, por ejemplo, en dife
rentes alternativas de impuestos progresivos y exenciones; si se
seleccionan algunos casos representativos: familias de un obrero
no calificado, de uno calificado, de un empleado pblico, de un
empleado particular, de un profesional, de un gerente, de un ren
tista, etc., en cada uno de estos casos podr probarse cada una
de las alternativas planteadas. Algunas de ellas sern fcilmente
descalificadas y la discusin puede llegar a circunscribirse a muy
pocas alternativas. Una pequea muestra puede dilucidar la dis
cusin cuando el nmero de alternativas se ha reducido. Es
necesario admitir que este mtodo supone algn conocimiento
realista de la poblacin para elegir los casos realmente re
presentativos.
4] Experim entacin numrica
El surgimiento y la utilizacin generalizada de computadores
electrnicos permite la posibilidad de tanteos, pruebas de ensayo
y error, con una velocidad extraordinaria, empleando un conjunto
numeroso de alternativas. Para la planificacin a corto plazo,
disponer de una descripcin detallada del funcionamiento de la
actividad econmica es una herramienta de innegable utilidad;
ahora bien, las descripciones detalladas suponen que se dispone
de una extraordinaria cantidad de informacin. Para ello se hace
necesario destinar una buena cantidad de tiempo y esfuerzo a la
recopilacin de datos, aunque sean aproximados, que permitan
alimentar el modelo que representa la formalizacin matemtica
de las ideas que se tengan respecto del funcionamiento del sistema
econmico. Las relaciones del modelo, de definicin y compor-

18

ESTADSTICA Y

PLA N IFIC A C IO N

tamiento, implican una enorme cantidad de parmetros, muchos


de ellos desconocidos; por ello, una alternativa podra ser el in
tento de reproducir la historia reciente a travs del modelo.
El modelo se alimenta con los datos disponibles sobre variables
exgenas y parmetros y se dan valores intuitivos respecto de los
parmetros desconocidos. Con ese conjunto de datos, unos fieles
y otros estimados, se trata de reproducir la historia, por ejemplo
de los ltimos dos aos, cuyas variables exgenas y las principales
variables de resultado son conocidas. De la comparacin entre
las variables de resultado efectivas y las variables de resultado dadas
por el modelo, surgen idas para reformular las ecuaciones de
comportamiento y para modificar los valores intuitivos de los
parmetros. Se pueden repetir muchas veces los experimentos has
ta encontrar satisfactoria la reproduccin que entrega el modelo.
Una reproduccin aproximada de las variables de resultado es el
punto de partida para realizar pruebas de sensibilidad, las que
consisten en modificar ligeramente los valores de cada uno de
los parmetros y analizar su efecto sobre las variables de resulta
do; la utilizacin de coeficientes de elasticidad permite calificar
los parmetros como crticos y neutros, segn el valor de dichos
coeficientes. Esta calificacin da una pauta para realizar investi
gaciones estadsticas y economtricas que permitan estimar aque
llos parmetros crticos con mtodos ms rigurosos y confiables.
Dada la interrelacin que tienen las variables en un modelo
de este tipo, tambin ser posible estimar, por medio de la expe
rimentacin numrica, variables y parmetros que puedan des
pejarse de otras relaciones d la descripcin. Evidentemente esto
supone una gran confianza en el tipo de funciones elegidas y en
los valores de los parmetros conocidos.

C.

LA D ISPO N IBILID A D DE IN FO R M A C I N

EN A M R IC A

LA TIN A

Una apresurada generalizacin sobre las disponibilidades de in


formacin estadstica en Amrica Latina corre el riesgo de no
tener una validez total. La gran heterogeneidad de pases que
caben dentro del comn denominador de subdesarrollados tam
bin se manifiesta en la disponibilidad de datos. Con todo, es
posible exponer algunas consideraciones que poseen un cierto
carcter general.
En primer lugar, es necesario aceptar como hecho evidente la
insuficiencia de informacin bsica sobre varios aspectos de im
portancia para la planificacin. Pocos son los pases que poseen

DISPONIBILIDAD DE IN FO RM ACIN

19

informaciones sobre distribucin de ingreso y de riqueza, y apa


rentemente no hay alguno que efecte este tipo de investigaciones
en forma continuada a nivel nacional.
La carencia de datos en una buena parte de. los pases latino
americanos llega a ser realmente crtica; en algunos apenas se
dispone de uno o dos ndices de precios, y donde como agravante
se notan caractersticas inflacionarias, permanentes. Esta carencia
de datos sobre precios ofrece un doble inconveniente; la dificul
tad de plantear polticas de precios y la imposibilidad de tra
bajar con valores reales, ya sea poder de compra o expresiones
fsicas; dos aspectos que interesan fundamentalmente a toda tarea
de planificacin. No es difcil seguir enumerando una serie de
deficiencias en materia de datos: se desconocen estructuras de con
sumo, de inversin, de capital, de produccin, de costos, etctera.
En segundo lugar, una vez admitido el hecho que hay una
aguda escasez de datos, tampoco se puede dejar de reconocer que,
aun as, no siempre se hace un aprovechamiento ptimo de la
escasa informacin disponible. Adems existen problemas de in
terpretacin de datos, provocados por deficiencias de las publica
ciones y por falta de entrenamiento en el anlisis estadstico.
Sin desconocer que en general la informacin es escasa, con
viene tener en cuenta que hay una mayor cantidad de datos de
la que habitualmente se supone, pues tambin existen investiga
ciones cuyos resultados no revisten carcter oficial. Es indispen
sable, por tanto, realizar inventarios de las estadsticas no publi
cadas. Adems, existe una gran cantidad de informacin en estado
primario, cuyo traspaso a tarjetas perforadas o a cintas o discos
magnticos, bastara para obtener clasificaciones o resmenes que,
a su vez, pueden transformar una masa de datos casi intil
en informaciones aprovechables para propsitos mltiples.
En tercer lugar, no se puede dejar de subrayar que al problema
de la escasez, se agrega el del atraso con que se dan a conocer
informaciones que pueden tener enorme importancia en un de
terminado momento, pero que despus slo son tiles para verifi
car hechos pretritos, que ya pertenecen a la historia., La idea
de oportunidad en materia de planificacin adquiere una sig
nificativa importancia.
En cuarto lugar, parece til un breve comentario sobre la ca
lidad de las informaciones. Con frecuencia muchas estadsticas
provienen de muestras insuficientes o fueron obtenidas a travs
de cuestionarios que, involuntaria o inadvertidamente, inducen a
cierto tipo de respuestas. Un conjunto de informaciones socio

ESTADSTICA Y

20

PLA N IFIC A C IO N

econmicas, difcilmente puede superar todas las pruebas de con


sistencia que pueden plantearse.
Finalmente, dada la exigua disponibilidad de recursos para en
frentar investigaciones estadsticas, puede observarse una curiosa
asignacin de prioridades de tareas. Los organismos pblicos y
privados, plantean muchas veces investigaciones en forma inde
pendiente, sin preocuparse por armonizar criterios de los usuarios
ni por dispendiosas duplicaciones.

D.

E L CO N TRO L DE LA CALIDAD DE LAS IN FO R M A C IO N E S ESTAD STICAS

Del aserto que en planificacin no cabe exigir precisin rigurosa,


no se sigue necesariamente que se pueda trabajar con cualquier
calidad de informacin recogida; se advirti ya que las desvia
ciones deban ser razonables y no exceder ciertos lmites de
tolerancia fuera de los cuales las conclusiones pueden ser ambi
guas. Las siguientes consideraciones quiz puedan facilitar la
comprobacin de la calidad.
1] H i p t e s i s

Cuando se plantea una investigacin, es fundamental establecer


hiptesis previas acerca de los posibles valores que tendran las
variables investigadas. Confrontar los resultados efectivos con
las hiptesis previas, constituye una primera prueba que ayuda
en la evaluacin. Si ambos tipos de datos apuntan en el mismo
sentido, aumenta la confianza para admitirlos; si difieren en
forma significativa ser necesario averiguar la causa de las dife
rencias, por lo tanto, habra que revisar las hiptesis previas y
la metodologa que se aplic para obtener informaciones.
2] Consistencia
Es conveniente establecer pruebas de consistencia interna, dentro
del conjunto de los investigadores que se obtienen como resultado
de la investigacin, y tambin consistencia con otros antecedentes
disponibles. Todo esto permite calificar mejor los datos con los
cuales s trabaja. Recurdese que, en planificacin, uno de
los puntos ms delicados es lograr compatibilizaciones en distin
tos sentidos.

CONTROL DE CALIDAD DE IN FO RM ACIONES

21

3] R epresentatividad
La evaluacin de la representatividad de un indicador es parte
de la etapa de control; un ejemplo concreto de falta de una
evaluacin adecuada, es la jerarquizacin del nivel de desarrollo
de un pas basndose sobre los ingresos por habitante.
En primer lugar, un promedio no siempre es representativo;
para que lo sea, todos los valores tendran que estar muy prxi
mos a dicho promedio; el caso de los ingresos por habitante
est muy lejos de acercarse a esta situacin. En segundo lugar,
hay un problema de cmputo de los ingresos reales: evaluaciones
del autoconsumo y utilizacin de sistemas de deflactacin muy
diferentes entre los pases, hacen todava menos comparables los
referidos promedios. A pesar de todo esto hay una tendencia a
utilizarlos en las comparaciones internacionales sin especificar
sus limitaciones. Cuanto se manejan estadgrafos o indicadores
que en general, resumen de manera imperfecta una masa de
datos, parece recomendable detenerse en el anlisis de su repre
sentatividad y especificar qu faceta del problema puede abor
darse a travs de ellos y qu otros aspectos quedan al margen
de tales indicaciones.
4] Sesgos
Cuando se recolectan informaciones por medio de encuestas, es
particularmente importante registrar y eliminar, o por lo menos
reducir, la posibilidad de trabajar con informaciones que con
tengan sesgos. Por sesgo se entiende una desviacin sistemtica
de las caractersticas observadas respecto de las caractersticas rea
les, por consiguiente parecera casi innecesario subrayar el peligro
que esto significa durante la etapa de obtencin de conclusiones.
Un mal diseo de cuestionarios puede, en cierto modo, inducir
las respuestas pedidas. Los encuestadores, a veces, no mantienen
una posicin neutra e inclinan, en un cierto sentido, a quienes
responden. Una encuesta sobre ingresos y consumos generalmente
evidencia subestimaciones en el monto de las rentas y distorsiones
en la estructura del gasto, sobre todo en los estratos de ingresos
altos, y esto por razones fciles de imaginar. La realizacin de
confrontaciones utilizando muestras yuxtapuestas, permite com
probar la existencia de estos desvos y, a veces, en algn sentido
cuantificarlos. Con todo, tampoco puede desconocerse que el pro
ceso de reduccin de estos errores supone esfuerzos que encarecen
sustancialmente la investigacin.

ESTADSTICA Y

22
E.

PLA N IFICA CI N

ESTA D STICA PA RA PLA N IFIC A C I N

Respecto de las tareas inmediatas que parecen ineludibles, ad


mitida la necesidad de establecer procesos continuos de planifi
cacin, se estima conveniente discutir las siguientes ideas:
1] Investigaciones simultneas
No puede aguardarse que estn disponibles los datos para comen
zar una serie de investigaciones socioeconmicas. Parecera ms
bien que la decisin de iniciar una investigacin, debera adop
tarse admitiendo dos criterios: por un lado, estructurar la parte
conceptual y sustantiva de la investigacin; y, por otra, simult
neamente, la investigacin estadstica pertinente. Muchas inves
tigaciones se postergan por falta de informacin, cuando todo
retardo causa un perjuicio que se magnifica a medida que trans
curre el tiempo. Durante una primera etapa, los organismos de
investigacin deberan incorporar unidades cuyo objetivo esen
cial fuese la captacin de informacin, en particular centros de
muestreo, para no depender de otros organismos en la disponi
bilidad oportuna de datos. En ese sentido, las investigaciones
interdisciplinarias parecen ofrecer facilidades en el planteamiento
de investigaciones simultneas; desde luego, no es sta una solu
cin integral del problema de la informacin; antes bien, se corre
el riesgo de duplicar esfuerzos y malgastar recursos por falta de
comunicacin y coordinacin entre los organismos. Sin embargo,
com o etapa transitoria y mientras se organizan planes nacionales
de estadstica, parecera que podran evitarse as mayores poster
gaciones. Por lo dems no sera demasiado oneroso algn grado
de duplicacin, dada la exigidad de los recursos destinados a
la investigacin estadstica. En todo caso un mnimo de coordi
nacin entre los diferentes organismos sera suficiente durante
esta etapa transitoria.
2] Organizacin institucional
Un tema sobre el que se insisti mucho y sobre el que poco se
hizo, es la adecuacin de la estructura institucional que facili
tara el establecimiento de los procesos de planificacin. En este
sentido, y desde el punto de vista que se est considerando parece
realmente conveniente establecer una estrecha relacin entre las
oficinas de estadstica y los organismos de planificacin. La can
tidad de recursos disponibles para captar informacin obliga a
una detenida jerarquizacin de las diferentes investigaciones. El

ESTADSTICA PARA PLA N IFIC A C I N

23

anlisis de las distintas publicaciones en materia estadstica que


dan a conocer los pases revela que existe una apreciable can
tidad de informacin, que aunque importante es susceptible de
ser sustituida o postergada en beneficio de otra ms urgente. Es
posible que este tipo de consideracin est determinada en parte
por algn inters especfico en materia de planificacin, pero en
todo caso el diseo de un plan nacional de estadstica supondra
evaluar diferentes asignaciones de recursos, considerar los inte
reses de los usuarios pblicos y privados, evitara innecesarias
duplicaciones, delimitara las responsabilidades de los diferentes
organismos para la entrega de la informacin y, lo que es ms
importante, establecera plazos concretos para dar por terminadas
investigaciones que muchas veces se arrastran durante lapsos pro
longados.
3] R equisitos concretos de inform acin estadstica
en m ateria de planificacin
Parecera realmente fuera de lugar aqu elaborar, por intermi
nable, una lista exhaustiva; sin embargo, enumerar los principa
les campos donde parece urgente concretar investigaciones mos
trara la enorme e impostergable tarea que se tiene por delante.
(Se parte del supuesto que existen adecuados sistemas de conta
bilidad nacional: cuentas nacionales, esquemas de fuentes y usos
de fondos, matrices de insumo producto, balanza de pagos, etc.)
a) T a l vez uno de los principales campos corresponda al an
lisis de la distribucin del ingreso y de la riqueza. Distinguir entre
asalariados y no asalariados supone dos categoras demasiado
elementales y heterogneas en exceso. Es preciso detallar escalas
de ingreso que abarquen grupos homogneos de personas; pero
convngase tambin que cualquier indagacin sobre esta materia
ofrece muchas dificultades. La veracidad de los datos sobre ingre
sos personales (sobre todo en el grupo no asalariado) debera
quedar asegurada por investigaciones complementarias sobre la
propiedad, el consumo, la tributacin, etc. Estudios con controles
cruzados son indispensables desde el punto de vista de la calidad
de los datos.
Tampoco parece exagerado admitir que informaciones sobre
estos aspectos deberan constituir el punto de partida de la ela
boracin de cualquier plan que especifique acciones concretas.
b) Otro aspecto, muy ligado al anterior, es el reconocimiento
de la estructura de preferencias de los consumidores segn sus
diferentes niveles de ingreso. La compatibilidad entre una estruc

24

ESTADSTICA Y

PLA N IFIC A C I N

tura de produccin y la demanda final, implica trabajar con


coeficientes de elasticidad ingreso y elasticidad gasto a un nivel
de desagregacin bastante grande; la obtencin de funciones con
sumo por tipos de productos homogneos, permite dar coherencia
a las variables. Por otra parte, investigaciones de este tipo per
mitiran verificar la representatividad de las ponderaciones efec
tuadas en los diferentes ndices de precios al consumidor.
c)
Dentro de las tareas urgentes en materia de recopilacin
estadstica para la planificacin, tiene especial importancia deter
minar el valor del capital por sectores, subsectores o ramas de
actividad, que es, por cierto, un problema en extremo delicado.
Requiere estudios muy prolijos confeccionar un inventario con
especificacin de antigedad, y que al mismo tiempo evale el
contenido.
i)
Las estructuras de precios vigentes no siempre se ajustan a
los objetivos sociales y econmicos que plantean los planes. Estu
diar la formacin de los precios, sus componentes, la especulacin
y las duplicaciones en las distintas etapas del proceso de distri
bucin y comercializacin, son tareas de tipo estadstico que
tambin deben tener prioridad en el futuro inmediato. La dispo
nibilidad de ndices de precios, en general, es insuficiente para
cumplir con algn xito tareas de cuantificacin econmica a
travs del tiempo; hay pases, por ejemplo, donde slo se dispone
de un ndice de. los llamados de costo de vida confeccionado
sobre una base obsoleta y para un sector escasamente represen
tativo de la poblacin.
e) Dentro de los pases pueden delimitarse zonas geoeconmicas bastante diferenciadas, la necesidad de establecer determi
nado tipo de desagregacin de la contabilidad social que tome
en cuenta algn tipo de regionalizacin, permitira dar, desde este
punto de vista, una mayor coherencia a los objetivos perseguidos,
a los proyectos elegidos y a las medidas de poltica econmica.
f) El anlisis de factibilidad necesario para imponer ciertas
medidas de poltica econmica, exige identificar los centros de
decisin y la gravitacin e influencia que tienen sobre la acti
vidad econmica; tales investigaciones tampoco son ajenas al
empleo de mtodos estadsticos. Lo que se dio en llamar socio
metra apunta en este sentido.
g) Numerosas variables macroeconmicas se calculan tomando
como referencia un perodo equivalente al ao; sin embargo, una
desagregacin semestral o trimestral, permitira adoptar medidas
oportunas, si los hechos contingentes as lo requieren. Este tipo
de desagregacin temporal, tendra que basarse, naturalmente,

PLA N NACIONAL DE ESTADSTICA

25

sobre estimaciones algo elementales. Estimaciones sobre producto,


consumo, inversin, a un nivel de detalle sectorial parecen facti
bles utilizando muestras e indicadores parciales. Los indicadores
a corto plazo cobran actualmente una significativa importancia.

F.

PLA N NACION AL DE ESTA D STICA

Las anteriores consideraciones sobre escasez, oportunidad, dupli


caciones, necesidad de establecer prioridades en materia de inves
tigaciones estadsticas y la fijacin de plazos para realizarlas,
constituyen fundamentos slidos para confeccionar planes de
estadstica a nivel nacional. La realizacin y puesta en marcha
de un plan de esta naturaleza implica la necesidad de hacer un
inventario crtico, en materias de calidad y oportunidad, de las
informaciones estadsticas existentes, tanto de las publicadas como
de las que se reservan para el uso interno de diferentes organis
mos. Disponer de un catlogo semejante significara una conside
rable ayuda para los investigadores; permitira realizar un diag
nstico eficiente sobre la disponibilidad de informaciones.
La confeccin de un plan de estadstica supone determinar
prioridades respecto de los diferentes tipos de informacin, de
la periodicidad y oportunidad de su publicacin. Una encuesta
a los principales usuarios, actuales y potenciales, parecera un
mtodo adecuado para preparar una lista del conjunto ms ge
neral de informaciones necesarias. La frecuencia con que se re
quiere cada tipo de informacin, permitira fijar prioridades a
las diferentes investigaciones. Es evidente que los pases empea
dos en un proceso de planificacin, tendran que asignar recur
sos y especificar investigaciones, con una orientacin clara en
ese sentido.
A esta altura del trabajo se hace necesario repetir que la in
corporacin de tcnicas mustrales para recoger informacin y
utilizar computadores electrnicos en el procesamiento y clculo
de datos, conducen a un ahorro de tiempo y a veces de costo par
ticularmente significativos.
La asignacin de responsabilidad en cada una de las investiga
ciones programadas es un punto delicado durante la elaboracin
de un plan; en este mentido debern precisarse las responsabili
dades de las oficinas de estadstica, as como tambin de cada
uno de los dems organismos pblicos, las universidades y centios de investigacin y de las instituciones privadas.
La Oficina de Estadstica dependiente del organismo de plani

26

ESTADSTICA Y

PLA N IFIC A C I N

ficacin, o por lo menos estrechamente vinculada a l, debera


asumir la responsabilidad central de la coordinacin administra
tiva y tcnica del plan. Es de gran importancia, una vez asigna
das las responsabilidades, discutir a profundidad los posibles
mtodos para captar informacin, el sistema de control, el tipo
de clasificaciones, los indicadores resultantes y sus mtodos de
cmputo.
La fijacin de plazos, entre el comienzo y el trmino de las
investigaciones, es fundamental para garantizar el cumplimiento
del programa de trabajo.
Estimaciones de costo, confeccin de presupuestos por investi
gacin y el logro de financiamientos oportunos son tareas que
completan este conjunto de ideas que pretende ser un esquema
primario de discusin.
Nada fcil es imponer la idea de trabajar con seriedad y pers
pectiva, cuando se programan tareas de investigacin estadstica,
perfilando un verdadero plan. Los problemas a corto plazo, en
general, postergan asignaciones de recursos para esta clase de tra
bajos; cuando por ejemplo existen presiones polticas, econmicas
y sociales, por captar fracciones de presupuestos exiguos, es difcil
imponer un plan de estadstica que demanda recursos nada des
deables y que parece no ofrecer utilidad inmediata. Slo una
evaluacin a largo plazo, y una comparacin con otras asigna
ciones de recursos que no siempre puede defenderse, permiten
favorecer esta propuesta.
Una de las tareas de los planificadores es precisamente, llamar
la atencin sobre la urgencia de un plan tie. esta naturaleza, in
dispensable para cualquier proceso de planificacin.

ESTADIGRAFOS DESCRIPTIVOS ESTATICOS

A.

D ISTR IBU C IO N ES D E FR E C U EN C IA

1] Generalidades

Un conjunto de datos, o masa estadstica, puede ser resumido y


clasificado de acuerdo a criterios convenientes. Provengan las
informaciones de censos o de muestras relativamente grandes,
siempre sern tiles para el anlisis, ya que difcilmente podr
obtenerse conclusiones vlidas de una masa estadstica no clasi
ficada.
Los tipos de variables fundamentales, por lo menos para este
trabajo, sern los siguientes:
a) variables cardinales: susceptibles de medicin cuantitativa;

y las que a su vez comprenden:


i) continuas: variables que pueden tomar cualquier valor
dentro de un intervalo (ingresos, estaturas, distancias,
etc.)
ii) discretas: variables que skr toman algunos valores den
tro de un intervalo (nmero de hijos por familia, nme
ro de accidentes de trnsito por da, etc.)
b) variables ordinales: slo susceptibles de ordenacin pero no
de medicin cuantitativa (grado de cultura de una persona:
muy culta, regularmente culta, poco culta, inculta).
Para cada uno de estos tipos de variables, un conjunto de ob
servaciones puede dar origen a una distribucin de frecuencias;
y sta debe entenderse como un cuadro o tabla resumen de los
datos originales.
En el caso de variables continuas ser necesario fijar intervalos
de frecuencia para llegar a un resumen efectivo de la informacin
original. El punto medio de cada intervalo se denominar marca
de clase y constituir el valor representativo de cada intervalo.
El nmero de observaciones que correspondan a cada intervalo se
denominar frecuencias absolutas.

28

ESTADGRAFOS DESCRIPTIVOS ESTATICOS

Una tabla de distribucin de frecuencia para variable continua


y sus smbolos correspondientes se presenta de la siguiente forma:
In g r e s o s d e p r o fe s io n a le s
I n te r v a lo s
M arcas d e cla se

N m e r o d e p r o fe s io n a le s
F r e c u e n c ia s a b so lu ta s

Y1 'i - l

Y'
1

V,

Y* 0'
Yj
Yj

Y'
M
Y'
Yj

Yx
Y
y3

ni
n
n.

Y'm - 1

Y1 m
'

Ym

nm

11

donde:
+ Y
Y = --------------

n =
c = Y-

n i de clase
marca

2 n
i'l

nmero de observaciones

Y' ,

amplitud del intervalo

Estas tablas pueden ser de amplitud constante o de amplitud


variable, segn los valores que tome c,.
Cuando se trata de variable discreta o discontinua, la tabla
de distribucin de frecuencias adquiere la forma siguiente:
Y,

n,

"v i
Y,
Y3

nT
n2
n3

Ym

Dnl

Cabe. destacar que cuando la variable adquiere numerosos va


lores distintos para abreviar el trabajo, con cierta arbitrariedad
y con alguna prdida de precisin, puede tratarse como una va
riable continua, formando intervalos de clase.
Por ltimo, en el caso de variables no mensurables, dicha tabla
adoptar una forma como la siguiente:

29

DISTRIBUCIONES DE FR EC U E N C IA

Variable

Frecuencia

C aracterstica
C aracterstica

A
B

nA

C aracterstica

nz

nB

1 lector advertir que las tablas de distribucin de frecuen


cias facilitan enormemente el anlisis. Es muy ventajoso dispo
ner de informaciones clasificadas en intervalos o en valores es
pecficos de la variable, ya que, de esta manera, es posible obte
ner conclusiones primarias acerca de la variable que se investiga.
Respecto de las frecuencias, es posible y generalmente til
presentarlas en trminos relativos, calculando la proporcin que
corresponde a cada intervalo o marca de clase sobre el total de
observaciones. Se denominan frecuencias relativas, y se simboli
zarn por Iq:

Tanto las frecuencias absolutas como las relativas son suscep


tibles de acumulacin respecto de los intervalos o marcas de cla
se. Las frecuencias absolutas acumuladas se simbolizarn por N
y se definen:
N, =

2 nj
i-l

Las frecuencias relativas acumuladas se simbolizarn pr H,


y se definen:
H =

2 h,
i-i

En general este tipo de frecuencias se acumulan en sentido


creciente de la variable, y una frecuencia acumulada N indica
el nmero de casos u observaciones donde la variable toma va
lores a lo sumo iguales a Y, en el caso de variable discreta, y
a Y'j en el caso de variable continua. Sin embargo, para ciertos
anlisis tambin es necesario acumular en sentido inverso; de
ah que se hable de frecuencias acumuladas hacia arriba o hacia
abajo.

30

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

2] Representacin grfica
En general, la representacin grfica de una tabla de distribucin
de frecuencias, permite percibir con mayor claridad algunas ca
ractersticas de la masa de datos que se investiga; por ello resulta
bastante ms fcil trasmitir conclusiones a personas no habi
tuadas a la interpretacin de distribuciones de frecuencia, cuando
se utilizan grficos estadsticos.
a)
Representacin grfica de variable continua. Si se utiliza un
par de ejes coordenados, en el eje de las abscisas se representar
la variable estudiada, en tanto que en el eje de las ordenadas,
se representar las frecuencias correspondientes. Recurdese que
en este tipo de variables la frecuencia corresponde a un intervalo
y por esto se representa mediante una superficie.
Con un ejemplo se ilustrarn estas ideas; admtase, en este sen
tido, la siguiente tabla correspondiente a las edades de los par
ticipantes de un curso de estadstica:

Edades
Y'
Y'
1 -i
1%
18
22
26
30
38

Alumnos

Amplitud de intervalo

Ci

10
20
16
12
1

4
4
4
8
2

22
26
30
38
40

Puesto que la amplitud ms frecuente es 4, puede adoptrsela


como amplitud unitaria; as el cuarto intervalo tendr dos veces
la amplitud unitaria elegida y el quinto intervalo tendr la
mitad de dicha amplitud. La representacin grfica se har segn
la grfica 1 de la pgina siguiente.
En la grfica, para calcular la altura de cada rectngulo se
plantea la relacin de superficie siguiente:
superficie = base X altura
ni

ci

donde c' es la amplitud unitaria elegida con el objeto de dise


ar una grfica adecuada. Desde luego que tambin pudo haberse
trabajado con las amplitudes originales, aunque habra sido algo
ms laborioso.

DISTRIBUCIONES DE FR EC U E N C IA

31

GRFICA 1

Este tipo de grficas recibe el nombre de histogramas y la lnea


quebrada que une los puntos medios de los lados superiores de
los rectngulos se denomina polgono de frecuencias.
b)
Representacin grfica de variable discreta. En este caso la
frecuencia correspondiente a cada valor de la variable estar re
presentada por una barra vertical.
g r f ic a

Naturalmente, se puede construir, en forma similar, grficas


que relacionen la variable con cualquiera de los tipos de fre
cuencias que se han visto, relativas, acumuladas, etctera.
A continuacin se presentar un ejemplo donde se seguirn
todos los pasos necesarios para llegar a una tabla completa de
distribucin de frecuencias. Supngase que se dispone de las
siguientes informaciones acerca de los sueldos de los obreros de
una fbrica (en dlares por mes):

32
68
90
55
50

ESTADGRAFOS DESCRIPTIVOS ESTTICOS


48 53
70 40
6C 30
40 45

73
80
110
90

100
100
110
105

80
70
90
108

40
50
70
35

55
55
60
45

65
70
45
50

95
65
65
70

85
45
80
82

35
80
85
84

110
60
90
66

120
90
68
38

60
50
72
48

Una de las primeras decisiones que deben adoptarse es determin. r el nmero de intervalos que tendr la tabla. Para ello es
necesario considerar el objetivo que se persigue con el estudio
de la variable, qu tipo de diferenciaciones o agrupamientos in
teresara conocer; por otra parte, es indispensable determinar el
recorrido de la variable, es decir, el menor y mayor valor entre
los datos que se analizan. Por ltimo, el nmero de observa
ciones, cie manera que los diferentes intervalos tengan frecuen
cias en alguna medida significativas. Cuando existan valores es
casos, muy alejados de lo que podra llamarse una concentracin
central, puede optarse por dejar los intervalos extremos abiertos.
Supngase que, tomando en cuenta las consideraciones anterio
res, se decide clasificar los datos originales en 9 intervalos de
amplitud constante. Dado que la diferencia entre los valores ex
tremos (30 y 120) es de 90, la amplitud de los intervalos ser
igual a 10.
Y -i
'

Y'i

30.0
40.1
50.1
60.1
70.1
80.1
90.1
100.1
110.1

40
50
60
70
80
90
100
110
120

Observaciones

HH
HH
HH
HH
HH
HH
III
HH

II
HH
III
HH

f/ll

ni

7
10
8
11
6
9
3
5
1

60

7 /6 0
1 0 /6 0
8 /6 0
1 1 /6 0
6 /6 0
9 /6 0
3 /6 0
5 /6 0
1 /6 0

Ni

Hi

N -*

H i*

Yi

7
17
25
36
42
51
54
59
60

7 /6 0
1 7 /6 0
2 5 /6 0
3 6 /6 0
4 2 /6 0
5 1 /6 0
5 4 /6 0
5 9 /6 0
6 0 /6 0

60
53
43
35
24
18
9
6
1

6 0 /6 0
5 3 /6 0
4 3 /6 0
3 5 /6 0
2 4 /6 0
18 /6 0
9 /6 0
6 /6 0
1 /6 0

35
45
55
65
75
85
95
105
115

* Acumuladas hacia arriba .

Para evitar situaciones ambiguas, cuando se presentan obser


vaciones con valores de la variable que corresponden a los lmites
de los intervalos, puede seguirse el criterio planteado en el ejem
plo, es decir, agregar un decimal a la columna de lmites infe
riores, aunque esto tenga utilidad solamente para clasificar las

ESTADGRAFOS DE TEN D EN CIA CEN TRA L

33

observaciones, ya que en los clculos que posteriormente se tra


tar, tales decimales son despreciados.
Con lo visto hasta el momento, es posible realizar los primeros
anlisis de un conjunto dado de datos. Tanto la representacin
grfica como la tabulacin de las distintas clases de frecuencias
ayudan a ensayar los primeros juicios. Es necesario insistir sobre
la necesidad de tomar en cuenta, en todas las decisiones respecto
de la tabla de frecuencias, la naturaleza del fenmeno que se
investiga; sobre todo en lo que se refiere al nmero de intervalos
y a sus amplitudes: constantes o variables. Naturalmente que,
una vez clasificados los datos originales, ser preciso realizar an
lisis con mayor profundidad, utilizando los instrumentos estads
ticos que se detallarn en las prximas pginas.

B.

ESTAD GRAFO S DE

TEN D EN CIA CEN TRA L

Una vez conseguida la clasificacin de los datos originales, cuyas


caractersticas ms esenciales se destacan, ser preciso calcular un
conjunto de indicadores que caractericen en forma algo ms pre
cisa la distribucin que se est estudiando. Interesa, en primer
trmino, disponer de estadgrafos que representen valores cen
trales en torno de los cuales se agrupan las observaciones, en ge
neral se los designa como promedios, y son de extraordinaria
utilidad tanto en el anlisis de una distribucin, como en la
comparacin entre distribuciones.
1]

Media aritmtica

Es sin duda el estadgrafo ms utilizado, sobre todo en la cuantificacin de variables econmicas. Se simbolizar por Y o M[Yi],
y se definir como:
m
S y , n,
Y = M[Y] = -----------n
Puede observarse que a cada valor de la variable o marca de
clase se atribuye una importancia o peso equivalente a la fre
cuencia absoluta correspondiente. Esta frmula de clculo es
para datos agrupados en forma de una distribucin de frecuen
cias. Cuando se desea calcular una media aritmtica de datos no
agrupados, todas las frecuencias absolutas sern iguales a la uni
dad, se simbolizar por X o M[Xi] y se definir como

34

ESTA D G RA FO S D E SC R IPT IV O S

E ST TIC O S

2 X,

1*1

X = M [X ,1 = -------------

En general cuando el nmero ae observaciones es relativa


mente grande conviene la agrupacin de frecuencias en interva
los. Es evidente que cuando se resume un conjunto de datosen
un nmero dado de intervalos, se pierde precisin; esta prdida
estar relacionada con la amplitud del intervalo, cuanto mayor
sea sta, menos preciso ser el clculo. Por ello, en general, para
un mismo conjunto de datos, la media aritmtica obtenida de
los datos originales, que es un clculoexacto, diferir de la
obtenida de una tabla de distribucin de frecuencias. La razn
estriba en el supuesto de uniformidad de la distribucin de
frecuencias dentro de cada intervalo, supuesto que generalmente
no se cumple; mas, en todo caso, esa prdida de precisin est
ms que compensada por las ventajas que significa tener una
tabla de frecuencias. Por lo dems en ciencias sociales, la preci
sin necesaria autoriza, dentro de ciertos lmites, a desentenderse
de una rigurosidad extrema.
En la grfica que a continuacin se presenta, se tienen dos
distribuciones de frecuencias (supuesto un gran nmero de in
tervalos pequeos) muy similares, y sin embargo con medias arit
mticas muy distintas.
g r f ic a

La media aritmtica como estadgrafo de tendencia central in


dica la posicin de la distribucin. Sobre este estadgrafo cabe
advertir su alta sensibilidad a valores extremos de la variable.
Un valor muy alejado de los valores centrales, aunque poco re
presentativo por ser nico, puede hacer variar significativamente
el promedio. Por ello, cuando se est utilizando este indicador

ESTA D G RA FO S DE T E N D E N C IA C E N T R A L

35

en un anlisis, vale la pena advertir la representatividad de los


valores extremos y la influencia que stos tienen sobre el resul
tado. Muchas veces se concluye que es preferible estratificar pre
viamente los datos originales en dos o tres categoras, realizando
clculos de medias aritmticas en forma separada para cada grupo.
a)
Propiedades. Se presentarn las propiedades ms importan
tes de la media aritmtica.
i) Primera propiedad: La suma de las desviaciones pondera
das de los valores de la variable respecto de la media arit
mtica es cero
2

i=l

(Y, - ) n, = 0

2 Yj n, - n = 0

n - n = 0
ii) Segunda propiedad: La suma de los cuadrados de las des
viaciones ponderadas de los valores de la variables es un
mnimo, cuando se toman respecto de la media aritm
tica. Se iniciar la demostracin tomando desviaciones res
pecto a un valor cualquiera P, para luego concluir que
P forzosamente tendr que ser la media aritmtica
2

(Yj P)2 ns mnimo

i=l

La derivada de esa expresin respecto de P, se iguala a


cero.
-2 2

1-1

(Y, - P) n, = 0

Y, n, - nP = 0
m

2 Yj n
i=l

P = -----------n

36

ESTA D G RA FO S D E SC R IP T IV O S E ST T IC O S

Es seguro que igualando la primera derivada a cero se


obtiene un mnimo, porque se llega a un valor concreto.
Para que fuera un mximo, P tendra que ser infinito,
iii) Tercera propiedad: La media aritmtica de una variable
ms (menos) una constante es igual a la media de la va
riable ms (menos) la constante.
M [Y, K] = M [Y,] K
m (Yf K) n,
2 ------- = M [Y,] K
m Yi n
nK
2 - ------- = M [Yi] K
n
n
M [Y ] K. = M [Y] K
iv) Cuarta propiedad: La media aritmtica de una variable
multiplicada (dividida) por una constante, es igual a la
constante que multiplica (divide) a la media de la va
riable.
M [Y, K] = K M [Y,]
Y K n,
2 - ------i-i
n

= K M [Y.]

m
n
K 2 = K M [Y,]
-i

K M [Y,] = K M [Y,]

b)
Mtodos abreviados de clculo. Se presentarn estos mto
dos no tanto por el ahorro de tiempo que puede significar su
aplicacin, como porque destacan algunos detalles sobre la me
dia aritmtica, y muestran procedimientos de trabajo con cambio
de variable.
i) Primer mtodo abreviado: Se trata de reducir la magnitud
de la variable, en trminos de desviaciones respecto de un
origen de trabajo Ot arbitrariamente elegido. En cuanto a
la eleccin de Ot vale la pena, para que el mtodo sea
realmente abreviado, tomar como origen de trabajo un

37

ESTADGRAFOS DE TENDENCIA CENTRAL

valor o marca de clase central de la distribucin de fre


cuencias.
Se definir esta variable reducida en la forma siguiente:
Z\ = Y, - O t
Grficamente se fijan los siguientes puntos dentro del
recorrido de una variable:
g r f ic a

yE

ot

S/
>K

V '

ti

Ym

A
Adems, las desviaciones respecto de la media aritmtica
se simbolizarn por Z1( es decir:
Z, = Y,
La diferencia entre la media aritmtica y el origen de
trabajo arbitrariamente elegido se designar por K, es
decir.
K =

Ot

Por este hecho, observando la grfica puede concluirse


que
=

Ot + K

Se trata de encontrar una expresin para K, en funcin


de desviaciones Z', para disponer de una frmula de clcu
lo. En efecto,
Z\ = Zj-f- K (multiplicando por n)
Z\ n = Zt n -f- K n (aplicando sumatoria)
m

m ...

________________ _

2 Zj n 2 Zj iij -|- nK
*1
1=1

38

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

Recurdese que en la primera propiedad de la media


aritmtica se demostr que:

2 Zj n, = 2 (Y, - ) n, = 0
Luego
K

2Z f n

La frmula de clculo abreviado ser


Y = 0, + ^

En la siguiente tabla de distribucin de frecuencias se


aplica este mtodo:

Desviaciones
Marca de clase Frecuencia Desviaciones ponderadas
Yi Yi~ Ot*
Z 'nt
Yt
i

Intervalo
YU -Y',
0- 8
8 -2 0
2 0 -2 6
2 6 -3 0
3 0 -4 0

<

4
14
23
28
35

8
10
30
9
3

-1 9
9
0
5
12

60

*
Se elige O , =

152
-9 0
0
45
36
-1 6 1

23.

161
60

Y = 23 ------------ =

20.32

ii) Segundo mtodo abreviado. Este mtodo en general slo se


aplica con ventaja, cuando es constante la amplitud de los
intervalos. Como en el anterior, se trata de trabajar en tr
minos de desviaciones, pero adems en este mtodo dichas
desviaciones se expresan en unidades de intervalo (divi
dindolas por C).

E S T A D G R A F O S

DE

T E N D E N C IA

39

CEN TRAL

Esta nueva variable es en consecuencia,

de donde
Z\ = CZf
En la frmula del primer mtodo se remplaza Z' y se
tiene
m

2 Z f n,
Y = Ot

C ---------n

Cabe destacar que este mtodo permite obtener Z" en


forma totalmente mecnica; basta fijar el origen de trabajo
para completar todos los valores de Z f'.
En el siguiente ejemplo podr apreciarse las ventajas de
esta forma de clculo.

Intervalo
Y
* ' -i - Y
1 'i
2- 6
6 -1 0
1 0 -1 4
1 4 -1 8
1 8 -2 2
2 2 -2 6

Desviaciones
M arca de clase F recu en cia * D esviaciones ponderadas
Yi
4
8
12
16*
20
24

zr

20
40
50
90
60
40

-3
-2
-1
0
1
2

300

E lig ie n d o O t =

4
-6 0
-8 0
-5 0
0
60
80
-5 0

16.

Aplicando la frmula del segundo mtodo abreviado se


tiene
m

2 Z\' n,
= Ot + C --------n

40

ESTA D G RA FO S D E SC R IPT IV O S E ST T IC O S

Y =

16 -

50
4 ------- = 15.33
300

Obsrvese que una vez fijado el origen de trabajo las


Zf se colocan en sucesin decreciente para las marcas de
clase menores que Ot y en sucesin creciente para las mar
cas de clase mayores.
2] M ediana (Me)
Se trata de otro estadgrafo de tendencia central de aplicacin
muy frecuente. Se define como el valor de la variable que supera
a no ms de la mitad de las observaciones y es superado por
no ms de la mitad de dichas observaciones. Es un estadgrafo
menos sensible que la media aritmtica ante valores extremos
de la variable, y puede ser calculado aun en variables de tipo
ordinal.
Cuando las observaciones no estn agrupadas en forma de una
tabla de distribucin de frecuencias, su cmputo es en extremo
sencillo. Basta disponer los valores en orden creciente y ubicar
el valor central. Por ejemplo, supngase que se tienen ordenados
los siguientes valores de gastos en consumo de 7 familias (en d
lares por mes).
40 -

47 - 60 -

70 -

78 - 80 -

90

La mediana ser 70 dlares ya que este valor supera a 3 ob


servaciones (40, 47 y 60) que no son ms que la mitad (la mitad
es 3.5) y a su vez es superada por 3 observaciones (78,80y 90)
que tampoco son ms de la mitad.
Cuando el nmero de observaciones es par, existen dos valores
centrales que satisfacen la definicin de mediana. Si en el ejem
plo anterior se agrega una familia adicional se tiene:
40 - 47 - 60 -

70 -

78 - 80 -

90 -

180

En este caso tanto 70 como 78 son valores medianos. La mitad


de las observaciones es 4 y 70 supera a 3 que no son ms de la
mitad y es superado por 4 que tampoco es ms de la mitad,
pues es exactamente la mitad. Igual cosa ocurre con 78; para
evitar ambigedades se toma como mediana en
estoscasos el
punto medio entre los dos valores medianos. En el ejemplo, la
mediana definitiva sera 74 dlares. Obsrvese la poca sensibi

41

ESTADGRAFOS DE TENDENCIA CENTRAL

lidad de este estadgrafo a los valores extremos. Al agregar la


8a. observacin con un valor bastante ms alto que el resto,
la mediana ha experimentado apenas un ligero crecimiento; ms
todava aunque en vez de 180 aquel valor hubiese sido de 5 000,
la mediana siempre habra sido 74. En cambio no ocurre lo
mismo para la media aritmtica, que es sumamente sensible a
ese tipo de valores extremos; intente el lector su clculo en uno
y otro ejemplo, y verificar una fuerte variabilidad.
Si los datos se agrupan en una tabla de frecuencias, el clcu
lo de la mediana implica computar previamente las frecuencias
acumuladas.
a) Variable discreta, en. este caso bastar con identificar la fre
cuencia acumulada que es inmediatamente mayor a la mitad
de las observaciones. La mediana ser aquel valor de la
variable que corresponda a dicha frecuencia acumulada.
Ejemplo:
N m ero d e
predios p o r persona
Yt
1
2
3
4
5
6
7 y

ms

N u m e ro de
propietarios
ni

F recu en cia
acum ulada
Ni

200
160
150
100
80
40
20

200
360
510
610
690
730
750

750

Siendo = 375, la menor frecuencia acumulada que supera


este valor es 510, que corresponde al valor 3 de la variable, sien
do ste el valor mediano. Dicho valor supera a 360 observaciones
que no son ms de la mitad y es superado por 260 que tampoco
son ms de la mitad, satisfaciendo la definicin de mediana.
b) Variable continua, en este caso el problema consiste en de
terminar un punto dentro del intervalo en que est com
prendida la mediana. La identificacin del intervalo donde
se halla la mediana, es exactamente igual al caso ele variable
discreta: el intervalo ser aquel que corresponde a la fre-

E STA D G RA FO S D E SC R IP T IV O S E ST TIC O S

42

cuencia acumulada inmediatamente superior a la mitad de


las observaciones. Como se dijo, la preocupacin consiste
en fijar un punto dentro de este intervalo, que corresponde
a la mediana. Para ello se adoptar el supuesto que las ob
servaciones se distribuyen linealmente dentro del mencio
nado intervalo.
Grficamente se tiene:
g r fic a

Sea YjU Yk el intervalo donde se halla la mediana. Luego.


M, = Y k-i + d
Ser necesario encontrar una expresin para d en funcin
de frecuencias que son los valores conocidos que se dispone y por
los cuales est determinado este estadgrafo.
Por semejanza de tringulos se tiene que
AB

AC

1T =

CD

Pero
AB = d
BE = ~ - Nk_!
AC = CK (amplitud del intervalo K-simo)
CD Nk Nk_! = nK

43

E ST A D G R A F O S D E T E N D E N C IA C E N T R A L

Remplazando, se tiene
CK
n
~2

Njc-i

de donde
n
y -
d = C , -------------nK
Luego
Me Yk,!

CK ---------------

Ejemplo: la siguiente tabla muestra la distribucin de los coe


ficientes producto-capital de 310 empresas industriales:

C oeficientes
YV i'
1 i-i - M

Em presas

Frecu en cia s
acum uladas

ATi

0 .1 5 -0 .2 0
0.20 - 0.30
0 .3 0 -0 .4 2
0 .4 2 -0 .5 0
0 .5 0 -0 .7 0

40
80
100
60
30

40
120
220
280
310

310

n
310
= ------

: 155

La menor frecuencia acumulada que supera a 155 es NE


= 220. Luego, nK = 100,
Yk-j = 0.30,

CK = 0.12

120

(donde K = 3)

Remplazando estos valores en la frmula


Me = 0.30

4^

155 120
0.12 -------------- = 0.30 4- 0.042 = 0.342

100

E STA D G RA FO S D E SC R IPT IV O S E STA TIC O S

44

Como una extensin de este estadgrafo, ser fcil ampliar el


concepto a otros indicadores que dividen la masa de informa
ciones en otras proporciones y no slo en mitades como lo hace
la mediana.
Se tiene el caso de los cuartiles que dividen las observaciones
en cuartas partes; as, el primer cuartil Qx es un valor de la va
riable que supera a no ms de un cuarto de las observaciones,
y es superado por no ms de tres cuartos de ellas. Para identificar
el intervalo donde se halla Qj, habr que determinar la frecuen
cia acumulada inmediatamente superior a . El clculo es simi
lar al de la mediana:

( f " NK1)

Q, = Yk-i + CK ------------------nK
Para el tercer cuartil, sucede otro tanto

Qj = Y K -l +

C jC

---------------------nK

Para identificar el intervalo que comprende a Q3, habr que


averiguar cul es la frecuencia acumulada NK, inmediatamente
superior a 3 ; no es necesario detallar el segundo cuartil, por
que coincide con la mediana. En forma similar se pueden en
contrar estadgrafos que dividan al total de observaciones en
dcimas partes (deciles), en centsimas partes (percentiles), etc.
Las frmulas correspondientes pueden deducirse por analoga
con las de los cuartiles.
As, el 79 decil estar dado por
7 11

I ~ Nk_i
D7 Yk_! -f- CK --------------11K
E l 3 5 p e rc e n til e s ta r d a d o p o r

e s t a d g r a f o s

de

t e n d e n c ia

45

cen tral

3] M oda o valor m odal


Se trata de otro estadgrafo de tendencia central. Tiene un
significado bastante preciso y es de extraordinaria utilidad, aun
que inexplicablemente poco utilizado en estudios socioeconmi
cos. Se simbolizar por Md y se definir como aquel valor de la
variable al que corresponde la mxima frecuencia. Es muy co
rriente que se confunda el valor modal con la frecuencia m
xima; recurdese que es un valor de la variable y por lo mismo
se le representa en el eje de las abscisas. Est dado por la fre
cuencia mxima, pero no se trata de una frecuencia.
g r f ic a

a)
Variable discreta, una vez agrupados los datos, es posible
determinar inmediatamente el valor modal; bastar con fijar el
valor de la variable que ms se repite.
Ejemplo:
N m ero de cargas fam iliares

N m ero de familias

Y{

ni

0
1
2
3
4
5
6 o

80
120
210
380
180
60
ms

, 40

1 070

46

E STA D G RA FO S D E SC R IP T IV O S E ST TIC O S

La frecuencia mxima es 380, que corresponde al cuarto valor


de la variable. El valor modal en consecuencia, es 3; este valor
modal ser tanto ms representativo cuanto mayor sea la fre
cuencia mxima. Se presentarn algunos casos donde el valor
modal pierde significacin; es el caso donde hay varios valores
de L s variables que tienen frecuencias similares. Es as como se
califica a las distribuciones de unimodales, bimodales, multimodales, etctera.
b)
Variable continua, de la misma manera que en el clculo
de la mediana, primero es necesario determinar el intervalo
donde se halla comprendido el valor modal; en este caso bastar
ver cul es el intervalo que tiene la frecuencia mxima. El paso
siguiente es determinar un punto dentro de ese intervalo. Exis
ten algunos criterios, un tanto arbitrarios, para deducir frmulas
del valor modal. Uno de esos criterios toma en cuenta la mag
nitud de las frecuencias de los intervalos contiguos (mayor y
menor) al que comprende el valor modal; en otras palabras, di
vidir al intervalo en partes inversamente proporcionales a las
frecuencias de los intervalos contiguos.
Grficamente:
G R FIC A

7
Md
J ______________ I______ I--------- 1------------------ 1
Yk -z

Yk -i

nK - l

Yk

y k

nK

+i

nK+l

La moda estar ms cerca del intervalo contiguo que tenga


mayor frecuencia.
Md Y'k- i
Y 'K- M d

nK+1
^

Despejando Md de la relacin anterior, se tiene:


Md nK_!

YK1 nK_! Yk nK+1 Mtl nK+1


Y* k
' - Y
' -i ~r
4 - CW
yk

Ma [nK_i -f- nK+1] = Yk_1 [nK+1 -|- n ^ ] -|- Ck nK+i


Ma = Y_, +

C*
D

- 1 T

n K+l

ESTA D G RA FO S DE T E N D E N C IA C E N T R A L

47

Es necesario destacar que la deduccin anterior no toma en


cuenta la amplitud de los intervalos contiguos; en caso de am
plitudes muy diferentes, puede distorsionarse el valor de este es
tadgrafo.
Ejemplo;
Ingresos de profesionales

Profesionales

Y'i-i - Y i

0 -2 0
20-

40

25
45

40-

60

80

60-

80

60

80 -1 0 0

40

1 0 0 -1 2 0

15

120 y ms

Inmediatamente se puede adelantar que la moda se encontrar


en el tercer intervalo: 40 60. Aplicando la frmula
Md z= 40 -I

20 (60)
= 40 J
45 -f- 60
_

1 200
= 51.43
105

Si se supone una gran cantidad de intervalos pequeos para


una cierta distribucin, grficamente el valor modal estara as
representado:
g r f ic a

B im odal

Este estadgrafo, al igual que la mediana, puede determinarse


para variables cualitativas, ya que basta con encontrar la fre
cuencia mxima. El siguiente ejemplo ilustra esta posibilidad:

48

ESTA D G RA FO S D E SC R IPT IV O S E ST T IC O S

Color de automviles preferido


por los clientes

Clientes encuestados

Blanco
Azul
Verde
Am arillo
R o jo

18
22
40
25
75

El valor modal, en este caso, es el rojo, ya que por tener


la mxima frecuencia es el preferido por los clientes.
Al iniciar el estudio de este estadgrafo, se deca que inexpli
cablemente era poco utilizado en los anlisis. Es evidente que
requiere, para su cmputo, ms informacin que la media arit
mtica; ello podra explicar en forma parcial su poco uso, pero
aun cuando se dispone de informacin muchas veces se cree sufi
ciente calcular por ejemplo un ingreso por habitante y quedarse
con un anlisis parcial. Sin duda, para caracterizar adecuada
mente una distribucin, se requiere una serie de estadgrafos
cuyas indicaciones se complementen. Por ejemplo, saber que dos
pases tienen ingresos por habitante de 150 y 200 dlares al ao
puede permitir cierto tipo de conqlusiones, pero saber adems
que los valores modales de los ingresos anuales por habitante
son de 140 y 130 dlares respectivamente permite obtener con
clusiones bastante ms objetivas. Naturalmente, son necesarios
muchos otros antecedentes e indicadores, que se presentarn a
continuacin, para realizar anlisis ms completos. Interesa des
tacar la necesidad de buscar un conjunto de indicadores que haga
posible el anlisis de las distintas facetas de un fenmeno some
tido a estudio.
4] M edia geom trica
Este estadgrafo se define como la. raz de orden n del producto
de los n valores de la variable.
Cuando los datos no estn agrupados, su frmula de clculo es

Mg =

x3 . . . x =

______________
X,

n X,
i=l

Para fines prcticos es preferible calcular el logaritmo de la


media geomtrica y luego el antilogaritmo de sta:

E STA D G RA FO S D E T E N D E N C IA C E N T R A L

49

log Mg = E log X (
n 1-1
Si los datos aparecen grupados, es decir, si las marcas de clase
tienen frecuencias superiores a la unidad, se tendr la siguiente
frmula.
Mg = - V

yi

= y

ni
...

n2
nm
Y, Y, . . . Y, Ym . . . Yn

Y ,ni Yn2

Ymnm

Mg = y * Yi
1=1
log Mg = 2 (log Yj) nj
n ,-1
El estadgrafo que se estudia, aparte del inconveniente que
significa el engorro de su clculo, est adems limitado porque
los valores de la variable deben ser positivos para que pueda ser
interpretado. Si algn valor de la variable es cero, la media
geomtrica ser cero; igualmente si aparece algn valor nega
tivo el estadgrafo toma un valor imaginario. Pese a estos incon
venientes, para cierto tipo de variables, en especial las cronol
gicas, que sigan una tendencia exponencial, se hace indispensable
su uso si se desea calcular valores intermedios, es decir, si se
desea interpolar no linealmente. Por ejemplo, si cierta poblacin
en 1940 era de 2.5 millones y en 1960 alcanza a 4 millones, para
calcular la poblacin en 1955 sera indispensable el empleo de
la media geomtrica, si se admite el crecimiento exponencial de la
poblacin a una tasa constante.
P1950 = V ( 2-5)

() = 3.15 millones

P1955 = y/(3.15) (4.0) = 3.55 millones


5] M edia arm nica
El ltimo de los estadgrafos de tendencia central que aqu se
abordar se define como el recproco de la media aritmtica de
los valores recprocos de la variable.

50

ESTA D G RA FO S D E SC R IP T IV O S E ST T IC O S
P a r a d a to s n o a g ru p a d o s :

Mh

n
1

Xi

X,

Para datos agrupados:


n

Mh

ni

Ejemplo: Un grupo de trabajadores construyen los primeros


120 metros de una avenida con una productividad de 12 metros
diarios, en cambio los siguientes 120 metros lo hacen a razn de
18 metros por da. Se trata de determinar la productividad dia
ria durante todo el trabajo.
Si se decidiera calcular la media aritmtica se tendra:
12+18
Y = ----------- = 1 5 metros diarios
Por otra parte los primeros 120 metros requieren 10 das y
los siguientes 120 metros 6.67 das; es decir, todo el trabajo lo
haran en 16.67 das. Si la productividad diaria es de 15 me
tros, en los 16.67 das construiran un total de 250.05 metros,
lo que es inconsistente, ya que el trabajo total es de slo 240
metros. Si en cambio se utiliza la media armnica.
2
M = ------------ =
1 1
12

1----

72
3+2

72
5

= 14.4 metros

18

Trabajando con una productividad media de 14.4 metros por


da, en 16.67 das se construirn 240 metros.
Como pudo advertirse, la media armnica se aplica cuando
se presenta una relacin inversa entre las variables implcitas;
en el caso del ejemplo la relacin inversa aparece entre la pro
ductividad y el tiempo:

51

EVA LU A CI N

e: espacio
p: productividad

e = pxt

p = e

t: tiempo

C.

EVALUACIN

DE

LOS

ESTAD GRAFO S DE TEN D EN CIA

1
t

C EN TRA L

En ms de una oportunidad se insisti sobre la necesidad de dis


poner de un conjunto de indicadores sobre la variable que se
est estudiando. Los indicadores presentados, que en general
se denominan de tendencia central, tienen definiciones precisas;
por ello muestran ; spectos particulares del fenmeno que se es
tudia. Se trata de un conjunto de estadgrafos complementarios;
las conclusiones a que en ltimo trmino den lugar, debern ser
producto de la consideracin simultnea de los valores que al
canzan dichos indicadores.
Al analizar la bondad de cada uno de estos indicadores, es
preciso tener presente el volumen de observaciones tomadas en
cuenta para su clculo y las limitaciones de cada uno de ellos.
Siempre es conveniente complementar el anlisis de las cifras,
con una representacin grfica de la distribucin de frecuencias
de la variable; v interesa destacar la posicin relativa de la media
aritmtica, la mediana y el valor modal. La posicin relativa
de estos estadgrafos depende de la forma de la distribucin; de
esta suerte si la distribucin es simtrica, es decir, si se observa
perfecta simetra respecto de un eje central, los tres estadgrafos
coinciden.
g r f ic a

En el caso de distribuciones no simtricas, la posicin relativa


de los estadgrafos depende del tipo de asimetra. De esta mane
ra, si la asimetra es positiva, es decir, si la distribucin tiene su
rama o manto ms extendido hacia valores positivos de la variable,
la moda ser menor que la media aritmtica. La mediana, por
el hecho de dividir la masa de observaciones en dos partes, que

E STA D G RA FO S D E SC R IP T IV O S E ST T IC O S

52

dar comprendida entre ambas. Si la asimetra es negativa, es


decir, cuando la distribucin se extienda suavemente hacia va
lores negativos de la variable, la moda superar a la media arit
mtica, permaneciendo la mediana, y por la misma razn dada
en el otro caso, comprendida entre ambos indicadores. Grfi
camente
g r f ic a

10

Recurdese que la media aritmtica es un estadgrafo muy sen


sible a valores extremos de la variable, de all que en un caso
sea el mayor de los tres estadgrafos y en otro caso el menor de
ellos. La moda, como el valor de la variable que ms se repite,
tiene en general una clara ubicacin. Habra que agregar que
su valor depende sobremanera de la amplitud de intervalo ele
gida y su representatividad slo se garantiza cuando existe una
clara concentracin de frecuencias en un intervalo dado.

D.

ESTAD GRAFO S D E' D ISPERSIN

Una vez caracterizada la distribucin a travs de estadgrafos de


tendencia central y conociendo el tipo de asimetra, interesa tener
indicaciones acerca del grado de heterogeneidad con que la va
riable se distribuye en un conjunto de observaciones. Dos distri
buciones pueden tener iguales estadgrafos de tendencia central,
sin embargo pueden mostrar grados de dispersin diferentes, como
puede observarse en la grfica que a continuacin se muestra.
g r f ic a

11

53

STA D G RA FO S D E D ISPE R SI N

Evidentemente en la primera distribucin (lnea continua) los


alores aparecen ms concentrados en torno al eje central, en
anto que en la otra aparecen mucho ms dispersos. Si ambas
listribuciones representaran ingresos de dos poblaciones, se conluira que en la primera distribucin los ingresos son ms homoneos, mientras que en la segunda se observara gran disparidad
ntre ingresos altos, medios y bajos.
Parecera innecesario destacar la importancia que tiene contar
on indicadores que pudieran mostrar este tipo de caractersticas
n una distribucin; sobre todo en lo que se refiere a distribuin de ingresos, ahora de tanta actualidad, es indispensable cen
ar con indicaciones adecuadas en este sentido.
] R ecorrido de la variable

litando se aborda el problema de la dispersin, lo primero que


e piensa es el campo de recorrido de la variable; la diferencia
ntre el mayor y menor valor de ella. Si bien brinda una primera
dea acerca de la heterogeneidad, tiene el inconveniente que slo
orna en cuenta los dos valores extremos, descuidando el conjun0 de valores intermedios. Puede suceder que uno de los valores
xtremos est accidentalmente desplazado y no constituya por
anto un valor representativo; en este caso el recorrido sera exa
erado y la dispersin aparecera distorsionada. Para iniciar el
nlisis es conveniente considerar el recorrido, pero en ningn
aso es suficiente.
Para variable discreta

R = Ym Y 0

Para variable continua

R = Y Y

] R ecorrido intercnartilico

lomo una manera de subsanar el inconveniente de los valores


xtremos que presentaba el estadgrafo anterior, se define un
tuevo indicador, que toma en cuenta el recorrido entre el prier y tercer cuartil.
Dq =

Qs Q t

Si bien es cierto que este indicador representa un adelanto


especto del anterior, no lo es menos que siempre toma dos vaores de la variable, dejando de lado el resto, y en consecuencia
1 influencia de valores extremos puede, aunque en menor me

54

ESTA D G RA FO S D E SC R IPT IV O S

E ST T IC O S

dida, originar algn tipo de deformacin en cuanto al grado de


dispersin.
3] Varianza
Se define este estadgrafo en virtud de la propiedad de la media
aritmtica que minimiza la suma de las desviaciones al cuadra
do. Se simbolizar por o2 V[Yi],
a) Para datos no agrupados
2 (X - X )2
2 XI
V[X,1 = o2 = - i - ! ------ =
n
n

X2

b) Para datos agrupados


2 (Y Y)2 n
V[Yj] = o2 =

' L =
n

2 Y i n,
L _ i _ Y2
n

Si bien la varianza no tiene un fin per se sino que se utiliza


en materias que se presentarn posteriormente, da origen a un
estadgrafo que s tiene utilidad e interpretacin prctica. Se
trata de la desviacin tpica o estndar que se define como la
raz cuadrada positiva de la varianza.
o = +y<Mientras ms dispersa sea la variable, may ser la magnitud
de la desviacin tpica puesto que mayores ern los desvos res
pecto de la media aritmtica, sin pos'bilidad de compensacin
de desvos por tratarse de suma de cuadrados. Este estadgrafo se
expresa en las mismas unidades de la variable estudiada, en tan
to que la varianza se expresa en el cuadrado de la unidad de
medida.
Como puede observarse en la frmula, este indicador de dis
persin toma en cuenta todos los valores de la variable con sus
correspondientes frecuencias o pesos relativos, sin embargo, siem
pre es sensible a valores extremos. Por ello es conveniente, antes
de calcular los estadgrafos, hacer un anlisis previo de la tabla de
distribucin de frecuencias, para percibir la representatividad
de valores extremos y sus posibles efectos sobre los valores de los
estadgrafos.

55

E ST A D G R A FO S D E D ISPE RSI N

c)

Propiedades de la varianza

i)

Primera propiedad: La varianza de una variable a la cual


se le suma (resta) una constante, es igual a la varianza
de la variable original.
V[Y,

K] = V[Y,]

Aplicando la definicin de varianza a la variable Y


se tiene:

K.,

2 (Y, K - M[Y, K])2


-------------------------

n,= V[Y]

pero se vio que


M[Y, +

K] =

K +

M[Y]

2 (Y, K - M[YJ K)2


n, =

V[Y]

2 (Yt Y)2 n
V[Y,]
Grficamente, las dos distribuciones tienen la misma va
rianza, pese a estar desplazadas en el eje de las abscisas.
GRFICA

ii)

12

Segunda propiedad: La varianza del producto de una cons


tante por una variable, es igual al cuadrado de la constante
por la varianza de la variable.

56

E STA D G RA FO S D E SC R IP T IV O S E ST T IC O S

V[K Y,] K2 V[Y,]


m
__
2 (K Y K Y)2 n,
-------------------------- = K2 V[Y,]

2 [ K 2 (Yi Y)2] n
--------------------

K2 V[Y,]

K2 2 ( Y i - Y ) 2 !!,
------------------- = K2 V[Yf]
n
K2 V[Y|] = K2 V[Y,]
d)
Com ponentes de la varianza. En el caso que un conjunto
de datos haya sido dividido previamente en grandes categoras
o estratos, es posible desglosar la varianza en dos componentes
muy tiles para el anlisis. Admtase que una masa de datos ha
sido dividida en L estratos; cada estrato tendr una media arit
mtica, una varianza y un nmero de observaciones que expresa
la importancia de cada uno de estos estratos. En este caso la
variabilidad total puede deberse tanto a variabilidad dentro de
cada estrato como a variabilidad entre los diferentes estratos,
i) Intervarianza: Estadgrafo que representa la variabilidad en
tre los estratos; se define como la varianza entre las medias
de los estratos.
2 ( h- ) 2 nh
ol

= V[Y] =

------ ----------

donde
Yh es la media aritmtica del estrato h
Y es la media aritmtica general
nh es el nmero de observaciones o tamao de cada es
trato.

57

ESTA D G RA FO S DE D ISP E R SI N

ii)

Intravarianza: Estadgrafo que representa la variabilidad


dentro de los estratos; se define como el promedio de las
varianzas de los estratos.

2 (T n
2

o*

M[o; ] = ----------- n

donde ab2 es la varianza del estrato h, y nh y n obedecen


a las mismas definiciones del caso anterior.
Dado que los dos estadgrafos estudiados son partes componen
tes de la varianza, a continuacin se presenta la correspondiente
demostracin.
(52 r= Ob

2 2 (Yhi - Y)2

h=l i=l

-f- ( i

2 (Yh - Y)2 nh

h=l

2 oj nu

_]_

h-1

-----

pero

ah =

2 (Yhl Yj,)2
-------- --------- -

remplazando

*=l i=t

L T' \ (Yhi Yh)2 nh


(Yh - Y)2 = 2 (Y - Y)2 n + 2 2 ----------- '----h=l

h=l i=l

Elevando al cuadrado los correspondientes binomios


n
_
2 2 (Ym - 2Y Yhi + Y2) =

L _
__
2 (Y?, - 2Y Y + Y2) nh +

4 n
_
+ 2 2 (Yh - 2Yh Y + Y * )
A p lic a n d o las p ro p ie d a d e s d e la s u m a to ria

58

ESTA D G RA FO S D E SC R IPT IV O S

2 [2

(Y,?, ) - 2Y n Y + nh Y-)] =

n Y- -f- 2

[(Y|, ) - nh Y* ]

2 2 Y,;, n Y2 2 Yg nh - n Y2 + 2 2 Y,?,
b=l

I"1

E ST TIC O S

L
2 Yg n -

h=l

h=l

1=1

2 nu Yg
h -1

Simplificando trminos queda


2

h -l

2 Y, = 2 2

1=1

h=l

t 'l

Yg,

Luego
o2 = of, + r'
Ejemplo: Pinsese en los sueldos y salarios pagados por una
fbrica, que tienen una varianza de 137 600. Si las observaciones
se clasifican por estratos: obreros, empleados administrativos y
tcnicos, ser posible analizar ms a fondo la distribucin de in
gresos.
Las informaciones disponibles seran:
T am a o
estrato

istmios (h)

O b reros
E m p lea d os
T c n ic o s

a dm inistrativos

M edia p o r
estrato

Varianza p o r
estrato

nh

ol

300

400
400

160 000
160 000

500

40 000

100
100

La media aritmtica general ser:

59

ESTADGRAFOS DE DISPERSIN

i*
2 of, nh
-1
Ow = ------------ =

680 000

136 000

2 (Yn Y)2 nh
8 000

a l = ----------------------=

= 1600

El clculo de los anteriores estadgrafos permite concluir que


la variabilidad se debe principalmente a heterogeneidad en las
remuneraciones dentro de los estratos y no as a diferencias en
tre estratos; en otros trminos las remuneraciones promedio de
cada estrato, son bastante homogneas ya que la intervarianza es
pequea, mientras que las remuneraciones dentro de cada estrato
son muy heterogneas puesto que la intravarianza es bastante
grande. (Ver Anexo.)
e) M todos abreviados de clculo.
1) Primer mtodo abreviado. Se trata de encontrar una fr
mula que reduzca el volumen de operaciones; como en el
caso de la media aritmtica, la variable se expresar en
trminos de desvos respecto de un origen de trabajo. Re
curdese que:
2 (Y Y)2 n,

2 Z? n

1=1

1=1

o2 =

ya que
Zi = Y, Y
Si se desarrolla el cuadrado del binomio dentro de la sumato
ria, se tiene:
m

rr*
O
=

pero

2 Yf n 2Y 2 Y 1n , 4 - n Y !
i=i
i=i

_______________________________________

n
m
2 Yi
i=l

nY

60

E STA D G RA FO S D E SC R IP T IV O S E ST T IC O S

luego,
m

2 Y n
i=l
_
------------------ Y2
n

a2

Observando la siguiente grfica, resulta inmediata la deduc


cin de la frmula abreviada:
g r f ic a

13
Z-i

I_______ I,----------
Y 'o

_i

.1---------i
Yi

Y 'm

Z = Z. + K
Elevando al cuadrado
Z f = i:\ + 2K Z, + K2
Ponderando por n
Zf n = Tl\ ni -f- 2K Z ni + K2 n
Aplicando sumatoria
ni

i-l

Z f n, =

1-1

n+ 2K2 Zi ni

t\

i-1

Pero la primerapropiedad de lamedia aritmtica


m

Zi ni 0

luego
m

2 Z f n = 2 Zf- n, 4- n Ki=i

pero
m

2 Z r H| = n a2
i~l

n K2
deca:

61

ESTA D G RA FO S DE D ISP E R SI N
m

nK = 2 Zf ni (en el clculo abreviado de la media arit


mtica).
Luego

2 Zf n,
o =
ii)

Segundo mtodo abreviado. Consiste, como se recordar, en


expresar las desviaciones en trminos de unidades de inter
valo (dividiendo por la amplitud del intervalo).

Y .-Q t

= zr

es decir que Zf = c Z'f y remplazando en la frmula anterior


se obtiene:
i2

i-l

zr n

(szrJ)
v

En el siguiente ejemplo se podr comprobar el ahorro de tiem


po que significa la aplicacin de estas frmulas.
En el caso del primer mtodo abreviado:
Im puestos p o r
contrib uy en te
Y'x -i
0
20
40
60
80

N m e ro d e contribuyentes

y'i

Yi

20
40
60
80
100

10
50
50*
70

20
15
10
8
5

90

58

O, -

50.

A
-4 0
-2 0
0
20
40

A 2 i
-8 0 0
-3 0 0
0
160
200

32 000
6 000
0
3 200
8000

740

49 200

62

ESTADGRAFOS DESCRIPTIVOS ESTATICOS

Remplazando estos valores en la frmula, seobtiene:


49 200

/ 740

<r = -------------( -------------) = 848.3 - 162.8


58
\ 58 )

= 685.5

En el caso del segundo mtodo abreviado se tiene:


Y'--i
0
20
40
60
80

Y'i

Yt

zr

Zf ,

20
40
60
80
100

10
30
50*
70
90

20
15
10
8
5

-2
-1
0
1
2

-4 0
-1 5
0
8
10

80
15
0
8
20

-3 7

123

58

* o t =

Z f 2 i

50.

Aplicando la frmula respectiva:


a2 = 20-

( ^ y } = 400 {2.12 - 0.407} = 685.5

4] C oeficiente de variabilidad
Tanto la varianza como la desviacin tpica tienen el inconve
niente de los estadgrafos absolutos, ya que en el caso de indi
caciones sobre dispersin, tiene mucha importancia no tomar en
cuenta la posicin de la distribucin. Estos estadgrafos, sobre
todo al comparar distribuciones, pueden deformar las conclu
siones.
Obsrvense las dos distribuciones que aparecen a continuacin.
g r f ic a

14

63

ESTA D G RA FO S D E D ISPERSIO N

Ambas distribuciones muestran la misma dispersin en torno


a la media, es decir, tienen igual varianza y desviacin tpica;
sin embargo, en trminos relativos, una distribucin donde el
menor ingreso es 1 000 y el mayor es 1 100, es muclio ms homo
gnea que otra distribucin donde el menor ingreso es 100 y el
mayor 200. En un caso la diferencia entre el mayor y menor in
greso es 10%, mientras que en el otro es de 100%.
Surge, por consiguiente, la necesidad de disponer de un esta
dgrafo que tome en cuenta la tendencia central de la distri
bucin. Se define as el coeficiente de variabilidad, como la razn
entre la desviacin tpica y la media aritmtica.

Y
En el ejemplo anterior, si ambas distribuciones tuvieran, por
ejemplo, una desviacin tpica de 60, los coeficientes de varia
bilidad seran:
CVt = J L =
= 0.4 = 40%
1
150
CV2 =

o2
------ =
,,

60

= 0.057 = 5.7%

1050

Estos estadgrafos permiten llegar a conclusiones ms realistas


y ciertas.
El coeficiente de variabilidad, o desviacin tpica relativa como
tambin se le llama, puede tomar valores tan grandes como se
quiera, ya que no hay una relacin de dependencia limitante
entre a y Y. Por otra parte, en el caso de una distribucin
donde la media aritmtica fuera negativa no tiene sentido con
siderar el signo para calificar la dispersin. Por ello este esta
dgrafo podra definirse como el valor absoluto del cociente entre
la desviacin tpica y la media aritmtica.
Puesto que las propiedades de la media aritmtica y la desvia
cin tpica ya fueron analizadas, las propiedades del coeficiente
de variabilidad sern el resultado de las propiedades de los indi
cadores componentes.
Si bien es cierto que para calificar la dispersin de una distri

64

ESTA D G RA FO S D E SC R IPT IV O S E ST T IC O S

bucin es ms apropiado el coeficiente de variabilidad, de esto


no debe deducirse que la varianza y la desviacin tpica carecen
de utlidad; por el contrario, son muy tiles en el tratamiento de
materias que se estudiarn posteriormente.

E.

UTILIZA CI N

DE INDICADORES DE LA PRO GRAM ACIN

Con mucha frecuencia se escuchan quejas respecto de la escasez


de informaciones estadsticas bsicas para los pases en vas de des
arrollo. Admitida la deficiencia, es conveniente tambin recono
cer que no siempre se hace un uso ptimo de la escasa infor
macin disponible. Si se reconoce como etapa primaria durante
un proceso de planificacin la posibilidad de realizar diagns
ticos, ser necesario destacar la enorme utilidad de la estads
tica descriptiva en lo que se refiere a caracterizacin de fen
menos en un momento dado. Por una parte, el diagnstico
requiere disponer de una perspectiva histrica sobre las varia
bles estratgicas; por otra, esa misma perspectiva histrica debe
complementarse con anlisis cuantitativos en profundidad du
rante perodos que presenten cambios de orientacin y/o ritmo
en las tendencias observadas, aparte de una cuantificacin deta
llada para el momento cero de un plan. Es para esos puntos
para lo que el instrumental de estadstica descriptiva debe ser
puesto a disposicin del analista. Se ha insistido sobre la urgente
necesidad de contar con un juego de indicadores para las prin
cipales variables; cada indicador mostrar una faceta de la varia
ble estudiada, y un conjunto de ellos permitir una adecuada
e integral calificacin de las variables que interesan para el
diagnstico.
En general, un conjunto de indicadores permite realizar an
lisis de consistencia; de ese modo puede llegarse a una primera
evaluacin acerca de la calidad y fidelidad de la informacin
que se pretende utilizar.

TEMAS DE DISCUSIN
ludique si las siguientes afirmaciones son verdaderas o falsas y justifi
que su opinin.
1] En toda distribucin con media nula el percentil 38 es igual, en
valor absoluto al percentil 62.

65

TEM A S DE DISCUSIN
2]

L as sigu ientes frm u la s d a n


la m e d ia aritm tica.
n

resultados

exa cta m en te

igu ales para

2 X,

2 Y n.

3] L a m e d ia a rm n ica d e u n a con sta n te es igu a l al r e c ip r o c o d e la


con stante.
4] L o s sigu ientes d a tos son consistentes.
h2 =

0.4

hj =

0.2

n4 =

H3 =

Y =

0.8

25

Mu =

50

30

5] Para q u e la in ten rrianza fuese igu a l a la varianza, las m edias


d e lo s estratos d e b e ra n ser iguales.
6] E n u n a d is trib u ci n asim trica, el v a lo r d e la m ed ia n a co in c id e
c o n e l d e l se g u n d o cu artil.
7] E n u n a d is trib u c i n n o rm a l tip ifica d a e l sexto p e r ce n til es igu al
a - 0 .1 5 .
8] L o s sigu ientes d a to s son consistentes:

el =

780

150

CV =

10]

20%

L o s sigu ientes d atos son consistentes:


m =
H2 =

6
0.6

hj = 0.2
H3 +

H4 =

lt4 = 0.2
1.9

11] E l n m e ro d e in terva los e n q u e se cla sifica u n a m asa d e datos,


d e p e n d e d e la ca n tid a d d e stos.
12] L a m o d a es u n m e jo r in d ic a d o r q u e la m e d ia a ritm tica, p o r q u e
es p o c o sensible a va lores extrem os.

66

ESTA D G RA FO S D E SC R IP T IV O S E ST TIC O S

13] En u n a d is trib u ci n n orm a l, d o n d e la m ed ia n a es 8 y la m ed ia


cu a dr tica 10, el c o e ficie n te d e va ria b ilid a d ser in fe r io r al 5 0 % .
14] L o s sigu ientes d atos son consistentes:
Mg =

M =

-1 0

15] L a m e d ia n a d e u n a d istrib u cin es 50. Si se m u ltip lica n los va


lores d e la va ria b le p o r 1.6, e l v a lo r d e la m e d ia n a ser 80.
16] L o s sigu ientes d atos son consistentes para u n a p o b la c i n d iv id id a
en d o s estratos d e igu a l tam ao.

a2 =

81

Y1 = 10

2 = 10

O =

o2 10

(varianza para tod a la p o b la c i n )

17] Si las edad es d e los alu m n os sigu en u n a d is trib u c i n n o rm a l c o n


m ed ia 28 y d esvia cin tp ica 2, la p r o p o r c i n d e a lu m n os m e
n ores a 23 a os es d e l o rd e n d e 10 p o r cie n to .
18] En e l sector servicios e l su eld o p r o m e d io es d e 200 u. m. Si los
varon es con stitu y en e l 70 p o r c ie n to d e la p o b la c i n rem u n era
da, es fa c tib le q u e su in greso p r o m e d io m en su a l sea d e 300 u. m .
19] D a d a u n a p o b la c i n c o n u n a cierta varianza, la m a g n itu d d e la
in tervarian za y d e la intravarianza d e p e n d e d e l crite rio d e estra
tifica ci n .
20] E l v a lo r m o d a l est c o n d ic io n a d o p o r e l n m e ro d e in terva los en
q u e se ta b u le u n a masa d e datos.
21] L o s sigu ientes d a tos son consistentes en u n a d is trib u c i n sim trica.
R e c o r r id o in tercu a rtlico:
P ercen til N 80:
M e d ia a ritm tica:
22] L a
dos
b le
23] L o s

80
200
160

m e d ia ge o m trica d e los valores de u n a v a ria b le m u ltip lica


p o r u n a con sta n te, es igu a l a la m ed ia g eom trica d e la varia
o rig in a l.
sigu ientes d atos son consistentes:

m =

h5 =

1=1
0.1

Y z n =

H3 =

0.5

400

Y =

n4 =

24] E l v a lo r m o d a l ca rece d e a d ecu a d a rep resen ta tivid ad , cu a n d o las


frecu en cia s d e los in terva los co n tig u o s al q u e c o n tie n e a este es
ta d gra fo, rep resen tan fra ccion es p eq u e a s d e l tota l d e ob serva
cion es.

P R O B L E M A S P R O P U E ST O S

67

25] Si la varianza de los ingresos de los obreros de una industria es


400, y la intravarianza y la intervarianza son iguales, estos com po
nentes no alteran su particip acin relativa dentro de la varianza
total si se reajusta a todos los obreros en un 20% .
26] L a desviacin tpica de las utilidades reinvertidas de las sociedades
annimas de cierto pas, es de 2 5 0 0 0 unidades m onetarias. Si sola
m ente se consideran las sociedades annim as industriales, su des
viacin tpica no podr exceder de 25 000 unidades m onetarias.
27] Al com p arar las regiones A y B, se tiene que las desviaciones t
picas de los ingresos familiares son de 600 y 450 unidades m one
tarias respectivam ente. Se puede concluir - en consecuencia, que en
la regin B el ingreso est ms uniform em ente distribuido.

PRO BLEM A S PR O PU ESTO S


1] E labore una distribucin de frecuencias de 7 intervalos, de modo
que el coeficiente de variabilidad sea de 8 0 % .
2] E l sector asalariado de u n a regin ha sido dividido en dos estra
tos; obreros y empleados. Se tratab a de analizar los efectos de
una poltica de redistribucin de ingresos. Los datos disponibles,
antes y despus de ap licar tal poltica, fueron los siguientes:

Antes

Despus

Coeficiente de variabilidad general

60%

50%

15

30

(obreros)

Y (empleados)
P roporcin de obreros

0.6
150
225

Ob

Se le pide enum erar


redistribucin tan to a
tifique sus opiniones,
rezcan pertinentes.
3] C om pare el grado de
ros de la construccin

qu conclusiones le m erece la poltica de


nivel general com o a nivel de estrato. Ju s
deduciendo aquellos estadgrafos que le pa
heterogeneidad en los salarios de los obre
en dos pases.

Venezuela

a =

0.6
24
144

650 bolvares

Salario prom edio an ual: 1000


dlares
T ip o de cam bio: 5 bolvares
p or dlar

A rgen tin a
cr =

50 000 pesos

Salario prom edio an ual: 780


dlares
T ip o de cam bio: 350 pesos
por dlar

68

ESTA D G R A FO S D E SC R IP T IV O S E ST A T IC O S

Qu podra con clu ir en cu an to a Ja distribucin de ingresos en


ambos pases?
4] E n cierta com unidad el impuesto total recaudado a 100 000 con
tribuyentes d uran te el ao 1966 fue de 13 millones de unidades
m onetarias. E l coeficiente de variabilidad de los tributos indivi
duales es de 120% , se sabe que hay 60 0 00 contribuyentes obreros
que cancelaron en con jun to 3 millones de unidades m onetarias.
Calcule la intravarianza de esa poblacin estratificada en obreros
y no obreros, y com ente brevem ente la hom ogeneidad de la dis
tribucin de los tributos.
5] E l sector agrcola de un pas se divide en dos estratos: cultivos
intensivos y cultivos extensivos; respecto de los ingresos de los
trabajadores del sector, se tienen los siguientes indicadores:
Y =

100 u. m .

CV =

50%

400

Se decide reaju star los ingresos de los trabajadores en 2 0 % y


darles adems una bonificacin de 30 u. m . a cada u n o de ellos.
A nalice qu cam bios en la distribucin del ingreso provoca el
reajuste.

E JE R C IC IO S
1] L a inversin real anual de un grupo de industrias pesqueras se
d etalla a con tinu acin:

Miles de dlares
10 12 8 16 20 - 25 1 3 - 1 7 - 2 1 0 14 6 12 65-

40
28
7
8
5

6 - 8 10 30 - 26 - 30 6 8 - 1 4 9 11 - 13 6 8 7 -

30 28 - 6 4 6 - 10 - 18 7 - 1 5 - 1 9 - 2 7 - 2
15 - 18 - 2 0 - 3 0 12 - 15 - 36 - 39 -

14
17
2
60
52

Se pide:

a) Fo rm e una tabla de distribucin de frecuencias, con ocho in


tervalos de am plitud constante;

b) C alcule las frecuencias relativas;


c) Calcule las frecuencias absolutas y relativas acum uladas;

d)
e)

R ep resen te grficam ente la distribucin de frecuencias (histo


gram a y polgono de frecuencias) ;
C alcule los siguientes estadgrafos:
i) M edia aritm tica (datos originales y mtodos abreviados) ;
ii) M ediana;
iii) M oda;
iv) M edia arm nica.

69

E J E R C IC IO S
2]

L as d istrib u cio n e s d e in greso d e d o s pases son las siguientes:

Pas A

Pais B

Ingresos anuales
por
h a b .: dlares

Poblacin
rem un erad a

80 - 1 0 0
1 0 0 -1 2 0
1 2 0 -1 4 0
140 - 1 6 0
160 - 200
200 - 220

30 000
80 000
40 000
10 000
4 000
1000

Ingresos anuales
por
h a b .: dlares

P oblacin
rem u n era d a

60 90
9 0 -1 2 0
120 - 150
1 5 0 -1 8 0
1 8 0 -2 1 0
210 - 240
240 - 270

10 000
20000
50 000
20 000
15 000
10 000
4000

a) F u n d a m en te, e m p le a n d o

3]

4]

5]
0]

7]

e l c lc u lo d e estadgrafos q u e crea
co n v e n ie n te , e l g ra d o d e d e s a rro llo co m p a r a d o d e a m b os pases.
N ecesita adem s o tro s an teced en tes pa ra ca lifica r a estos p a
ses c o n m a y o r rigor?
b) C a lcu le e l in greso p r o m e d io d e l 3 0 % d e la p o b la c i n d e m a
yores in gresos e n ca d a pas. C o m p a re los resultados y discu ta
sus con clu sio n e s. R e a lice e l m ism o c lc u lo pa ra e l 4 0 % d e la
p o b la c i n d e m e n o re s ingresos.
c) C u l es el in greso p r o m e d io d e los d os pases en c o n ju n t o ?
d ) S u p o n ie n d o q u e e l pas B d ev al a su m o n e d a e n 3 0 % y e l
p as A e n 5 % , ca lcu le los n u ev os in gresos p r o m e d io en a m b os
pases.
E l in greso p o r h a b ita n te d e u n pas es d e 310 d la res al a o ;
su se cto r o b re ro , q u e co n stitu ye e l 59 p o r c ie n to d e la p o b la c i n ,
p e r cib e 1 /5 d e l in greso tota l. C a lcu le e l in greso p o r h a b ita n te
d e este sector.
U n a u tom ov ilista se d irig e d e S an tiago a T a lc a , ciu d a d es q u e dis
tan 300 k m en tre s; lo s p rim eros 200 k m los re co rre a u n a v e lo
c id a d d e 120 k m /h o r a y e l resto a 80 k m /h o r a . U tiliz a n d o u n
esta d gra fo d e ten d en cia cen tra l, ca lcu le la v e lo c id a d m ed ia .
L a m e d ia aritm tica en tre d os n m eros es 8 y su m e d ia g e o m
trica 2. C a lcu le la m e d ia a rm n ica .
Si la p o b la c i n d e u n pas es a l 31 d e d ic ie m b re d e 1950 d e
5 800 000 personas, y al 31 d e d ic ie m b re d e 1960 d e 7 200 000,
ca lcu le la p o b la c i n e n 1955.
Si se tien e u n a d is trib u ci n d e frecu en cia s sim trica, c o n 6 in
tervalos d e a m p litu d con sta n te, y los sigu ientes datos:
n =
n :i =

150
30

ca lcu le el 69 d e cil

Y' =
Q, =

60
43.5

n, =

n4 - f

70

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

8] L a siguiente tabla de distribucin de frecuencias representa


impuestos personales de un con jun to de profesionales.

Impuestos (u. m.)


YU
Y<
0
20
40
60
80
100

los

Profesionales
n , (miles)

20
40
60
80
100
120

30
25
15
13
12
5

Se le pide que:
a) C alcule la varianza p o r los tres m todos que conoce.
b) C alcule el coeficiente de variabilidad.
c) Si se cobra un impuesto adicional de 5 u. m . p or persona,
cul es la desviacin tpica?
d) Si se reajustan los impuestos p or persona en 2 0 % , cul es la
varianza?
9] E l C. V. de los ingresos de 200 em pleados de u n a com paa es
57 p or ciento. Despus de reajustar, segn ley, todos los sueldos en
E 11, este C. V. es ahora de 50 p o r ciento. Sin em bargo, la
gerencia fija un sueldo m nim o de E 71. Antes del reajuste,
haba 35 personas que tenan un sueldo m edio de E 4 0 y todos
ellos ganaban menos de E 60; con la nueva poltica de la ge
rencia, sus sueldos sern elevados a E 71. D eterm ine la cantidad
de dinero que necesitar mensualm ente la com paa, p ara pagar
los sueldos despus de h acer efectivos los reajustes.
10] E n una distribucin de frecuencias se m ultiplican los valores de
variable p or 3, y se obtiene una media aritm tica de 54; si se
suma 5 a los valores de la variable, se obtiene una media cua
drtica de 24. Calcule el coeficiente de variabilidad de la dis
tribucin.
11] Se clasific a los trabajadores de un m ineral en dos categoras:
mayores y menores de 25 aos, y se extrajo la siguiente infor
m acin:

Nmero de
obreros
**h
Mayores de 25 aos
M enores de 25 aos

200
300

Productivi Desviacin
dad media
tpica
Yh
O
40
60

Calcule la varianza de todos los obreros del m ineral.

70
40

71

SO LU CI N DE E JE R C IC IO S

12] L a media aritm tica y la desviacin tpica de los porcentajes de


reinversin de utilidades de las empresas constructoras son de 4 0 %
y 2 0 % respectivam ente. Si se supone que esta variable sigue ap ro
xim adam ente una distribucin n orm al,* se le pide que
a) Calcule cul es el porcentaje de empresas que reinvierten ms
del 7 0 % ;
b) Calcule el porcentaje de empresas que reinvierten entre 20 y
50% ;
c) Calcule cul es la proporcin de empresas que reinvierten cuan
do m ucho 8 5% de sus utilidades.
18] Se sabe que los consumos fam iliares en bienes esenciales, estn
relacionados con los consumos fam iliares de energa elctrica me
diante la funcin:
C. Es. =

4.5 C. E n . - 5

Si la media aritm tica y la desviacin tpica de los consumos de


energa se estim an en E 40 y E 1 5 respectivam ente, calcule el
coeficiente de variabilidad de los consumos esenciales.

S O LU C I N D E E JE R C IC IO S
1] Dado que el m enor valor es 0, el m xim o 60, y se especifican 8
intervalos de am plitud constante, se clasifican los datos en la si
guiente form a; quedan as resueltas las partes a, b y c.
y
1 /t-j _ y<
1
0 - 8
8.1 - 16
1 6 .1 -2 4
2 4 .1 -8 2
3 2 .1 -4 0
40.1 - 4 8
48.1 - 5 6
56.1 - 64

nl
21
17
9
8
3
0
1
1
60

*1

H.t \

2 1 /6 0
1 7 /6 0
9 /6 0
8 /6 0
3 /6 0
0
1 /6 0
1 /6 0

2 1 /6 0
3 8 /6 0
4 7 /6 0
5 5 /6 0
5 8 /6 0
5 8 /6 0
5 9 /6 0
6 0 /6 0

infra

21
38
47
55
58
58
59
60

6 0 /6 0
3 9 /6 0
2 2 /6 0
1 3 /6 0
5 /6 0
2 /6 0
2 /6 0
1 /6 0

Ar, t
60
39
22
13
5
2
2
1

Obsrvese que la am plitud


superior a la del resto.
* Vase

H t

del prim er intervalo, es ligeramente

el anexo sobre distribucin normal.

72

ESTA D G RA FO S D E SC R IP T IV O S E ST T IC O S

d) L a representacin grfica sera la siguiente:


GRFICA

15

Ni
20
15

10

16

24

32

40

56

48

64

e) Los valores de los estadgrafos serian los siguientes:


i) Media aritmtica; existen varias alternativas
datos originales

X =

2 X,
i=i

967
60

16.12

Marcas de clase
,? lY n
Y
n

912
J 2 V , h,

Yi
4

2 1 /6 0
1 7 /6 0
9 /6 0
8 /6 0
3 /6 0
0
1 /6 0
1 /6 0

12
20
28
36
44
52
60

152

60

Y ih {
8 4 /6 0
2 0 4 /6 0
1 8 0 /6 0
2 2 4 /6 0
1 0 8 /6 0
0
5 2 /6 0
6 0 /6 0
9 1 2 /6 0

M to d o s a breviados
H a c ie n d o O t =

20

73

SOLUCIN DE E JE R C IC IO S

Yi

4
12
20
28
36
44
52
60

21
17
9
8
3
0
1
1

-1 6
-8
0
8
16
24
32
40

60

Z\ n,

2?

zr ,

-336
-136
0
64
48
0
32
40

-2
-1
0
1
2
3
4
5

-4 2
-17
0
8
6
0
4
5

-288

-3 6

Por el primer mtodo abreviado


s z ; n.
/ 288 \
Y = Ot -]------- -- - = 20 - f [ ----- } = 20 - 4.8 =
n
\ 60 /

15.2

Por el segundo mtodo abreviado


Y = Ot - f c
ii)

2 Z ? n,
/ -3 6 \
---- == 20 -f- 8 [ --------) = 20 - 4.8 =
n
\ 60 /

15.2

Mediana:
n
Nk-1

YU

Me =
n
60
= =

+ Ck -------------

30. La menor frecuencia acumulada que su-

pera este valor es N2 = 38; luego en el segundo intervalo


estar comprendida la mediana. (Vase tabla 1.1.)
30-21
72
M. = 8 + 8 ------------ = 8-1--------17
17
iii)

12.23

Moda: Puesto que la frecuencia mxima corresponde al pri


mer intervalo, se presenta un caso particular.
M =

YU +

CL H].,.
- - tal -

n k-i + n k+i

8 17

17

Ntese que este estadgrafo adquiere el valor del lmite


superior del primer intervalo, porque no existe intervalo
inferior.

74

ESTA D G RA FO S D E SC R IP T IV O S E ST T IC O S
.iv) M edia arm nica
4.00

12.00

21.00
5.25

17.00

9.00

1.41

0.45

Y,
i
n ./Y

20.00

28.00

36.00

44.00

52.00

8.00

3.00

1.00

0.08

0.00
0.00

1.00

0.28

0.02

0.01

60
8

Ma

2] a) U n p r im e r in d ic a d o r es e l in greso p r o m e d io
exp resa e n

m iles

Y<

Yi

- y 'i

(la

p o b la c i n

Pais B
i

Y i i

Y'.
1 -i -- y 'i

yi

i %

2?

10 - 2
-1

-2 0

8 0 - - 100

90

30

2 700

6 0 --

90

75

1 0 0 -- 120

110

80

8 800

9 0 - - 120

105

20

1 2 0 -- 140

130

40

5 200

1 2 0 --1 5 0

135

50

1 4 0 -- 1 6 0

150

10

1 500

1 5 0 -- 1 8 0

165

20

20

1 6 0 -- 2 0 0

180

720

1 8 0 -- 2 1 0

195

15

30

2 0 0 --2 2 0

210

210

2 1 0 --2 4 0

225

10

30

2 4 0 --2 7 0

255

16

165

Ot

129

19 130

2 Y, n
YA ~

se

d e p erson a s).

Pais A
1 *-i

60.00

n
SZ'f n,

56

19 130

C -------------- -

-2 0

115.94

165

135

4-

56
30

148.02

129

U n p rim e r in d ic io q u e el pas B ten dra m a y or


arro llo , est d a d o p o r el m a y or v a lo r d e su in greso

g ra d o d e des
p o r h ab ita n te;

sin e m b a rg o , es n ecesario ca lcu la r otro s estad grafos y c o n o c e r o tr o


tip o de in fo rm a cion es, para ca lifica r a p ro x im a d a m e n te am bas situa
cion es.
El c lc u lo d e los valores m od a les ya in dica q u e la d ife re n cia en tre
a m b os pases, n o pa rece tan im p orta n te c o m o lo in d ica ra n los in
gresos p ro m e d io s.

75

SO LU CI N DE E JE R C IC IO S

M- = Y'k_t +
A

M dB =

C k nk+1

20-40

- -

100 + =

k-! + nk+i

135 co rre s p o n d e r

con

70

la

m arca

de

clase

111.4
que

tien e

la

fre cu e n cia m xim a , p u e sto q u e los in terva los co n tig u o s tien en igu al
frecu en cia . N o se p u e d e p r e te n d e r resu m ir u n a situ a cin tan c o m
p le ja en u n p a r d e estadgrafos, pu es ca d a in d ic a d o r con stitu ye u n
anlisis pa rcial d e a q u e llo q u e es suscep tible d e cu a n tifica ci n .
b ) Se trata d e a cu m u la r las frecu en cia s h acia arriba, hasta c o m p le
tar el 3 0 % d e n. C o m o las frecu en cia s n o c o in c id e n p erfecta m en te
c o n esta cifra , se h ace n ecesario d iv id ir e l in terv a lo d e m anera
q u e la fre cu e n cia a cu m u lad a N f
sea e l 3 0 % d e n.
Pas A
n == 165
0.30 n = 49.5
L a fre cu e n cia a bsolu ta d eb er ser 34.5 para satisfacer las c o n d i
cio n e s d e l p r o b le m a ; 34.5 represen ta el 8 6 .2 5 % d e 40 y en esta
p r o p o r c i n se d iv id e e l in terva lo, q u e d a n d o

Y<
1 -i - 1Y '

y i nv

122.75 - 140
1 4 0 .0 0 - 160
1 6 0 .0 0 - 2 0 0
200.00 - 220

34.5
10.0
4.0
1.0

131.38
150.00
180.00
210.00

4 532
1 500
720
210

49.5

Ya
Pas

6 962

6 962
=

140.6

49.5

S igu ie n d o el m ism o p roceso se llega a la siguiente

tabla.

Y'.
1 i-1 Y'1i

n,

yi

Yi ;

1 6 5 .5 - 1 8 0
1 8 0 .0 - 2 1 0
2 1 0 .0 -2 4 0
240.0 - 270

9.7
15.0
10.0
4.0

172.7
195.0
225.0
255.0

1 675.2
2 925.0
2 250.0
1 020.0

38.7

7 870.2

76

ESTA D G RA FO S D E SC R IP T IV O S E ST T IC O S

7 870.2

Para el 4 0 % d e la poblacin de ingresos m enores, el procedi


m iento es similar, se llega a las siguientes tablas estimadas.
Pas A

YU -Y'i
8 0 -1 0 0
1 0 0 -1 0 9

ni

Yi

30
36

90.0
104.5

66

2 700
3 762
6462

6462
=

97.9

Pais S
p
* *. -i _ *Y<t
6 0 - 90
9 0 -1 2 0
1 2 0 -1 3 3

Yi

Yii

10.0
20.0
21.6

75.0
105.0
126.5

750.0
2 100.0
2 732.4

51.6

5 582.4

5 582.4

tr*onju
n to)
, \
c)i vY (C

nA ^ A + nB
---------------------------=
nA~hnn
_

(165) (115.9) - f (129) (148.0) _

294

d)

L a devaluacin im plica una tasa de cam bio ms alta, en moneda


pas p or dlar. Luego, para el pas A:

dd

77

S O L U C IO N D E E J E R C IC IO S
Para e l p a s B

M T Y - 1
L 1.05

=
1.05

8]

- M [Y ,] ==
L
1.05

148.02 =

141.0

Se sabe q u e
In g re so total
=

In g reso p o r h ab ita n te

P o b la ci n
Y
_

310

Para el sector o b r e r o , e l in greso p o r h a b ita n te ser

(o b r e r o )

pero

1 /5 Y
------------0.59 P

= 310 P,

(o b r e r o )

lu e g o

1 /5 ( 3 1 0 . P )
------------- =
0.59 P

62
=

105.08

0.59

4] E l esta d gra fo in d ic a d o es la m ed ia a rm n ica


n

300

Mu =

720

=
n,

=
200

100

103

T 20"*"8 T
5] Sean x e y lo s n m eros:

x+ y
- = 8
2

Vr y = 2
2

Mh

1
x

_j_ 1
y

x+ y
xy

2xy

x+ y

xy

x+y
2

78
6]

ESTADGRAFOS DESCRIPTIVOS ESTATICOS


Si se supone un crecimiento exponencia] a una tasa constante,
es factible aplicar la media geomtrica, que dar la poblacin a
mitad del perodo.
Mg =

7]

y 5 .8

. 7.2 =

-y/41.76 =

6.459

Los datos disponibles, pueden disponerse as en una tabla de fre


cuencias.
Y<
1t - i

Y 'i

Y'

Y',

"l

Y'

tij

Y'
1 2
Y'
1 3
Y'<

V'2
Y
Y'4
60

60

y;

E s ta d g r a fo s

N,
N2
75
N
n5

30
30
n6 + 5
n

Q j = 43.5

150

150

Recurdese que la distribucin es simtrica y, por lo tanto,


n i

n 6 ;; n 2 =

n5

n3 =

n4 =

30

Se sabe que

1 +
ni

n2 - f n3 =
! +

nt =

20

n2 =

25

5 +

75

30 = 75

luego

Se trata de encontrar el valor de la amplitud del intervalo Ck.


Para ello
n

Nk-1

Qi =

Y'

4
Ck --------------nk

Para determinar en qu intervalo se halla Qj, debe verse cul


n
es la menor frecuencia acumulada que supera a = 37.5. Se
comprueba que es N 2 =
intervalo:

45; luego Q t estar dentro del segundo

79

SOLUCIN DE E JE R C IC IO S
37.5

- 20

Qi = Y 4- Ck -----------1

Pero

25

4 Ck

Y' = Y' +

60

Luego
Y

60 -

4 Ck

y remplazando en la frmula de Qx, se tiene:


43.5

60 -

17.5
4 Ck 4 - Ck ----- =
25
3.3 Ck =

60 -

60 -

43.5 =

4 Ck - f 0.7 Ck

16.5

16.5

L a distribucin quedar asi;

YU

Y<

Ni

35
40
45
50
55
60

40
45
50
55
60
65

20

20

25
30
30
25

45
75
105
130
150

20

Una vez completada la tabla, se calcula inmediatamente el 6 ? decil.


6n

D6 = Y U

10

N*.,

+ Ck ---------------nk

Para determinar k, ser necesario calcular la menor frecuencia


6n
acumulada que supere a = 90. Se comprueba que es N4.

D =

Y4 +

9 0 -7 5
30

75
50 4 --------=
30

52.5

80

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

8] a) Una frmula para el clculo de la varianza es

yi

Y i i

I i i

10

30
25
15
13

300
750
750
910
1080
550

3000
22 500
37 500
63 700
97 200
60 500

4 340

284 400

30
50
70
90

12

110

4 340

43.4

10 0

0a

284 400
=

(43.4) 3 =

2 844 -

Utilizando mtodos abreviados con O t =

Z\

Z'i

960

-4 0

- 1 200

48000

-5 0 0
0

10 0 0 0
0

260
480
300

5 200
19 200
8 000

-6 6 0

100400

40
60

2 2 ? n,
n

/E Z n ,
\

50 se tiene

Zf(

zr

-2 0
0
20

1884 =

10 0

n,

-6 0
-2 5

-2
-1
0
1
2

2f

12 0

25

13
24
15

13
48
45

-3 3

251

100400

10 0

l'am bin
(2 5 1
'I
400 < :------ 0.11 >

IlOO

b) E l C. V. es

960

81

SOLUCIN DE E JE R C IC IO S

C. V. = _ =
Y

V96
----43.4

==

31

= 71.4%

43.4

c) Recurdese que
V [Y. -f K] = V [Y]
V [Y, -f 5] = V [Y,] = 960
Luego,
0 31
d) Recurdese que
V [K Yj] = K* V [Yj]
V [1.2 Y,] = 1.44 V [Y] = 1.44 (960) = 1 382.4
9] Los datos son
= 0.57
Y
o

(1)

0.50

(2)

11

ya que.

M [K .+

Y ,]

V [K +

= M
Y ,]

[Y,]

= V

+ K

[Yj]

Luego,
a a= 0.57 Y remplazando en (2)
0.57 Y = 0.50 ( + 11)
0.07 = 5.5
Y = 78.6

(antes del reajuste)

82

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

Adems, esta media estaba compuesta por dos grupos: 35 perso' as con ingreso medio de 40 y 165 personas con ingreso de Ylt
que se obtendr de
- =

35 (40) + 165 (Y,)


200

78.6 (200) = 1 400 -f 165 Yt


15 720- 1400
165

Y, =

-----------------------

14 360
165

87

Las nuevas medias aritmticas despus de los reajustes sern:


El primer grupo de 35 personas tendr un ingreso promedio de
E 71.
El segundo grupo de 165 personas tendr un ingreso medio de
E 98 (87 + 11).
La cantidad de dinero necesaria ser:
C. D. = 35 (71) + 165 (98) = 2 485 + 16170 = 18 655
10] Los datos son:
M [3 Y,] = 54
Mc [Y, + 5] = 24
Luego
M [3 Y,] = 3 M [YJ = 54
M [YJ = 18
rsY ?

n , ~l%

M0 [YJ = | _ _ _ ]
MC [Yt + 5]

S (VI n. + 10 Y, n, + 25n,) = ^
2 Y\ n,

JL-

L 4- 10

2 Y , n,

4- 25 = 576

24

SOLUCIN DE E JE R C IC IO S

SY'I n

83

(- 10 (18) = 551

2Y f nt
i- = 371

Siendo
o2 = S Y * Y2 = 371 - 324 = 47
n
a

6.86

6.86

C. V. = ----- = 38.11%
18
Aplicando las propiedades de la varianza, es posible llegar al misrtio resultado:
V[Y] = V[Y, + 5] = M* - ( 4- 5)2 = 242 - 232 = 47
11] La descomposicin de a2 en <j| y o* es til para llegar al va
lor de la varianza del conjunto
2 (hY)2nh

2oJ nh

o = = -------------------------1---------------

Ser necesario calcular Y:


- _

2 Y hnh _
n

40 (200) + 60 (300) _
500

(40 - 52)2200 -f- (60 - 52)2 300


4 900 (200) -)- 1 600 (300)
500
1
500

o2 = ------------

288 + 192
9 800 + 4 800
o2 = ------!---------1------------!---------- =
5
5
12] Los datos son:

= 0.4
a

0.2

15 080
5

= 3 016

84

ESTADIGRAFOS DESCRIPTIVOS ESTATICOS

o) Se tendr que estandarizar el valor 0.7:


0.7-0.4

1.5

Luego en la tabla se ve que


P (t, > t0) = P (t, > 1.5) = 0.5 - 0.433 == 6.7%
b) Estandarizando ambos valores se tiene
0.2-0.4

0.5-0.4
0.2

= 0.5

P ( ^ i < t,) = P (-1 ^ t ^ 0.5) = 0.341 + 0.195 = 53.6%


c) Estandarizando se tiene

P (t, ^ t) = P (t, ^ -0.25) = 40.1%


13] Si la funcin es
C. Es. = 4.5 C. En. - 5
aplicando el operador media se tiene:
M[C. Es.] == 4.5 M[C. En.] - 5
remplazando valores
M[C. Es.] = 4.5 140] - 5 = 175
Aplicando el operador varianza:
V[C. Es.] =r- (4.5) * V[C. En]
V C. Es. = 20.25 [225] = 4 556
El coeficiente de variabilidad ser:

175

85

DISTRIBUCIN NORMAL
ANEXO: DISTRIBUCIN NORMAL

Una de las ms utilizadas, dentro de las distribuciones tericas


de variable continua, es la llamada distribucin normal o de
Gauss. Se trata de una distribucin simtrica, unimodal y asinttica al eje de las abscisas. Numerosas variables que se analizan
en la investigacin socioeconmica corresponden o se aproximan
a la distribucin normal.
La expresin matemtica de esta distribucin es la siguiente:

y la representacin grfica de una distribucin normal particu


lar es la siguiente:
GRFICA

16

f (*)

M d
M e

Si se desea que el rea encerrada por la curva sea igual a 1,


bastar con integrar la funcin entre oo y -j-oo, igualar el
resultado a 1 y despejar el valor de c.
(' f(x) dx = o c y2jt = 1
1

86

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

Luego, la expresin matemtica de la distribucin normal o


funcin de densidad cuando el rea que ella encierra es igual
a la unidad, es:
1

i (x) = ---------- e

- K(

o \Z2re

La anterior expresin muestra que una distribucin normal


est completamente determinada cuando se especifica el valor
de su media aritmtica y de su desviacin estndar.
Si se obtiene la primera derivada:
F = - ~

02

(x - x) f(x)

igualando a cero, result evidente que el nico punto mximo


se verifica para x = x. Se trata entonces de una distribucin
unimodal donde coinciden la mediana, la moda, y la media arit
mtica.
Si se obtiene la segunda derivada:

se encuentra dos puntos de inflexin igualando la anterior ex


presin a 0,
x = x o
Geomtricamente la desviacin estndar es la distancia que
hay entre el eje de simetra y un punto de inflexin.
Toda vez que se desee encontrar el rea encerrada por la curva
normal entre dos puntos cualesquiera, sera necesario integrar la
respectiva funcin entre los lmites deseados; existen tablas es
tndar donde ya se han realizado los clculos de las integrales.
Es necesario, para hacer uso de dichas tablas, expresar previa
mente la distribucin particular que se tenga, en trminos de
una variable tipificada, definida de la siguiente manera:

87

DISTRIBUCIN NORMAL

XX

t = ------donde esta nueva variable tiene media 0 y desviacin tpica 1.


En efecto,
M
aplicando las propiedades de la media aritmtica
1

M [t] = [M

(x ) -

X]

= 0

Por otra parte,


v "

v r

aplicando propiedades de la varianza


1
V [t] =

a-

o2
V [*] =

a-

En consecuencia, el rea encerrada en una distribucin normal


tipificada N[0, 1] ser
1

.*

"i!

f e a dt

V2

ya que
x x
t = ------o
dx = a dt
En cualquier texto de estadstica aparecen los valores tabula
dos de la distribucin normal tipificada; una manera muy co
rriente de tabularla es la siguiente:

88

ESTADGRAFOS DESCRIPTIVOS ESTTICOS

Variable tipificada
l

rea comprendida entre Oyt


f f<)dt

0.00
0.05
0.10
0.15
0.20
0.25

0.000
0.020
0.040
0.060
0.079
0.099

0.50
0.60
0.80
0.90
1.00
1.20
1.50
1.60
2.00
2.50
5.00
oo

0.195
0.226
0.288
0.316
0.341
0.385
0.433
0.445
0.477
0.494
0.499
0.500

Es necesario tener cuidado en el uso de estas tablas y cer


ciorarse de que los limites de la integral correspondan con lo que
se desea. Asi, hay tablas en las cuales se tabula el valor del
rea entre t y -f-t, que correspondern al doble de rea de la
tabla mostrada como ejemplo. Se deca que una vez especificados
los valores de la media aritmtica y la varianza, queda total
mente determinada la funcin.
Ejemplo: Admtase que las edades de los participantes de un
curso siguen aproximadamente una distribucin normal, con me
dia 25 aos y desviacin tpica 5. Con estos dos datos ser posible
calcular la proporcin de alumnos en cualquier tramo del eje
de las abscisas.
Para encontrar la proporcin de alumnos con ms de 29

i
'\

89

DISTRIBUCIN NORMAL

aos de edad, previamente se tendra que tipificar este va


lor. Sea x0 = 29

Si se observa la tabla de pginas anteriores se tiene que el rea


entre 0 y 0.8 es de 0.288; luego la proporcin de alumnos con
mas de 29
aos ser:
P (x >

29) = P (t > 0.8) = 1

(0.50-f 0.288)= 0.2

Donde P indica proporcin o probabilidad. Si se quisiera ha


llar la proporcin de alumnos que tienen edades entre 22 y 26
aos, sera necesario tipificar previamente cada uno de estos va
lores;
Sean

x = 22
22-25
t0 = ---------- = -0.6
5

x, = 26

26-25
t, = ------- - = 0.25
5

Recurdese que la distribucin es simtrica y que


P (t > t,) = P (t < - t x)
O sea que
P (0 > t > -0.6) =

P (0 < t < 0.6) = 0.226

P (0 < t < 0.25) = 0.099


Sumando las dos reas se concluye que el 32.5% de los alum
nos tienen edades comprendidas entre 22 y 26 aos.

Ill

NMEROS NDICE

A.

EL PRO BLEM A

GEN ERA L

Cuando se define un nmero ndice como un indicador de la


tendencia central de un conjunto de elementos que generalmente
se expresa como porcentaje, se advierten las limitaciones de todo
estadgrafo.
El uso cotidiano que se hace de este instrumento obliga a
plantear previamente algunas de sus limitaciones. Es muy til
no olvidar que se trata de un indicador que pretende reflejar el
comportamiento de ciertas variables en forma aproximada; en
consecuencia no se trata de una medicin exacta. Por otra parte
es necesario establecer que un nmero ndice plantea una com
paracin, ya sea en el tiempo o enel espacio, respecto de un
punto de referencia denominado base del ndice.
A medida que se vayan introduciendo los distintos conceptos
que se refieren al conjunto de los nmeros ndice, se profun
dizarn estos planteamientos primarios, ya que la experiencia
aconseja que el estudiante tenga ciertas reservas a medida que
avanza en este terreno, para evitar posteri irmente una utiliza
cin indiscriminada y sin las aludidas reser'as.

B.

CLASES DE N M ERO S N DICE

Fundamentalmente, dentro de la estadstica econmica, interesa


disponer de indicadores sobre precios, cantidades y valores.
Un ndice de precios ser un indicador que refleje la varia
cin de los precios de un conjunto de artculos entre dos mo
mentos en el tiempo o dos puntos en el espacio; es el caso de
un ndice de costo de vida.
Un ndice ele cantidades ser un indicador que refleje la va
riacin en las cantidades de un conjunto de productos entre dos
momentos en el tiempo o dos puntos en el espacio; por ejem
plo, un ndice de produccin industrial.
Por ltimo, un ndice de valor indica la variacin en el valor
total de un conjunto de productos entre dos momentos en el
[9 0 ]

91

FRM ULAS DE CALCULO

tiempo o dos puntos en el espacio; ejemplo, ndice de ventas


comerciales.

C.

F R M U L A S DE CLCULO

Ocurre que, cuando se trata de analizar la variacin, por ejem


plo, en el precio de un solo artculo, no es necesario un indi
cador especial, basta con expresar la variacin en trminos por
centuales.

Ejemplo;
P e r o d o

P r e c io d e l b ie n

1960
1961
1962
1963

R e la c i n p o r c e n t u a l

20

10 0

25
26
30

125
130
150

Tomando como punto de referencia el precio del ao 1960, y


asignndole el valor 100, se calculan, por una regla de tres
simple, los ndices correspondientes a los otros perodos; as, pue
de decirse que el precio del bien entre 1960 y 1965 ha experi
mentado un alza de 50%. El clculo de un ndice, cualquiera
que sea ste, referido a un solo bien, no necesita, pues, de un esta
dgrafo especial.
El problema de los nmeros ndice surge cuando se desea ave
riguar las variaciones de precios o cantidades de un conjunto de
artculos; considrese el siguiente ejemplo;
P r ec io s
B ie n e s

A (metro)
B (quintal)
C (litro)
D (tonelada)

1960

1964

10
10 0

50

15
140
60

168

221

Para resumir el incremento en los precios de este conjunto de


artculos, una primera solucin consistira en sumar los precios

92

NM EROS NDICE

en ambos perodos y establecer la variacin porcentual entre


ambos agregados; de esa manera se llegara a calcular un ndice
agregativo simple. Si se considera el ao 1962 como base, se tiene:
1960
168
100 = ------ 100
168

1964
221
131.5 = ----- 100
168

Podra concluirse que el conjunto de estos precios ha variado


en 31.5% durante el perodo. Sin embargo, el mtodo tiene dos
serias limitaciones; por una parte, estar afectado por las uni
dades a que estn referidos los precios, y por otra, considera
igualmente importantes los cuatro bienes, cuando el B puede
ser trigo y el bien D comino; no se discrimina, si se emplea
este mtodo, la importancia relativa de cada articulo. En cuan
to a las unidades de medida, considrese el ejemplo anterior,
y supngase que el precio del bien B se refiere al quintal de
trigo; si se tuviera el precio del kilo el resultado del ndice
sera distinto:
P rec io s
B ie n e s

A
B
C
D

(metro)
(kilo)
(litro)
(tonelada)

1960

1964

10
1

15
1.4
60

50
8

69

82.4

Asignndole siempre a 1960 el valor 100 como base del ndice,


se tiene que, para 1964, el ndice agregativo simple es ahora de
119.42 (100 82.4/69). Se llega a un resultado distinto sin que
haya habido variacin de precios alguna respecto del caso an
terior, excepto que en ambos perodos se tom un precio referido
a una unidad distinta.
Por lo que toca a este problema, es posible evitarlo calculando
precios relativos. Se asigna a los precios de cada uno de los ar
tculos en el perodo base, el valor 100 y por regla de tres sim
ple, se calculan los correspondientes al perodo para el cual
interesa conocer el ndice.
Si se observan los ejemplos anteriores, se tendr:

93

FRM ULAS DE CLCULO


P r e c io s
B ie n e s

1960

1964

10 0
10 0
10 0
10 0

150
140

B
C
D

12 0

75

Obsrvese que en el bien B, sea cual fuere la unidad de me


dida, el incremento de su precio es de 40%. Pero aunque en
este mtodo denominado de cifras relativas se subsana el pro
blema de las unidades, persisten otros problemas que exigen so
lucin: en primer lugar, la eleccin de un indicador de tenden
cia central. Se tienen los precios relativos para 1964, pero es
necesario resumirlos por medio de un estadgrafo de posicin:
media aritmtica, mediana, etc. Todos ellos conducirn, en ge
neral, a resultados distintos. Cul de ellos admitir? Si bien en
cada caso particular habr un estadgrafo adecuado que satisfaga
las necesidades de representatividad que se tenga, en general se
utiliza la media aritmtica, principalmente por la facilidad que
implica su manejo algebraico. Es necesario cuidar que no hayan
valores extremos que distorsionen el estadgrafo. En el ltimo
ejemplo, si se toma la media aritmtica, el ndice para 1960 ser
de 100 y el de 1964 de 121.25, es decir, el conjunto de artculos
habr experimentado un alza de 21.25% en el perodo. Obsr
vese que la conclusin est referida al conjunto, pues se trata
de un promedio. Cada bien en particular acusa variaciones dis
pares en sus precios, e incluso el bien D muestra decrecimiento.
En consecuencia, tomar cifras relativas salva el inconveniente
de las unidades de medida, pero an subsiste el problema de la
ponderacin, ya que a cada artculo debe asignrsele la impor
tancia debida.
Tomando como punto de partida los precios relativos se en
sayarn algunos criterios de ponderacin, para obtener los ndices
ms usuales en la investigacin econmica.
Si los precios relativos

i
Po

donde p es el precio en el perodo dado y p0 el precio en el


perodo base, se ponderan por los valores del ao base: p0 q0,

94

NMEROS NDICE

se obtiene la conocida frmula de Laspeyres para precios


(IPL), es decir:

2 pq0
2 Po qo

2pq0

2 p0q0

La sumatoria se extiende a todos los artculos considerados en


el ndice. Como en todo promedio aritmtico, se divide por la
suma de las ponderaciones.
Un ndice de precios de Laspeyres debe interpretarse como el
nivel que alcanzan los precios en un ao dado, respecto de un
ao base al que se asigna el valor 100, considerando las mismas
cantidades del ao base en ambos perodos; en otras palabras,
se trata de percibir la variacin en los pretios de una canasta
de productos elegidos en el ao base y que permanece inalterada
durante los perodos sucesivos.
Este ndice, por lo tanto, tiene un significado bien concreto.
El supuesto que la canasta de productos realmente no registre
variciones significativas, es otro problema; es el analista quien
deber determinar si el supuesto se cumple o no, y por lo tanto,
juzgar la conveniencia de utilizar un ndice de Laspeyres.
Por otra parte, si los precios relativos , se ponderan por vaPo

lores hbridos: p0 qn, se tiene el ndice de precios de Paasche


(IPP), que tambin se utiliza con frecuencia:

2 pnq
2poq

2 p0qn

Obsrvese que ahora los {necios estn multiplicados por las


cantidades del ao que se calcula (qn). Por este hecho un n
dice de precios de Paasche debe interpretarse como la variacin
de los precios de un conjunto de productos, suponiendo cons
tantes las cantidades del ao dado; en otros trminos, la canasta
de productos que se considera, es la del perodo que se calcula
y se toma esta misma canasta pata el ao base.
Respecto de los ndices de valor, por el significado simple que
tienen, no requieren deducciones especiales, ya que son sencilla
mente el resultado de la divisin entre los valores del ao que
se calcula y el ao base.

95

FRMULAS DE CALCULO

IV

2 P qB
2 po qo

A continuacin se considerar un ejemplo donde se calcularn


los ndices presentados:
Ao 1

Ao 0
A rtcu lo s

A
B
C
D

4
3

8
20

10
2

10

Ao 2

4
5
3

12

4
8

30

12
2

9
3
3
15
3

20

5
7
40

p: precio; q: cantidad.

No hace falta el clculo en el ao 0, base del ndice, ya que


coinciden precios y cantidades:

Po = Po y q =q0
Para los ndices de Laspeyres se tiene:
IP L

( , 1) =

2 p0q0
IPL

(ao 2)
v
'

40 + 12 + 80 + 40

2 p 2q0
80 4- 15 + 70 + 80
= =
- ------
2 p 0q0
40 + 12 + 80 + 40

11M

172
245
= ---- = 142.4
172

Para los ndices de Paasche, suponiendo siempre el ao 0 como


base del ndice:
2 Pl qt
60 + 12 + 96 + 60
228
IPP (ao 1) = - = ---- ----
=
= 115.2
v
2 po qi
5 0 + 12 + 9 6 + 40
198
IPP

(ao 2)
v
'

2p,q,
6 0 + 1 5 + 105 +120
300
= ------- = --------------------------- = ----- = 135.1
2pq2
3 0 + 1 2 + 120 + 60
222

El ndice de valor:
IV (ao 1) =

2 p! Qi
60 + 12 + 96 + 60
228
- =---- ----
=
= 115.1
2 po q0
4 0 + 12 + 80 + 40
172

96

NMEROS NDICE

IV (ao 2) =

2 p., q,

2 po q0

60 + 15 + 105 4- 120

300

- ---- ------------- =
4 0 + 12 + 80 + 40
172

= 174.4

En el siguiente cuadro puede apreciarse la diferencia entre las


indicaciones de uno y otro ndice
In d ic e s
IP P

A os

IP L

0
1

10 0 .0

10 0 .0

10 0 .0

116.3
142.4

115.2
135.1

115.1
174 4

IV

Puede apreciarse que el IPL crece ms que el IPP. En el pri


mero se considera constante la canasta de productos del perodo
base; en cambio, en el segundo, se considera constante la ca
nasta de productos del perodo en que se calcula el ndice. Por
lo tanto ambos ndices indican la variacin promedio de los
precios bajo supuestos diferentes; sin embargo, es muy frecuente
confundir el significado de estos indicadores, porque no se con
sideran los supuestos de uno y otro.
Con referencia a los ndices de caqtidad, es necesario hacer el
mismo tipo de consideraciones, ya que se presentan problemas
similares; unidades de medida, ponderaciones, etctera.
Siguiendo el mismo criterio de los ndices de precios, puede
obtenerse el ndice de cantidades de Laspeyres (IQL).
IQL

Z -p.q.

q"
2

po

2 qo Po

El ndice de cantidades de Paasche ser (IQP).


IQP =

2 ----- * qo Pn

2 q 0 p

2 q P

2 q 0 pu

Mientras el IQL representa la variacin en las cantidades su


poniendo constantes los precios del perodo base, el IQP repre-

97

PRUEBAS

senta la variacin de las cantidades suponiendo constantes los


precios del perodo calculado. Nuevamente se insiste sobre la
necesidad de no descuidar estos supuestos, cuando se interpreta
un ndice.
Las frmulas presentadas son, como se dijo, las de uso ms
frecuente. Hay una cantidad extraordinaria de frmulas de ndi
ces que se diferencian unas de otras segn los factores de pon
deracin utilizados. Por razones de brevedad slo se mostrarn
las ms conocidas.
Marshall - Edgeworth para precios
iPM =

2 p - (q+ q)
2po (qo + q)

ndice de precios de Keynes


IpK _

S Pn (q0 A q)
2 p (q A q)

donde el signo A es nfimo y quiere indicar que se tome la


menor de las cantidades que estn a sus costados.
La llamada frmula ideal de Fischer para precios, que es
la media geomtrica de los ndices de Laspeyres y de Paasche.
IPF = VffL IPP =

2 p0 q0

2 p0 q

En estas ltimas frmulas, bastar remplazar p por q, para


obtener las frmulas correspondientes a ndices de cantidad.
D.

P R U E BA S SO BR E

LO S N M ERO S N DICE

Irving Fischer, quien plantea la frmula por l llamada ideal,


propuso pruebas para calificar los nmeros ndice.
1] Prueba de reversin de factores

La prueba se basa sobre un criterio de analoga: lo que es cierto


para un producto debiera ser cierto para un conjunto de ellos.
As, para cualquier artculo se tiene que:
precio X cantidad = valor

98

NMEROS NDICE

Las frmulas de Laspeyres y Paasche no satisfacen esta prueba,


como puede verse a continuacin.
IPL X IQL IV, en efecto
2 Pnqo
2 p0q0

2 qnPo
2 (JoPo

2 pn(Jn
2 po (Jo

IPP X IQP * IV
2 p q
2 q p
2 p q
2 p0q

2 q0pn

2 p q0

La frmula de Fischer s satisface esta prueba


IPF X IQP = IV
/ 2 pn q0
\ 2 poq0

2pqn\ /2 q p 0 2 gnpn\ * _ 2 p ngn


2 poqn/ \ 2 q0p0 2 q0p /
2 p0q0

Simplificando trminos semejantes se tiene:


2 Pn qn _ 2 pnqn
2 p q0
2 p0q0

Sin embargo, esta prueba tambin se satisface con una combi


nacin de ndices de precios de Laspeyres y cantidades de Paas
che o viceversa, como se comprueba a continuacin:
IPL X IQP = IV
2 Pn qo
2 po qo

2 qnPn
2 qo pn

2 Pn qn
2 po qo

IPP X IQL = IV
2 pnqn
2 p q

2 qnPo
2 q p0

2 pnqn
2 p0q0

Estas dos ltimas relaciones merecen retenerse, porque se uti


lizan con frecuencia.

99

PRUEBAS

2] Pruebas de reversin temporal

Nuevamente el criterio de analoga; si el precio de un producto


es en el perodo a de 40 y en el perodo b de 50, en el
primer perodo se observa que el precio es el 80% del que se
da en el perodo b, y en ste el 125% del precio del perodo
a. Lgicamente el producto de estos porcentajes debe dar 1,
es decir;
Po
pn
Esta prueba no la cumplen las frmulas de Laspeyres y
Paasche.
En efecto:
IPLb, X IPLa>
1
donde el primer subndice indica el perodo que se calcula y
el segundo el perodo base.
Spbqa

2 Pa qa

Spaqb

2 Pb qs

IPPb,a IPPa,b = 1

s Pbqb
2 pa qb

2 Paga
2 Pb qa

La frmula de Fischer s cumple la prueba


/ 2 Pb q
\ 2 pa q
3]

IPFb, a X IPFa,b = 1
2 pb qb \ K/ 2 Pa qb
2 Pa qa
2 Pa qb / \ 2 pb qb
2 p bqa /

P ru e b a circu la r

Si elprecio de un producto es de 10 en el primerperodo, de


12 en elsegundoy de 18en el tercero, se comprueba que en
el segundo periodo el precio es 120% del precio en el primero

100

NMEROS NDICE

y en el tercer perodo 150% del precio en el segundo. En con


secuencia el precio del tercer perodo es 180% del registrado
en el primero:
(120%) (150%) = 180%
La prueba circular no la cumple ninguna de las frmulas ana
lizadas. Suponiendo tres perodos para IPL se tiene:
i p l 3>2 i p l 2, j

ip l 3. x

donde el primer subndice indica el perodo que se calcula y


el segundo el perodo base.
2 p3q3
2 p=q3

2p=qi
2 p, qt

2 p 3qi
2 pi qi

Esta relacin slo se cumplira en el caso que


q3 = q2 = q3 (para todos los artculos).
Sin embargo, la relacin planteada se cumple en forma apro
ximada cuando no existen diferencias significativas en las can
tidades durante los distintos perodos.
El lector podr comprobar que ni la frmula de Paasche ni
la de Fischer cumplen la prueba circular, pudiendo seguir el
mismo proceso d comprobacin realizado para la frmula de
Laspeyres.
Respecto de estas pruebas, es conveniente aclarar que la exis
tencia de ndices que no las cumplan no justifica dejarlos de
lado; interesa ms el significado concreto del ndice, teniendo
en cuenta sus alcances y limitaciones. Es as como la frmula
ideal de Fischer, que satisface las pruebas por l planteadas, no
es susceptible de ser claramente interpretada, ya que se trata
de la combinacin de dos ndices que, si por separado adquieren
cabal significado, al combinarlos ofrecen dificultades para su in
terpretacin.

E.

BA SE DE UN N M E R O

N DICE

Al definir un nmero ndice se ha destacado que se trata de una


comparacin de dos momentos en el tiempo o dos puntos en el

101

BASE

espacio. El momento o punto con respecto al cual se establece


la comparacin recibe el nombre de base de un ndice y se le
asigna el valor 100, para analizar las variaciones porcentuales.
Respecto de la eleccin del perodo base hay que tener siempre
presente el objetivo que se persigue con el ndice; en general
se estima que el perodo base debe ser un perodo normal. Cabe
preguntarse qu se entiende por normalidad en estos casos, cuan
do en los pases en desarrollo los cambios son muy frecuentes
y la anormalidad es un denominador comn. Tal vez al definir
el perodo base fuese ms sensato pensar en un perodo du
rante el cual no existan accidentes o cambios violentos. Por lo
dems, ser necesario cambiar la base del ndice cuando los
supuestos planteados pierdan validez a medida que pasa el tiem
po; es el caso de los ndices de costo de vida, cuya base debe
modificarse toda vez que la estructura de consumo presente cam
bios significativos con respecto de la admitida en el perodo base.
Sobre este mismo asunto, ser necesario distinguir dos tipos
de base: base fija y base variable. Los ndices de base fija son
aquellos que mantienen como base un perodo fijo de referencia,
en tanto que los ndices de base variable son aquellos que tienen
como base el perodo inmediatamente anterior. Con un ndice
de base fija puede calcularse el correspondiente de base variable
y viceversa; los resultados, en general, diferirn de los que se ob
tendran a partir de los datos originales, ya que las frmulas
usuales no cumplen con la prueba circular.
Ejemplo: Supngase que el ndice de Laspeyres para los precios
de los materiales de construccin sea el siguiente:
In d ic e
b a se 1960 =

100

1960

100

1961

110

1962

120

1963

144

1964

180

1965

190

E l co rresp o n d ie n te n d ice d e base v a ria b le sera:

102

NMEROS INDICE
n d ic e d e b a s e v a r ia b le

1960
1961
1962
1963
1964
1965

110.0
109.1
120.0
125.0
105.5

Otra operacin que es muy usual respecto de los ndices de


base fija es la del empalme; se trata, como indica su nombre,
de empalmar ndices con base distinta. Obsrvese el siguiente
ejemplo, donde se tiene un ndice para el perodo 1956-1959 con
base 1956, y otro ndice de 1959 a 1962 con base 1959, y se pre
tende tener una serie para todo el perodo 1956-1962.
A os

1956
1957
1958
1959
1960
1961
1962

n d i c e
b a s e 1 9 5 6 = ! 100

100
120
150
180

n d ic e
b a s e 1959 = 100

100
110
132
150

Mediante una sencilla regla de tres, puede completarse cualesquiera de las dos series , para tener el movimiento del ndice
durante todo el perodo.
A os

n d ic e
b a se 1956 = 100

1956
1957
1958
1959
1960
1961
1962

100.0
120.0
150.0
180.0
198.0
237.6
270.0

n d i c e
b a s e 1959 =

55.6
66.7
83.3
100.0
110.0
132.0
150.0

100

UTILIZACIN

103

Debe advertirse que este tipo de empalmes significa slo una


aproximacin que puede ser muy defectuosa, dependiendo de la
similitud de las bases y de sus supuestos. En todo caso, es posible
recurrir a estos empalmes siempre que se tenga conciencia de sus
limitaciones.
F.

U TILIZA CI N DE LO S N M ERO S NDICE

Un nmero ndice indica la evolucin de precios, cantidades y


valores, para un conjunto de productos. Prestan en consecuencia
la utilidad inmediata de reflejar la tendencia de los cambios y
ritmos de los conceptos sealados. Ese solo hecho ya justifica su
cmputo y su peridica utilizacin en la investigacin socioeco
nmica. Sin embargo prestan adems otros servicios sobre los
que es conveniente hacer algunos comentarios.
1] L a

d e fla c ta c i n *

Las alteraciones en los sistemas y niveles de precios que se pre


sentan dentro de la actividad econmica originan dificultades
en la comparacin de valores monetarios que corresponden a
perodos distanciados. No es mucho lo que se puede deducir
de la comparacin de valores nominales, es decir, de valores
expresados en unidades monetarias de distinto poder adquisi
tivo. Para poder llegar a conclusiones vlidas acerca del com
portamiento de una variable que represente valor, ser nece
sario expresar los montos monetarios nominales en unidades
homogneas; esta transformacin recibe el nombre de deflacta
cin, y con ella se pretende eliminar, exclusivamente, el efecto
de alteraciones en los precios.
E] proceso de deflactacin exige disponer de un ndice de
flactor, es decir, de un indicador que proporcione una pauta
de las alteraciones en los precios que tengan relacin con la va
riable que se pretende delactar. Es de fundamental importancia
recordar que no existe un ndice deflactor nico; cada variable,
en rigor, debera tener un deflactor adecuado. La disponibili
dad de slo un reducido nmero de ndices de precios, hace que
stos sean utilizados indiscriminadamente para una serie de pro
* Se em p le a r el n eo lo g ism o d e fla c ta c i n " p a ra in d ic a r la m eto d o lo g a
de tra n sfo rm a c i n d e valo res exp resa d o s en p recio s co rrie n te s a v alores en
p re cio s c o n sta n tes; e l p ro p sito es lim ita r el e m p le o d e "d e fla c i n p ara c a
ra c te riz a r co n esta ltim a e x p resi n e l fe n m en o eco n m ico o p u esto a la
in fla c i n .

1 04

NMEROS NDICE

psitos; aunque este hecho puede adolecer de errores conceptua


les, muchas veces se justifica el procedimiento, porque interesa
conocer un orden de magnitud antes que un valor exacto, siem
pre que se tenga conciencia de las limitaciones del mtodo. En
todo caso, aun dentro de las escasas disponibilidades de ndices
de precios, es posible llegar a soluciones aceptables, ya sea eli
giendo racionalmente un ndice de precios como deflactor o com
binando y ponderando en forma adecuada dos o ms ndices;
este ltimo procedimiento, si bien puede no conducir a solu
ciones ideales, por lo menos puede representar una disminucin
de las posibles distorsiones.
Antes de profundizar este problema de la deflactacin, cuando se
desea transformar unidades monetarias heterogneas (unidades de
cada perodo) en unidades monetarias homogneas (unidades
del perodo base), y permitir de este modo la comparacin en el
tiempo, el primer recurso al cual se apela, es expresar los mon
tos monetarios nominales en unidades de moneda extranjera de
valor ms o menos estable; dlares, libras, etc. Mas sobre este
procedimiento caben algunas objeciones. Los gobiernos tienen
instrumentos que les permiten fijar los tipos de cambio con las
monedas extranjeras en forma arbitraria (arbitraria para los fi
nes que aqu se comentan) y que en general no representan las
alteraciones en los niveles de precios. En Chile hay una expe
riencia reciente; en el transcurso de menos de dos aos, la unidad
monetaria chilena lleg a sufrir una fuerte devaluacin (de E 1 053
en noviembre de 1962 a E 3 400 en abril de 1963, por dlar
norteamericano tipo de cambio corredor). Si un valor dado en
escudos se expresase en dlares en ambas fechas, podra con
cluirse que entre los dos perodos mencionados dicho valor se
redujo a la tercera parte; si bien esto puede ser cierto para una
persona que va a gastar sus ingresos en Estados Unidos, no lo es
para quien efecta sus desembolsos en Chile, porque durante ese
perodo ningn ndice de precios propiamente tal ha sufrido un
aumento de 200 por ciento.
Por otra parte, una segunda objecin a este procedimiento con
siste en el hecho de que aun las economas ms estables pueden
sufrir cierto grado de inflacin. Los dos argumentos expuestos
descalifican, en general, la conversin a unidades monetarias ex
tranjeras como una alternativa de la deflactacin. La mecnica
de la deflactacin implica dividir los montos monetarios nomi
nales por el ndice de precios elegido como deflactor adecuado;
y su explicacin podr encontrarse en la siguiente regla de tres.
Si en el ao n se tiene un valor nominal VNn y un ndice de

105

UTILIZACIN

precios lP n, cul sera este valor expresado en unidades mone


tarias de igual poder adquisitivo que las del ao base? En otros
trminos, cul sera este valor si el ndice de precios no hubiera
variado?
El planteamiento queda as reducido:
IP . . . VNn
100 . . . x
x = VN
---- 100 = Valor real
IP
Desde otro punto de vista, se justifica la deflactacin pensan
do en los componentes de un valor: precio por cantidad
Indice de precios X cantidad = Valor (100)
Valor (100)
Cantidad =
Valor real
ndice de precios
Ahora bien, la evolucin de las cantidades en el tiempo est
libre, por as decirlo, de influencias monetarias directas, y muestra
la evolucin fsica, real, de una serie, que es precisamente lo que
de pretende con la deflactacin.
Los valores reales as obtenidos, estn expresados en unidades
monetarias que tienen un poder adquisitivo correspondiente al
ao base del ndice deflactor.
Con referencia a este ltimo planteamiento, es necesario dis
tinguir dos tipos de base. Se llamar base propiamente tal al
perodo que corresponde al diseo del ndice, donde se perfila
la muestra, se establecen las ponderaciones, etc. Por otra parte,
se utilizar la expresin base aritmtica para referirse a cual
quier perodo, que por transformacin lineal se le haya asignado
el valor 100. Los cambios aritmticos de base implican hasta
cierto punto una arbitrariedad que puede originar algn tipo
de perturbaciones al establecer las comparaciones. Sus efectos se
rn tanto mayores, cuanto ms distante sea la base propiamente
tal del ndice deflactor. Cuando hay consenso de que los supues
tos de la construccin y diseo del ndice siguen siendo vlidos,
los cambios aritmticos de base no introducirn deformaciones
significativas; por ello, antes de deflactar ser necesario decidir

106

NMEROS NDICE

de qu ao sern las unidades monetarias en que interesa ex


presar los valores reales. Es recomendable, si se cumple la con
dicin de constancia de los supuestos de la construccin del
ndice, expresar los valores nominales en unidades monetarias
del ao ms reciente, lo que se consigue mediante un ndice
deflactor que tenga como base el ltimo ao en el sentido cro
nolgico. La utilidad de la sugerencia anotada, radica en el he
cho que el investigador tiene una visin reciente y tal vez objetiva
del sistema de precios imperante, por lo que es probable que
la obtencin de conclusiones quede facilitada. Es necesario desta
car que un proceso de deflactacin conduce a valores reales que
pueden tener dos interpretaciones: una expresin fsica o un
poder de compra. Una variable monetaria est compuesta por
una suma de valores del tipo 2pn q; si esta serie se deflacta
por un ndice de precios de los productos considerados en la
serie nominal, el residtado ser una expresin fsica de la serie.
En efecto, utilizando un ndice deflactor de Paasche, se tiene:
Valor nominal

2 p n

----------------- = --------- = 2 po q
IPP
2 p nqn
2 p0q
El resultado es evidentemente un quantum, es decir, cantida
des del perodo n, valorizadas a precios del perodo base. Si se
hubiera deflactado por un ndice de precios de Laspeyres, se
tendra:
Valor nominal

2 p q

IPL

2 pnq0
2 p q0

= IQP 2 p0 q0

Resultado que equivale a proyectar un valor en el perodo


base, a travs de un ndice de cantidades tie Paasche. Tambin
representa una evolucin fsica de la serie, aunque con conno
taciones diferentes al caso anterior. Cabe hacer notar que cuan
do se desea llegar a una expresin fsica rigurosa, slo existe
un tipo de deflactor adecuado: el que contienen los productos
incluidos en la serie nominal.
Por otra parte, cuando se quiere obtener un poder de com
pra, es necesario especificar qu uso se tiara a un monto mone
tario; de esta manera, si el sueldo de un empleado en diferentes

107

UTILIZACIN

perodos se deflacta por un ndice de precios al consumidor, el


resultado sera un poder de compra en trminos de la canasta
de productos elegida en el ndice deflactor. Si el sueldo de dicho
empleado se deflacta por ndice de valores burstiles, el resul
tado ser un poder de compra en trminos de acciones y bonos.
El uso que se dar a un monto monetario es el que determina el
tipo de poder de compra resultante.
Resumiendo esquemticamente se tiene:
Q untum

P o d e r de co m p ra

A continuacin y a ttulo de ejemplo se presentan los resulta


dos de un proceso de deflactacin:

A os

1958
1959
I960
1961
1962
1963

S u e ld o d e un
e m p le a d o
(u . ot. d e c j a o )

n d i c e d e p r e c io s
a l c o n s u m id o r
(b a s e 1963 = 100)

409
480
600
680
720
900

36.5
50.6
56.5
60.9
69.3
10 0 .0

S u e ld o r e a l
(u . m . d e 1963)

A
_ 10 0
B
1 096
946
1 062
1 117
1 039
900

La deflactacin presentada implica haber elegido como de


flactor el ndice de precios al consumidor. Tal vez de los valo
res reales no pueda deducirse, en forma categrica, que el em
pleado haya sufrido una merma de esa magnitud en su poder
de compra; lo que hubiera ocurrido si dicho empleado gastara
todo su ingreso en la forma que lo hace el empleado tpico ele
gido como padrn en el ndice de precios al consumidor. Si
dicho empleado slo gasta en manutencin el 60 por ciento de
sus ingresos y el 40 por ciento restante lo dedica, por ejemplo,
a la construccin de una vivienda, la deflactacin se realizara

10 8

NMEROS NDICE

en dos partes: la primera parte (60%) se deflactara por el


ndice de precios al consumidor y el saldo debera deflactarse
por un ndice de precios de insumos de la construccin; de esta
manera se obtendra la expresin real de su poder de compra,
en trminos del uso que dar a sus ingresos.
Cuando se ha realizado una deflactacin, es necesario tener pre
sente que los valores reales as obtenidos son simplemente apro
ximaciones, que sern tanto mejores cuanto ms representativo
sea el ndice de los precios que se cancelarn con el monto mo
netario. Esto no quiere decir que sea indispensable "construir
ndices si no se dispone de los ms adecuados; slo se pretende
destacar la necesidad de seleccionar los ndices disponibles, y
en todo caso, tener presente las limitaciones que acuse una de
flactacin obligada por un ndice que no sea el mejor. Es res
ponsabilidad de los organismos autorizados y de los principales
usuarios la elaboracin de ndices de precios de la actividad eco
nmica.
La deflactacin, mecnicamente es un asunto trivial, pero la
eleccin de deflactores adecuados requiere mucha atencin. Vase,
por ejemplo, qu sucede con los ndices de produccin y ventas
industriales de Chile.* Observando las cifras siguientes debe ad
mitirse que no existe la concordancia que debera existir, tam
poco se encuentran razones que expliquen la diferencia; aunque
es muy probable que el desajuste radique en la calidad del
deflactor utilizado, antes que en las variaciones de existencias.

P e r io d o

1959
1900
1901
1902
1903
Enero
Abril
Agosto

n d i c e d e p r o d u c io n
in d u stria l
fa s e 1919 = 100

n d i c e d e v en ta s
in d u stria le s r e a le s
fa s e 1959 = 100

10 0 .0

10 0 .0

103.5

98.3

1 0 0 .1

1 1 0 .0

113.8

127.7

108.4

120.9
129.8
132.1

12 2 .2
1 1 2 .8

* Csar Molestina, Los ndicos de produccin industrial manufacturera


y ventas reales industriales. Un comentario acerca de su comportamiento,
mayo de 1903.

109

UTILIZACIN

De la simple observacin de- estas series surgen las contradic


ciones anotadas. Si se admite que el ndice de produccin in
dustrial es un indicador confiable, el ndice de ventas sera el
que adolece de defectos. Estos defectos pueden deberse a dos
causas no excluyentes: que el ndice de ventas nominales no sea
lo suficientemente acertado, por errores inherentes o ajenos al
muestreo, o que el deflactor utilizado no tiene la relacin apro
piada con los precios de los bienes industriales, o una combina
cin de ambas causas.
2] El deflactor im plcito del producto bruto
No es necesario citar la imperiosa necesidad que hay de dispo
ner de un sistema de contabilidad social expresada en precios
constantes; en este sentido se tratar principalmente la .deflac
tacin del producto bruto.
Es importante aclarar la idea de deflactor implcito. ste apa
rece como resultado de un proceso de deflactacin cuando se
trata de cumplir con alguna restriccin; se presenta principal
mente cuando una variable global ha sido desglosada en com
ponentes, con el objeto de identificar un ndice deflactor ade
cuado con cada componente. En estos casos la restriccin aparece
como suma de componentes que reproducen la variable global;
es necesario agregar que el deflactor implcito se origina en el
hecho que la restriccin (muchas veces definicin) debe ser sa
tisfecha tanto en valores nominales o corrientes como en valores
reales o constantes; entonces se dice que el proceso de deflacta
cin es coherente. El deflactor resultante de una deflactacin
coherente se denomina implcito, porque justamente est implcito
en el cumplimiento de la restriccin.
Supngase que X, Y y Z representan valores sujetos a la res
triccin:
X -f Y -(- Z = W

restriccin que se satisface en valores corrientes. Si adems se de


sea que esta restriccin sea satisfecha en valores constantes, se tiene:
X + + Z = W

donde la barra sobre el smbolo se utiliza para indicar que se


trata de valores reales, es decir, que

110

NMEROS NDICE

IPX
Y
Y = ------IPY
Z
Z = -----IPZ

La suma de X -j- Y -f- Z reproduce el valor real de W, es


decir, W. Cul deber ser el deflactor de W para que el valor
real resultante W coincida con la suma de X
Y Z? En
efecto, se tiene que
IPX

IPY

IPZ

IPW

Basta con despejar IPW de la anterior relacin:


W
IPW = 1
1
1
IPX

IPY

IPZ

Se comprueba que el deflactor implcito IPW es el promedio


armnico de los deflactores componentes, donde los factores de
ponderacin son justamente los valores nominales; otra forma de
calcular el deflactor implcito es comparar W que se obtiene
como suma de X + Y -f- Z con W.
W
IPW = ---W
Para determinar el deflactor implcito del producto bruto,
habr que pensar previamente en alguna definicin. Si la res
triccin es del siguiente tipo:
P = C4-I + E - M
se determinarn los deflactores para consumo, inversin, expor

111

UTILIZACIN

taciones e importaciones y se obtendr como suma el producto


real (P).
C -------------|
I ---------E
P = ----------1
IPC
IPI ^ IPE

M
IPM
El deflactor implcito del producto (DI), segn esta restriccin, estar dado por la relacin
DI = ----P
P
Puede verificarse al mismo tiempo que el deflactor implcito
es equivalente a la media armnica de los deflactores compo
nentes.
i
i
C -I-----------I l-I-------------E
--------------M
IPC
IPI
IPE
IPM
Si la restriccin fuera de otro tipo, por<r ejemplo que la suma
de los valores agregados sectoriales rep oducen el producto bruto,
se tendr otro deflactor implcito sujeto a la restriccin pro
puesta. Habra que discutir previamente posibilidad de encon
trar deflactores adecuados para el valor agregado; una alterna
tiva, por cierto muy discutible, es deflactar el valor agregado de
cada sector, por los precios de los bienes que el sector produce.
El resultado sera un poder de compra de los valores agregados
sectoriales, en trminos de los bienes que produce cada sector.
Puede argumentarse en favor de este mtodo, sosteniendo que
la contrapartida fsica del valor agregado es justamente la can
tidad de bienes producidos, sin embargo, la justificacin es en
extremo dbil. En todo caso, en los cursos de Contabilidad So
cial se muestran las ventajas y desventajas de este y otros mtodos
de deflactacin. Para ilustrar, en seguida se detalla este proce
dimiento. Si se desea llegar a expresiones reales, cada rama de
actividad debera deflactarse por un ndice de precios relacio
nado directamente con dichas ramas de actividad. As el valor
agregado por el sector industrial, debera deflactarse por un n
dice de precios tie bienes industriales; el valor agregado por el
sector agropecuario, se deflactara por un ntlice de precios de
l

------------

NMEROS NDICE

112

bienes agropecuarios. De esta manera se obtendran valores reales


en cada rama que representara una aproximacin a la evolucin
fsica de lo producido por cada sector. Sumando los valores reales
de todas las ramas de actividad, se tendra el producto bruto
en trminos reales; y comparando los productos brutos en valores
nominales y reales se obtiene el llamado deflactor implcito del
producto, que no es otra cosa que un ndice general promedio
de los precios que rigen en la actividad econmica.
Sean:
PNj el producto nominal del sector i en el ao j.
llij el ndice de precios del sector i en el ao j.
PR ij el producto real del sector i en el ao j.
De la deflactacin resulta

Si se suman todos los productos reales por sector en un ao


cualquiera j, se tiene el producto bruto real en el ao j.
PR, =

2 P R ij =
i-l

donde i = 1, 2, . . . L representa el nmero de sectores con


siderados. Por otra parte, el producto bruto real PRj se obtiene
deflactando el producto bruto nominal P N j , por el deflactor
implcito DIj, conceptos todos referidos a un perodo j, es decir:
PR

PNj

100

DL
Remplazando en la igualdad anterior, se tiene
PNj

DI
Despejando DIj

113

UTILIZACIN

PN,

DI j

PN j

que justamente corresponde con la definicin de media aunnica de los deflactores sectoriales, considerando como ponderacio
nes los productos nominales de cada sector, ya que
PNj =

i,
2 P Nh
i=l

A continuacin se presentar un ejemplo para ilustrar el pro


ceso de deflactacin de los productos sectoriales.
Supngase que la actividad econmica ha sido dividida en
cuatro sectores para los cuales se dispone de las siguientes infor
maciones:
P r o d u c to n o m in a l
(u n id a d e s m o n e ta r ia s c o rrien tes )
S ecto res

M inera
A gricultura
Ind u stria
Servicios
Producto b ru to nom in al
In d ic e s d e p r e c io s (b a s e 1960
Productos m ineros
Productos agrcolas
Productos industriales
Servicios

1960

1961

1962

200
300
200
500

300
350
250
600

400
400
300
700

1 200

1 500

1 800

130
110
120
110

150
120
130
120

= 100)
100
100
100
100

Deflactando el producto de cada sector, por el ndice de pre


cios correspondiente, se tendr los productos reales de cada sector:

114

NMEROS NDICE

Producto real
(unidades monetarias constantes de 1960)
Sectores

1960

1961

1962

Agricultura

200

230.8

266.7

Minera

300

333.3

Industria

200

318.2
208.3

230.8

Servicios

500

545.5

583.3

1 200

1 302.8

1414.1

Producto bruto real

Para calcular el deflactor implcito, recurdese que


D Ij _

Deflactor implcito

PN l
PRj

100

1960

1961

1962

100

115.1

127.3

Como se demostr, estos valores equivalen a los promedios ar


mnicos de los ndices deflactores.
Con respecto a la deflactacin del producto bruto es conve
niente advertir que puede prestarse a presentaciones caprichosas,
segn sea la base de los ndices deflactores. En otras palabras,
el producto bruto real mostrar distintas tasas de crecimiento
segn sea la base de los deflactores. Aparentemente esto no ten
dra por qu ocurrir, ya que un cambio aritmtico de la base
del ndice deflactor no debera afectar las variaciones reales en
el producto bruto. Mediante un ejemplo que pretende exage
rar la situacin antes que representar un hecho real, se ilustra
este planteamiento.
Para abreviar, supngase que la actividad econmica ha sido
dividida en dos sectores: primario y secundario. Los datos son
los siguientes:

115

UTILIZACIN
P r o d u c t o b r u t o n o m in a l
(u. m . c o rrien tes )

Sector primario
Sector secundario

1956

1962

1 000
1 000

1 600
1 800

n d ic e s d e fla c t o r e s (b a s e 1956 =

Sector primario
Sector secundario

100)

10 0
10 0

110

300

Si se calcula el producto brut real, en precios constantes de


1956, se tiene:
P r o d u c to b r u t o n o m in a l
(u. m . c o n sta n te s)

Sector primario
Sector secundario

1956

1962

1 000
1 000

1 450
600

2 000

2 050

Entre ambos aos el crecimiento es 2.5 por ciento, si se com


puta el producto en precios de 1956. Si aritmticamente se cam
bia la base de los deflactores y en consecuencia el producto se
computa a precios de 1962, se llega a una variacin porcentual
diametralmente opuesta.
Los nuevos ndices deflactores (con base en 1962) sern los
siguientes:
n d ic e s d e fla c t o r e s (b a s e 1962 =

Sector primario
Sector secundario

91.0
33.3

100)

100
100

Deflactando los productos nominales, por los ndices anterio


res se tiene:

116

NMEROS NDICE
P r o d u c to b r u to r e a l
(u , ot. co n sta n te s)

Secto r prim ario


Sector secundario

1 100
3 000

1 600
1 800

4 100

3 400

Puede observarse un decrecimiento de 17 por ciento en el


mismo periodo. Ntese que para los sectores, considerados en
forma aislada, no ocurre esta incompatibilidad, la que slo se
presenta cuando se comparan sumas de sectores con crecimientos
nominales distintos y cuyos respectivos deflactores tambin mues
tran variaciones desiguales. Los resultados sern tanto ms con
tradictorios, en uno y otro caso, cuanto ms distintos sean los
ndices deflactores y mayores sus variaciones. Lo que ocurre es
que se est sumando valores que no son rigurosamente homo
gneos, dados los cambios aritmticos de la base de los ndices.
Los resultados a que se ha llegado no deben sorprender si se
piensa en la limitacin de los mencionados cambios de base.
Por otra parte, la estructura del producto bruto nominal es dis
tinta en ambos perodos. En el primer caso los dos ndices de
flactores son iguales a 100 en 1956 cuando tanto el sector pri
mario como el secundario aportan un 50 por ciento del pro
ducto bruto cada uno. En el segundo caso los dos ndices de
flactores son iguales a 100 en 1962 y el sector primario apor
ta con un 47 por ciento al producto y con 53 por ciento al sector
secundario. Por esta razn no se presentan las inconsistencias
anotadas para los sectores considerados en forma aislada, y s,
en cambio, se presentan al comparar sumas deflactadas por n
dices distintos. La inconsistencia ser tanto mayor cuanto ms
distintas sean las variaciones de los deflactores.
3] L a proyeccin sobre la base de indices de cantidad
Un procedimiento corrientemente utilizado para proyectar el
producto bruto real por sectores, es el basado sobre ndices de
cantidad. Consiste en hacer variar el producto de un perodo
dado conforme al ndice de produccin correspondiente. De esta
manera, si se sabe que para 1962 el producto generado por la
industria fue de 5 000 unidades monetarias de ese ao y se dis
pone del ndice de produccin industrial para los aos 1962 a

117

NDICES DE COM ERCIO EX T ER IO R

1965, se puede suponer que habr correspondencia entre las va


riaciones de dicho producto sectorial y del ndice de cantidad.

A os

1962
196.3
1964
1965

I n d ic e
E stim a ci n
P r o d u c to
d e p rodu cd el p ro d u cto
in d u stria l
c i n in d u stria l
in d u stria l
( p r e c io s d e 1962) (b a s e 1962 100) (p r e c io s d e 1962)

5 000

10 0

198

12 0

135

5 000
5 400
6 000
6 750

Este tipo de estimaciones, para breves perodos parece jus


tificado, pero no hay que perder de vista que el ndice de pro
duccin muestra ms bien las variaciones de la produccin glo
bal antes que las del producto (valor agregado); la metodo
loga de estimacin presentada tiene como supuesto la constancia
en los coeficientes de insumo producto, constancia que puede no
ser real en una poca caracterizada por tanto cambio tecnolgico.
G.

NDICES

DE C O M E R C IO

E X T E R IO R

Para abordar el intercambio de bienes y servicios con el resto del


mundo, es indispensable cuantificar indicadores acerca de pre
cios, cantidades, valores, etc., relacionados con exportaciones e
importaciones; el tipo de problemas que en estos casos debe en
frentarse, son los inherentes a los nmeros ndice, ms algunas
precauciones que deben tomarse por circunstancias que ataen
al comercio exterior.
1] ndices de precios
En general es necesario homogeneizar los datos bsicos, ya que
no siempre estn sujetos a criterios uniformes de valuacin: pre
cios CIF, FOB, precios expresados en monedas diferentes, valores
nominales de retorno u otro tipo de valorizacin, en qu mo
mento se considera que la importacin o exportacin est con
sumada: en trnsito, en aduana, etc.
Para el clculo de ndices de precios, puede utilizarse frmu
las de Laspeyres y Paasche. Sin embargo, en caso de utilizar la
frmula de Laspeyres, si algn producto deja de negociarse, im

118

NMEROS NDICE

plica suponer que su precio baj a cero, lo que constituye un


evidente falseamiento. Habr que tener la precaucin de tomar
en cuenta para el clculo de los productos slo los negociados
tanto durante el perodo base como durante el perodo dado.
Por otra parte, no es necesario adoptar esta precaucin, si se apli
ca la frmula de Paasche, ya que en sta se elimina automtica
mente el producto que deja de negociarse y no quedar com
prendido en ninguno de los factores p q ni pn qn. Por eso,
para determinar ndices de precios se suele utilizar frmulas de
Paasche. En estadsticas de comercio exterior, se acostumbra desig
nar a estos ndices como ndices de valor unitario, por el tipo
de informaciones que se tiene. No es el precio y la cantidad de
un artculo, sino el precio promedio o valor unitario que co
rrespondera a un artculo proveniente de una partida de ar
tculos no totalmente homogneos. De este modo, si la impor
tacin de 100 automviles de distintas marcas representa un va
lor CIF de 400 000 unidades monetarias, el precio promedio por
automvil es de 4 000 u. m. En este sentido es que se prefiere
designar a estos ndices como ndices de valor unitario en vez
de precios, aunque metodolgicamente no hay diferencias.
2] ndices de cantidad
Nuevamente cabe hacer aqu referencia a la denominacin espe
cial de ndices de quantum que se les da en comercio exterior
por razones similares a las anotadas en el punto anterior.
En este caso, si un producto deja de importarse o exportarse
quiere decir que la cantidad negociada baj a cero, lo que queda
ahora bien reflejado en la frmula de Laspeyres. Por esa razn
se acostumbra utilizarla en el clculo de ndices de quantum de
comercio exterior. Adems, utilizar frmulas de Laspeyres o Paa
sche para quntum y valor unitario, respectivamente, garantiza
el cumplimiento de la prueba de reversin de factores planteada
por Fischer. Por ello, basta conocer el valor total de exporta
ciones o importaciones y uno cualquiera de los dos ndices men
cionados, para deducir inmediatamente el otro. Recurdese que
IPP X IQL = IV IPL X IQP = IV
El trabajo que requiere el clculo de estos ndices induce a
la utilizacin de muestras, en vez de indagaciones totales.
En el caso de ndices de precios se supone que los precios de
los artculos incluidos en la muestra representan los precios de los

ALGUNOS INDICADORES ECONOMICOS

119

no incluidos. Naturalmente, ser necesario calcular los errores


de muestreo correspondientes para hacer un uso racional del in
dicador. Por lo que a los ndices de quntum se refiere, el hecho
de que en todos los perodos se disponga del valor total de las
importaciones, permite cuantificar la representatividad que tenga
la muestra utilizada en cada periodo mediante el cociente.
2 p q n (para la muestra)
----------------------------------== Representatividad
2 p q (para el total)
Posteriormente, s se desea calcular un ndice de quntum de
Laspeyres, se cuantifica E q p0 en la muestra, y para proyectar
al total, se divide por la representatividad (que implica la apli
cacin de una regla de tres simple). De esa manera se tiene la
estimacin del numerador de la frmula para el total poblacional; en cuanto al denominador no hay problema alguno, ya
que para cada perodo se dispone del total de importaciones y
exportaciones. Si se desea calcular un ndice de quntum de
Paasche, ser necesario ajustar al 100 por ciento la expresin
del denominador de la frmula, calculada con datos mustrales.
H . ALGUNOS INDICADORES ECONM ICOS

Se presentarn algunos indicadores de uso muy frecuente en la


literatura econmica. Si bien es cierto que la mayora de ellos
deberan ser analizados con mucho ms profundidad desde el n
gulo de la contabilidad social, es conveniente examinarlos desde
el punto de vista estadstico.
1]

Indice de la relacin de trminos del intercam bio

Se define como el cociente entre el ndice de precios de ex


y el ndice de precios de importaciones, referidos ambos
a la misma base. En consecuencia, este estadgrafo indica la evo
lucin en el tiempo de la relacin de precios registrada durante
el perodo base; en otros trminos, representa variaciones en la
capacidad de compra de un volumen de exportaciones. Responde
a la siguiente interrogante: en qu proporcin ha aumentado o
disminuido el nmero de unidades que deben exportarse para
financiar la importacin del mismo volumen de productos que
se introduca al pas durante el ao base? Se trata de un con
cepto estrictamente relativo; no se puede concluir que la relacin

portaciones

12 0

NMEROS NDICE

de intercambio sea buena o mala, sino mejor o peor que la del


ao base. El ndice de la relacin de precios del intercambio
queda entonces definido como:
^
Indice de precios de exportaciones
IPX
ndice de precios de importaciones
IPM
2] Producto e ingreso bruto
Cuando estos conceptos se consideran en valores constantes, am
bas magnitudes no coinciden. El producto real es una medida del
valor de los bienes y servicios debidos al esfuerzo productivo in
terno. El ingreso real est relacionado, adems, con el inter
cambio con el exterior, puesto que parte de la produccin de un
pas se exporta y parte de los insumos y bienes finales deben
adquirirse en el exterior; por consiguiente estas transacciones
con el exterior afectan, por la relacin de precios del intercambio,
la disponibilidad de bienes y servicios que satisfacen la demanda
de la poblacin. A medida que se deteriora la relacin de inter
cambio, hay una transferencia al exterior de una parte del es
fuerzo productivo interno. En valores constantes, la diferencia
entre ambos conceptos, recibe el nombre de efecto de la relacin
de precios del intercambio, luego:
Ingreso bruto = Producto bruto Efecto de la relacin
de precios del intercambio
En smbolos:
IB = PB EFI
donde
Efecto de la relacin de precios del intercambio = Poder
de compra de exportaciones Quantum de exportaciones
Es decir

EFI = PEX - QX

Adems
Poder de compra de exportaciones = Quntum de ex
portaciones X ndice de la relacin de intercambio
PEX = QX (IRI)

121

ALGUNOS INDICADORES ECONOMICOS

Dado que el producto del quntum de exportaciones y el


ndice de precios de exportaciones es equivalente al valor co
rriente de las exportaciones, el poder de compra tambin puede
definirse como
corriente de las exportaciones
-------------------------------------------PEX = Valor
ndice de precios de las importaciones
en otros trminos, el valor nominal o corriente de las exporta
ciones queda deflactado por el ndice de precios de las importa
ciones. Por otra parte el quntum de las exportaciones es el valor
de las exportaciones a precios constantes.
QX = 2 q p0
donde la sumatoria se extiende a todos los rubros de exporta
cin, es decir
Valor corriente de las exportaciones
QX = --------------------------------L-------------ndice de precios de las exportaciones
remplazando las expresiones correspondientes en la frmula de
EFI se tiene
EFI QX (IRI) - QX =: QX [IRI - 1.00]
A continuacin se cuantificarn estos conceptos mediante un
ejemplo, para destacar su importancia. Supngase que se tienen
las siguientes informaciones:
a)
b)
c)
d)
e)

Producto bruto (u. m. corrientes)


Deflactor implcito (base 1960 = 100)
ndice de precios de exportaciones
Indice de precios de importaciones
Valor corriente de las exportaciones

I9 6 0

1962

1964

1 000
10 0
10 0
10 0
20 0

1 20 0

1 500
140
110
130
280

1 000
10 0
20 0
20 0

1 043
92
218

115
110
12 0

240

Para calcular el E FI, se tiene


f)
g)
h)
i)
j)
k)

PB real (u. m. de 1960) (a/b)


IR I (base 1960 = 100) (c/d)
Q X (u. m. de 1960) (e/c)
Q X IR I = P E X
(h.g)
EFI
(i-h)
YB real
(f-j)

1 000

201

-1 7
1026

1 071
85
255
217
-3 8
1 033

122

NMEROS NDICE

3] Capacidad para importar

Cuando se piensa en trminos de valores corrientes, la capacidad


para importar no es otra cosa que el valor total de las exporta
ciones, ms el ingreso neto de capitales extranjeros.
La capacidad para importar a precios constantes estar dada
por
Existencia de oro y divisas
EOD
-j- Quntum de exportaciones
QX
-)- Radicacin de capitales extranjeros
RC
-f- Efecto de la relacin de precios del intercambio EFI
Capacidad total de pagos sobre el exterior
Remesas de utilidades e intereses
Salida de capitales extranjeros
Capacidad para importar
CPI
La capacidad para importar a precios constantes, tambin pue
de determinarse deflactando la capacidad para importar a pre
cios corrientes por el ndice de precios de importaciones. La ca
pacidad para importar a precios constantes es:
CPI = QX -j- QX [IRI 1.00] -)- RC (neta a precios constantes)
RC (neta precios corrientes)
CPI = QX [IRI] -f
IPM
IPX
RC
CPI = QX ----------1---------IPM
IPM
Valor corriente de las exportaciones -|- EOD -fRC (neta a precios corrientes)
ndice de precios de importaciones
Capacidad para importar a precios corrientes
ndice de precios de importaciones
4] T ipo de cam bio de paridad
Como una aplicacin de nmeros ndice, es conveniente tratar
la forma de convertir monedas de distintos pases a unidades
homogneas con propsitos de comparacin. Utilizar para ello

123

ALGUNOS INDICADORES ECONOMICOS

los tipos de cambio oficiales puede originar distorsiones serias,


en la medida que exista ms de un tipo de cambio (discrimina
cin de reas cambiarias), o que el tipo de cambio nico est
sobre o subvaluado.
Una alternativa terica consistira en la determinacin de una
canasta de productos, resultando el tipo de cambio entre dos
monedas la relacin de valores que sera necesario gastar para
adquirir dicha canasta. Este mtodo tiene inconveniente de tipo
prctico; la determinacin de los artculos que cqnformaran la
canasta significa un serio problema, sobre todo si se piensa en
la enorme variacin de las preferencias de los consumidores en los
distintos pases. Sin embargo, con algunas restricciones, este m
todo es utilizado en la prctica.
Un mtodo que puede ser utilizado con alguna ventaja es la
proyeccin de un tipo de cambio base, en un perodo en el que
no se haya advertido sobre o subvaluaciones monetarias, sin cam
bios mltiples y, en general, sin accidentes que descalifiquen a
ese perodo base.
La aludida proyeccin se efecta sobre la base de las modifi
caciones en la relacin de precios de los dos pases cuyo tipp
de cambio se pretende determinar.
Sean los pases A y B; se desea estimar el nmero de unida
des monetarias de A, por unidad monetaria de B. El tipo de
cambio de paridad en un ao cualquiera n, estar dado por
Tipo de cambio de

Tipo de cambio

Deflactor implcito de A

paridad ao n

ao base

Deflactor implcito de B

Ejemplo: Supngase que el tipo de cambio base en el ao 0,


fue de 5 u. m. de A por 1 u. m. de B, siendo los deflactores im
plcitos los siguientes:
Ao

0
1
2
3
4

D . I . p a is A

100
120
150
200
300

D . I. p a is B

100
110
120
140
150

El tipo de cambio de paridad para los aos siguientes ser:

124

NMEROS NDICE

Ao

0
1
2
3
4

Relacin de deflactores Tipo de cambio


d ia/ d i b
de paridad

100.0
109.1
125.0
142.9
200.0

5.00
5.45
6.25
7.14
10.00

Evidentemente el mtodo da estimaciones que sern tanto ms


confiables en la medida que el tipo de cambio base haya sido
elegido adecuadamente y los deflactores implcitos sean represen
tativos de las variaciones de precios en ambos pases.

5] Transferencias implcitas
El hecho que en la actividad econmica se presenten transac
ciones intersectoriales donde cada sector tiene precios distintos,
origina cierto tipo de transferencias de producto de un sector a
otro, implcitas en las transacciones que efectan cuando se con
tabilizan a precios corrientes.
I.os sectores cuyos precios crecen menos que el promedio gene
ral de precios representado por el deflactor implcito, estn trans
firiendo parte de su producto hacia aquellos sectores que tienen
precios que crecen ms que el promedio de precios.
Evidentemente que la suma algebraica de las transferencias ser
nula, por cuanto la ganancia de unos sectores tiene como con
trapartida la prdida de otros.
Se definen las transferencias implcitas para cada sector, como
la diferencia entre la produccin valorizada a precios del sector,
y esa misma produccin valorizada a precios promedios repre
sentados, como se dijo, por el deflactor implcito:
Transferencias implcitas = Produccin a precios corrien
tes Produccin a precios constantes X Deflactor im
plcito
en smbolos
T Imp. = p q - p q (DI)
donde n y 0 indican el perodo que se calcula y el perodo base
respectivamente.

125

ALGUNOS INDICADORES ECONMICOS

2 T Imp (li) = 2 p q - 2 p0 q (DI) = 0


Donde L es el nmero de sectores considerados,
h = 1, 2, 3, . . . L
L

.2 T lmp (h) Produccin nominal Produccin real X


Produccin nominal
X -----------------------------=

Produccin real
Ejemplo:
P r o d u c c i n n o m in a l
ao 0
ao 1

S ecto res

500
600
300
400

1
2

3
4

1080
800
350
420

I n d ic e d e
n d ic e d e
c a n tid a d P r o d u c c i n
p r e c io s
base 0 = 1 0 0
b a s e 0 = 100
real
12 0
110
10 0

90

2 650

600
660
300
360

180
12 1

117
117

1 920

El deflactor implcito para el ao I ser:


Produccin nominal ao 1 2 650
DI =
=
= 138
Produccin real ao 1
1 920
Las transferencias implcitas por sector:

S e c to r es

1
2
3
4

P r o d u c c i n
n o m in a l
p1q1

1 080
800
350
420
2 650

P r o d u c c i n
r e a l (D I)
p 0 q x (D I)

828
911
414
497
2 650

T r a n s fe r e n c ia s
im p lc ita s

+252
-1 1 1
-6 4
-7 7
0

12 6

NMEROS NDICE

I. ETAPAS DE LA CONSTRUCCIN DE NMEROS NDICE

Es interesante e ilustrativo seguir cada uno de los pasos para la


confeccin de indicadores acerca de precios o cantidades. Los pa
sos que se enumerarn estarn referidos al diseo de un ndice
de costo de vida por constituir ste un caso bastante general y
complejo.
1] O bjetivo del indice
Es fundamental calificar con toda precisin el objetivo del in
dicador. En el caso de un ndice de costo de vida, es necesario
determinar a quines estar referido: si a la poblacin en su
conjunto, a una ciudad, a profesionales, a obreros, a campesi
nos, etc. De esto depender qu tipo de artculos conformarn
la muestra de productos que componen el ndice. Es imprescin
dible no descuidar el objetivo bsico: los usos principales que
tendr el indicador.
2] Determ inacin de la estructura de consumo
Es conveniente, cuando se calcula un ndice de costo de vida,
clasificar los gastos: alimentacin, vestuario, vivienda, varios, etc.
De esta manera es posible calcular ndices, por separado, para
cada componente. Este desglose aparte que permite realizar
anlisis de las variaciones de precios en forma ms detallada, es
muy til en la seleccin de deflactores adecuados. Estos ndices
desglosados pueden combinarse para obtener el ndice general.
Las ponderaciones de cada componente se establecen mediante
una muestra. Se selecciona una muestra de unidades familiares
para el caso del costo de vida, obtenida de la poblacin para la
cual se confecciona el ndice, por ejemplo la poblacin de obre
ros y empleados de una ciudad. Esta muestra, en lo posible, debe
ser aleatoria y de un tamao que asegure fidelidad y garantice
confianza. En cada una de las unidades elegidas para la mues
tra, se lleva un registro de los gastos en bienes y servicios por
tipo de bien o servicio, donde se recopilan los precios pagados
y las cantidades consumidas. Vale la pena llevar este registro du
rante un tiempo prolongado, por lo general un ao, para que
permita captar las variaciones en los consumos durante las dife
rentes estaciones. De esta manera es posible llegar a obtener pon
deraciones por componentes y por tipos de bienes y servicios.

ETAPAS DE SU CONSTRUCCIN

127

3] Seleccin de artculos
En las anotaciones que se hacen en los registros o libretas de
consumo acerca de los distintos bienes que se consumen, en ge
neral aparece una gran cantidad de productos, aunque muchos
de ellos responden a consumos espordicos o accidentales. Es pre
ciso seleccionar los productos ms importantes, de consumo habi
tual y representativos de las preferencias de los consumidores. Para
seleccionar estos productos y servicios no es conveniente un m
todo aleatorio, pues es preferible decidir qu productos sern con
siderados en el ndice, tomando en cuenta el volumen del gasto
efectuado en cada bien o servicio. En esta forma se llegar a esta
blecer una lista de 100 a 300 productos cuya importancia relativa
o ponderacin se tiene tabidada.
4] Formas de valuacin
Otra etapa importante durante el proceso que permite confec
cionar ndices de precios, es la decisin acerca de los tipos de
precios que se considerar. Sabido es que los precios varan enor
memente segn el lugar donde se adquieren los productos; por
otra parte es corriente que para artculos considerados de prime
ra necesidad, hayan precios oficiales y precios reales con gran
des diferencias entre s. Para el caso tie ndices de costo de vida
los precios debieran tomarse en los lugares donde el consumi
dor adquiere los productos: almacenes, ferias, etc. Sobre el par
ticular es necesario tomar decisiones previas en forma categrica.
5] Variaciones de calidad de los bienes y servicios
Otro aspecto fundamental es la especificacin precisa, hasta don
de sea posible, de la calidad de los productos, de manera que se
pueda controlar a travs del tiempo la invariabilidacl de sus
caractersticas. Es muy frecuente, sobre todo en los artculos con
trolados, que se incrementen los precios reales, permaneciendo
fijos los precios nominales, por una disminucin de la calidad de
los productos.
6] Base del indice
En general cuando se plante el tema se advirti sobre la nece
sidad de elegir como base un perodo donde estuvieran ausentes
las modificaciones y circunstancias violentas. Ahora debe agre
garse que, en el caso de ndices de costo de vida, el perodo base
debe ser modificado, toda vez que la estructura de consumo haya

128

NMEROS NDICE

cambiado significativamente. En los tiempos actuales, cuando las


innovaciones tecnolgicas cambian con extraordinaria rapidez,
determinando modificaciones en las preferencias de los consumi
dores, la base de un ndice de costo de vida no debera tener
una antigedad superior a los 6 a 8 aos.
1 in embargo, en las frmulas de clculo, para evitar cambios
de base muy seguidos, modificaciones que significan altos cos
tos, se contempla la posibilidad de introducir nuevos artculos,
toda vez que se registren cambios en las preferencias de los con
sumidores.
7] Eleccin de los m todos de clculo
En general es necesario tomar decisiones sobre la frmula de
clculo; corrientemente, cuando se trata de ndices de costo
de vida se acostumbra utilizar frmulas de Laspeyres, porque
implica considerar constantes las ponderaciones del perodo base.
La utilizacin de una frmula de Paasche significara un esfuerzo
muy grande, ya que en cada perodo (generalmente cada mes) ha
bra que volver a ponderar hacia atrs, aparte que sera nece
sario calcular peridicamente estas ponderaciones a medida que
pasa el tiempo.
La decisin acerca de qu frmula utilizar estar condicionada,
o primer lugar, al objetivo que se persigue con el ndice y a la
factibilidad de su diseo desde el punto de vista del costo y
la oportunidad con que se entreguen los resultados.
La Direccin de Estadstica y Censos de algunos pases calcula
el ndice de costo de vida sobre la base de una modificacin
a la frmula de Laspeyres.

Esta frmula implica el clculo del ndice en un perodo i,


sobre la base del ndice en el perodo anterior, afectndolo por
la variacin que acusen los precios. La frmula tiene la ventaja
que se pueden introducir nuevos artculos segn sus especifica
ciones, o cambiar la fuente de informacin.

129

TEM A S DE DISCUSIN
TEM AS DE DISCUSIN

Indique si las siguientes afirmaciones son ciertas o falsas, y justifique


su opinin.
1] Poder de compra, valor real y quntum fsico, son conceptos
equivalentes.
2] La relacin de intercambio es desfavorable para los paises subdesarrollados, porque los precios de sus importaciones son ma
yores que los precios de sus exportaciones.
3] La frmula de Laspeyres no proporciona indicaciones correctas,
cuando se trata de averiguar la variacin de los valores unitarios
de las exportaciones.
4] Deflactar una serie de valores nominales por un ndice de pre
cios de Laspeyres, equivale a proyectar el valor del ao base
(2 Po q0) Por un ndice de cantidades de Paasche.
5] Los siguientes datos son factibles. (Los ndices tienen base 1960.)

^1967 =
Transferencias implcitas del sector primario al resto de la eco
noma 200. Indice de precios en 1967 del sector primario 140.
6 ] El deflactor implcito es nico, independiente de la restriccin
planteada.
7] Las pruebas planteadas por Fischer significan una seria limita
cin a la utilizacin de ndices de Laspeyres y Paasche.
8 ] Los siguientes datos son consistentes
E FI =

-2 0 0

QX =

4 000

IP X =

150

IR I =

80

9] Si los ndices de precios de Laspeyres y Paasche coinciden en


valor numrico, para cierto perodo, quiere decir que la estruc
tura de ponderaciones es exactamente igual a la del perodo base.
10] Los ndices de precios de Laspeyres no pueden tomar valores
negativos.
11] El ndice de valor debe ser siempre mayor que el ndice de
precios.
12] Los siguientes datos son consistentes.
PEX

3 000

QX =

2 400

IR I =

80

13] Si el producto nominal coincide en tres periodos con el pro


ducto real, quiere decir que los precios de todos y cada uno de
los bienes y servicios han permanecido invariables en los tres
perodos.
14] En un perodo caracterizado por una completa estabilidad de
precios, los ndices de Laspeyres y Paasche para precios coinci
dirn necesariamente en valor numrico.

130

NMEROS NDICE

15] Si una econom a se divide en dos sectores: prim ario y secunda


rio, y el ndice de precios de productos prim arios coincide con
el d eflactor im p lcito, qu iere decir que las transferencias im p l
citas de ingresos, son nulas para am bos sectores.
16] La m agnitud del efecto de la relaci n de precios del in tercam
bio, es ind ep en d iente del perodo elegido com o base de los n
dices deflactores.
17] Para que el n d ice de produccin ind ustrial re fle je cam bios rea
les, d ebiera ser deflactado por un nd ice de precios de bienes
industriales.
18] E l nd ice de precios de Laspeyres es el que ms se presta para
el clculo de variaciones en el costo de vida, prin cip alm en te por
que tom a com o ponderaciones las cantidades de un perodo base
considerado com o norm al.
19] Los ndices de base variable, tien en la desventaja de que no
puede establecerse com paraciones en tre ellos.
20] Si el nd ice de la relacin de precios del intercam bio es in fe
rio r a 100, est re flejan d o una situacin desfavorable para el pas.
21] Si un o b rero en 1964 tien e un sueldo superior en 3 0 % al de
1963 y por o tra parte, el nd ice de precios al consum idor para
1963 con base en 1964 es de 70, quiere d ecir que la situacin
del o b rero en cu an to a poder de com pra no h a variado.

PRO BLEM A S PRO PU ESTO S

1] U n a fb rica produce 2 bienes (A y B ) . Si se tien en los siguientes


datos incom pletos.

Ao

V en ias lo la le s
en u. m .
c o r r ie n te s

1961
1966

5 000
9 000

lite n "A
P r e c io
C a n tid a d
10
15

400
}

B ie n B
P r e c io
C a n tid a d
100
400

C alcule uu nd ice de cantid ad de las ventas de esta fbrica para


1966, con base 1961.
2] Dadas las siguientes inform aciones:
P rodu cto n om in al del pas A en 1968
Producto no m in al del pas B en 1968

6 000
180 000

1 31

PROBLEM AS PROPUESTOS
U nidades m onetarias de A por una unidad
m o n etaria de B en 1962
P rodu cto re a l de A en 1968 en u. m. de 1964
P roducto real de B en 1968 en u. m. de 1962

10
4 000
120 000

E l Indice gen eral de precios con base v ariable para el pas A, se


presenta a co n tin u aci n :
P a s A
1961
1962
1963
1964

_
110
120
110

Se le pide estim ar el tipo de cam bio de paridad e n 1968. Seale


brevem ente las lim itacion es del m todo.
U n a econom a se divide en tres sectores: prim ario, secundario y
terciario, y se dispone de los siguientes datos:
P r o d u c to b r u to
(u. m. corrientes)

Sector prim ario


Sector secundario
Sector terciario

1964

1967

2 000
5 000
3 000

4 000
6 000
5 000

1964

1967

2 000
5 000
3 000

2 500
5 000
4 000

P r o d u c t o b r u to
(u. m. constantes de 1964)

Sector prim ario


Sector secundario
Sector terciario

Se pide d eterm in ar las transferencias im p lcitas de ingreso entre


los sectores.

13 2
4]

NMEROS NDICE
Los ndices de precios y produccin industrial han sido los si
guientes:
n d ic e s

1958

Precios
Produccin

1959

1960

1965

80

10 0

150

300

10 0

110

12 0

125

Si se sabe que el producto de la industria fue en 1960 de 800


millones de u. m. se pide:
a ) Estimar el producto nominal para 1965.
b ) Estimar el producto real para 1959, en u. m. de 1965
c) Sealar las limitaciones de los mtodos utilizados.

EJERCICIO S

1]

Para los artculos A, B, C y D, se tiene los siguientes precios y


cantidades en los aos que se indican:

A r tcu lo s
C

A os

<7

<7

<7

1959

10

12

15

10

30

10

1960

12

12

15

15

30

15

1961

15

20

10

20

50

20

1962

20

20

10

30

50

20

1963

30

30

15

50

60

20

Calcule para todo el perodo:


a ) Un ndice de precios de Laspeyres con base 1959;
b ) Un ndice de cantidad de Paasche con base 1959; y
c) Un ndice de valor.

2]

El ndice de base variable de los precios de los productos agro


pecuarios muestra el siguiente comportamiento:

133

PROBLEM AS PROPUESTOS
A os

I n d ic e

1957
1958
1959
1960
1961
1962
1963

104
102
108
120
150
130

C alcule el nd ice tom ando 1960 com o base fija .


P ara el Indice de prod uccin ind ustrial se tien en los siguientes
datos:

A os

n d ic e d e p ro d .
in d u st: b a s e 1955

1955
1956
1957
1958
1960
1961
1962
1963
1964

n d ic e d e p rod .
in d u st. b a s e 1960

100
106
114
120
130

_
_
-

100
112
120
130
145

Se le pide que em palm e am bos ndices y seale claram en te las li


m itaciones del m todo.
U n a econom a ha sido dividida en tres sectores y sus valores agregados se presentan a con tin u acin (en m illon es de unidades monetarias c o rrie n te s).

1956

1957

1958

1959

1962

1965

A gricultura
Servicios y otros
Ind u stria

2 000
4 000
1 600

2 600
5 600
2 000

3 100
5 800
2 800

4 000
7 900
3 800

6 000
9 000
5 500

8 00C
10 000
6 000

Producto

7 600

9 600

11 700

15 700

20 500

24 000

134

NMEROS NDICE
Por otra parte, se dispone de los siguientes ndices para los mis
mos aos.
Indice costo vida
Indice de precios al
por mayor
ndice de produccin
industrial
ndice de precios de
la construccin
ndice de sueldos y
salarios

80

10 0

130

150

190

2 10

10 0

12 0

140

170

2 10

220

10 0

110

125

140

170

20 0

90

10 0

12 0

160

20 0

2 10

10 0

125

140

160

180

20 0

Se le pide que:
a ) Calcule el producto bruto real para los seis aos en unidades
monetarias de 1956 y luego de 1962. Compare los resultados.
b ) Calcule el ndice deflactor implcito del producto bruto y ex
plique su significado.
5] Una familia incrementa sus ahorros nominales en 360 por ciento
entre 1955 y 1962. Si en el ao 1962 dicha familia desea invertir
sus ahorros en materiales de construccin, slo podr adquirir una
cantidad 20 por ciento mayor que en 1955; en cambio, si destina
sus ahorros a la compra de productos agrcolas, no alcanzar a
obtener la cantidad que habra
comprado en 1955. Pero almismo
tiempo, si invirtiera sus ahorros
para comprar ambos tiposdebienos, de tal modo que gastase igual suma en cada uno, podr ad
quirir una cantidad 5 por ciento superior al ao 1955. Se le pide
calcule el ndice de precios de productos agrcolas para 1955 con
base 1962. Qu limitaciones tendra el mtodo empleado?
6 ] Se disponen de antecedentes, sobre la base de una muestra de

cuatro productos, de las exportaciones de cierto pas.

A os

M u estra d e p r o d u c to s d e e x p o r ta c i n
B
C
D
A
p
q
p
q
p
p
q

1958
1959
1960
1961
1962
1963

3
3
4
4
4

10
10
10
10
12

15

20
20

25
30
30
25

6
8
6
8
8

4
4
4
5
5

20
20

25

12

14
16

4
4

2
2

6
6
6
8

3
3
2

V a lor
t o ta l
d e las
expor
ta c io n e s

250
320
420
450
480
500

1S5

SOLUCIN DE E JE R C IC IO S

Se le pide que estim e


a ) U n nd ice de cantid ad de exportaciones para el to tal de stas
con base 1958.
b ) U n ind ice de Paasche para los precios de exp o rtaci n con base
1959.
c) Si el n d ice de precios de im portacion es tien e el siguiente com
portam iento:
1958

1959

I9 6 0

1961

1962

1963

100

120

160

240

310

430

IP M

Se le pide calcule el nd ice de relaci n de trm inos de intercam bio


con base 1959.
7] Si los precios de los cigarrillos se increm entan en 70 p or cien to y,
com o consecuencia, el nd ice de costo de vida sube en 1.8 por
ciento, qu pond eracin d en tro del costo de vida tien e este bien?

SOLUCION DE EJERC IC IO S
1J a )

IP L

2 p q0
2 p q
A

13

1)

T ota l

A os

P,,<lo

PnVo

Pn<lo

P<0

2 p,,q

1959
1960
1961
1962
1963

120
144
180
240
360

60
60
75
75
90

10
10
20
20
20

300
300
500
500
600
>

490
514
775
835
1 070

b)

IQ P

n d i c e b a se
1959=100
100.0
104.9
158.2
170.4
218.4

2 qn P
2 q P.

Ao

P n<l

P<1

P r f

1959
I960
1961
1962
1963

120
144
300
400
900

60
60
50
50
90

10
15
40
60
100

D
P /I n
300
450
1 000
I 000
1 200

T o ta l
2 /><jr

490
669
1 390
1 510
2 290

n d ic e
100.0
130.2
179.4
180.8
214.0

136

NMEROS NDICE
c) El ndice de valor puede obtenerse multiplicando los dos ndi

ces antes encontrados; y en virtud de la prueba de reversin de


factores:
A os

IP L

1Q P

IV

1959
1960
1961
1962
1963

10 0 .0

10 0 .0

10 0 .0

104.9
158.2
170.4
218.4

130.2
179.4
180.8
214.0

136.6
283.8
308.1
467.4

Es necesario desencadenar el ndice previamente:


n d ic e base
f ij a 1 9 5 7 = ,1 0 0

1957
1958
1959
1960
1961
1962
1963

10 0
10 0
10 0
10 0
10 0

10 0 .0

104
104
104
104
10 0 104
10 0 104

10 2
1 0 2 108
10 2 108
10 2
10 2

^ 108
108

12 0
12 0
12 0

150
150 130

104.6
106.1
114.6
137.6
206.2
268.1

Luego ser necesario cambiar de base, dividiendo por el valor de


1960 (114.6).

A os

1957
1958
1959
1960
1961
1962
1963

n d i c e
b a se fij a 1 9 6 0 = 1 0 0

87.3
90.8
92.6
10 0 .0
12 0 .0

179.9
233.9

3] Para empalmar el ndice con base 1955, bastar aplicar la siguiente


regla de tres:
130

100

^61.55

^61.60

137

SOLUCIN DE E JE R C IC IO S

y de igual forma para todos los aos. Para empalmar hacia atrs
el otro indice, el procedimiento es similar. Los ndices empalmados
se muestran a continuacin:
n d i c e b a s e 1955

n d i c e b a s e 1960
1 .0 0

1955

10 0 .0

1956

106.0

76.9(100

81.5 (100

1.30^
1.06
T m )
1.14

1957

114.0

87.7(100

1958

12 0 .0

92.3(100

1960
1961
1962
1963
1964

1.30^
1.2 0

130.0
145.6
156.0
169.0
188.5

(130
(130
(130
(130

1 .1 2 )
1 .20 )

10 0 .0
1 1 2 .0
12 0 .0

1.30)
1.45)

130.0
145.0

lio *

La limitacin estriba en el hecho que a lo largo de cualquiera de


los dos ndices empalmados aparecen implcitamente dos bases:
cuanto ms diferentes sean los supuestos de una y otra base, tanto
ms defectuoso ser el empalme.
4] a ) El primer problema por resolver es la eleccin de los deflactores
adecuados, es decir, que exista relacin entre el concepto que se
desea deflactar y el ndice elegido como deflactor. El segundo
problema consiste en expresar los deflactores elegidos, con la
misma base para disponer de unidades homogneas. Admtase
que despus de un estudio se ha decidido deflactar el valor agre
gado de la agricultura por el ndice de costo de vida, el de ser
vicios por un ndice de sueldos y salarios y en industria se hara
la proyeccin a travs del ndice de cantidad respectivo.
Los ndices con base 1956 sern los siguientes:

Deflactor agricultura
Deflactor servicios
ndice de produc. ind.

1956

1957

1958

1959

1962

1965

10 0
10 0
10 0

125
125

163
140
125

188
160
140

238
180
170

263

110

200
200

N U M ER O S IN D ICE
Los valores agregados reales, en u.m. de 1956, sern:
1956

1957

1958

1959

1962

1965

A gricultura
Servicios
Ind u stria

2 000
4 000
1 600

2 080
1000
1 760

1 902
4 143
2 000

2 128
4 938
2 240

2 521
5 000
2 720

3 042
5 000
3 200

P rod u cto real

7 600

7 840

8 045

9 306

10 241

1 1 242

P ara o b ten er los valores agregados reales, en u.m.. de 1962 ser


necesario expresar los deflactores con base 1962.

D eflacto r agricultura
D eflacto r servicios
n d ice de prod. ind.

1956

1957

1958

1959

1962

1965

42
56
59

53
69
65

68
78
74

79
89
82

100
100
100

111
ill
118

Los valores agregados reales en u.m. de 1962! sern:

1956

1957

1958

1959

1962

1965

4 762
7 143
3 245

4 906
7 246
3 575

4 559
7 436
4 070

5 063
8 876
4 510

6 000
9 000
5 500

7 207
9 009
6 490

P roducto real 15 150

15727

16065

18449

20 500

22 706

A gricultura
Servicios
Ind u stria

L os resultados evid entem ente sern distintos, ya que se expresan


en unidades distintas: incluso, la tasa de crecim ien to del producto
real, por las razones citadas, ser d iferente.

b) Para calcular el deflactor implcito del producto, se aplicar la


Produ cto nom in al
relacin DI ---------------------------Producto real
En cu an to al producto real, puede tom arse cualqu iera de los va
calculados, segn la base tlel d eflactor im p lcito que se desee. De
esta m anera, si se pretend e que la base sea el ao 1956, se tendr:

139

SOLUCIN DE E JE R C IC IO S
1956

1957

1958

1959

1962

1965

9 600

11 700

15 700

20 500

24 000

9 306
168.7

10 241

11 242
213.5

600
P rodu cto n om in al
Produ cto real
(u.m. de 1956) 7 600
D eflacto r im p lcito 100.0

7 840
122.4

8 045
145.4

200.2

5] Con los datos presentados pueden construirse los siguientes ndices:


I n d i c e d e v a lo r
a h o r r o n o m in a l

n d i c e d e c a n tid a d
c o n stru cci n

100
460

100
120

1955
1962

n d ic e d e
c a n t id a d m ix to
'

100
105

E n virtud de la prueba de reversin de factores pueden obtenerse


los siguientes ndices de precios:

n d i c e s d e p r e c io s
c o n str u c c i n
1955
1962

n d ic e s d e p r e c io s
m ix to

100
383

100
438

E l nd ice de precias m ixto, ser una com binacin lin eal de los n
dices de precios parciales, ponderados p or el gasto:
IP

(m ixto) =

pero W c =

438 =

IP (const) W,. -j- IP (agrie) W a

Wa =

383 + IP (agrie)

---------1--------

IP (agrie) =

876 -

383 =

I P (a g rie)
b a s e 1955 = 100

493
I P (a g rie)
h a se 1962 = 100

100.0

20.3

493.0

100.0

140

NM EROS NDICE

L o s su p u e sto s a d m itid o s fu e r o n lo s sig u ie n te s:


ij Q u e lo s n d ic e s c u m p le n c o n la p r u e b a d e r e v e r s i n d e fa c to re s;
ii] Q u e e l n d ic e d e p r e c io s m ix to se o b tie n e a p a r tir d e u n p r o
m e d io p o n d e r a d o d e lo s n d ic e s p a rc ia le s;
iii] Q u e la e str u c tu r a d e l n d ic e d e p r e c io s a g r c o la s e s la m ism a
e n tr e lo s a o s 19 5 5 y 19 62 .
6] S e c a lc u la r u n n d ic e d e c a n tid a d d e L a sp e y r e s
IQ L =

Arios

19 58
19 59
1960
1961
1962
1963

b)

2 q p
A
'Po
20

B
QnPo
12 0

20

160

20

12 0

160
160
160

20

24
30

a
'loPo

Repre- qnp0 ndice


Total sent. Ajust. base
2 qp0
% 100% 1958=.

D
'IPo

48
56
64
80
80

196
244

8
8
8

2 12

272
276
298

12
12

10 0

7 8 .4
7 9 .8
6 0 .9
8 8 .4
8 4 .6
8 5 .2

250
306
348
308
326
350

139
123
131
140

Putfn

ndice

10 0
12 2

2 p q

ip i = . _ d o n d e 0: 19 59
2 Po qo

Ailos

A
Polo

1958
1 9 59
1960
1961
1 9 62
1963

30
30
30
30
36
,45

B
PoOo
12 0

160

12 0

160
160
160

C
Po9n

48
56
64
80
80
10 0

D
Po9
8
8
8
12
12
8

pq

206
254
222

282
288
313

196
254
256
398
406
426

c) El ndice de la relacin de intercambio est dado por


IP X
I R I = ----------IP M

95.1
10 0 .0

11 5.3
141.1
141.0
136.1

141

SOLUCIN DE E JE R C IC IO S

P a r a d is p o n e r d e lo s d o s in d ic e s d e ig u a l b a se, se e fe c tu a r u n
c a m b io d e b a se a r itm tic o e n e l IP M .

IP X
IP M
IR I

1958

1959

1960

1961

1962

1963

95.1
8 5 .0
111.9

10 0 .0
10 0 .0

11 5.4
13 3.3

141.1
20 0.0

10 0 .0

86.6

14 1.0
2 5 8 .3
5 4 .6

136.1
3 5 8 .3
3 8 .0

7 0 .6

7] S e c o n sid e r a r n d o s g r u p o s: u n o c o m p u e s to p o r lo s c ig a r r illo s (C )
y o tr o c o m p u e s to p o r to d o e l r e sto d e lo s b ie n e s (R )
1C (W c ) - f I R (W u ) = 1.0 18
1.7 W c -f- 1.0 \V R = 1.0 1 8
pero W 0 4 - W R = 1
1 .7

Wc

. 1.0 (1 - W c ) = 1.0 18
0 .7 W c = 0 .0 1 8
0 .0 1 8
VVC = --------- = 0 .0 2 6
0.7

L o s c ig a r r illo s tie n e n u n 2 .6 % d e p o n d e r a c i n d e n tr o d e l n d ic e
d e c o sto d e v id a .

SEGUNDA P A RTE

ANALISIS DE REGRESION
Y CORRELACION

ANLISIS DE REGRESIN

A. MTODO DE LOS MNIMOS CUADRADOS

Probablemente uno de los temas estadsticos ms utilizados en la


planificacin es el que se refiere al anlisis de regresin y co
rrelacin.
Es de extraordinaria utilidad conocer en qu forma estn re
lacionadas las variables objeto de anlisis, es decir, la funcin ma
temtica capaz de representar tal relacin.
Conociendo tal funcin, es posible estimar el comportamiento
de la variable objeto de estudio, denominada variable dependiente
o predictando, de acuerdo a las variaciones de otra u otras varia
bles denominadas independientes o predictoras. De lo anterior se
deduce que la regresin debe aplicarse a variables que tengan una
relacin lgica, es decir, que exista razonablemente dependencia
entre las variables. Desde el punto de vista terico, a cualquier par
de variables puede encontrrseles una funcin matemtica o ecua
cin de regresin que las relacione, pero slo ser de utilidad cuan
do haya una relacin de causalidad entre dichas variables.
Es necesario distinguir dos etapas en el proceso de ajuste por
mnimos cuadrados; por una parte, est el problema de elegir la
funcin que relaciona en forma adecuada a las variables; por otra,
la necesidad de disponer de un mtodo que permita determinar
los valores que asumen los parmetros de la ecuacin de regresin.
Para solucionar el problema sealado en primer lugar, pueden ser
de mucha utilidad las representaciones grficas y los anlisis nu
mricos de las series de datos. A veces, el propsito es verificar el
cumplimiento de ciertas teoras, se trate de una adaptacin de
teoras ya existentes, o del planteamiento de otras nuevas. En am
bos casos la funcin sujeta a verificacin ya est elegida.
Una forma de determinar los valores de los parmetros est
dada por el mtodo de los mnimos cuadrados, cuyo tratamiento se
detalla para cada uno de los casos que se presentan a continuacin:
1]
Regresin simple. Se denomina de esta manera a la metodo
loga que permite obtener ecuaciones, donde slo intervienen dos
variables: una dependiente o predictando y otra independiente o
[145]

146

ANLISIS DE REGRESIN

predictor. Cuando por medio del anlisis lgico se ha comprobado


la existencia de una relacin de causalidad directa o indirecta entre
las variables, es necesario determinar cul es la funcin matemtica
que representa adecuadamente la relacin. Para ello es indispensa
ble disponer de informaciones acerca de los valores que ha alcanza
do cada una de las variables en distintos perodos, si se trata de un
anlisis histrico cronolgico, o en distintos lugares si se trata de
un corte transversal en el tiempo. Con las informaciones obtenidas,
que deben ser suficientes en nmero para garantizar un buen
ajuste, se construir una grfica y se podr decidir si la funcin
adecuada es una recta, una hiprbola, una parbola, una potencial,
una exponencial, etctera.
Una vez que se ha decidido cul es la funcin adecuada para
el ajuste de regresin, es posible determinar los parmetros de la
funcin elegida.
a)
Lnea recta: Si al representar los puntos en una grfica, stos
muestran un comportamiento rectilneo como en el ejemplo si
guiente:
g r eic a

17

es necesario calcular los partnetros o coeficientes de regresin de


dicha recta.
Yc = a Xi + b,
para poder determinar los valores de a y b, se recurre al mtodo
de los mnimos cuadrados, que cumple la condicin de minimizar
la siguiente expresin:

i-1

(Y, - Y c)2

donde Y: es un valor observado;

147

MTODO DE LOS MNIMOS CUADRADOS

Y c: es u n v alo r calcu lad o p o r la ecu aci n de regresin ;

n: es el nmero de observaciones.
Si se remplaza Yc por a X - f b dentro de la sumatoria, es po
sible, derivando, encontrar los valores de los coeficientes de regre
sin a y b que satisfacen la condicin. En efecto, llamemos Z a la
expresin:
Z = 2 (Y. - a X , - b)2
Se trata de derivar parcialmente respecto de cada uno de los
parmetros
~ = 2 2 {Y, - a X , - b) ( - 1) = 0
b
Aplicando las propiedades de la sumatoria se tiene:

2 Y1 = a 2 X 1 -)-nb
que es la primera ecuacin normal.

= 2 2 (Y - a X , - b) ( - X ) = 0
8a
Aplicando propiedades de la sumatoria
2-YiX, = a 2 X't -f z 2 X ,
que es la segunda ecuacin normal.
Obsrvese que se tienen dos ecuaciones normales y dos incgni
tas. Se trata de un sistema de ecuaciones que permiten calcular los
parmetros o coeficientes de regresin.
1? Ecuacin normal 2 Y i = a 2 X i - ) - n b
2^ Ecuacin normal: 2 Y X = a 2 X

} Sistema
b2 XJ

Donde 2 Y es la suma de los valores observados de la variable


dependiente; S X , es la suma de los valores observados de la va

148

ANLISIS DE REGRESIN

riable independiente y n es el nmero de observaciones. En este


caso el sistema est formado por dos ecuaciones, porque slo hay
dos parmetros por determinar. El signo del coeficiente de regre
sin que corresponde con la pendiente de la recta (a), determina
si la regresin es directa o inversa. Si a es positivo, quiere decir
que ante incrementos de la variable predictor, corresponde incre
mentos de la variable predictndo. Si el signo de a es negativo,
ante incrementos de la variable predictor habr decrementos de la
variable predictndo y se dice que la regresin es inversa.
Hasta el momento se estuvo planteando una regresin de Y
en X , es decir, considerando a Y como variable dependiente y a X
como variable independiente, cuando se trataba de minimizar:
1 (Y, - Yc)2
i-i

Puede perfectamente plantearse una regresin de X en Y,


donde lo que interese minimizar sea:
2 (X, - X c)2
i-i

siendo X c = a Y t + b.
Las ecuaciones normales, en este caso, por analoga, sern:
2 X f = a 2 Y, + nb
2 X ,Y , = ~ 2 Y + b 2 Y,
Tngase presente que los parmetros de la regresin de Y en
X , sern distintos de los parmetros de la regresin de X en Y.
Por ello suele distinguirse a estos parmetros de la siguiente ma
nera:
aYX: coeficiente de regresin de Y. en X ;
aXY: coeficiente de regresin de X en Y.
En general, cuando se analiza la relacin de las variables cuya
regresin se pretende determinar, se puede especificar cul es la
variable dependiente y cul la independiente. Una vez tomada la
decisin, se denominar con Y, a la variable dependiente o pre-

149

M TODO DE LOS M NIM OS CUADRADOS

dictando, y con X a la variable independiente o predictor, para


evitar confusiones. A continuacin se plantea un ejemplo que per
mitir aclarar algunos aspectos que son difciles de explicar de otra
manera. Como el lenguaje de los smbolos es claro, no permite
malos entendidos ni interpretaciones equivocadas.
Ejemplo: Durante los ltimos aos las ventas de una empresa
han crecido por razones de una intensa campaa de promocin de
ventas; dichas variables han tenido el siguiente comportamiento
en el tiempo.

yen tas
Y

Ao

19 58
19 5 9
19 6 0
1961
19 6 2
1963
19 64

Gasto en propaganda

10 0

10

150

14

20 0
2 10

21
22

300
500
600

28
45
55

Interesa determinar la funcin matemtica o ecuacin de re


gresin que relaciona estas variables. Representando estos valores
en un grfico, se concluir que la recta representa adecuadamente
la relacin de las variables. Para determinar los parmetros de la
recta, se plantean las ecuaciones normales
2 Y, = a 2 X , + nb
2 Y ,X , = a 2 X2t -f b 2 X ,
Luego es necesario tabular los valores que interesa remplazar
en estas ecuaciones normales; a continuacin se procede a hacer
lo as:

Yt
10 0

Xi
10

150

14

20 0
2 10

21
22

300
500
600
2 060

28
45
55
19 5

YX
1 000
2 10 0

4 200
4 620
8 400
22 500
33 000
75 820

*1
10 0

19 6
441
484
784
2 02 5
3 025
7 055

150

ANLISIS DE REGRESIN

Las ecuaciones normales en valores sern:


2 060 = 195 a -j- 7 b
75 820 = 7 055 a + 195 b
Resolviendo el sistema
a = 11.4
b =s= - 26.1
La ecuacin de ajuste queda en consecuencia expresada as:
Y 0 = 11.4 X , - 26.1
Por medio de esta ecuacin se puede determinar valores calcu
lados de la variable dependiente para cualquier valor de la va
riable independiente. Naturalmente que al realizar estimaciones,
por ejemplo para calcular el probable volumen de ventas ante un
desembolso en propaganda de 100 (X t = 100), debe tenerse en
cuenta el campo de validez de la regresin. No escapar a la aten
cin del lector el hecho que aumentos sucesivos de propaganda no
siempre implicarn mayores volmenes de venta, porque puede
darse en un momento determinado la saturacin del mercado u
otro obstculo semejante. En consecuencia es necesario que, cuan
do se realicen estimaciones, se verifique el cumplimiento de los
supuestos implcitos en los datos disponibles. Por ello sobre el re
sultado de una proyeccin, es indispensable advertir que slo ten
dr validez si se sigue manteniendo la tendencia de los puntos ob
servados durante el perodo histrico.
b) Potencial: Una funcin muy utilizada enproyecciones, por
su flexibilidad, es la denominada funcin potencial o de elastici
dad. Su expresin matemtica es la siguiente:
Yc = b X
Para determinar las ecuaciones normales se procede en forma
similar al caso de la recta, realizando previamente, mediante la
aplicacin de logaritmos, una transformacin lineal:
log Yc = log b + a log Xi
log Yc = b' -j- a lg X ,

donde

b' = log b

MTODO DE LOS M NIM OS CUADRADOS

151

En este caso se trata de minimizar la expresin:


Z= i

(log Y - log Yc)-

i- l

es decir:
Z = 2 (log Y, - a log X , - b')2
Derivando respecto de cada uno de los parmetros e igualando
los resultados a cero, se obtendrn las dos ecuaciones normales.

- - = 22
o b'

(log Y, - a log X , - b') ( - 1 ) = 0

Z
= 2 2 (log Y a log X , - b') (-lo g X .) = 0
a
Aplicando a ambas derivadas las propiedades de la sumatoria,
se tiene:
2 log Y = a 2 log Xi -j- n b'
2 log Y, log X , = a 2 (log X )2 + b' 2 log X ,
que forman el sistema de dos ecuaciones normales que permitirn
el clculo de los dos parmetros. Evidentemente el mtodo es un
tanto laborioso cuando se tienen muchas observaciones, ya que es
necesario trabajar en los logaritmos con por lo menos 5 decimales
para evitar aproximaciones que pueden implicar serios desajustes.
c)
Exponencial: Cuando se desea calcular tasas de crecimiento
tomando en cuenta todos los puntos observados en el perodo his
trico se recurre principalmente a la funcin:
Y = a b*

donde b = 1 + i
t: tiempo en perodos

Aplicando logaritmos a la anterior expresin:


log Yc = log a 4 - t, log b

152

ANLISIS DE REGRESIN

Como en los casos anteriores interesa minimizar la expresin


Z = 2 (log Y, - log Yc)2
i-i

Z 2 (log Y, log a t| loe b)2

g -j--- = 2 2

- - = 22
o log b

(log Y, - log a - t, log b) (-1 ) = 0

(log Yt - log a - t, log b) ( - t ,) 0

Aplicando las propiedades de la sumatoria, se obtienen las dos


ecuaciones normales
2 log Yi =

n log a +

lg b 2 ti

2 t !^g Y, = log a 2 t, -)- log b 2 t2


El caso general de la funcin exponencial es l clculo de tasas
de crecimiertte cuando se considera el tiempo como variable inde
pendiente. Sin embargo, puede considerarse cualquier otra variable
independiente y ajustar la funcin sin hacer referencia a tasas de
crecimiento.
En general se obtienen significativas ventajas, cuando se cambia
la escala de unidades para la variable t. De este modo, si se tiene
una serie con un nmero impar de datos, se le asigna el valor cero
al perodo central y sucesivamente los primeros dgitos con signo
positivo para perodos posteriores y con signo negativo para pero
dos anteriores. Con ello se consigue que la sumatoria de t sea nula,
con lo cual se facilita la resolucin del sistepia. Cuando el nmero
de datos es par, a los dos perodos centrales se le asignan los va
lores 1 y -j-1 y para perodos posteriores los primeros nmeros
impares con un signo positivo y con uno negativo para los perodos
anteriores.
d)
Parbola: Esta conocida funcin se ajusta en forma similar a
los casos anteriores.
Yc a' x 2 -f- b X -f- c
Dado que la forma general contiene tres parmetros, ser nece
sario determinar tres ecuaciones normales para determinar los va

155

M TODO DE LOS MINIMOS CUADRADOS

lores de a, b, c. Estas tres ecuaciones normales provienen de la de


rivacin parcial respecto de cada uno de dichos parmetros, intereza minimizar la expresin:
Z = 2 (Y, Yc)s
i-i

Z = 2 (Y, a

b Xi c)*

Derivando respecto de a, b y c, se tiene:


z
c
z
b

= 2 2 (Y, - a X 2 - b X , - c) (- 1 ) = 0

= 2 2 (Y, a X2, - b X i - c )

z
------ = 2 2
a

(Y ,-aX V -b X ,-c)

( - X ,) = 0

( - X 2, ) = 0

Aplicando las propiedades de la sumatoria, se tienen las siguien


tes ecuaciones normales:
H Ecuacin

normal: 2 Y, =

a 2 X2, - f

2^ Ecuacin

normal: 2 YX = a 2 X 2- + sb 2

X 2 -f- c 2 X ,

3? Ecuacin

normal: 2 YiX 2= a 2 X*

X* -f- c 2 Xfj

-f- b 2

b 2 X -(-n c

Puesto que durante el perodo histrico se


tienenlos valores de
Y i y X 1; es necesario tabular todas las sumatorias que aparecen
en las ecuaciones normales. Resolviendo el sistema, se tiene deter
minado el valor de cada uno de los tres parmetros.
e)
Hiprbola equiltera: Para el ajuste de algunas funciones de
demanda y por la propiedad que tiene que cualquier punto de la
funcin subtiende superficies iguales con los ejes de coordenadas,
su aplicacin es bastante frecuente. Se trata de un caso particular
de la funcin potencial. Su expresin matemtica es:

154

ANLISIS DE REGRESIN

En vista de que slo tiene un parmetro, ser necesario calcular


una ecuacin normal, minimizando la expresin:
Z = 2 (Y, - Y c)2

Z = 2 (Y, - - - ) 2
v
X ,'
Derivando respecto de a
Z
_

f S

Aplicando las propiedades de la sumatoria se tiene:


Y,
1
Ecuacin normal 2 ------= a 2
X,
X2

f)
Otras funciones: Dentro del campo de la investigacin econ
mica a veces es preciso ajustar funciones particulares. La metodo
loga de la obtencin de ecuaciones normales es similar a los casos
considerados. Por ejemplo la funcin:
Y,, = a log X , -f b
Siempre se tratar de minimizar la expresin
Z = 2 (Y Ye)2
i-i

Z = 2 (Y, - a log X , - b)2


Donde:
^ = 2 2
ob
~

8a

( Y , - a l o g X , - b ) ( 1) = 0

= 2 2 (Yt - a log X, - b) ( - log X, ) = 0

155

MTODO DE LOS MNIMOS CUADRADOS

Las ecuaciones normales sern:


2 Y, = a 2 log X , -f- nb
2 Y, log X , = a 2 (lo^ X ,)2 + b 2 log X ,
Resolviendo el sistema, es posible determinar el valor de los
parmetros.
Siempre es conveniente seguir esta metodologa, para funciones
cuyas derivadas no compliquen demasiado las expresiones que
aparecen en las ecuaciones normales.
2]
Regresin m ltiple. Ocurre que a veces es necesario encon
trar funciones donde se relacionen una variable dependiente y
dos o ms variables independientes, de all el calificativo de ml
tiple. En este caso se adoptar una simbologa especial, para de
signar cada una de las variables y parmetros:
X j: variable dependiente;
X 2, X 3 . . . X p: variables independientes.
Por lo tanto, si se trata de un caso de regresin mltiple donde
se consideren dos variables independientes, la funcin se expre
sar de la siguiente manera:
X c 1 .2 3

a 1 .2 3 +

b l 2 .3 X

2+

b j 3 .2

X3

donde:
X 123: indica la variable dependiente X , que se relaciona con
las variables X 2 y X 3; esa es la razn de los subndices.
ai.23: coeficiente de posicin (trmino libre) del plano de re
gresin donde se consideran la variable dependiente X ,
y las variables independientes X , y X,.
bi2.s: coeficiente de regresin que multiplica a la variable X,
cuando adems se consitiera la variable X 9.
b192: coeficiente de regresin que multiplica a la variable X 3,
cuando adems se considera la variable X 2.
Es fcil extender esta notacin para los casos en que se consi
deren 3 o ms variables independientes. En el caso de tres varia
bles independientes (X 2, X 3, X 4) la funcin quedar as sim
bolizada:

A N L IS IS D E R E G R E S I N

156

Xc 1.284 == a1.2S4 -f- 1*12.34 X 2 -+- b ]324 X 3 -|- b14.23 X 4


El lector, por analoga con el caso anterior, puecle interpretar
cada uno de estos smbolos.
Cuando se desea ajustar una funcin de este tipo a una serie
de datos, el mtodo de los mnimos cuadrados implica hacer m
nima la expresin.
S

(X j-X e j. )*

donde X t son los valores observados y X c i ,23 son los valores cal
culados de la variable dependiente. Por simplificaciones, se su
prime el subndice i. Las ecuaciones normales, en el caso de dos
variables independientes, se obtienen minimizando la siguiente
expresin:
Z 2 (X t 84.21 b12 3 X , b13 2 X 3)
Para ello, se deriva parcialmente respecto de cada uno de los
parmetros, igualando los resultados a cero.

------- = 2 2 (Xj a123 b12 3 X 2 b13 2 X 3) ( 1) = 0


o at 23

O bjo i

2 2 (X x ax 23 b12 3 X 2 bJ3 o X 3) ( X 2) 0

----- 2 2 (Xj a 123 b12 3X 2 b13 2 X 3) (X 3) 0


8 b)3 o
Aplicando las propiedades de la sumatoria se tienen las siguien
tes tres ecuaciones normales que formarn el sistema para calcular
el valor de cada uno de los tres parmetros.
2 X .4 b4o 32 X 2
|bj3 2 2 X i
(n a 4.23
2 X , X 2 = b12 3 2 X|

b ,3.2 2 X 2 X s -f- a ,.23 2 X 2

2 X 4X 3 = b12.3 2 X 2 X 3 + b13.2 2 X + 34.03 2 X 3

CONSIDERACIONES PRACTICAS

157

Tabulando los valores de las sumatorias que aparecen en el


sistema, se podr resolver para cada parmetro.

B. CONSIDERACIONES PRACTICAS

En pginas anteriores se ha detallado la metodologa que permite


obtener ecuaciones normales por el mtodo de los mnimos cua
drados, para el tipo de funciones usado con ms frecuencia en la
planificacin. Ahora se pretende enunciar algunas de las consi
deraciones que es necesario hacer, desde el punto de vista prctico,
cuando se realizan los mencionados ajustes.
1] R especto del tipo de funcin. Si se piensa que una de las
principales aplicaciones de la regresin es la proyeccin, en el
tiempo o en el espacio, donde no se tienen valores de la variable
estudiada, y donde no queda otra alternativa que conformarse
con estimaciones provenientes de extrapolacin de funciones ajus
tadas por regresin, deber admitirse la necesidad de disponer de
funciones sencillas que contengan un reducido nmero de varia
bles y parmetros. Recurdese que una funcin complicada, de
muchas variables y parmetros, se parecer ms bien a una inter
polacin, a una funcin que se aproximar al mayor nmero de
puntos observados. Para determinar tendencia no tiene sentido
la interpolacin. Recurdese que para proyectar una variable de
pendiente, es necesario disponer de estimaciones para todas las
variables independientes; pero disponer de estimaciones para mu
chas variables independientes suele ser en extremo difcil y en
todo caso existe alta probabilidad de cometer errores. En cambio
una funcin sencilla, como las analizadas en pginas anteriores,
puede representar cabalmente una tendencia de la relacin de la
variable dependiente con la o las variables independientes.
2] R especto del nm ero de observaciones. Un buen ajuste im
plica disponer de una cantidad significativa de puntos observa
dos; el conjunto de puntos observados representa una muestra de
la relacin de las variables en el tiempo o en el espacio. Mientras
ms grande esta muestra, es decir, mientras mayor nmero de
puntos se posea, tendr ms representatividad y menor ser la
probabilidad de cometer errores. Cuando se est analizando una
ecuacin de regresin, una de las primeras cuestiones que se debe
aclarar ser el nmero de observaciones, para que con este ante
cedente se califique en parte la significacin de la regresin.
3] R especto de la dificultad del clculo. El lector comprobar,
a travs de la realizacin de ejercicios, el trabajo que exigen los

158

ANLISIS DE REGRESIN

clculos de regresin. En la prctica, cuando ya se tiene aclarada


la parte conceptual, para lo cual constituye una importante ayu
da la realizacin de ejercicios con calculadoras convencionales,
ser til recurrir a los computadores electrnicos, ya que una vez
entregadas las informaciones originales, en brevsimo tiempo po
dr disponerse de clculos exactos, ya que los programas de re
gresin estn previamente diseados. Por otra parte, respecto de
la deduccin de las ecuaciones normales, puede significar cierta
demora obtenerla basndose sobre las derivadas parciales. Existe
una regla nemotcnica para hallar ecuaciones normales en fun
ciones lineales respecto de los parmetros. La regla es la siguiente:
Para la primera ecuacin normal, multipliqese la funcin a
ajustar por el coeficiente del primer parmetro, y luego apli
qese el operador sumatoria a la funcin. Para la segunda ecua
cin, multipliqese toda la funcin por el coeficiente del segundo
parmetro y luego apliqese el .operador sumatoria. Y as sucesi
vamente para todas las ecuaciones normales que se deba obtener.
Ejemplos: Se obtendrn las ecuaciones normales de la funcin:
lo g Y c

= al ogX, + logb

Multiplicando ambos miembros de la ecuacin por el coeficien


te de logb que es 1, y aplicando sumatoria, se tiene la primera
ecuacin normal:

2 log Y

a 2 log Xi

- f-

n log b

Multiplicando ambos miembros de la ecuacin por log X que


es el coeficiente del otro parmetro y aplicando sumatoria, se
tiene:
2 log Y, log X = a 2 (log X ,)2 + log b 2 logX,
que es la segunda ecuacin normal. Comparando estas dos ecua
ciones normales con las obtenidas por derivacin parcial en la
parte 1 , b se concluye que son idnticas.
Si se quisiera obtener la ecuacin normal de una recta que pasa
por el origen, se tiene:
Y c = aXj
(recta que pasa por el origen ya que no tiene trmino libre; coe
ficiente de posicin 0).

CONSIDERACIONES PRCTICAS

159

Multiplicado por X , que es el coeficiente del nico parme


tro, y aplicando sumatoria, se tiene:

2 YjX = a 2 X*
Por el proceso de derivacin, se llega al mismo resultado. En
efecto:
Z 2 (Y Y c)2 = 2 ( Y i - a X O 2
i=l

Z
a

= 2 2 (Y, - aX) ( - X .) = 0

2 Y, X, = a 2 X 7
En las pginas siguientes se tratarn conceptos referentes al
anlisis de correlacin, conceptos que permitirn cuantificar el
grado de asociacin entre las variables estudiadas y la validez de
las proyecciones a travs de las ecuaciones de regresin.

II

CORRELACIN

A . O B JE T IV O S D E L A N LISIS DE CORRELACIN

En el capitulo anterior se presentaron las tcnicas del ajuste de


funciones por el mtodo de mnimos cuadrados. Una vez deter
minada la funcin, es necesario especificar si hay asociacin entre
las variables consideradas y en qu m edido lo estn. En caso de
que las variables estn ntimamente asociadas, la ecuacin de re
gresin puede utilizarse para explicar el comportamiento de la
variable dependiente (explicada) en trminos de las variaciones
que experimente la variable independiente (explicativa). Por
ejemplo, el incremento del volumen de venta de artefactos elc
tricos puede ser explicado por aumentos en los niveles de ingre
so, por variaciones en los precios, por modificaciones en los tipos
de cambio, etc. Por otra parte, el instrumento de la regresin y
correlacin puede ser empleado en la estimacin de valores de la
variable dependiente (predictndo), en el entendido que se cono
cen las variaciones de la variable independiente (predictor). En
general, los planes de desarrollo especifican los niveles de ingreso
por habitante que se pretende alcanzar en los prximos perodos;
con tales datos y la ecuacin de regresin del caso, pueden esti
marse magnitudes de las variables que muestren un alto grado de
asociacin con el ingreso, tales como el consumo, la importacin
de alimentos, la reinversin de utilidades, etc. En todo caso, la
validez de una proyeccin por regresin depende del grado en
que estn asociadas entre s las variables; Si es alto el grado de
la asociacin, la estimacin tiene base de fundamento, y si la
asociacin es dbil, la proyeccin no se justifica.
Recurdese que para determinar la ecuacin de regresin es
necesario contar con antecedentes sobre los valores que han toma
do las variables; la representacin grfica de estos valores ayuda
a especificar el tipo de funcin. En esta etapa ya puede adelan
tarse algo acerca del grado de asociacin. Obsrvese los dos dia
gramas siguientes:
[

160 ]

T IP O S
GRFICA

161
18

En el primer diagrama de dispersin los puntos estn ms ale


jados de la funcin que en el segundo; la proximidad de los pun
tos observados a la funcin determina el grado de asociacin.
El objetivo bsico del anlisis de correlacin es pues evidente:
se trata de disponer de un indicador cuantitativo del grado de
asociacin que respalde la ecuacin de regresin que se pretende
utilizar. De hecho, un conjunto de puntos que muestren la rela
cin de un par de variables puede ser representada por cualquier
funcin, pero una representacin adecuada slo se consigue cuan
do la garantiza una asociacin estrecha entre las variables.

B. TIPOS DE CORRELACIN

En forma similar a la clasificacin de los tipos de regresin pre


sentada en el captulo anterior, se puede distinguir los siguientes
tipos de correlacin:
1] Atendiendo al nmero de variables:
a) Correlacin simple. Cuando se estudia el grado de asocia
cin entre un par de variables: dependiente e indepen
diente.
b) Correlacin m ltiple. Cuando se estudia el grado de aso
ciacin que simultneamente existe entre la variable de
pendiente y dos o ms variables independientes.
c) Correlacin parcial. En el caso de correlacin mltiple, la
cuantiicacin de la asociacin neta entre dos variables,
una vez que se elimina estadsticamente la influencia de
otras variables independientes.
2] Atendiendo a la forma de la funcin: Segn el tipo de ecua-

162

CORRELACIN

cin de regresin se tiene correlacin rectilnea, parablica,


potencial, exponencial, logartmica, etctera.
3] Atendiendo a la relacin de variables:
a) Correlacin directa o positiva. Cuando por aumentos en
la variable independiente corresponden aumentos de la va
riable dependiente.
b) Correlacin inversa o negativa. Cuando por aumentos en
la variable independiente corresponden disminuciones
de la variable dependiente.

C. EL COEFICIENTE DE CORRELACIN

Definicin. Un coeficiente de correlacin indica el grado de aso


ciacin entre las variables; se simbolizar por r y se definir de la
siguiente manera:

Donde Syu representa la varianza explicada, es decir, aquella


parte de la varianza total explicada por la ecuacin de regresin
y Sj representa la varianza total como se la defini en la primera
parte del trabajo, es decir:

S (Yc -Y )-'
n

(Yc: valor calculado)

(Y: valor observado)


Como puede observarse, ambas varianzas expresan un promedio
le cuadrados de desviaciones respecto de la media aritmtica y su
cmputo no difiere del que se realiza para una varianza cualquie
ra. Lo que ocurre es que la variabilidad total se descompone en
dos fuentes: la varianza explicada y la varianza no explicada que
se define:
2 (Y, Y c)2
n

LIM ITADORES

163

Lgicamente la suma de la varianza explicada y la varianza no


explicada reproduce la varianza total, como se demuestra ms ade
lante. La raz de la varianza no explicada, por el hecho de ser un
indicador del grado de dispersin de los puntos observados res
pecto de los puntos calculados por la ecuacin de regresin, reci
be el nombre de error de proyeccin y se utiliza para fijar inter
valos de confianza.
Observando la frmula del coeficiente de correlacin, ste pue
de interpretarse como la proporcin que representa la desviacin
tpica explicada dentro de la desviacin tpica total.

D. LIMITACIONES DE LA CORRELACIN

La rapidez y sencillez con que ha sido presentado el tema puede


hacer que la correlacin se interprete sin salvedades y con ilimi
tados alcances; por ello parece conveniente plantear los siguien
tes puntos.
1] Un alto coeficiente de correlacin no necesariamente deter
mina causalidad entre las variables; dos variables pueden apare
cer correlacionadas por casualidad y no porque exista una relacin
de dependencia entre ellas.
2] En cuanto a las variables, es necesario que aparezcan depu
radlas de las influencias de otras variables. Dos series nominales
pueden mostrar estrecha asociacin porque hay una tercera varia
ble: alzas de precios, que exagera el grado de asociacin. Por ello
es conveniente trabajar con series reales, por habitante, de mane
ra que haga ms significativa la correlacin.
3] Dos series pueden tambin arrojar coeficientes de correlacin
cercanos a uno, porque el tamao de muestra es insuficiente. En
un caso extremo, cuando slo se tomen dos puntos, el coeficiente
de correlacin rectilneo mostrar en general un valor igual a la
unidad, pero esto no garantiza la adecuada significacin. La cali
ficacin del grado de asociacin no puede dejar de considerar el
nmero de puntos utilizados en el estudio.
4] Desde el punto de vista del tipo de funcin, sobre todo cuan
do se tiene por objetivo la proyeccin de una variable, es conve
niente trabajar con funciones sencillas capaces de representar la
tendencia de la nube de puntos. Si se posee una funcin compli
cada con muchos parmetros y muchas variables independientes,
posiblemente se obtenga un alto coeficiente de correlacin, porque
la funcin, dada su complejidad, pasar muy cerca de los puntos
observados. Sin embargo, la correlacin pierde validez como ga

164

CORRELACIN

ranta de una adecuada proyeccin; estimar los valores de las va


riables independientes, es decir, fijar las variables exgenas se hace
ms difcil cuando stas son numerosas.
5] No debe olvidarse que la proyeccin por regresin y correla
cin es vlida en tanto sigan en vigencia los supuestos y circuns
tancias implcitos en los datos y antecedentes disponibles. Proyec
tar por regresin la produccin agrcola de los prximos perodos,
por ejemplo, haciendo caso omiso de una eventual reforma agra
ria, probablemente conducir a estimaciones alejadas de la reali
dad. Es importante, cuando se realizan estimaciones, dejar en cla
ro los supuestos bsicos y admitir que cualquier desviacin de es
tos supuestos exige tina revisin del modelo de proyeccin o del
modelo de anlisis segn el caso.
6] Por ltimo, merece destacarse que los modelos de regresin
y correlacin significan una perm anente revisin de supuestos y
acumulacin de nuevos antecedentes que permitan ajustar el mo
delo a las nuevas circunstancias.

E. CORRELACIN RECTILNEA

Es conveniente presentar en detalle los conceptos expuestos en


forma general aplicados al caso especfico de la correlacin rec
tilnea.
1]
Representacin de las magnitudes que determinan las varianzas
Se enunci que la varianza denominada total corresponda exac
tamente con el concepto utilizado en la primera parte del trabajo.
En efecto:

Jy

2 (Y Y)2

---------------------

En la grfica 19 pueden observarse las desviaciones que toma en


cuenta este estadgrafo.
La varianza explicada la determinan las desviaciones de los valo
res calculados respecto de la media aritmtica.

165

CORRELACIN R E C T ILN EA
GR FICA

19

Grficamente;
g r f ic a

20

La varianza no explicada la determinan las desviaciones de los va


lores observados respecto de los valores calculados.
2 (Y i Y t.)2

2>Yg

Grficamente:

-------

166

CORRELACIN

GR FICA 2 1

Evidentemente:
S = Sic -(- Sys
ya que:
2 (Y, - Y)2 = 2 (Y. - )2 + 2 (Y, - Y,p
2 Y ! - 2 2 Y, + n Y 2 = 2 Yi - 2 2 Yc + n * + 2 Yi - 2 2 Y Yt. + 2 Y?
Por otra parte 2 Yi = 2 Y 0 ya que:
2Yi = a 2 X - | - n b

ecuacin normal.

Yc = a Xi -j- b
Ecuacin de regresin rectilnea,
que al aplicarle el operador sumatoria, se transforma en:
2 Y,. = a 2 X , -f n b
Luego
2 Yc = 2 Y,
La relacin original en consecuencia puede simplificarse:
2 2 Y, Yc 2 2 Y, = 2 2 Y* 2 2 Y,
pero,

2 Yi = 2 Yc

C O R R E L A C I N R E C T IL N E A
y queda:
Pero:

167

2 Y, Y,. = 2 Y?
Yc

a X

- f-

Y* = a2 X*, + 2ab X , + b2
Yac = 32 X 1 4 . ab X , + ab X , + b=
Y: = a (a X=j -f b X ,) + b (a X , + b )
2 Y? = a (a 2

X? -f b 2 X .)

+ b (a 2 X , + n b)

Las expresiones entre parntesis son las ecuaciones normales de


una recta, luego
2 Y? = a 2 X , Yt + b 2 Y,
Por otra parte
2 Y, Y 0 = 2 Y, (a X , + b)
ya que
Y,. = a X , + b
2 Y, Y.. = a 2 X , Y, + b 2 Y,
Luego
2 Y? = 2 Y , Ye
y por consiguiente
S? = S*c + SI.
De esto se deduce que el valor numrico del coeficiente de correla
cin, o de su cuadrado que se denomina coeficiente de determi
nacin, flucta entre 0 y 1 .

168

CORRELACIN

Los lmites planteados son casos generales. Cuando no se elige en


forma adecuada la ecuacin de regresin, es posible encontrar coe
ficientes de correlacin que adoptan valores no comprendidos entre
los lmites establecidos.
En correlacin rectilnea se asigna el signo positivo de la raz
cuando se trata de correlacin directa y el signo negativo si la
correlacin es inversa. En este caso, entonces los lmites sern:
-I < r < 1
El coeficiente de correlacin tomar un valor igual a la unidad
cuando todos los puntos observados estn situados sobre la ecua
cin de regresin, y tomar el valor cero cuando la ecuacin de
regresin coincida con una paralela al eje de las abscisas a la al
tura de la media aritmtica.
g r fic a

22

x
X

Xx

2] Mtodo abreviado de clculo


El clculo del coeficiente de correlacin basado en las varianzas,
es decir, en la definicin, implica cuantificar los valores calculados
por la ecuacin de regresin, lo que por s mismo representa un
trabajo bastante laborioso. El mtodo que a continuacin se ex
pone, aprovecha los clculos que se debieron realizar para deter
minar los parmetros de la ecuacin de regresin. Si se recuerda
la definicin:
r2_

S|c _

r" ~

S%

2 (Yc Y)2

2 (Y, - Y)*

169

CORRELACIN R E C T ILN EA

2 Y? 2 Y 2 Yc -f- n Y2
2 Y? - 2 2 Y , - f n 2

Obsrvese que 2 Y, = 2 Y| = n Y
2 Y? 2 n 2 -j- n Y2

2 Y2 - n Y 2

2 Y? 2 n Y2 -(- n 2

2 Y? - n Y 2

Ser necesario encontrar una expresin para 2 Y? . En el punto


anterior se demostr que
2 Y t = a 2 X , Y, -H b 2 Y
Remplazando esta nueva expresin en la ltima frmula de r 2
se tiene:
r2 =

a 2 X . Yi + b 2 Y, - n Y2
2 Y? - n Y 2

La frmula anterior, como se dijo, posee la ventaja de utilizar


cmputos que debieron hacerse para el ajuste por el mtodo de los
minimos cuadrados, con excepcin de 2 Y? . El numerador de esta
frmula equivale a n veces la varianza explicada, y el denomina
dor equivale a n veces la varianza total. Por consiguiente, para ob
tener el cuadrado del error de proyeccin (varianza no explicada),
ser necesario restar el numerador del denominador y dividir la
diferencia por n, antes de realizar simplificaciones numricas. La
utilizacin del error de proyeccin para predecir o estimar inter
valos, tiene la siguiente interpretacin grfica:
g r f ic a

23

170

CORRELACIN

Detrs de esta interpretacin est el supuesto que las diferencias


entre valores observados y valores calculados tienen una distribu
cin de probabilidad normal. Por ese hecho pueden establecerse
niveles de confianza o probabilidades de acierto en las estimacio
nes. Si se suma y resta una ve/, el error de proyeccin, el intervalo
resultante implica un nivel de confian/a de 68 por ciento; si se
suma y resta dos veces el error de proyeccin, el nivel de confianza
ser de 95 por ciento; si se suma y resta tres veces el error de pro
yeccin, el nivel de confianza ser de 99 por ciento, etctera.
3]
Otras frmulas tie clculo
Existen otras frmulas para cuantificar el grado de asociacin
entre ellas la frmula llamada m om ento-producto que conduce a
su vez a expresar el coeficiente de correlacin como la m edia geo
mtrica de los coeficientes tie regresin angulares.
Dada la ecuacin de regresin; Y,. = a X -|- b aplicando el opera
dor media aritmtica, se tiene; Y = a X -f b de donde; b =
- a X.
Por otra parte, las ecuaciones normales para la recta son:
i) 2 Y, = a 2 X , + nb
ii) 2 X Y j = a 2 X'f + b 2 X
Dividiendo la segunda ecuacin por n, queda
S X Y
2X?
------------- = a -------------f - b X
n
n
Remplazando el valor de b = Y a X, se
SX .Y

tiene;

2 X2,
= a ------------ (- (Y - a X) X

+ X Y - a X2

2 X, Y
,
/2X1
- >
------------------X Y = a
'------ X 2 ,
Observando estas expresiones, se concluye que el primer miem
bro no es otra cosa que la covarianza de las variables Y, y X|, y la

171

CORRELACIN R E C T ILN EA

expresin dentro del parntesis es la varianza de la variable inde


pendiente, es decir:
C [Xj Y,] a V [X,]
Ntese que esta expresin corresponde a una ecuacin de regre
sin de Y en X , es decir, donde X t es la variable predictor y Y
es la variable predictando. Para especificar la frmula en este sen
tido el coeficiente angular a tendr la siguiente expresin:
C[ X, Y,]
^YX =

V[ X, ]

Por analoga, si la ecuacin de regresin fuera de X en Y se tendra:

X c = a Y + b
Dado que
C (X , Yj) = C (Y, X ,) = *

S X Yj

- -

L_ Y X

donde el orden de ios factores no altera el producto numrico;


se tiene:
C [Xj Yj]
TXY =

V [Y,]..

En resumen, hasta ahora se dispone de frmulas para los coefi


cientes de regresin en trminos de varianzas, covarianzas y medias
aritmticas, que son tiles para obtener valores numricos y para
las demostraciones que a continuacin se presentan.
La frmula abreviada del coeficiente de correlacin es

r2 _

a 2 Xj Y + b 2 Y , - n Y 2
'

2 Y? - n 2
d ado que

bX Y aYX X

________

172

CORRELACIN

remplazando se tiene:

rz =

iyx 2 Xi Y i (Y Hyx X) 2 Y n Y2

---------------------------------------- _ ------------------------

2 Y? n Yavx 2 X Y, -j- n 2 n avx X n Y2

2 YI - n 2

ar x { 2 X , Y . - n X Y )
2 Y ? n Y3

diviendo numerador y denominador por n se tiene:


2 X , Y,
- avx {---------------- X Y }
n
* =

------------ y - y T

n
Luego

---- -

C[X,Y,]

' X ------------------------------

--Y 2

V [Y,]

ra = ayx axv
r =

V a YX

a XY

De otra manera
^ =

(C [X, Y,])2

V [X,] V [Y,] ' *

C [X, Vi]
S;vt SV1

De esta manera se han deducido dos frnuilas adicionales para


el coeficiente de correlacin. La primera est dada por la
media geomtrica de los coeficientes angulares de regresin, y la
segunda tiene como numerador a la covarianza, que es un m o
m ento de orden uno-uno respecto de las medias aritmticas, y co
mo denominador al producto de las desviaciones tpicas de las
variables; de donde el nombre de momento-producto que se le da
a esta frmula.
Se ha hecho hincapi sobre la necesidad de distinguir el sentido
de la regresin y correlacin, es decir, si se trata de Y sobre X "
o de X sobre Y por el hecho que hay anlisis donde puede pre
sentarse cierta reversibilidad en la causalidad.

173

CORRELACIN R E C T ILN EA

4] Correlacin por rangos


Un caso particular de la correlacin rectilnea es la llamada co
rrelacin por rangos u ordenamientos. Hay una cantidad de va
riables no susceptibles de medicin exacta y, sin embargo, suscep
tibles de ordenarse o jerarquizarse cualitativam ente; por ejemplo,
una seleccin de candidatos a un cargo, basada en entrevistas per
sonales, puede conducir a ordenamientos de los candidatos (por
ejemplo, de mejor a peor) por parte de cada uno de los entrevis
tadores. El anlisis de correlacin por rangos determinar si estos
ordenamientos son coincidentes o dispares, y cul es la magnitud
de la coincidencia o disparidad. El problema consiste en asignar a
cada candidato un nmero de orden y determinar el grado de aso
ciacin entre dos ordenamientos, y el mismo puede ser enfrentado
recurriendo a frmulas generales ya vistas para la correlacin rec
tilnea. Sin embargo, en este caso se consigue alguna ventaja de
clculo por el hecho que las variables tomarn valores enteros
equidislanciados. Siguiendo el ejemplo, si dos supervisores hubie
ran ordenado a ocho postulantes en la siguiente forma:

Ordenamiento del
entrevistador 1
Postulantes
A
B
C
D
E
F
G

4?

Ordenamiento del
entrevistador 2
U*,
3?

i.
8?

7?
?

6
3?
8?
5?
1?

5?

2o
7?
6?
1?

El anlisis de la correlacin por rangos proporcionar un indi


cador cuantitativo acerca de la disparidad o coincidencia de los
ordenamientos. Obsrvese que las variables son los nmeros natu
rales en ambos tipos de ordenamientos; este hecho permite con
cluir que:
i) las medias aritmticas de los dos ordenamientos sern igua
les, es decir: M [u,,] = V[ [uL,].
ii) las varian/.as de ambos ordenamientos sern iguales, es decir:
V fu, ] =

V [tu ,]

174

C O R R E L A C I N

Una de las frmulas generales para el coeficiente de correlacin


rectilnea era la siguiente:
r =

C[X, Y, ] . o
. . r
Sx ST,

(C [X jY ,])2
V [X,] V [Y,]

Para las deducciones posteriores es importante establecer previa


mente cul es la varianza de una suma de variables:

v [y- , Yi]_ S ( X i + Y , X )2 _

2 [ ( X , - X ) + (Y, Y)]2

' S (X, - X )2
2 (Y, - Y)2
2 2 (X, - X ) (Y, - Y)
V [X, + Y,] =
L + _ _ iJ
L . + __L_!

'
V [X, + Y,] = V [Xj] + V[Y,] + 2 C [X, Yj]
2 2 ( X j - X ) (Yj-Y)
2 2 (X, Y,- X Y ,- X , + X )
ya q u e------------------------------- ==-----------------------------------------------2 Xj Y,
- 2 Xj
- 2 X
= 2 [---------------X ---------- Y ---------- H X Y]
n
n
n
2 X, Y, - - 2 [-------------- X Y - Y X
n

- r
+ XY]

2 X Y,
- = 2 [---------- - X Y] = 2 C [X, Y,]
Por analoga la varianza de la diferencia de dos variables ser
V [X, - Y,] = V [Xj] + V [Y] - 2 C [X, Yj]
Dadas las variables ordenamiento u^, ua, se puede establecer una
relacin de diferencia entre ellas:
d = Ujj - Uj-j
V[dj] = V [u,j] + V [u,,j] - 2 C [ujj u2i]

C O R R E L A C I N R E C T IL IN E A

175

El coeficiente de correlacin en trminos de estas variables ser:


C [ u j , u 2i]

V
c [Un u2]

r =

-
V[u]

V[ u]
ya que

V [ u 2 ]
V [Uj,] = V [u21]

Despejando la relacin V [d], se tiene que:


C [u uai] = (V[u] + V [u21] - V [el,] i/ 2
=

(2 V [u,,] V [d,]) y2

Por otra parte


d = u ,i

u 2

M [di] = M [u,,] - M [u21] = 0


luego,
V [d,] = M [df ] - (M [d,])2
2 di

Entonces,

C [uu u2i]

V[u]-V[d,]V4

V [u,,]

V[ u]

1-

V [d,]

2 V[u]

Pero la varianza de u n [V (u,,)] es la varianza de los n primeros


nmeros naturales.
2 ufi

V[u,,] = ------------- u7

176

CORRELACIN

( n + 1) (2a + 1)

/ n(n + l)y

6n

= ( n + l ) (2n + l )

2n

^ n + 1y

< n + l ) ( 2n + l)

( n + 1) (n + 1)

= (n + 1, [ ! ^ _ - i ]
|"4n + 2 3n 3 1

(n +

/ n - A

) (

r = 1 ------

Luego,

2
,

r=

n2 - l

12 )

12

V [d,]

Pii1)
62d?

--------------------

n (n2 - 1)

Para el ejemplo propuesto en pginas anteriores el clculo se ha


ra de la siguiente manera:

P o stu la n te s
A
B
C
D
E
F
G
H

21

d,

d?

3
4

1
_2

_1
1
1
1

6
1

1
1
0

36

36

10

n
4
7
3

8
2

_1

1
1

177

CO RRELACIN NO R E C T IL N E A

Aplicando la frmula anterior resulta


i =

6 ( 10)

8 (63)

0. 88

El resultado del indicador muestra que los dos ordenamientos


estn bastante asociados, sin que tengan, en general, discrepancias
significativas.
A veces puede utilizarse con ventaja este tipo de indicador, aun
en casos de variable cuantificable. Puede ocurrir que si el nmero
de datos es muy grande y las variables toman valores que dificul
tan el clculo numrico, sea conveniente ordenar las observaciones
de acuerdo a sus valores numricos y establecer la correlacin entre
los ordenamientos. Evidentemente esta simplificacin implica ri
gidez por la introduccin de supuestos adicionales, tales como la
correlacin rectilnea, y la necesidad que los ordenamientos refle
jen adecuadamente la distribucin de las variables originales. Sin
embargo, muchas veces basta con saber si existe o no asociacin sin
que interese mucho refinar el anlisis; para este tipo de estudios
puede prestarse esta conversin arbitraria de variables.
La facilidad de clculo del coeficiente de correlacin por ran
gos tiene, como contrapartida, una seria limitacin. Se supone que
las distancias o diferencia de atributos es constante entre los casos
considerados. En el ejemplo visto, esto quiere decir que la dife
rencia entre el postulante H y el postulante B es la misma que la
que existe entre el postulante B y el postulante E, etc., para cada
uno de los ordenamientos. En la prctica, difcilmente se cumplir
este supuesto, pero como se ha dicho, este tratamiento es adecuado
para variables de atributos donde la jerarquizacin u ordenamien
to constituyen la nica forma de discriminacin, y donde se obser
va con menos rigurosidad las limitaciones aludidas.

F. CORRELACIN NO RECTILNEA

Sin desconocer que el caso particular de la correlacin rectilnea


es til para presentar los conceptos del anlisis de regresin y co
rrelacin, su aplicacin prctica es algo restringida por el hecho
de que en los estudios socioeconmicos las relaciones entre las varia
bles adquieren formas que, en general, difcilmente pueden ser
representadas en forma adecuada por una lnea recta.
De la misma manera que se distinguan diversas relaciones no
rectilneas en el captulo de regresin, aqu desde ese mismo punto

178

CORRELACIN

de vista se expondrn los coeficientes de correlacin respectivos.


En correlacin no rectilnea carece de utilidad distinguir entre
directa e inversa, por el hecho que pueden haber tramos donde
la relacin sea directa y otros donde sea inversa.
1] Si la funcin es del tipo
Yc = a log X - f b
es decir, si cambios relativos de X determinan cambios absolutos
de Y, el coeficiente de determinacin tendr la expresin general
SL

2 (Yc Y )2

2Y | n Y 2

Sv

2 (Y )2

2Y-; - n Y 2

pero,
Y = a* (log X J 2 + 2ab log X, + b2
Y? = a{a (log X ,)2 + b log X J + b {a log X , + b}
2 Y| = a{a 2 (log X,)2 + b 2 log X J + b { a ^ o g ^ J - j i b }
Ecuacin normal

Ecuacin normal

2 Y* = a 2 Y, log X, + b 2 Y

r2 =

a 2 Y log X + b 2 Y, - n 2
2 Yf - n Y 2

Ntese que este coeficiente de determinacin resulta de la rela


cin entre Y y log X , que ser distinto del que resulta de la re
lacin entre Y, y X (siendo X[ el antilogaritmo de log X).
Para el clculo del error de proyeccin se procede tie manera
similar al caso de correlacin rectilnea, es decir, basta dividir por
n la diferencia entre el numerador de la frmula del coeficiente
de determinacin (n veces la varianza explicada) y el denomina
dor (n veces la varianza total); la raz cuadrada de esta diferencia
dividida por n ser el error de proyeccin. Nuevamente, el error
de proyeccin est dado teniendo en cuenta la proyeccin de Y|,
en trminos de la variable independiente log Xj, que ser distinto
al error que se d al proyectar Y en trminos de Xj.

179

CORRELACIN NO R E C T IL N E A

2] Si la funcin es del tipo


Y = f dx

si log f = b; log d = a
log Y = aX + b

es decir, una funcin de las llamadas exponenciales, el procedi


miento para encontrar las frmulas del coeficiente de correlacin
y del error de proyeccin es similar al caso anterior. Obsrvese
que en esta funcin, variaciones absolutas de la variable X deter
minan variaciones relativas de Y. La frmula general del coefi
ciente de determinacin es la siguiente:

r2

2 (Yc - Y )2

2 Y2 n Y2

2 (Y, - Y )2

2 Y? - n Y2

Obsrvese que en la funcin aparece el logaritmo de Y|. Por este


hecho la frmula particular ser:

r2 _

2 (log Y )2 n log Y2

~~ 2 (logYj)2 n gY 2
donde,
log Y = M flog Y,]

2 log Y,
II

Dado que log Yc = aX[ -(- b


2 (log Y ,)2 = a2 2 Xi + a b 2 X , + a b 2 X l + nb2
= a {a 2 X f + b 2 ' X , } + b { a 2 X 1 + nb}
= a 2 (log Yj) X , + b 2 log Y,
a 2 X log Y -}- b 2 log Y n log Y 2
2 (log Y,)2 - n log Y2
Cabe destacar nuevamente que el coeficiente de correlacin calcu
lado segn la ltima expresin diferir del calculado segn la ex-

180

CORRELACIN

presin general. En la frmula general se establece la asociacin


entre Y, y X ; en cambio, en el caso particular se establece la co
rrelacin entre el logaritmo de Y y la variable X i. El error de
proyeccin en uno y otro caso se obtiene calculando la raz de la
varianza no explicada que es la ene-ava parte de la diferencia entre
el numerador y el denominador de la frmula del coeficiente de
determinacin.
3] En una funcin potencial del tipo
Yc = b X 1
cuya expresin logartmica es
log Y 0 = log b -f a log X
donde variaciones relativas de la variable independiente determi
nan variaciones tambin relativas de la variable dependiente; pue
den as establecerse dos frmulas para el coeficiente de correlacin
que conducirn a resultados distintos:
r2 =

2 (lo g Y l o g Y ) 2
2 (lo g Y g Y )-

y la otra con los antilogaritmos respectivos.


2_

2 (Yc Y)2 (Y )2

Para el caso de la correlacin logartmica la frmula abreviada


de clculo se obtiene de la misma forma que las anteriores.
a 2 log Xi log Y ,

log b 2 log Yt n log Y 2

r- = --------------------------------- ; ------------- ----------


- j-

2 (log Y)2 n log Y 2


De esta frmula tambin puede obtenerse el error de proyeccin
logartmico con el procedimiento ya conocido.
En el caso de correlacin logartmica la estimacin de interva
los se hace en la misma forma que en el caso rectilneo, pero te
niendo en cuenta que para los valores reales el desvo contempla

CORRELACI N NO R E C T IL N E A

181

do representa una proporcin constante de los valores dados por


la ecuacin de regresin.
La interpretacin grfica es la siguiente:
g r f ic a

24

En escalas logartmicas aparece una diferencia constante. Los


antilogaritmos de estos valores conducen a la representacin en
escala natural donde puede observarse que el intervalo es cada
vez mayor, lo que corresponde a una proporcin constante del semiancho del intervalo respecto de los valores dados por la ecua
cin de regresin.
4]
Correlacin parablica
Dada la funcin
Y0 = a X 2 + b X + c
El coeficiente de determinacin est dado por
._

2 (Yc Y)2 _ 2 Y c- n Y 2

2 (Yi )2 ~ 2 Y? - n 2
Y2 = a2 X* - f b2 X 2 + c2 + 2 a b X 3 + 2 a c X 2 + 2 b c X
Y; = a2 X< -f a b X a + a b X 3 + b2 X 2 + a c X 2 + a c X 2 +
-f- c! - f b c X
b cX
Y? = a{a X t + b X? + c Xf } -f b{a X? + b X ?. + c X ,} +
+ c {a X 2 + b X + c}

182

CORRELACIN

Aplicando el operador sumatoria


2Y? =

a {a

2 X ? + b 2 X 3, + c 2 X } + b
+ c 2 X , } + c ( a 2X 2 + b 2 X

{a
-f

2X* + b SX? +
nc}

Las expresiones dentro de los parntesis corresponden con las


ecuaciones normales de la parbola, es decir:
2Y? = a {2Y X ? } + b { 2 Y , X , } + c {2 Y }
La frmula abreviada de clculo para el coeficiente de correlacin
ser:
r2

a 2 Y X? -f b 2 Y, X , - f c 2Y , - n Y 2
2 Y? - n Y 2

El error de proyeccin se calcula por el mtodo expuesto para


los casos anteriores.

G. CORRELACIN MLTIPLE

En el caso de que existan dos o ms variables independientes, la


necesidad de disponer de indicaciones acerca de la asociacin que
simultneamente tiene la variable dependiente con las variables
independientes, conduce a la obtencin de coeficientes de correla
cin mltiples; si bien son necesarios para el anlisis los coeficien
tes de correlacin simples, es preciso complementar este conjunto
de indicadores con un estadgrafo que resuma simultneamente los
grados de asociacin simples.
1] Correlacin en un plano de regresin.
Si se tienen dos variables independientes, la ecuacin de regre
sin es de la forma

El coeficiente de correlacin se obtiene siempre a partir de la


frmula general que ahora tendr la siguiente simbologa:
>Xc

1 .2 3

2 (X le - X )2 _

2 X?c - n X j

2 (Xu X ) 2 ~

2 X? - n X ?

183

CORRELACIN M U L T IP L E

Donde Sxc 1.23 es la varianza explicada por las variables


X , Sxi es la varianza total de la variable dependiente.
X-lc

= at 23 -f- b ,2.3 X

b13 X -3

-f-ai.23 b12.3 X2 -\- aJ.23 bi3,2 X3


(~b|23 bl22

Xjc

X2X3

X2

aj 23bJ2.3 X 2

3],03 bia.jx, +

bj 23 bt3.2 X 2X 2

ai.23 {ai.23 f~ b ,2 3

X2 -j- b 13.2 X 3}

"l- bjo.3 {bi 2,3 X j

ai,23 X 2 -{- bj3-2 X 2X 3}

-f- b, 3.2 {b,3.2 X 3 -|- a, 23 X , -f- b 12.3 X 2X 3}


Aplicando sumatoria se tiene:
2 X l,

at.23 {fi ai.23 "j- bj2,3 2 ^^2 I- ^13,2 2 X 3}

I- bi2.3 {bj2.3 2 X2 -)- ai.23 2 X2 -)- b13 2 2 X2X3}


+ b, 3.2 {b, 3.2 2

X|

+ a ,.23 2

x 3 -)- b12.3 2 X.X,}

Las expresiones dentro de los parntesis corresponden con las


ecuaciones normales de un plano de regresin. En efecto,

2 X\ =

ax.M 2 X ,

+ b,2.3 2 XjX. + b13.2 2 XtX:s

La frmula abreviada del coeficiente de determinacin queda en


consecuencia,

R- 3 =

ai.23 2 X t -j- b12.3 2 X 3X 2 + bi3.2 2 X , X S n X^

= ---------

2X2

_ nX2

En correlacin mltiple no tiene sentido el signo de R, ya que


puede haber variables que influyan positiva o negativamente en
la variable dependiente.
En cuanto a la forma de clculo del error de proyeccin, no di
fiere de los vistos anteriormente; la diferencia entre numerador y
denominador es n veces la varianza no explicada.
En el caso de correlacin mltiple se presenta un problema par
ticular originado por la necesidad de disponer de indicaciones so

184

CORRELACIN

bre la asociacin neta existente entre la variable dependiente y


cada una de las variables independientes. 1 coeficiente de corre
lacin mltiple indica el grado de asociacin que simultnea
mente se presenta entre la variable dependiente y las variables in
dependientes. Un coeficiente de correlacin simple indica el grado
de asociacin entre dos variables: dependiente e independiente,
pero sin eliminar o depurar estadsticamente la asociacin entre
ambas variables de la influencia de otras que actan a travs de
la variable independiente. Por ejemplo, puede haber una alta co
rrelacin entre la cantidad vendida de un artculo y su precio; pero
esta asociacin puede disminuir en forma sustancial al eliminar
explcitamente la influencia de la variable precio de un sustituto.
Este concepto de asociacin neta o depurada se cuantifica a tra
vs del coeficiente de correlacin parcial que, en el caso de tres
variables, se define de la siguiente manera:

r12S representa la asociacin entre las variables


y X 2, elimi
nando estadsticamente la influencia de la variable X 3. En efecto,
si se observa el numerador, se concluye que representa el incre
mento en la varianza explicada al incluir la variable X. Este in
cremento se compara con la varianza que dejaba sin explicar la
variable X s. Sustituyendo el numerador por varianzas totales y no
explicadas se tiene:

1*12.3

SI
'X s

1.2 3

El otro coeficiente de correlacin parcial se define

Con todos estos estadgrafos, en el caso de tres variables se tiene


un conjunto de indicadores complementarios que permiten obte
ner conclusiones objetivas. Por una parte, se dispone de tres coefi-

185

CO RRELACIN M U L T IP L E

cientes de correlacin simple: r12, r13, r23; adems dos coeficientes'


de correlacin parcial: r 123 y r 13 2; por ltimo un coeficiente de
correlacin mltiple: R^.^. Por otra parte, se dispone de todos
los errores de proyeccin correspondientes que permitirn obtener
intervalos para las proyecciones.
Las relaciones que se plantean entre estos coeficientes de corre
lacin permiten realizar anlisis de consistencia. Cualquier coefi
ciente de correlacin parcial es menor, y a lo sumo igual, que un
coeficiente de correlacin simple, por la eliminacin explcita de
la influencia de otras variables:

Un coeficiente de correlacin mltiple ser siempre mayor, o


por lo menos igual, que un coeficiente de correlacin simple,
por el hecho que aqul toma en cuenta un mayor nmero de va
riables independientes que explican la variabilidad de la variable
dependiente.

R i jk '5' r

2] Correlacin en un hiperplano de regresin.


Cuando se tienen ms de dos variables independientes, se presen
ta el caso general de la correlacin mltiple; los conceptos anal-*
zados para el caso de -res variables son tambin aplicables al caso
general. Lo que ocurre es que si se consideran muchas variables
independientes se dificulta un tanto el anlisis, y el clculo de es
tadgrafos, cuando no se dispone de computadores, resulta en ex
tremo laborioso. En todo caso, a continuacin se presentan las
frmulas de los estradgrafos ms importantes para una ecuacin
lineal que considera 3 variables independientes, es decir:

2X ? - n X y

SXy n Xy

El error de proyeccin se calcula recordando que la diferencia

186

CORRELACIN

entre numerador y denominador de la formula anterior es n veces


la varianza no explicada.
Los coeficientes de correlacin parcial, aislando el efecto de dos
variables, son los siguientes:
q 2
C>

1 .2 3 4

1 .3 4

V 2 .3 4
Sx

s .

1 .2 3 4

1 1 3 .2 4

1 .3 4

2
a Xc

1 .2 4

q2
a X s 1 .2 4

S I

11 4 .2 .1

1 .2 3 4

Sxc

Sx*

1 .2 3

1 .2 3

Puede definirse otro tipo de coeficientes de


donde se asla el efecto de una variable:
r ;,
1 1 2 2 .4

<>
y*
1 1 3 4 .2

1 .2 3 4
q2
^Xs

5/5

q2
3 X

1 .2

1 .2

1 .3

7.

s 1 .2 3 4
r ik a

1 .4

1 .4

s 1 .2 3 4
q2
a X

S 2
X

3]
Correlacin mltiple logartmica
La linealidad de los planos de regresin ya vistos puede no ser
adecuada en muchos problemas de estimacin; en esos casos es
conveniente probar con otro tipo tie funciones, como por ejemplo:
X. = a,.o + bt2,

+ bI3.s X'f

La metodologa que permite obtener ecuaciones normales para


determinar los parmetros de regresin y la deduccin de las frmu
las de coeficientes tie correlacin mltiples y parciales, es la misma
que se present en pginas anteriores. Con ecuaciones del tipo que
ahora se muestra puede representarse adecuadamente la relacin
entre las variables.
Sin embargo, una funcin que es muy utilizada en los problemas
tie proyeccin es la llamada funcin logartmica:

187

ETA PA S DE L A CONSTRUCCIN

X lc = a XJ> x 3y
Para poder aplicar la metodologa de los mnimos cuadrados, es
necesario previamente linealizar esta funcin, aplicando loga
ritmos.
log X lc = log a + p log X 2 + y lag X 3
La funcin as linealizada es similar al caso de correlacin ml
tiple lineal; la nica diferencia radica en el hecho de que en los
cmputos deben tomarse los logaritmos de las variables. El coefi
ciente de correlacin mltiple logartmico, por analoga con el caso
de correlacin mltiple lineal (siendo log a = a *) es:
a * 2 log X x - j -

p S

log X j log X 2

** 1 0 8 ( 1 . 2 3 )

!-------------------

2 (log X i )2 n log X^
y 2 log X1 log X g - n log X^
+

2 (log X ,)2 n logfj

La diferencia entre numerador y denominador resulta ser n ve


ces la varianza no explicada. Esta funcin tiene amplias posibili
dades de ser aplicada por el hecho que los parmetros P y y son
coeficientes de elasticidad entre las variables Xi y X 2 y las va
riables X t y X.-, respectivamente. Esta ecuacin ser tratada con
ms detalle, en el captulo correspondiente a las proyecciones por
coeficientes de elasticidad.
En cuanto a los coeficientes de correlacin parcial, tampoco
aparecen diferencias, ya que la metodologa de deduccin y clculo
no vara, mas lo que no debe descuidarse en el trabajo con los lo
garitmos de las variables es que deben tener una precisin equi
valente a los 6 decimales.

H. ETAPAS DE LA CONSTRUCCIN DE UN MODELO DE REGRESIN Y


CORRELACIN

Es necesario diferenciar dos tipos de moledos de regresin en lo


tocante al objetivo que persiguen: los m odelos de anlisis, utiliza
dos para cuantificar relaciones y explicar adecuadamente qu su
cedi con una variable en trminos de otras variables que tienen
influencia sobre aqulla, y los m odelos predictivos que adems de

188

CORRELACIN

ser tiles en el anlisis estn diseados para predecir o estimar


valores de la variable dependiente en trminos de las variables
independientes en el supuesto de que se conoce su comportamiento.
Adems, es conveniente distinguir entre modelos temporales y
atemporales. Los primeros son aquellos que analizan y estiman va
lores en el tiempo, por ejemplo, estimacin de los precios agrcolas
del prximo ao en funcin de las siembras y la poltica de im
portaciones. Los modelos atemporales, en cambio, no toman en
cuenta explcita ni implcitamente la variable tiempo: son cortes
transversales; sera ste el caso de la estimacin de los consumos fa
miliares en funcin de la variable ingreso, pero teniendo como
datos los consumos e ingresos fie una muestra en un momento o pe
rodo dado.
La metodologa que a continuacin se presenta tiene aplica
cin general; con todo, se aclararn aquellos puntos que son ms
crticos en uno y otro tipo de modelo.
1] El primer punto, obviamente es la determinacin clara y pre
cisa del objetivo del estudio. Es necesario especificar los objetivos
de la investigacin general y los objetivos del anlisis de regresin
y correlacin en particular. En esencia es necesario responder a las
interrogantes en qu se utilizar el modelo?, qu se pretende de
mostrar por medio de la regresin y correlacin?
2] Una vez aclarado el primer punto bsico, se hace necesaria
una evaluacin lgica para determinar qu variables deben in
corporarse al anlisis. En principio deben tomarse en cuenta todas
las que razonablemente pueden estar asociadas a la variable que
se estudia.
3] A continuacin se procede a recopilar las estadsticas, ya sea
histricas, cuando se trata ele modelos temporales, o las estadsticas
pertinentes si se trata de un modelo atemporal.
4] Siempre es indispensable un anlisis de la calidad de los da
tos recolectados. Ya aqu quedan eliminadas algunas de las varia
bles que, en principio, fueron seleccionadas, por el hecho que sus
valores pueden no ser confiables; por otra parte, pueden haber al
gunas variables que, pese a ser confiables, no puedn tomarse en
cuenta porque constituyen muy pocas observaciones. Sobre este
punto hay que decidir ciil es el nmero mnimo de datos y ob
servaciones que puede considerarse satisfactorio. Recurdese que
tamaos de muestra insuficientes conducen a resultados errneos.
En los modelos temporales no puede pensarse en un nmero in
ferior a las 10 o 12 observaciones (puntos en el tiempo). Adems,
en los modelos predictivos, el nmero de variables independientes

ETA PA S DE L A CONSTRUCCIN

189

est condicionado por la posibilidad de disponer con cierta con


fianza de valores futuros de tales variables.
5] Las variables restantes deben ser depuradas de otras variables
que actan a travs de stas. Como se apunt antes, es indispensa
ble trabajar con series que representen valor real o quantum. La
consideracin de valores nominales exagera la correlacin por el
hecho de que la variable inflacin o alzas de precios puede actuar
sobre la variable dependiente y, simultneamente, sobre las va
riables independientes. Es conveniente tambin, en lo posible, re
presentar las series en trminos por habitante, si no hubiera un
propsito especfico para hacerlo de otra manera.
6] Una vez que se dispone de las estadsticas de las principales
variables depuradas, se hace necesario determinar la forma y cuantifcar el grado de la asociacin siemple que cada una de estas va
riables tenga con la variable dependiente estudiada. Tambin pue
de ser conveniente calcular los coeficientes de correlacin simple
entre las variables independientes para advertir las posibles depen
dencias que existan entre ellas. A esta altura del anlisis ya se
tiene bastante definido el campo de la posible metodologa que
finalmente se utilizar; por lo menos, se habr decidido si se trata
de correlacin simple o mltiple.
7] Otro punto de gran importancia es la determinacin de la
forma general de la funcin. Si se trata de correlacin simple, ser
til la representacin grfica, es decir, con la ayuda del diagrama
de dispersin puede solucionarse adecuadamente este problema.
Si se trata, en cambio, de correlacin mltiple, hay que considerar
principalmente los coeficientes cuantiicados en el punto 5 y las for
mas particulares de relacin entre las variables. A veces se dispone
de modelos tericos ya probados, donde slo se requiere comprobar
si tal teora corresponde al caso que se estudia; por ejemplo, la fun
cin consumo de Friedman, donde ya se tienen especificadas las
variables indejiendientes y la forma de la funcin, y slo resta
calcular el valor de los parmetros. El caso ms corriente es deter
minar la funcin (formulacin de la teora), primero en trminos
conceptuales y, segundo, cuantificando resultados. En los modelos
temporales un punto delicado es la especificacin de las asncronas entre las variables. Por ejemplo, la produccin del perodo t
podra depender de la inversin del perodo t a, donde a
indicara el tiempo de maduracin de la inversin. La*representa
cin grfica (xtr parejas de variables (dependiente o independiente)
puede ayudar a la especificacin mencionada.
8] El paso siguiente es la cuantificacin de estadgrafos: medias,
varianzas, coeficientes de correlacin simples, mltiples, parciales,

190

CORRELACIN

errores de proyeccin y, por ltimo, la estimacin en los modelos


predictivos y el anlisis en los modelos descriptivos. Es convenien
te tambin calcular, por medio de la ecuacin de regresin, los va
lores de la variable dependiente en trminos de los valores conoci
dos en la variable independiente, para compararlos con valores
observados y analizar la bondad del ajuste. Las formulaciones de
pruebas de consistencia entre los estadgrafos calculados constitu
yen, tal vez, los puntos ms descuidados en los anlisis de regre
sin y correlacin. Por otra parte, es aqu donde cabe calificar el
anlisis a la luz de las cuantificaciones apropiadas. Es conveniente
comparar la magnitud de los errores con los valores calculados, es
tableciendo porcentualmente la cuanta de los probables desvos.
9]
Finalmente, en la presentacin de los resultados es imprescin
dible destacar:
a) Clara definicin de las variables;
b) Tamao de muestra y tipo de modelos;
c) Forma de la funcin;
dj Estadgrafos pe/tinentes.
No se debe dejar de sealar las limitaciones particulares del mto
do, los supuestos utilizados y las fuentes de obtencin de infor
maciones.

1. MTODO DE ESTIMACIN POR MEDIO DEL COEFICIENTE DE ELASTICIDAD

1] Presentacin conceptual
Un mtodo muy utilizado en proyecciones de variables socioeco
nmicas es el que utiliza el coeficiente de elasticidad entre las va
riables. El coeficiente de elasticidad se define como
dY
~Y~
~

dY

~dx ~ d Y

"y

f X
V

Como puede observarse, el coeficiente de elasticidad es una medida


de cambios porcentuales experimentados por una variable Y (de
pendiente) ante cambios porcentuales de una variable X (in
dependiente).
En la definicin est implcita la funcin que relaciona ambas

191

MTODO DE ESTIM ACIN

variables. Desde un punto de vista estricto, se trata de un cociente


entre cambios porcentuales infinitesimales; cuando se trata de es
timar valores de una variable, no interesan los cambios demasiado
pequeos, sino los cambios significativos.
El objetivo inmediato ser, entonces, encontrar funciones donde
el coeficiente de elasticidad sea constante en cualquier punto de
la funcin. Solamente tal tipo de funciones podrn ser utilizadas
en la proyeccin, ya que de otra manera el coeficiente de elastici
dad variar para cada punto de la funcin haciendo impracticable
la proyeccin.
Si la funcin es una recta, el coeficiente de elasticidad no es
constante, como se ve a continuacin.
Y= a X + b
dY
dX
dY
~ dX

= a
X
~Y

X
a

Y~

pero Y = a X -j- b
E = a

aX + b

Como puede observarse, el coeficiente de elasticidad E est en


funcin de X , y tomar un valor distinto para cada valor de X . Si
la funcin es una hiprbola equiltera, se tiene:
Y = = a X 1
X
dY
dX

= - a X -2

dY
X
X
E = ------ _ _ a X-2
dX
Y
a
X
X2
E a X 2
a

192

CORRELACIN

El resultado se interpreta de modo tal que aumentos porcentuales


en, la variable independiente determinen disminuciones de igual
magnitud porcentual en la variable dependiente. En este resulta
do, e n consecuencia, puede estimarse cualquier valor de la variable
dependiente, si se supone conocido un valor de la variable inde
pendiente. En la funcin potencial general tambin puede verifi
carse la constancia del coeficiente de elasticidad. En efecto,
Y = b X
dY
dX

= ab X a' 1

dY
X
X
E = ------ = ab X a-1
dX
Y
Y
pero Y = b X a
E = ab X a-1

X
b Xa

= a

El hecho de que el coeficiente de elasticidad sea constante en esta


funcin haceque sela utilice peridicamente ei lasproyecciones.
La proyeccin sebasa en lo siguiente:
Dada lafuncin:
Y = b Xa
Aplicando logaritmos:
log Y = log b
a log X
Las relaciones correspondientes al ao 0 (base de proyeccin)
y al ao n (perodo para el que se quiere estimar la variable de
pendiente), son las siguientes:
log Y0 = log b + a log X 0
log Y = log b + a log X u
Restando la primera de la segunda se tiene:
lg Yn - log Y0 = a (log X - log X 0)
E l a n tilo g afitm o de la re la ci n a n te rio r

193

M TODO DE ESTIM ACIN

Observando la frmula puede concluirse que los cambios porcen


tuales en la variable dependiente son equivalentes a los cambios
porcentuales en la variable independiente, elevados a la potencia
a. A veces, suele interpretarse errneamente la relacin potencial;
por ejemplo, si a = 2, se dice que un cambio de 0 por ciento en X
determinar un cambio de 100 por ciento en Y. Evidentemente, la
conclusin es falsa, porque ella supone una relacin de linealidad
entre las variables que est lejos de presentarse en este caso.
Los datos necesarios para proyectar mediante este mtodo son;
disponer del coeficiente de elasticidad (a), conocer el valor base
y dado de la variable independiente (X 0 y X n), o por lo menos su
variacin porcentual. Con estos datos puede aplicarse la frmula
antes citada:
h

Y0 ~ ' X 0 '

Por ejemplo, si a = 2
Y0 -

100

X u = 200
X = 300
Remplazando;

Y = 225
2] T ipos de elasticidad
Es necesario distinguir el tipo de elasticidad segn las variables
consideradas. De este modo, si la variable Y representa consumos
y la variable X representa ingresos, se habla de. elasticidad ingreso
del consumo o de la demanda. Por otra parte, si ,1a variable X re
presenta consumo y la variable Y representa consumo especfico de
un bien o conjunto de bienes similares, se habla de elasticidad gasto
del consumo especfico. Estos dos son los conceptos ms conocidos
y utilizados. Sin embargo, segn las denominaciones de las varia
bles puede hablarse de otros tipos distintos de elasticidad, como

194

CORRELACIN

por ejemplo, elasticidad de la tributacin al ingreso, elasticidad del


ahorro al producto, de las importaciones al tipo de cambio, etc.

3 ] Mtodos de clculo
A continuacin se presentarn las formas de clculo del coefi
ciente de elasticidad. Cuando se est utilizando la forma general
de proyeccin,

Y0

f^y
\X0 /

implcitamente se estn aceptando dos supuestos: a) que las va


riables estn relacionadas mediante la funcin potencial; b) que
el coeficiente de correlacin entre los logaritmos de X y de Y sea
significativo. El cumplimiento de estos supuestos garantiza una
buena proyeccin.
De lo anterior se deduce que una forma de obtener el coeficiente
de elasticidad consiste en ajustar la funcin potencial, por el m
todo de mnimos cuadrados, a los datos retrospectivos de que se
disponga. Es decir, dada
Y = b X "
el ajuste a una nube conocida de puntos permitir calcular los
parmetros.
El valor de "a corresponde, como se demostr, al coeficiente de
elasticidad. Existe una forma aproximada de estimar este coefi
ciente de elasticidad por el mtodo grfico. En la expresin:
log Y = log b -(- a log X
el coeficiente de elasticidad es el coeficiente angular de la recta
logartmica.
Si los puntos retrospectivos de que se dispone se representan en es
calas logartmicas,, es posible a simple vista ajustar la recta tra
tando de aproximarse a la recta minimocuadrtica.

* A la p arte final de este captulo se agrega una exposicin sobre las di


ferencias de las proyecciones a travs de ecuaciones de regresin y de coefi
cientes de elasticidad.

195

MTODO DE ESTIM ACIN


GR FICA

25

La recta ajustada a ojo puede entregar estimaciones muy cer


canas al valor efectivo con un ahorro de tiempo considerable. La
manera de obtener el valor de a es la siguiente:
a = .T g a = -

f
k

donde f es el cateto opuesto al ngulo a en el tringulo del grfico


m edido en centm etros u otras unidades de longitud, y k es el cateto
adyacente al ngulo a, tambin medido en las mismas unidades de
f. El cociente dar la inclinacin de la recta logartmica y, por con
siguiente, el coeficiente de elasticidad. La bondad de esta estimacin
depende de la habilidad y cuidado que se tenga para hacer pasar la
recta por entre los puntos, de manera que se minimice el cuadrado
de las diferencias.
Cualquiera de los dos mtodos anteriores supone disponer de
estadsticas retrospectivas. Ocurre con frecuencia que es necesario
proyectar variables para las cuales no es posible recopilar suficien
tes' antecedentes que permitan garantizar una cierta representativi
dad del coeficiente de elasticidad.
En estos casos es corriente utilizar com paraciones internacionales,
eligiendo pases que tertgan similitudes marcadas con el pas cuya
proyeccin se necesita hacer. Por ejemplo, es posible utilizar el
coeficiente de elasticidad gasto del consumo de artefactos elctri
cos en Colombia, al realizar una primera estimacin para Chile;
entre ambos pases existen caractersticas comunes en cuanto a po
blacin y su concentracin, nivel de ingreso, grado de industria-

196

CORRELACIN

lizacin, etc. Otra manera sera seleccionar un conjunto de pases


dentro de un rango de nivel de ingreso comparable al del pas con
siderado y calcular el coeficiente de elasticidad por los mtodos
anteriores, contando con informaciones de estos pases en vez de
las estadsticas retrospectivas mencionadas. Este mtodo es conocido
con el nombre de estimacin del coeficiente de elasticidad por me
dio de datos internacionales; el ltimo mtodo tiene por objetivo
' generalmente la estimacin de coeficientes de elasticidad ingreso
de la demanda. Por ltimo, otra manera de cuantificar coeficien
tes de elasticidad, principalmente elasticidad gasto, es la realiza
cin de muestras en un perodo dado, con las cuales se averigua
los valores que toman las variables que interesa analizar y pro
yectar. Si bien el hecho de calcular un coeficiente de corte trans
versal en el tiempo y utilizarlo en proyecciones hacia el futuro,
tftne limitaciones, hay que reconocer que si se tiene buen cuidado
de definir las unidades mustrales de manera tal que reflejen in
ternamente las condiciones de una cierta dinmica, las proyeccio
nes no sern distorsionadas seriamente. Con anterioridad deben
realizarse pruebas sobre la racionalidad y consistencia ele los re
sultados alcanzables.
4] La ecuacin de regresin y el coeficiente de elasticidad com o
instrumentos de proyeccin.*
Como se lia visto, la ecuacin de regresin puede utilizarse di
rectamente como instrumento para estimar valores futuros de la
variable dependiente, una vez planteadas determinadas hiptesis
sobre el comportamiento de la variable independiente. Cabra dis
cutir entonces qu diferencia existira entre utilizar la ecuacin
de regresin o el coeficiente de elasticidad como instrumento de
proyeccin, por ejemplo, de la demanda de un bien en funcin
del ingreso. En primer trmino, la ecuacin de regresin es de
aplicabilidad mucho ms general, ya que podra utilizarse cual
quiera que fuese la forma de relacin que se admita entre las dos
variables; desde este punto de vista, el concepto de elasticidad no
sera sino un caso particular donde, como se ha visto, se admite
una relacin logartmica.
Podra suceder, sin embargo, que en determinados casos prcti
cos no pudiera disponerse de la ecuacin de regresin correspon
diente; en cambio, s utilizar una estimacin del coeficiente de
elasticidad. Si slo se tienen las cifras globales de coqsumo e in
greso para un nico perodo reciente, podran por ejemplo utili
* E l te x to del p u n to 4 es del p ro feso r P e d ro V uskovic.

MTODO DE ESTIM ACIN

197

zarse coeficientes de elasticidad deducidos de las experiencias de


otros pases de condiciones similares.
Aun cuando se dispusiera de los dos intrumentos ecuacin de
regresin y coeficiente eje elasticidad-ingreso y se admitiera una
relacin logartmica, los resultados de las proyecciones a que con
duciran uno y otro seran diferentes en la generalidad de los ca
sos. Supngase, por ejemplo, que las comparaciones correspon
dientes se hayan referido al consumo de determinado bien en pases
con distinto nivel de ingreso (pases 1, 2, 3, . . . en la grfica si
guiente; interesa para la proyeccin, el pas 1).
y: consumo por habitante
x: ingreso por habitante
g r f ic a

26

En la medida en que la relacin entre las dos variables est ms


alejada de la lnea de regresin en el pas que interesa para las
proyecciones, mayor sera la diferencia a que se legue utilizando
la ecuacin tie regresin y el coeficiente de elasticidad como ins
trumento de proyeccin. Si, como- en la grfica anterior, la rela
cin est en ese pas por debajo tie la lnea de regresin, ello signi
ficara que existe all un consumo relativamente bajo (en compa
racin con el nivel de ingreso) del bien considerado; una estimacin
tlel consumo futuro basatlo sobre la ecuacin de regresin supon
dra que tal situacin se eliminara, y el consum tendera a au
mentai no slo por electo del incremento del ingreso, sino tambin
para superar ese retraso relativo; la utilizacin del coeficiente de
elasticidad, en cafhbio, equivaldra a admitir que el consumo au-

198

CORRELACIN

mentar slo por el efecto ingreso, pero que continuar registrn


dose un consumo relativamente bajo (en comparacin con el nue
vo nivel de ingreso).
En otras palabras, al aumentar el ingreso.de X ! a X 2 en la ecua
cin de regresin, se admite un aumento del consumo de Yi a Yc2.
En el primer caso, se supone que el nuevo nivel del consumo co
rresponder exactamente al valor dado por la ecuacin de regre
sin; en el segundo, se admite que perdurar una discrepancia en
tre el valor terico (dado por la ecuacin de regresin y el valor
efectivo proporcionalmente igual al que existir en el perodo base).
Es difcil juzgar en trminos generales cul de los dos mtodos
podra ser ms adecuado ante una situacin de esta ndole. Si el
nivel relativamente bajo del consumo en el pas considerado es
atribuible a limitaciones de la oferta, u otros factores de carc
ter temporal, podra ser ms adecuada la proyeccin basada sobre
la ecuacin de regresin; si se debe, en cambio, a diferencias en
materia de hbitos de los consumidores, a factores climticos u
otros de carcter relativamente permanente, sera ms adecuada
la proyeccin basada en el coeficiente de elasticidad. Aun en el
primer caso sera necesario tener en cuenta si el perodo al que se
refiere la proyeccin es lo suficientemente prolongado como para
que lleguen a eliminarse los efectos adversos de los factores tem
porales. Las diferencias anotadas entre los dos mtodos de proyec
cin podran presentarse tambin en el caso que todo el anlisis
se hubiera basado en series cronolgicas correspondientes a un
mismo pas, puesto que las cifras correspondientes al perodo to
mado como base seguramente sern diferentes de los valores te
ricos dados por la ecuacin de regresin.
g r f ic a

27

La interpretacin sera, sin embargo, algo diferente, si se trata


de un mismo pas; el consumo relativamente bajo ^o relativamente

M TODO DE ESTIM ACIN

199

elevado) registrado en el perodo base sera, con mayor probabili


dad, atribuible a factores de carcter temporal. En consecuencia,
podra considerarse como ms adecuada la proyeccin basada sobre
la ecuacin de regresin.
De modo que, en trminos generales, la utilizacin de la ecuacin
de regresin y del coeficiente de elasticidad conducir en la mayor
parte de los casos a proyecciones diferentes, sin que resulte posible
precisar cul de las dos tendra que considerarse ms adecuada.
Esto puede llevar a la proyeccin de un intervalo probable para
la variable dependiente, basado no en la magnitud del error estn
dar de estimacin, sino en la diferencia entre la proyeccin obte
nida con la ecuacin de regresin y la proyeccin a que conduce
l aplicacin del coeficiente de elasticidad.
La grfica anterior y la siguiente ilustran esta alternativa; en el
primer caso se utilizan la ecuacin de regresin y el error estndar
de estimacin para proyectar el intervalo correspondiente. Al uti
lizar Yc Cys se est admitiendo no slo que se elimina el bajo
g r f ic a

28

consumo relativo registrado durante el perodo base o en el pas


correspondiente (si se trata de una comparacin internacional),
sino que adems se estima como probable que llegue a registrarse
un consumo relativamente elevado durante el perodo abarcado
por la proyeccin. Es evidente que las posibilidades prcticas de que
esto ocurra son muy limitadas.
En el segundo caso, se utilizan la ecuacin de regresin y el coefi
ciente de elasticidad, y se proyecta un intervalo delimitado por
estos dos valores. De este modo se estima un intervalo ms amplio
por debajo de la lnea de regresin y ninguno por encima de sta,

200

CORRELACIN

lo que parecera ms lgico en una situacin como la supuesta en


las grficas.
5] R elaciones y propiedades del coeficiente, de elasticidad
a) El coeficiente de elasticidad ingreso del consumo est rela
cionado con las propensiones media y marginal al consumo de la
siguiente manera:
dY
X
E = -------
dX
Y
Si Y = consumo
dY
dX

X = ingreso

= Propensin marginal a consumir

X
= Inverso de la propensin media al consumo
Luego
E = Propensin marginal

Propensin media

b)
Si el consumo total X se divide en consumos parciales u,, u2,
u3 . . . uk> de manera que,
2 u, = X,

i-i

la media aritmtica ponderada de las elasticidades gasto respecti


vas ser igual a la unidad.
La definicin de la elasticidad gasto en estos trminos es la si
guiente:
du
X
E g = --------- '
dX
u,

donde i = 1, 2, . . . k son los componentes del consumo total.

MTODO DE ESTIM ACIN

201

Ui

donde Wi = (participacin porcentual del consumo especfico


X

del consumo total).


Remplazando Egl y Wi por las definiciones, se tiene:

2 d (u) = d x, dado que la suma de las diferencias es equiva


lente a la diferencia de la suma:
d [2 u] = cl X
recordando que 2 u = X
se tiene:
dX = dX
con lo que se comprueba la proposicin enunciada.

6] Elasticidad en regresin m ltiple


Parece oportuno presentar aqu el caso del clculo de elasticida
des simultneas para ms de una variable independiente. Es muy
frecuente tratar con funciones potenciales mltiples cuando se
deben encararproblemas de anlisis econmico; determinar, por
ejemplo, enformasimultnea cmo juegan las elasticidades con
respecto al precio y a] ingreso en sus relaciones con la cantidad
vendida; o cul es la elasticidad de la tributacin respecto a va
riaciones en las tasas y variaciones en el ingreso. El tratamiento
simultneo implica evitar la superposicin que podra presentarse
cuando se efectan clculos parciales por separado.
Sea la funcin:
Y = a Xf Wr
La elasticidad X de Y se encontrar derivando parcialmente la
funcin respecto de X y multiplicando por la relacin ; en otras
palabras, aplicando la definicin de elasticidad.
dY

dX

C O RR ELA CI N

202

En la funcin que se presenta habr dos elasticidades: una que


relaciona X con Y y otra que relaciona W con Y.
Para el primer caso es tiene:
dY
dX

= aW rpX M

Ex = a W ^ X M

pero Y = a X W?
Luego,
Ex = a W r p X -1

X
aXPWT

Ex = [3
Para el segundo caso se tiene:
Ew = a X v WT - 1

W
a XP W r

Ew = y
Los exponentes ele la funcin potencial mltiple corresponden a
los conceptos tie elasticidad respectivos.
Para determinar la magnitud de los parmetros a, [3, y, donde
los dos ltimos son las elasticidades mencionadas, se sigue el m
todo tradicional del ajuste por mnimos cuadrados. Previamente
ser necesario linealizar la funcin aplicando los logaritmos, es
decir:
log Y = log a + (3 log X -j- y log W
Interesa minimizar la expresin:
Z = 2 (log Y, - log Y,.)-1
Z = 2 (log Y ! log a |3 lox X y log W ) 2

205

REG R E SI N Y C O RR ELA C I N

y haciendo
SZ
8 log a

SZ
sp

SZ

= 0

=0

= 0

8y
se tienen las tres ecuaciones normales que permiten determinar los
parmetros. Estas ecuaciones normales son:
2 log Y = n log a 4~

2 log X 4 - y 2 log W

2 (log YO log X , = log a 2 log X , - f p


2 log Wi log X|
2 log Y log W = log a

2 log Wi
2 (log W .,)2

2 (log X,)* + y

2 log X , log W , -)- y

donde Y,, W t, X , son los valores observados de las tres variables,


ya sea que correspondan a, valores en el tiempo (temporal) o en el
espacio (atemporal). Los lmites de las sumatorias corresponden al
total de observaciones que se disponga simultneamente sobre las
tres variables.
Con una funcin ajustada de esa manera, pueden realizarse pro
yecciones y anlisis entre las variables. Para las proyecciones, como
en el caso de regresin simple, queda la alternativa de hacerlo a
travs de la ecuacin de regresin o a travs ele los coeficientes de
elasticidad.
Para proyectar por medio de la ecuacin de regresin, bastar
con fijar exgenamente el comportamiento de las variables inde
pendientes y remplazar tales valores en la funcin. Si se desea
proyectar a travs de los coeficientes de elasticidad se tiene para
el periodo 0 :
log Y 0 = log a - f p log X 0 -p y log W
para el perodo n:
log Y = log a - f p log X , + y log W n

204

CO RR ELA C I N

restan d o am b as ecuaciones:

log Y - log Y = ji(log X - log X) + yflog W - log W]


El antilogaritmo de la anterior relacin conduce a

que es la frmula bsica de proyeccin a travs de coeficientes de


elasticidad en el caso de ms de una variable independiente. Como
ejemplo de una proyeccin de este tipo, admtanse los siguientes ca
sos: Y variable que representa la recaudacin efectiva tributaria;
X variable que representa la tasa tributaria promedio, y W el
Producto Geogrfico real.
Si se tienen estimaciones que el producto crecer en los prxi
mos cinco aos en 20 por ciento, siendo la elasticidad producto de
la tributacin unitaria, y se desea aumentar la tasa promedio en
44 por ciento, siendo la elasticidad tasa de la tributacin equiva
lente a 0.5, el incremento porcentual de la recaudacin tributaria
ser:

(
Y
- - 1 (1.2) (1.2) - 1 = 1.44 - 1 = 0.44
^ I)
Evidentemente que el tratamiento puede extenderse a ms de
dos variables independientes. La metodologa presentada puede f
cilmente ampliarse a tales rasos.
7] .im itaciones en la utilizacin de coeficientes de elasticidad
Pese a la prolusa, y qui/ hasta exagerada utilizacin de .coefi
cientes de elasticidad en las proyecciones econmicas, cabe recono
cer que su aplicacin, en pases donde se registran cambios politico
econmicos con inusitada frecuencia, tiene serias limitaciones. Se
tratar el caso principal de los coeficientes de elasticidad ingreso.
Un coeficiente de este tipo calculado, por ejemplo, con estadsticas
retrospectivas, lleva im plcita la distribucin de ingresos y estruc
tura de preferencias de los consumidores durante el perodo que

T E M A S DE DISCUCIN

205

comprenden las estadsticas retrospectivas. Surge una objecin in


mediata cuando se piensa en proyecciones hacia el futuro cuyo
objetivo puede ser precisamente modificar esa distribucin de in
gresos. Igual objecin puede hacerse a las proyecciones por medio
de coeficientes de elasticidad calculados a partir de muestras de
corte transversal en el tiempo. De igual manera los coeficientes de
elasticidad resultantes de comparaciones internacionales llevan im
plcita la'distribucin de ingresos de los pases considerados.
El problema de las proyecciones supone un mtodo de aproxima
ciones sucesivas; los tres mtodos planteados para calcular coefi
cientes de elasticidad no son mtodos alternativos sino comple-'
mentados. Un coeficiente calculado a travs de estadsticas retros
pectivas puede ser corregido por muestras sucesivas que registren
los cambios en la distribucin de ingresos. Por otra parte, la uti
lizacin de coeficientes internacionales supone seguir las - d i s t r i
buciones de ingresos de los pases considerados y, en determinados
casos, esa tendencia puede no estar demasiado apartada de los pla
nes que sobre esta materia se formulen. En general, puede llegarse
a proyecciones razonables considerando el problema como un mto
do iterativo sujeto a revisiones peridicas. En los modelos tempo
rales, el transcurso clel tiem po proporciona nuevas informaciones,
tjue, al tomarse en cuenta, mollifican las proyecciones a medio y a
largo plazo. se debera ser el verdadero sentido de las proyeccio
nes y no la estimacin espordica. En las instituciones ms avan
zadas existen equipos de tcnicos que estn dedicados permanen
temente a preparar, corregir, revisar e integrar modelos predictivos.
Como regla general, para calificar una proyeccin, debera es
tablecerse, por una parte, un mnima razonable de eonfiabilidad
en la proyeccin, porque malas proyecciones en general pueden
ocasionar serios perjuicios; por otra parte, aunque se carezca de es
timaciones certeras, disponer de aproximaciones, aunque bur
das, siempre ser mejor que el desconocer o ignorar las caracters
ticas de un fenmeno en el futuro.

T E M A S D E D IS C U S I N
In d iq u e si
su o p in i n .
1J Si la
c i n
2] Los

las siguientes a firm a cion es son ciertas o

falsas, y justifique

covarian za tom a un v a lor n egativo, el c o e ficie n te d e co rre la


es im ag in a rio.
siguientes datos son consistentes en correla cin rectiln ea :

CORRELACIN

206
rx =

10

S2xc =

ax y =

16

0 .0 8

S*x , =

8]

F.l erro r d e p r o y e cci n p u e d e tom a r valores su p eriores a la u n id a d .


_,a fle x ib ilid a d d e la fu n c i n p o te n c ia l h ace q u e los coeficien tes
d e co rre la c i n sean siem p re m ayores q u e si e l aju ste h u b iese sido
a u na recta.
5] L os siguientes d atos son consistentes:
4]

Yc =

0.2 X -

V [ X ] =

50

X =

30

6] En la sigu ien te fu n c i n :

X, =

4 +

2 X2 +

0.1

X3

e l c o e ficie n te d e co rre la c i n sim p le en tre X x y X 2


co e ficie n te d e co rre la c i n sim p le en tre X j
y X 3.
7] L os siguientes datos son consistentes:
Yc =

0.4 X , - f 4

(Y en X )

Xc =

2.4 Y j -

( X en Y)

V (Y ) =

20

ser m a y or q u e el

E rror de p r o y e cci n :

8 ] L os siguientes datos son consistentes:

V [ X j] =

16

r =

0.3

Sya =

9] L a e cu a ci n n o rm a l d e la fu n ci n Y c =
10] L o s siguientes d atos son consistentes:
Ve =

0.4 X j +
X =

S X j Yj

V [ X j] =

Yc =

a X es 2

2 X, +
Y =

5
a 2 X

20

50

11] Si las varianzas e x p lica d a y n o e x p lica d a son iguales, el co e ficie n te

de co rre la ci n ser su p erior a 0.5.

207

PR O BLEM A S PROPUESTOS
a
12] D a d a la fu n c i n Y =

, la e cu a ci n n o rm a l co rre s p o n d ie n te ser:

1
S Y. =

a 2

13] L o s siguientes d atos son p erfecta m en te consistentes:

^X c
8x

1 .2 3 4 = = 2 0 0
1 .2 3 =

X l .2 3 4

260
0-80

S js

1 .2 3

Sxs

1 .2 3 4 =

r J 4 .2 3

: 80
50

0-25

14] M ien tras m a y or n u m ro d e parm etros ten ga la e cu a ci n d e regre


sin, ms a lto ser el v a lo r d e l c o e ficie n te d e co rre la ci n .
15] U n co e ficie n te d e co rre la c i n d e 0.95, in d ica siem p re u n a asocia
c i n sign ificativa en tre las variables.
16] Si e l co e ficie n te d e e la sticid a d in greso d e la d em a n d a d e p a p e l es
in fe r io r a la u n id a d , q u iere d e c ir q u e el co n su m o d e p a p e l en
p e r o d o s fu tu ro s ser ca d a vez m e n o r en ca n tida d es absolutas.
17] Si e l gasto total d e u na c o m u n id a d se d iv id e en tre co n su m o esen
cia l y n o esencial, es ra zon a b le a d m itir q u e, si los co e ficie n te s de
elasticidad gasto respectivos son 1.4 y 0.6 el v o lu m e n d e l gasto se
distrib u y e en tre am bos tip os d e con su m o, en partes iguales.
18] Si el p r o d u c to in te rn o b ru to crece a u n a tasa d e 8 % sim p le anu al
y el v a lo r a grega d o d e l sector co n stru cci n lo h ace a u n a

tasa

acu m u lativa d e 4 % anual, q u iere d e c ir q u e la p a rticip a c i n d e l


sector co n stru cci n , d e n tr o d e l p r o d u c to ser cada vez m ayor.

PRO BLEM AS PRO PU ESTO S


1] La e cu a ci n d e regresin en tre e l co u su m o tota l y e l in greso total
d e u n a reg i n , es la sigu iente:
C =

40 - f 0.6 Y

En 1967 la p r o p e n s i n m ed ia al co n su m o es d e 8 0 % ; e l 2 0 % d e l
co n su m o total est co n stitu id o p o r p r o d u c to s im p orta d os, la elasti
cid a d gasto d e l co n su m o d e p r o d u c to s n a cion a les es d e 0.8. Si se
estim a q u e el in greso en 1972 ser u n 4 0 % m a y or q u e en 1967,
cul ser el v a lo r d e las im p orta cion es d e b ien es d e con su m o
e n 1972?

208

CORRELACIN

2] E l aju ste e n tre c o n su m o (C ) y co n su m o d e a rtefactos


p o r c io n la sigu ien te fu n c i n :
CA =

(C A )

pro

0.4 C i s

Si el co n su m o d e a rtefa ctos rep resen ta e l 5 0 % d e l tota l, qu


p o r ce n ta je d e l co n s u m o represen tar c u a n d o ste se d u p liq u e ?
3] S ob re e l c o n su m o d e a cero en u n a reg in , se tie n e n los siguientes
an teceden tes:

A os

Valor d e l consum o
d e acero
( m ili d e u.m . corrientes)

C onsum o de acero
(m iles d e ton)

1960
1961
1962
1963

200

10

250
320
400

20

15
28

Se p id e ca lcu la r la ten d en cia rectiln ea d e l n d ic e d e p recios d e l


a ce ro (el tie m p o c o m o va ria b le in d e p e n d ie n te ) y estim ar el v a lor
p r o b a b le d e l n d ice e n 1965 c o n base en 1963.
4] Se desea estim ar el m o n t o d e gastos en co n su m o d e a lim en tos p a ra
1967. Para e llo se. d is p o n e d e u n a 'e c u a c i n d e regresin en tre el
in greso real y e l c o n su m o tota l re a l d e l sigu ien te tip o :
C =

0.9 Y ?

P o r otra p a rte se sabe q u e la ela sticida d gasto d e a lim en tos es


d e 0.8. R e a lice la p r o y e cci n deseada si adem s se sabe q u e el c o n
su m o en a lim en tos en l a o 1964 fu e d e 2 000 m illo n e s ele uni
dad es m on etarias, sien d o el sigu ien te el n d ice d e base v a ria b le
d el in greso real segn el Plan d e D esa rrollo:

196/
-----

1965

1966

1961

105

106

106

E J E R C IC IO S

1] Ajuste los siguientes datos:

209

P R O B L E M A S P R O P U E ST O S
In greso (Y)
C onsum o (C )
(u .m . constantes)

Aos

1.6

1957
1958

2.0
2.1

1.7

1959

2.4

2.0

I960

2.4

2.1

1961

2.5

2.2

1962
1963

2.8

2.5

3.0

2.6

a ) a u n a recta: C = a Y - )- b
b ) a u n a p o te n c ia l: C = b Y>
c ) ca lcu le lo s co e ficie n te s d e co rre la c i n respectivos, co m e n ta n d o
los resultados;

d ) ca lcu le la tasa d e cre cim ie n to d e l co n s u m o m ed ia n te la fu n c i n :


c)

C = a b*
estim e la p r o p e n s i n m ed ia al c o n su m o e n 1965 si a d m ite q u e
el in greso ser e n ese p e r o d o d e 3.7.

2]

L o s seguientes d atos co rre s p o n d e n a p recios y ca n tid a d es transadas


d e c ie r to a rtcu lo en u n m erca d o:

Precio (p )
(u .m .)

10

C antidad v endida (q)


(m ile s d e u .m .)'

2.00

12

1.60

15
18

1.50
1.20

20

1.00

25

0.80

30

0.30

Se le p id e :

a)

D e te rm in e la fu n c i n d e d em a n d a m ed ia n te:

i)

q =

a
P

ii) q =

a
------- \- b
P

210

C O RR ELA C I N
b) C a lcu le los co eficien tes d e co rre la c i n respectivos;
c) C a lcu le los errores d e p r o y e cci n ;
d ) E stim e la ca n tid a d v en d id a a u n p r e c io d e 40, p o r m e d io d e
las dos fu n cion es;

e) E stim e el p r e cio q u e garantizara u n a v en ta d e 3.00 m iles d e


u nid ad es.
3] C o n
de
sas
las

e l o b je t o de estu diar la re la ci n en tre las va ria b les co n su m o


en erga elctrica ( X ) y v o lu m e n d e p r o d u c c i n en las em p re
in du striales ( Y , ) , se to m u n a m uestra d e 20 em presas,
para
cuales se c o m p u ta ro n los sigu ientes valores:
S X , =
2 Yj

11.34

2 Y =

84.96

20.72

2 X jY =

2 X 2

12.16

22.13

Se le p id e :
a) C a lcu le las e cu a cion es d e regresin d e " Y e n X y d e X en Y ;
b) C a lcu le el co e fic ie n te d e co rre la c i n rectiln e o ;
c) C a lcu le el e rro r d e p r o y e cci n d e la regresin d e Y en X .
4] En el d is e o d e un m o d e lo d e sim u la cin se n ecesitaba d is p o n e r d e
u na fu n c i n co n su m o d e b ien es d e o rig e n in d u stria l; para lo g ra rlo
se tien en los sigu ientes datos:

C o n su m o de bienes

Aos
I960
1961
1962
1963
1961
1965

In greso
Im portaciones
industriales
disponible
b ien es d e consum o
U nidades monetarias constan tes
45
42
48
55
53
65

52
58
58
60
65
70

10

13
10

14
16
18

Se le p id e :
a) A ju ste u n a fu n ci n d e l tip o : C = a Y - j - ( l M - j - y
d o n d e : a, i, y , parm etros d e regresin
C : con su m o d e b ien es in du striales
Y : in greso d is p o n ib le
M : im p orta cion es d e b ien es d e con su m o
b) C a lcu le el co e fic ie n te d e co rre la ci n m ltip le y e l erro r d e
p r o y e cci n ;

c) C a lcu le el co e fic ie n te de co rre la ci n

parcial en tre co n s u m o e
in greso, a isla n d o el e fe cto d e las im p orta cion es.

5] Interesa disponer de estimaciones de las variaciones en los pre-

P R O B L E M A S P R O P U E ST O S

211

cio s d e b ien es agrcolas d e co n su m o esen cial; para log ra rlo, des


pu s d e algu n os estudios, se c o n c lu y q u e u n a m e t o d o lo g a p osi
b le p o d ra ser el ajuste d e u n a ecu a cin d e regresin a los si
gu ientes datos:

Perodo

Precio de bienes
agrcolas
P

Costo unitario
de produccin
C

Expectativas
de inflacin
V

10

6%

12

8%

3
4

15
17

12

20

30
35

4%
7%
12 %
12%

13
16
25
25

8%

Se le p id e :

a) A ju ste u n a fu n c i n d e l tip o : P

(t } 1)

(t)

[1 j

a.
(

+ b V (t)]
d o n d e , a: m argen d e ga n an cia d e em presarios
agrcolas
b : co e ficie n te d e rea lim en ta cin d e in
fla ci n

b) Estim e el p r e c io cu a n d o el costo sea d e 40 y h ayan exp ectativas


d e esta b ilid a d e n la a ctivid a d econ m ica .
6]

D e a cu e rd o al p la n de d esa rrollo d e u n pas, se co m p ru e b a q u e el


p r o d u c to real d e l sector a g rcola m uestra los siguientes crecim ien
tos p o rcen tu a les anuales en e l p e r o d o 1 9 56/1962:

1957

1958

1959

1960

1961

1962

2.0

3.0

4.0

3.5

3.0

3.3

a) D e te rm in e la tasa a n u a l p r o m e d io d e cre cim ie n to pa ra e l p e


r o d o co n sid e ra d o u tiliza n d o la ecu a cin d e regresin a decu a da .*

b) E l a o 1962, el sector a g rcola a p orta b a e l 3 0 % d e l p r o d u c to


in te rn o b ru to ( p i b ) . Si se e m p le a la e cu a ci n d e regresin e n
co n tra d a y se su p o n e q u e el p i b crecer el 5 % a n u a l acu m u la-

* Por razones implcitas en el modelo de proyeccin, la recta queda excluida


como posible solucin.

CO RR ELA C I N

212
d u r a n t e el p e r o d o

1962/1970, e s t i m e l a p a r t i c i p a c i n q u e
e l p i b , e l a o 1970.
7] L o s siguientes d a tos co rre s p o n d e n a ingresos y con su m os d e un
c o n ju n t o d e profesion ales.
tiv o

te n d r e l s e c to r a g rc o la e n

P erod o (t)

Ingreso (Y )

C onsum o (C )
60

100

120

65

120

66

3
4
5

130
140

70

160
160

75
80

72

Se le p id e ca lcu la r e l v a lo r d e los parm etros e n la fu n c i n co n s u


m o d e F ried m a n :

C(t)=a+PY(t)

y C

(t -

1)

Para u n a re g i n de cie rto pas, se tien en los sigu ientes anteceden tes:

C onsum o de
C onsum o p o r
alim entos p o r
Ingreso po r
habitante
habitante
habitante
U nidades monetarias constantes

Aos
1958
1959
I960

200
220

245
270
300
340

1961
1962
1963

180
210
230
250
280
320

120

130
150
170
200

220

Se le p id e :
a) C a lcu le la ela sticida d in greso d e l c o n su m o m ed ia n te la fu n ci n :
Y =

b X* ;

b) E stim e, u tiliz a n d o e l m t o d o g r fico, e l c o e ficie n te d e elastici


d a d gasto d e l co n su m o d e alim en tos;

c) T e n ie n d o en cu en ta las d os elasticitlades ca lcu la da s a n terior


m en te, estim e el con su m o d e a lim en tos en 1970, a d m itie n d o q u e
e l in greso p o r h ab ita n te crecer a partir d e 1963, a u na tasa de
3 % a cu m u la tiv o an u al.

SO LU CI N DE E JE R C IC IO S

213

8] La distribucin del gasto en 1960 es la siguiente:


A lim e n to s
O tro s p r o d u c to s m a n u fa ctu ra d os
Servicios

100
60
40

C o n su m o tota l

200

Si adem s se sabe q u e la elasticidad gasto d e a lim en tos es 0.8 y la


d e p ro d u cto s m a n u fa ctu ra d os 1. 2 , se le p id e ca lcu le:
o ) E l co e ficie n te d e ela sticida d gasto de servicios;
b) L a d istrib u ci n d e l gasto en 1966, co n sid e ra n d o q u e e l in greso
crecer al 4 % anu al, si se m a n tien e con stante la p ro p e n s i n
m ed ia al con su m o, al n ivel d e 0.85.
10] En 1955 el co n su m o d e p a p e l para cierto pas se c a lc u l en 4.5 k g
p o r h abitan te. C o n el p r o p s ito d e p rogra m a r el d esa rrollo d e la
in du stria d e la celu losa, se necesita estim ar el co n su m o para 1967,
te n ie n d o en cu en ta los sigu ientes anteceden tes:

a) E lasticidad gasto d e la d em a n d a p e r capita de p a p e l: 1.5;


b) C re cim ie n to d e l in greso: 4 % a cu m u la tiv o an u al;
c) E cu a cin d e l gasto tota l en rela cin al in greso total: G 0.9 Y.
A greg u e, si necesita, la in fo rm a ci n a d icio n a l q u e estim e til
para efectu a r la p ro y e cci n .

S O L U C I N D E E J E R C IC IO S
1] a) Las e cu a cion es n orm ales son:
2 C =

a 2 Y -f- n b

2 CY = = a 2 Y2 - f b 2 Y

YC

C-

ya
4.00
4.41
5.76
5.76

43.02

2.0

1.6

3.20

2.1

1.7

2.4
2.4

2.0

2.5

2.2

3.57
4.80
5.04
5.50

2.8

2.5

7.00

5.0

2.6

7.80

2.56
2.89
4.00
4.41
4.84
6.25
6.76

17.2

14.7

36.91

31.71

2.1

6.25
7.84
9.00

214

C O R R E L A C I N
Si se rem pla za n estos valores en las ecu a cion es n orm ales:
14.7 =

17.2 a - f

7b

36.91 == 43.02 a +
Si se resuelve e l sistema: a =
la fu n c i n q u e d a : C =

b)

17.2 b

1.043; b = 0.463
1.043 Y 0.463

Para e l ajuste d e la p o te n cia l, ser n ecesa rio a p lica r loga ritm os,
pa ra u tilizar las ecu a cion es n orm a les
C =
lo g C =

b Y

lo g b

a lo g Y

Las e cu a cion es n orm a les son:


2 lo g C

2 lo g C lo g Y =

lo g C

n lo g b

- j-

a 2 lo g Y

lo g b 2 lo g Y -|- a 2

log Y

log C log Y

(lo g Y ) 2

(lo g C)*

(logY )t

0.20412

0.30103

0.061446

0.041665

0.090619

0.23045

0.32222

0.074256

0.30103

0.38021

0.114455

0.144560

0.32222
0.34242

0.38021

0.122511

0.053107
0.090619
0.103826

0.144560

0.39794

0.136263

0.39794

0.44716

0.177943

0.117251
0.158356

0.199952

0.41497

0.47712

0.197990

0.172200

0.227643

T o t a l 2.21315

2.70589

0.884864

0.737024

1.069516

0.103826

0.158256

Si se rem pla za n estos va lores en las ecu a cion es n orm ales


2.213150 =
0.884864 =

7 lo g b - f 2.70589 a

2.705890 lo g b - f

Si se resuelve el sistema:
a -=
lo g b =

1.247
0.166

1.069516 a

215

S O L U C I N DE E J E R C IC IO S
L a fu n c i n q u ed a r :
lo g C == 1.247 lo g Y -

0.166

yt-an

1.306

c)

L o s co e ficie n te s d e co rre la c i n sern:


para la recta:

r2 =

a 2 Y ,C - f b 2 C - C 2
--------------------------------------------------2C ? -C S C ,
1.043 (36.91) - 0 . 4 6 3 (14.7) - 2 . 1

(14.7)

31.71 2.1 (14.7)


38.4971 - 6.8061 - 30.87

0.82

31.71 - 3 0 . 8 7

0.84

0.976

r =

- f -y 0.976 =

0.987

para la p o te n c ia l:

r 2 lo g C lo g Y =

a 2 lo g Y lo g C - )- lo g b 2 lo g C , lo g C 2 lo g C ,
---------2 ( l o g C ,) 2 - l o g C 2 l o g C ,
1.247 (0.884864) - 0.166 (2.21315) - 0.31616 (2.21315)

r 2 lo g C lo g Y
0 .7 3 7 0 2 4 - 0 .3 1 6 1 6 (2.21315)

r 2 lo g C lo g Y =

d)

1.10343 - 0.36738 - 0.69971


------------------------------------------------ =
0.737024 - 0.69971

0.03634
-------------- =
0.03731

0.974

lo g C lo g Y = 0.987
Las e cu a cio n e s n orm a les desp us d e a p lica r loga ritm os son:
2 lo g C n lo g a - f- lo g b 2 t,
2

(lo g C ,)

t, =

lo g a 2

t +

lo g b 2 tf

Ix>s d a tos se d is p o n e n en la sigu ien te form a :

216

C O R R ELA C I N
Ci

log Ci

ti log C

t\

-3

1.6

_2

1.7

- 0 .6 1 2 3 6
- 0 .4 6 0 9 0

9
4

-1

2.0

ti

2.1

1
2

2.2

2.5

0.20412
0.23045
0.30103
0.32222
0.34242
0.39794

2.6

0.41497

1.24491

4
9

2.21315

1.00892

28

-0 .3 0 1 0 3

1
0

0.34242
0.79588

R e m p la z a n d o estos valores en las ecu a cion es n orm a les:


2.21315 =
1.00892 =

7 lo g a - f 0
0 - j - 28 lo g b

lo g a =

0.3162

a =

2.071

lo g b =

0.0360

b =

1.0865

En la fu n c i n se tena C = a b l, d o n d e b == 1 -|- i en q u e i
es la tasa d e cre cim ie n to a cu m u lativo. En el p r o b le m a i
=
0.0865 = 8 .6 5 % acu m u lativa anual.

e)

Para e n co n tra r la p r o p e n s i n m ed ia al co n su m o en 1965, es n e


cesario d is p o n e r d e estim acion es d e co n s u m o e in greso pa ra ese
a o ; e l c o n su m o f cilm en te p u e d e estim arse a travs d e la fu n
c i n e n co n tra d a en d.
C 1965 =

2.071 (1. 0865)


C 19#3 =

2.071

(1.7313)

t =
=

5 para 1965
3.5855

E l in greso est d a d o ; lu ego,

P r o p e n s i n m ed ia el co n su m o =

3.5855
------------- =
3.7000

0.969

2] o ) Para re s p o n d e r i e ii, ser n ecesario d eterm in a r sus ecu a cion es


n orm ales.

i) 2 q /p =

a 2 1/p2

211

SO LU CI N DE E JE R C IC IO S
ii)

2 q =

a 2 ------ 1~ n b

P
2 q /p =

a 2 l/p 2 4 . h 2 i q

Se calcula a continuacin los datos p o n i t n f b a t r ero (Sita.


ecuaciones:
H

<?//>

2.00

10
12

0.2000
0.1333

o .* *

15
18

0.1000

0.0667

0.0667
0.0500
O.O52 O

tu s

M rnm i

0.0506
OuOMIffi

U B
M um

0.0100

0.0333

M U

0.5920

0.4288;

M 9B

1,60
1.50
1.20
1.00

20

0.80
0.30

25
30

8.40

IIP '

S .IM

VHP*

MOM
moiWM

R e m p la z a n d o valores;
i)

0.5920 =

0.2968 a

a == 19.946
La fu n c i n q u ed a :
q =
i)

1 9 .9 4 6 /j)

8.400 =
0.5920 =
a =

0.42880 a - f
0.02968 a - f

7 b
0.4288 b

22.6966

h == -0 .1 9 0 3

I.a fu n ci n q u e d a : q =

b)

22.6966
-------------------- O. i 90S
P

Para ca lcu la r los coeficien tes d e correlaci n se iMiilkii lta HAnuai


la gen eral:

( 2 (Vc - ) \ w

218

CORRELACIN
Caso ii

Caso i

A m bos casos

qc

(<h - q ) 2

qc

(ic - q ) 2

qi

( q .- q ) 2

1.995
1.662
1.330
1.108
0.997
0.798
0.665

0.632
0.213
0.017
0.008
0.041
0.162
0.286

2.079
1.700
1.324
1.072
1.025
0.718
0.565

0.773
0.250
0.015
0.016
0.031
0.232
0.403

2.0
1.6
1.5
1.2
1.0
0.8
0.3

0.64
0.16
0.09

1.720

8.4

1.90

1.359

q =

2 q,
-------- , =

8.4
=

0.04
0.16
0.81

1.20

C a so i)
/

1 .3 5 9 \ v s

( ----------1

=(0.715)1/2 =

Mono/
1.900

0.845

C a so ii)

r =

/ 1 .7 2 0 \ i/2
( ----------)
=
' 1.900 '

(0.905) 1/2 =

0.952

c ) Para el c lcu lo d e los errores d e p r o y e cci n recu rdese q u e

s?.

S2 C +

E rror =

\ S2.s

S ?s

Ss

C a so i)
1.90
S t.

-------- =

0.27

7
1.359
s:. = ------=
7

S|c

Error =

0.08

0.283

0.19

219

SO L U C I N D E E J E R C IC IO S
C aso ii)
1.90
S|

0.27

S fc

172
-------- =
7

0.25

S?c = 0.02
E rro r == 0.142

d)

Basta rem pla za r p =

40 en am bas fu n cip n es:

C aso i)

q =

19.946
-------- =
p

19.946
=

0.499

40

C a s o ii)
22.6966
q = = -------------------- 0.1903
P
22.6966
-

0.1903 == 0.377

40

e)

Basta rem pla za r q =

3.00

C aso i)
19.946
3 =

p = 6.65

P
C a so ii)

22.6966

3]

a)

3 =

-------------------- 0.1903
P

p =

7.11

Para el caso de la regresin de "Y en X se sabe que

*
220

CO RR ELA C I N

^
C L X .Y ,]
iX ~

- x

V [ X ,]

2X i

------ VV-

R e m p la z a n d o valores se tiene
22.13

11.34

20

20

12.16i

20.72
1 .1 0 6 5 - 0 .5 6 7

20

//1
I1
I .3
,344X\--

20

'

20

1.036

0 .6 0 8 - 0 .3 2 1

0.519
1.808
0.287
Para d e te rm in a r el c o e ficie n te d e p osicin se tiene

Y =

1>YV =

20.72

a vv X 4 - Ijvx
11.34

1.808

20

1.036 -

I.a ecu a ci n d e "Y en X q u ed a : Y t.


C fX .Y .l
aivv

1.025 =

0.009

20

0.519
84.96
20

/2 0 .7 2 y
'

20

0.09

0.519
=
4 .2 4 8 - 1 . 0 7 3

=
V [Y ]

1.808 X ,

= 0.163

'

Para d e te rm in a r el co e ficie n te d e p o s ici n , se tiene


X =

1>V =

11.34
---------

axv X +

b sv

20.72
0.163

20

0.567 -

0.169 =

0.396

20

L a e cu a ci n d e X en Y q u ed a :
X,. =

b)

0.163 Y - f 0.396

Para el c lc u lo d el co e ficie n te de correla cin rectiln eo, se tiene


que

S O L U C I N DE E J E R C IC IO S
r- =

221

aXY aYX =

r =

c)

(0.163)

- f Y~0.295 =

(1.808) =

0.295

0.543

Para el c lcu lo d e l error de p r o y e cci n recu rdese q u e

r_

S.

_ t

T~

SY-

SY*

2
0.295 =

1 3.175
=

ya q u e S|
^

(0.705)

E rror d e p r o y e cci n SYs


4]

V [Y .l == 3.175

(3.175) =

'Y Sf.s =

2.238

Y 2.238 =

1.5

Si se llam a X , al con su m o, X 2 al ingreso, X ;1 a las im p orta cion es,


las e cu a cion es n orm ales son:

a)
X 1=

X ,

+ P X s + n

2 X tX 2 =

a 2 Xi

2 X tX 3 =

a 2 X 2X ;! - j- p 2 X $

- f p 2 X 2X 3 - f y 2 X 2
-f Y 2 X3

L os d atos se d is p o n e n as:

X*

X X

2 340
2 436
2 784
3 300
3 145
4 550

2 704
3 364
3 364
3 600
4 225
4 900

520
754
580
840
1 040
1 260

18 855

22 157

4 994

X,

X,

x tx t

45
42
48
55
53
65

52
58
58
60
65
70

10
13
10
14
16
18

308

363

81

x,

C O R R ELA C I N

222
**3

X*

450

100

2025

546

169

1 764

480

100

2 304

x x a

770

196

3025

848

256

2 809

1 170

324

4 225

4264

1 145

16 152

El sistema queda:
308 =
18.855 =

363 4 - 81 P - f 6
22157 a - f 4994 p +

4 .264 == 4994 a +

1L45 p +

363
81

C uya resolucin es
a =

b 123 =

1.114

p =

b13 2 =

0.040

Y =

b)

* 1 .2 3 '= 16.59

L a frm ula del coeficiente de correlacin m ltiple que se u tili


za es la siguiente:

**1.23

* 1.23 2 X t + b12.3 2 X tX 2 + b13 , 2 X tX 3 - n X *

y /2

2X 2 _ nX2

Si se rem plazan valores:

f~
123_

16.59 (308) - f 1.114 (18 855) + 0.04 (4 264) - 6 (2 635) y / 2

'

16 1 5 2 - 6 2
(2 635Y
635)

/ - 5 109.7 + 21 004.5 - f 170.6


r0 . 6 - 15 810.0
810.1 y / 2

Xi.23 = y

1 6 1 5 2 - 1 5 810

223

S O L U C I N D E E J E R C IC IO S

R i-23 =

/255.4V1/2
W
=

0.865

que

Para e l c lc u lo d e l e r r o r d e p r o y e cci n , recu rdese

n
~

D e lo s d a tos a n teriores se tien e

n xe 1.23 =
n

255.4

. .

SXc i.2s =

42.6

1.23 == ^42

. .

SX , 23 =

57

L uego

86.6
SXs

1 .2 3 = = : z:

\ 14.4 =

E rror =

c)

^ 4 .4

3.8

Se trata d e ca lcu la r:
Xc

1 .2 3 ^ X c
^Xs

1 .3

lt/ 2
|.3 ^

E n esta f rm u la se d e s co n o ce n los va lores d e las varianzas e x


p lica d a y n o e x p lica d a en tre las variables
y X .; en c a m b io
e l v a lo r d e

123 se o b tie n e d e l c lc u lo a n terior

255.4
SL

1.23 =

4 2 .6

Para las otras varianzas se recu rre a las sigu ientes

frmulas:

sx<= 1.3 = 1.3 2 X . + b.,3 2 X tX 3 - n f ,


La e cu a ci n d e aju ste re ctiln e o es
X 1.3 =

l.3 4 " ^ 1 .3 x a

Sus ecu a cio n e s n orm ales:

2 Xt =

n a, 3 +

b13 2 X 3

224

CO RR ELA CIO N
2 X A

ai.s 2 X 3 +

M a s Ias su m atoras a p a recen


RitairpiUraindo v a lores se tien e:

b 13 2 X*

tabuladas en la p rim era h oja .

308 == 6 a , 3 - f- 81 ^ 3
4264 =

81 a 13 + 1 1 4 5 b j 3
a i ,3 =

23.52

b t .3 =

2.06

Mgm$$xEamt> va lores e n la frm u la de la varianza ex p lica d a , se

Sg^ j 3 =

23.52 (308)
7 244.2 +

2.06 (4 264)

8 7 8 3 . 8 - 15 810

* L = --------%e

218

6
1.3

6 (2 635)

36.3
*

KfflBranese q u e

1.3 ~

%c

1.3 +

^Xs 1.3

La varasza to ta l d e la v a ria b le d e p e n d ie n te es nica, cu a lq u ieaai me e l M m en d e va ria b les in d e p e n d ie n te s q u e se tom en ; en


m m ecM ea d o. este v a lor es el m ism o q u e aparece en el d en om imwfVor d d l o e J d e n lc d e co rre la c i n m ltip le.

SL

57 -

/ 4 2 . 6 36.3 X 1/
\ ------ ------ )

*13. =

5[j

, A=

36.3 =

20.7

---------

= V 4 = 0 . 5 5 1

La n a c i d e aju ste p u e d e representarse as:


r

<t

lih r a u a iid o

1)

(1

a) C

(t)

b C

(t) V

(t)

225

SO L U C I N DE E J E R C IC IO S

P = X1
C (t) =

x 2

C (t) V (t) =

x3

l + a = d
L a e cu a ci n q u ed a :
Xt =

d X , 4- b X3

Las e cu a cion es n orm a les son las siguientes:


2 X 1X 2 =

d 2 X|

2 X ^

d 2 X 3X 2 +

b 2 X 3X 2
b 2 X|

L a ta b u la ci n d e va lores se d is p o n e as:

CV

Xt

X2

X,

PC
X jX 2

C2
X|
36
49
144
169
256
625
1 279

12

15

17

12

0.36
0.56
0.48

20

35

13
16
25

0.91
1.92
3.00

72
105
204
260
480
875

129

79

7.23

1 996

30

VC2
x*x2

201.98 =

30.72
75.00

0.1296
0.3136
0.2304
0.8281
3.6864
9.0000

129.39

201.98

14.1881

1279.00 d - f 129.39 b
129.39 d 4

R e s o lv ie n d o para d y b
d =

1.555

b =

0.054

L u e g o la e cu a ci n aju stada q u ed a

(C V )2
X|

4.32
8.40
8.16
18.20
57.90
105.00

2.16
3.92
5.76
11.83

E l sistem a q u e d a
1996.00 =

PCV
XxX 3

14.1881 b

226

C O R R E L A C I N
P (t - f - 1) =

b)

Bastar rem p la za r C

C (t) [1.555 +

0.054 V

(t)]

(t) p o r 40 y V p o r 0, pa ra estim ar P (t J

1) , e n tales circun stancias

p
6]

(t 4 - 1) = 4 0 [1.555 - f 0] =

62.22

E n vista d e q u e h a y va ria cion es p orcen tu a les anuales, se calcu lar


u n n d ic e d e base fija , y lu e g o m ed ia n te la fu n c i n
Y =

a b

se ca lcu la r la tasa p ed id a .

a)
n d ic e d e l p ro d ,
real agrcola

T iem po

Y,

aos
1956
1957
1958

ti
-3

100.0
102.0

-2

105.1
109.3
113.1
116.5

-1

1959
1960
1961
1962

0
1
2

120.3

Las e cu a cion es n orm a les son:


2 lo g Y i =

2 t, lo g Y , =

lo g Y
2.00000

2.00860
2.02160
2.03862
2.05346
2.06633

n lo g a +

lo g b 2 t,

lo g a 2 t, 4 - lo g b 2 t^

t?

(lo g Y i)h

9
4

- 6.00000
-4 .0 1 7 2 0

- 2 .0 2 1 6 0

2.08027

4
9

2.05346
4.12516
6.23754

14.26888

28

0.37736

227

SOLUCIN DE E JE R C IC IO S
Si se rem plazan estos valores en las ecuaciones norm ales
14.26888 =

7 log a

(Y a que 2 q =

0.37736 =
log

14.26888

a = -------

0)

28 log b

2.03841

0 .37736
--------------- =
28

0.01348

a =

109.24

b =

1.0315

log b =

/.

L a funcin queda
Yc =

b)

109.24 (1.0315)

L a tasa de crecim iento es 3.15% acum ulativa anual.


P ara en co n trar la p articipacin relativa, se puede trab ajar con
los mismos porcentajes dados en los datos iniciales.

1962

1970

100
30

P IB

P. agrie.

p iB m o

100 (1 - f 0.05)
30 (1 + 0.0315) 8

100 (1.477) =

P. agrie. m o =

147.7

30 (1.282) =

38.5

l a participacin relativa del sector agrcola en 1970 ser


38.5
147.7

26.07%
/0

7] Los datos se disponen de la siguiente m anera (se introduce ei desajuste del consumo)

Y(t)

C (t)

C (t-l)

1
2
3
4
5
6

120
120
130
140
160
160

65
66
70
72
75
80

60
65
66
70
72
75

830

428

408

228

C O R R E L A C I N
Las e cu a cio n es n orm a les son las siguientes:
n a - f P 2 Y (t) - f y 2 C (t 1)

2 C (t) =
2 C (t) Y (t) =
2 C

(t)

a 2 Y (t) +

(t -

1)

p 2 [Y ( t ) F 4 - Y 2 c

= = a 2 C (t - 1) +
+ y 2 [C ( t - l ) p

P 2 Y

(t (t)

1) Y

(t)

(t -

1)

Es n ecesario ta b u la r adem s las siguientes sum atorias.

C (t) Y (t)

C ( t - l ) Y(t)

[ W

7 800

14 400

C (t) C ( t - l )

[C (t-1 )Y

12 000

14
16
19
25

400
900
600
600

7 200
7 800
8 580
9 800
11 520

3
4
4
5
5

12 800

25 600

12 000

6 000

5 625

59 700

116 500

56 900

29 250

27 890

7 920
9 100
10080

900
290
620
040
400

3 600
4 225
4 356
4 900
5 184

El sistem a d e ecu a cion es n orm a les q u ed a :


428 =
59 700 =

6 a +

830 a - f

29 250 = = 408 a +

830 p +

408

116 500 p 4 - 56 900

56 900 p 4 - 27 890 y

Si se resuelve e l sistem a se llega a


a =

38.017

P == 0.1333
Y =

0.2187

L a fu n c i n co n s u m o q u ed a
C
8]

(t) =

38.017 4 - 0.1333 Y

(t)

- f 0.2187 C

a) Las e cu a cio n e s n orm a les d e la fu n ci n son:


2 lo g Y , =

n lo g b -f- a 2 lo g X

(t -

1)

S O L U C I N D E E J E R C IC IO S

229

'

2 lo g Y lo g X =

lo g b 2 1 o g X , - f - a 2

S ie n d o X t =
Y,

In g reso; Y , =

( lo g X ) 2

C on su m o

log X

log Y t

log X { log Y i

logX \

2.25527
2.32222
2.36173
2.39794
2.44716

5.18944

5.29474
5.48693
5.70813
5.91151

34.94582

200

180

2.30103

220

210

245
270
300
340

230
250
280
320

2.34242
2.38917
2.43136
2.47712
2.53148

2.50515

5.43961
5.64257
5.83026
6.06191
6.34174

14.47258

14.28947

34.50553

6.13612
6.40839

Si se rem p la za n estos valores:


14.28947 = = 6 lo g +
34.50553 =

14.47258 a

14.47258 lo g b - f
lo g b = = a =

34.94582 a

0.12203

1.038

L a fu n c i n q u e d a :

1
Y = ------ X .i nas
1.324
L u e g o e l c o e ficie n te d e elasticidad in greso d e l c o n su m o es:
a =

b)

1.038

U tiliz a n d o el m t o d o g r fico, se tien e:

g r f i c a 29

_____________ ____I__________ I_______ I_____ I____ I____I___I


100

ZOO

300

400

I- L

lo g X

250

CORRELACIN
5.4
------ = 1 . 2
4.5

Elasticidad gasto =

c)

Si las elasticidades son las siguientes:


Elasticidad ingreso del consumo: E y == 1.038
Elasticidad gasto del consumo de alim entos: E e =

1.20

P ara realizar la estimacin pedida, se har prim ero una estim a


cin del consumo en 1970 m ediante la relacin

E l valor del ingreso en 1970 est dado por


Y 70 =

Y es (1 - f 0.03) * =

340 (1.23) =

418.2

Luego,
4 1 88.2
.2\y1038
o8

C 70

'334400..0
0'

320

(1.23) 1038 _
320
C70 =

320 ( 1. 23)1038 _

320 (1.24) =

396.8

P ara la proyeccin del consumo de alim entos:

(
Si se rem plazan valores se tiene:
396.8'
396.8\ i 2

C. alim. 70

320.0
C. alim .70 =

220 (1.24) 1.2 =

220
220 (1.295) =

284.9

231

SOLUCIN DE EJERCICIOS

P ara calcu lar la elasticidad gasto de los servicios se recu rre a la


propiedad:

a)
Es W s +

EA W A +

EM W M =

gasto en servicios
W 8 == ---------------------------- =
gasto total

40
--------- =
200

0.20

gasto en alim en tos.


------------------------------=
gasto total

100
--------- =
200

0.50

WA =

gasto en prod, m anufac.


------*-------------------gasto total

WM=

60
=

9]

==

0.30

200

Luego,

E =

1 - 0 . 8 (0.50) - 1.2 (0.30)


------------------- ------------ -- - =

0.20

b)

0.24
=

1.20

0.20

Si la propensin media al consumo se m antiene constante, el


consumo crecer a la misma tasa que el ingreso.
E l consumo en 1966 ser:
C*196 =
C 1()(!(! =

C 19ft0 (1 -j- i) "

200 (1. 04) 0 =

200

(1.265) =

253

Para proyectar los consumos especiticos se tiene:


i) Servicios:
C. serv. 1966

^Cioeoy
^1960

1.265

40 (1.326) =

53.04

C. serv. 1960

(1.265)

C. serv. 1966 =
ii)

253
;'d a d o q u e

1-2 =

200
C. serv.1966
----------------40

4 0 (1.265) i -2 _

O tros productos m anufacturados:


Cismo
(C
)\ E m
^ 198

C. prod. m an. 1966


C- prod. m an. 1960

232

C O RR ELA C I N
(1.265)

C. p ro d . m an . 1966
---- -------------------------60

1-2 =

C. p r o d . m an . 1966 =
iii) A lim e n to s :

60 (1.265) 12 =

C 1968\ E a

C. a lim . 1966 =

100

79.56

C . alim . 1966

C 1960 '

(1.265)

60 (1.326) =

C. alim . 1960

08 =

C . alim . 1966
---------------

(1.265) n * =

100

100

(1.207)

120.7

L a d is trib u ci n d e l gasto en 1960 y 1966 es la sigu iente:

I9 6 0
A lim e n to s
O tro s p r o d u c to s m a n u fa c.
Servicios
T ota l

1966

100
60
40

50
30
20

120.7
79.6
53.0

47.7
31.4
20.9

200

100

253.3

100.0

10] L o s d atos se resum en as:


C o n su m o d e p a p e l p o r h ab ita n te en 1955: C P 1985 = 4.5
C o n su m o d e p a p e l p o r h a b ita n te en 1967: C P 19(57 =
?
E la sticida d gasto de la d em a n d a d e p a p e l p o r h ab ita n te: E G = 1 . 5
T a sa d e cre cim ie n to d e l in greso: i = 4 % ac. an u a l
R e la c i n gasto in greso: G 0.8 Y
L a f rm u la para la p r o y e cci n ser la sigu iente:
C o n su m o

p o r h a b ita n te

1967\ EG

C o n su m o p o r h a b ita n te 1955
C o n su m o d e p a p e l p o r h a b ita n te 1967
C o n su m o de p a p e l p o r h ab ita n te 1955
Es n ecesa rio estim ar p revia m en te los con su m os p o r h a b ita n te en
1955 y 1967. Para e llo es n ecesario

SOLUCIN DE E JE R C IC IO S

233

0.9 Y1#35

G1955 =

1955

,
, , . v
-9*1955
(Por liabit.) = -------

1*1955

donde P = Poblacin
g 1967 (Po r h a b it.) =

G1 ""

/
. i . .
(p o r h ab it.)

Gl955

Y1955 (1 + 0 - 4 ) 12
1*1955 (1 .0 2 5 )

0-9

0 . 9 Y i #35 (1.04) xa

P 1933

1*1.955 (1 -0 2 5 )1 -

0.9 Y 1933

/1
n.040\ia
.0 4 0 X 1
'1 . 0 2 5 '
R e m p la z a n d o en la f rm u la d e la p r o y e cci n se tiene:
r /1
m -ii.5
'1.0
.044 0 \ w
n i.o

L \L025/

C on su m o d e p a p el p o r h ab ita n te 1967

4.5

C o n su m o d e p a p e l p o r liabit. 1967 =

4.5

(1.0146) 18 =

/1 .0 4 0 V "
4 .5 )
'1 . 0 2 5 '

4.5 (1.308) =

5.89

L u e g o , se estim a para 1967 u n co n su m o d e 5.89 k g d e p a p e l p o r


h abitan te.

TERCERA PARTE

ELEM ENTOS DE M UESTREO

I
ASPECTOS

A.

t e r ic o s

INTRODUCCIN

Cuando se acepta la idea de planificar, implcitamente se admite


la necesidad de contar con ms, mejores y peridicas informacio
nes bsicas. En el proceso de planificacin, desde el diagnstico
hasta la reformulacin de los planes, es indispensable contar con
magnitudes e indicadores que muestren lo que en verdad est ocu
rriendo en una actividad econmica. Ahora bien, hay varias posi
bilidades de captacin de informacin: los censos, el anlisis de
casos tpicos y las muestras. Al considerar el tipo y fidelidad de las
informaciones necesarias, el costo de obtenerlas y el tiempo que de
mandar su recoleccin, surgen ntidas las ventajas del muestreo.
No debe interpretarse con esto, que el muestreo sea un sustituto
del censo. Informaciones bsicas para el total de una poblacin o
universo siempre sern necesarias; de otra manera no ser posible
disear una muestra con reales ventajas y. suficiente garanta. Lo
que ocurre es que mediante una muestra pueden obtenerse infor
maciones que resultaran poco menos que imposibles con una
enumeracin total de la poblacin: justamente por problemas de
costo y' tiem po. Por otra parte los censos se realizan cada 5 o ms
aos y las muestras pueden ser utilizadas para estimar parmetros
en perodos intermedios. Conocer el tamao de una poblacin y
otras caractersticas bsicas es indispensable para extraer una bue
na muestra representativa. Se concluye pues, que censo y muestra
son dos mtodos complementarios y no excluyentes en el proceso
de captacin de informacin.
El objeto de la primera parte de este trabajo es mostrar, a los
pxofesionales planificadores, las posibilidades y limitaciones de
esta tcnica, por una parte, y plantear los principales conceptos
envueltos en el muestreo. La segunda parte est destinada a anali
zar los principales problemas que se presentan en las encuestas
industriales y sealar las posibles soluciones.
A esta altura es indispensable advertir que existe una gran pro
fusin bibliogrfica sobre el tema, pero es difcil encontrar un
[237]

238

ASPECTOS TERICOS

trabajo que deje de lado todo el tratamiento matemtico y se


centre en la parte prctica. El planificador debe conocer los ele
mentos bsicos del muestreo, sus limitaciones y alcances, de modo
que pueda determinar qu tipo de investigaciones son susceptibles
de mfrentarse por muestreo y pueda decidir con base fundada
sobre las posibilidades que le ofrezca el muestrista o especialista
en muestreo. El experto en muestreo puede presentar posibilidades
para una investigacin dada, que fcilmente pueden implicar cos
tos que van desde los 5 o 10 mil dlares hasta los 50 mil o ms,
dependiendo del grado de precisin, de los niveles de confianza o
probabilidad de acierto, del tipo de diseo muestral, etc. Sobre
esas posibilidades el planificador debe estar en condiciones de to
mar una decisin racional.
Se intentar cumplir con los objetivos sealados en lneas ante
riores, prescindiendo hasta donde sea posible del aparato mate
mtico. El trabajo est diseado para ser interpretado contando
con conocimientos de estadstica descriptiva, elementos de proba
bilidades y lgebra superior.
En los anexos finales se presentan las principales demostracio
nes matemticas y formularios completos de los principales dise
os mustrales.
Se piensa que con estos antecedentes, el planificador estar en
condiciones de interpretar en su justa dimensin las reales posi
bilidades de las tcnicas mustrales en general, de calificar las esti
maciones resultantes y de tener una posicin realista en los pro
blemas en que deber tomar decisiones.
B . FUNDAMENTOS TERICOS DEL MUESTREO 1

Para presentar los elementos bsicos del muestreo, se tomar como


punto de partida el diseo muestral aleatorio simple por dos razo
nes principales: se trata de un diseo sencillo, de fcil interpreta
cin, y constituye la base de los diseos mustrales aleatorios.
Por poblacin, universo o marco muestral se entender el con
junto de elementos de los que se extraer informacin y sobre
los que se podr generalizar la conclusin obtenida a partir de la
muestra. La poblacin podr estar formada por personas, empre
sas, familias, reas, objetos, etc. El nmero de elementos que com
ponen la poblacin se designar por N.
1 Se utilizar la smbologa de W . C. Cochran, para facilitar al lector inte
resado la consulta del libro Sampling techniques del autor citado.

230

FUNDAMENTOS DEI. MUESTREO

Por muestra se entender una parte representativa de esa pobla


cin y se designar por n.
Ser necesario definir la variable que se investigar: ingresos,
valor agregado, productividad, etc., y las unidades en que se ex
presar.
Por y[, se denominar el valor de la variable de la i-sima uni
dad de la poblacin o de la muestra (i = 1, 2, 3 . . . n . . . N).
El nmero posible de muestras de composicin distinta que se
N

podr obtener estar dado por el nmero combinatorio C


. Se
insiste que se trata de muestras de composicin distinta, en cuan
to a sus elementos, aunque muchas de estas muestras pueden tener
la misma media aritmtica.
Los estadgrafos que interesa definir son los siguientes:
: media aritmtica de la poblacin
N

2 y.
i=l
y: media aritmtica de la muestra
n

2 y,
i1
a2: varianza de la poblacin
2 (y. - ? ) 2
i=l

S2: varianza de Cochran de la poblacin

2 (y. - )2

s2 =

i=i

N- 1

240

ASPECTOS TERICOS

s2: varianza de C o ch ra n de la m u estra

2 (y, - y)2

S2 =

i=l

n -

Ahora bien, si el nmero de muestras distintas que se puede


/N\
obtener es I
I , habr igual nmero de medias aritineticas muestraies: h, donde h =

/N\
1, 2, 3 . . . 1 I.

Si se extraen todas esas muestras computndose sus medias arit


mticas y clasificndolas en una tabla de distribucin de frecuen
cias, se comprobar que en general estas medias aritmticas tienen
distribucin muy aproximada a la distribucin normal. Se recalca
en general, porque esto no se cumple cuando la muestra es muy
pequea (menos de 30-40 elementos),2 o la poblacin es muy redu
cida o con caractersticas poco frecuentes. En el siguiente grfico
se ilustra este comentario:

Si se promedian todas estas medias aritmticas (E: esperanza


matemtica) se encuentra que el promedio es exactamente igual a
la media aritmtica poblacional, es decir (demostracin en el
apndice):
2 El desconocim iento de la varianza poblacional (S2) es otro aspecto a con
siderar. Para investigaciones en el campo industrial, en don de generalmente
las muestras superarn los 30 o 40 elementos, no es muy peligroso aceptar
esa simplificacin terica.

241

FUNDAMENTOS DEL Ml.'ESTREO

2 i.
h=1

n/
Por eso a la media aritmtica muestral (h) se le llama estim ador
de la media aritmtica poblacional.
De la misma manera, a todas las posibles muestras se les puede
computar una varianza (s-b). Si se promedian estas varianzas, el
resultado es la varianza de Cochran para la poblacin:
insesgado

Por ello a la varianza de Cocinan para la muestra se le llama


estimador insesgado de la varianza de Cochran para la poblacin.
Esta igualdad slo es vlida para el caso en que las varianzas hayan
sido calculadas con denominadores N 1 (poblacional) y n 1
(muestral) y sa es la razn para restarle una unidad al deno
minador de las varianzas.
En la prctica slo se extrae una muestra y sobre la base de ella
se hacen las estimaciones para la poblacin. La seleccin de esa
nica muestra se hace, en este diseo muestral, en forma aleatoria
y sin reposicin, es decir, todas y cada una de las posibles mues
tran tienen la misma probabilidad de ser elegidas, y la muestra con
la que se trabaja estar formada por elementos distintos. Por ejem
plo, en una encuesta industrial no habr empresas repetidas en la
muestra. Cada empresa aparecer una vez y slo una vez en la mues
tra. En resumen, este diseo muestral es, pues, equiprobaWlstico
y sin reposicin.
Ahora bien, con el cmputo de la media aritmtica de la mues
tra se tiene una estimacin de la media aritmtica poblacional, es
decir, una estimacin puntual. Es prcticamente imposible que la
media aritmtica muestral coincida exactamente con la media
aritmtica poblacional. Es necesario determinar un rango o inter-

242

ASPECTOS TERICOS

valo a partir de la media aritmtica muestral, donde se espera


est comprendida la media aritmtica poblacional. A ese inter
valo especficamente se l denominar intervalo de confianza y
a su mitad se simbolizar por d, que corrientemente se le deno
mina semiancho del intervalo de confianza. Lo anterior puede
interpretarse grficamente de la siguiente manera:

La curva continua representa la distribucin de las medias


mustrales en torno a la media poblacional. Si se ha seleccionado
una muestra que tiene por media aritmtica yM, se traslada la dis
tribucin con eje en yM, que en el grfico est representada por la
lnea punteada. A partir de yM se determina el intervalo de con
fianza (zona sombreada sobre el eje de las abscisas).
El intervalo de confianza tiene dos componentes:
El coeficiente de confianza que est determinado por la proba
bilidad de acierto de la estimacin, y tiene su origen en la estruc
tura de una distribucin normal. En una distribucin normal, en
el intervalo comprendido entre a se encuentra el 68 por cien
to de los casos, entre 2a se encuentra el 96 por ciento de los
casos.3 El coeficiente de confianza es el nmero de veces que se
debe tomar a a derecha e izquierda de para agrupar, entre me
dio, cierto porcentaje de casos. Asociado al concepto de coeficien
te de confianza est el nivel de confianza o probabilidad de acier
to (porcentaje de casos comprendidos en cierto intervalo central).
A continuacin se dan los coeficientes de confianza ms frecuente
mente utilizados en una distribucin normal, los que se simboli
zarn jaor t.
Nivel de confianza
Coef. de confianza (t)
3 Eslas proporciones deben
muestras a obtener

l N\

98%
2.33

95%
1.96

90%
1.65

80%
1.28

68%
1.0

interpretarse respect;) del nm ero posible de

FUNDAMENTOS DEI, M UESTREO

243

El otro componente del intervalo es el que representa la disper


sin de la variable. En una distribucin normal corriente, por
ejemplo la distribucin de una poblacin, ese componente est
representado por a. La distribucin normal que ahora se est tra
tando es bastante particular: en primer lugar la variable est
dada por medias aritmticas que provienen de muestras, en se
gundo lugar se trata de una distribucin terica ya que se supo
nen computadas todas las posibles medias aritmticas. El esta
dgrafo que indica la dispersin de esta particular variable estar
dado por:

GD

2 ( u -)2

v () =

Ntese que se trata de la frmula de una varianza cualquiera,


pero donde la variable est dada por todas las posibles medias
aritmticas mustrales.
Se puede matemticamente demostrar que

O
2

(s -

Y)2

S2 /

n \

que constituye la frmula de clculo prctico de la varianza ver


dadera del estim ador de la m edia aritm tica. Este estadgrafo se
conoce tambin con el nombre de cuadrado del error estndar
verdadero. En general, cuando se realizan estimaciones sobre me
dia aritmtica, no se dispone del valor de la varianza poblacional
de Cochran. En esos casos se utiliza la varianza de la muestra s2,
en virtud de que es un estimador insesgado de S2. Cuando ocurre
tal cosa, es decir cuando se utiliza s2 en vez de S2, el estadgrafo
toma el nombre de varianza estimada del estimador de la media
aritmtica, y se simboliza as:

244

ASPECTOS TERICOS

Intervalos de confianza:
Con los elementos mencionados, ya se puede cuantificar el in
tervalo de confianza para la media aritmtica. Este intervalo esta
r dado por:

'

lagnitud del semiancho del intervalo de confianza

d = t f V f
Como se recordar, t es el coeficiente de confianza que corres
ponde a un nivel d confianza. En general el nivel de confianza
flucta entre 80 y 95 por ciento, en la prctica generalmente se
toma un 90 o 95 por ciento de confianza, lo que en otros trminos
indicara que en 95 de cada 100 muestras la media aritmtica
poblacional estar dentro del intervalo de confianza. V (y) indi
caba la dispersin de las medias mustrales en torno a la media
poblacional. Con los elementos vistos ya se est en condiciones de
estimar una media aritmtica poblacional:
Ejemplo: se ha tomado una muestra de 30 de las 108 empresas
pesqueras de un pas. Se pretende estimar el nmero promedio de
obreros por empresa. Para las 30 empresas de muestra se calcul
una media aritmtica de 46 obreros por empresa y una varianza
de 18. El nmero promedio de obreros por empresa en toda la po
blacin estar comprendido entre:

es decir
1 V vW
Los datos que se conocen son:
N = 108; n = 30; y = 46; s2 = 18.
s2 /
n \ 18 /
30 V
V () = ( 1 -----------= (1 --------------= 0.433
w
n V
N/
30 V
108/

245

FUNDAMENTOS 1)1.1. MUESTREO

Si se toma como nivel de confianza un 90 por ciento, el corres


pondiente valor de t ser de 1.65. El intervalo de confianza esta
r dado por:
46 1.65
lo que equivale a decir que la media aritmtica poblacional estar
comprendida entre 44.92 y 47.08, con 90 por ciento de probabili
dad de que tal estimacin sea cierta.
Para la estimacin de un total, es decir, de la suma de los valores
de la variable de cada uno de los elementos de la poblacin, se
procede a multiplicar el intervalo para la media aritmtica por
N; en virtud de que:
El total (Y) estar dado por:
Y = NY
y el total estimadd (Y):
= N
Si en el ejemplo anterior se deseara encontrar el intervalo para
el total de obreros ocupados en las 108 empresas, con el mismo ni
vel de confianza se tendr:
N y N t y/v (y)
que equivale a:
(108) (46) dt (108) (1.65) (0.656)
El total de la poblacin estar comprendido entre: 4851 y 5085,
con 90 por ciento de probabilidad de que tal cosa sea cierta.

C.

D ETER M IN A C I N D EL TA M A O DE M U ESTR A

Hasta ahora se ha supuesto un tamao de muestra dado, interesa


pues analizar brevemente cules son los elementos que determinan
la magnitud de n.
Fundamentalmente hay cuatro elementos tcnicos que condicio
nan el tamao de una muestra. Por otra parte hay un quinto ele-

246

ASPECTOS TERICOS

mento de extraordinaria importancia prctica: el monto de re


cursos financieros y elementos humanos y materiales sin cuyo con
curso no es posible garantizar estimaciones confiables.
1] H om ogeneidad, de la poblacin
Es fcil interpretar que el grado de homogeneidad indicado por
la magnitud de S2 condicionar el tamao de muestra. Donde la
variable en la poblacin se distribuya uniformemente, slo sern
necesarios unos pocos elementos de muestra para tener una idea
bastante precisa de lo que ocurre en la poblacin para la variable
que se investiga. En cambio en poblaciones muy heterogneas para
la variable investigada, ser necesario un tamao de muestra bas
tante grande para poder realizar estimaciones sin riesgo de gran
des errores. Hay, pues, una relacin directa entre n y S2.
2] Precisin d e la estim acin
Nuevamente el ttulo sugiere algo obvio: mientras ms precisa sea
una estimacin (menor tamao de d), ms grande deber ser el ta
mao de muestra. Se haba adelantado que la precisin estaba dada
por la magnitud de d. Es el investigador: planificador, socilogo,
economista, etc., que investiga el comportamiento de una variable,
quien tiene que decidir sobre la magnitud del mximo de desvia
cin respecto de la media aritmtica verdadera. Se concluye pues
que hay una relacin inversa entre tamao de muestra y precisin.
3] Nivel d e confianza
El nivel de confianza que representaba la probabilidad de que la
estimacin fuera verdadera, tambin tiene una relacin directa con
el tamao de muestra, a travs del coeficiente de confianza t. Mien
tras mayor probabilidad de acierto se desea tener, ms grande de
ber ser el tamao de muestra.
4] T am ao de la poblacin
Otro elemento que es indispensable analizar es la relacin que
existe entre los tamaos de muestra y poblacin. De poblaciones
numerosas, cabr esperar muestras grandes y viceversa.
Del equilibrio de todas estas condicionantes se determina la mag
nitud del tamao de una muestra, como se ver en pginas pos
teriores.

FUNDAMENTOS DEL M UESTREO

5]

247

Recursos

Este elemento, s bien no es tomado en cuenta en la determinacin


tcnica del tamao de muestra, desempea, en nuestros pases, un
papel de primera lnea. Existe toda una problemtica entre la
compatibilizacin del tamao de muestra determinado tcnicamen
te, y el tamao de muestra que resultara del monto de recursos,
principalmente financieros, asignados para la investigacin.
En general el monto de recursos determina una muestra menor
que la que resultara de la aplicacin de las frmulas. La muestra
menor determinar una menor precisin; ser necesario analizar
si esa precisin resultante garantiza la obtencin de estimaciones
adecuadas. Es en este punto donde hay que decidir: o se renuncia
a la precisin especificada tcnicamente y se acepta la resultante
de la limitacin de recursos, o se destinan mayores recursos finan
cieros. Las dos posibilidades restantes son: una combinacin de los
dos procesos anteriores, o la decisin de no llevar adelante la in
vestigacin por estos mtodos.4
Las frmulas del tamao de muestra se deducen fcilmente a
partir del intervalo de confianza: '
Recurdese la frmula del intervalo de confianza para la media
aritmtica:

Despus de elevar al cuadrado, se despeja n y se tiene:


n
sta es la frmula del tamao de una muestra aleatoria simple,
que garantiza la estimacin de una media aritmtica con los re
quisitos de precisin y confianza o probabilidad de acierto espe
cificados.
.
Es necesario prestar atencin a estos conceptos mencionados:
* Vase, del autor, El costo en las investigaciones mustrales , en la revista

Economa, nm. 83, Facultad de Ciencias Econmicas de la Universidad de


Chile.

ASPI CTOS TERICOS

248

t, como se haba adelantado, es el coeficiente de confianza que pro


vena de la distribucin normal estandarizada (media = 0 y varian
za = 1) y estaba automticamente determinado al elegir el nivel
de confianza. Una interpretacin para este concepto, en este caso,
sera: la proporcin dentro de todas las muestras posibles, que en
tregan resultados para la media aritmtica que no difieran respecto
de la media aritmtica verdadera en ms del valor d especificado.
En cuanto a la precisin representada por la magnitud de d,
se haba adelantado que quien est en mejores condiciones para
decidir sobre 1 desvo mximo que se puede tolerar es el investi-,
gador, en este caso el planificador, porque sabe cules sern los
fines de la estimacin. No est de ms sealar que una alta preci
sin (d pequeo) slo se podr conseguir a expensas de una mues
tra grande, y que muestras pequeas slo pueden entregar resul
tados poco precisos. Los anteriores juicios son vlidos cuando el
grado de heterogeneidad en la poblacin (magnitud de S2) es
apreciable. En poblaciones homogneas, una muestra pequea pue
de ser suficiente para lograr una aceptable precisin. Todo lo an
terior exige una decisin del planificador, que para este fin
deber agregar dos elementos importantes: el costo de la investi
gacin y el tiempo que demandar.
El muestrista se limitar a presentarle alternativas, el planifica
dor deber elegir la ms conveniente.
Observando la frmula de tamao de muestra, se puede visuali
zar que cuando la poblacin es bastante grande, el denominador
tiende a la unidad, y el numerador puede aceptarse como una ade
cuada aproximacin del tamao de muestra.

= (ir)'
El lector debe haberse planteado una interrogante: en las frmu
las para tamao de muestra se supone conocida la varianza. Qu
sentido tiene determinar una muestra para estimar una media arit
mtica si se supone conocida la varianza y esto implica conocer la
media aritmtica? Lo que sucede es que el supuesto no es hipot
tico y el propsito no carece de sentido. Hay muchos estudios que
exigen investigaciones mustrales peridicas. Con estas investiga
ciones se pueden tener buenas estimaciones de S2 y porque en mu
chos casos la varianza puede ser poco cambiante, lo que no siem
pre ocurre con la media (recurdese que V (y -j- K) = V (y) y
que M (y - f K) = K + M(y))-

FUNDAMENTOS DEL MUF.STRF.O

249

Sin embargo, el caso ms frecuente es que se desconozca el valor


de S2. El muestrista dispone de mtodos que le permiten estimar
la magnitud de S2, en este caso el planificador deber tomar nota
de que se trata de una estimacin que puede- constituir una fuente
de posibles errores. Es necesario que, una vez realizada la muestra,
se compulse el valor estimado de S2 y la varianza de la muestra.
Si el valor estimado de S2 es similar o mayor a la varianza de la
muestra (s2) no hay motivo de preocupacin, excepto que se haya
tomado tal vez una muestra mayor que la necesaria y esto puede
estar compensado en parte por la mayor precisin que se consigue.
Pero si la varianza de la muestra es apreciablemente mayor que el
valor estimado de S2 para fines de clculo del tamao de muestra,
la situacin deber ser motivo de mayor investigacin. Habr que
recalcular el tamao de muestra en funcin de s2. En esta etapa
ser necesaria otra decisin: se toma una muestra complementaria
o se renuncia a la precisin especificada primitivamente.
Por ltimo, en muchas investigaciones resulta que los datos cen
sales disponibles escasamente proporcionan un valor de la magni
tud de la poblacin. En estos casos, a veces como primera aproxi
macin, se utilizan varianzas de la variable que se investiga prove
nientes de otras poblaciones, otros pases u otras reas dentro del
mismo pas. Ntese que tal procedimiento puede contener serios
errores y deber ser analizado concienzudamente. Adems es nece
sario recalcar que estas suposiciones son con el solo objeto de te
ner una primera aproximacin del tamao de la muestra. Poste
riormente, si se realiza la encuesta, debern compararse las magni
tudes de las varianzas y proceder en la forma indicada en pginas
anteriores.
Cuando no es posible tener estimaciones previas de S2, a veces
se opta por una muestra piloto o de iluminacin, cuyo tamao
generalmente est condicionado por el costo que sta implica.
Dicha muestra de iluminacin puede dar una idea del posible
tamao definitivo de muestra. Con todos los conceptos que se han
sealado se pretende sistematizar en un cuadro las alternativas que
se le presentarn al planificador para que decida sobre el tamao
de muestra definitivo, a la luz de los objetivos que tiene plantea
dos. Slo se incluyen los principales elementos de decisin; as,
se omite presentar posibilidades en cuanto al nivel de confianza
porque ste generalmente tiene poca variacin (entre 90 y 95 por
ciento), y su omisin no distorsionara la decisin.

250

ASPECTOS TERICOS

T am a o d e
muestra

D esvio
m xim o

150
600
938
1666
3750
6000

0.10
0.05
0.04
0.03
0.02
0.00

Costo
(miles d e dlares)
4
8
9
15
2 2
50

- 5
- 9
- 10
- 17
-2 5
- 56

T iem po
(dias)
30 35
6 0 70
70 85
120 - 140
210 - 240
400 - 500

a Censo.

El cuadro anterior puede corresponder por ejemplo a posibili


dades de tamao de muestra para una investigacin en el sector
industrial, donde la variable estratgica sea la estimacin del coe
ficiente producto-capital. Se ha supuesto, para fines de ilustrar el
ejemplo, que la varianza de los coeficientes producto-capital
es 0.375, y en todos los casos se ha considerado una probabilidad
de acierto de 96 por ciento. He aqu un caso de ocurrencia peri
dica en la prctica.
Puede un investigador decidir racionalmente, seleccionando la
mejor posibilidad sin contar con ideas fundamentales de los con
ceptos que entran en juego? Evidentemente que decisiones realistas
y racionales slo provienen de investigadores que conocen los ele
mentos bsicos de la teora de muestras.

D.

t,A E STIM A C I N DE PRO PO RCIO N ES

Dentro de los diagnsticos y en la preparacin de los programas


hay cierto tipo de variables cuyo tratamiento puede ser indispen
sable. Es el caso de las variables cualitativas. Por ejemplo, la esti
macin de la proporcin de empresas que son sociedades annimas,
la proporcin de empresas que cuentan con ms de 100 obreros, el
nmero de obreros que tienen salarios superiores al promedio del
pas, etc. El lector puede imaginarse una serie de casos donde la
estimacin de la proporcin puede ser til. No es otra cosa que
un caso particular del dise anterior; aqu la variable puede estar
clasificada en dos categoras: posee la caracterstica que se inves
tiga, o no la posee. Por convencin se asigna el valor 1 a aquellas
unidades en la poblacin que tienen la caracterstica y 0 si no la
tienen. Con esa convencin, la proporcin en la poblacin ser:

251

LA ESTIM ACIN DE PROPORCIONES

y.

La proporcin de los elementos que no poseen la caracterstica


que se investiga ser:
Q = 1 P

En la muestra este estadgrafo estar dado por:


2

y.

i = l

Si se observan las frmulas en ambos casos, corresponden a las


conocidas frmulas de una media aritmtica. En este caso tambin
las proporciones mustrales se distribuyen en general en forma
aproximadamente normal, en torno a la proporcin poblacional.
Donde hay que poner un poco de atencin es en >a varianza de la
proporcin. Como se ver en seguida, en este caso la varianza
tiene dos lmites: slo puede tomar valores comprendidos entre
0 y 0.25/'
Cuando la variable era cuantitativa, la varianza slo tena lmite
inferior: no poda ser negativa pero poda tomar un valor tan
grande como se quisiera.
Es fcil deducir la frmula de la varianza de la proporcin, par
tiendo de la frmula conocida para la varianza de Cochran:
2 (y* - ?)*

i=i

N 1

s3 =

Desarrollando el cuadrado y reduciendo trminos semejantes,


se tiene:
N

2 yr
s = ,=1

N1

NN2

5 Para poblaciones no demasiado pequeas. La varianza mxima se tiene


cuando P = Q.

ASPECTOS TERICOS

Se trata de remplazar los valores de esta expresin, por los que


resultan de considerar la proporcin en el caso en que la variable
torna valores cero o uno.
Si
N

2 Vi
i= i

puede asociarse con .


Adems:
2 y. =

i = l

2 yi = 2 y.a
i= 1

i= 1

porque la variable slo toma valores cuyos cuadrados son los mis
mos valores. Remplazando en la frmula de Cocinan para la
varanza se tiene:

N P _ N PN 1

S2 = ------------------------- =

N P O
N 1

Por analoga, la varianza de la muestra estar dada por:

11 P 1
n 1
Para la determinacin de los intervalos de confianza, se. utilizan
las mismas frmulas, teniendo cuidado de remplazar el valor de

NPQ
s'

P '

TT

npq
i

Pr V T T T

En todo caso, en el formulario anexo de este trabajo se incluyen


frmulas detalladas, cuya consulta puede ser beneficiosa.

253
F.. NOCIONES DE MUESTREO ALEATORIO ESTRATIFICADO

Este diseo muestral no ofrece complicacin alguna. Es simple


mente la combinacin de varios diseos aleatorios simples.
Se trata de estratificar la poblacin, es decir dividirla en partes
excluyentes, de acuerdo con la caracterstica que se investiga. As,
por ejemplo, si se quiere estimar el valor agregado del sector in
dustrial, sera conveniente dividir la poblacin de industrias en
4 o 5 estratos de manera que en cada estrato las unidades tengan
caractersticas homogneas en cuanto a valor agregado, es decir,
en cada estrato los valores agregados de cada industria deberan
estar dentro de cierto rango. De esta manera se minimiza la mag
nitud de la varianza6 en cada estrato y, por consiguiente, se trata
de disminuir el error de muestreo. Es importante insistir que el
criterio de estratificacin debera estar en directa relacin con
el objetivo de la encuesta. Por ejemplo, si se quiere estimar un oooficiente producto-capital, un posible criterio de estratificacin po
dra ser segn el nmero de turnos diarios; un primer estrato
comprendera a las industrias que trabajan un tumo diario, el se
gundo estrato a las que lo hacen dos turnos diarios, el tercer estrato
las de tres turnos y un ltimo estrato que comprendera a aquellas
industrias que no tienen un nmero de turnos definido.
La principal ventaja de este diseo muestral es su eficiencia
comparada con otros diseos mustrales: para un mismo tamao
de muestra el error de muestreo es en general menor cuando se
estratifica la poblacin. La otra ventaja importante es que permite
realizar estimaciones no slo para la poblacin total sino para cada
uno de los estratos, lo que sin duda, especialmente en el campo
industrial, permite afinar conclusiones. La desventaja es la nece
sidad de tener un conocimiento anticipado de las caractersticas
generales del universo que se investigar; de la calidad de las in
formaciones bsicas depender la bondad del criterio de estrati
ficacin.
En cuanto al nmero de estratos, hay que considerar que, mien
tras mayor sea, ms precisas sern las estimaciones y una mayor
desagregacin en los resultados permitir obtener conclusiones espe
cficas y detalladas. Por otra parte, es difcil disponer de antece
dentes que permitan clasificar adecuadamente (estratificar) la po Recurdese que los com ponentes de la varianza son la intervarianza y la
intravarianza. D ado que para los errores de muestreo se promedian las va
rianzas de cada estrato, en el hecho slo se est tom ando en cuenta la intiavarianza.

254

ASPECTOS TERICOS

blacin. En la prctica, con los antecedentes que en general se


dispoi.en, lo ms que puede hacerse es dividir la poblacin en grue
sas categoras. Incluso si se pudiera estratificar en un nmero
grande de estratos, la complejidad administrativa y la organizacin
del trabaj de campo puede significar trabajo adicional consideraole.
En las investigaciones industriales, normalmente se toman entre
4 y 7 estratos.
1] Estimadores e intervalos de confianza
En cada estrato se podrn computar los siguientes estadgrafos:

Media aritmtica del estrato h

Yh

2 (y... - Y..)2
Varianza de Cochran del estrato h

Yh = Nh Yh

Total del estrato h

La media aritmtica de la poblacin (con L = nmero de es


tratos) estar dada por
L

Nh

L
2 N = N

donde

Y =

n = l

y la varianza de la poblacin
L

2 (Y S2 =

)2 N

N 1

2 Sh2 (N 1

1)

N 1

P a ra la m u estra se ten d ran los siguientes estadgrafos:

255

NOCIONES D E M U ESTREO A LEATORIO ESTRATIFICADO

yi>

, 2 yi.
=1
media aritmtica de la muestra del estrato h

2 (yi.i i.)2
1=1
varianza del estrato h
sir = -----------------:----nh 1
Ahora bien, dado que en cada estrato se extrae una muestra
aleatoria simple, tanto la media de la muestra (yh) como la varianza
son respectivamente estimadores insesgados de la media aritmtica
(h) y de la varianza (SH2) del estrato:

E() = h
E(s2) = Sh2
Si ahora se combinan todos los estratos,7 la media de la muestra
ser:
L

2 h nh

h=l

yn =

donde

2 nb = n

h=l

y el estimador insesgado de la media aritmtica poblacional ser:


2 h Nh
h1

?.. =

7 En

general

f j------

no es estimador insesgado de , slo lo es cu an d o

n
n

Nh

=
N

256

ASPECTOS TERICOS

Es fcil verificar que:


E (y) = Y
lo que justifica que ysl, sea estimador insesgado de .
En la misma forma se pueden combinar las varianzas del esti
mador tie la media. Recurdese que en muestreo aleatorio simple
se tena:

Este estadgrafo para un estrato cualquiera ser:

U|,

N /

Prometliando las V(h) para todos los estratos se tendr la varian/.a del estimador de la media poblacional:

2 Nu* V(y)
V(yst) = --------------'Yhi>
N2

L
=

Si_2 8

2 Nh (N n)
N2 >.=i
n

Cuando no se dispone de los valores de las varianzas de los


estratos (Sh2) , se utilizan los resultantes de las muestras de cada
estrato (sh2) y se tiene:

1 L
sh2
v(yst) = ---Nh (Nh nh)
N2 =1
nh
que es el estimador de la varianza del estimador de la media arit
mtica poblacional.
En igual forma que en el muestreo aleatorio simple, el intervalo
de confianza para la media estar dado por:
Bt d
* Frmula general de la varianza del estimador tie la media aritmtica
poblacional.

NOCIONES DE

MUESTREO

ALEATORIO ESTRATIFICADO

257

donde
d = t
El intervalo de confianza para el total estar dado por
N st + d
donde
d = t n V V (y^r
2] A fijaciones y tamaos de muestra
Es importante*considerar lo que en muestreo se denomina afijacin; el significado de esta expresin es el de distribucin y asig
nacin de la muestra total en cada uno de los estratos. Por afijacin, entonces, se entender el proceso que permite distribuir un
tamao de muestra dado (n) entre los estratos, de manera de tener
una muestra en cada estrato (nh) . Hay distintas maneras de
afijar una muestra; a continuacin se expondrn las principales.
i] Afijacin proporcional. Se trata de distribuir una muestra
dada de tamao n entre los estratos, en forma proporcional
al tamao de cada estrato. El tamao de muestra en cada
estrato estar dado por:

Nh
La justificacin de este mtodo radica en el hecho de que
de mayores estratos se extraern mayores tamaos de muestra.
Cuando se sigue una afijacin proporcional, la frmula ge
neral de la varianza del estimador V (yst) puede simplifi
carse remplazando nh por

n en la forma:
1 f L

= --------2 Wh s*
n

258

ASPECTOS TERICOS

donde
n

f=

Nh

W> = 7 f

De la frmula anterior puede despejarse n y se tendr la frmula


del tamao de muestra cuando se decide previamente segjuir un
diseo muestral estratificado por afijacin proporcional:
n : :

n0
14-
T N

donde

'h = l

( > s t)

Es necesario aclarar que, cuando se trata de determinar un


tamao de muestra, es necesario tener estimaciones de la varianza
de la variable que se desea investigar (Sh2), ya sea por antecedentes
de otras encuestas, por comparaciones con otras variables de dis
tribucin similar, por muestras de iluminacin o por otros m
todos estadsticos de estimacin. En la frmula aparece V(st) que
es el cuadrado del error de muestreo que se puede tolerar. La
manera de especificar este valor es a travs del intervalo de con
fianza.
d = t xAV(^
de donde

= ~T
Recurdese que d es el desvo mximo que se puede tolerar, y
est expresado en las mismas unidades de la variable que se inves
tiga; este valor lo determina el planificador, t es el coeficiente
de confianza que est dado por el nivel de confianza o probabili
dad de acierto en la estimacin. El nivel de confianza tambin
es materia de decisin del investigador. Ser necesario plantear

n o c io n e s

de

m u estreo

a l e a t o r io

259

e s t r a t if ic a d o

alternativas para diferentes magnitudes de d. Con un cuadro simi


lar al presentado en el anterior diseo muestral, se puede decidir
en forma objetiva,
ii] Afijacin ptima. La distribucin de una muestra en forma
.proporcional al tamao del estrato puede adolecer de ciertos
defectos. Es posible que existan estratos muy grandes pero
bastante homogneas, y al contrario, puede ocurrir que haya
pequeos estratos sumamente heterogneos, o> amhas cosas
a la vez. Si en estos caso se sugiere una afijacin propor
cional, sucedera que de los grandes estratos homogneos se
extraera una muestra ms que suficiente con el correspon
diente desperdicio de recursos, y en los pequeos estratos
altamente heterogneos se extraeran muestras de tamao
insuficiente. Para evitar tales desajustes, la afijacin ptima
distribuye la muestra total (n) entre los estratos tomando
simultneamente el tamao y el grado de heterogeneidad
del estrato. La frmula para afijar ptimamente una mues
tra es:
10

Observando la frmula se comprueba que la distribucin de n


entre los estratos es proporcional simultneamente al tamao y al
grado de variabilidad de la variable en el estrato.
Remplazando, este valor de nh por la expresin recin comen
tada, en la frmula general de la varianza del estimador para la
media aritmtica, se tiene:

( st)A .O .

------

Si no se dispone de los valores de Sh2, se podr introducir el corres El calificativo de ptim a tiene su origen en el hecho de que mediante
esta afijacin se consigue el m enor error de muestreo.
JO Existe una demostracin que justifica esta frm ula, basndose en la minim izacin de la varianza del estimador.

260

ASI'M T O S TERICOS

pondiente sh2 de Ja muestra, con lo que se tendr el estimador


de la varianza del estimador de la media:

v ( y s l )A .O . =

2 W h sh->
h=1

2 VVh sli=1

Si de la frmula de la varianza del estimador se despeja n, se


tiene la frmula del tamao de muestra cuando se decide aplicar
un diseo muestral estratificado por afijacin ptima:

^ 2 w h sh y
n =
V(yst) + 2 Wh S2
N >=
Los elementos que conforman esta frmula ya han sido tratados.
Se insiste que V(yst) es el cuadrado del error de muestreo que se
tolerara. Para especificar su valor, habr que plantearse un desvo
mximo d y una probabilidad de acierto que determinar el va
lor de t.
d2
V(Bt) = i r
iii] Afijacin ptima econmica. Aparte de considerar simult
neamente el tamao y variabilidad del estrato (Nh y Sh2), a
veces es recomendable introducir un tercer elemento: el costo
por unidad encuestada en cada estrato. Sucede que en algu
nas investigaciones hay diferencias sustanciales en cuanto a
las facilidades de acceso a la informacin por colectar y pue
de ser justificado tomar este elemento que tiene su origen
en limitaciones financieras. Cabe aclarar que tal procedi
miento slo se justifica en la medida que su introduccin
no signifique prdida de representatividad en las muestras
de los estratos. La forma de afijar una muestra dada obe
dece en este caso a la siguiente relacin.
nh =

Nh Sh / y/Ch
----------------------- n
2 Nh Sh / V T
h:=l

d on d e C h es el costo de in vestigar u n a u n id ad en el e stra to h.

NOCIONES DE M UESTREO ALEATORIO ESTRATIFICADO

261

iv] Afijacin arbitraria. Finalmente, cuando se decide distri


buir la muestra sobre la base del buen sentido, cuidando
de no perder representatividad y tomando supuestos tenta
tivos en cuanto a heterogeneidad de los estratos, es decir,
dirigiendo la distribucin sobre la base de un conocimiento
ilustrado de la poblacin, se dice que la afijacin es arbitra
ria. Para la determinacin de los intervalos de confianza se
utiliza la frmula general de la varianza del estimador.
Es necesario advertir que el diseo muestral estratificado va co
brando mayores ventajas, sobre todo en cuanto a eficiencia, a
medida que se tiene un mayor conocimiento de la poblacin. De
la adecuada eleccin del criterio de estratificacin depende en gran
medida la fidelidad y precisin de los resultados. Dado que las en
cuestas industriales, en un proceso de planificacin, deben tener
cierta periodicidad, permitir conseguir cada vez mejores informa
ciones con lo que se facilitar la tarea iterativa de acercarse, con
los estimadores, a valores cjue estn muy prximos a los que se dan
en la realidad.

ENCUESTAS IN DUSTRIALES

En gran parte de la bibliografa disponible sobre muestreo aparece,


en general, un esquema de las etapas que se deben cumplir en una
investigacin muestral. Pero puede observarse al mismo tiempo que
obedecen a circunstancias que precisamente no parecen ser las que
se dan en los pases en desarrollo, especficamente los de Amrica
Latina, desde el punto de vista de la carencia de informaciones
bsicas. Si bien es cierto que las etapas, son inevitables, cuales
quiera sean las circunstancias que se contemplen, no lo es menos
que hay necesidad de adaptar y jerarquizar cada punto, en fun
cin de las dificultades y posibilidades especficas de la planifi
cacin industrial en estos pases.
A continuacin se detallarn las diferentes etapas y facetas de
una investigacin del sector industrial, a travs de tcnicas mus
trales. Se recalcar aquellos problemas sobre los que la experien
cia en investigaciones del sector industrial aconseja poner el mayor
cuidado, detallando hasta donde sea posible la compatibilizacin
de los conceptos tericos con las metodologas y sus alternativas
prcticas.

A.

D ETER M IN A CI N CLARA Y P REC ISA DE LOS O B JE T IV O S

Es de fundamental importancia especificar en la mejor forma po


sible cules son los fines que persigue la investigacin muestral.
El diseo de la muestra obedecer en cada caso a consideraciones
distintas. Es diferente disear una muestra para averiguar la mag
nitud que de la capacidad instalada en el sector industrial se uti
liza efectivamente, en comparacin a indagar la estructura de in
sumos importados que tienen las industrias dinmicas, o a inves
tigar la situacin de este sector, identificar sus principales escollos
y disponer de antecedentes para proyecciones en el nivel agregado.
Desde otro punto de vista, una misma muestra no puede ser igual
mente eficiente si se trata de una primera investigacin sobre rela[2 6 2 ]

DELIM ITA CIN DEL M A RCO M UESTRAL

263

dones interindustriales, que si se trata de corregir coeficientes


tcnicos cuando se tienen sospechas de que stos puedan haber
variado. Es necesario tomar conciencia de que, segn Jo que se
desea averiguar y la ponderacin que la investigacin tenga dentro
del anlisis general, se podr disear en cada caso una muestra
adecuada. No hay pues diseos matrices en toda su extensin;
lo ms que puede hacerse en aras de una cierta orientacin es
fijar gruesas lneas dentro de las cuales hay una infinidad de alter
nativas. Ms an, otra condicionante es la situacin del sector
en cuanto al conocimiento que de l se tiene. En dos encuestas
industriales en que se persiguen los mismos objetivos los diseos
mustrales pueden ser muy diferentes si se considera la cantidad,
calidad y antigedad de las informaciones de que se disponga
en uno y otro caso.
Slo cuando haya completo acuerdo en el equipo investigador
sobre lo que se desea averiguar se podr iniciar el diseo muestral
propiamente tal, siempre que ste sea factible. Recurdese que el
muestreo no es apto para toda averiguacin; hay casos donde
es saludable renunciar a utilizar este procedimiento, porque es pre
ferible desconocer algo antes que tener una informacin apreciablemente errada.
Una clara delimitacin de objetivos permitir centrar la inves
tigacin en los puntos ms importantes. Debe dejarse de lado
la idea de aprovechar la encuesta para averiguar todo aquello
que tiene y puede llegar a tener importancia en el futuro; ese
frecuente criterio es altamente perjudicial, porque hace de la en
cuesta un conjunto de preguntas en las que se diluyen los obje
tivos centrales. Basta analizar los formularios de encuestas a la
industria, y en no pocos casos se encontrar este tipo de defectos.
Aqu el planificador debe tomar en consideracin la puntos sea
lados compatibilizando y jerarquizando los objetivos.

B.

D ELIM IT A C I N D EL M ARCO M U E ST R A L

Las estimaciones que proporcione una muestra se generalizan para


una poblacin. El campo de donde proviene una muestra, es
decir el marco muestral, exige una muy precisa definicin. En
el sector industrial es especialmente peligroso dejar de ser acu
cioso en esta etapa. Como se sabe es necesario definir lo que se
entender por unidad industrial. As, corrientemente se divide este
sector en industria manufacturera, que puede estar constituida por

264

ENCUESTAS INDUSTRIALES

las empresas industriales que cuentan con cinco o ms obreros,


e industria artesanal, las que no alcanzan dicha cifra. Pero aqu
el problem a an no estar resuelto, porque dentro de las em
presas m anufactureras puede haber unidades que se dediquen
tanto a actividades industriales como a comerciales, agrcolas, etc.
Ser necesario fijar un criterio que perm ita clasificarlas ntida
mente en una u otra categora. Es indispensable contar con un
listado, directorio o em padronam iento donde estn inscritas todas
las unidades sobre las cuales se desea investigar. N orm alm ente los
pases disponen de censos industriales que son utilizados como
m arco de la muestra; sobre este punto es necesario destacar que
dichos censos no pueden hacerse anualm ente: cuando ms se rea
lizan cada cinco y ms aos y en consecuencia un trabajo adicional
que no puede evitarse es la actualizacin de los directorios. Hay
empresas que se forman despus del censo, otras que desaparecen
y finalmente las que cam bian de giro y tamao dentfo de la misma
industria; estos cambios deben ser identificados antes de la extrac
cin de la muestra. Es frecuente que en las encuesta? industriales
se desee tener alguna clasificacin, al menos sobre las principales
variables, segn las ramas o agrupaciones industriales. Sobre lo
mencionado surge en algunos casos otro problem a: el de la iden
tificacin de tocias y cada una de las unidades que conforman la
poblacin, dentro de dichas categoras.'
Un criterio de clasificacin podra encontrarse en la escritura
jurdica de formacin de la empresa, en la que por regla general
se destaca el giro o actividad, pero ocurre que en algunas legis
laciones sobre el particular el cambio de giro exige una serie de
trmites e impuestos que hacen que los industriales, al form ar
una empresa, aprovechen para especificar una serie de actividades
o giros potenciales, para evitarse molestias y erogaciones en un
eventual cam bio de actividad. Este hecho obliga en muchos casos
a prescindir de esa fuente de clasificacin y puede no quedar otro
cam ino que una inspeccin censal. Muchas veces, la misma muestra
puede ser utilizada para ajustar tentativam ente el directorio in
dustrial, en cuanto a clasificacin ele industrias por giro o tamao.
No est de ms sealar que en estos casos puede ser necesaria una
muestra com plem entaria por razones obvias.
Cuando no se disponga de marcos mustrales ni siquiera me
dianamente aceptables, como ocurre con la industria artesanal,
corrientem ente se estim an" los valores de sus correspondientes
variables mediante asociacin y ajustes correctivos con las peque

ELECCIN

DEL DISEO

M UESTREAL

265

as empresas manufactureras. Es probable que tales estimaciones


no estn muy distantes de los valores efectivos. En todo caso, para
establecer los coeficientes de ajuste es necesario averiguar las simi
litudes y diferencias, cualitativas y cuantitativas, entre la pequea
industria m anufacturera y la industria artesanal. N o puede prescindirse de un empadronam iento por reas de este tipo de unidades
industriales; lo que ocurrir, en general, es que slo ser necesaria
una pequea muestra para tener las estimaciones necesarias para
realizar los mencionados ajustes, o para cuantificar directam ente
los estadgrafos que interesen a este subsector.
Finalm ente, en muchos casos no ser posible determ inar para
la industria artesanal el marco de la muestra definitivo y tendr
que recurrirse a marcos mustrales ms generales, siempre que
tengan una relacin razonable con la investigacin.

C. ELECCIN DEL DISEO M UESTRAL


Dadas las caractersticas de los sectores industriales y pensando
siempre en funcin de la recoleccin de informaciones para la
planificacin de la industria, no hay m ucha posibilidad de elec
cin en cuanto a los diseos mustrales. El muestreo estratificado
calza perfectamente bien con los objetivos que se plantean en este
tipo ele estudios; tanto en lo que concierne a la eficiencia (menor
error com parado con otros diseos mustrales para igual tam ao
de muestra) como en lo que toca a la posibilidad de tener esti
maciones para cada estrato o subestrato.
Ahora bien, en cuanto a las informaciones bsicas de las que
norm almente disponen los pases a travs de los censos industria
les, cabe advertir que prcticam ente hay un criterio obligado de
estratificacin: por tamao, asimilando ste al nmero de obreros
con que cuenta cada unidad industrial. Vale la pena advertir
sobre este punto que no siempre se justifica este tipo de estrati
ficacin, a no ser que se piense en trminos de factibilidad, es decir
porque puede no ser posible estratificar de otra manera, aunque
los conceptos tericos as lo indiquen. Si se piensa que la fina
lidad principal que debe cum plir un criterio de estratificacin es
la de hacer lo ms homogneas posibles las unidades de cada es
trato, de modo de disminuir la magnitud de la varianza, surge
inm ediatamente la pregunta: Qu tipo de homogeneidad? Debe
elegirse una variable estratgica o clave, para agrupar las unidades
de la poblacin segn los valores que toman en cuanto a dicha

266

ENCUESTAS INDUSTRIALES

variable. A grupar las unidades segn el nm ero de obreros im


plica adm itir que esta variable es representativa, en cuanto a cla
sificacin, de las otras variables que interesan, com o el valor agre
gado, los insumos, la capacidad utilizada, etc. E l avance tecnolgico
produce cierto escepticismo para pronunciarse sobre la validez de
ese supuesto. L a mecanizacin puede disminuir la ocupacin al
mismo tiempo que aum entar considerablemente, por ejemplo,
el valor agregado. Segn uno u otro criterio, u n a industria con
esas caractersticas puede quedar clasificada en estratos m uy dife
rentes. Si el objetivo central es estudiar la absorcin de rcursos,
principalm ente m ano de obra, su productividad y composicin, el
primer criterio sera adecuado, pero si lo que realm ente interesa
es tener estimaciones sobre el producto industrial, su estructura y
dinamismo, parecera preferible utilizar, siempre que fuera facti
ble, el segundo criterio.
En general en una encuesta industrial se plantean una serie
de objetivos; de su jerarquizacin depender la eleccin del cri
terio adecuado. Si hay ms de un objetivo im portante, como
ocurre con frecuencia, habr que buscar un criterio que compatibilice ambos; tal vez no se consiga hacerlo en form a ideal, pero
al menos podr lograrse una correspondencia aceptable.
U n a vez que la poblacin ha quedado estratificada de acuerdo
con el criterio elegido, ser indispensable establecer nuevas clasi
ficaciones p ara propsitos de planificar el desenvolvimiento del
sector. D entro de cada estrato podr requer rse subclasificaciones
que conform arn subestratos, como por ejemplo en industrias tra
dicionales y dinmicas, segn ramas industriales, segn ubicacin
geogrfica, muy im portante dentro de planes de integracin regio
nal, etc. De esta m anera se podr disponer de una serie de clasi
ficaciones cruzadas que perm itirn al program ador realizar anlisis
en un distinto nivel de agregacin. Los diagnsticos sern ms
acertados, las metas sern ms detalladas y concretas y el control
se facilitar muchsimo. L a reform ulacin de los planes se har
sobre la base de un slido conocim iento de lo ocurrido.

D. CLCULO DEL TA M A O DE MUESTRA


De ms est insistir sobre la trascendencia de esta fase. Prctica
mente en este punto es donde se conjugan todos los elementos
conceptuales vistos en la prim era parte. De otro lado, es donde
ms cuenta respetar los principios tericos, al confrontarse con una

CLCULO DEL TAMAO DE MUESTRA

267

realidad que no se compadece con los supuestos simplificadores


que debieron hacerse en busca de organicidad y claridad de ex
posicin.
Recurdese que, principalm ente desde un punto de vista pura
mente tcnico, hay tres elementos fundamentales que determinan
el tamao de una m uestra: la m agnitud de la poblacin, la varia
bilidad con que se distribuye la caracterstica que se investiga y la
precisin que se desea tener. As presentado el asunto es extra
ordinariam ente sencillo, pero analizado con un poco ms de de
tenim iento se com prender la com plejidad que representa. E n lo
que se refiere a tamao de la poblacin, el problem a rad ica prin
cipalm ente en la definicin de la unidad a investigarse y en la
delimitacin del m arco muestral, ambos aspectos tratados ya en
el punto B.
E l problem a crucial dice relacin con la variabilidad de la po
blacin, es decir con el estadgrafo S2. Prescindiendo por un m o
mento de discutir sobre si se cuenta o no con esa informacin,
es interesante discutir sobre cul ser la variable para la que es
necesario cuantificar o disponer de una varianza. Revisando cual
quier encuesta industrial, se com probar que se indaga sobre una
cantidad grande de variables; pues bien, la varianza de cul de
ellas se tomar? H abr algunas variables cuya distribucin es muy
homognea, en tanto que habr otras que presentan enorme hete
rogeneidad. En rigor, habr que elegir slo una varianza. Puede
pensarse en elegir aquella que presente el ms alto valor, y es
difcil que ello conduzca a resultados prcticos; norm alm ente en
ese caso se calcular un tamao de muestra excesivamente grande,
sin posibilidades de financiamiento. H ay variables cuya varianza
es tan grande que el ^clculo del tamao de muestra, con una
precisin razonable, equivale en el hecho a casi censar la po
blacin. En todo caso, constituye la alternativa ms defendible
desde un punto de vista terico. Las limitaciones que ofrece una
investigacin, en la realidad) obligan en general a desecharla.
Deber pensarse en elegir una variable estratgica o representativa
del conjunto de variables. En prim er lugar es sumamente difcil
disponer de varianzas para todas las variables que interese inves
tigar; adems, como se vio, aun en el hipottico caso de que se
dispusiera de tales estadgrafos, la muestra resultante podra exce
der en demasa el presupuesto disponible. E n la prctica es un
poco ms realista empezar determinando el tamao de muestra
en funcin de los recursos, y luego calcular tcnicamente el ta-

268

ENCUESTAS INDUSTRIALES

m ao de m uestra en trminos de la variable elegida com o repre


sentativa, es decir, la que ms interese en la investigacin. De la
com paracin de los tamaos de muestra resultantes por esos dos
mtodos diferentes nacer el ajuste que ser necesario hacer en aras
de la factibilidad de la encuesta. H abr tres posibilidades: se
aum enta la cantidad de recursos, se disminuye razonablem ente
la precisin, o ambas cosas en alguna medida.
De cualquier m anera, la muestra que resulte slo garantizar
la estimacin de la media aritm tica, con la precisin y confianza
especificadas (d y t) de aquella variable cuya varianza se ha to
m ado en cuenta p ara el clculo de n. Para aquellas variables que
tengan una varianza m enor que la de la variable clave, el tam ao
de muestra ser ms que suficiente, es decir, se conseguir mayor
precisin que la especificada; en cambio para aquellas variables
con mayor varianza, el tam ao de muestra ser insuficiente y, en
consecuencia, para dichas variables se estar especificando im pl
citam ente una precisin menor (mayor d ) . U n a vez realizada la
encuesta y en conocim iento de las varianzas mustrales de todas
las variables, deber procederse a calcular los intervalos de con
fianza. Es frecuente encontrarse con sorpresas desagradables; hay
algunos intervalos, cuya magnitud es tan extraordinariam ente gran
de que tom ar la estimacin puntual implica serios riesgos. E l pla
nificador deber tom ar conciencia de estos hechos, para que en
todo m om ento contem ple, en la utilizacin de tales estimadores,
sus bondades y limitaciones. Es muy frecuente escuchar la frase
de que basta tener un orden de m agnitud para formarse una idea,
pero ocurre que a veces estos rdenes de m agnitud tienen un
rango de variabilidad tan amplio que, situndose en uo u otro
lmite del intervalo, las conclusiones pueden ser del todo diferentes.
Esta situacin ocurre particularm ente en las investigaciones indus
triales en niveles muy desagregados, donde las poblaciones son
demasiado pequeas.
L a eleccin de la variable clave es de una trascendencia que
es innecesario recalcar. En la encuesta sobre la industria en C entro
amrica, para fines del clculo del tam ao de muestra, se ha
tomado com o variable representativa el tam ao de las industrias
a travs del nm ero de obreros que ocupan. No sera aventurado"
adelantar que habr otras variables, como el valor agregado, los
insumos, etc., que tendrn mayor variabilidad que la variable
elegida. En esos casos, con seguridad que la precisin ser mucho
m enor que la especificada para estim ar el nm ero prom edio de

CLCULO DEL TAMAO DE M UESTRA

269

obreros por industria. L o interesante ser analizar cul es la pre


cisin efectivamente alcanzada y la confianza que ello merece.
E n cuanto a la precisin, indicada por la m agnitud del semiancho del intervalo de confianza (d), en otras palabras el desvo
m xim o tolerable, constituye un grado de libertad en el simpli
ficado modelo del clculo de una muestra estratificada. Puede
tericam ente tom ar cualquier valor positivo; lo interesante es de
term inar un valor, un desvo, de m anera que no signifique por
una parte un rango demasiado amplio que no perm ita obtener
conclusiones generales, y por otra que no sea tan innecesariamente
pequeo como para que exija un tam ao de muestra prohibitivo.
E n verdad, en una encuesta industrial slo ser necesario deter
m inar la precisin deseada para la variable clave, ya que para
el resto de las variables habr dejado de ser un grado de libertad,
ya que el tam ao de muestra es nico para toda la investigacin.
L a , precisin alcanzada para las otras variables habr que calcu
larla en funcin de ese nico tam ao de muestra y de la desviacin
tpica (s) de cada una de las variables. Com o en general cada va
riable tiene distinto grado de heterogeneidad, tendr tambin una
diferente precisin. En la fijacin del desvo m xim o tolerable
para la variable representativa, el planificador tendr que tom ar
una decisin. Si por ejemplo se sabe que el valor agregado de la
industria en Chile fue en 1963 de 811 millones de escudos de 1960,
el promedio por industria ser del orden de 115 000 escudos de
1960. Si adems se supone que el valor agregado por industria
crece al 5 por ciento anual, el promedio p ara 1964 ser de 121 000
escudos de 1960 aproxim adam ente. L a pregunta que debe plan
tearse el planificador es: si se quisiera estim ar este promedio, cul
sera el desvo m xim o (d) que se podra tolerar: 10 000, 2 0 0 0 0
o 25 000 escudos? Compulsando los tamaos de m uestra resul
tantes para cada alternativa, los objetivos de la investigacin, y el
presupuesto disponible, se tendr que tom ar esa im portante deci
sin. Cuando se tiene conciencia de que el resto de las variables
por investigar tiene una heterogeneidad m ucho mayor que la de
la variable clave, ser necesario considerar en el tam ao de m uestra
un desvo m enor al necesario, en la medida que no encarezca en
exceso la encuesta industrial. U n a vez calculado el tam ao defi
nitivo de la m uestra, el siguiente paso ser la distribucin de ella,
entre los estratos y /o subestratos por la correspondiente afijacin
elegida.

270

ENCUESTAS INDUSTRIALES

E . SELECCIN DE LAS UNIDADES MUESTRALES

Se haba advertido que el muestreo estratificado no era ms que


una combinacin de diseos mustrales aleatorios simples; la se
leccin de las unidades deber ser hecha en form a aleatoria! Sin
embargo, la extraccin p or medio de una tabla de nmeros alea
torios puede significar un procedim iento muy engorroso, com o
prim era desventaja, y luego que la concentracin industrial, alre
dedor de las zonas urbanas, determ ina que un a gran p arte de la
muestra provenga justam ente de esas reas. E n el hecho lo men
cionado en segundo trm ino no constituye una desventaja, a no
ser que se tome en cuenta que la m uestra no entregar resultados
por zonas geogrficas, aspecto que debiera interesar al program a
dor. E n tales casos puede justificarse seleccionar muestras sistem
ticas, es decir, una de cada k industrias de la poblacin (siendo
N
k = ). En el caso d e la encuesta industrial de la Corporacin
de Fom ento de Chile, se sigui una extraccin sistemtica d e norte
a sur del pas, garantizando de esta m anera cierta representatividad
de zonas geogrficas que de otra m anera no la hubieran tenido.
L a extraccin de u n a muestra sistemtica puede asociarse con
una muestra aleatoria, siempre que la poblacin no presente un
determinado ordenam iento coincidente con el intervalo de siste
matizacin y que la iniciacin de la seleccin sea aleatoria, es decir, *
que una de las k primeras unidades sea elegida al azar. E n tal
caso, podrn utilizarse los mismos estimadores de las muestras
aleatorias o las aproximaciones correspondientes al muestreo sis
temtico.

F . ENTREN A M IEN TO DE ENUMERADORES


El enum erador deber ser una persona que, conociendo perfecta
mente los objetivos de la encuesta, tenga alguna experiencia en
m ateria de industrias. E n general, en dichas encuestas, se inquiere
sobre una serie de datos tcnicos, muchos de los cuales son dados
directam ente por el respondiente; el enum erador debe estar en con
diciones de calificar estas respuestas. E n las encuestas de opinin
pblica, en m ateria de poltica, religin, simpatas, actitudes, etc.,
es correcto que el enum erador sea un elemento en lo posible neu
tro hacia las respuestas del encuestado. En las encuestas industria-

COLABORACIN DE LA POBLACIN INFORM AN TE

271

les, sobre todo en las preguntas que dicen relacin con magnitudes,
el encuestador tendr una participacin activa y verificadora. In
cluso p ara la realizacin de encuestas industriales donde se averige
p or datos tcnicos, es conveniente que el encuestador sea un tc
nico entendido en la m ateria; de otro m odo se corre el riesgo de
obtener respuestas deficientes que pueden estropear el trabajo.
E n todo caso ser necesario un proceso de adiestramiento, pro
bando en el terreno la eficiencia de cada enum erador sobre la base
de indagaciones que exijan una cabal interpretacin, teniendo
previamente a disposicin los datos que averiguar en el terreno
cada encuestador.

G. COLABORACIN DE LA POBLACIN IN FO RM A N TE
E n las encuestas industriales, es de una significacin muy grande
conseguir una actitud positiva de la poblacin que se investiga,
imprescindible para garantizar una cierta fidelidad en la masa de
informaciones que recolectar. Es frecuente que se advierta a la
poblacin la trascendencia de la muestra, y una m anera de hacer
ms efectiva esa colaboracin es realizar conjuntam ente la inves
tigacin con asociaciones de industriales u organismos de probado
prestigio, universidades, institutos, etc. De una u otra m anera
existe siempre un margen considerable de no respuesta. Sobre el
p articular hay que destacar que si la no respuesta tiene su origen
en una desaparicin o cam bio de estrato de la unidad que se pre
tende investigar, no debe ser motivo de preocupacin, ya que
puede tomarse como una muestra representativa de una parte del
universo que desaparece o cam bia de estrato. El problema es mu
chsimo ms serio cuando, existiendo la unidad, hay negativa de
d ar respuesta. Basar las estimaciones solamente en poblaciones de
respondientes, puede ocasionar sesgos de alguna magnitud. E n esos
casos las estimaciones realizadas, podrn ser generalizadas slo
a la poblacin de respondientes y no a la poblacin total. P ara
tener informaciones sobre la poblacin de no respondientes, habr
que disponer de encuestas de seguimiento u otros mtodos indi
rectos. Sobre este problem a de la no respuesta y, adems de l,
sobre la respuesta defectuosa, es necesario una consideracin dete
nida. L a necesidad de planificar y para ello de con tar con infor
maciones serias, peridicas y oportunas, son cuestiones de acepta
cin general. P ara poder contar con informaciones con tales

272

ENCUESTAS INDUSTRIALES

atributos, parece que no hay otra salida ms que en las legisla


ciones de los pases se contemple la obligacin y las sanciones
correspondientes, en forma similar a una declaracin de impuestos.
No puede esperarse a que las poblaciones tomen conciencia del
agu o problema. Esto im plicara la elaboracin previa de planes
nacionales de estadstica, donde se coordinaran todas las necesi
dades de informacin de los diferentes organismos de planificcin,
ejecucin y control.

H . ORGANIZACIN DE, TRA BA JO EN EL TERRENO


L a programacin de la recoleccin de informaciones debe plan
tearse en trminos de las peculiaridades geogrficas, concentracin
industrial en la urbe, etc. Debiera haber un cntacto permanente
entre la oficina de diseo de la muestra y el equipo de encuestadores. Siempre se presentarn tipos de respuesta o caractersticas
de la industria que no se han contemplado en el proceso de adies
tramiento. En tales casos es preferible solucionar el problema con
sultando a los directores de la investigacin. E n encuestas in
dustriales en el nivel nacional, es conveniente que en los lugares
donde no hay oficinas a cargo de los que dirigen la encuesta la
enumeracin se realice por personas altam ente calificadas para
este tipo de trabajos. En la prctica, la recoleccin de datos en
provincias la realiza personal de las juntas de planificacin u orga
nismos similares, dejando la investigacin en la capital o sede
de la encuesta a personal temporal contratado p ara este efecto.
Es indispensable que se implanten ciertos controles en forma
simultnea a la recoleccin de informaciones. De esta m anera se
previene que se cometan errores voluntarios e involuntarios. Ve
rificar una pequea parte del nmero de encuestas que realiza cada
enumerador puede ser un medio para disminuir un posible sesgo.
Es im portante que se realice esta forma de control sim ultnea
mente al proceso de extraccin de informacin, p ara que puedan
tomarse medidas oportunas de correccin. Los controles ex post
son en general tardos y no se alcanza a rem ediar el problema,
si no a expensas de muchos mayores gastos y demoras perjudiciales.

I . SIST EM A T IZ A C I N DE DATOS

T o d a la m asa de in fo rm a cio n es e x tra d a s d eb e r ser co d ifica d a ,

DETERMINACIN DEL COSTO TOTAL

273

tabulada, clasificada, interpretada y verificada. E n esta altura es


donde se deber disear el nivel de desagregacin y tipos de clasi
ficaciones necesarias. Por una parte, las informaciones sumamente
desagregadas no permiten obtener conclusiones; por la otra, esti
maciones globales slo dan una idea muy general de la situacin
de la industria en sus diversos aspectos. Es imprescindible pues
com binar estimadores en distintos niveles de desagregacin; unas y
otras son necesarias cuando se pretende fijar una poltica y estra
tegia de desarrollo industrial. Conocer por ejemplo el coeficiente
producto-capital para toda la industria m anufacturera es un dato
de m ucha utilidad, pero adems es necesario conocer sus compo
nentes, ya sea por ramas industriales, por ubicacin geogrfica,
por tamao de establecimiento, etc. Con la utilizacin de compu
tadores electrnicos, la sistematizacin de datos se hace m ucho ms
amplia y rpida. Previamente a la introduccin de los datos en los
computadores, aqullos debieron ser sometidos a un estricto con
trol, m xim e si fueron extrados por enumeradoes que no tenan
un cabal conocim iento tcnico-econmico de la industria. Este
control en general se realiza por com paracin entre industrias
similares, por antecedentes que se tienen acerca de los probables
resultados que arrojara la encuesta en cada caso y por revisin
analtica en cuanto a lo razonables que pudieran ser esas infor
maciones.

J . DETERM INACIN DEL COSTO TOTAL


Para la realizacin de una investigacin muestral se ha debido con
tar con un determ inado presupuesto, el que ser necesario com
parar con el costo real de la investigacin. En la misma forma en
que se ha realizado el presupuesto, contem plando cada u n a de las
principales etapas, se deber realizar la com paracin con la reali
dad. De esta m anera se acum ularn experiencias tiles para pos
teriores investigaciones, ya que en todas las diferencias que se
produzcan habr que analizar sus causas; as se tom ar una mayor
conciencia de la trascendencia de cada etapa, lo que puede redun
d ar en mayor aprovecham iento de los recursos disponibles en
futuras investigaciones.

274

ENCUESTAS INDUSTRIALES

K. PUBLICACIN DE RESULTADOS

E n la publicacin de los resultados obtenidos mediante muestras es


fundamental indicar las principales caractersticas del diseo u ti
lizado: criterio de estratificacin, tamao de muestra, tipo de
afijacin, estratos en que se hizo censo, precisin p ara cada una
de las variables principales, probabilidad de acierto, formas de
seleccin, etc. De esta m anera los usuarios conocern las bondades
y limitaciones de que son objeto las estimaciones resultantes. In
cluso es necesario presentar un anexo con una descripcin m inu
ciosa de toda la investigacin, detallando los principales problemas
y las formas de solucin.

Ill

DEMOSTRACIONES MATEMATICAS DE MUESTREO


ALEATORIO SIMPLE

i. L a m edia de la m uestra, y, es un estim ador insesgado de ,


media de la poblacin.
Dem ostracin: se sabe que

2 fs
A]

fa

E{yh)

2 (yi + ya + ya . + y)/h
la

O
donde h =

1, 2, 3,

i =

1 , 2 , 3,

N!
n! (N n)!

C )
n ....

P ara poder evaluar la suma que aparece en el num erador, es


necesario averiguar en cuntas muestras aparece un valor espec
fico cualquiera y ,. A parte de ese valor y ,, habr otras (N 1)
unidades disponibles para el resto de la muestra y otros (n 1)
lugares a ocupar en la m uestra. Luego el nm ero d e muestras
que contienen el valor y estar dado p or:
c N-i
-.-i

(N _l)!
( n 1)1 (N n)l

Por lo tanto:

B]

(n)
2 (yi + y + + y*)/h =
h=l

(N 1)1
( n 1)! (N n)l

(yi + y* + y* +

[275]

- + Yn)

276

DEMOSTRACIONES M A TEM TICA S DE M U ESTREO

Ntese que, por el anterior artificio, la suma de los valores se


extiende hasta yx, porque el valor especfico
puede ser cual
quiera de los valores poblacionales.
Rem plazando la expresin obtenida en B en el num erador de
la igualdad sealada con A, se tiene:
1
(N i ) !
;

(fh) ~ ( T ^ 'j ' ! ( n ) ! (Tl + y* + y* + ' + y * ), n

(Xh)

( N 1)1
! (N

(n 1)

n)

N!
n! (N n ) 1

* 1 n (N n )
+ * * " ---------- i------

+ * + * +

Simplificando factoriales:

E (y h) =

ii

4-

y* +

(yx
y> +
----------------------

y*)

, ,

Demostracin

E [(y i -

Y)* +

(y, _ ? ) * + . . . .

(y. -

i=l
Donde S2 =

(y -

Y )2] = J P ~

Y )*

-------------

(varianza de Cochran)

L a esperanza propuesta es igual a:

(n)
2 (yx C]

Y )2 +
-

(y, -

Y )2

.... +

(yn Y) 2

/h

C)

Ntese que los ndices de la sum atoria se extienden a todas las


posibles muestras.

277

DEMOSTRACIONES MATEM TICAS DE M U ESTREO

Utilizando el mismo artificio que en la demostracin i, el nu


m erador se puede evaluar de la siguiente m anera:

( n

i)

[(yi -

Y)2 + (y -

)2 + to -

? )aJ

Remplazando esta expresin, en el num erador cl G se tiene:


( N

!\

Vn -1 )

[(yi ~ Y)2 +

(ya Y)2 +

(ya -

Y)2 + (Yn " " Y)2]

ZN

C)
=

(N ~ 1) !
. nl ( N - n ) l [(yi _ vy + (ys _ y)2 + . . . . + (yK )*]
(n 1)! ( N _ n ) !
N!

Simplificando se obtiene:

^-[(yi -Y )2+ (y2-Y )2+ + (y* -Y )2]


M ultiplicando y dividiendo p or N 1:
( N - l)n T (Yl N

)2 +

(y2 -

Y )2 +

....

N 1

(N _
N

l)n

p ii

(Yk -

? )21 _
J

(Y. -

? )2

1i iJ

L a expresin dentro del parntesis es lo que se haba llamado S2


(varianza de Cochran).
Luego, queda demostrado que:

278
ni.

DEMOSTRACIONES M A TEM TICA S DE M UESTREO

E [ ( y ,' Y ) (y2 Y ) +

(y, Y ) (y3 Y ) +

.... +

(y .., -

Y ) (y Y)] =

n (n 1)
2N

L a esperanza indicada significa:

(N)

i [(y.

(y* -

Y)

Y) +

(y, -

Y) (y3 -

Y) +

(yx-i -

Y) (y* -

Y)

O
P ara evaluar la suma del num erador, debe
mo artificio utilizado en las demostraciones
cuenta que, com o ahora se trata de productos
habr dos valores especficos en la poblacin
dos lugares en la muestra. L a evaluacin de
rador estar dada, pues, por:

(n _

2)

[(y ~ Y)

f N - 2 ^ [(yx _
L

(y*

~ j)+

Y) (y2 _

- J

/N

<y -

Y +

Y) +

>

(n 2 ) ! ( N n ) !

in
1

(y, Y) + . . . . + (y*., -

.... +

pensarse en el mis
y i i , teniendo en
de dos desviaciones,
que podrn ocupar
la suma del nume

(y*-, -

Y) (yN -

Y)]

Y)]
-

riM ni
N!

Y) (y -

" [ ( y , _ Y) ( y , - Y ) + . . . . +

Y) ( y _ Y ) l

Simplificando factoriales y multiplicando y dividiendo p or 2 s


tiene:

2N(l(>r - 1)l) [2{ (Vl -

(y2 -

Y) +

. . . . -f (yx-, -

Y)

(yN -

Y)>]

A la expresin dentro del parntesis cuadrado le sumaremos y res


taremos los trminos:

279

DEMOSTRACIONES M A TEM TICAS DE M UESTREO

(y i-? )2 +

(y2 - Y ) 2 +

.... +

(yN- Y ) 2

Luego
n (n 1)

2 N (N 1)

[2{ (yx -

Y)

<y2 Y) +

. . . . + (yN_x - Y) (y* - Y)> +

+ { (yi - )2 + y2 ?)2 + + (yn - m

- {(Yi

)2

+ (Y2 -

Y )2

....

(yN
- -

Y )2}]

Observando los trminos dentro del parntesis cuadrado se con


cluye que la expresin que tiene signo negativo es el num erador
d e la varianza de Cochran, y los dos primeros que tienen signo
positivo son el desarrollo del cuadrado de una suma de desviacio
nes, ya que aparecen las desviaciones al cuadrado y los dobles
productos correspondientes, es decir

(Yi -

Y)2 + 2

(y. -

(y, -

Y) =

p or tratarse del cuadrado de la suma de las desviaciones respecto


de la media aritm tica (es decir, el cuadrado de cero). Con esta
reduccin, la expresin queda de la siguiente m anera:

2 (" _ ^ [ - { ( n -

Y)2 + (y. -

Y ) * + ( y - Y ) 2 + . . . . + (yK-Y )*>] =

n (n 1) r N

--------2N(N

}\

1) L 1=1
2

(y.i -

)2 ]

280

DEMOSTRACIONES M ATEM TICAS DE M UESTREO

1)

n (n -

2 <yi - Y)2
r *=1
I
L N1 J

2N

n (n !) c ,
2N

(n)

VW

E 1- Y ) .

11=1

(h -

Y )2

S2

--------- = _

n\

Empezamos la demostracin por esta identidad

2 y.
n(y Y) =

n Y

yi +

Y2 +

y3 +

-j- yn n y

Y +

y2 -

y3 -

yi -

Y+

Y + +

y -

Elevando al cuadrado ambos miembros se tiene:


n2 (y -

Y)2 = [(y, -

n2 (y _

Y)2 = (y, Y)2 + (y2 Y)2 + . . . . + (y, -

2 [(y, -

Y) (y, _

Y) +

Y) + (y*-

Y) + (y, -

(y, Y ) (y, -

) +

Y) + . . . . +

....

( y - Y ) ] 2-

Y)2 +

(y-! -

(y -

Y )]

*
Aplicando el operador esperanza m atem tica:
2 E(y -

2E [(y, _

Y)2 = E[(Yl* Y)2 + (y, -

Y ) (y , -

Y) +

(Yl Y ) (y, -

Y)2 +

Y) +

....

. . . . + (y. -

+ (y .., -

Y)2] +

Y ) (y . -

Y)]

281

DEMOSTRACIONES M ATEM TICAS DE M UESTREO

Los dos trminos de la derecha tienen expresiones conocidas,


demostradas en los puntos ii y iii .
Remplazando tales expresiones se tiene:
n* E(y -

Y )2 = n (N N~

n2 E( Y )2 =

S E ( _

r =

n2 E(y Y )2 =

K, _

1}-

S2 +

S2 n^n ~

2[ -

S2

nS2 (N ~

T). = | ( l _

sta es la frm ula de clculo prctico de la varianza de la media


de una muestra aleatoria simple. (Cuadrado del error estndar de
estimacin.)
v. Demostracin de que la varianza de un a muestra aleatoria
simple es una estimacin insesgada de la varianza de la poblacin
(ambas con denominadores restados en una unidad).

r i ^ y,
^

= E [

Sumando y restando la media poblacional:

(n _

(n -

I) E(sh2) =

I) E(sh2) =

[ 2

E f 2

(Yi -

(Yi -

Si hacemos:
y4 Y =

W ,; Y = W

) -

?)2

( -

Y)

2 (*>

282

DEMOSTRACIONES M A TEM TICA S DE M UESTREO

tenemos:
2 [(y. -

Y) -

Y)]*

( -

= 2 (W, _

1=1

2 W,2 _

2 W 2 W, +

1=1

1=1

2 Wi2

W)2

1=1

n W2

(n W) + n W 3

2 W

1=1

= W ,! - n W !
= 2 (y. 1=1

n(y

Y )2 -

Y )2

Remplazando esta expresin en aquella m arcada con el asterisco


(p. 281) se tiene:
(n _

1) E(sh2) = E

(yi -

Y )2 -

n ( -

Y )2j

[ 2 t (y. -

Y )2 J

( -

n E

Y )2

Teniendo en cuenta las demostraciones 11 y iv y remplazando


dichas expresiones en el miembro de la derecha de la igualdad
anterior:
< n _ 1) E(sh2)

n(N

1)

S2

/,

n(N 1)
S2 S2

N
=

S2

S2

n(N 1) (N n)

n (N 1) (N 11)

= s2 - N(n
N

Se obtiene finalm ente:


E(s2) =

S2

l)

( > - * )

F O R M U L A R IO SO B R E M U E S T R E O A L E A T O R IO SIM PU E

A.

V A RIA BLE CUANTITATIVA

N : N m e r o d e e le m e n to s q u e c o m p o n e n la p o b la c i n ,
n : N m e r o d e e le m e n to s q u e c o m p o n e n la n a f t a ,
y ,: V a lo r d e la v a r ia b le d e la n a u n id a d d e l a p u U m ffla
(i = 1, 2 , 3 ............' N ).
y ,: V a lo r d e la v a r ia b le e n la i- sim a u n id a d d e l a m im iHM i
(i = = I, 2 , 3 ...............n ).
: M e d ia a r itm tic a p o b la c io n a l
N

2 y.
1=1
=
y:

-T

M e d ia a r itm tic a d e la
n

2 j y.
-

*""

muestra

E stim a d o r in s e s g a d o d e l a \
\ ^m e d ia a r itm tic a p o trb faiz ce iaio Bn aillj
r

o 2: V a r ia n z a d e 1; p o b la c i n
2 (y. - )2

o2 =

1= 1
---------------------

N
S 2: V a r ia n z a d e C o c h r a n p a ra la p o b la c i n
N

2 ( y ,- ? ) 2

S2 =

i=i

2 y2

i=i

-a

N I
N 1
N
s2: V a r ia n z a d e C o c h r a n p a r a la m u e str a
2 (y. - y)2

11

2 **

1=1

n 1
n 1
E stim a d o r in se sg a d o 'd e la v a r ia n z a
d e C o c h r a n p a ra la p o b la c i n .

Q yS

M U ESTREO A LEATORIO S IM P L E

Y : Total poblacional

N Y

1=1

Yi

: Estimador del total poblacional


Y

N y

V(y): Varianza verdadera del estimador de la media o cuadrado de


la desviacin estndar verdadera
('-* )
vfy): Estimador de la varianza del estimador de la media
=

V(t): Varianza verdadera del estimador del total


V(Y) = Na V(y)
v(Y): Estimador de la varianza del estimador del total
V() =

N2 V(y)

n.: Tamao de muestra (primera aproximacin)


t* Sa
n. =

da

en que t es el coeficiente de confianza y d es el semiancho


del intervalo de confianza.
d =

t v w

n: Tamao de la muestra (definitivo)

M UESTREO ALEATORIO SIM P L E

B. VARIABLE CUALITATIVA (DOS CATEGORAS)

La variable solamente puede tomar dos valores: 1 si


mento (en la poblacin o en la muestra) posee la
rstica que se investiga, y 0 si no la posee.
P: Proporciii en la poblacin

el d e

2 1 y.
i

p = --------N
p: Proporcin en la muestra
.n
P=

2 y.
=i

n
Estimador insesgado de la
proporcin poblacional.
S2: Varianza de Cochran para la poblacin
N
S2 = --------N 1 PQ Q = 1 P
s2: Varianza de Cochran para la muestra
' = T n = - pq

Estimador insesgado de la varianza


Cochran para la poblacin.

de

q = 1 P

A: Nmero de elementos que poseen la


blacin

caracterstica en la po

A = NP = 2 Yi
1=1

: Estimador del nmero de elementos que


rstica en la poblacin
A = Np

poseen la

M U ESTREO ALEATORIO SIM P L E

v e r d a d e r a d e l e stim a d o r d e la p r o p o r c i n o c u a
d r a d o d e la d e s v ia c i n e st n d a r v e r d a d e r a

Varianza

P Q / N n\
VW =

\ - n j

E m im a d o r d e la v a r ia n z a d e l e stim a d o r d e la p r o p o r c i n
p q

/ N n\

V ariaaa v e r d a d e r a d e l e stim a d o r d e l n m e r o d e e le m e n to s
q u e p o s e e n la c a r a c te r stic a q u e se in v e stig a

V<A) = N* V(p)
E stim a d o r d e la v a r ia n z a d e l e stim a d o r d e l n m e r o d e e le
m e n ta s q u e p o s e e n la c a r a c te r stic a q u e se in v e stig a
*i)

= X 2 v<p)

T a m a a d e la m u e str a (p r im e r a a p r o x im a c i n )
tJPQ
*

d-

e st q u e : t e s e l c o e fic ie n t e d e c o n fia n z a y d e s e l s e m ia n c h o
d e l in te r v a lo d e c o n fia n z a .
a

= t

y v (p )

m: Tamao

d e m u e str a (d e fin itiv o )


n.

FORMULARIO SOBRE MUESTREO ALEATORIO ESTRATIFICADO

A.

VARIABLES CUANTITATIVAS

N:
n:
N h:
n h:
y,.,:

N m e r o d e e le m e n to s q u e c o m p o n e n la p o b la c i n
N m e r o d e e le m e n to s q u e c o m p o n e n la m u e stra
N m e r o d e e le m e n to s d e l e str a to h - sim o
N m e r o d e e le m e n to s d e la m u e str a d e l e str a to h - sim o
V a lo r d e la i-sim a u n id a d d e l e str a to h - sim o
i = 1, 2, 3, . . . . N h; h = 1 , 2 , 3
L
yh l: V a lo r d e la i-csim a u n id a d d e la m u e str a d e l e str a to h - sim o
i = 1, 2 , 3, . . . . n; h = 1, 2, 3, . . . . L
h: M e d ia a r itm tic a d e l e str a to h - s im o
2 y*.

i=l

: M e d ia a r itm tic a d e la p o b la c i n
2

ii=i

yu:

y .. n >.

M e d ia a r itm tic a d e la m u e stra d e l e str a to h - s im o


2 ya.
1=1

y h = ---------------- E stim a d o r in se sg a d o d e Yh
n,.
y: M e d ia a r itm tic a d e la m u e str a to ta l
L
2

h = l h "a
n

y s t : E stim a d o r in se sg a d o d e la m e d ia a r itm tic a p o b la c io n a l


[287]

288

M UESTREO ALEATORIO ESTRATIFICADO

2 h Nh
ii=i
st =

Sh2 : V a r ia n z a d e C o c h r a n p a ra e l e str a to h - sim o


Nh

2 (Yh. 2

Yu)2

2 Ybi2

N h Y h2

Nh 1

Nh 1

1= 1

ah

Nh 1

sh2 : V a r ia n z a d e C o c h r a n p a ra la m u e str a d e l e str a to h - sim o (es


tim a d o r in se sg a d o d e S ,2)
n

nh
(Y u i

-------

h )2

i= 1

Y h l2

1= 1

nh

" h

nh

Y : T o t a l p o b la c io n a l
L

Nh

2 2 Yh,
h=l i=l

Y = N Y =

Y s t : E stim a d o r d e l to ta l p o b la c io n a l
Yst

N st

V ( st); V a r ia n z a v e r d a d e r a d e l e stim a d o r d e la m e d ia
a] F r m u la g e n e r a l
V ( at) =
N

1 L
2 N h (N h 2 h=1

n)

S 2

nb

b ] P a r a a fija c i n p r o p o r c io n a l
1
_ f L
V ( st) = ---------------- 2 w h S u2 d o n d e :
n
b=i

n
Nh
f = ------- Y W h = ----N
N
c] P a ra a fija c i n p tim a

n2

289

M UESTREO ALEATORIO ESTRATIFICADO

r L

2 wh s j"I

2 wbV

h = l

V(st)

h = l

----

v (yst): V a r ia n z a e stim a d a d e l e stim a d o r d e la m e d ia (la s m ism a s


f r m u la s a n te r io r e s, p e r o u tiliz a n d o s , 2 e n v e z d e S h2, p o r
se r e stim a d o r in se sg a d o )
n h: T a m a o d e la m u e str a e n e l e str a to h - sim o
a] A fija c i n p r o p o r c io n a l
Nh
N
b ] A fija c i n p tim a
n

N h Sh
2 N h Sh
h = l

c] A fija c i n p tim a e c o n m ic a
nh =

Nh S/ V^h

2 N s SJ

h=i

n : T a m a o d e la m u e stra ; p a r a e stim a r la m e d ia a r itm tic a


a] A fija c i n p r o p o r c io n a l
2 whV

nO

h=l

n = --------------- d o n d e n n -------------------V (y Bt)


"O

V+

b ] A fija c i n p tim a
n

[ w- *]
V(yst) +

N <=!

M U ESTREO A LEATORIO ESTRATIFICADO

290

B. VARIABLE CUALITATIVA (DOS CATEGORAS)

L a v a r ia b le so la m e n te p u e d e to m a r d o s v a lo r e s: 1 si e l e le
m e n to (e n la p o b la c i n o e n la m u e str a ) p o se e la c a r a c te r s
tic a q u e se in v e stig a , y 0 si n o la p o se e .
(L a n o m e n c la tu r a e s sim ila r a la p r e se n ta d a e n e l p u n t o a .)
P h: P r o p o r c i n e n e l e str a to h - sim o
X
h
2 yh,
Ph =

Nb

Ah
Nb

P : P r o p o r c i n e n la p o b la c i n
p __

Ph N

h = l

p h: P r o p o r c i n e n la m u e str a d e l e str a to h - sim o


h

ytu

ah
p h = --------------- -----nh
nh

E stim a d o r in se sg a d o d e P h

p : P r o p o r c i n d e la m u e str a to ta l
L

2 Ph n h

h=l

p =

p s t : E stim a d o r in se sg a d o d e la p r o p o r c i n p o b la c io n a l
2

Ph N h

h = l

P st =

A : N m e r o d e e le m e n to s q u e p o s e e n la c a r a c te r stic a e n la p o
b la c i n

291

M U ESTREO ALEATORIO ESTRATIFICADO

A =

N P

: Estim ador del to tal pob lacio n al

A =

(nm ero de elem entos)

Npsl<

Sh-: Varianza d el estrato h-simo


N P Q,,

V (Pst): Varianza verdadera d el estim ador de la p roporcin po blacio n al


a] Frm ula general

V (p ) =

i
N|" (Nh ~ n?l)
N - =
N _ _ 1

Ph Q l
ni.

b] A fijaci n proporcional

v (Pst) =

N _

11 N

n
c]

----------

1=

N h2 P h Q h

t-

h=l

W h P h Q

A fijaci n ptim a

(2

\h=1

Nh

V (P ) =

l J

Nh 1

*= '

V (A ): V arianza verdadera del estim ador del total


V(A ) =

N2 V (p st)

v(pst) : Varianza estim ada del estim ador de la p roporcin. Se u tili


zan las mismas frm ulas anteriores, pero sustituyendo:

Nh Ph Qh

---------------

por

nh Ph lh

, por ser estim ador insesgado.

292

M U ESTREO A LEATORIO ESTRATIFICADO

v ( ): E stim a d o r d e la v a r ia n z a d e l e stim a d o r d e l to ta l
v (A ) = N 2 v ( p st)
n h: T a m a o d e la m u e str a e n e l e str a to h - sim o
a] A fija c i n p r o p o r c io n a l
N
. N

nh =

b ] A fija c i n p tim a
Nh (P>, Qh) 1/2

nh =
2

h=l

N h (P h Q h)

' 11

c] A fija c i n p tim a e c o n m ic a
nh

Nh (Ph Qh/c)*

-------------------------- n

2 Nh (Ph Qh/Ch)^
h=l

n : T a m a o d e la m u e str a p a ra e stim a r u n a p r o p o r c i n
a] A fija c i n p r o p o r c io n a l
2

n = --------

W h P Q h

h=I

donde n0 =

1 + _

V(Pst)

+ N

b j A fija c i n p tim a
n

n =
1+

W h Ph Qh

N V (pst) >=!

[ i Wh

d o n d e n n -----------------------V(Pst)

B IB L IO G R A F IA

C a n sa d o , E n r iq u e , Curso de estadstica general, C o m isi n d e E d u c a c i n


E sta d stic a d e l I n s titu to I n te r a m e r ic a n o d e E sta d stic a , R o sa r io , A r
g e n tin a , 1958.
C o c h r a n , W illia m G ., Sampling techniques, N u e v a Y o rk , J o h n W ile y
a n d S o n s, 5 a . e d ., 1966.
C r o x to n , F re d e r ic E ., y D u d le y J . C o w d e n , Estadstica general aplicada,
tra d , d e T e o d o r o O r tiz y M a n u e l B r a v o , M x ic o , F o n d o d e C u ltu r a
E c o n m ic a , 19 48 .
H o e l, P a u l G ., Introduccin a la estadstica matemtica, tr a d , d e E n r iq u e
E . D ie u le a it, B ib lio te c a In te r a m e r ic a n a d e E sta d stic a T e r ic a y
A p lic a d a , R o sa r io , A r g e n tin a , 2 a . e d ., 19 55 .
M ills, F . C e c il, Mtodos aplicados a la economa y los negocios, tr a d , d e
J u a n R u iz M a g a n y J o s R u iz R u b io , M a d r id , A g u ila r , 19 60 .
O s tle , B e r n a r d , Estadstica aplicada, tra d , d e D a g o b e r to d e la S e r n a V a l
d iv ia , M x ic o , L im u s a -W ile y , 19 65 .
R o s, S ix to , Mtodos estadsticos, M a d rid , E d ito r ia l d e l C a stillo , 5 a . e d .,
19 67 .
V u sk o v ic , P e d r o , Apuntes de estadstica, S a n tia g o , E sc u e la d e E c o n o m a , .
U n iv e r sid a d d e C h ile , 19 59 ; e d ic i n m im e o g r a fia d a .
Y a m a n e , T a r o , Elementary Sampling Theory, N u e v a J e r se y , P r e n tic e H a ll, 19 67 .
Y a m a n e , T a r o , Statistics. An Introductory Analysis, N u e v a Y o rk , H a r p e r
a n d R o w , 1 9 64 .
Y u le , G . U . y M . G . K e n d a ll, Introduccin a la estadstica matemtica,
tra d , d e J o s R o s J im e n o , M a d r id , A g u ila r , 19 64 .
B e tte lh e im , C ita rle s, Problemas tericos y prcticos de
la planificacin,
tra d , d e V ic e n te L o z a n o , M a d rid . E d ito r ia l
T e c n o s , 19 66 .
C h a k r a v a r ty , S., La lgica de la planificacin
de inversiones,tra d , d e
T o r t e lla C a sa res, M a d r id , E d ito r ia l T e c n o s ,
19 65 .
C h e n e r y , H . y P . C la r k , Economa interindustrial, insumo-producto y pro
gramacin.lineal, M x ic o , F o n d o d e C u ltu r a E c o n m ic a , 19 63 .
M a ss, P ier r e, El plan o el anliazar, B a r c e lo n a , E d ito r ia l L a b o r , 19 66 .
P e r r o u x , F ra n o is, Tcnicas cuantitativas de planificacin, B a r c e lo n a ,
E d ic io n e s A r ie l, 19 67 .
V a r io s, Discusiones sobre planificacin, te x to s d e l I n s titu to L a tin o a m e
r ic a n o d e P la n ific a c i n E c o n m ic a y S o c ia l, M x ic o , S ig lo x x i, 2a.
e d ., 19 68 .
V u sk o v ic , P ed r o , Tcnicas de planificacin, I n s titu to L a tin o a m e r ic a n o d e
P la n ific a c i n E c o n m ic a y S o c ia l, S a n tia g o , 19 62 ; e d ic i n m im e o g r a -
fia d a .
[2 9 3 ]

impreso en impresora publimex, s.a.


calz. san lorenzo 279-32 - col. estrella iztapalapa
del. iztapalapa - 09880 mxico, d.f.
dos mil ejemplares y sobrantes
27 de agosto de 1987

Você também pode gostar