Você está na página 1de 76

HUBERT M. BLALOCK, JR.

ESTADISTICA
SOCIAL

GB
¿0 ANIVERSARIO

FONDO DE CULTURA ECONÓMICA


MÉXICO
S eg u n d a P a rte

E S T A D ÍS T IC A D E S C R IP T IV A UNIVARIADA
I I I . ESCALAS N O M IN A L E S : P R O P O R C IO N E S ,
P O R C E N T A JE S Y R A ZO N ES

E s m u c h o m ás sencillo re su m ir los datos que com portan escalas


nom inales que en el caso en que se em plean escalas de intervalo.
La operación aritm ética b ásica es, en el p rim e r supuesto, la
de c o n tar el n ú m ero de los casos al in te rio r de cada categoría y de
a n o ta r sus tam años relativos. Un grupo determ inado puede cons­
ta r de 36 varones y 24 m u jeres, o de 25 p ro testan te s, 20 católi­
cos y 15 judíos. Sin em bargo, p a ra p o d er estab lecer com para­
ciones con otro s grupos, hay que te n e r en cu en ta el n ú m ero de
casos en cada un o de los grupos considerados. Las m edidas que
se exam inan en el p re sen te capítulo p erm iten establecer com pa­
raciones e n tre diversos grupos, m ediante norm alización esencial­
m en te en relación con el tam año. Sin d u d a alguna, dos de las
m edidas en cuestión, la de las proporciones y la de los p o rc en ta­
jes, son ya conocidas de todos.

I I I .1. P roporciones
Con o b jeto de p o d er servirnos de las proporciones, hem os de
p re su m ir que el m éto do de clasificación h a sido ta l que las cate­
gorías son m u tu am en te exclusivas y exhaustivas. E n o tro s térm i­
n o s: cada individuo h a sido pu esto en u n a categoría y en u n a
sola. Con fines de sim plificación, tom em os u n a escala nom inal
q u e co n ste d e c u a tro categorías, con N u N 2, N s y N 4 casos re s­
pectivam ente. S upongam os que el nú m ero to ta l de los casos sea
N. La pro p o rció n de casos en cualquier categoría dada e s tá defi­
n id a com o el nú m ero en la categoría dividido e n tre el nú m ero
to tal de casos. P o r lo ta n to , la proporción de individuos de la
p rim e ra categoría se halla d ad a p o r la ca n tid ad N 1/N , y las p ro ­
porciones de las dem ás categorías son respectivam ente de N 2/N ,
N 3/ N y N J N . Es obvio que el valor de u n a proporción n o puede
ser m ay o r que la unidad. .En efecto, com o q u iera que

Nj. + N 2 + N 3 + N é = N

tenem os que

Nx N2 Ns Ni N
_ J_ + __L + _ L = -------- = i
N N N N N

Así, pues, si adicionam os las proporciones de los casos en todas


las categorías (m u tu am en te exclusivas), el re su ltad o es la unidad.
43
Es ésta u n a p ro p ied a d im p o rta n te de las p ro porciones que se
d eja ex ten d er fácilm ente a cu alq u ier n ú m ero de categorías.
Ilu strem o s el em pleo de las proporciones con los datos dados
en el cu ad ro I I I .1.

C uadro II I .l. N ú m ero de delincuentes y de no delincuentes en


dos localidades hipotéticas

Sujetos Localidad 1 Localidad 2


Delincuentes
Prim er delito 58 68
Reincidentes 43 137
No delincuentes 481 1081
Total 582 1286

R esulta m ás bien difícil decir cuál de las dos localidades cuenta


con m ayor n ú m ero de delincuentes, p o rq u e son diversam ente
grandes. E n cam bio, si expresam os los datos en térm in o s de
proporciones, podem os establecer u n a com paración directa. E n
efecto, la p ro p o rció n de p rim ero s delitos es, en la com unidad 1,
de 58/582, o .100; la de la localidad 2, en cam bio, es de 68/1 286
o sea .053. Las dem ás proporciones pu ed en calcularse en form a
análoga, resu m ien d o los re su ltad o s en fo rm a de c u a d ro (cu ad ro
III.2 ). El cu ad ro en cuestión nos p e rm ite ap re c ia r que los núm e­
ro s relativos de delincuentes son m u y parecidos en las dos lo­
calidades, p ero que la segunda de ellas contiene u n núm ero
considerablem ente m ás b a jo de p rim ero s delitos y u n a p ro p o r­
ción m ás a lta de reincidentes.

C uadro III.2. Proporciones de delincuentes y de no delincuentes


en dos localidades hipotéticas

Sujetos Localidad 1 Localidad 2


Delincuentes
Prim er delito .100 .053
Reincidentes .074 .107
No delincuentes .826 .841

Total 1.000 1.001

La sum a de las proporciones d e la localidad 2 n o d a exacta­


m en te la unidad, debido a los e rro re s de redondeo. E n ocasiones
es conveniente p re s e n ta r los dato s de ta l m odo que las sum as
sean ex actam en te igual a 1.000. E sto puede acaso exigir el aju ste
de algunas de las proporciones de las categorías, en cuyo caso
m odificam os p o r convención las cifras de las categorías que com ­
p re n d en el m ay o r n ú m ero de casos.1 E l argum ento en favor de
ese pro ced im ien to está en que u n cam bio en la ú ltim a cifra deci­
m al de u n a p ro p o rció n m ayor es relativ am en te m enos im por­
ta n te que el m ism o cam bio en u n a cifra m enor. Así, p o r ejem plo,
p o d ría cam b iarse la pro p o rció n de los no delincuentes de la lo-
calid ad 2 en .840, d e m odo q u e la su m a re s u lta n te sea igual a la
unid ad .
El cu ad ro III.2 com prende proporciones del n ú m ero to tal de
casos en cada u n a de las com unidades. Supóngase, sin em bargo,
que el in terés se c e n trab a sobre to d o en los delincuentes, y que
deseábam os conocer la p ro p o rció n de los reincidentes entre los
delincuentes. E l n ú m ero to ta l de delincuentes e n las dos localida­
des es resp ectivam ente de 101 y 205. P o r lo tan to , e n tre los delin­
cuentes, las pro p orciones de los reincidentes son respectivam ente
de 43/101, o .426 y 137/205, o .668. A p rim e ra vista estas cifras
p u ed en p ro p o rcio n ar u n a im presión lig eram en te diferente de la
del p rim e r co n ju n to de proporciones. H abríam os de g u ard arn o s
especialm en te de concluir que el segundo espécim en es “m ás
delictivo" que el p rim ero. P o r supuesto, este ú ltim o co n ju n to de
p ro p o rcio n es n ad a nos dice en absoluto acerca de las cifras rela­
tivas de no delincuentes en los dos especím enes considerados.
E s obvio q ue no existe su stitu tiv o alguno de la lectu ra a te n ta de
los cuadros. C onstituye u n bu en principio aco stu m b rarse a de­
te rm in a r siem pre las categorías que se hallan com prendidas en
el nú m ero to tal de casos que sirve de denom inador de la p ro p o r­
ción. El lecto r debiera siem pre p re g u n ta r: "¿de qué es esto la
p ro p o rció n ?” Y la re sp u esta re su lta rá clara del conjunto.

I1I.2 P orcentajes
Los p o rcen tajes pueden o b ten erse de las proporciones m ultipli­
cando sim plem ente p o r 100. La p a la b ra p o rc en taje significa por
ciento. P or lo tan to , al servirnos de los p o rc en tajes norm alizam os
en relación con el volum en, calculando el n ú m ero de individuos
que h ab ría en u n a categoría d eterm in ad a si el to ta l de los casos
fu era 100, perm aneciendo in altera d a la p roporción en cada cate­
goría. Y com o q uiera que las proporciones sum adas dan la uni­
dad, es obvio que los p o rcen tajes sum arán 100, a m enos que las
categorías no sean m u tu am en te exclusivas o exhaustivas.
Al re p ro d u cir resultados, los p o rcentajes se em plean con
m ucha m ayor frecuencia que las proporciones. Las cifras del cua­
dro XII.2 h ab ría n podido expresarse lo m ism o e n térm inos de
i Puede utilizarse exactamente el mismo procedimiento en el caso de por-
oentajes.
p o rcen tajes. M ejor que servirnos de los m ism os datos, tom em os
o tro cuadro que puede servir p a ra iiu s tra r otros diversos aspec­
tos. Supongam os que tenem os tres agencias de servicios dom és­
ticos con u n a distribución de casos com o la que se indica en el
cu ad ro III.3.
Como es usual, los p o rcen tajes se h an dado h a sta el p rim er
decim al y se h an operado los aju stes de los últim os dígitos, de
m odo que los totales den exactam ente 100. Aquí el núm ero de ca­
sos de cada agencia es lo suficientem ente grande com o p a ra ju s ­
tificar el em pleo de p orcentajes. Sin em bargo, si el núm ero de
casos h u b iera sido m enor, el em pleo de aquéllos h a b ría resultado
equívoco'. E n efecto, supóngase que la agencia C h ab ía trata d o
sólo 25 casos en total. Si h u b iera hab id o cu a tro m ad res solteras
y siete p arejas de novios, los po rcen tajes en dichas categorías
h ab ría n sido respectivam ente del 16 y del 28 p o r ciento. Y com o
q u iera que m uchas personas aco stu m b ran m ira r sólo los p o r­
cen tajes y no el núm ero efectivo de casos com prendidos, po­
d ría fácilm ente o btenerse la im presión de que h ab ía m uchas m ás
p arejas de novios que de m ad res solteras. Como se verá cuando
lleguem os a la estad ística inductiva, la diferencia e n tre cuatro
y siete casos p u ed e deberse perfectam en te a factores pu ram en te
casuales. El em pleo de los p o rc en tajes y las proporciones com­
p o rta p o r lo re g u lar u n a estabilidad m ucho m ayor de las cifras.
P o r lo tan to , he aquí dos reglas generales im p o rta n te s: 1) indí­
quese siem pre el núm ero de casos ju n ta m en te con los porcentajes
o las proporciones, y 2) n o se calcule nunca u n porcentaje, a m e­
nos que el n ú m ero d e casos en que está basado se halle a proxi-

Cuadro I I I .3. D istribución de los n úm eros y porcentajes de casos


tratados p o r tres agencias hipotéticas de servicios dom ésticos

Agencia A Agencia B Agencia C Total


Clase de casos
N? % Ni °/0 M % N°- %
Matrimonios 63 47.3 88 45.5 41 36.6 192 43.8
Divorciados 19 14.3 37 19.2 26 23.2 82 187
Novios 27 20.3 20 10.4 15 13.4 62 14.2
Madres solteras 13 9.8 32 16.6 21 18.8 66 15.1
Otros 11 8.3 16 8.3 9 8.0 36 8.2
Total 133 100.0 193 100.0 112 1.00.0 438 100.0

m id a d de los 50 o más. Si el núm ero de casos es m uy pequeño,


será preferible in d icar el núm ero efectivo de ellos en cada cate­
goría, sin re c u rrir a los po rcen tajes. En el caso an terio r, por
ejem plo, indicaríam os sim plem ente que la agencia C había tra ­
ta d o cu a tro m ad res solteras y siete p arejas de novios.
Véase ah o ra la colum na del to tal que indica la distribución en
p o rcen tajes de las tres agencias ju n tas. E sas cifras se han ob­
tenido sum ando el n ú m ero de casos de cada tipo y el núm ero
to tal de casos trata d o s p o r las tres agencias ju n tas. P a ra el
cálculo de ios p o rcen tajes totales se utilizó, pues, com o base
u n N de 438. Supóngase, sin em bargo, que el núm ero de casos
no nos h u b iera sido dado en el cuerpo del cuadro, sino que se
h u b iera presentado- com o en el cuadro III.4. E n tal caso po­
d ría d arse la tentación de o b ten er los po rcen tajes totales to­
m an d o directam ente la m edia aritm ética de los tres p o rc en ta­
je s de cad a hilera. S em ejante p rocedim iento n o ten d ría en cuenta
el hecho de que las tre s agencias h ab ían tra ta d o núm eros di­
feren tes de casos; sólo se ju stific aría si los núm eros de éstos
fu e ran efectivam ente iguales. El procedim iento correcto consis­
tiría en p o n d e ra r cada p o rc en taje p o r el núm ero correspondien­
te de casos. Uno de los m edios p a ra hacerlo consistiría en calcu­
la r h acia a trá s p a ra o b ten er el nú m ero efectivo de casos de cada
casilla. Lo que p o d ría efectuarse m ultiplicando el núm ero to tal
de casos tra ta d o s p o r la agencia p o r la proporción de u n a catego­
ría d eterm in ad a. P or ejem plo, (133)(.473) = 63.

Cuadro III.4. D istribución en porcentajes de los casos tratados


p o r tres agencias hipotéticas d e servicios dom ésticos, con los
porcentajes dispuestos verticalm ente

Agencia A Agencia B Agencia C


Clase de casos (N = 133) (N = 193) (N = 112)
% Vo %
Matrimonios 47.3 45.5 36.6
Divorciados 14.3 19.2 23.2
Novios 20.3 10.4 13.4
Madres solteras 9.8 16.6 18.8
Otros 8.3 8.3 8.0

Total 100.0 100.0 100.0

O bsérvese que los p o rc en tajes dados en los cuadros III.3 y


III.4 tien en p o r objeto- co n te sta r a ciertas p reg u n tas y n o otras.
Nos p erm iten ex am inar cada agencia p o r sep arad o y v er la dis­
trib u ció n de los casos tra ta d o s. P erm iten adem ás la com para­
ción de las agencias e n tre sí e n relación con los casos trata d o s.
Así, p o r ejem plo, las agencias B y C tra ta ro n relativ am en te m ás
m ad res solteras y perso n as divorciadas de las que tra tó la agen­
cia A. Supóngase, sin em bargo, que nos in tere sa b an a n te todo
los casos de cierto tip o y el n ú m ero relativo de ellos tra ta d o s p o r
cada agencia. Así, p o r ejem plo, p o d ría eventualm ente interesar-
Cuadro III.5 . D istribución en porcentajes de los casos tratados
p o r tres agencias hipotéticas de servicios dom ésticos, con los
porcentajes calculados horizontalm ente

Agencia A Agencia B Agencia C Total


Clase de casos (N = 133) (N = 193) (N = 112) (N = 438)
% % % %
Matrimonios (N= 192) 32.8 45.8 21.4 100.0
Divorciados (N =82) 23.2 45.1 31.7 100.0
Novios (N = 62) 43.5 32.3 24.2 100.0
Madres solteras ( N- 6 6 ) 19.7 48.5 31.8 100.0
Otros ( N~36) _* _* _* __ *

* Los porcentajes no se calculan cuando la base es inferior a 50.


n o s sab e r el p o rc en taje de todos los m atrim onios que pasaron
p o r la agencia B . E n estas condiciones re su lta ría m ás conve­
nien te calcu lar los p o rcen tajes a través del cuadro. E a efecto,
po d ríam o s to m a r el n ú m ero to ta l de m atrim onios y v er cuáles
p o rcen tajes de dicha categoría fu e ro n tra ta d o s respectivam ente
p o r las agencias A, B y C. Los p o rcen tajes su m arían entonces
100 en el sen tid o horizontal del cuadro, y no en el vertical, y los
resu ltad o s se resu m irían com o en el cuadro III.5.
De m odo que los p o rcen tajes pueden calcularse tan to en sen­
tid o vertical com o en sentido horizontal. Por lo tan to , los cua­
dros h an de exam inarse siem pre cuidadosam ente p a ra ver exac­
tam en te cóm o se h an calculado aquéllos. P ara los casos en que
la p ro p ia teo ría nos dicta cuál es la variable que debe ser tom a­
da com o cau salm ente dependiente y cuál ha de ser considerada
causalm ente p rim a ria o independiente, p o d rá b astarn o s u n a sim ­
ple regla em pírica. Si tenem os la costum bre de s itu a r la varia­
ble independiente en la p a rte alta del cuadro, y la variable de­
p endiente al lado izquierdo, los p o rcen tajes su m ará n 100 hacia
abajo, y las com paraciones se h a rá n de izquierda a derecha. En
el ejem plo relativo a la com paración de niveles de delincuencias
en dos localidades, ca b ría n o rm alm en te su p o n er que ciertas ca­
racterísticas locales pueden te n e r influencia sobre la delincuen­
cia, m ás bien que a la inversa.
Cuando com putam os los p o rcen tajes p ara que sum en 100 hacia
abajo, lo que en re alid ad hacem os es norm alizar los tam años de
las localidades, ya que reconocem os que los factores que se refie­
re n a sus tam años relativos, o los m uestreos realizados dentro
de cada localidad, no dependen causalm ente de sus niveles de
delincuencia. Al co m p u tar hacia ab ajo los po rcen tajes estam os
controlando aquellos factores que afectan al tam añ o de los dos
m uestreos. E ste p u n to qu ed ará m ás en claro u n a vez que haya­
m os considerado el concepto de inclinación de u n a línea recta
en la que u n a de las variables fig u ra com o dependiente de la o tra
(v e r cap ítu lo xvrr).
R esu ltará que los po rcen tajes com putados en la dirección su­
gerida p u ed en ser considerados com o casos especiales de dichos
declives.

II I.3. R azones
La razón de u n n ú m ero A con respecto a o tro núm ero B se de­
fine com o A dividido e n tre B . La cantidad que precede se pone en
el n u m erad o r, en tan to que la que sigue fo rm a el denom inador.
S upóngase que en una elección local se hallan inscritos 365 re p u ­
blicanos, 420 dem ócratas y 130 independientes en calidad de vo­
tan tes. E n este caso la razón de los republicanos a los dem ócra­
tas es de 365/420, y la de los republicanos y los dem ócratas a los
independientes es de (365 + 420)/130. O bsérvese que, a diferen­
cia de la proporción, la razón puede to m a r u n valor su p erio r a
la unidad. Vemos asim ism o q u e la expresión que precede o que
sigue pueden constar, u n a y o tra, de cantidades d istin tas ( v.gr.
republicanos y d em ócratas). G eneralm ente la razón se reduce a
su expresión m ás sim ple elim inando en el n u m era d o r y el deno­
m in ad o r los factores com unes. Así, pues, la razón de los dem ó­
cratas a los independientes se escrib irá com o 42/13 o bien, en
fo rm a equivalente, com o 42:13. En ocasiones es conveniente ex­
p re s a r la razón en térm inos de u n denom inador form ado p o r la
unidad. P o r ejem plo, la razón de los dem ócratas a los indepen­
d ientes pu ed e escribirse com o 3.23 a 1.
E s obvio que las proporciones re p resen tan u n tip o especial de
razón en la que el denom inador es el nú m ero to tal de los casos
y el n u m era d o r u n a cierta fracción de aquél. Sin em bargo, el
térm in o de razón se em plea p o r lo re g u lar p a ra re ferirse a casos
en los q ue A y B re p re se n ta n categorías separadas y distintas.
P odríam os, p o r ejem plo, estab lecer la razón de los delincuentes
a los n o delincuentes, o de los m atrim onios a los novios. Es evi­
d ente que con cu atro o cinco categorías el n ú m ero de razones
posibles susceptible de calcularse es m uy grande. En consecuen­
cia, a m enos que el in terés se cen tre a n te to d o en uno o varios
p ares de categorías, será en general m ás económ ico y m enos su­
je to a confusión p o r p a rte del lecto r servirse de los p o rcentajes
y las proporciones. O bsérvese que, si las categorías sólo son dos,
será posible calcular la proporción d irectam en te a p a r tir de la
razón y viceversa. Así, p o r ejem plo, si sabem os que la razón de
los varones a las m u jeres es de 3 :2, entonces en cada cinco p er­
sonas h a de darse u n prom edio de tres varones y dos m ujeres.
La p ro p o rció n de los varones es, pues, de 3/5, o .6.
Las razones pu eden ex presarse en térm inos de cualquier b ase
que re su lte conveniente. L a base de la razón está indicada p o r la
m ag n itu d del d enom inador. Así, p o r ejem plo, las razones relati­
vas al sexo se in d ican convencionalm ente en térm in o s del núm ero
de varones p o r 100 m u jeres. P o r lo tan to , u n a razó n de 94 en
m ateria de sexo in d icará que el n ú m ero de los varones es ligera­
m en te in fe rio r al de las m u jere s, en ta n to que u n a razón de
sexos de 108 significaría u n a ligera p re p o n d eran cia de los p ri­
m eros. Las bases que co m p o rtan núm eros grandes, tales como
1 000 o 100 000, se em plean a m enudo al calcular cuotas, o tro tipo
de razón, cuando el em pleo de las proporcion es o los po rcen tajes
co n d u ciría a valores decim ales pequeños. Las cuotas de n atali­
dad, p o r ejem plo, suelen d arse e n térm in o s del n ú m ero de naci­
m ien to s vivos p o r 1 000 m u jeres e n ed ad de p ro c rea r. Las cuotas
de asesinatos pueden darse en térm in o s del n ú m ero de asesinos
p o r 100 000 h ab itan tes.
Las cuotas de crecim iento constituyen o tro tip o co rrien te de
razón. Al calcu lar u n a de estas cuotas, tom am os el crecim iento
efectivo d u ra n te el perio d o considerado, dividido e n tre el volum en
al principio del periodo. Así, p o r ejem plo, si la población de una
ciu d ad au m en ta de 50 000 a 65 000 e n tre 1940 y 1950, la cuota de
crecim iento d u ra n te el decenio en cuestión s e rá de
65 000 - 50 000
---------- — ---------- = .30
50 000
o 30 p o r ciento. E n el caso de cuotas de crecim iento, es obvio
q ue los p o rc en tajes se p re s ta n bien m ás allá del 100 p o r ciento,
en ta n to que serán negativos si la ciu d ad h a experim entado un
descenso de población.

G losario

Porcentaje
Proporción
Tasa
Razón
E j e r c ic io s

1. Supóngase que se da el siguiente cuadro que m uestra la relación


entre la asistencia a la iglesia y el año de clase en una determinada
universidad:

Asistencia Año de clase


a la Total
iglesia 1er. Año 2ü Año Inferior Superior
Asistencia regular 83 71 82 59 295
Asistencia irregular 31 44 61 78 214
Total 114 115 143 137 509
a) ¿Cuál es el porcentaje de asistencia regular en el conjunto? Res­
puesta, 57.96 %.
b ) ¿Cuál es la razón de los estudiantes de primer año a los del año
superior?
c) E ntre los asistentes regulares, ¿cuál es la razón de los años infe­
riores a los superiores (de los 1? y 2? años a los años inferior y
superior)? Respuesta, 1.09 a 1.
d) ¿Cuál es la proporción de los asistentes irregulares entre los es­
tudiantes del año superior? ¿La proporción de estudiantes de año
superior entre los asistentes irregulares? Respuesta .364; .569.
e) ¿Hay relativamente más asistentes irregulares entre los estudian­
tes de 1* y 2° años que entre los de las clases inferior y superior?
Exprésense los resultados en porcentajes.,
f) Resúmanse los datos en varias proposiciones.
2. Al estudiar la relación entre la productividad industrial y el tipo
de líder de los grupos, un psicólogo social obtiene los siguientes datos,
que m uestran los niveles de productividad agrupados en tres tipos
distintos de dirección:

Grupos de tipo de líder del grupo


Productividad Total
Democrático Liberal Autoritario

Alta 37 36 13 86
Mediana 26 12 71 109
Baja 24 20 29 73
Total 87 68 113 268

a) ¿En qué dirección preferiría el lector calcular los porcentajes?


¿Por qué?
b ) Calcúlense los porcentajes y resúmanse los datos en forma breve.
c) ¿Cuál es la razón de los productores de nivel alto a los de nivel
bajo en cada uno de los grupos? En relación con estos datos par­
ticulares, ¿resumen las tres razones la situación de modo ade­
cuado? Expliqúese.

3. Si la razón de los blancos a los no blancos es de 8/5 en una deten


minada localidad, ¿cuál es la proporción de los no blancos? Supóngase
que la razón de los blancos a los negros fuera de 8/5, ¿podría obte­
nerse la proporción de negros en la misma forma? ¿Por qué, o por
qué no?
4. Si una ciudad tenía una población de 153 468 habitantes en 1940
y de 176118 en 1950, ¿cuál fue la tasa de crecimiento (expresada en
porcentaje) entre 1940 y 1950? Respuesta, 14.76%.
5. Si en un determinado condado hay 12160 varones y 11913 mu­
jeres, ¿cuál es la razón entre los sexos (expresada en términos del
número de varones por 100 mujeres)?
B iblio g ra fía
1. Anderson, T. R. y M. Zelditch: A Basic Course in Statistics, 2* ed.,
Holt, Rinehart and Winston, Inc., Nueva York, 1968, pp. 24 a 31.
2. Freeman, L. C.: Elementary Applied Statistics, John Wiley & Sons,
Inc., Nueva York, 1965, cap. 4.
3. Hagood, M. J. y D. O. Price: Statistics for Soeiologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 7.
4. Weiss, R. S .: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 4.
5. Zeisel, H ans: Say I t w ith Figures, 5? edición, Harper and Row,
Publishers, Incorporated, Nueva York, 1968, caps. 1 y 2.
IV . ESCA LAS D E IN T E R V A L O : D IS T R IB U C IO N E S D E
F R E C U E N C IA Y R E P R E S E N T A C IÓ N GRÁFICA

E n e l p re se n te capítulo nos ocuparem os de m étodos p a ra el re ­


su m en de datos m uy p arecid o s a los del capítulo precedente.
V am os a ag ru p a r las escalas de intervalo en categorías, a o rd e n a r
éstas y a servirnos de dichos grupos p a ra d a r u n a visión con­
ju n ta de la d istrib u ción d e los casos. Al p ro c ed er en esta form a,
p odem os re d u c ir la in form ación relativ a a u n n ú m ero m uy gran­
de de casos a u n a fo rm a m uy sim ple, que p e rm ita al le c to r
re p re se n ta rse en q u é fo rm a están d istrib u id o s los casos. M ás
a d e la n te co m probarem os que ag rupando los datos podem os asi­
m ism o sim p lificar considerablem ente ciertos cálculos. E n los dos
cap ítu lo s siguientes nos ocuparem os de m étodos de resu m en de
dato s en fo rm a m ás com pacta, de m odo que p u ed an se r descri­
to s p o r varios n ú m eros expresando m edidas que re p re se n ta n
fo rm as típ icas y grado de hom ogeneidad.

IV .l. D istribuciones de frecuencia: agrupam iento de los datos


E n el cap ítu lo p reced en te nos hem os en c o n trad o con sólo pocas
decisiones im p o rtan tes, si h a h ab id o alguna, en relación con el
re su m e n de los datos. E sto se debe al h echo de que, presu m ib le­
m ente, las clases estab a n y a d eterm inadas y lo único que h abía
q ue h a c e r era c o n tar el nú m ero de casos en cada clase y luego
n o rm alizar en relación co n el n ú m ero de casos del espécim en
co n ju n to , calculando u n a proporción, u n p o rc e n ta je o u n a razón.
E n cam bio, si los datos de la escala de in terv alo h an de re su ­
m irse del m ism o m odo, hay que a d o p tar u n a decisión inicial en
relación con las categorías q u e se van a u tilizar. Ya que p o r lo
re g u la r los datos e sta rá n d istrib u id o s de m odo continuo, sin o con
p eq u eñ as lagunas, e n tre cifras contiguas, el esq u em a de clasifi­
cación p u ed e se r m uy a rb itra rio . S erá m en este r decidir cu án tas
categorías se van a u tiliza r y en dónde deban establecerse los

39.2 % 11.6% 36.3 % 26.3 % 37.1 % 15.3 % 27.3 % 23.5 % 13.3 %


28.1 263 27.1 35.1 23.0 26.1 31.0 36.3 27.3
22.8 33.4 25.6 21.6 46.8 7.1 16.8 26.9 46.6
44.3 58.1 33.1 13.4 27.8 33.4 22.1 42.7 33.0
36.3 20.7 9.3 26.3 29.9 39.4 5.3 24.3 17.8
18.2 37.1 21.6 17.5 12.3 23.6 37.2 37.1 25.1
27.1 28.8 27.8 33.6 26.5 28.3 26,9 24.8 41.0
33.6 19.3 43.7 28.2 19.9 83.6 47.1 4.8 9.7
39.5 32.3 22.4 15.1 26.3 26.1 29.2 14.3 14.6
21.6 37.9 37.1 24.9 10.0 20.7 11.8 22.9 36.0
46.1 21.5 13.3
53
pu ntos de intersección. In fo rtu n ad am en te, no- existen reglas sim ­
ples p a ra h acer esto, ya que la decisión depende de los objetivos
perseguidos p o r m edio de la clasificación. Sirvám onos, p a ra ilus­
tr a r el carác te r del problem a, de u n ejem plo sencillo. Supóngase
que los núm eros indicados al final de la página a n te rio r re p re­
sen tan el p o rc en taje de electores elegibles que vo tan en la elec­
ción de u n consejo escolar, en 93 colegios electorales de u n a de­
term in ad a ciudad.
Los datos b ru to s p resentados en esta fo rm a n o sirven p rá cti­
cam ente de n ad a en cu an to a p ro p o rcio n ar al lecto r u n a idea cla­
ra de lo que está sucediendo. Y esto es ta n to m ás así cuanto
m ayor sea el n ú m ero de los casos. Supóngase que deseáram os
co m p arar dicha localidad con o tra en relación con la p articip a­
ción electoral. Una rá p id a o jead a echada a los datos indica que la
m ayoría de los d istrito s tuvieron u n a participación de 20 a 40 %
y que h u b o u no con u n a cifra extrem adam ente alta.
R esulta sin em bargo realm ente difícil ob ten er u n a id ea clara de
la distribución total.
N ú m ero y m a gnitud de los intervalos. Con o b jeto de represen­
tarn o s dicha d istribución total, será ú til clasificar las cifras ve­
cinas en u n a m ism a categoría. Sin em bargo, nos encontram os
en seguida con un problem a. ¿De cuántos intervalos habrem os
de servirnos al a g ru p ar los datos? ¿Cuál ha de se r su extensión?
P o r lo pro n to , no tiene o b jeto em plear intervalos de am plitud
o lím ites peculiares. Así, pues, escogerem os m ás bien intervalos
de am plitud 5, 10 o 20 que u n o de am plitud 4.16, pongam os p o r
caso. Y tam bién nu estro s puntos term inales, o lím ites de clase
com o se los suele llam ar, serán p o r lo regular núm eros redondos,
tales com o 5.0 o 10.0. Si tenem os duda acerca de los intervalos
de los que h ab rem os de servirnos definitivam ente es preferible
clasificar las cifras sirviéndonos de u n nú m ero m ayor de in ter­
valos relativam ente pequeños. La razón de ello es obvia: si nos
servim os de intervalos pequeños, siem pre podem os agrupar, in­
m ediatam ente, los casos en intervalos m ayores. E n ta n to que si
em pezáram os con u n pequeño nú m ero de intervalos grandes, no
podem os luego subdividirlos, com o no sea rehaciendo todos los
cálculos. P o r lo tan to , nos decidirem os probablem ente a clasifi­
ca r los datos en intervalos de am p litu d 5 p o r ciento, com o en el
cuadro IV .l.
Y si exam inam os ah o ra las frecuencias en cada categoría, ve­
m os que la im agen que p re sen tan es relativam ente angulosa e
irreg u lar. Podem os probablem ente explicarnos las variaciones
en tre categorías contiguas en térm inos de fluctuaciones casuales.
Si hub iera hab ido m ás casos, habríam os podido c o n tar con u n a
distribución m ás suavizada. El razonam iento que se halla a la
base de este ju icio intuitivo se d estacará m ás claram en te en ca­
pítulos u lterio res. B aste de m om ento decir que em píricam ente
Cuadro IV .1. D istribución de la frecuencia, con datos agrupados
en intervalos de 5 por ciento

Intervalo Frecuencia, f Intervalo Frecuencia, f

0.0-- 4.9 1 45.0 - -49.9 4


5.0-- 9.9 4 50.0--54.9 0
10.0--14.9 9 55.0--59.9 1
15.0--19.9 8 60.0--64.9 0
20.0--24.9 16 65.0 - -69.9 0
25.0--29.9 23 70.0--74.9 0
30.0--34.9 8 75.0--79.9 0
35.0--39.9 14 80.0--84.9 1
40.0--44.9 4 —
93

siem p re p arece o c u rrir así. S in em bargo, dado n u estro N d e 93


d istrito s, lo m e jo r que podem os h a c e r p a ra o b ten er u n a d istri­
bu ció n de aspecto m ás re g u la r es servirnos de u n nú m ero m en o r
de in terv alo s m ás am plios. S irviéndonos de intervalos de 10 en
10, obtenem os el cu ad ro IV.2.

C uadro IV .2. D istribución de la frecuencia, con datos agrupados


en intervalos de 10 por ciento

Intervalo Frecuencia, f

0.0— 9.9 5
10.0— 19.9 17
20.0 — 29.9 39
30.0 — 39.9 22
40.0 — 49.9 8
50.0 — 59.9 1
60.0 — 69.9 0
70.0 — 79.9 0
80.0 — 89.9 1
93

Si hu b iéram o s em pleado intervalos m ayores todavía, digam os,


p o r ejem plo, de 20, el c u a d ro se p re se n ta ría com o el cuadro IV.3.
Aquí em pezam os a o scu recer ya la m ayor p a rte de n u e stra in­
fo rm ación inicial. E n efecto, sabem os sólo que aproxim adam en­
te las dos terceras p a rte s de los casos se sitú an e n tre 20.0 y 39.9,
p ero viendo los datos en esta form a, no podem os decir m ucho
acerca de dónde se sitú e el grueso de los casos al in te rio r de ese
C uadro IV.3. D istribución de las f recuencias con datos agrupados
en intervalos de 20 por ciento

Intervalo Frecuencia, f
0.0 — 19.9 22
20.0 — 39.9 61
40.0 — 59.9 9
60.0 — 79.9 0
80.0 — 99.9 1
93

in terv alo realm ente m uy grande. E n resum en, hem os de encon­


tr a r u na fo rm a a m odo de servirnos de gran nú m ero de in­
tervalos de m odo que la visión n o re su lte dem asiado detallada
o irregular, n i servirnos de ta n pocos que se p ierd a dem asiada
inform ación. Y dicho sea de paso, observam os que, al resu m ir
los datos de la escala de intervalo, se pierde prácticam ente siem ­
pre algo de inform ación im portante. E n ta n to que, p o r o tra p a r­
te, incluir to d a la inform ación conduce a p re se n ta r ta n to detalle,
que la visión re su lta m ás bien oscurecida que aclarada.
Pese a que se h an indicado fórm ulas m atem áticas que pueden
serv ir de guía p o r lo que se refiere al nú m ero de intervalos a
utilizar, esas fórm ulas dan a m enudo la im presión de exactitud,
en tan to que la m e jo r decisión se b a sa rá norm alm ente en el sen­
tid o com ún y en el o b jeto a que se destine la tab la de frecuencia.
In d ep endientem ente del n ú m ero de casos o de la reg u larid ad de
la línea, lo m ás p ru d e n te consiste en seguir la regla práctica
de que el in terv alo n o debería ser m ayor que la m ag n itu d de di­
ferencia e n tre valores que pueden ignorarse sin perjuicio. Una
diferencia de $ 5 e n tre precios de casas, p o r ejem plo, es insignifi­
cante, en ta n to que no es así si se tra ta de los precios de cam isas.
P o r consiguiente, el intervalo d eberá com prender los casos cuyos
valores pu ed an considerarse p a ra fines prácticos com o sem e­
jantes.
Los datos indicados m ás a rrib a p resen tan o tro problem a. ¿Qué
p asa con el único colegio que o sten ta u n a participación del 83.6
p o r ciento a la vista? Si nos servim os de intervalos de u n a am ­
p litu d de 10, varias clases quedan vacías, con dicho único colegio
abandonado, p o r así decir, a sí m ism o. Sin duda, esto es lo que
hay que h acer, si es que los datos h an de resu m irse cuidadosa­
m ente. Dicho colegio es efectivam ente único. P or o tra p arte , en
d eterm inadas circunstancias puede se r conveniente ab rev iar la
tabla. Si los p o rcentajes fu eran bien m ás allá de 100 y si hubiera
varios extrem os que se extendieran p o r sobre de 10 o m ás in ter­
valos, nos en frentaríam os a u n a decisión m ás difícil todavía. E n
tal caso, en efecto, se p re se n ta n varias alternativas. P rim ero,
podem os serv im o s de intervalos de am p litu d es diversas, p erm i­
tien d o que los intervalos extrem os sean m u ch o m ás grandes que
los otro s. Así, p o r ejem plo, podríam os serv im o s de u n solo in­
terv alo de 50.0 a 89.9, lo que com prendería las dos m arcas m ayo­
res. P o r supuesto, al p ro c ed er en esta fo rm a perdem os in fo rm a­
ción, ya que ah o ra tenem os u n a indicación m ucho m enos precisa
de las cifras correspondientes a los dos casos extrem os.
E n segundo lugar, podríam os servim os de u n intervalo abierto
p a ra co m p ren d er los casos extrem os. La ú ltim a categoría po d ría
leerse en tal caso com o "50 p o r ciento o m ás". Aquí, sin em ­
bargo, perdem os todavía m ás inform ación que an teriorm ente,
au n q u e sabem os que en este ejem plo concreto los po rcen tajes no
pued en ir m ás allá de 100. P ero si los datos se re firiera n a ingre­
sos y que el últim o in terv alo fu e ra de "$ 20 m il o m á s”, el lector
n o te n d ría en ab so luto m an era alguna de adivinar, sobre la b ase
de la sola tabla, cuáles pu d iero n h a b e r sido los ingresos m ás
altos. Conviene observar, con todo, que e n d eterm inadas circuns­
tancias pued e no re v estir im p o rtan cia alguna sa b e r cuáles sean
esos ingresos m ás altos. E n ta l caso, las sim plificaciones in tro ­
ducidas m ed ian te el em pleo de intervalos ab ierto s pu ed en com ­
p e n sa r con v en taja los inconvenientes. Con distribuciones que
p re se n ta n xm nú m ero red u cid o de casos m uy extrem os, p u ed e no
darse altern ativ a satisfac to ria alguna. Si alguien desea, p o r ejem ­
plo, in d icar los ingresos de los ciudadanos m ás ricos sin desfigu­
r a r su tab la, le re su lta rá m ás fácil hacerlo e n el tex to de su
exposición. Como lo verem os en capítulos sucesivos, no debieran
em p learse in tervalos abiertos si el objetivo p rim ero de la ag ru ­
pación de los datos consiste en sim plificar los cálculos y n o en
exponer aquéllos de m odo significativo.
L ím ite s verdaderos. El lecto r h a b rá observado que, al indicar
los intervalos, los lím ites de las clases se h a n establecido de tal
m odo que éstas no se en tre co rten . De hecho, existe u n pequeño
vacío e n tre u n a y o tra . Los lím ites suelen p o r lo regular fija rse
en esta fo rm a p a ra ev itar to d a am bigüedad fre n te al lector. E n
efecto, si se h u b iera fijad o com o de 10 a 20, de 20 a 30, etcétera,
se h a b ría p lan tead o la cuestión de qué hacem os con u n a m arca
de 20 exactam ente. E n realidad, siem pre h a b rá am bigüedad, cual­
q u ie ra q u e sea la fo rm a e n q u e se fijen los intervalos, com o p o ­
dem os ap reciarlo al p re g u n ta rn o s ah o ra qué h a b rá que h ac er con
un caso q ue se sitúe e n tre 19.9 y 20. O bservam os, p o r supuesto,
q ue no hay tales casos, p e ro u n poco de reflexión nos convencerá
de q ue esto es debido al hecho de que los datos se h an redon­
deado a la décim a del p o rc en taje m ás próxim o. P or lo tan to ,
hem os d e co n testa r a la siguiente cuestión: "¿cuáles casos corres­
ponden en realid ad a un intervalo determ inado, puesto que los
datos se h a n red ondeado?” V em os in m ed iatam en te que los ver­
daderos lím ites d e las clases n o son los m ism os que los que se
h a n fijado. Si hu biéram os seguido las reglas convencionales del
redondeo, u n colegio con u n a particip ació n ligeram ente superior
a 19.95 se h a b ría redondeado en 20.0, situ án d o lo en el intervalo
de 20.0 a 29.9. Y si el p o rc en taje h u b ie ra quedado p o r deb ajo de
19.95, p o r poco que así fuera, lo habríam os red o n d ead o en 19.9,
colocando el colegio en cuestión en la categoría inm ediatam ente
in ferio r. P o r lo tan to , los verdaderos lím ites efectivam ente em ­
pleados son los sig u ien tes:

d e -0 .0 5 a 9.95
de 9.95 a 19.95
de 19.95 a 29.95
etcétera.

Vemos que, al servim os de los verdaderos lím ites, cada in ter­


valo tien e u n a am p litu d exactam ente de 10.0 (m ás bien que de 9.9)
y que el lím ite su p erio r de u n intervalo coincide exactam ente con
el lím ite in ferio r del siguiente.1 Si la m arc a h u b ie ra sido exacta­
m en te de 9.95000, h ab ríam o s seguido el p rocedim iento conven­
cional red o n d ean do hacia arrib a, ya que el n ú m ero dígito que
preced e al ú ltim o cinco es im par.2 Podem os, pues, asig n ar a cada
caso, de m odo inequívoco, su in terv alo propio. O bsérvese que si
el red o n d eo se h a operado h ac ia la cifra próxim a, com o suele
se r el caso, el v erd ad ero lím ite co m p o rta rá siem pre la separa­
ción de la diferencia e n tre los lím ites fijados de dos intervalos
contiguos. Así, p o r ejem plo, si p artim o s la d iferencia e n tre 19.9
y 20.0, obtenem os 19.95. La convención consiste e n in d icar las
cifras de ta l m odo que se exprese el grado de ex actitu d de la
m edición, o sea que 10.45 indica u n a ex actitu d a dos lugares deci­
m ales, 10.450 a tre s y 10.4 a uno. Dicho grado de ex actitu d debe
ind icarse siem pre, d e m odo que el le c to r p u ed a averiguar los
lím ites v erdaderos si desea servirse d e ellos en sus cálculos. Así,
p o r ejem plo, si se indica que los lím ites son respectivam ente 10.00
a 19.99, sabem os que la m edición es exacta h a s ta dos decim ales,
que el red o n d eo se h a operado a la próxim a centésim a d e -----
100
del 1 p o r ciento, y que, en consecuencia, los v erdaderos lím ites
van de 9.995 a 19.995. Si los lím ites se h u b iera n indicado com o
1 Si el límite más bajo es cero y que los valores no pueden ser negativos
(como en el caso de los porcentajes), consideramos de todos modos que to­
dos los intervalos son de la misma amplitud, imaginando que el límite in­
ferior del primer intervalo es en realidad —.05 y que las marcas se han re­
dondeado en 0.00.
2 Obsérvese que en el caso de los intervalos de los que nos hemos servido
habría una desviación muy ligera, ya que los casos que quedan exactamente
entre intervalos se situarán siempre en la categoría superior. En la mayoría
de los casos prácticos dicha desviación puede ignorarse.
10 a 19, entonces los verdaderos lím ites h ab ría n sido, p o r su­
puesto, 9.5 a 19.5.
E n unos pocos casos, como, p o r ejem plo, el de la edad en re la ­
ción con el ú ltim o aniversario, los datos pueden n o hab erse
red o n d ead o en la fo rm a convencional. S in em bargo, si nos pregun­
tam os a cuál intervalo corresponda u n caso determ inado, la re s­
p u esta h a b ría de ser siem pre clara. Como q u iera que, en efecto,
u n a p erso n a que vaya a cu m p lir 20 años m añ an a cuenta hoy 19,
es obvio que el intervalo fijad o com o de 15 a 19 tiene com o ver­
daderos lím ites los valores 15 y 20. Pese a que p u ed a p arece r que
andam os con sutilezas al distinguir e n tre los lím ites indicados
y los lím ites verdaderos, verem os, sin em bargo, en los capítulos
sucesivos q ue estos últim os h a n de utilizarse en los cálculos, au n ­
que p o r lo reg u lar n o se indiquen explícitam ente al p re sen tarse
los dato s en form a de d istribución de frecuencia.
D atos discretos y continuos. Los datos de los que nos hem os
servido son continuos, en el sentido de que cualquier valor h u ­
b iera p odido obtenerse teóricam ente p a ra u n porcentaje, a con­
dición que la ex actitud de m edición fu e ra lo suficientem ente p re­
cisa y q ue los intervalos fu e ran m uy grandes. Así, p o r ejem plo,
el v alo r de 17.4531 p o r ciento es ta n posible com o el de 17.0000
p o r ciento. Algunos otros tipos de datos son discretos, ya que no
todos los valores son posibles. E n efecto, u n a m u je r puede ten er
ex actam ente 0, 1, 2 o inclusive 17 niños, p ero no puede te n e r 2.31
niños. El ingreso y el volum en de u n a ciudad son variables teó­
ricam en te discretas, y a que n o es posible te n e r u n ingreso de
$ 3 219.5618, o que u n a ciudad tenga u n a población de 43 635.7 h a ­
b itan tes. Debido a las lim itaciones de to d o in stru m en to de m e­
dición y a la necesidad subsiguiente de h ab e r de red o n d ear en u n
p u n to u o tro, los datos em píricos vienen siem pre en fo rm a dis­
c re ta ; p ero en m uchos casos podem os p o r lo m enos concebir u n a
distrib u ció n continua susceptible de alcanzarse con un in stru ­
m en to de m edición perfecto. Como lo verem os en el capítulo
relativ o a la curva n orm al, los m atem áticos h an de d esa rro llar
a m en u d o distribuciones teóricas que ad o p tan u n a variable con­
tinua.
E n algunos casos, com o los del ingreso o n ú m ero de h ab itan tes
de u n a ciudad, n o re su lta dem asiado difícil concebir los datos
com o continuos, aunque se tra te en realidad de unidades m uy pe­
queñas (centavos, p erso n as) que no se d ejan subdividir. Pero,
¿qué o cu rre con el n ú m ero de niños en u n a fam ilia? Aquí p a re ­
ceríam os v io len tar excesivam ente los hechos si adm itiéram os
continuidad. Al p re s e n ta r los datos en u n a distribución de fre­
cuencia no se nos o cu rrirá, p o r supuesto, servim os de intervalos
que vayan de 0.5 a 2.4 o de 2.5 a 4.4 niños. E m plearem os senci­
llam en te intervalos com o de 0 a 2, de 3 a 4, etcétera, y no h ab rá
am bigüedad alguna p o r lo que se refiere a los huecos e n tre aqué-
líos. E n algunos cálculos, sin em bargo, se rá necesario, p o r razo ­
nes p ragm áticas, tr a ta r los casos com o continuos y d isp o n er m a r­
cas discretas en in tervalos pequeños. E n efecto, p o r ra ro que se
n o s p u ed a a n to ja r, podem os n ec esitar c o n sid erar a las m adres
con u n h ijo com o e n u n in terv alo d e 0.5 a 1.5 niños. P a ra la m a­
y o ría de los o b jeto s obtendrem os lo s m ism os re su ltad o s que
o b ten d ríam o s m an teniendo los datos en fo rm a discreta. Con el
fin de ad a p ta rse a los m odelos establecidos p o r los m atem áticos,
en este y otro s casos será necesario h a lla r u n com prom iso con la
realidad. A condición de que nos dem os p erfec ta cu en ta de lo que
estam os haciendo, n o re s u lta rá de ello confusión alguna o sólo
m uy poca.

IV.2. D istribuciones de frecuencia cum ulativa


P a ra algunos o b jeto s es conveniente p re se n ta r los d ato s e n u n a
fo rm a algo d istin ta. E n lugar de in d icar el n ú m ero d e casos en
cad a intervalo, podem os in d icar el n ú m ero de m arc as que son
m enores (o m ay o res) que xm v alor determ inado. E n el caso de
los intervalos de los que nos hem os estad o sirviendo, n o hay, p o r
supuesto, colegios electorales con u n a p articip ació n de votantes
in ferio r a cero, hay cinco con m enos del 9.95 p o r ciento, 22 con
m enos del 19.95 p o r ciento, y los 93 ju n to s tienen u n a p artic ip a­
ción in ferio r al 89.95 p o r ciento. Así, pues, podem os p re se n ta r
los datos en fo rm a acum ulada, ta l com o se indica en el cuadro
IV.4. O bsérvese que podem os acu m u lar lo m ism o h acia a rrib a
que h a d a a b a jo p re g u n ta n d o cuántos casos están p o r encim a de
u n valor d eterm inado. Las frecuencias cximulativas su elen indi­
carse p o r lo re g u la r con u n a F m ayúscula, en lu g ar de la mi-

Cuadro IV.4. D istribución de frecuencia cum ulativa

Acumulación hacia arriba Acumulación h ada abajo


Número de Frecuencia Número de Frecuencia
casos por acumulada, Por ciento casos por acumulada, Por ciento
debajo de F encima de F
0.0 0 0.0 0.0 93 100.0
9.95 5 5.4 9.95 88 94.6
19.95 22 23.7 19.95 71 76.3
29.95 61 65.6 29.95 32 34.4
39.95 83 89.2 39.95 10 10.8
49.95 91 97.8 49.95 2 2.2
59.95 92 98.9 59.95 1 1.1
69.95 92 98.9 69.95 1 1.1
79.95 92 98.9 79.95 1 1.1
89.95 93 100.0 89.95 0 0.0
núscula. Si querem os, podem os convertir las frecuencias efecti­
vas en p o rcen tajes. T endrem os ocasión de servim os d e las
distrib u cio n es cum ulativas en el capítulo v al calcular las m edia­
nas, así com o m ás ad elan te en el capítulo xiv.

IV.3. P resentación gráfica: histogram as, polígonos de frecuencia


y ojivas
H ay p erso n as que sienten re p aro en in te rp re ta r los cuadros y
que ca p ta n m e jo r los m ateriales presen tad o s en fo rm a gráfica

%
-43.0

-32.3

-21.5

-10.8

0 10 20 30 40 50 60 70 80 90 100
F ig . IV .l. H istogram a de intervalos iguales.

o visual. U no de los m odos m ás sencillos y útiles de p re se n ta r


los dato s de tal m an era que las diferencias e n tre las frecuencias
se d estaq u en fácilm ente consiste en servirse de figuras de áreas
o a ltu ra s p roporcionales a las frecuencias en cada categoría.
Puede, p o r ejem plo, u tilizarse u n a b a r ra p a ra re p re se n ta r cada
categoría, ind icando la a ltu ra de la m ism a s u m ag n itu d relativa.
Si la escala es nom inal, la ordenación efectiva de las b a rra s no
rev iste im p o rtan cia. P o r lo que se refiere a las escalas ordinales
y de in terv alo , las b a rra s pueden disponerse en s u p ro p io orden,
con lo q ue d an u n a b u en a indicación visual de la distribución
de la frecuencia. La fig u ra re su lta n te se llam a histogram a. La
frecu en cia ab so lu ta o la p roporción de los casos pueden indi­
ca rse a lo larg o de la ordenada, com o en la fig u ra IV .l.
H ay que o b serv ar que si las alturas de las b a rra s se tom an
com o p roporcionales a las frecuencias en cada intervalo de clase,
el c u a d ro visual puede re s u lta r confuso, a m enos q u e todos los
in terv alo s sean cerrados y d e am p litu d igual. Supóngase, p o r
ejem plo, q u e u n o de los intervalos cen trales h u b iera sido de
an cho 20 e n lu g ar de 10. E n co n traríam o s en consecuencia un
m ay o r n ú m ero de casos en el intervalo, y el re su lta d o sería
com o e n la fig u ra IV.2. Es obvio que si deseam os o b ten er un
h isto g ram a que re p resen te los datos en form a m ás adecuada,
debiéram os d a r a la b a rra la m ita d solam ente del alto, ya que he-

t %
40 -43.0

30 -32.3

20 -21.5

10 -10.8

0 --- --- --------1


t____i—
— ..... ,
—■■ -- ■
.
0 10 20 30 40 50 60 70 80 90 100
Fig. IV.2. H istogram a de intervalos desiguales y alturas
proporcionales a las frecuencias.
m os doblado el ancho y, en prom edio, hem os incluido u n doble
n ú m ero de casos en el intervalo m ay o r d e lo q u e sería el caso
en uno u o tro de los dos intervalos de tam añ o norm al. E sto nos
d aría u n h isto g ram a (véase figura IV.3) m ucho m ás sem ejante al

%
-43.0

-323

-21.5

-10.8

.... i ________ _ , _________1 j


0 10 20 30 40 50 60 70 80 90 100
Fig. IV.3. H istogram a d e intervalos desiguales y áreas
proporcionales a las frecuencias.
o btenido inicialm ente. Una breve reflexión nos convencerá de
que si hem os de p e n sa r en térm inos de áreas m ás que en altu ­
ras, podrem os m an ip u lar m ás fácilm ente los datos que com por­
tan intervalos desiguales. E n o tro s térm in o s: dejam os que las
áreas de los rectángulos sean proporcionales al n ú m ero de los
casos. E n el caso especial im p o rtan te en que todos los in terv a­
los sean de ancho igual, las altu ra s serán tam bién, p o r supuesto,
prop o rcio n ales a las frecuencias. Si el ancho de cada rectángulo
se to m a com o u n id ad y si las altu ra s se re p resen ta n com o p ro ­

f %
dnLdxn

1 i- i___ i________ u-« i


0 10 20 30 40 50 60 70 80 90 100
F ig . I V .4. Polígono de frecuencia.

porciones, entonces el á re a to ta l com prendida en el histo g ram a


será la un id ad . Así, p o r ejem p lo :

1(5/93) + 1(17/93) + 1(39/93) + .......... + 1(1/93) = 1

Al e stu d ia r la curva n o rm al en el capítulo v n , verem os que es


necesario' tr a ta r con áreas, antes que con a ltu ra s, y será conve­
n ien te to m a r el área to ta l b a jo el histo g ram a com o unidad.
O tro m odo m uy p arecid o de p re se n ta r g ráficam ente u n a dis­
trib u ció n de frecuencia es el del polígono de frecuencia. P ara
ob ten erlo , u nim os sim plem ente los p u n to s m edios de los lados
su p erio res de cada rectángulo p o r m edio de re ctas y b o rram o s
luego los rectángulos, com o e n la fig u ra IV.4. O bsérvese q u e los
p u n to s extrem os del polígono de frecuencia se h a n colocado so­
b re la lín ea b ase (e je h o rizo n ta l) en los p u n to s m edios de los
intervalos a uno y o tro lad o de los dos intervalos de los extre­
m os. N o rm alm en te n o nos serviríam os de los dos tipos de figu­
ras, p ero, su p erp oniendo el polígono de frecuencia sobre el h isto ­
gram a, vem os que el á re a delim itada p o r las dos figuras h a de
ser igual. E sto es así p o rq u e p o r to d o trián g u lo que queda al
in te rio r del polígono de frecuencia, p ero ex terio rm en te al h isto ­
gram a, hay u n trián g u lo idéntico debajo del histogram a, p ero
fu e ra del polígono d e frecuencia. Así, pues, podem os tam bién
co n sid erar com o u n id ad el á re a delim itada p o r dicho polígono.
Obsérvese, sin em bargo, q u e n o hem os hecho m ás q u e conectar
p o r m edio de re ctas cierto n ú m ero de puntos. Los puntos m is­
m os pu ed en re p re s e n ta r el n ú m ero de casos en cad a intervalo,
p ero hem os de guardarnos de in fe rir que hay cierto nú m ero de
casos en cu alq u ier o tro p u n to a lo largo del trazo continuo. Así,
p o r ejem plo, no hem os d e in fe rir que hay aproxim adam ente 28
casos con m arcas de 20 exactam ente.
Los polígonos de frecuencia pueden em plearse asim ism o p ara
re p re se n ta r d istribuciones de frecuencia cum ulativa. La figura

F %
93.00 -100 , , ' , -

69.75 -75 -------------,

46.50 -50 /

23.25 -25 /

0, —-"i i i
0 10 20 30 40 50 60 70 80 90 100
Fig. IV.5. Ojiva que representa una distribución d e frecuencia
acum ulativa.

q ue en ta l caso re su lta se designa com o ojiva. A lo largo de la


o rd en ad a o eje Y podem os in d icar frecuencias o porcentajes. Co­
locam os, en cam bio, las m arcas de la variable de escala de in­
tervalo a lo larg o del e je de las X (a b scisa), lo m ism o que
an terio rm en te, e n el b ien en tendido de que las frecuencias re­
p resen tad as in dican el n ú m ero d e casos de valor inferior al eje
de la X . P o r ejem plo, en la fig u ra IV.5 vem os q u e aproxim ada­
m en te el 75 % de las m arc as son m enores que 34. P or lo tanto,
las ojivas se pueden u s a r com o u n m étodo gráfico de determ i­
n a r el n ú m ero de casos p o r encim a o p o r deb ajo de u n cierto
valor. E s obvio que la fo rm a d e la ojiva h a b rá de se r siem pre
o creciente o decreciente según que se acum ule hacia a rrib a o
h acia ab ajo . La curva será, e n cam bio, horizontal e n los in te r­
valos vacíos. Si la distrib u ció n de frecuencia es del tip o de nues­
tro s datos anterio res, con el nú m ero m ayor de casos en los in te r­
valos que quedan cerca del cen tro de la distribución, la ojiva
te n d rá fo rm a de S, con la inclinación m ás rá p id a a proxim idad
de los in tervalos que contienen el m ayor nú m ero de casos.
Glosario
Datos continuos y datos discretos
Distribución cumulativa
Distribución de frecuencia
Polígono de frecuencia
Histograma
Ojiva
Límites verdaderos

E j e r c ic io s

1. Supóngase que las cifras a continuación representan los ingresos


anuales de un grupo de residentes de una localidad:

$ 2 760 $3 850 $ 3 340 $ 3 890 $ 2 860


4340 4 360 4350 11740 4 350
5210 2140 2610 3 560 7 310
3410 3330 8190 2740 3 550
4570 7 810 4250 7110 4210
9300 5 340 3 460 10300 5 490
3 320 2 970 19310 4440 2110
1790 4140 2 670 3 370 23 400
4560 3 000 3 100 5170 3 760
3 800 1610 5130 3160 4170
13 460 4 570 1710 2 800 6170
5 210 1940 4320 3180 2 350
2 690 2 780 9 830 4 240 8 340

a) Constrúyase una distribución de frecuencia y una distribución


cumulativa.
b) ¿Cuáles son los verdaderos límites?
c) Trácese un histograma, un polígono de frecuencia y una ojiva.
2. En un examen de tipos de visita entre amigos íntimos y parien­
tes, 81 interrogados son invitados a indicar el número de los amigos
y parientes que visitan por lo menos una vez al mes. Los resultados
son los siguientes (las cifras indican el núm ero efectivo de personas
regularmente visitadas):

3 5 2 3 3 4 1 8 4
2 4 2 5 3 3 3 0 3
5 6 4 3 2 2 6 3 5
4 14 3 5 6 3 4 2 4
9 4 1 4 2 4 3 5 0
4 3 5 7 3 5 6 2 2
5 4 2 3 6 1 3 16 5
3 11 4 5 19 4 5 2 2
4 3 14 5 2 1 4 3 4

a) Constrúyase una distribución de frecuencia y una distribución


cumulativa.
b) Justifiqúese lo m ejor que se pueda la elección de los intervalos.
c) Trácese un histograma, un polígono de frecuencia y una ojiva.

3. Indíquense los límites verdaderos en cada uno de los siguientes


intervalos:
a) 1000 — 1900 c) 1.000— 1.999 (Respuesta,
2000 — 2 900 2.000 — 2.999 0.9995 — 1.9995)
b) 1000 — 1 999 d) .010— .019
2000 — 2 999 .020— .029
¿Qué se ha supuesto en cada uno de los casos a propósito del méto­
do de redondeo?

B ibliografía

1. Anderson, T. R. y M. Zelditch: A Basic Course in Statistics, 2- edv


Holt, Rinehart and Winston, Inc., Nueva York, 1968, cap. 4.
2. Downie, N. M. y R. W. H eath : Basic Statistical Methods, 2' ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 3.
3. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, caps. 4 y 5.
4. McCollough, C., y L. van A íta: Introduction to Descriptive Statis­
tics and Correlation, McGraw-Hill Book Company, Nueva York,
1965, cap. 1.
5. Mueller, J. H., K. Schuessler y H, L. Costner: Statistical Rea-
soning in Sociology, 2‘ ed. Houghton Mifflin Company, Boston,
1970, cap. 4.
6. Weiss, R. S .: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 5.
V i m o s que las escalas nom inales pueden resu m irse fácilm ente en
térm inos de porcen tajes, proporciones o razones, y que dichas
m edidas de resum en son fundam entalm ente intercam biables. En
o tro s térm in o s: b asta u n tipo determ inado de m edida p a ra des­
c rib ir los datos. E n el caso de las escalas de intervalo, a su vez,
vimos que los datos pueden describirse p o r m edio de u n a distri­
bución de frecuencia. Podem os servirnos tam bién de tipos dis­
tin to s de m edidas, siendo las m ás im p o rtan tes de ellas las de
tipism o o de tendencia central y las de heterogeneidad o dis­
persión. Verem os que existe en cada caso cierto núm ero de m e­
didas d istin tas e n tre las que podem os elegir, cada u n a de las
cuales reú n e propiedades, ventajas e inconvenientes aigo diferen­
tes. P o r lo tan to , el resu m en de las escalas de intervalo es algo
m enos directo que en el caso de las nom inales. E n el p resen te
capítulo nos ocupam os de las m edidas de tipism o, en ta n to que
en el siguiente exam inarem os las de dispersión. Tom ados ju n ­
tos, dichos dos tipos de m edidas re su ltarán norm alm ente ade­
cuados p a ra la descripción de los datos de escala de intervalo.
La idea que tiene el lego a p ropósito del térm in o prom edio pro­
pende a ser m ás bien vaga o am bigua. E n efecto, puede n o darse
cu en ta de que existen varias m edidas diversas del tipism o y que,
en d eterm inadas circunstancias, dichas m edidas dan resultados
m uy d istintos. El hecho de que sea posible o b ten er tales m edi­
das diferen tes de tendencia central supone que es necesario
co m p ren d er las v en tajas y los inconvenientes de cada u n a de
ellas. Im p o rta, pues, sab e r en cuáles circunstancias cada u n a
sea adecuada. ¿P o r qué la Oficina del Censo indica ingresos m e­
dianos y n o ingresos m edios? ¿T endría algún sentido in d icar al
lego que la fam ilia "m ed ia” tiene 2.3 hijos y vive en u n a casa de
4.8 cu arto s? ¿E n cuáles circunstancias es de poca im portancia
la m ed id a que se em plee? É stas son algunas de las num erosas
cuestiones que p o d rían p lan tearse acerca del tip o de prom edio
que hem os de calcular.

V .l. La m edia aritm ética


H ay dos m edidas im p o rtan tes de tendencia cen tral em pleadas en
la investigación sociológica: la m edia aritm ética (designada a
continuación sim plem ente com o m e d ia ) y la m ediana. La m edia
es con m ucho la m ás com ún de las dos y se define com o la sum a
de las m arcas dividida p o r el núm ero to tal de los casos com pren­
didos. P a ra in d icar la m edia se utiliza p o r convención el sím bolo
67
X, au n q u e a veces se em plee tam b ién la le tra M. P o r lo tanto,
la fó rm u la de la m ed ia aritm é tic a es la sig u ie n te :
N
2 X'
—■ X-± -V*X%“1"..........
x = — ------- — ----------------- — = ------------- ' ( V .l )
N N

en la que X x re p re se n ta la p u n tu ació n del p rim e r individuo, X 2


la del segundo, y X t la del individuo general.1 Si no existe am bi­
güedad, podem os p re sc in d ir de los subíndices y e sc rib ir sim ple­
m en te

- 2X
X = -------
M

en donde se en tien d e que to d as las cantidades se sum an.


La m ed ia posee la p ro p ied a d algebraica de que la sum a de las
desviaciones de cada m arc a con re sp ecto a la m ed ia será siem ­
p re cero. S im bólicam ente esto pu ed e exp resarse m ed ian te la
ecuación sig u ien te:

2 (X «-X ) = 0
«=*i

E ste hecho n o h a de so rp re n d e r en absoluto si tenem os e n cuen­


ta la definición de la m edia. La p ru e b a es sencilla. Como quiera
que tenem os u n a sum a de n ú m ero s cada u n o de los cuales, es
en realidad, u n a diferencia, podem os descom poner la expresión
in d icad a en la diferencia d e dos sum as. E n la siguiente fo rm a :

y — » y _
2 (Xt - X ) = 2 Xt - 2 X
<=*1 1=1 i= 1

Pero, com o q u iera que X es u n a constante, ten em o s:


N
2 X*
& _ _ i=l N
.2 X = N X = N ------------ = 2 X*
í= i JV C i 1

y vem os in m ed iatam en te que la d iferencia es cero.


La p ro p ied ad m encionada p u ed e u tilizarse p a ra sim plificar el

1 Para el examen de la notación de adición véase el Apéndice I.


cálculo de la m edia. Supóngase, p o r ejem plo, que hem os de
calcu lar la m edia de los n úm eros 72, 81, 86, 69 y 57. S um ando
y dividiendo p o r cinco obtenem os u n a X — 73.0. Si sustraem os
ah o ra esta m edia de cad a u n a de las cifras y adicionam os los re ­
siduos, verificam os que la su m a re su lta n te es cero.

X X-73 X-70
72 - 1 2
81 8 11
86 13 16
69 - 4 - 1
57 -1 6 -1 3

0 15

Supóngase, en cam bio, que hubiéram os an ticip ad o u n a m edia


de 70 y la hu b iéram o s re sta d o de cada u n a de las cifras en cues­
tión. E ntonces la su m a re su lta n te n o es cero, sino que observa­
m os q ue cada u n a de las nuevas diferencias es m ayor en tre s
u n id ad es (e n dirección positiv a) que las diferencias originarias.
Vem os así q ue hem os an ticip ad o u n a m ed ia que es dem asiado
p eq u eñ a en tre s u n idades. Si añadim os a h o ra u n fa c to r de co­
rrecció n de tre s a la m edia anticipada, obtenem os la m edia correc­
ta. E n la p ráctica, sin em bargo, no co m p araríam o s los dos ju e ­
gos de diferencias e n esta form a, sino que, observando q u e la
su m a del segundo g ru p o de diferencias es de + 15 y sabiendo
q ue h ay cinco térm in os, e sto indica que en pro m ed io estábam os
de 15/5, o sea 3.0 u n idades, p o r deb ajo de la m ed ia verdadera.
Y com o pued e v erificarse fácilm ente, si h u b iéram o s anticipado
u n v alo r dem asiado alto, entonces la su m a de las diferencias
h a b ría sido negativa, y hubiéram os debido su stra e r de la m edia
an ticip ad a p a ra o b ten er la correcta. Si X' re p resen ta la m e­
dia anticip ad a, podem os estab lecer u n a fó rm u la de la m edia en
térm in o s d e la m edia su p u esta y de u n fa c to r de corrección:

1 ( X i - X ’)
X = X ’ + — ----------------- ( V.2)
N
o bien, en p a la b r a s :

la suma de desviaciones de ésta


La media verdadera = a la media supuesta + --------------------------------------------.
número de casos
Con o b jeto de verificar la corrección de esta fórm ula desarrolla­
m os la expresión de la derecha y o b te n e m o s:
N N _
S xt 2 X'
i=i i=i
X' + - •= X ' + -
iV JV Af
N
2 X*
t=i NX’
= X' + -
A? N
N
2 Xi
i= l
■= x
“ ÁT

Pese a que p u ed a p arece r que nos hayam os to m ad o m ucha


m olestia calculando X p o r rodeo en esta form a, este m étodo p er­
m ite sin em bargo ah o rra rse a m enudo u n a considerable cantidad
de tra b a jo cuando no se dispone de calculadoras de escritorio.
E l em pleo de u n a m edida an ticip ad a p erm ite p o r lo re g u lar re ­
d u cir la m ag n itud de los núm eros que h a n de adicionarse. En
efecto, cu an to m ás cerca quede la m edia su p u esta de la verda­
dera, ta n to m en ores serán en m agnitud las diferencias resu ltan ­
tes. E ste p rin cipio nos será p artic u la rm en te ú til cuando em pren­
dam os el cálculo de las m edias de datos agrupados.
O tra p ro p ied ad de la m edia puede fo rm u larse com o sigue: la
sum a de las desviaciones cuadradas d e cada cifra con respecto
a la m edia es m en o r que la sum a de las desviaciones cuadradas
con resp ecto a cualquier o tro núm ero. O en o tro s té rm in o s :

2 (Xi ~ X ) 2 = m ínim o.
i= l
* La p ru eb a de esta propiedad es m uy sencilla. C onsiderem os
las desviaciones de X t alrededor de cualquier o tro n ú m ero X ' que
previam ente hayam os tra ta d o com o m edia anticipada. S um ando
y re sta n d o la m edia real X de cada u n a de dichas expresiones
podrem os a n o ta r :

Xi - X ' = ( X í - X ) + ( X - X ' )

Elevando los dos térm inos al cu ad rad o obtenem os:

(X i - X' ) s = ( X t - X )2 + 2( Xi - X ) ( X - X ’) + ( X ~ X ’)2

R esum iendo p a ra todos los casos N o b te n d re m o s:


2 ( X i - X ') 2 ^ 2 ( X i - X p
í= i i= i

+ 2(X — X ') 2 ( X * - X ) + 2 ( X - X ' ) 2


í = i i= i

en do n d e h a sido posible esc rib ir la ca n tid a d 2(X — X ') fre n te al


signo d e su m ar en el segundo térm ino, ya q u e se tra ta de u n a
co n stan te. In m ed iatam en te verem os que to d o el segundo térm in o
N
debe s e r igual a cero, pues acabam os de m o s tra r que 2 ( X¿ —
_ i= l
X ) = 0. P o r o tra p a rte , el últim o térm in o co n sta de N térm inos,
to d o s iguales a (X — X ')2. T endrem os p o r ta n to

2 2 (X j — X )2 + N ( X — X ')2
i=i <=i

y así se co m prueba que la sum a de las desviaciones a lre d ed o r de


X ' al cu a d rad o es igual a la su m a de las desviaciones alred ed o r
de la m ed ia verd adera, al cuadrado, m ás u n té rm in o al cuadrado
que n u n ca pu ed e s e r negativo.
C uanto m ás g ran d e sea la diferencia e n tre X ' y X, ta n to m ayor
será el segundo térm in o situ ad o a la derecha.
T endrem os frecuentes ocasiones p a ra u tiliza r e sta p ro p ied ad
¡v _
de los cu ad rad o s de la m edia, y la ca n tid a d 2 (X* — X )2 h a b rá de
t= i
a p a re c e r en g ran p a r te d e lo que sigue, com o u n a m edida de la
variación to ta l o heterogeneidad.

V.2. La m ediana
A m en u d o necesitam os localizar la posición del caso m edio cuan­
do los d ato s se h a n o rd e n ad o de m ay o r a m enor. O podem os
d iv id ir u n g rupo de estu d ian tes en p o rc en tajes localizando los in­
dividuos q ue tienen exactam ente el 10 p o r ciento de la clase que
q u ed a d eb ajo de ellos, ex actam ente el 32 p o r ciento d eb ajo de
ellos, etcétera. Las m ed id as de este tip o se designan a m enudo
com o m ed id a s de posición, ya que localizan la posición de algún
caso típ ico (o atípico) en relación con o tro s individuos. La m e­
d ian a es ta l vez la m ás im p o rta n te de estas m edidas de posición.
D efinim os la m ed ian a com o u n núm ero que posee la pro p ied ad
d e te n e r el m ism o n ú m ero de m arcas con valores m enores que
las que h ay de valores m aypres. La m ed ian a divide h ab itu alm en ­
te el to ta l de los datos en dos m itades. Si el n ú m ero de los ca­
sos es im p ar, la m ed ian a será sim plem ente la m arca del caso
del m edio. Si N es p ar, no h a b rá caso cen tral y, de hecho, cual­
q u ier n úm ero e n tre los valores de los dos casos centrales ten d rá
la p ro piedad de dividir las m arcas e n dos grupos iguales. Así,
pues, si N es p ar, la m ediana queda definida am biguam ente. Por
convención tom am os entonces com o valor único de la m ediana
la m edia aritm ética de los dos datos centrales.
Si tuviéram os los núm eros 72, 81, 86, 69 y 57, la m ediana sería
72 (e n ta n to que la m edia es 73). Si h u b iera u n sexto térm ino,
digam os, p o r ejem plo, 55, las dos m arcas centrales serían 69 y 72,
y tom aríam os com o m ediana (69 + 72)/2, o sea 70.5. Si se da el
caso de que los dos casos centrales tengan la m ism a m arca,
la m ediana será, p o r supuesto, este m ism o dato. O bsérvese que
si N es im par, la m ediana será el dato (N + l) /2 . Si el núm ero
de los datos es p ar, la m ediana se en c o n trará en el ce n tro e n tre
el dato N /2 y el d ato (N + l)/2 . Así, p o r ejem plo, si N = 251, la
m ediana será el dato del caso centésim o vigésim o sexto, y si
N = 106, tom am os u n valor m edio e n tre las cifras de los casos
quincuagésim o terc ero y quincuagésim o cuarto. E stas fórm ulas
re su ltarán ú tiles p o r lo re g u lar cuando N sea relativam ente
grande.
Vimos que la m edia posee las propiedades sig u ien tes:

S (X í - X ) = 0
i= l
y
1 (X t —X )2 = m ínim o.
i=l
La razón de que la p rim e ra pro p ied ad se verifique es fundam en­
talm en te que, cuando se su strae la m edia de cada u n o de los
datos, las diferencias resu ltan tes son tales que las m arcas nega­
tivas se eq u ilib ran exactam ente con las positivas. P ero supóngase
que h ubiéram os prescindido p o r com pleto de los signos, consi­
deran d o to d as las diferencias com o positivas, ¿qué o c u rrirá en
este caso? P uede d em o strarse que si se h u b iera re sta d o la m e­
diana de cada u n a las m arcas prescindiendo del signo de las di­
ferencias y sum ando los residuos, se o b ten d ría u n a sum a m enor
que la cifra co m parable de cu alq u ier o tra m edida de tendencia
central. E n sím bolos esto se expresa a s í :
y
2 |Xi —M d | = m ínim o
<=i
en donde M d re p resen ta la m ediana y las b a rra s a am bos lados
de la expresión (X i — M d ) indican q u e hay que to m a r el valor
positivo (o "ab so lu to ” ) de cada diferencia. A unque esta p ro p ie­
d ad de la m ediana posea ta l vez algún interés, n o parece, sin em ­
bargo, te n e r aplicaciones directas de alguna significación socio­
lógica.

V.3. Cálculo de la m edia y la m ediana de datos agrupados


M étodo largo para el cálculo de la m edia. C uando el nú m ero de
datos se hace gran de y los cálculos se realizan a m ano, el com pu­
ta r la m ed ia o la m ediana puede re su lta r tedioso. La m ayoría
de los científicos sociales cu en tan con p rogram as de com putación
q ue resuelven estos y o tro s cálculos con facilidad. E n general
re su lta p referib le u tiliza r tales program as cuando así parece con­
veniente, pues así dism inuyen los riesgos de in c u rrir en e rro res
de com putación y redondeo, a la vez que se obtiene u n a econo­
m ía considerable e n tiem po y dinero. Debe, sin em bargo, conocer­
se el p rocedim iento p a ra co m p u tar varias m edidas sin re c u rrir
a tales pro g ram as, ya que con frecuencia re su lta inconvenien­
te d isp o n er los datos en fo rm a adecuada p a r a su m an ejo p o r
co m p u tad o ras rápidas. E n tales casos re su lta ú til a g ru p ar los da­
tos p o r categorías, com putando la m edia o la m ediana, tom ando
com o base las re su ltan te s distribuciones de frecuencias. E n oca­
siones se tr a ta de datos que nos son dados ya en fo rm a agrupada,
pud ien d o re su lta r im posible o inconveniente re g re sa r a los datos
originales p a ra p ro ced er a su com putación. Un ejem plo de da­
tos en grupos lo constituyen los censos. P or ellos sabrem os que
hay cierto n ú m ero d e p ersonas con edades d e 0 a 4 o d e 5 a 9
años, p e ro desconocerem os la edad exacta de cad a individuo.
Como verem os m ás abajo, el em pleo d e los datos agrupados
puede sim plificar n u e s tra la b o r considerablem ente. Pero, p o r o tra
p arte, al agru p arlos en categorías, perdem os sin poderse evitar
inform ación. Podem os sa b e r solam ente, p o r ejem plo, que hay
17 p erso n as con ingresos e n tre $ 2 000 y $ 2 900, p ero n o sabem os
cóm o se h allan d istrib u id as exactam ente en el in te rio r de dicho
intervalo. Con o b jeto de calcu lar la m edia o la m ediana de tales
datos agrupados, hem os d e p ro c ed er a h a c e r ciertos supuestos
sim plificadores acerca de la posición de los individuos en el in te­
rio r de cad a categoría. E n el caso de la m edia, tra ta re m o s todos
los casos com o si se h allaran concentrados en los p untos m edios
de sus in tervalos respectivos. Y al calcular la m ediana supon­
drem os que aquéllos se h allan esparcidos a distancias iguales en
el in te rio r de cada intervalo. P o r supuesto, esas sim plificaciones
llevan a p a re ja d a c ierta inexactitud. E n efecto, no podem os es­
p e ra r o b ten er en esta fo rm a exactam ente los m ism os resu ltad o s
que nos p ro p o rcio n arían los datos b ru to s. Pero, p o r o tra p arte ,
si el n ú m ero de datos es grande, las distorsiones introducidas
s e rá rrp o r lo re g u la r insignificantes y com pensarán so b rad am en te
el ah S rro de tiem po. Es obvio, p o r lo dem ás, q u e cuanto m ás an ­
gostos sean los intervalos, ta n to m enos inform ación perderem os
y tan to m ay o r será la exactitud. Así, p o r ejem plo, si sabem os que
hay 17 casos e n tre $ 2 000 y $ 2 900 y 26 casos e n tre $ 3 000 y $ 3 900,
podem os o b ten er resu ltad o s m ás exactos im aginando que los 17
casos se h allan en el p u n to m edio del p rim e r in terv alo y los
26 en el p u n to m edio del segundo, que si hu b iéram o s de situ ar
los 43 casos ju n to s en el p u n to m edio del in terv alo m ay o r de
$ 2 000 a $ 3 900. E stas sim plificaciones tienen m ayores pro b ab i­
lidades de co n d u cir a e rro re s en el caso de intervalos extrem os,
ya q ue los d ato s de dichos intervalos pueden re s u lta r desviados
hacia el ce n tro de la distrib u ció n to tal. E n e s ta form a, si hay
17 casos en el in terv alo m ás bajo , la m ayoría de ellos pueden
e n c o n trarse en la m ita d su p erio r del m ism o. Sin em bargo, si el
n ú m ero de los individuos e n dichos intervalos extrem os es m uy
pequeño, com o suele suceder, es p ro b a b le que la d isto rsió n in tro ­
ducida sea insignificante.
De ah í q u e al calcu lar la m edia de datos agrupados tratem os
todos los casos com o si estuvieran situ ad o s e n el p u n to m edio
de sus in tervalos respectivos. Si lo p refiriéram o s, podríam os su­
ponerlos esparcidos a distancias iguales en el in te rio r del in te r­
valo, pero, com o es fácil verificar, esto conduciría a los m ism os
resu ltad o s, ya que la m edia de cada in terv alo q u ed a ría exactam en­
te en el p u n to m edio del m ism o. Como q u iera que todos los ca­
sos de u n in terv alo se tra ta n com o si tu v ieran el m ism o valor,
podem os m u ltip licar el n ú m ero de casos de cada in terv alo p o r
su v alo r com ún, en lu g ar de ad icio n ar los datos separadam ente.
Así, p o r ejem plo, si hem os colocado 26 casos a la a ltu ra del valor
d e 3 450, el p ro d u c to de 26 X 3 450 se rá igual a la su m a de 26
m arcas sep arad as de 3 450 cada una. Y si hacem os esto con to­
dos los intervalos, sum am os los p ro d u cto s y dividim os e n tre el
n ú m ero to ta l de casos, ob ten d rem o s la m edia aritm ética. La
fó rm u la de ésta se convierte e n ta l caso e n :
fc Te
2 fitr ii 2 /¡Mj
__ 4=1 i= 1
X = ---------------------------------- (V.3)
N 2n

en la q ue /¡ = n ú m ero de casos de la categoría ¿-ésima con 2 / t=A/


m{ = p u n to m edio de la categoría í-ésima
k = n úm ero de las categorías.

E l ejem plo expuesto en el cu ad ro V .l a c la rará el proceso.


E n el cu ad ro V .l todos los intervalos son de la m ism a am pli­
tu d . E sto no es esencial, a condición q ue se em pleen puntos m e­
dios correctos. S in em bargo, es necesario servirse de intervalos
cerrados. Supóngase, en efecto, que el últim o intervalo hubiera
sido de $ 7 000 p a ra arrib a . ¿Qué p u n to m edio tom aríam os? No
poseem os abso lu tam ente base alguna qué nos p e rm ita juzgar, a
m enos que nos rem ontem os a los datos originales. Algunas ve­
ces esto resu lta posible, ya que las categorías extrem as sólo com ­
p ren d en a m enudo relativam ente pocos datos. E n éstos re su lta
p o r lo re g u lar m ás lógico servirse de la m ed ia real de los datos

Cuadro V .l. Cálculo de la m edia de datos agrupados por el


m étodo largo

Puntos medios
Límites fijados Límites verdaderos ft fimi
("«i)
$2000-2 900 $ 1 950-2 950 $2450 17 $ 41650
3 000-3 900 2 950-3 950 3 450 26 89700
4 000-4 900 3 950-4 950 4 450 38 169100
5000-5900 4 950-5 950 5450 51 277 950
6000-6 900 5950-6950 6450 36 232 200
7 000-7 900 6 950-7 950 7 450 21 156450
Totales 189 $967050

2 /„«,
967050
X = - = $5117
~Ñ 189

de la categoría ex trem a que del p u n to m edio de algún intervalo


m ayor. E n los casos en que n o re su lta posible rem o n tarse a los
datos originales, será necesario ad o p ta r u n supuesto razonable
en relación con el v alor del p u n to m edio. De ah í que sea decidi­
d am en te m ás ventajoso p a ra nosotros servirnos de intervalos
cerrad o s siem pre que h ay a de calcularse u n a m edia. Según ve­
rem o s en el cap ítulo vi, esto se aplica asim ism o al cálculo de la
desviación están dar, la m edida m ás com únm ente em pleada de
dispersión.
M étodo corto para el cálculo de la m edia. El m étodo a rrib a in­
dicado co m p o rtará p o r lo re g u lar la m ultiplicación de núm eros
b a sta n te grandes (v.gr., 2 450X 17), a m enos que re su lte que los
p u n to s m edios son n úm eros sim ples. Con u n a calculadora m o­
d e rn a dichos p ro d u cto s pueden calcularse y acum ularse fácil­
m ente. Pero, si los cálculos h an de h acerse a m ano, existe un
m edio m u ch o m ás sencillo de calcular la m ed ia de datos agru­
pados. E ste m étodo, llam ado "co rto ”, parece a p rim e ra vista com ­
p o rta r m ás tra b a jo que el "largo", pero, u n a vez dom inado, se
revela com o m ucho m ás sencillo que el otro. F undam entalm ente,
el m éto d o co rto consiste en an ticip ar u n a m edia y servirse en
e sta fo rm a de n ú m eros m ás pequeños en la m ultiplicación. Lue­
go se añade, com o an terio rm en te, u n fa c to r de corrección a la
m edia supuesta.
Con o b jeto de sim plificar n u estro s cálculos, tom em os com o
m edia an ticip ad a el p u n to m edio de u n o de los intervalos. E n el
ejem p lo a rrib a tra ta d o podem os v er p o r inspección que la m edia
será algo in ferio r a $ 5 450, p u n to m edio del c u a rto intervalo. La
v en taja de serv irn o s de u n p u n to m edio com o m edia su p u esta es
obvia. E n efecto, todos los dem ás datos e starán en ta l caso a
cierto n ú m ero de intervalos de distancia de la m edia supuesta,
ya que cad a m arc a se supone h allarse en u n o u o tro de los puntos
m edios. Si restam o s ah o ra la m edia su p u esta de cad a u n a de las
m arcas, o b ten d rem os diferencias de exactam ente $ 1 000, $ 2 000
o $ 3 000 en am b as direcciones. M ultiplicam os luego esas diferen~
d a s p o r las frecu encias ap ro p iad as p a ra o b ten er el fa c to r de
corrección q u e h a de añ ad irse a la m edia anticipada. E n o tro s
térm inos, h a b rá 17 casos con m arc as de exactam ente $ 3 000 m e­
nos que aq u élla; h a b rá 26 casos con u n a diferencia de $ 2 000,
etcétera. Si nos servim os de u n a colum na di que re p re se n te la
diferencia e n tre las m arcas efectivas y la m edia anticipada, p o d e­
m os m o d ificar la fó rm u la (V.2) y esc rib ir la fó rm u la de la m edia
com o sigue:
¿ fA
x = r + _ LL— ( v .4)
N
donde
di = X t - X '
y podem os d isp o n er n u estro s cálculos en u n cu ad ro com o en el
cu ad ro V.2. Una vez m ás, el fa c to r de corrección se obtiene to ­
m an d o la desviación to ta l con re sp ecto a la m ed ia an ticip ad a
(a q u í —63 000) y después dividiendo e n tre el n ú m ero de casos, lo
q ue d a la ca n tid ad prom edio en que la m edia an ticip ad a se sepa­
ra de la verdadera.
E n este ejem plo, el fa c to r de corrección h a re su lta d o se r ne­
gativo, in dicando que la m edia an ticip ad a e ra dem asiado grande.
H ay que o b serv ar que si hubiéram os an ticip ad o p a ra la m edia
o tro v alo r cualquiera, h ab ríam o s llegado al m ism o resu ltad o . Si
se elige com o m ed ia an ticip ad a el p u n to m edio de te rc e r in te r­
valo ($ 4 4 5 0 ), el fa c to r de corrección es de $667, el cual, adicio­
nado a $ 4 450 d a el re su ltad o correcto. Dicho sea de paso, esto
constituye u n m edio de control m uy ú til de n u e s tra lab o r. Ob­
sérvese que si h u b iéram os elegido el p u n to m edio d e cualquier
o tro intervalo, h ab ríam o s realizado m ás trab a jo , y a q u e los n ú ­
m eros a su m a r en la colum na /td4 h a b ría n sido n u m éricam ente
m ayores. Y si h u b iéram os fallad o en serv im o s de u n p u n to m e­
dio, las desviaciones resp ecto de la m edia su p u esta h ab ría n com ­
p o rta d o n ú m ero s m ucho m enos sim ples, con lo que n o nos
h ab ríam o s a h o rrad o tra b a jo alguno. U na vez que el proceso se
h ay a com prendido bien, es posible o m itir en el cu ad ro de cálculo
la colu m n a de los p u n to s m edios.
E l lecto r h a b rá sin d u d a observado que cada u n a de las desvia­
ciones resp ecto de la m edia p re su n ta del ejem plo a n te rio r es un

Cuadro V.2. Cálculo de la m edia de datos agrupados p o r el


m éto d o corto

Limites Puntos
verdaderos medios n ¿i fA

$1950-2950 $2450 17 $ - 3 000 $ -5 1 0 0 0


2950-3 950 3 450 26 - 2 000 -5 2 0 0 0
3 950-4950 4 450 38 -1 0 0 0 - 3 8 000
4 950-5950 5450 51 0 0
5950-6950 6450 36 1000 36 000
6 950-7 950 7450 21 2 000 42 000
Totales 189 $ - 6 3 000
le
2 fA
— _ «—1

X = * ' i+---
=A -—
N
-6 3 0 0 0
= 5450 + „ = 5 450 333
189
= $5117

m ú ltip lo exacto de 1 000, o sea la m agnitud del intervalo utilizado.


E sto será siem pre así, a condición que todos los intervalos ten ­
gan la m ism a am plitud. P o r lo tan to , podem os p o n e r la am p litu d
del in terv alo com o fa c to r en cada u n o de los p ro d u cto s fA> m ul­
tip lican d o p o r d icha a m p litu d u n a vez te rm in a d a la adición. E n
o tro s té rm in o s : pudim os h a b e r obtenido la su m a de — 63 000 de
la m an era sig u iente:
- 63 000 = 1 000( — 51 - 52 - 38 + 0 + 36 + 42).

En lo que equivale a lo m ism o, pudim os h a b e r expresado las


desviaciones originales en té r m inos del n ú m ero de intervalos (o
“ desviaciones g ra d u an tes” ) resp ecto de la m edia supuesta. P or
lo tan to , d eterm inam os cu án to s intervalos d ista la m edia supues­
ta de la v erd ad era y, finalm ente, tran sp o rta m o s la m agnitud del
e rro r h acia a trá s a las unidades originales, m ultiplicando este
fa c to r de corrección p o r la m agnitud del intervalo. Designando
la desviación en am plitudes de intervalo com o d', podem os re ­
visar n u e stro cu ad ro en la fo rm a indicada en el cu ad ro V.3.
Si se han em pleado interválos desiguales, h a b rá que m odificar
esta segunda fó rm ula del m étodo breve. A algunas personas les
p arece rá m ás fácil re m o n ta rse al m étodo an terio r, sirviéndose

Cuadro V.3. Cálculo de la m edia de datos agrupados p o r el m étodo


corto y de las desviaciones graduales

Límites Puntos medios


verdaderos U *i U*i

$ 1 950-2 950 $2 450 17 -3 -5 1


2 950-3 950 3 450 26 -2 -5 2
3 950-4 950 4 450 38 - 1 -3 8
4 950-5 950 5 450 51 0 0
5 950-6 950 6450 36 1 36
6 950-7 950 7 450 21 2 42
Totales 189 -6 3

La fó rm u la m odificada es a h o ra :

A udi
X = X ' + _1JL----- i (V.5)
N
en donde i re p resen ta la am p litu d de intervalo. P or co n siguiente:

X - 5 450 + 1 000 = 5 117


189
de d t en lugar de d \ y escribiendo las diferencias efectivas en
las u n id ad es originales. Y alternativam ente, si sólo difieren del
re sto en cuanto' a am p litu d u n o o dos intervalos, podem os to m ar
com o am p litu d i de in terv alo la am p litu d de la m ayoría de los
intervalos de clase. Las desviaciones de los p u n to s m edios de
los intervalos re sta n te s resp ecto de la m edia su p u esta pueden
en este caso ex presarse en fo rm a de fracciones de los interva­
los enteros. Así, p o r ejem plo, si el últim o intervalo h u b iera sido
de $ 6 950 a $ 8 950, en lu g ar de $ 6 950 a $ 7 950, entonces el p u n to
m edio h a b ría sido $ 7 950 en lu g ar de $ 7 450. P o r lo tanto, la
desviación resp ecto de la m edia p re su n ta h a b ría sido de $ 2 500,
o sean 2.5 am p litudes de intervalo. Si el intervalo h u b iera ido
h a sta $ 9 950, el v alor d \ h u b iera sido de 3.0, según se deja com ­
p ro b a r fácilm ente.
Cálculo de la m ediana. Al calcular la m ed ian a de datos agru­
pados, tra ta re m o s todos los casos al in te rio r de u n intervalo dado
com o si estuvieran d istribuidos a distancias iguales en el m ism o.
Localizam os p rim ero el intervalo que contiene el caso m edio,
e interp o lam o s luego p a ra en c o n trar la posición exacta de la
m ediana. Al d eterm in a r el intervalo que contiene a ésta, es p o r

C uadro V.4. Cálculo de la m ediana de datos agrupados

Límites verdaderos F Ni de casos


í inferiores a
11 950-2 950 17 17 $2950
2 950-3 950 26 43 3 950
3 950-4950 38 81) (4950
4 950-5 950 51 132) 15 950
5 950-6 950 36 168 6950
6 950-7950 21 189 7 950
Total 189

lo re g u la r conveniente o b ten er la distrib u ció n de frecuencia


acum ulativa. Pese a que no es absolutam ente necesario, es p re­
ferib le ac o stu m b ra rse a disponer p o r e sc rito la distribución
acu m u lativ a com pleta y a in d icar en u n a colum na sep arad a el
significado de cada u n a de las cifras de dicha colum na (F ). La
d istrib u ció n acum ulativa de los datos an terio res se da en el cua­
d ro V.4. A títu lo de co n tro l de n u e stra adición, observam os que
todos los 189 casos h a n de q u ed a r p o r d eb a jo de $ 7 950.
A continuación localizam os el intervalo q u e contiene el dato
m edio o él JV/2-ésimo. Aquí es 189/2 = 94.5, de m odo que busca­
m os el in terv alo que contenga los casos nonagésim o c u a rto y
nonagésim o quinto. O bsérvese que, si los datos n o h u b iera n es­
ta d o agrupados, h ab ría m o s localizado el d ato (N + l)/2-ésim o,
o sea el nonagésim o quinto. La razón de esta inconsecuencia
ap a ren te se ex am in ará m ás abajo. Como q u iera que hay 81 ca­
sos p o r deb ajo de $ 4 950 y 132 p o r debajo de $ 5 950, la m ediana
h a de q u ed a r en algún lu g ar del in terv alo que va de $ 4 950 a
$ 5 950. C onstituye u n b u en p rocedim iento m a rc a r dicho in te r­
valo con Un p arén tesis, y a que se d a a veces la tendencia de leer
los dato s a p a r tir de la cifra 81, con lo que se obtiene el intervalo
incorrecto' de $ 3 950 a $ 4 950.
E xam inem os ah o ra m ás de cerca el intervalo que contiene la
m ediana. H ay en éste 51 casos y, en consecuencia, habrem os
de d iv id ir el in terv alo e n tero en 51 subintervalos de am plitud
$ 1 000/51, o $49.61 cada uno. S ituam os cada uno de los 51 casos
en el p u n to m edio de su subintervalo propio. El caso octogésim o
p rim ero q u ed a rá así situ ad o en el últim o sub in terv alo del in ter­
valo de $ 3 950 a $ 4 950, y el caso 132-avo será sólo ligeram ente
in ferio r al lím ite su p erio r del intervalo que contiene la m ediana.
Ahora procedem os sim plem ente a c o n ta r subintervalos h asta
lleg ar a aquélla. Si los datos no estuvieran agrupados, h ab ría­
m os localizado la m arc a del caso (N + \ )/2, o sea el nonagésim o
quinto. De acuerdo con n u e stra convención, dicho caso se situa­
ría en el p u n to m ed io del decim ocuarto subintervalo o, exacta­
m ente, a 13.5 subintervalos del lím ite in ferio r del intervalo. Ob­
sérvese que este m ism o valor se h u b iera obtenido re sta n d o 81

81 94.5 132
-----J | +H I I I I l-l H I I | l | -------------------------------- ■---------------- I !
4,950 5,950
de 94.5 o N /2 . Es p o rq u e estam os operando con p u n to s m e­
dios de in tervalos pequeños que contam os exactam ente N /2
intervalos, con o b jeto de localizar la posición del caso {N + l)/2 .
El v alo r de la m ed ian a pu ed e ah o ra o b ten erse m ultiplicando
sim plem ente el n ú m ero de subintervalos ab arcad o s p o r la m ag­
n itu d de cada u no de ellos y añadiendo el re su lta d o al lím ite
in ferio r del intervalo. E l procedim iento co n ju n to pu ed e resu­
m irse en la fó rm u la siguiente:

N /2 — F
M d = t + -------------- i (v .6 )

en la que F = frecuencia acum ulativa co rresp o n d ien te al lím ite


in ferior,
/ = n ú m ero de casos del intervalo q u e contiene la me-
diana,
l = lím ite in ferio r del intervalo q u e contiene la m e­
diana,
i = am p litu d del in terv alo que contiene la m ediana.
La can tid ad i / f re p resen ta la m ag n itu d de cada subintervalo, y
N /2 — F da la d istan cia (e n su b in terv alo s) e n tre el lím ite inferior
del in tervalo y la m ediana. E n n u estro p roblem a tenem os, pues :

M d = 4 950 + — 5 ~ 81 1 000 = 4 950 + 13.5 - i — -


51 51
= 4 950 + 265 = $ 5 215.
E xiste u n cam ino alternativo, p e ro equivalente, de re p resen ta r
el proceso conducente a la obtención de la m ediana. E n efecto,
en lu g ar de b u sca r la m agnitud de cada subintervalo y m ultipli­
cando p o r el nú m ero de los subintervalos, podem os d iscu rrir
que, com o quiera q ue hay 51 casos en el intervalo en tero y que
hem os de re c o rre r 13.5 de estos intervalos m ás pequeños p a ra
llegar a la m ediana, hem os de re co rre r 13.5/51 del intervalo en­
tero. P o r lo tan to , si m ultiplicam os la m ag n itu d del intervalo
(1 000) p o r la fracción de la distancia to tal que hem os de reco­
rre r, obtenem os el re su ltad o deseado llam ado interpolación. Al
u tiliza r la fórm ula es indiferente, p o r supuesto, cuál de las dos
explicaciones nos parezca m ás satisfactoria. Con objeto de no
h acem o s dem asiado dependientes de la fórm ula, es m ejo r discu­
r r ir el proceso cada vez, sirviéndonos de aquélla com o control,
h a s ta que se haya co m prendido a fondo. A títu lo de o tro control
hay que observ ar que la m ediana pudo h a b e rse asim ism o obte­
n ido restando cierta ca n tid ad del lím ite superior u. Como püede
d em o strarse fácilm ente, la fórm ula se convierte en ta l caso e n :

Md = u ~ ¿ (V.7)

en la q ue F re p resen ta ah o ra la frecuencia acum ulativa co rresp o n ­


d iente al lím ite su p erio r del intervalo. N um éricam ente esto d a :

132 * 94.5 __
M d = 5 950 --------- —----- 1000 = $5 215.

V.4. C om paración de la m edia y la m ediana


H abiendo exam inado los m étodos de cálculo utilizados en la ob­
tención de la m edia y la m ediana ta n to de datos agrupados com o
no agrupados, tócanos ah o ra co m p arar sus propiedades. Saltan
a la v ista varias diferencias e n tre las dos m edidas. P rim ero, la
m edia u tiliza m ás inform ación que la m ediana, p o r cuanto al calcu­
la r la m edia nos servim os de la totalidad de las m arcas exactas,
e n ta n to q ue la m ediana sólo com porta la m arc a del caso m edio.
Volviendo a las m arcas 72, 81, 86, 69 y 57, vem os que si la m arca
m ás a lta h u b iera sido 126 en lu g ar de 86, la m ediana h ab ría
p erm an ecid o in alterada, en ta n to que la m edia h ab ría aum en­
tad o considerablem ente. Y en fo rm a análoga, si la m arca infe­
rio r h u b iera sido cero, la m edia h a b ría b ajad o , perm aneciendo
la p W ia n a nuevam ente inalterada. P or consiguiente, podem os
estab lecer u n a diferencia m uy im p o rtan te e n tre am bas m edidas,
a sab e r :\ La m edia resulta afectada por cam bio de los valores
extrem os, en tanto que la m ediana perm anece inalterada, a m e­
n os que cam bie asim ism o el valor del caso medió'. E n nuestro
ejem plo, m ien tras 72 siga siendo el te rc e r caso después del re o r­
denam iento, la m ediana p erm an ecerá inalterada.
E s ta im p o rta n te d iferencia e n tre las dos m edidas nos perm ite
decid ir en la m ayoría de los casos cuál de ellas re su lta m ás a p ro ­
p iada. P o r lo re g u la r deseam os q u e n u e s tra m ed id a se sirva de
to d a la info rm ación disponible. E n u n a fo rm a u o tra ponem os
in tu itiv am en te m ás fe e n la m ed id a que cum ple dicha condición.
P ese q ue al p re sen te n o sea posible re fo rza r dicha fe con un
sólido razo n am iento estadístico, p u ed e darse, con todo, cierta
ju stificació n de la p re fere n cia de la m edia en las circunstancias
co rrien tes. R esulta, en efecto, que la m edia es p o r lo re g u la r
u n a m ed id a m ás estab le que la m ediana, en c u a n to v a ría m enos
d e u n a m u e s tra a o tra. C uando enderecem os n u e s tra atención
a la E stad ístic a inductiva, verem os q u e p o r lo re g u la r el inves­
tig ad o r tien e m ás in te ré s e n generalizar a p ro p ó sito d e la pobla­
ción q u e en su m u e stra p a rtic u la r. E stá p erfectam en te p ercatad o
d e que si se h u b ie ra to m ad o o tra m u e stra los re su lta d o s n o h a­
b ría n sid o ex actam ente los m ism os. Si se h u b iera to m ad o u n a
g ran can tid ad d e m u e stra s del m ism o tam año, h a b ría podido ver
sim p lem en te e n cuánto las m edianas de las m u estras diferían
e n tre sí. Lo q ue aquí decim os es q u e las m edianas de las m ues­
tr a s d ifieren d e u n o a o tro de ellos m ás que las m edias corres­
p o n d ien tes. P ero com o q u iera que en la p rá c tic a sólo extraem os
p o r lo re g u la r u n a sola m u estra, im p o rta sab e r q u e la m edida
q u e em pleam os d a rá re su ltad o s seguros, en cu a n to q u e h a b rá u n
m ín im o de v ariab ilid ad de u n a m u e stra a la próxim a. Podem os,
p o r consiguiente, estab le cer la siguiente regla p rá c tic a : en caso
d e duda, em pléese la m edia con preferencia a la m ediana.
D ebido al h echo de que u tiliza todos los datos, en ta n to que
la m ed ian a n o depende de los valores extrem os, la m edia puede
p ro p o rcio n ar e n d eterm in ad as circunstancias re su ltad o s m uy
am biguos. H em os de te n e r p re se n te que, al serv im o s de u n a
m ed id a de ten d en cia central, tra ta m o s de o b te n e r u n a sim ple
descripción de lo q u e e n n u e stro s datos hay de "típico". Supón­
gase, p a ra to m a r u n caso extrem o, q u e en la serie de cinco n ú ­
m eros el d ato su p e rio r fu e ra la de 962. La m ed ian a seguiría sien­
do en n u e s tro caso 72, e n ta n to que la m ed ia su b iría a 1 241/5,
o sea 248.2. A hora bien, ¿es este v alo r "típ ico ”, en alguna form a,
de los d ato s? C iertam ente no. N o se e n c u e n tra en p a rte alguna
cerca de los d ato s de los cinco casos. Es verdad, p o r supuesto,
que en u n ejem plo ta n extrem ado nin g u n a m ed id a p a rtic u la r p o ­
d ría utilizarse p a r a d escrib ir adecuadam ente el caso típico, pero,
com o q u iera q u e c u a tro de los cinco datos se sitú an alrededor
de 72, el em pleo de la m ed ian a re su lta ría m an ifiestam en te m e­
nos equívoco. Podem os, pues, d ecir q u e: siem pre que una dis­
tribución es fu ertem e n te asim étrica, esto es, siem pre que hay
consid erab lem ente m ás casos extrem os en u n a dirección que en
o tra, la m ediana será por lo regular m á s apropiada que la media.
La relación e n tre la desviación y las posiciones relativas de la
m edia y la m ediana se indica en la figura V .l. Como q uiera que
puede re su lta r afectad a p o r unos pocos valores extrem os, la m e­
dia se v erá "em p u ja d a” en la dirección de la asim etría, esto es,
h acia la cola. Si la distribución es p erfectam ente sim étrica, la
m edia y la m ediana coincidirán. Sabem os que las distribuciones
relativas a los ingresos suelen e sta r desviadas p o r lo regular

Simétrica

. . . x
Asim étrica negativa Asim étrica positiva

Fig. V .l. R elación entre la asim etría y las posiciones relativas


d e la m edia y la m ediana

h acia los ingresos superiores, con m uy pocos de ellos extrem a­


d am en te altos. R esultaría, pues, m uy im preciso p re se n ta r ingre­
sos m edios en el m arco de u n a corporación o de u n a localidad
pequeña. P o r ello los d ato s relativos al ingreso se d an p o r lo
re g u la r sirviéndose de la m ediana, m ás que de la m edia. Sin
duda, si la d istribución e s tá m uy desviada, el hecho debería
m encionarse al p re se n ta r los datos. E n tales casos, puede resu l­
ta r ú til in d icar am bas cosas, la m edia y la m ediana, pese a que
esto sólo ra ra m e n te se hace así en la práctica.
La m ed ia tien e u n a segunda p ro p ied ad que n o posee la m e­
d ian a: se deja m an ip u lar algebraicam ente con m ayor facilidad.
Así, p o r ejem plo, p recisa o b ten er a m enudo u n prom edio pon­
d erad o d e varios conjuntos de datos. Supóngase que tenem os
los siguientes ingresos m edios correspondientes a las tres locali­
dades A, B y C :
Localidad Habitantes Media
A 10000 $3 518
B 5000 4760
C 8000 4122

Si el n ú m ero d e h a b ita n te s de las tre s localidades fu e ra el m is­


m o, po d ríam o s to m a r la m edia de esos tre s datos com o m edia
general. P ero es el caso que la localidad A es dos veces m ayor
que la localidad B, o sea, e n o tro s térm inos, que la cifra $ 3 518
re p re se n ta u n doble n ú m e ro de casos de los que re p resen ta la
cifra $ 4 760. Si los 23 m il h a b ita n te s se h u b iera n p u esto ju n to s
calculándose la m edia general, la cifra re su lta n te h a b ría refle­
ja d o dicho hecho. P ara o b te n e r la m edia co rrecta, hem os de
p o n d e ra r cada m edia sep a rad a p o r el n ú m ero p ro p io de casos,
sum ando luego y dividiendo fin alm en te e n tre el n ú m ero to tal de
éstos (23 000). O btenem os en esta fo rm a :

2 N tX x
X = — --------- (V.8)
N

en donde N t y X { re p re se n ta n respectivam ente el n ú m e ro de ca­


sos y la m ed ia de la categoría i-ésima, indicando k el n ú m ero de
las categorías. Tenem os, p o r consiguiente:
- _ 10 000(3 518) + 5 000(4 760) + 8 000(4 122)
Ji. — ........... ......... —
23 000
91 956 000
=$ 3 998.09
23 000

Podem os ju s tific a r fácilm ente ese p rocedim iento d e p o n d era­


ción observando que la m edia de la categoría i-ésim a fu e en re a­
lid ad o b ten id a adicionando los datos y dividiendo p o r A^.2 P or
lo tan to , el p ro d u c to N iX t re p re se n ta la sum a de todos los datos
d e dicha categoría. Así, pues, la adición de los p ro d u cto s y la di­
visión e n tre N nos d a el m ism o re su lta d o que se h a b ría obtenido
si se h u b iera n ignorado las categorías p o r com pleto. E ste tipo
de m anipulación algebraica de la m ed ia re su lta en ocasiones m uy
ú til. N o h a d e re s u lta r difícil d arse cu en ta q u e la m ediana
general de los d ato s com binados n o p u ed e o b ten erse en dicha
2 Casi siempre ponderemos X i con w{, representando la expresión '2wiX i/
2 w4 nuestra media ponderada. Por lo regular hacemos la ponderación en
tal forma que suma una cantidad conveniente como la unidad (esto es,
= 1) o la muestra total de tamaño N, como en el ejemplo anterior.
form a. E n efecto, si conociéram os los valores de los casos m e­
dios de cad a u n a de las categorías separadas, nos fa lta ría toda­
vía conocer el v alor del caso m edio de los datos com binados.
Obsérvese, finalm ente, u n a diferencia im p o rtan te e n tre la m e­
dia y la m ediana. El cálculo de la m edia re q u ie re u n a escala de
in terv alo . E n efecto, sin u n a escala de in terv alo no te n d ría sen­
tido alguno h a b la r de su m ar m arcas. E s m an ifiestam en te nece­
sario suponer, p o r ejem plo, que la su m a de los n ú m eros 30 y 45
equivale a la de los n ú m ero s 20 y 55, ya que am bos p ares poseen
la m ism a m edia. La m ediana, en cam bio, puede em plearse ta n to
con la s escalas o rd in ales com o con las de intervalo. La m arca
n u m éric a real de la m ed ian a carecerá de sentido, a m enos que
dispongam os de u n a escala de intervalo, p e ro será sin du d a
posible situ a r la m a rc a m edia. E sto significa que, e n tre o tro s, po­
dem os se p a ra r los casos en u n a o dos categorías, según que
aquéllos queden p o r en cim a o p o r d eb ajo d e la m ediana. P o r lo
ta n to , las m ed id as de posición pu ed en em plearse con escalas
o rd inales, hecho que re su lta m uy ú til p a ra el desarrollo' de p ru e ­
b a s que n o req u ieren escalas de intervalo.

V.5. O tras m edidas de tendencia central


E x isten todavía algunas o tra s m edidas de tendencia cen tral, nin­
guna de las cuales, sin em bargo, e n c u e n tra u n em pleo m uy co­
rrie n te en la investigación sociológica. U na de ellas es el m odo,
q u e es sim plem ente la m arc a m ás frecuente. Si, p o r ejem plo,
to m am o s las tre s series de n úm eros siguientes:

(1) 71, 75, 83, 75, 61, 68


( 2) 71, 75, 83, 74, 61, 68
(3) 71, 75, 83, 75, 83, 68

podem os decir que la p rim e ra tien e u n m od o de 75, ya que hay


d os térm in o s de dicha m arca, en ta n to q u e ninguna o tra a p a re ­
ce dos veces. N o h ay m odo alguno en la segunda serie de nú m e­
ros, p e ro los h ay dos, en cam bio, e n la te rc e ra (75 y 83). E l
m odo re su lta ta l vez m ás ú til cuando se d a u n núm ero m ayor
de casos y cu an do los datos h an sido agrupados. E n ta l caso
h ablam os a veces de u n a categoría m odal, to m an d o el p u n to
m edio de la m ism a com o m odo. E n los datos agrupados que
hem os utilizado, la categ o ría m odal sería la de $ 5 000 a $ 5 900.
E n u n a d istribución de frecuencia, el m odo re s u lta rá indicado
p o r el p u n to m ás elevado de la curva. E n u n a distrib u ció n sim é­
tric a con u n solo m odo en el centro, la m edia, la m ediana y el
m odo serán p o r supuesto, idénticos. Podem os d istin g u ir asim is­
m o e n tre d istrib uciones "unim odales" y "bim odales”, tom ando
esta ú ltim a la fo rm a que aparece en la fig u ra V.2. Al h a b la r de
distribuciones bim odales, n o solem os p o r lo re g u la r su p o n er que
am b as cúspides tengan exactam ente el m ism o alto, com o p are­
cería deducirse de la definición. H ay que o b serv ar que, com o
q u iera que el m odo se refiere a la categoría con el m ayor núm e­
ro de casos, podem os servim os de dicho concepto ta n to al des­
c rib ir escalas nom inales, com o ordinales o de intervalo. De esta
m an era en el caso de las escalas nom inales p o d rá considerarse la

categoría m odal com o u n tip o d e tendencia central, siem pre que


se tenga bien p re sen te que ello n o supone u n ordenam iento de
categorías.
O tras dos m edidas de tendencia central que prácticam ente
n o se ven n u n ca en la lite ra tu ra sociológica son la m edia arm ó­
nica y la m edia geom étrica. Se definen respectivam ente p o r las
siguientes fó rm u las:
N
M edia arm ónica = ---------------
ir i
2 ——
« -1 Xi
N ___________ _
M edia geom étrica = > / ( X x) ( X 2) ........ ( X N)

E n esta ú ltim a fórm ula, la N a rrib a del radical indica que to ­


m am os la raíz JV-ésima del p ro d u c to de N datos.

V.6. Deciles, cuartiles y percentiles


Al exam inar la m ediana, señalam os que hay o tras m edidas po-
sicionales, ta le s com o los percentiles, que pueden utilizarse p ara
fija r la p o sición de datos m ayores que u n a proporción determ i­
n ad a de casos. E sas m edidas, au n q u e n o sean necesariam ente
m edidas de tip ic id a d o de tendencia central, son análogas di­
rectam en te a la m ediana. Así, p o r ejem plo, en lugar de buscar
u n n ú m ero q u e tenga la m ita d de los datos p o r encim a o p o r
d eb ajo de sí m ism o, podem os q u e re r d e te rm in a r el v alor del p ri­
m e r cu artil, que posee la p ro p ied a d d e que u n cu a rto de los datos
sean de m en o r m ag n itu d que la suya. Y en fo rm a sem ejante, el
te rc e r cu a rtil re p re se n ta la m arc a que tien e p o r deb ajo d e ella,
e n cu an to a m agnitud, a los tre s cu a rto s de los casos. Si se p re­
fiere, se pu ed e dividir la d istrib u ció n en 10 deciles, fijan d o m a r­
cas q u e tengan u n a décim a, dos décim as o nueve décim as d e los
casos con valores m enores. Tal vez el lecto r esté m ás fam iliari­
zado con los p ercentiles, q u e dividen la d istrib u ció n e n 100 p o r­
ciones d e tam añ o igual. Así, p o r ejem plo, el e stu d ia n te que falla
en el nonagésim o p rim e r p ercen til sabe q u e el 91 p o r ciento de
los dem ás estu d ian tes ten ían puntuaciones m ás b ajas q u e él.
E l cálculo de los deciles, los cuartiles y los p ercentiles es direc­
ta m en te análogo al de la m ediana. E n el caso d e dato s ag ru p a­
dos, d eterm in arem os p rim e ro el in terv alo e n cuyo in te rio r que­
d a la m ed id a de posición deseada. S irviéndonos luego de los
d ato s del cu ad ro V.4, ob ten d rem o s el p rim e r cu a rtil localizando
la posición del caso N /4 o 47.25-ésimo. De la colum na de la fre­
cuencia cum ulativa vem os que el p rim e r cu a rtil h a de situ arse
en algún lu g ar e n tre el in terv alo de $ 3 950 a $ 4 950. Y com o
q u iera que en dicho in terv alo hay 38 casos, hem os de re c o rre r
los (47.25 — 43 )/38 de e sa distancia. Así, pues, el valor del p rim e r
c u a rtil Q i será:

47 25 — 43
Q1 = 3 950 + — ^---------- 1 000 = 3 950 + 112 = $ 4 062
38

O tras m edidas de posición pueden calcularse en fo rm a análoga.


Obsérvese, in cid entalm ente, que p o r definición la m ediana es
equ iv alen te al segundo cu artil, al q u in to decil, y al quincuagé­
sim o p ercen til. Si b ien los deciles, cu artiles y percentiles sólo
se em plean m uy ra ra m e n te e n la investigación sociológica, con­
viene p o r lo m enos conocer su sentido.

G losario
Decil
Media
Mediana
Modo
Percentil
Cuartil
Distribución asim étrica

E je r c ic io s

1. Indíquense la media, la m ediana y el modo de los números siguien­


tes: 26, 37, 43, 21, 58, 26, 33 y 45, Respuesta, 36.1; 35; 26.
2. Calcúlense una media y una mediana de los datos compilados en
el ejercicio 1, cap. iv. Hágase lo mismo en relación con el ejercicio 2,
cap. iv.
3. Calcúlense el tercer cuartil, el cuarto decil y el septuagésimo pri­
m er percentil de los datos del ejercicio 1, cap. iv.
4. Los siguientes datos (hipotéticos) m uestran la distribución del
porcentaje de las familias granjeras en 60 distritos. Calcúlense la
media y la mediana. Respuesta, 32.83; 32.83.
Intervalo Frecuencia
%
10-19 7
20-29 16
30-39 21
40-49 12
50-59 4
60

5. Sirviéndose de los datos del ejemplo anterior, indique el lector


en qué form a resultarían afectadas la media y la mediana (aumenta­
das, reducidas, inalteradas) si:
a) el último intervalo se ampliara de 50 a 69, permaneciendo las
mismas frecuencias. Respuesta, aum entada; la misma.
b) si se añadiera un 10 por ciento a cada intervalo (haciendo los
intervalos 20 a 29, 30 a 39, etcétera), con frecuencias inalteradas;
c) los intervalos permanecieran inalterados, pero pasando dos ca­
sos de la categoría 20 a 29 a la categoría 30 a 39 (haciendo que las
frecuencias fueran 7, 14, 23, 12 y 4);
d) los intervalos permanecieran inalterados, pero se doblaran to­
das las frecuencias.
_6. Un grupo de 10 muchachos y 7 muchachas participaron en un acer­
tijo algebraico. Supóngase que la puntuación media de los muchachos
íue 84 y su mediana 74, en tanto que, en relación con las mucha­
chas, tanto la media como la mediana resultaron en 79. El m aestro
concluye que en esa prueba los muchachos obtuvieron un resultado
mejor que las muchachas. ¿Está su conclusión justificada? ¿Por qué,
o por qué no? ¿Cómo cabría explicar la gran diferencia entre la media
y la mediana en los muchachos?
7. Supóngase que se ha encontrado que la edad media de los 50 go­
bernadores (de los Estados Unidos) es de 51.6 años, la de 100 sena­
dores 62.3, y la de 435 diputados de 44.7. ¿Cuál es la edad media de
todos esos políticos? Supóngase que las cifras anteriores indicaran
medianas, ¿podría obtenerse la mediana general del mismo modo?
¿Por qué, o por qué no?

B iblio g rafía

1. Anderson, T. R., y M. Zelditch: A Basic Course in Statistics, 2? ed.,


Holt, Rinehart and Winston, Inc., Nueva York, 1968, cap. 5.
2. Downie, N. M., y R. W. H eath: Basic Statistical Methods, 2' ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 4.
3. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holí and Company, Inc., Nueva York, 1952, cap. 8.
4. McCollouhg, C. y L. van Atta: Introduction to Descriptive Statis­
tics and Correlation, McGraw-Hill Book Company, Nueva York,
1965, cap. 2.
5. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Rea-
soning in Sociology, 2* ed. Houghton Mifflin Company, Boston,
1970, cap. 5.
6. Weinberg, G. H., y J. A. Schumaker: Statistics: An Intuitive Appro-
ach, Wadsworth Publishing Company, Inc., Belmont, Cal. 1962,
caps. 2 y 6,
V I. ESCA LA S D E IN T E R V A L O : M ED ID A S
D E D IS P E R S IÓ N

E n la investigación sociológica la atención se con cen tra en m u­


chos casos en m edidas de tendencia central. P o r ejem plo, pode­
m os q u e re r c o m p arar varios tipos de religión en relación con la
asisten cia m ed ia a la iglesia o el nivel m edio de ingreso. Pode­
m os tam b ién d esear o btener, sin em bargo, m ed id as de hom oge­
neidad. Tal vez hayam os p a rtid o de la hipótesis que u n a de las
religiones ex tra e rá sus adeptos en m ay o r g ra d o que las o tras de
u n a m ism a capa social. S in em bargo, au n si estam o s interesados
an te to d o en c o m p arar m edidas de tendencia cen tral, necesita­
m os, con todo, sab e r algo acerca de la dispersión en cada grupo.
Nos dam os cu en ta in tu itiv am en te d e que, si cada religión fu e ra
ex trem ad am en te heterogénea en cuanto al ingreso y a la asis­
ten cia a la iglesia, u n a d iferencia d eterm in ad a e n tre sus m e­
d ias (digam os de $ 2 000) n o sería ta n im p o rta n te o indicativa
com o se ría el caso si cada g ru p o fu e ra p erfectam en te hom o­
géneo.
C uando lleguem os a la estad ística inductiva, estarem o s en con­
diciones de ju stific a r dicha intuición y de a p re c ia r p o r qué las
m edidas de d ispersión son ta n im p o rtan tes. E n el p re sen te capí­
tu lo vam os a co n cen trarn o s en el m ecanism o, en tan to que en el
siguiente darem os u n a in terp re tació n de la m edida de dispersión
m ás im p o rta n te : la desviación están d ar.

V I.l. E l recorrido
De las d istin tas m edidas de dispersión que vam os a exam inar en
este capítulo, el re co rrid o es con m ucho el m ás sim ple. El reco­
rrid o se define com o la diferencia e n tre la m arc a m ás a lta y la
m ás b aja. Así, pues, e n relación con los datos proporcionados en
el capítulo a n te rio r (72, 81, 86, 69 y 57), el re c o rrid o sería la dife­
ren cia e n tre 86 y 57, o sea 29. P o r lo re g u lar solem os in d icar el
re co rrid o ya sea p o r m edio de la diferencia real (29), o dando
las dos m arc as extrem as, v.gr. 57 y 86. Si los datos se h a n agru­
pado, tom am os com o re co rrid o la diferencia e n tre los puntos
m edios de las categorías extrem as. Así, pues, si el p u n to m edio
del in tervalo in ferio r es 2 450 y el del intervalo su p e rio r 7 450, el
re co rrid o será de 5 000.
La sim plicidad extrem a del re co rrid o com o m ed id a de disper­
sión p re sen ta a la vez ven tajas e inconvenientes. E n efecto, el
re co rrid o pued e re s u lta r m uy ú til si se tr a ta de o b ten er unos
cálculos m uy rápidos que p u ed an p ro p o rcio n ar u n a indicación
b ru ta de la dispersión, o si los cálculos h a de hacerlos alguna
90
p erso n a que n o esté fam iliarizada con la estad ística. Si los datos
h an d e p re sen tarse a u n a audiencia relativ am en te ingenua, el reco­
rrid o será tal vez la ú n ica m edida de dispersión que aquélla esté
en condiciones de in te rp re ta r fácilm ente. S in em bargo, el nivel de
p re p aració n de los sociólogos está alcanzando ráp id am en te u n
p u n to tal, que podem os legítim am ente su p o n er que en ten d erán
tam b ién m edidas algo m ás com plicadas y satisfactorias. E l in­
conveniente del re co rrid o es obvio: se b a sa exclusivam ente en
dos casos, que son, adem ás, los dos casos extrem os. Y com o
q u iera que los casos extrem os suelen se r ra ro s o poco com unes
en la m ay o ría de los problem as em píricos, nos dam os cu en ta que
p o r lo re g u lar es u n a cuestión de az ar q u e obtengam os u n o o dos
de ellos en n u e stra m u estra. Supóngase, p o r ejem plo, que en la
localidad investigada hay u n m illonario. Si escogem os 10 perso­
nas al azar, es p ro b ab le que aquél n o e sté incluido e n tre ellas.
Pero, supóngase que sí está. E n ta l caso el re co rrid o de los in­
gresos será ex trao rd in ariam en te am plio y m uy engañador en
cu an to m edida de dispersión. Si nos servim os del re co rrid o
com o m edida, n a d a sabem os acerca de la variación de las m a r­
cas e n tre los dos valores extrem os, excepto que éstas se sitú an
en algún lu g ar en el in te rio r de dicho re co rrid o . Así, pues, com o
re su lta del ejem plo a n terio r, el re co rrid o v a ria rá considerable­
m en te de u n a m u e stra a o tra. P or o tra p a rte , el re co rrid o será
p o r lo re g u la r m ayor en las m u estras grandes que en las peque­
ñas, sim plem ente p o rq u e e n los p rim ero s tenem os m ás p ro b a ­
bilidades de in clu ir a los casos individuales extrem os. É sta es
la razón de que el re c o rrid o n o se em plee p o r lo re g u la r en so­
ciología, excepto al nivel de tipo m ás exploratorio.
O tra m ed id a su m am ente sim ple, la razón de variación, puf de
s e r utilizada e n el caso de los datos en grupo, lo que re su lta
especialm ente adecuado en el caso de las escalas nom inales.
C onsiste b ásicam ente en u n a m edida del grad o en que se con­
ce n tran los dato s en la categoría m odal, en lu g ar de que se les
e n cu en tre distrib u idos u n iform em ente a lo larg o de to d as las ca­
tegorías. Se define a s í :

V i?. = 1 - f moaJ N ,

en donde /modaj se re fiere al nú m ero de casos en la categoría mo­


dal, y N al n ú m ero to ta l de casos. E s evidente que e sta m edida
re s u lta insensible a la distrib u ció n de casos en las categorías no
m odales, siendo p o r o tra p a rte dependiente del proceso de cate-
gorización. S u v en taja ra d ic a en su sencillez extrem a y en su
atracció n intuitiva, adem ás del hecho de que en el caso de las
escalas nom inales no es posible h a c e r uso d e u n a ordenación de
categorías que p erm ita h a b ilita r m edidas de u n m ayor re fin a­
m iento.
VI.2. La desviación cuartil
O tra m ed id a em pleada algunas veces en los cam pos de la psico­
logía y la enseñanza, p ero que ra ra m e n te ap arece en la lite ra tu ra
sociológica, es la desviación cu a rtil o re co rrid o sem i-intercuartil.
La desviación cu artil Q es u n tipo de reco rrid o , pero, en lugar
de re p re se n ta r la diferencia e n tre los valores extrem os, sé define
a rb itra ria m e n te com o la m ita d de la d istancia e n tre el p rim ero
y el te rc e r cu artiles. O en fo rm a sim bólica:

en donde Qi y Q3 re p resen ta n respectivam ente al p rim e ro y te r­


cer cu artiles. O bsérvese que la desviación c u a rtil m ide el reco­
rrid o ocupado p o r la m ita d ce n tral de los casos. Como quiera
que Qi y Q3 v aria rán m enos de u n a m u e stra a o tra que los casos
m ás extrem os, la desviación c u a rtil re p re se n ta u n a m ed id a m u­
cho m ás estab le que el re co rrid o . P or o tra p a rte , e n cam bio, no
saca provecho del co n ju n to de la inform ación. N o estam os m i­
diendo la v ariabilidad e n tre los casos cen trales ni tom am os en
consideración lo que o cu rre en los extrem os de la distribución.
De ahí, pu es, q u e enderecem os n u e s tra atención, a o tra s dos m e­
didas que sí poseen esta p ro p ied a d deseable.

VI.3. La desviación m edia


Si deseam os serv im o s de todos los datos, el sentido com ún nos
su g erirá que to m em os las desviaciones de cada d ato con resp ecto
a alguna m ed ida de tendencia cen tral y que calculem os luego
alguna especie de p ro m ed io d e dichas desviaciones, con o b jeto
de co n tro lar el n ú m ero de casos com prendidos. S ería posible
to m a r com o m ed id a de ten d en cia c e n tral la m ed ian a o el m odo,
p ero p o r lo re g u la r tom am os la m edia, ya que é s ta es en la
m ay o ría de los casos la m ed id a p a rtic u la r m ás satisfactoria.
Supóngase que sum áram os sim plem ente las desviaciones efecti­
vas resp ecto d e la m edia. P o r desgracia, com o sabem os, el resu l­
ta d o sería siem p re cero, y a que las diferencias positivas y nega­
tivas se com pensan m u tu am en te. E sto sugiere que, p a ra o b ten er
u n a m ed id a de d ispersión a lre d ed o r de la m edia, hem os de des­
h acem o s e n u n a fo rm a u o tra d e los signos negativos. Se nos
o cu rren in m ed iatam en te dos m éto d o s: 1) ig n o rar los signos y
to m a r sólo los valores absolutos d e las diferencias, o 2) cu a d rar
las diferencias. E sto s dos m étodos conducen efectivam ente a las
dos m edidas re sta n te s de dispersión que hem os d e exam inar en
este capítulo, a sa b e r: la desviación m edia y la desviación es­
tán d ar.
La desviación m edia se define com o la m edia aritm ética de las
diferencias absolutas de cada m arca con resp ecto a la m edia,
£> en sím b o lo s:
2 )Xt - X \
<==1
Desviación m edia = ------------------ (V I.2)
N
La m edia de los n úm eros 72, 81, 86, 69 y 57 es 73.0. Si su stra e ­
m os 73.0 de cada u n o de dichos núm eros, ignorando los signos, y
luego adicionam os los re su ltad o s y dividim os en tre 5, o b te n e m o s:
y _
2 |j^ ._x \
' 1 + 8 + 13 + 4 + 1 6 42
8.4
N 5 5
Podem os p o r consiguiente decir que el prom edio de los datos
d ifiere de la m ed ia en 8.4.
Pese a que la desviación m edia p re sen ta u n a in terp retació n
in tu itiv a m ás d irecta que la desviación están d a r, tiene, con todo,
varios inconvenientes graves. P rim ero, los valores absolutos no
se d ejan m an ip u lar algebraicam ente con facilidad. Segundo y m ás
im p o rtan te, la desviación m edia no es de fácil in terp re tació n
teó rica ni conduce a re su ltad o s m atem áticos sim ples. Con fi­
nes p u ra m e n te descriptivos, la desviación m edia puede se r ade­
cuada, pese a que, según verem os, la desviación e stá n d a r se
d eja in te rp re ta r m ás fácilm ente en térm inos de la curva norm al.
C uando lleguem os a la estad ística inductiva verem os que la des­
viación e stá n d a r se u tiliza sobre todo a cau sa de su su p erio rid ad
teórica. É sta es la razó n de que sólo ra ra m e n te encontrem os
en la lite ra tu ra sociológica referencias a la desviación m edia.

VI.4. La desviación estándar


H abiendo elim inado m ás o m enos o tras varias m edidas de dis­
p ersión, podem os ah o ra d irig ir n u e stra atención a la m ás útil
y frecu e n te de las m ed id as: la desviación estándar. É sta se de­
fin e com o la raíz cu a d rad a de la m edia aritm é tic a de las desvia­
ciones cu ad rad as con resp ecto a la m edia, o en sím b o lo s:

(Xt-X)*
(V I.3)
N
en donde s se em plea p a ra designar la desviación están d ar.1 O en
1 Algunos textos definen s con N —1 en el denominador en vez de N. La
razón de ello no resultará clara hasta e n el capítulo XI.
p a la b ra s : tom am os la desviación de cad a m arc a con respecto
a la m edia, a la d ra m o s cada diferencia, sum am os los resultados,
dividim os e n tre el n ú m ero de casos y extraem os la raíz cuadrada.
P ara conseguir u n a re sp u esta correcta, es indispensable que las
operaciones se efectúen exactam ente e n el o rd e n indicado. E n
n u e stro ejem plo n um érico la desviación e stá n d a r p o d ría conse­
guirse com o sigue:

*« (X.-X) (Xt - X P

72 - 1 1
81 8 64
86 13 169
69 - 4 16
57 -1 6 256
--- ---
X = 73.0 0 506
s = V506/5 = V101.2 = 10.06

E l significado intuitivo de la desviación e s tá n d a r n o nos aparece­


r á claram en te h a s ta m ás adelante, cuando nos sirvam os de s p a ra
d am o s las á re a s b a jo la curva norm al. P o r el m om ento la acepta­
m os sim plem ente com o u n n ú m ero ab stracto . Sin em bargo, algu­
n a s p ro p ied ad es de la desviación e stán d a r son y a m anifiestas
desde ah o ra. O bservam os, en efecto, que cu an to m ay o r es la dis­
persió n alred ed o r d e la m edia ta n to m ayor es la desviación están­
dar. Si to d o s los cinco valores h u b iera n sido cero, las desviaciones
alred ed o r de la m edia h a b ría n sido cero, y s tam b ién h ab ría sido
cero. P o r o tra p a rte , vem os que las desviaciones extrem as con
resp ecto a la m edia p esan m ás, con m ucho, en cu an to a deter­
m in a r el v alo r d e la desviación están d a r. E n efecto, los valores
169 y 256 dom inan las o tra s tre s desviaciones cuadradas. Al
c u a d ra r las desviaciones, pese a que después extraigam os la raíz
cu ad rad a, estam os en re alid ad dando m ás peso relativo a los va­
lores extrem os todavía de lo que e ra el caso al calcu lar la m edia.
E sto sugiere q u e hem os d e m itig ar n u e stro en tu siasm o inicial
a p ro p ó sito de la desviación e stá n d a r e n cu an to "la m e jo r" m edida
p a rtic u la r de dispersión. C iertam ente, si hay varios casos extre­
m os, querem os que n u e stra m ed id a lo señale. P ero si la d istri­
bución p re se n ta unos pocos casos m uy extrem os, la desviación
no rm al pued e conducir a re su ltad o s engañosos, e n cu an to pue­
de se r ex tra o rd in aria m e n te grande. E n tales casos nos serviría­
m os p ro b ab lem en te com o m edida de tendencia ce n tral de la m e­
diana y, ta l vez, de la desviación cu a rtil com o m edida de
dispersión. S in em bargo, p a ra la m ayoría de los datos la des­
viación n o rm al re su lta rá adecuada.
E s razonable p re g u n ta r: "¿p o r qué m o lestarse en e x tra e r la
raíz cu a d rad a al calcu lar u n a m edida de d ispersión?” U na re s­
p u esta fácil, au n q ue poco satisfactoria, sería la d e decir que así
es com o se define la desviación e stán d a r. P o d ría ju stific arse la
extracción de la raíz c u a d ra d a señalando que, y a que hem os cu a­
d ra d o cada desviación, lo que hacem os es com pensar dicho paso
an terio r. Sin em bargo, re s u lta m ás com prensible ju stific a r la ex­
tracció n de la raíz en térm in o s d e su c a rá c te r práctico. Como quie­
r a que, en efecto, m ás ad elan te habrem os d e h a c e r u n em pleo
considerable de la cu rv a norm al, la desviación están d a r, ta l com o
se la h a definido, re s u lta se r u n a m ed id a m uy ú til. P a ra o tro s
fines nos servirem os del cu ad rad o d e la desviación n o rm al o va­
riancia, que se define com o:

2 ( Xt - X P
<=i
V ariancia = s2 = -------—-----------
N

Los m atem ático s h a n en co n trad o q u e el concepto de variancia


poseía m ay o r v alor teó ric o que la desviación están d ar. A p a r tir
del cap ítu lo xvi, h arem o s u n uso creciente d e la variancia, p ero
d e m o m en to podem os lim ita r n u e stra atención a la desviación
e stá n d a r. Los dos conceptos son p o r lo dem ás ta n fácilm ente in­
tercam b iab les, q ue podem os p a s a r sin dificu ltad del u n o al otro .
Que se defina la v arian cia com o cu a d rad o d e la desviación es­
tá n d a r o ésta com o raíz cu a d rad a d e la variancia, esto n o reviste
im p o rtan cia alguna.
Cálculo de la desviación estándar de datos no agrupados. Si
b ien la desviación e stá n d a r puede calcularse siem pre a p a r tir
de lá fó rm u la b ásica que se acaba de dar, re s u lta a m enudo m ás
sencillo servirse de fó rm u las de cálculo que n o req u ieren la sus­
tracció n de la m edia de cada m arc a sep arad a. E n efecto, no sólo
la m ed ia n o será p o r lo re g u la r u n n ú m e ro entero, sino que
u su alm en te se co m eterán e rro re s d e redondeo al em p lear la
fó rm u la an tes indicada. Con o b jeto de v er de qué m odo poda­
m os sim p lificar los cálculos, desarrollem os la expresión que está
a b a jo del radical. T en e m o s:

2 2 { X ? - 2X j l + X*)
i= l Í=1
. _ _ _

2 X ? - 2X 2 X i + N X 2
«—i t=i
N
O bsérvese que, com o q u iera que X es constante, pudim os tom ar­
la fre n te al signo de sum ación en el segundo térm in o del n u m era­
dor. E n el te rc e r térm ino, a su vez, nos hem os servido del hecho
de que, p a r a to d a co nstante k, te n e m o s :

2 k = N k.
i=l
_ w
Pero, com o q u iera q u e X = 2 X J N , el térm ino cen tral del nu-
í =*i
m era d o r se red u ce a — 2X 2, y podem os e s c rib ir:
X _ 2 N 2 .V 2
2 (X t ~ X ) 2 X,2 X 4
i= l 4=1 _, ___ i= l ___
2X2 + X2 = ------------X2
N N M

P o r lo ta n to :

V N
ír 2
2 X,

\T
-X * (W .4)

Algunas o tras fórm ulas de cálculo altern ativ as son las sig u ien tes:

v ^-(4y (VI.5)

(^X
i)
N 2 \ 4=1
2 X ¿--------------------
í= i jv
/

-V (V I.6)3

1 I N 2 / N \ 2
(VL7)

Si b ien cu alquiera de las form as precedentes puede utilizarse


com o fó rm u la de cálculo, la ecuación (V I.7) es la que com porta,
2 La obtención de las ecuaciones (VI.6) y (VI.7) a partir de la ecuación
(VI.5) se deja como ejercicio.
con todo, m enos errores d e redondeo, p o r ello se la recom ienda.
Sirvám onos de u n a de dichas fórm ulas de cálculo (ec. VI.7) en
el p roblem a an terio r, e n donde N = 5.

Xi *<2
72 5184
81 6561
86 7 396
69 4761
57 3 249
365 27151
E n adición al n ú m ero to ta l de casos, las dos cantidades requeri-
-V !f 2
das son S I , y 2 X t. A m bas sum as pueden acum ularse sim ul-
«=i i=i „
tán eam en te con las m odernas calculadoras de oficina. Calcula­
m os ah o ra s a p a r tir de (V I .7):

s = 1/5 V 5(27 151) - (365)2 = 1/5 V 135 755 - 133 225 = 10.06

Nos hem os servido de este problem a m uy sencillo p a ra ilu s tra r


q u e Ja fó rm u la de cálculo d a el m ism o re su ltad o num érico que la
fó rm u la b ásica de la ecuación (V I.3). Como q u iera que X resu ltó
ser u n en tero , la fó rm u la de cálculo h a com portado en realidad
m ás tra b a jo que la fórm ula original. P ero norm alm ente, p o r su­
p uesto, esto n o será así.
* Cálculo de la desviación estándar de datos agrupados. Si los
datos h an sido agrupados, podem os sim plificar n u e stra lab o r
considerablem ente tra ta n d o cada caso com o si se h allara en el
p u n to m edio de u n intervalo y sirviéndose de u n a m edida su­
pu esta. Sin du d a introducim os con ello alguna inexactitud, p ero
el ah o rro de tiem po es sustancial. Siguiendo u n a convención co­
rrie n te , supongam os que = X t — X . E n consecuencia, las x m i­
núsculas re p resen ta n desviaciones resp ecto de la m edia, y la
fó rm u la básica de la desviación está n d a r se convierte e n :

Podem os m odificar ah o ra la fórm ula tom ando en cuenta el he­


cho de que h a b rá u n gran n ú m ero de casos trata d o s todos com o
si tu v ieran el m ism o valor, esto es, uno de los p untos m edios. Si
m u ltiplicam os el n ú m ero de casos en cada clase p o r el p u n to
m edio p ro p io y sum am os luego los p ro d u cto s, nos podem os
a h o rra r el tra b a jo de su m a r todos los N casos. La fó rm u la de la
desviación e stá n d a r se convierte así en :

(V I.8)

en donde /{ es el n ú m ero de casos del intervalo i-ésimo y A: el


n ú m ero de intervalos.8
S upongam os a h o ra que anticipam os u n a m ed ia y tom am os las
desviaciones con re sp ecto a ésta, e n lu g ar de re sp ecto de la m e­
dia v erd ad era. M ostram os en el cap ítu lo a n te rio r que la sum a de
las desviaciones c u a d rad a s de la m edia será m en o r —que cual­
q u ier o tro v alor— que la su m a d e las desviaciones cuadradas. E n
p artic u la r, la su m a de las desviaciones cu a d rad a s de la m edia
an ticip ad a se rá m ay o r que la cifra o b ten id a sirviéndonos de
la m ed ia v erdadera, a m enos, p o r supuesto, que aquélla coincida
con ésta. Puede, pues, d em o strarse que cu an to m ás cerca queda
la m ed ia su p u esta de la v erdadera, ta n to m en o r re su lta la sum a
de las desviaciones cu ad rad as de la m edia supuesta. E n o tro s
té rm in o s: si nos servim os de u n a m ed ia su p u esta, esperam os
o b ten er u n a sum a de cu ad rad o s dem asiado grande. Lo m ism o
que an terio rm en te, podem os servirnos d e u n fa c to r de correc­
ción, al que su straem o s luego del valor o b ten id o utilizando la
m ed ia an ticipada. La fó rm u la de la desviación está n d a r se con­
v ierte e n tal caso e n :

en donde los d¡ re p re se n ta n las diferencias e n tre cada m arc a y


la m ed ia an ticip ad a y son d irec tam en te análogos a los x, de la
ecuación (V I.8).
Antes de to m a r u n ejemplo- num érico, exam inem os la fó rm u la
p reced en te con m ay o r atención. El segundo térm in o d eb ajo del
rad ical re p re se n ta el fa c to r de corrección que h a de su strae rse
de las desviaciones cu ad rad as de la m edia supuesta. R ecordando
la fó rm u la de la m edia expresada en térm in o s de la m edia su ­
p u esta, o sea:

8 Obsérvese que no se elevan al cuadrado las frecuencias ji que aparecen


en el numerador de la expresión bajo el radical.
k
2 fA

vemos que
&
i—1
=X-X'
N
y que, p o r lo ta n to :
fc V
2 ] fA \

De este modo, el fa c to r de corrección re su lta se r el cu ad rad o de


la diferencia e n tre las m edias verd ad era y la supuesta. Vemos
inm ed iatam en te que, si hubiéram os an ticip ad o la m edia exacta­
m ente, el facto r de corrección h a b ría sido cero. P o r lo tanto,
cu an to m ay o r sea la diferencia e n tre las m edias verd ad era y su­
p u esta ta n to m ayor será el fa cto r de corrección. Una suposición
deficiente conducirá siem pre al re su ltad o correcto, p ero com­
p o rta rá m arcas n u m éricas m ayores en am bos térm in o s de la
fórm ula.
É sta puede m odificarse m ás todavía si p referim os p en sa r en
térm in o s de desviaciones graduales d¿. Lo m ism o que e n el capí­
tulo v, ponem os en fa c to r la am plitud del intervalo de cada dt
y m ultiplicam os el re su ltad o final p o r i, lina vez el proceso te r­
m inado. La fó rm u la se convierte así e n :
=i ' V n ¿ w ~( i ) 2 (w

O bsérvese q u e efectivam ente n o hem os hecho m ás q u e sac ar la


am p litu d i del intervalo, de d eb a jo del radical.
Al calcu lar la desviación e stá n d a r de d ato s agrupados, pode­
m os ah o ra ex ten d e r el p rocedim iento em pleado p a r a la m edia,

Cuadro VI. 1. Cálculo d e la desviación estándar utilizando datos


agrupados

Límites verdaderos Puntos medios fi Wt W


$1950-2950 $2450 17 -3 -5 1 153
2 950-3 950 3450 26 -2 -5 2 104
3 950-4 950 4450 38 -1 -3 8 38
4 950-5950 5450 51 0 0 0
5950-6950 6 450 36 1 36 36
6 950-7 950 7 450 21 2 42 84
Totales 189 -6 3 415

k / k \ 2

V
= 1 000 J __ ( = 1000 V 2.1%—.111
" 189 V 189 /
= 1444

añ adiendo la colum na f idi’2. Atraque en re alid ad p odríam os ob­


te n e r las desviaciones cu ad rad as d i2 y m u ltip licar luego p o r f u
re su lta rá con to d o m ucho m ás sim ple m u ltip licar las dos últim as
colum nas em pleadas en o b te n e r la m edia (e sto e s : d{ x f{d{). En
efecto, h ab ien d o m u ltiplicado d / p o r sí m ism o, vem os que todos
los nú m ero s negativos se h acen ah o ra positivos.4 Calculem os
ah o ra la desviación e stá n d a r de los datos agrupados utilizados
en el cap ítu lo precedente. Con fines de ilu stració n nos servire­
m os de la ecuación (V I.10), p ese a q u e p o r lo re g u la r la (V I.12)
co m p o rta rá m enos e rro re s de redondeo.
* Obsérvese bien que la última columna del cuadro VI.l no se obtiene
elevando al cuadrado la columna ftdv ya que al hacerlo traería consigo ele­
var también al cuadrado.
O btuvim os en esta fo rm a u n a m edia de $ 5 117 y u n a desvia­
ción e stá n d a r de $ 1 444. E stos dos n ú m ero s pueden serv ir ah o ra
p a ra re su m ir los d ato s o p a ra co m p ararlo s con datos de o tra
m u estra. Según verem os m ás ad elan te que p u ed en em plearse
tam b ién p a ra v erificar hipótesis o p a ra ap re c ia r m edidas de
población.

VI.5. E l coeficiente d e variabilidad


E s a veces conveniente c o m p arar varios grupos en relación con
su hom ogeneidad relativa, en casos en que dichos gru p o s tienen
m edias d istin tas. P odría, pues, re s u lta r engañoso co m p arar las
m agnitudes ab so lu tas de las desviaciones e stá n d a r. C abría es­
p e ra r que, con u n a m edia m uy grande, p o d ría en c o n trarse p o r
lo m enos u n a desviación e stá n d a r suficientem ente grande. Así,
pues, alguien p o d ría in te re sa rse en p rim e r lu g ar p o r el tam añ o
de la desviación e s tá n d a r en relación con el d e la m edia. E sto
sugiere que podem os o b te n e r u n a m ed id a de la variabilidad re la ­
tiv a dividiendo la desviación e stá n d a r e n tre la m edia. El resu l­
tad o se h a llam ado coeficiente de variabilidad y se designa con
u n a V. Así, p u e s: c

P ara ilu s tra r las v en tajas del coeficiente de variabilidad con


resp ecto a la desviación e stá n d a r, supóngase q u e xm psicólogo
social tr a ta de d e m o stra r que p a ra todos los fines prácticos dos
grupos son ig u alm ente hom ogéneos en relación con la edad. En
u n o de los grupos la e d a d m ed ia es d e 26, con u n a desviación
e stá n d a r de 3. E n el o tro la ed ad m edia es de 38 años, con u n a
desviación e s tá n d a r de 5. P o r lo tan to , los coeficientes de varia­
b ilid a d son resp ectiv am en te 3/26 = .1 1 5 y 5/38 = .132, o sea u n a
diferencia m u ch o m ás peq u eñ a que la q u e se d a e n tre las dos
desviaciones e stán d a r. E n vista del hecho d e que p o r lo re g u lar
la ed ad exacta re su lta m enos im p o rtan te, al d eterm in a r in te re ­
ses, capacidades y posición social, a m ed id a que au m en ta la edad
pro m ed io de los m iem bros del grupo, la com paración de los dos
coeficientes de v ariabilidad p o d ría re s u lta r m uy bien, e n este
caso, m u ch o m enos engañosa que si se em p learan las desviacio­
nes están d a r.
Si se desea, puede u tilizarse tam b ién u n a variancia relativa.
P o r desgracia, estas m edidas relativ as d e dispersión se hallan
citad a s con m uy p oca frecu en cia en la lite ra tu ra sociológica. Es
m u ch o m ás frecuente, efr efecto, e n c o n tra r las m edias y las des­
viaciones e s tá n d a r relacionadas en colum nas adyacentes.
VI.6. Otras m edidas resum idas
Sólo hem os exam inado dos tipos de m edidas resum idas : las de
tendencia central y las de dispersión. Son posibles, adem ás, o tras
m edidas, au n que sólo se las utiliza ra ra m e n te en la investigación
sociológica. Sin duda, encontram os a m enudo d ad a la d istrib u ­
ción de frecuencia en tera, p ero esto no constituye u n a m edida p a r­
ticu lar de resum en. R esulta a veces deseable in d icar en u n a dis­
trib u ció n el grado de asim etría. Una de las m edidas de ésta saca
provecho del hecho de que cu an to m ayor es la asim etría tan to
m ayor re su lta la diferencia e n tre la m edia y la m ediana. E sta
m edida se h alla dada p o r la fó rm u la:

3(X - M d)
A sim etría = ------------------
5

Si la distrib u ción está desviada hacia la derecha (grandes m a r­


cas p o sitiv as), la m edia será m ayor que la m ediana, y el resu l­
tad o será u n n ú m ero positivo. En ta n to que la distribución des­
viada h acia la izquierda d ará u n resu ltad o negativo.
Con m uy poca frecuencia, tam bién, hallam os en sociología re ­
ferencias al ca rác te r general de las cúspides d e u n a distribución
asim étrica. Utilízase el térm in o de picudez en relación con dicha
m edida, que exam inarem os brevem ente u n a vez que hayam os vis­
to la curva norm al. P or lo regular, los textos de estad ística es­
critos an te to d o p a ra los estu d ian tes de econom ía se ocupan
m ás a fondo ta n to de la desviación com o de la picudez. Tal vez
cuando em pecem os a alcanzar u n a m ayor precisión en la des­
cripción de las form as exactas de las distribuciones de las varia­
bles sociológicas hallarem os u n m ayor em pleo p a ra estas o tra s
m edidas descriptivas.

Glosario
Coeficiente de variabilidad
Desviación media
Desviación cuartil
Recorrido
Desviación estándar
Variancia

E jercicios
1. Calcúlense las desviaciones media y estándar de los datos indica­
dos en el ejercicio 1, cap. v. Respuesta, 9.62; 11.59.
2. Calcúlense las desviaciones estándar y cuartil de los datos agru­
pados en el ejercicio 1, cap. iv. Hágase lo mismo con los del ejercicio
2, cap. iv.
3. Calcúlese la desviación estándar de los datos del ejercicio 4,
cap. v. Contrólense los cálculos escogiendo una media anticipada y
una fórmula de cálculo distintas. Respuesta, 10.83.
4. Indíquese en qué form a resultaría afectada la desviación normal
por los cambios indicados en el ejercicio 5, cap. v.

B iblio g rafía
1. Anderson, T. R., y M. Zelditch: A Basic Course in Statistics, 2- ed.,
Holt, Rinehart and Winston, Inc., Nueva York, 1968, pp. 76-84.
2. Downie, N. M., y R. W. H eath: Basic Statistical Methods, 2? ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 5.
3. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 9.
4. McCollough, C., y L. van A tta: Introduction to Descriptive Sta­
tistics and Correlation, McGraw-Hill Book Company, Nueva York,
1965, cap. 3.
5. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reasoning
in Sociotogy, 2“ ed., Houghton Mifflin Company, Boston, 1970, cap. 6.
6. Weinberg, G. H., y J. A. Schumaker: Statistics: An Intuitive
Approach, Wadsworth Publishing Company, Inc. Belmont, Cal. 1962,
cap. 3.
7. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons,
Inc., Nueva York, 1968, cap. 7.
L a noción de la distribución de frecuencia es ya fam iliar. El p re ­
sen te capítulo se ocupa de u n tipo m uy im p o rtan te de d istrib u ­
ción de frecu en cia: la cu rv a n orm al. E sta distribución es m uy
ú til, no sólo p o rq u e u n gran n ú m ero de distribuciones em píricas
se en cu en tran se r aproxim adam ente norm ales, sino debido tam ­
bién a su significado teórico en la estad ística inductiva. E n este
m om ento, el le c to r n o debe preo cu p arse p o r las aplicaciones en
las que se em plea la curva norm al. E n efecto, el o b jeto del p re ­
sen te capítulo está en in d icar las propiedades de la curva en
cuestión y en fam iliarizar al lecto r con el em pleo de cuadros
basados en la m ism a. E sta distribución se exam ina e n la esta ­
dística d escriptiva m ás que en la inductiva p o r dos razones p rin ­
cipales. P rim ero, la curva n orm al puede em plearse p a ra p ro p o r­
cio n ar u n a in terp re tació n de la desviación están d ar. Y en segundo
lugar, serán útiles al lecto r p a ra fam iliarizarse con la distribución
norm al algunos capítulos antes de exponerse a pru eb as estad ís­
ticas que req u ieren facilidad en la m anipulación de la m ism a.
P o r lo tan to , cuanto m e jo r se com prenda la m a te ria expuesta en
este capítulo, tan to m enos dificultad se ex p erim en tará m ás ade­
lante.

V II.1. D istribuciones de frecuencias finitas versus infinitas


Las distribuciones de frecuencia h a s ta aquí exam inadas com por­
tab an un n ú m ero finito de casos. De hecho, p o r supuesto, todas
las d istribuciones em píricas co m portan n ecesariam ente u n nú­
m ero fin ito de casos, aunque ta l vez m uy grande. Sin em bargo,
los m atem áticos consideran ventajoso a m enudo p en sa r en té r­
m inos de distribuciones basadas en u n n ú m ero de casos infinita­
m en te grande. Más bien que tr a ta r con distribuciones em píricas
de aspecto anguloso, com o las que ejem plifican el histogram a
o el polígono de frecuencia, re su lta posible concebir curvas lisas
basadas en u n nú m ero indefinidam ente grande de casos y sus­
ceptibles de se r expresadas en térm in o s de ecuaciones m atem á­
ticas relativ am ente sencillas. La distribución n o rm al es u n a de
tales curvas. Antes de exam inar esta distribución específica, con­
v en d rá e stu d ia r la n atu raleza del proceso a través del cual se
d esarrolla u n a curva lisa sem ejante.
Em pecem os con un h istogram a que com prende cinco intervalos
(fig u ra V ll.la ) . Con fines de sim plicidad supondrem os que la
distribución de frecuencia es sim étrica. Ya vim os que si el n ú ­
m ero de intervalos au m en tab a sin cam biar N , la fo rm a del h is­
to g ram a tien d e a hacerse irregular. Supóngase, sin em bargo, que
104
el n ú m ero de casos se h a aum entado asim ism o. E n ta l caso,
com o en la fig u ra V II. Ib, será posible serv irse de u n m ayor n ú ­
m ero de intervalos m ás angostos, cada u n o de los cuales tenga
u n n ú m ero suficiente de casos p a ra m a n te n e r la regularidad. Si
el n úm ero de casos sigue aum entando, pueden em plearse todavía
m ás rectángulos, conservando, con todo, el tipo reg u lar (fig.

:d f £ "TTTTt-t- - ..
(í)

Fig. V II.L C om paraciones d e curvas lisas con histogram as de


a m plitudes diferentes de intervalo

V II.lc ). Las curvas lisas se h an trazad o p o r los p u n to s m edios


del lad o su p erio r de cada rectángulo. R esulta claro que los rec­
tángulos van form ando aproxim aciones cada vez m ejores a la
cu rva lisa a m edida q u e el nú m ero de los m ism os aum enta,
esto es, a m edida que dism inuye el ancho de cada intervalo.
Im aginem os ah o ra u n n ú m ero de casos en au m en to incesante,
con intervalos cada vez m ás angostos, h a sta que los rectángulos
se aproxim en ta n íntim am en te a la curva lisa que ya n o podam os
a p reciar diferencia alguna e n tre aquéllos y ésta. Designam os la
curva lisa a la que se van acercando incesan tem en te los re ctán ­
gulos cad a vez m ás angostos com o lím ite de la distribución de
frecuencia.1 Pese a que no podam os im aginam os u n n ú m ero infi­
n ito de casos, podem os, sin em bargo, concebir u n n ú m ero tan
gran d e de ellos, que los rectángulos se acerquen a la curva lisa
con el grad o de ex actitu d deseado.
Se re c o rd a rá q u e el área de cada rectángulo puede utilizarse
p a ra re p re se n ta r la pro p o rció n de casos com prendidos en el in-

Fig. V II.2. C omparación d e las áreas debajo de la curva y debajo


del rectángulo

tervalo. Como ya se indicó en el cap ítu lo iv, el á rea to tal de to ­


dos los rectángulos se suele h a c e r igual a la unidad. Así, pues,
si la p ro p o rción d e los casos del p rim e r in terv alo es .10, en to n ­
ces dicho m ism o n ú m ero re p re se n ta el á re a re al del p rim e r
rectángulo. O bservam os ah o ra que el área del rectángulo co rres­
p o n d ien te p u ed e ap ro x im arse al área que q u ed a deb ajo de la
cu rv a lisa al in te rio r de cu alq u ier intervalo dado. Es lo que
indica la fig u ra VII.2. A m edida q u e el n ú m ero de rectángulos
au m enta, el á rea to tal de los rectángulos se convierte en u n a
aproxim ación cada vez m e jo r al á rea que q u ed a b a jo la curva
lisa. E sto puede verse observando que las á reas ach u rad as se
van h acien d a cada vez m ás pequeñas. E n el lím ite, pues, el á rea
d eb ajo de la curva lisa p u ed e o b ten erse sum ando las áreas de
u n n ú m ero in definidam ente gran d e de rectángulos. Y com o quie­
r a q u e el á rea deb ajo d e los rectángulos es la unidad, el área
d eb ajo de la curva lisa será asim ism o igual a la unidad. El p ro ­
ceso q ue acabam os d e d escrib ir es exactam ente la clase de proce­
so que se h alla en la ra m a d e las m atem áticas designada com o
cálculo.

1 La noción de límite se examina también en la sección IX.l.


VII.2. F orm a general de la curva norm al
La curva n o rm al es u n tipo especial de curva lisa sim étrica.
Como q u iera q ue la curva norm al es lisa, perfectam en te sim étrica
y se b asa en un n ú m ero indefinidam ente grande de casos, sólo es
posible ap ro x im arse a la m ism a m ediante distribuciones de fre ­
cuencia que co m p o rtan datos efectivos. Tiene fo rm a de cam pana

y posee cierto n ú m e ro de propiedades m atem áticas notables, al­


gunas de las cuales se señalarán brevem ente. Como q uiera q u e es
sim étrica y unim odal, su m edia, m ediana y m odo coinciden. La
fo rm a general de la d istribución n o rm al se indica en la fi­
g u ra VII.3.
* L a ecuación m atem ática de la curva n orm al es relativam ente
sencilla en las n o rm as de los m atem áticos. A unque el lecto r no
h a b rá de em p lear n u n ca dicha fórm ula, ya que se h an confeccio­
n ad o cuadros con ta l objeto, será ú til, sin em bargo, que la vea,
p a ra señ alar y v erificar algunas de las propiedades de e s ta dis­
trib u ció n teórica. La fórm ula es com o sigue:

Y = - - - - - -- - - - - e - ( x - x ) * / 2 í*
sV2jc

e n donde Y es la a ltu ra de la curva p a ra u n valor determ inado


d e X . Como q u ie ra que ta n to jt com o e son co n stan tes (iguales
resp ectivam ente a 3.14 y 2.72), la fó rm u la sólo com porta dos m e­
didas de resum en, la m edia X y la desviación e stá n d a r s? P or
lo tan to , la fo rm a exacta de la curva n o rm al será conocida si se
nos dan los valores de dichas m edidas. E n otros térm in o s: hay
m uchas curvas n orm ales, u n a p a ra cada com binación d e la m edia
y de la desviación están d ar.
* R ecordando que u n a can tid ad afectad a de u n exponente ne­
gativo pued e esc rib irse com o la recíproca de dicha ca n tid a d ele-

2 Cuando lleguemos a la estadística inductiva se introducirá otra nota­


ción para la media y la desviación estándar. La fórmula de la curva nor­
mal suele escribirse en términos de una media de ¡i y una desviación es­
tándar de o.
vada a la p o ten cia positiva, podem os esc rib ir la fó rm u la com o
sig u e :

en la que e h a sido su stitu id a p o r su valor num érico. Suponga­


m os q ue el v alo r de s es fijo, y busquem os el v alo r d e X p a ra el

Fig. V II.4. C om paración d e curvas norm ales d e igual desviación


estándar pero d e m edias d iferen tes

cual Y será u n m áxim o. E s obvio q u e Y será m áxim a cuando


el d enom inador incluido en los p arén tesis sea m ínim o. P ero dicho
den o m in ad o r co n sta de u n n ú m ero positivo m ay o r que la unidad
elevado a u n a p o ten cia que n o p u ed e se r negativa, ya que u n
n ú m ero real cu ad rad o n o puede se r n u n ca m e n o r que cero.
P o r consiguiente, el denom inador alcanzará su m ínim o cuando
éi exponente sea cero. Y esto o c u rrirá cuando X ad o p te el valor
de X , ya que ten d rem o s X — X — 0. E sto m u e stra q u e el m odo
(y, p o r consiguiente, la m ed ia y la m ed ian a) es realm en te X , he­
cho q ue ya se h a b ía señalado, p e ro sin dem ostrarlo. Podem os
ver, asim ism o, que la ecuación da u n a curva que es sim étrica
alred ed o r de X . Como q u iera que la can tid ad X — X está al cua­
d ra d o y no puede, p o r consiguiente, ser negativa, las desviaciones
resp ecto de X e n u n a u o tra dirección p ro d u c irán valores idén­
ticos de Y .
La ecuación específica p a ra to d a curva n orm al p a rtic u la r pue­
de o b ten erse em pleando los valores propios de I y s. E n la fi­
gura V II.4 p u ed en verse curvas n o rm ales de la m ism a desviación
están d ar, p ero d e m edias distin tas. P o r o tra p a rte , las curvas
de desviaciones e stá n d a r d istin tas v a ria rá n en la configuración de
las cúspides, ta l com o se indica en la fig u ra V II.5. C uanto m e­
n o r sea la desviación norm al, ta n to m ás p u n tiag u d a re su ltará
la curva.
H a b ría q ue señ a la r que no to d as las curvas sim étricas en fo r­
m a de cam pana son norm ales. A unque las curvas de la figura
VII.5 difieran e n cu an to a las cúspides, e sto se debe únicam ente
a diferencias en sus desviaciones norm ales. Todas ellas son n o r­
m ales en cu an to a la form a. P o r regla general, las curvas sim é­
tric a s unim odales p u ed en ser m ás o m enos puntiagudas o apla-

Fig. VII.5. C om paración d e dos curvas norm ales d e m edias


iguales p ero con desviaciones estándar diferentes

n ad a s q u e la curva norm al, au n siendo su s desviaciones e stán ­


d a r las m ism as. Algunas de estas curvas pueden verse e n la
fig u ra VII.6. Las que son m ás p u n tiag u d as que la n o rm al se de-

Fig. V II.6. C om paración d e una curva norm al con curvas de su


m ism a desviación estándar pero d istin ta s en m a n to a las cim as

signan com o leptocúrticas y las m ás p lan as que aquélla com o


platicúrticas. A d iferencia de la curva n o rm al, las ecuaciones de
las curvas lep to cú rticas y p laticú rtica s tien d en a c o m p o rta r m e­
didas de resum en, adem ás de la m edia y la desviación estándar.

VII.3. Á reas bajo la curva norm al


Con frecu en cia es n ecesario d e te rm in a r la p ro p o rció n de casos
que quedan al in te rio r de u n in terv alo dado. A fortunadam ente,
la curva n o rm al posee u n a p ro p ied ad im p o rtan te que hace que
dicha ta re a re su lte relativam ente sencilla. E n efecto, resulta
q u e in d ep en d ien tem ente de la m ed ia o de la desviación n o r­
m al que u n a curva ostente, h a b rá u n área constante (o p ro p o r­
ción de casos) en tre la m edia y una ordenada, que es una distan­

cia determ inada a partir de la m ed ia en térm inos de unidades


de desviación estándar. La figura V II.7 ayuda a ilu s tra r el sen­
tid o de e s ta afirm ación.
Así, pues, si vam os en u n a desviación está n d a r a la derecha
d e la m edia, en co ntrarem os siem pre .3413 del á rea incluida en tre
la m edia y la o rd e n ad a en dicho punto. P or consiguiente, dos
veces dicha área, o .6826 e sta rá n incluidas e n tre las dos ordena­
d a s situ ad as a u n a desviación e stá n d a r a am bos lados d e la m edia.
E n o tro s térm in o s: u n poco m ás d e dos tercios de los casos se
e n c o n tra rá n siem pre en el in te rio r de una desviación están d a r
de la m edia. Y en fo rm a análoga, el área com prendida e n tre la
m ed ia y la o rd en ad a a dos desviaciones e stá n d a r de aquélla será
siem p re .4773 y, p o r lo tan to , u n poco m ás del 95 p o r ciento del
á re a e sta rá co m prendido e n tre la p a re ja de o rdenadas a dos des­
viaciones e s tá n d a r a am bos lados de la m edia. P rácticam ente,
todos los casos esta rá n com prendidos en el in te rio r de tres
desviaciones e s tá n d a r de la m edia, aunque la curva n o rm al se
ex tien d a teó ricam ente al in fin ito en am bas direcciones. P o r su­
puesto, las d istancias de la m edia n o necesitan se r siem pre m úl­
tiplos exactos d e la desviación están d ar. M ediante u n procedi­
m ien to que vam os a d escrib ir en breve, es posible d eterm in a r las
áreas e n tre dos o rdenadas cualesquiera. P or ejem plo, si nos
ap a rtam o s e n 1.96 desviaciones e stá n d a r a am bos lados de la
m edia, com prenderem os casi exactam ente el 95 p o r ciento del
área, en ta n to q ue e n tre las ordenadas a 2.58 desviaciones n o r­
m ales de la m ed ia q u ed ará incluido el 99 p o r ciento del área.
E sta p ro p ied ad de la curva n orm al b rin d a u n a in terp retació n
de la desviación n orm al y u n m étodo p a ra re p re s e n ta r en fo rm a
visual el significado de e s ta m edida de dispersión. C ierto núm ero
de distrib u cio n es em píricas de frecuencia son lo b a sta n te sem e­
jan te s p a ra q ue estas relaciones e n tre las áreas y la desviación
n o rm al se verifiquen razonablem ente bien. Inclusive en el caso
de d istribuciones de ingresos, que p ropenden a disto rsio n arse en
la dirección de los ingresos elevados, encontram os norm alm ente
dos tercios de los casos en el in te rio r de u n a desviación está n d a r
de la m edia. H ay que te n e r presente, con todo, que au n q u e la
curva n o rm al p ro p o rcio n a u n a interpretación de la desviación
están d ar, esta p ro p ied ad no pu ed e em plearse p a ra d efin ir lo
que se en tien d e p o r desviación están d ar. L a definición se hace
en térm in o s de la fórm ula. La propiedad en cuestión sólo se
verifica en el caso de distribuciones norm ales o aproxim ada­
m en te tales.
R esulta posible to m a r cualquier curva n o rm al y tra n sfo rm a r
sus valores num éricos de ta l fo rm a que p u ed a utilizarse u n sim ­
p le cu ad ro p a ra evaluar la p roporción de casos al in te rio r de
cu alq u ier intervalo deseado. Vam os a ilu s tra r este proceso p o r
m edio de u n ejem plo num érico. Supongam os que tenem os u n a
cu rv a n o rm al con u n a m edia de 50 y u n a desviación está n d a r
de 10. B usquem os la pro p o rció n de los casos en el intervalo de
50 a 65. E m pezam os p o r d eterm in a r a cuántas desviaciones es­
tá n d a r se h alla 65 de la m edia 50. P ara ello tom am os la diferencia
e n tre estos dos valores, esto es, 15, y dividim os e n tre la m agnitud
de la desviación están d a r. E n el p re sen te caso el re su ltad o es
1.5. De m odo general podem os servirnos de la fó rm u la:

X -X
Z = ------------
s

10

en donde X es el valor de la ord en ad a y Z re p re se n ta la desvia­


ción con resp ecto a la m ed ia en unidades d e desviación están d ar.
* Antes de ex am inar cóm o p u ed e u tilizarse el valor num érico
d e Z p a ra d eterm in a r la pro p o rció n de los casos e n tre la m edia
y la o rd en ad a co rrespondiente a Z, perm ítasen o s d a r u n a in te r­
p retació n altern ativ a de ésta. Podem os p e n sa r en térm in o s de
u n a tran sfo rm ació n efectiva de la variable X en la variable Z.
E n ta n to q u e la d istribución d e la variable X es n orm al con una
m ed ia de X y u n a desviación e stá n d a r de s, la nueva variable,
en cam bio, es n o rm al con u n a m edia de cero y u n a desviación
e s tá n d a r de uno.8 E sta desviación con u n a m edia cero y u n a
3 La verificación de este hecho se deja como ejercicio (véase ejercicio 3).
desviación e s tá n d a r de uno se designa com o fo rm a estándar, y
la Z se designa a m enudo com o la marca. La tran sfo rm ació n de
variables se ilu s tra en la figura VII.8. S ustraem os de cada X la
co n stan te X . Al s u s tra e r este valor co n stan te (aq u í 50) de cada
X , hem os co rrid o cada m arc a original en 50 unidades a la izquier­
d a y, p o r lo tan to , hem os desplazado efectivam ente la curva

Fig. VII.8. C om paración de las fo rm a s estándar y general de la


curva norm al

n o rm al original a u n a posición d irectam en te sobre el origen.


E sto tien e en cu en ta el n u m era d o r en la expresión d e Z. Divi­
dim os ah o ra cad a diferencia X — X e n tre la m ag n itu d d e la des­
viación están d a r. Al hacerlo, o estrecham os la curva o la ensan­
cham os, según que su desviación e stá n d a r sea o n o m ayor que
la un id ad . Podem os, pues, p e n s a r que hem os desplazado prim e­
ro la posición d e la curva n orm al original y q u e luego hem os
cam biado la m ag n itu d de la desviación están d a r, de m odo que
quede so b re la fo rm a están d a r. Al dividir e n tre la desviación es­
tá n d a r de 10, hem os cam biado esencialm ente las unidades a lo
larg o del e je horizontal, d e m odo que u n a distancia de 10 sobre
el eje de X co rresponde a la d is ta n d a de 1 sobre el e je de Z.
In d ep en d ien tem en te de la in terp re tació n que se dé, un valor
de Z = 1.5 in d ica que la o rd e n ad a se en c u en tra a 1.5 desviaciones
e stá n d a r de la m edia. E n el caso de la fo rm a están d a r, esto sig­
nifica, p o r supuesto, que la o rd e n ad a m ism a coincide con el va­
lo r 1.5 de la escala Z. Se h a n co n stru id o tablas que m u estran
áreas exactas p a ra la fo rm a e stá n d a r d e la cu rv a norm al. El
cu ad ro C del A péndice 2 es u n a de ellas. Los valores de Z se dan
de a rrib a a b a jo en el m argen izquierdo, y horizontalm ente arrib a.
Los dos dígitos de Z se o btienen leyendo de a rrib a abajo, y el
terc ero leyendo horizontalm ente. L as cifras del cuerpo del cua­
d ro indican la p roporción del á rea e n tre la m edia (o sea cero)
y la o rd e n ad a co rresp o n d ien te a Z. E n el ejem plo an terio r, ve­
m os que se hallan contenidas e n dichos lím ites las .4332 del área.
Si Z h u b iera sido 1.52, el área co rrespondiente h a b ría sido .4357.
VII.4. Ilustraciones suplem entarias del em pleo de la tabla norm al
Supongam os que querem os h a lla r el área ach u rad a de la curva
norm al indicada en la fig u ra VII.9. E n este caso el valor de Z e s :

143 - 168 -25


= -2 .0 8
12 ~12~

El hecho de que Z sea negativa indica sim plem ente que el área
ach u rad a se sitú a a la izquierda de la m edia. Al u tilizar la tabla

F ig . VII.9. Curva norm al, con porción achurada representando


el área en una sola cola

norm al, el signo de Z puede ignorarse, ya que la curva es p e r­


fectam ente sim étrica. Del cu ad ro vem os que el área com pren­
dida e n tre la m edia y u n a Z de 2.08 es .4812. Como quiera que
el á rea to tal es la unidad, el á rea a la izquierda de la m edia h a
de se r .5 (p o r sim etría). P or consiguiente, el área ach u rad a puede
o b ten erse re sta n d o el área com prendida e n tre la m edia y la
o rd en ad a del área to ta l a la izquierda de la m edia. Así, p u e s :

(P ro p o rción de casos ^ 143) = .5000 — .4812 = .0188

P or lo tan to , m enos del 2 p o r ciento de los casos tienen m arcas


in ferio res o iguales a 143.4 El tipo de problem a ilustrado en este
ejem plo es m uy co rriente, debido al hecho de que las com pro­
baciones d e hipótesis casi siem pre com prenden las colas de u n a
d istrib u ció n de frecuencia. Si hubiéram os qu erid o h allar el área
4 En una distribución continua, la proporción de los casos que sean exac­
tamente 143.0 será cero. Esto puede verse si imaginamos dos ordenadas
extremadamente próximas una de otra. La proporción de casos entre estas
dos ordenadas será también muy pequeña. Y si a continuación dejamos
que las dos ordenadas se vayan aproximando indefinidamente, la propor­
ción de los casos se hará infinitamente pequeña. Recuérdese que la línea
matemática no tiene grueso. En la práctica podrá haber algunos casos con
marcas de 143.0, debido a defectos de medición. Sin embargo, como quiera
que estamos tratando de una distribución teórica, no importa que la orde­
nada ella misma se incluya o no en el intervalo. En adelante, nos referi­
remos simplemente al área entre dos ordenadas (pero sin comprender a
éstas), o área inferior a un valor dado.
to ta l fu e ra de la región definida p o r 168 ± 25 (com o la indican las
á re a s ac h u rad a s de la fig u ra V II.10), h ab ríam o s doblado simple-
m e n te el re su lta d o an te rio rm e n te obtenido, ya que las dos áreas
ac h u rad a s son exactam ente del m ism o tam año.
P a ra to m a r o tro ejem plo, supongam os q u e necesitam os obte­
n e r el área a c h u rad a indicada e n la fig u ra V I I .ll. E s ta á rea se

Fig. V II.10. C urva norm al, con porciones achuradas presentando


áreas en am bas colas

calcu la h allan d o p rim ero la p ro p o rció n de casos e n tre la m edia


y la o rd e n ad a B y su strayendo luego la p roporción de casos e n tre
la m ed ia y la o rd e n ad a A. Las Z co rrespondientes a B y A son
re sp ectiv am en te 2.0 y 1.2. Tenem os, p u e s:

P rop o rció n e n tre B y la m ed ia .4773


P rop o rció n e n tre A y la m ed ia .3849

P roporción e n tre A y B .0924

P o r consiguiente, ligeram ente m ás del 9 p o r cien to d e los casos


q u ed a n e n tre .42 y .46. O bsérvese que si se h u b ie ra deseado obte-

Fig, V I I .ll. Curva norm al con porción achurada, representando


el área entre d o s ordenadas

n e r el á re a e n tre o rdenadas a am bos lados de la m edia, el resu l­


ta d o se h a b ría obtenido m ás fácilm ente p o r adición que p o r
su stracció n .
G losario

Leptocúrtico
Distribución de frecuencia límite
Curva normal
Platicúrtico
Marca estándar

E jercicios
1. Ya se calcularon la media y la desviación estándar de los datos del
ejercicio 1, capítulo iv. ¿Cuál fue la proporción de los casos dentro
de una desviación estándar de la media? ¿Al interior de dos desviacio­
nes estándar? ¿De tres desviaciones estándar? ¿Con cuánta aproxima­
ción corresponden dichas cifras a las que encontraríamos si la distri­
bución fuese exactamente normal? Contéstese a las mismas preguntas
en relación con el ejercicio 2, capítulo iv. Compárense y expliqúense
las diferencias entre los resultados de los dos grupos de datos.
2. Si la media de una distribución normal es de 80 y su desviación
estándar de 12,

a) ¿Qué proporción de casos se halla entre 80 y 93? Respuesta, .3606.


b) ¿Qué proporción de casos se halla entre 90 y 105? ¿Entre 70 y 105?
Respuesta, .1838.
c) ¿Qué proporción de casos es inferior a 68?
d) ¿Cuántas desviaciones estándar se necesitarían a ambos lados de
la media para obtener dos colas que comprendan cada una el 2
por ciento exactamente del área total? ¿El 10 por ciento del área
total? Respuesta, 2.054.
ej ¿Cuál m arca tiene por encima de ella el 4 por ciento de los casos?
(en otros términos, sitúese la percentil 96).

* 3. Verifiqúese que la form a estándar de la curva normal tiene una


media de cero y una desviación estándar igual a la unidad. (Indica­
ción: vuelva a escribirse la fórmula de la curva normal en términos
de Z, aprovechando el hecho de que Z = (X —X)/ s. )
4. Las calificaciones primarias de diversas pruebas de aptitud y
actitud son tratadas a menudo por los psicólogos como escalas de
intervalo. Dichas calificaciones suelen a menudo convertise luego
en calificaciones estándar con medias y desviaciones estándar conve­
nientes. Supóngase que la calificación media prim aria en un examen
de admisión en la universidad es de 117 con una desviación estándar de
28.5. Supóngase, además, que esas calificaciones primarias están dis­
tribuidas normalmente.

a) ¿Cuál es la proporción de calificaciones por encima de 131? ¿De­


bajo de 79?
b) ¿Cuáles son las calificaciones primarias correspondientes a los
cuartiles primero, segundo y tercero?
*c) En los exámenes de la universidad, las calificaciones primarias
se normalizan de modo que la media de la distribución normal
sea exactamente de 500 y la desviación estándar de 100. Concre­
tamente, ¿cómo se norm alizarán los grupos de datos anteriores
para obtener una medía de 500 y una desviación estándar de 100?
(Indicación: ¿cómo se normalizaría para obtener una media
igual a cero y una desviación estándar igual a la unidad?)

B ibliografía
1. Downie, N. M., y R. W. H eath: Basic Statistical Methods, 2‘ ed.,
Harper and Row, Publishers, Incorporated, Nueva York, 1965, cap. 6.
2. Hagood, M. J., y D. O. Price: Statistics for Sociologists, Henry
Holt and Company, Inc., Nueva York, 1952, cap. 14.
3. Mueller, J. H., K. Schuessler y H. L. Costner: Statistical Reasoning
in Sociology, 2‘ ed., Houghton Mifflin Company, Boston, 1970,
cap. 6.
4. Weinberg, G. H., y J. A. Schum aker: Statistics: An Intuitive Appro-
ach, Wadsworth Publishing Company, Inc., Belmont, Cal., 1962,
cap. 8.
5. Weiss, R. S.: Statistics in Social Research, John Wiley & Sons, Inc.,
Nueva York, 1968, pp. 147-156.

Você também pode gostar