Você está na página 1de 20

Exposición general e indicaciones para el uso

de la distribución lognormal

por F. AZ^RIN y M. J. PALACIOS


Departamento de Estadística. Facultad de Ciencias
Unlversidad Autónoma de Madrid

o. INTRODUCCION

En diferentes campos de aplicación se hace uso de distribuciones asimétricas


con fines de análisis, ajuste, inferencia y predicción; así, en la etapa de elección
de modelo representativo o especificación de un sistema estocástico cuyos resulta-
dos aparecen más o menos asimétricamente distribuidos, suelen aonsiderarse como
posibles candidatos las funciones de d^ensida^d gamma, beta, de Pareto, normal
truncada, lognormal y otras. Entre éstas tiene especial interés la lognormal o
logarítmico-normal por la sencillez y fácil interpretación del esquema aleatorio
que puede originarla y por las propiedades que la caracterizan.
Su empleo se ha extendido considerablemente, a lo que, sin duda, ha contribuido
la obra monogró,fica de^ Aitchison y 8rown (1957) y su utilidad práctica en aplica-
ciones muy diversas: biológicas, económicas, geológicas (estud^io de partículas,
concentración en depósitos, espesores de capas, etc.).
Pvr ello creemos de interés la presentación sistematizada de los principales ele-
mentos que requiere su utilización, para facilitar el trabajo de los interesados en
sus posibilidades y limitaciones.

1. DISTRIBUGION LOGNORMAL DE DOS PARAMETROS

Se dice que una variable aleatoria tiene distribució^n lognormal o logarítmico-


normal cuando su transformada logarítmica (o, rnás generalmente, la transforma-
ción lflgarítmica de una transformación lineal de la variable original) tiene una
distribución normal. En el caso más simple, que es el que se considera en este
apartadb, se dice que la variable X es logn^ormal si la función de densidad de su
transformada logarítmica Y! log X, es la normal N(«, a-):
8 BSTADISTIGA E.SPAlYO].A

1
-. exp (- ^y -- ac)^/2 cr^ para y E(- oo, vc^ [ i.il
cr ti1 2 rr

Aunque en las aplicaciones prácticas se supone el logaritmo decimal, para los


desarrollos algebraicos que siguen 1© más simp:e es Cuponer que es neperiano t 1)
[ sin ernbargo, al final deI aparta^do 2 se expondrán los resulta.dos correspondien-
cix
tes a logaritmo decimal t2), con lo cual x^ exp (y) y, por consiguiente, dy ' ,
x
que sustituida en f 1.1I da lugar a la funcián de densidad^ de la variable X:

1
fL (x) - exp ^-- (log x -- ^^ )^/2 ^r= ^ ; x E (0, ^) [ 1.2]
cr ^✓ 2 >t

Abreviadarnente se dice que ]a variable X es L(,^, ^rl y su trans^formada, Y,


N (x, +rr^-

2. CARACTE.RISTiCAS DL'. LA DISTRIBUCIOIV LOGNURMAL


DE DOS PARAMETRC^S

Puesto que X- exp (Y), la función generatriz de momentos de Y verificará:

^^v (t^ - E [exp (tY^^ .- E (Xt) [2.i1

Por tanio, para t- r el momento r-ésimo ordinario de X tque de ahora en ade-


lante se dotar^, de subíndice para evitar confusiones con el de la normal), será:

ar fx . = E (X r) = ^v (r) [ 2.2 ^

Por otra parte, a1 ser ^ la funcián generatriz de una variable N(a, cr):

^v (t^ - exp (oc t + t^ ^-$^2j

y, por consíguiente, el momento ordinario [ 2.21

xr, x-' eXp (!X 1' -^- (T" r' /2^

(i) Conviene recordar que en general se verific^x, para una base b cua,lquiera:
b lo^; = eiog ^

log. x
log, x= _(log, x) ilog. b)
log. e
en particular para logaritmos decimal•3s:
log^. x logt, x
log, x _ _ -. log,. x• log. 10 - 2,30258... log,. z
loglo e ! 0,43429... T

(`'l ^éase al final de esta exposición la relación de ^ímbolos ampleados.


EXPOSICION GENERAL E INDICACIONES PARA EL USO DE LA DISTRIBUC10:^3 iOGNORMAL 7

En par^ticular, la esperanza o media lognormal

xl =- E(X^ = exp (z -f- cr='^`2) 12.3)

la, varlarlZa IO$nOrln&^

o^^z ^ . (X^) -- E (X) ^ - exp (2 x + 0^2) • ( exp (v-2) -- 1 ^ [ 2.4 ]

el cuadrado del coeflciente de variación

$^
^ -.- exp (cr^ -- 1

el coeflciente de asimetría

! (exp - 1 ^^ eXp (^2) + 2^ > 0

y el de curtosis

lu^.z
^ 2̀,9c - 4 .- exp (4 0-^^ -t- 2 exp (3 v-a^ -{- 3 exp (2 v-^^ - 3
^s

Cuando exp (^^) se acerque a 1, disminuirá la varianza y la asimetría, y el


coe8ciente de curtosis se acercará a 3, que es el de la normal.
En cuanto a los cuantiles, cua,ntilas, percentiles, centiles, fractiles o valores
divisorios, se tiene, en general, para la cuantila r-ésima de orden s, es decir, la
que ocupa el lugar r entre las que dividen el á,rea de la curva en s partes iguales,
en ambas distribuciones [ i. i l y [ 1.31;

f
^Tr Ja.t!

fL (L/,) (^ l.^ _= fN (V) G^ V

es decir:
lo,g rr ^a, x-^r J^, ,J o bien ^r^^, y `-- eXp (^r ^ ^. 1/)

En particular, la mediana ^C^,,^ = exp (µe, U) = exp (x^, por ser mediana y media
coincidentes en la distribución normal; y las cuantilas primera y tercera serán:

^1^4, z = exp (a -- 0,675 . . . o-^

^r3^^, z .- exp (a -1- O,1375 . . . v-^

La m©da se o?atendrá al igualar a cero la derivad^a primera de la función de den-


sidad [ 1.31, resultando
,
ud, s--- exp a-- cT`)
8 83TADISTICA ESPAÑOI..A

CASO DE LOGARITMO DLCIMAL

A continua^ción se indican las características de una distribución lognormal, en


la que el logaritmo se ha considerado con base decimal; los 9ímb41os se corres-
poncien con las antes empleados:

[2.51

[2.61

[ 2.? )

[2.81

[2.9)

[Z.io^

3. EST"IMACI4N Y AJIJSTE

La media rnuestral, esto es, la media de las observaciones obtenidas con una
muestra aleatoria simple es un estimador insesgado de la media teórica de la
variable en estudio en la población de procedencia. Designando por X esta varia-
ble, el estimador insesgado de la media ser^á

_ ^ xt^n [3.11
i=2, n

y el de la varianza cTx
-- 1^ [3.21
^ _ ^i ^xt - a ^^^^ln,
f^l, tt

La pmpiedad de ins^esgamiento se verifica cualquiera que sea la distribución


de origen; si además hay fundamento para especificar determinada distribución,
puede ocurrir que otros estimadores, insesgados o no, tengan propiedades que los
hagan preferibles a los antes indicados. Por ejemplo, si la distribución de p^roce-
dencia es lognormal, los estimadore^ obtenidos indirectamente a partir d^e los loga-
ritmos de las observaciones son m^s precisos en el sentido de que tienen menor
varianza en el muestreo.
La media y la cuasivarianza de los logaritmfls de las observaciones son:

á„ _ ^ log x,^n [3.31


tal. w
EXPOSICION GENE^i.AL E INDICACIONES PARA EL USO DB LA DISTRIBUCION IAG NORMAL 8

ó-y = ^ (log xi -- x^}2^(rL - 1^ [3.41

Estas^ expresiones son, por tanto, estimadores insesgados en la distríbución de


los logaritmos; sin embargo, debido a las relaciones [ 2.3 ] y[ 2.41 sus antilogarit-
m^os no serán estimadores insesgados de la variable original, empleándose como
estimadores en esta distribución (Aitchison y Brown y Koch y L.ink) los siguientes:

á^.v = eXp ^x^^ ' ^ri ^^y^2^ [3.51

n--2
c^-x ^ exp (2 G^cy^ . ^n (2 v-^ ^ -- t^i'n c:r^ [3.61
n -- 1

donde los valores de ^n están tabulados en las obras antes citadas. Dichos valores
aumentan con Q-^ y con el tamaño muestral, n; para n suficientemente grande, ^J es
aproximadamente igual a la función exponencial, con lo que se conservan las re-
laciones [2.31 y[2.41. Por ejemplo, para n - 2 y ^-^ --^ 0,1 es ^n = 1,025, y para n= 50
y ^2 = 4 es ^n = 6,628.
Si se parte de observaciones agrupadas en clases (loglo xi_1, logl© xi) i= 1, ..., m.,
con ni observa^ciones en dicha clas^e, se puede tomar como estimador de la media
de los logaritmos :

2,30258, . . ., ^ n^ logt^ x^
í -^ 1. ^n
z° _ ^, [ 3.7 ]
^ ni
i=1, m

en donde log ° x= designa la marca de clase del intervalo i-ésimo. Análogamente,


el estimador de la varianza

^^ ni (2,30258, . . ., logó x1- ^)'^


é^I,m
^ry ^ , [ 3.81
^ ni - 1
i.--1, m

La elección entre los métodos de estima^cián indicados, y otros posibles, depende


de las propiedades d^e los estimadores correspondientes^ y de las facilidades de
cálculo. Y las propiedades dependen, a su vez, de la distribución de origen y del
procedimiento de muestreo. Por ejemplo, la eficiencia de la media directa, á, de
las ob^servaciones disminuye en forma conocid^a, según demostró Finney (1941), al
aumentar el coeficiente de variación de la distribución Iognormal. Esta eflciencia,
que es del 100 por l00 para S= 0, pasa a s^er del 90 por 100 para ^= 1,2, menor
del ?5 por 100 para ^= 2 y menor del 60 por 100 para ^= 3. Por otra parte, los
estimadores c^ , c^^ pueden tener sesgos si la distribución de p^rocedencia no es,
como se ha supuesto, lognormal, lo que n^o justificaría la mayor complicación de
cálculo en los casos de especificación más dudosa.
Pueden vers^e varaios métodbs de estimación y aj uste y comparacic^n de resulta-
dos en Aitchison y Brown y en Koch y Link; los primeros recorniendan, para

^,.
l0 B.SiTADISTICA ESPAÑOLA

rnuestras gra.ndes, una estimación por cuantilas, por su sencillez de cz^.lculo y


porque su eflciencia puede superar al SO por l00 del estimador más eficiente. Las
relaciones entre cuantilas dan para las simétricas del mis^rno orden: log ^rr^,, x=
- Q-- k^ ^r y logl ^r,^,,,^ ^ a^ + k,^ cr, donde ky es la consiante asociada a Ia cuan-
tila en la distribución de I'; por consiguiente, desígnando por pr,^ las cuantilas
observad^as
10$' pr^i. ^ + ^Og pl-r/s. ^c

2 -
2

log p^-r^,.: - log prr.. ^

generalmente se utilizan las cuartillas prirnera y tercera aunque se consigue mayor


eficiencia con las p, ,^, y A^^,^,.

4. APLICACIONES DEL PAPEL PROBABILISTICO A LA DISTRIBUCION


LQGNORMAL (3)

Si X es una variable aleatoria lognormal, L(x, ^-), su función de distribución,


F (x), puede escríbírse:
log x -- a
[4.11
F (x^ _` c^ ^-

en donde ^ es la función de distribución de la N(o,l). Por tanto, si se hace la


transformacidn
^ ^ log x , ^^ _ ^-^ [F (x)^ [4.21

la curva [4.11 se transforma en la recta

t4.3]

El papel probabilístico correspondiente al sistema (^, ^ ^) se llama normal-logarít-


mico o gausso-logarítrnico y consta de :
1. Un eje, el de abscisas, construido a escala logarítmica y con doble escala indi-
cativa; Ia aritmética, correspondiente a los logaritmos y la de los antilogaritmos
(véa,se p. 23).
2. Un e^ e de ordenadas aritmético en >> _^^-1 [ F(x):) y también con d^oble esca-
la, la segunda correspondiente a F(x^ _^(rj).

(3) Varios ejeniplos de aplicación del papel pr^babilístico a problemas relacionados con la dis-
1.ríbucíán Iognormal pueden v^srse en G. CAr.aT (pp. 193 y ss.) y Kocx y LiNK (pp. 23? y as.).
EXPOSICION GENERAL E INDICACIONES PARA EI. USO DE LA DISTRIBUCION IAGNORMAt lI

Un papel de este tipo se incluye en la p^.gina 23. En él está^n señalizados en un


eje los antilogaritmos decimales, aunque para fle^ibilidad de representacián sólo
se indican los dígitos 1, 2, 3, ..., 9, repetidos con ia periodicidad adecuada, lo
que permite representaciones, según los casos, de números del 0,5 aI 20 o del 5 aI 200,
etcétera; el eje vertica^ contiene también dos escalas, una correspondiente a
100 F tx) y otra, aritmética en crr^ (4).

Qr^ EXAbIEN DE LA HIPÓTE.SIS DE LOGNORMALIDAD

Dada una distribución empírica xI, x.,, ..., x,^, con frecuencias relativas n,/N, ...,
n^/N, N- ^ nt sru representacián en papel gausso-logar-ftmico se hará por los
f-1, k
puntos (x^, F^), i= i, k, donde Fr .- ^+... + n{ .
N
Si la d^istribución está agrupada en intervalos a^ --- a,, aI -- a y, ..., a,^_ 1 -- a,^, con
frecuencias r^f/N, los puntos a representar seré.n (ai, Fi), i- 1, h, donde, como en eI
caso anterior, F{ - F (a{).
Si los puntos así representados se alinean sensiblemente, según una recta que
sería la ^=(,^ -- a)/o-, se podrá aceptar con este criterio gráfico que la distribución
empírica es lognormai y sus pará,metros podr^.n estimarse como a continuación se
indica.

b) ESTIMACIÓN DS a T cr

i. Puesto que a es la abs^cisa, en la escala aritrnética, del punto de corte de la


recta [4.31 con el eje de abscisas, ya que F(x) ^ 0,5 y, por tanto, ^= x, resulta que
si x* es el punto que indica esta intersección, será «^ log x*.
2. Análogamente, F(x) ^ 0,9772. ., si y sólo si ^._- a+ 2 ^; por tanto, si x* * es
el correspondiente valor, será cr ^( 1 /2) log (x* */x*), siendo x* y x** tales que
F(x*) ^ lJ,5 y F(x**^ - 0,9772...
Como dice G. Calot, es^tas estimaciones pueden ser más precisas que las analíti-
cas por no estar afectadas del error d^ agrupamiento en clases; sin embargo, hay
que tener en cuenta que ajustar una recta a los puntos (a,, F^), i.- 1, h, también
puede conllevar un error subj etivo.

C) C^BSERVACIONES SOIIRE LOS INTERVALOS DE PROBABILIDAD PREPTJADA

Es conocido que en Ia distribución N(^^ , c^) los intervalos de la forma (« f h a-)


con ^, = 0,68, 1,96, 2,58, 3,29, son importantes en cuanto que son centradas en media
y aontienen, respectivamente, el 50 por 10^0, 95 por 100, 99 por 100, 99,9 por 100 de la
distribución. Ahora bien, se quiere hacer notar que los correspondientss intervalos

í4) Dicho papel contiene, además, líneas verticales equidistantes que pueden utilizarse como
las marcas de clase de una distribución agrupada en intervalos; ello corr?sponde a tomar en la
distribución de los logaritmos clases de amplitud constante (de tamaño múltiplos decimales de
0,125 en este papel). En ol ejemplo de la p. 23 no se ha, tenido en cuenta esta posibilidad.
12 BSTADISTICA ESPAÑOLA

para la distribución lognormal serán exp (x --,^ cr), exp {^ -^t ^r) y, por tanto, no
centrados en media ni ta.n siquiera en mediana.
Por otra parte, si X es L(a, cr}, entonces el valor x^. tal que P ( X > xt) - E puede
obtenerse para e^ 1/2, de xe - exp (ac + crh,^), siendo ^.^ tal que:

P{^Z^>^.^) .- e

dond^e Z es N (0,1}; ell© se debe a que si Z es N (0,1), entonces para 0^ p c 1/2 es


P( ^ Z>> Ap) - P=^' (-- J1_,,} Y, por tanto,

^ --. P(X>x,^} -- 1-F(xQ} = 1-c^^((log x£`x)/^ ^ - ^^-'^-(log x^--aÍ^^) _


= ^^ (- ^^}, y alsi : xE ^ exp (x -+- cr A^^ )

Al final de esta exposición se incluye un ejemplo numérico de los métodos hasta


aquf expuestos.

s. RELACIONES ENTRE LAS CARACTERISTICAS DE LA DISTRIBUCION


NORMAL Y DE LA LOGNORMAL DE DOS PARAMETROS

Adem^s de las relaciones de la sección 2, y en virtud de ellas, se verifican


las siguientes expresiones en las que aparecen las características de la distribu-
ción normal en función de las de la lognormal:
x= 2 log al,^ - t1^2) log x.^,,^ d©nde ,^^,? = E(Xa)

rr" = l^g ^^2 .ac^al, x} - l^g ^1 + °^,^ /^ 1, ,^^

x- log ^t^14, x= log µ^ ^

^T = (1^2 ^,) log (^r^,^.x^^r,^#,x) donde A = 0,675 ...

6. FUNCIOIVES DE VARIABLES ALEATQRIAS LOGNORMALES

Puesto que combina^ciones lineales de variables aleatorias independientes dis-


tribuidas normalmente dan lugar a variables con distribución normal, se verificará:
Si X,, XZ, ..., Xn son variables aleatorias independientes con dis^tribución L(^,^, v-k},
k= 1, n, y hl, h^, .. ., h„ sfln números enteros, entonces la variable aleatoria Y= xhl,
^
Xh', ..., Xh'^ tiene distribución L(^c, cr) donde

^c = II h^: _^, Y (T^ --- II hk o-^k


k=1, n k=1, n

En particular:
1. El producto de dos variables aleataria,s independientes, X1, X^, lognormales
tiene distribución L{al -1- a^, ^/ a? + rr^^ )
F^CPOSICION GENERAL E INbICACIONF.S PARA EL USO DE LA DI5I'RIBUCION LOG NOR.MAL 13

2. E1 cociente de dos variables aleatorias independientes lognorrnales tiene dis-


tribucibn L (a, - x j, ^Y ^g -}- ^Y ).

7. EXTEI^TSi(^N A LA DISTRIBUCION LOGNORMAL DE TRES PARAMETRC3S

Si en lugar d® la transformación Y= log X, considerada en la sección 1, se


efectúa Ia más general:
y --. log (X - ^3)

en donde ^ es un parámetro real y X>/^ , se tiene la función de densidad lognar-


mal de tres parámetros :

f (x) - 1 exp( ( lag (x -- ^3) --- x ]^^ /2^ra.


i ^
(x - ^) ^ ^✓2^

Las características de esta distribución resultan ser:

xr x- E(Xr) _ ,^ ( k) ^3r~^ exp (h x + kry cr^^2)


k,^o,r

en particular, la media

x^. r=/^ -#- exp (^ + v-^^/2) 17.11

Los momentos centrados

fu^. ^ _ ^E (x) - E (X )^r - ^ ( - 1)^` ( ^: ) exp I ra -}- (r -- Y^" -i- h) ^` ^2^


^ ^a. P

resrultan independientes de /3, en particular la varianza

Q `^ = rexp (2 x + a-A)^ ^exp (cr2) -1 ^ [ 7.21

el coeficiente de variación

óx = ^^exp (x + c^^/2)^ ^-exp (^r=' ---- 1 ^ J_^


^^+exp (x-^-cr^=/2)

las cuantilas
^ ^,)
;, r,s, ^. _ ^3 -t- exp „,.,^,

y en particular, la mediana

lar moda

u^. :^ = /^ + eXp (^ ^ ^` 1
19 gsr^,nisric^ Esp^ÑO^

y el coeficiente de asimetría

^i. Z = (2 + exp c^-'l) ^eXp


,I^^;^}u

que es creciente con o-.

Estas relaciones dan lugar a otra.s, inversas de ellas, y que se indican a con-
tinuación:

1
^c - 21og (^i,,^ -- ^Í ` 2 l^g ^x^,: -- a 1^ ai. ^ + 1^) [?.3]

x
^z;^.t^ t^= ;,r ` ^1 {,:r ^1 (fiZ,^{^r -^- ^3^*, x
^ Z ?i ^ f^
r/J
[?.41
^ log ^. `^3:+.x

og ^ 1 + r ^(x^. ^----- ^^^^'^l [ ?.5 ]

^r = 1^ log (rr
^ 3!4, r ^4,r^^t^;,,^,^ ' ^1^^,^}^ A, = 0,675 ... [?.6]

[7.7^
^^ -^^ 114. 2^3^^, aC !^2/4^ x I l\^ 114, x+^^(4. x- 2^`^14, r^

Esta última expresián tiene interés, ya que permite una aproximación no dema-
siado complicada, además de ser la única analítica, del tercer parámetro de la
distrik^ución lognorznal.
En cuanto al empleo de la distribución lognorrnal de tres par^,metros en algu-
nas aplicacivnes concretas, deben tomarse especiales precauciones por las dificul-
tades en estimar ^3 cuando la muestra es pequeña. En general, una subestimación
de ^ Ileva a varios sesgos en la estimación de la media (Koch y Link), pero s^u
sobreestimación puede dar lugar a límites de confianza demasiado próximos, por
ser demasiado pequeña la varianza de los logaritmos.

8. ACEPTACION O RECHAZO DE LA HIPOTESIS DE LOGNORMI^LIDAD CON


PAPEL PROBABILISTICO

De forma, análoga al caso de la d^istrib^ución lognormal de dos pará,metros, se


puede examinar gráficamente la lognormalidad en una distribución de tres pará-
metros; puesto que si X es una variable aleatoria L(^(^, x, rr) tiene función de dis-
tribución

F (x) _ ^^ [(log (x - ^^) -- ^)/tT J [8.1 ]

resulta que, según que ^(3 sea conocido o no, se podrá realizar una transformación
sobre el sistema de coordenadas para que la curva 18.1 ] se convierta o no en
una recta.
F:JCPOSICION GSNF:^RAL E INDICACIONES PARA EI. USO DE LA DISTRIBUGION IAGNORMAL 15

a) Si ^ es conc^cicia.--En un sistema caordena^do (^, r^) donde = log (x - ^3)


y,^ -^^ -^ 1 ( F(x) ], la curva t 8.11 se transf orma en la recta

^-^
C8.21

y se mantienen ias consideraciones de la sección 4, con sólo repres^entar los pun-


tos x^ -- ^3 (h = 1, n) en el eje de abscisas. Resultando como estimación de z y cr,
respectivamente:

^^ .- log x* = log (x' - ,,^)

siendo x' tal que F(x') --= 1/2.


1 x* * 1 x" --- ^3
c.^- - log = log
2 x* 2 x'-^

siendo x" tal que F(ac"^ - 0,9??2...


E1 intervalo [ f3 -1- exp (a -^la-), ^3 + exp (u +^cr)] corresponderá al (« t Ac^-) de la
normal y el valor xg -^3 -{- exp (^ -}- o-^2F) será tal que P(X > xE) .= e.
b) Si /3 es desconacida.--En este caso caben dos posibilidades. Realizar una
estimación analítica del tipo indicado en la sección 7, o bien tratar de encontrar
una estimación gráfica como a continuación se establece.
A1 ser ^ desconocido, la transforma^ción a hacer será ^.^ Iog x y f1 =^-1 [ F(x) ],
con Io que la curva [8.11 se transformará en la

log (exp ^ - ^C3) -- x


a~

A continuación se estudia esta curva distinguiendo que /3 sea pos^itivo o negativo:


1. /3 > 0. La, curva existe para todo valor ^> log /3, siendo ^= log ^f3 y
` a
,=
J ^! asintotas vertical y oblicua, respectfvamente.
^r

FIGURA 1 FIGURA 2
16 LSTADISTICA ESPAÑOL^^

^. /; ^ o. La curva tendrá existencia para todo valor positivo de ^, siendo


f^ _. ^ lag (- ^,') - ^^/cr y ,^ _ (^ - =)/^T asintotas horizontal y oblicua.
En cualqu:era de los dos casos, sea (0, r^^) un punto arbitrario del eje y sean
(^,, ^^^,) y(^2, .^1u) los puntos correspondientes en la asíntota oblicua y en la curva;
entonces:

^1 = ^ -^ ar t]n y ^^ = log ^ IQ + exp ( x+ cr r^c^ ) ^

ahora,
,^ ^= log x' y ^,^ = log x"

por tanto:

,^ -- x" - x^

y ésta será una forma de estimación de ,^3 (véanse figuras 1 y 2).


E1 problema práctico consiste en determinar la asíntota oblicua; ello puede
hacerse eligiendo una recta tal que la desviación horizontal entre la curva y ella
se mantenga, aproximadamente, conytante cuando es medida en antiiogaritmos, y
comprobando después que ^ = log /3 0^^ _[log (- ^3) - x^/^- es asfntota vertical u
horizontal, respectivamente, para ^3 > 0 0^3 < 0 t5).

9. EXTENSI(JN A LA DISTRIBUCION LOGNORMAL DE CUATRC^ O CINCO


PARA1ViETR05 Y A LA DE ASIMETRIA NE(^ATIVA

Si en lugar de las transformaciones de las secciones 1 y 7 se efectúa la más


general :
log (x ""' ^1) [ 9.11
y = ^s + ^^

que se reduce a la de tres parámetros cuando R3 = 0 y^.3^ = 1, y a Ia de dos cuando


adem^ís ^3^ ^ ^, se tiene la función de densidad de la variable aleatoria X:

f l( xI1 .- ^a e X p^ j
l,^3+ 3,, 1 o
3 ^. g( ^1) ^/ , x- -^^ 2 v-'' x^ (/^^
lNl^
^ao j
I
cr ^/ 2 ^t (x - %31^

con cinco parámetros: L (a, ^, ^1, ^2, ^3'3).


Para la de cuatro (^33 - 4) se verifica para la función generatriz de momentos:

^^ y r r r 1 r r
^^•' -' ^ ^-, x - (1) 1^1 ^,^-1. .r + . . . -}- - ) ^Q i

y, por tanta, la media

xi.x = I^ji + exp [(x -^- crl/2)/l^•.^

(5) Véase nota (3) de la aección 4.


E3LFOSIGION GENERAL Ir INDICACIONES PARA EL USO DE LA DiSTRIBUGION LAGNOR!tiiAL 1^

y la varianza

^r^-' -- [exp (2 ^c -1- cJ-^}lÍ^ ^^ ( eXP (_`" ^.^`^/,^^7) ^ 1.^

Por otra parte, la transformación

y - log ((3 -- x)

da como función de densidad de la distribución lognormal de asimetría negativa:

f (x^ = 1 exp x E {-- a^, ^)


L - [log (^3 - x) + ^]^^^ °`:: J
cr ^✓ 2 7t (^3 - x^

Esta distribución constituye una representación simétrica respecto a un eje de


la correspondiente de asimetría positiva y tiene en valor absoluto las mismos
parámetros. (Véase Koch y Link para aplicaciones.)

l0. P4SIBLES MECANI"SMOS GENEr.RADOF^ES DE LA DISTR,IBUCIQN


L4GNORMAL

La distribucián lognormal puede originarse a través de ciertos mecanismos


aleatorios, como, por ejemplo, cuando el incremento de una variable es función de
su valor anterior, multiplicada por una variable aleatoria, esto es:

xc ^ xt-i - Et g (xc-i^ tlo.ll

Esta es la llamada teoría del efecto proporcional, que fue forrnulada por Kapteyn
en 1903, y en la que se supone que las et son variables aleatorias independientes
(frecuentemente se suponen también con igual distribuciónl, y que L1 X es una
proporción aleatoria del valor anterior de la variable. (Véase Aitchison y Brown,
así como Agterberg.)
Casos particulares importantes de [ 10.1 ] son :

a1 Cuando la función ^r se reduce a una constante, se tiene entonces

Xt ^ ^ ^k
n^i, c

Y en virtud del teorema central del límite, su distribución tiende a la normal.


bl Cuando p(X t_1} - Xx _^, se tiene

^ xh -- xn-i
^ - ^ ^n
h sl , i x^h-^ 1t-1, fi

ESTADISTICA BSPAÑOI.A.-2
1$ $sTADísTíCA FSPAIíiQ1.A

que en el limíte resulta

dx
i log Xt - log X^
x

o bien

1©g Xt = log Xn -}- ^ ei


^.^^. ^

según lo cual la distribución asintótica de X, es la lognormal.

11. ALGUNAS APLICACIONES ESPECIFICAS DE LA DISTRIBUCION


LOGNORMAL

Ya se han mencionado en las secciones anteriores algunas aplicaciones de la


distribución lognormal, y en la blbllografla se hace referencia a obras que^ tratan
con detalle algunos cas^os pr^cticos. Aplicaciones geolágicas pueden verse en las
de Agterberg y en las de Koch y Link. En esta última se dedica amplia exten-
sión (cap. 1s) a esta distribución en relación con datos procedentes de minas de
oro en Africa del Sur. Los problemas de muestreo, ensayos, prospección y deci-
sión sobre explotación de yacimientos relativos al oro pueden extenderse en mu-
chas casos a otros elementos, así como a aplicaciones no geológicas.
Una característica que se pone de manifiesto en el caso del oro es que el coefl-
ciente de variación es muy alto (la tabla 16.1 de Koch y Link da valores desde
0,33 a 5,10 donde la mayor parte superan 1,2, lo que apoya la transformación lo-
garítmica). Las distribuc^ones estudiadas se presentan en intervalos de clase de
amplitud 5, desde (0,5) a(82a0, 625) y frecuencias absolutas que configuran una
distribución muy asimétrica, adernás de tener val^ores muy inferiores a 10 a partir
del intervalo (55, 60) (6). Por otra parte, la distribución espacial es muy irregular,
y un gran número de observaciones pueden tener gran efecto en las estimaciones
de medias y varianzas. Esto plantea problernas de exploración y muestreo de
gran interés, pero que no corresponde ahora considerar. Conviene insistir en que
la transfarmacián logarítmica de dos parámetros aplicada a estos datos no es siem-
pre la mejor entre las distribuciones asimétricas. Además de la distribución log-
normal de tres pará,metros, que supone sumar una constante a todos los datos,
pueden ajustarse otras distribuciones asimétricas como las mencionadas en la
sección 1.

(s) Como el contenido de oro de las menas suele ser pequeño, los valor3s de la variable empleada
sa expresan en dwt/short ton (el significado es dwt ^ penny weight); un depósito con una onza de
oro por ton^slada contiene 34 partes de oro por un millón, esto es 34 gramos por tonelada métrica
o ^,0034 por i0o de oro. En muchas minas se trabaja con grados de cinco a diez partes de oro
por miilón (KocH y LINK, vol. 2, p. 385).
EXPOSICION GENERAL E INDICACIONE^ PARA EL USCI DI~ LA DISTRI©UCION IAGNORMAL 1^

12. EJEMPLl7

Considérese la siguiente distribución empírica, ordenada y agrupada en inter-


valos de clase (1):
a._, - at n. t?)

0 - 100 588
lU0 - 20U &4?
200 - 34C3 ?42
300 - 400 42?
400 - 500 344
500 - 600 209
804 - 8t}(i 238
8t^ - 1. (X^0 119
1. QOa - 2.000 108
2.000 - 3.000 8
3.000 - 5.000 8

Se tratará de estudiar si esta distribución se ajusta bien a una l^ognormal;


para ello se estiman los parámetros de la hipotética distribución y se^ examina la
bondad del ajuste mediant+e algún test xz o de Kolmogorov, etc. Sin embarga, como
este último proceso se realiza de manera análoga cualquiera que sea la distribu-
ción, se limitará nuestra atención a la estimación de los parárnetros, procediendo
para ello por diferentes métodos según lo expuesto en las secciones anteriores.

1. Estimación directa de los parámetros de la distribucián dada

^:1 CARACTBRÍSTICA3 PROPIAB DE LA DISTRIBUCIÓI^

De acuerdo a las expresiones ( 3.11 y t 3.21 se obtienen los estimadores de la


media y la varianza

z= 341,64333? y s^. ' 119866,43898

resultando los demás parámetros:

desviación tipica

sx = 346,21?32

caeficiente de variación

dx = 1,01338

(7) Los datos corresponden al ejercicio número 20, p. 215 de G. C^LOx, y represontan los resul-
tados de una encuesta sobre ^el consumo anual de el©ctricidad (en kwh} de 3.572 familias.
20 B3TADIS?1CA BSPAIYOLA

moda
ad^=150

mediana

pi^^, s = 250,28

y cuantilas

p^^^4,,^ = 138,^68 p3,^.,^ = 431,9078

b^ ESTIMACIÓN DE LOS PARÁMETROS DE LA DISTRIBL^CIÓN NORMAL ASOCIADA POR TRANSFORMA-

CIÓN LOGARÍTMICA DECI^iAL ^8^

1) Estimctción del tercer pará.metro /j.--En caso de que la distribución lo,gnormal


sea de tres par^.metros, será ^3 c 4, y para su estimación puede utilizarse la ex-
presión [7.71, resultando: ^3 =--- 39,5003. A partir de ahora se supone correcta esta
estirr^ación y se utiliza en eI resto de la seccián.

2) Estimaci.ón de ta media.--Pueden emplearse estimadores diferentes que son:


por cuantilas, relación [7.41:
a = 2,46225055

por momentas (2)

« -- log (z - j3^ -- - 2,450445


2 log e

pgr mediana
x = log (^u^, x - ^3^ = 2,48203845

3) Estimación de lcx variariz,a.---Aná,Iogamente al caso anterior pueden conside-


rarse los estimadores:
por cuantilas, relación [7,81

a- = 0,31312 y ^`^ ^ 0,(398044 ^.3

por momentos (9) :

s^
v-`^ .- log ^ 1-^- --_ ^, • log e= 0,1 Y347423 y cr = 0,3388
^x - ^)"

(e) En el resto de la sección ts utilizarán los mismos sfmbolos para los parámetros reales y sus
estimadores.
(9) Estas expresiones se corresponden, respectivament^, con las i7.1 y t7.51, pero utilizadas aquí
en el caso de logaritmo decimal en la trarisforrnacibn.
EXPOS3GION GENERAL E INDIGACIONES PARA EL USO DE LA DISTRIBUCION LoGNORMAL 2i

2. Estimación en la distribución asociada por transformación logarítmica decimal

^^ CARACTERÍSTICAS DE LA DIST^IBUCIóN ASOCIADA

De acuerdo a lo expuesto en la seccidn 3, y adrnitiendo que ^3 =-- 39,5003, debe-


rá considerarse la distribución empfrica de intervalos de clase: log (ak_1 + 39,5003) --
- log (ak -}- 39,5003}, y efectivos nk (k .- 1,11). Los estimadores de la media y va-
rianza resultan ser, de acuerda a las expresiones t3.71 y[3.81 consideradas en el
caso de logaritmo decimal:

x= 2,44041g699 y a-'-' = 0,11436995395

con lo que

r^ = 0,338186 y b= 0,13857726

^^ CARACTERÍSTICAS DE LA DISTRIBUCIÓN ORIGINAL

A partir del apartado anterior se pueden obtener las características de esta


distribución utilizando las expresiones [ 7.1 l y[ 7.21 para logaritmo decimal:

x 1, ^---^ -}- 10a +'/^ 1-10 ^-' = 333,82274547

^r'x= (10"^1• Io - 1) 143^`+^^^•IO = 118201,9224133

o-x = 340,88403074

8^. = 1,021152798501

3. Estimaci^ón mediante el uso de papel probabilistico

Según lo expuesto en la sección 8, puede procederse de dos formas:

Cl^ SUPUESTO ^Q DESCONOCIDO

Representando en papel probabilístico los puntos (ak, F^ = ni --{- n^ -}- n3 -}- ... + r^k)
con h = 1,11 se obtiene una curva del tipo de la figura 2 y+que se representa con
trazo discontinuo en el papel probabilístico ( p. 23. Si éste hubiera sido el primer
contacto establecido con la distribución que nos ocupa habría llevado a suponer
que era ajustable por una lognormal de tres par^,metros cuyfl tercer parámetro
sería negativo; en ese caso hubiese sido conveniente estimarlo conforme se ha
hecho . arriba. _
22 BS T'A.t1I 9 TI CA BsPA ^ OL^A

tJ! SUPUESTO ^,3 DADl7

Admitimos que la distribuci^n ®n caso de ser lognormal tendrá parámetro


l3 --- 39,5003, Se han de representar en el papel probabilfstic© los puntos (ak - j3,
F,^) con h- 1,11; el resultado^ de alinear estos puntos es una recta (representada
con trazo continuo en la p. 23l ^ de la que se deduce de acuerdo a Ia sección 8 ai ;

^ 1 log 127^J _ U,325.


J = 2,454t345
a[ = 1+Q$' ^r y U. ^32v
2 285

con l^o que

cr^ = 0,1058412

La estimación de los parámetros de ia distribución original se reatiza como en


el apart^ado 2 b^ de esta sección.

4. R^e^sumen de las estima.ciones obtenidas

A continuación se expone un cuadro con los métodos empleados y 1©s valores


encantrados para cada parámetro:

METODO L?E ESTIMACION _ ^

Cuartilas ........................................... 2,46225rJ5S 0,31312 0, 09804413


Momentos .. . ..... ... .. . ...... ... . . . . .... . .. . . . . . . .. 2,4544452 0,3368 0,11347423
Mediana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2, 4ó203845
Normal asociada ............................... 2, 44+D41fi69 0, 33^818 0,1143699
Papel probabiifstico ........................... 2,454845 0, 32533 O,1 d58412

13. RE.LACICJN DE SIMBC}LQS EMPLEADUS

^ ^ Coefi-
DISTR,IBUCIQN Median^ Moda Varianz^ ciente Momen- M, cent
Medie. tos Cuant.
de va-
riación

De variable abser-
vada x .............. ^ PYJ^, x a^^. z ^ á^ a^r, x ^, : hr^a. x
De hip^atética log-
normal. .7r . . . . . . . .. .. oex }^e, x ,^d, x ^ ^x ^ r, s !u r. x ^r Js, ae
De hip^tética nor-
1i381 ^7 ....... ..... .. ^ f ^. Y f'^d. iI ^^ S xr. L fr. Y ^rl^, 3r
EXPOSICION GENER.AL E INDICACIONES PARA LI. USO DE LA DISTRIBUCION LUGNORMAL

EXFO^SICION GENERAL E INDICACIONES PARA EL USO DE LA DISTRIBUCION


LOGNORMAL

T s e^ , 2 3 ^ . 6 T , 8 91 ^ ^
^^ 9 - `
3 e, - _^. _.__ _--_ _ __ . _ _- _ _-^- - _ __ _ _^ __.. __
^

^s

>is

sa _ _. _ ---- __._-
2 ^. _ ______ ___ _______- -___^_ ______ _____ _--^ --__,.
9T
>i 6
93

!0

R -

so

TO

s0 -

50

40

30

20
^ ^ _ ^ _ ___ ____.-_ _ _._ _ __--_. _._ _._ ^ __

f0

S _
4
3
2 0'2 - - -- _ . _ ^ _^ - ---_ ^ ^. . .._ -- - _^. .^ _.. ^ ^ ..._ ^

^, a ^ .__

3^ _ .,_._ ^ ._.. _. .._ _ ^ ___ _ ._._ __ __ _... _ _. _. ____ .^ ._^ ._._ ._


D, 1 ,
a a T s ei z 3 4 a e T e e1 :
2^ FSTADISTICA EsPA2+F4LA

^ 4. BIBLIt7GRAFIA

AGT"ERHERG, F. P. (19?4} : Geom^ath,ematics ( Elsevier) ,


Ai^^soN, J., y BROwrr, J. (1957}: T'he Lo^gncw-mal Distributi+c^n (Cambridge University
Press).
CAiAT, G. (1974} : C u rso de es tad ís tica desarip t ivp. i Faraninfo ).
CRA^x, H. (1g48}: Mathematiaai Method's of Statisti^cs. (Traducción española en ^d.
Aguflar.}
Frxx^, D. J. t 1941) :•^On the distribution of a variable whose logarithm is no^r^mally
distributed-. Journal Roy. Stat. So^c., vol. 17, núm. 2, p. 155.
KENDALL, M. ..C^^. (1943 y ss.): The Advrxnced Theory of Sta^tistics (Griffinl.
Kocx, G., y Lrxx, R. F. (19741: Statistical Analysis of G^alragicat I^ata (J. Wiley).

Você também pode gostar