Você está na página 1de 7

Variveis aleatrias

1. Funes de distribuio de probabilidades


Uma varivel aleatria tem suas propriedades estatsticas completamente
determinadas pela sua funo de probabilidade acumulada (fpa), , ou,
opcionalmente, pela sua funo de densidade de probabilidade (fdp), .
Seguindo uma abordagem conhecida como frequentista, o significado fsico atribudo
a estas funes matemticas pode ser compreendido se um conjunto de amostras
independentes, , utilizado como ponto de partida para as
definies. Sem perda de generalidade, admite-se a seguir que as amostras no
conjunto esto ordenadas de forma ascendente, ou seja, .
A partir deste conjunto de amostras possvel construir uma funo em forma de
escada ilustrada na fig. 1, que se denomina funo emprica de probabilidade acumulada.
Esta funo adimensional incrementada de nos pontos em que a abscissa
coincide com os valores das amostras, atingindo valor mximo 1 a partir de .
V-se na fig. 1 uma representao precisa e no tendenciosa do que foi observado a
respeito da varivel aleatria . At agora nenhuma hiptese foi feita e nenhum
aspecto subjetivo foi includo no procedimento, com exceo de eventuais
peculiaridades do mtodo de obteno das amostras. Se esta abordagem fosse
mantida e se fosse necessrio estimar-se a propenso de a assumir certos valores
numricos, tudo o que poderia ser dito pela abordagem frequentista que:

(1)

Acredita-se, contudo, que na medida que o nmero de amostras disponveis for


aumentando, a funo emprica de probabilidade acumulada ir convergir para uma
funo determinstica, que corresponderia ento funo de probabilidade acumulada
(fpa), . Esta crena em uma convergncia introduz um aspecto subjetivo na
anlise, pois jamais haver um nmero de amostras grande o suficiente para que
seja perfeitamente conhecida, embora seja ela uma informao fundamental
nos clculos de probabilidade que envolvam a varivel aleatria . Na prtica,
escolhe-se para fpa geralmente funes contnuas, que tenham uma justificativa fsica
associada ao fenmeno que contextualiza a varivel aleatria. Os modelos mais
comuns sero apresentados mais adiante (incluindo a funo de Gauss, usada no
exemplo da fig. 1 atravs do comando randn no Matlab).
Na medida em que a funo emprica aproxima uma funo terica (modelo) de
probabilidade acumulada, a sua derivada aproxima o que se denomina funo de
densidade de probabilidade (fdp), , tal que:
N = 128;
x = sort(randn(1,N));
xi = repmat(x,2,1);
Px = [(0:(N-1))/N; (1:N)/N];

plot(xi(:),Px(:));
axis([-3 3 0 1]);
grid on;

Figura 1. Funo emprica de probabilidade acumulada.


nbin = round(1+3.3*log(N));
[px,xi] = hist(x,nbin);

dx = xi(2) - xi(1);
px = px/(sum(px)*dx);

plot(xi(:),px(:));
hold on;

plot(xi,exp(-(xi.^2)/2)/sqrt(2*pi),'k:');
axis([-3 3 0 0.5]);
grid on;
hold off;

Figura 2. Aproximao da funo de densidade de probabilidade a partir de um


histograma sobreposta funo terica correspondente (distribuio normal).

(2)

Observa-se que, devido continuidade de domnio, a probabilidade de que a


varivel aleatria assuma um valor particular infinitesimal. Valores finitos de
probabilidade so obtidos somente para intervalos no eixo das abscissas.
Na fig. 2 pode-se ver, em linha tracejada, a f.d.p. associada f.p.a. apresentada na fig.
1. Esta funo suaviza o histograma de densidade de probabilidade, apresentado em
linha cheia na mesma figura. A construo deste histograma um pouco mais
complexa que a da funo emprica de probabilidade acumulada, uma vez que
requer o arbtrio de um intervalo de discretizao do eixo das abcissas. Uma vez
definida esta discretizao, o histograma construdo de forma a representar a frao
de amostras pertencentes a cada intervalo, respeitando a condio de que a rea total
do histograma (sua integral) seja unitria.
A passagem de funes empricas para funes tericas tema da disciplina de
Estatstica, e no ser aqui abordada em maiores detalhes. Entretanto, cumpre
mencionar a existncia de funes que so particularmente adequadas para o papel
de distribuio de probabilidades, principalmente por estarem associadas a algum
princpio fsico pertinente ou simplesmente por respeitarem as propriedades
axiomticas:

(3)

Com base nestas definies, a rigor a funo de densidade emprica deveria ser uma
soma de funes tipo delta de Dirac (impulsos unitrios nas coordenadas ):

(4)

mas d-se preferncia a uma apresentao mais suavizada, tal como a obtida do
histograma normalizado apresentado na fig. 2.
Cabe salientar que a transio de funes empricas (eqs. 1 e 4) para modelos tericos
representa um passo necessrio para que, a partir de uma informao limitada, se
possa levar a cabo um procedimento de anlise que requer o conhecimento da
propenso de ocorrncia de valores muito grandes ou muito pequenos da varivel
aleatria (que sequer foram observados). Em suma, o uso de funes tericas,
e , se d em decorrncia da necessidade de inter- e extrapolaes a partir de
dados disponveis, para determinao de probabilidades que no foram obtidas
experimentalmente.

2. Momentos estatsticos de uma varivel aleatria


Define-se inicialmente como valor esperado, valor mdio, ou simplesmente mdia de
uma varivel aleatria a coordenada de seu domnio obtida de uma ponderao de
todo o domnio pela fdp:

(5)

Demonstra-se facilmente que o operador linear. Alm disso, o seu uso pode ser
aplicado tambm para quaisquer funes de variveis aleatrias, , sendo de
especial interesse a classe de funes , para a qual:

(6)

onde denominado momento estatstico de ordem k da varivel aleatria , ou


simplesmente -simo momento de . O valor esperado de um caso particular
em que , e portanto .

3. Momentos estatsticos centrais


Os momentos estatsticos podem ser alternativamente definidos aps um
deslocamento da origem do eixo das abscissas para que este coincida com o valor
mdio da varivel aleatria:

(7)

onde denominado momento estatstico central de ordem da varivel aleatria ,


ou simplesmente -simo momento central de . Observa-se que por definio
. J o segundo momento central, , recebe a denominao de
varincia, e sua raiz quadrada o desvio padro, , que constitui uma medida da
variabilidade de . Assim como o valor mdio anlogo ao centro de rea da fdp, o
desvio padro anlogo ao seu raio de girao. A relao denominada
coeficiente de variao, e tambm constitui uma medida da variabilidade de , com a
vantagem de ser adimensional e a desvantagem de tender ao infinito para variveis
aleatrias com mdia tendendo a zero.
possvel obter-se os momentos centrais diretamente dos momentos
atravs da relao:

(8)

Por exemplo, para tem-se que:

e logo:

Este mesmo resultado pode ser obtido a partir das eqs. 6 e 7, com .
de fundamental importncia no confundir os momentos de uma distribuio de
probabilidade (abordagem axiomtica da teoria de probabilidades) com os estimadores
de momentos de uma distribuio (abordagem frequentista). A definio de estimadores
no ser abordada aqui em maiores detalhes, visto que um vasto campo de estudos
por si s. Estimadores so a fronteira entre a teoria matemtica e o mundo real,
consequncia natural da inteno de se estabelecer uma analogia entre os dois
contextos. Contudo, no se pode prescindir de relacionar os dois principais
estimadores que sero aqui utilizados. Pode ser demonstrado que os seguintes
estimadores da mdia, , e do desvio padro, :
(9)

(10)

so no tendenciosos (unbiased), pois tendem aos respectivos momentos quando


tende a infinito. Estes estimadores esto disponveis no Matlab atravs dos comandos
mean e std, respectivamente. Deve-se observar o uso do chapu para diferenciar o
momento estatstico de seu estimador.

4. A distribuio uniforme
Se uma varivel aleatria, , uniformemente distribuda entre 0 e 1, ento a sua
funo de densidade de probabilidade e a sua funo de probabilidade acumulada
so, respectivamente:

(11)

O primeiro momento calculado como:

enquanto o segundo momento central :

Observa-se que e so, respectivamente, a coordenada do centro de rea e o


raio de girao de um retngulo de lado unitrio.
A distribuio uniforme de fundamental importncia para vrias tcnicas de
simulao, tais como a Simulao de Monte Carlo, sendo que diversos ambientes
computacionais j trazem alguma funo capaz de gerar nmeros aleatrios
uniformemente distribudos e no-correlacionados. Por exemplo, no Matlab
utilizando-se o comando rand, e verificando-se mdia e desvio padro atravs de
estimadores internos:

>> u = rand(1,1000);
>> mean(u)

ans =

0.5127

>> std(u)

ans =

0.2893
5. A distribuio normal, ou Gaussiana
No Teorema do Limite Central deduzido que a soma de um grande nmero de
variveis aleatrias (por exemplo, erros acumulados) resulta ter uma funo de
distribuio de probabilidade que se denomina funo de distribuio normal ou
Gaussiana.
Curiosamente, a sua funo de probabilidade acumulada no pode ser conhecida em
uma forma analtica fechada, embora a respectiva funo de densidade seja:

(12)

Os parmetros da distribuio so e , que correspondem mdia e ao desvio


padro da varivel , respectivamente. Esta correspondncia direta entre os
parmetros da funo e os momentos estatsticos apenas mais uma das
caractersticas que tornam a distribuio Gaussiana to atrativa para fins prticos. Na
verdade, muito comum adotar-se a esta distribuio quando no se dispe de nada
alm de estimativas de mdia e desvio padro.
Ambientes computacionais, tais como o Matlab, geralmente disponibilizam recursos
referentes distribuio normal. Contudo, comum que se o use o caso particular
em que a varivel aleatria tem mdia zero e desvio padro unitrio:

(13)

sendo a funo denominada funo de densidade de probabilidade Gaussiana padro.


Esta funo est graficada na fig. 2 com uma linha tracejada, para fins de avaliao da
simulao realizada com o comando randn do Matlab. A correspondente funo de
probabilidade acumulada :

(14)

a qual, como j foi dito, no pode ser calculada analiticamente. A funo


encontra-se geralmente tabelada em livros de estatstica, ou pode ser calculada
atravs de uma aproximao por expanso assimpttica.
Uma caracterstica muito importante da distribuio normal, que ser amplamente
explorada na sequncia, o fato de que uma combinao linear de variveis
aleatrias gaussianas, correlacionadas ou no, resulta tambm em uma varivel
gaussiana. Mais do que isso, qualquer sistema (dinmico) linear, submetido a uma
excitao (input) gaussiano, apresentar tambm uma resposta (output) gaussiana.
Essa propriedade facilita a estimativa de valores extremos da resposta, que so de
grande interesse prtico.
Para simular uma vriavel aleatria gaussiana com uma dada mdia e desvio padro,
basta inverter a normalizao apresentada na eq. 13, tal como demonstrado na fig. 3.
N = 512;
mx = 3.0;
sx = 2.0;

x = mx + sx*randn(1,N);

nbin = round(1+3.3*log(N));
hist(x,nbin);
grid on;

Figura 3. Simulao de uma varivel gaussiana com mdia e desvio padro dados.

6. A distribuio determinstica
Caso o desvio padro na distribuio normal tenda a zero, a varivel aleatria passa a
ter seu nico valor possvel tendendo mdia. Neste limite a funo de densidade de
probabilidade tende a uma importante funo utilizada na fsica, chamada Delta de
Dirac ou funo impulso unitrio:

(14)

cuja integral total por definio finita e unitria:

(15)

Portanto, esta distribuio respeita as condies axiomticas estabelecidas na eq. 3. A


integral da funo impulso unitrio a funo passo unitrio, ou funo de Heaviside:

(16)

Estas duas funes, ilustradas na fig. 4, so usadas em diversos contextos, alm de


representarem funes de distribuio de probabilidades. Elas tambm podem
representar foras dinmicas em sistemas estruturais, ou ainda autocorrelaes e
densidades espectrais na anlise de sinais, como ser visto mais adiante.

7. Funes monotnicas de uma varivel aleatria

Você também pode gostar