Você está na página 1de 21

0.

Introduo
A Estatstica a ferramenta que deve ser utilizada para descrever um
conjunto de dados.
Sempre que o resultado de um fenmeno envolve variao, a Estatstica
a ferramenta que deve ser utilizada para descrever esse fenmeno.
Sempre que se deseja procurar por padres em acontecimentos, relaes
de causa-efeito e testar cientificamente uma hiptese baseando-se
exclusivamente nos dados, por exemplo, a Estatstica a ferramenta mais
adequada para lidar com essas situaes.
Em resumo, a Estatstica fornece mtodos para coletar, organizar,
descrever, analisar e interpretar conjuntos de dados, sendo uma ferramenta
poderosa na tomada de decises.
Dentre as vrias formas de dividir a Estatstica, comum dividi-la em
Estatstica Descritiva e Estatstica Inferencial. A Estatstica descritiva, como o
nome sugere, se encarrega de descrever os dados, estando associada coleta,
organizao e descrio. A Inferncia Estatstica (ou Estatstica Indutiva)
utilizada quando se quer generalizar as informaes de uma poro dos dados
(amostra) para toda uma populao, sendo associada anlise e interpretao.
A Probabilidade incorpora o uso de modelos matemticos Estatstica,
dando credibilidade a concluses de anlises envolvendo aleatoriedade.
Eis alguns exemplos atuais de uso da Estatstica:
a) Como possvel avaliar a validade de uma nova teoria?
b) Como testar a eficincia de uma nova droga?
c) Como prever o tamanho da populao mundial uma dcada frente?
d) Como verificar se a mudana no IPC ndice de Preos ao Consumidor
se deve a uma tendncia secular ou um desvio aleatrio?
e) Como predizer o resultado de uma eleio entrevistando uma pequena
parte dos eleitores?


1. Variveis
Todo fenmeno possui um conjunto de possveis resultados. Por
exemplo, podemos associar o resultado masculino ou o resultado feminino
ao sexo de uma criana. Tambm possvel associar os nmeros naturais (0, 1,
2, 3, ...) ao fenmeno nmero de filhos de um casal (embora seja improvvel um
casal possuir, por exemplo, 30 filhos).
Varivel uma abstrao que se refere a um determinado aspecto do
fenmeno sendo estudado.
Variveis quantitativas se referem a quantidades e podem ser medidas
em uma escala numrica. Exemplos: idade de pessoas, preo de produtos, peso
de recm-nascidos.
As variveis quantitativas subdividem-se em dois grupos: variveis
quantitativas discretas e variveis quantitativas contnuas. Variveis discretas
so aquelas que assumem apenas determinados valores tais como 0,1,2,3,4,5,6
dando saltos de descontinuidade entre seus valores. Normalmente referem-se a
contagens. Por exemplo: nmero de vendas dirias em uma empresa, nmero
de pessoas por famlia, quantidade de doentes por hospital. As variveis
quantitativas contnuas so aquelas cujos valores assumem uma faixa contnua
e no apresentam saltos de descontinuidade. Exemplos dessas variveis so o
peso de pessoas, a renda familiar, o consumo mensal de energia eltrica, o
preo de um produto agrcola.

Seria impossvel obter na prtica uma varivel perfeitamente contnua, j
que os instrumentos de medida no tm preciso infinita. Por exemplo, o peso
de pessoas medido com uma balana com preciso, digamos, de dcimos de
gramas. Ento jamais conseguiremos obter um valor para essa varivel que se
localize entre 50,1 e 50,2 gramas, por exemplo, 50,15 gramas. Ocorre, portanto,
um salto de descontinuidade. Mas do ponto de vista prtico, mais til
considerar essa varivel como quantitativa contnua.

Variveis qualitativas se referem dados no numricos. Exemplos dessas
variveis so o sexo das pessoas, a cor, o grau de instruo.
As variveis qualitativas subdividem-se tambm em dois grupos: as
variveis qualitativas ordinais e as variveis qualitativas nominais. As variveis
qualitativas ordinais so aquelas que definem um ordenamento ou uma
hierarquia. So exemplos o grau de instruo, a classificao de um estudante
no vestibular, as posies das 100 empresas mais lucrativas. As variveis
qualitativas nominais por sua vez no definem qualquer ordenamento ou
hierarquia. So exemplos destas a cor, o sexo, o local de nascimento.
No podemos dizer que para qualquer um desses tipos de variveis
possvel aplicar qualquer mtodo estatstico. As variveis quantitativas
contnuas so aquelas que permitem a utilizao de um conjunto maior e
superior de mtodos estatsticos e so, sem dvida, as variveis mais passveis
de um rico tratamento estatstico. Em seguida vm, nessa ordem, as variveis
quantitativas discretas, as variveis qualitativas ordinais e por ltimo, as
variveis qualitativas nominais. Essas ltimas so as que permitem a utilizao
de um menor e menos poderoso arsenal de instrumentos estatsticos de
anlise.

2. Populao e Amostra
Um conjunto de indivduos ou objetos portando pelo menos uma
caracterstica (ou varivel) em comum chamado de populao. Ao considerar
essa varivel, deve ser possvel definir sem ambiguidade se um elemento
pertence ou no populao.
s vezes, por impossibilidade ou inviabilidade econmica ou temporal,
limitamos as observaes a apenas parte de uma populao. Essa parte da
populao conhecida como amostra. Contudo, preciso ter cuidado ao
selecionar uma amostra para que a mesma goze de certas propriedades, a fim
de que a concluses tiradas a partir da mesma possam ser generalizadas para a
populao.
A rea da Estatstica responsvel pelas tcnicas de seleo de uma
amostra denominada Teoria da Amostragem.
Sem a coleta dos dados, todas as demais etapas da Estatstica perderiam
o sentido. A direo de uma empresa, incluindo as estatais e governamentais,
exige do administrador a tarefa de tomada de decises. Para embasar essas
decises necessrio amostrar, a fim de conhecer a realidade geogrfica e
social, os recursos naturais, humanos e financeiros disponveis, as expectativas
da comunidade sobre a empresa, estabelecendo suas metas com maior
possibilidade de serem alcanadas. Veremos resumidamente alguns processos
de amostragem.
2.1 Tipos de amostragem
A fim de que as concluses obtidas para uma amostra possam ser
generalizadas para uma parte maior da populao, necessrio que o processo
de escolha da amostra seja aleatrio. Os dicionrios costumam dizer que
aleatoriedade inclui incerteza, indeterminao e imprevisibilidade. Tambm
afirmam que o que aleatrio o segundo determinada lei de probabilidade. E
nesse sentido que o termo imprevisibilidade cai, pois a probabilidade nos dar
meios de traar padres a respeito da amostra que podero ser devidamente
generalizados para a populao.
- Amostragem aleatria simples: o processo de seleo mais simples
de ser usado. Equivale a um sorteio lotrico, pois todos os elementos
da populao tm igual probabilidade de serem selecionados, no
apenas antes de serem escolhidos, mas durante todo o processo de
coleta.
i. Numere todos os elementos da populao.
ii. Realize sorteios com reposio sucessivamente at completar o
tamanho da amostra.
- Amostragem sistemtica: uma variao da amostragem aleatria
simples, conveniente quando a populao est naturalmente
ordenada, pois nesse caso, no necessrio construir o sistema de
referncia.
i. Sejam n o tamanho da amostra e N o tamanho da populao. O
intervalo de amostragem o inteiro mais prximo a n/N,
chamado aqui de I.
ii. Sorteio um nmero x entre 1 e I.
iii. Forme um amostra dos elementos correspondentes s posies
x, x+I, x+2I, ..., x+(n-1)I.
- Amostragem estratificada: supe que a populao est organizada em
estratos (subgrupos) de elementos similares, selecionando de dentro
de cada subgrupo.
i. Divida a populao em estratos mutuamente excludentes.
ii. Selecione uma amostra aleatria de cada subgrupo, proporcional
a sua proporo na populao.
- Amostragem por conglomerados: supe que a populao est
organizada em subgrupos que possuem as mesmas caractersticas da
populao, selecionando um desses subgrupos como se fosse a
prpria populao. Na verdade cada conglomerado pode ser
encarado como uma minipopulao.
i. Selecione um subgrupo.
ii. Sorteie de dentro desse subgrupo utilizando uma das tcnicas de
amostragem anteriores.
Dependendo da complexidade da varivel sendo estudada ou mesmo do
tipo de estudo que se deseja fazer, necessrio realizar a amostragem em mais
de uma fase, possivelmente combinando essas tcnicas de amostragem.

2.2 Erros no processo de amostragem
O mtodo de amostragem , em teoria, extremamente eficaz. Contudo,
no podemos nos esquecer do fator humano. Alguns erros so muito comuns e,
em certa medida, podem ser facilmente evitados. So eles:
a) Erros de cobertura problemas com o vis de seleo. Nesse caso,
parte da amostra foi selecionada com probabilidade diferente
daquela que representa sua frequncia na populao. Uma das
consequncias disso que no h mais garantia sobre as concluses
obtidas.
b) Erros por falta de resposta ao fazer uma pesquisa, por exemplo, um
dos entrevistados omitiu alguma informao ou, para um produto
selecionado, impossvel avaliar a varivel sendo estudada.
c) Erros de medio por formulao ambgua ou confusa da pergunta,
ou ainda pela ordem em que as questes so colocadas, por
influncia do entrevistador sobre o entrevistado, por erro do
respondente, ...
d) Erro de amostragem esse o nico erro que deveria existir, tambm
conhecido como erro estocstico. O uso da probabilidade permite se
utilizar desse erro para definir questes importantes como tamanho
da amostra, confiabilidade das concluses tiradas e extrapolao, por
exemplo.



3. Formas de apresentao de dados
Ao descrever um conjunto de dados, possvel se utilizar de:
a) Tabelas (e distribuio de frequncias)
b) Grficos
c) Medidas resumo (tambm conhecidas como estatsticas)
i. Medidas de posio
ii. Medidas de disperso
iii. Medidas de assimetria e curtose

3.1 Tabelas e Distribuio de frequncias
Tabelas so formas de apresentar os dados em quadros, subdividindo
cada varivel em linhas e colunas e, caso sejam mais de duas, em mais sublinhas
e mais subcolunas. As tabelas mais comuns so as 2x2, como no exemplo
abaixo:
Tabela nmero - Ttulo
Coluna
indicadora
Cabealho
Contedo de
cada linha

c
o
l
u
n
a

clula

Fonte: permite rastrear ou autenticar
uma informao

A anlise estatstica se inicia quando um conjunto de dados torna-se
disponvel de acordo com a definio do problema da pesquisa. Um conjunto de
dados, seja de uma populao ou de uma amostra, contm muitas vezes um
nmero muito grande de valores. Alm disso, esses valores, na sua forma bruta,
encontram-se muito desorganizados. Eles variam de um valor para outro sem
qualquer ordem ou padro. Os dados precisam ento ser organizados e
apresentados em uma forma sistemtica e sequencial. Podemos construir uma
tabela com o intuito de comparar as frequncias observadas desses dados.
Quando fazemos isso, as propriedades dos dados tornam-se mais aparentes e
tornamo-nos capazes de determinar os mtodos estatsticos mais apropriados
para serem aplicados no seu estudo.
Considere o seguinte conjunto de dados:
14 12 13 11 12 13
16 14 14 15 17 14
11 13 14 15 13 12
14 13 14 13 15 16
12 12
Para montarmos uma distribuio de frequncias desses dados
verificamos quais so os valores no repetidos que existem e em uma primeira
coluna de uma tabela colocamos esses valores e na segunda coluna colocamos o
nmero de repeties de cada um desses valores. Para o exemplo acima, a
distribuio de frequncias ser:
Varivel Frequncia
11 2
12 5
13 6
14 7
15 3
16 2
17 1
Total 26

As frequncias podem ser absolutas (como acima) ou relativas, que so
expressas pela razo entre a frequncia absoluta e o total.
Varivel Frequncia
absoluta relativa
11 2 2/26=0,0769
12 5 5/26=0,1923
13 6 6/26=0,2308
14 7 7/26=0,2692
15 3 3/26=0,1154
16 2 2/26=0,0769
17 1 1/26=0,0385
Total 26 26/26=1,0000
3.2 Grficos
Existe uma variedade incrvel de dados e escolher a melhor forma de
apresent-los nem sempre bvio. Contudo, uma vez escolhida a forma mais
razovel de apresentao atravs de um grfico, ele se torna uma ferramenta
extremamente poderosa de descrio dos dados.

Grfico de colunas (ou barras)

Podem ser usados para comparar frequncias de variveis
separadas em categorias

Grfico de setores

Uso similar ao dos grficos em colunas, porm indicados para
menor quantidade de categorias


0
10
20
30
40
50
Sucesso Falha
Sucesso
Falha
Grfico de linhas

Indicados para sequncias quantitativas, em especial sries temporais

Grfico de pontos (diagrama de disperso)

Indicados para verificar a relao entre duas variveis quantitativas

Outros (inmeros tipos e aplicaes)

Grfico de bolhas: permite representar trs variveis no plano, sendo que uma delas tem sua
magnitude representada pelo raio da bolha
0
1
2
3
4
5
6
Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez
0
5
10
15
20
0 1 2 3 4 5 6
0
1
2
3
4
5
6
-5 0 5 10 15
Dois grficos muito teis
Histograma (e sua verso suavizada) esse tpico ser coberto aps as
primeiras aulas de probabilidade

Boxplot esse tpico ser coberto aps vermos medidas de posio e disperso

3.3 Medidas resumo
Grficos e tabelas permitem perceber, de um modo geral, como uma
varivel se apresenta para um conjunto de dados. Por exemplo, possvel
visualizar onde se encontra a maior concentrao de valores, se no incio, no
meio ou no final, ou ainda, se eles se distribuem igualmente ou mesmo se h
mais de uma regio de concentrao. Contudo, quando se quer evidenciar
certas caractersticas dos dados de forma isolada a fim de, por exemplo,
confront-las para dois ou mais conjuntos de dados, necessrio conceitos bem
estabelecidos que se apresentem atravs de medidas numricas.

3.3.1 Medidas de posio
Medidas de posio so estatsticas que representam uma srie de dados
orientando-nos quanto posio da distribuio dos mesmos em relao ao
eixo horizontal.
As medidas de posio mais importantes so as de tendncia central.
Entre elas destacam-se:
a) Mdia aritmtica: o quociente da diviso entre a soma de todos os
valores dos dados e o nmero de valores existentes:


A mdia aritmtica simples goza de algumas propriedades, como a soma
dos desvios ser nula, linearidade em relao a fatores aditivos e
multiplicativos.
H tambm a mdia aritmtica ponderada (ou mais resumidamente
mdia ponderada), utilizada basicamente em duas situaes: quando preciso
levar em conta a frequncia de certo tipo de observao (dados agrupados, por
exemplo) e quando preciso dar mais importncia a uma classe de valores em
detrimento de outras:


em que p
i
so os pesos de cada x
i
. Por exemplo, podem ser frequncias.
Nos estudos no ensino mdio ouvimos falar de outros tipos de mdia,
como a geomtrica e a harmnica. Elas tm vrias aplicaes e voltaremos a
esse assunto oportunamente. Deixaremos aqui a forma de clculo das mesmas:


Exemplo 1: Se um investimento rende 10% no primeiro ano e 20% no
segundo ano, qual o rendimento mdio desse investimento? Seja M o montante
aplicado inicialmente. Aps esses dois anos o montante ser igual a
M1,11,2=1,32M. Se tomarmos a mdia aritmtica, teramos 15% como mdia,
porm, ao calcular o montante ao final dos dois anos
obteramos M1,151,15=1,3225M, que diferente de 1,32M. Por outro lado, a
mdia geomtrica entre 10% e 20% igual a

(aproximadamente igual
a 1,1489). Aplicando essa mdia ao montante, temos que M1,14891,1489 =
1,32M.
Exemplo 2: Utilizamos a Mdia Harmnica quando estamos tratando de
observaes de grandezas inversamente proporcionais. A mdia harmnica
recomendada, por exemplo, para o clculo da velocidade mdia ou custo mdio
de bens comprados com uma quantia fixa.
b) Mediana
A mediana a observao que divide a distribuio das observaes ao
meio. Considere os dados ordenados. A mediana deixa a sua direita pelo menos
metade das observaes e a sua esquerda pelo menos a outra metade. O efeito
disso e que, se o nmero de observaes mpar, a mediana representada
pelo valor central, se par, dada por qualquer valor entre as duas
observaes centrais (por exemplo, sua mdia).
Embora a mediana seja numericamente mais difcil de computar que a
mdia, goza de uma propriedade muito til para certos tipos de distribuio: ela
menos sensvel a observaes extremas. Na verdade, se voc alterar o valor
de uma observao maior que a mediana, por exemplo, para um outro de
magnitude, digamos, 10 vezes maior, a mediana permanecer inalterada.
c) Moda
A moda o valor mais frequente e, dessa forma, mais indicada para
variveis qualitativas ou dados estruturados em classes.
Um dos inconvenientes da moda que nem sempre ela nica. Nesse
caso, possvel que os dados venham de uma mistura de distribuies e a moda
ajudar a detectar essa situao.
d) Propriedades da mdia aritmtica:
- Ela afetada por todas as observaes e influenciada
pelas magnitudes absolutas dos valores extremos na srie
de dados;
- Ela das trs medidas de posio vistas a que possibilita
maiores manipulaes algbricas, dadas as caractersticas
de sua frmula;
- Em amostragem, a mdia uma estatstica estvel.
e) Propriedades da mediana:
- Seu valor afetado pelo nmero de observaes e como
elas esto distribudas, mas ela no afetada pelos valores
das observaes extremas;
- Sua frmula no passvel de manipulao algbrica;
- Seu valor pode ser obtido, em distribuies de
probabilidade com limites superiores indeterminados para a
sua ltima classe.
- A mediana a estatstica mais adequada para descrever
observaes que so ordenadas em vez de medidas.
f) Propriedades da Moda:
- A moda o valor mais tpico e representativo de uma
distribuio. Ela representa o seu valor mais provvel;
- Como a mediana, a moda tambm no influenciada pelos
valores extremos da distribuio e no permite
manipulaes algbricas como a frmula da mdia.
g) Para uma distribuio simtrica e unimodal, mdia = mediana =
moda;
h) Para uma distribuio positivamente assimtrica, mdia > mediana >
moda;
i) A distncia entre a mediana e a mdia cerca de um tero da
distncia entre a moda e a mdia.

3.3.2 Medidas separatrizes
a) Quartis
b) Decis e percentis (e quantis)

3.3.3 Medidas de disperso
a) Desvio mdio e desvio absoluto mdio
b) Amplitude
c) Varincia (e desvio-padro)

3.3.4 Medidas de assimetria e curtose
a) Assimetria
b) Curtose

4. Introduo Probabilidade
4.1 Experimentos
Fenmenos determinsticos so aqueles em que os resultados so
sempre os mesmos, independente da repetio dos mesmos. Fenmenos
aleatrios so aqueles em que mesmo que as condies iniciais sejam mantidas
e fatores externos controlados, os resultados podem mudar.
Contudo, a experimentao til, pois se executarmos certos
experimentos sob condies quase idnticas, chegaremos a resultados
essencialmente iguais.
So exemplos de experimentos aleatrios:
a) Lanar uma moeda duas vezes se representarmos por C os
resultados de cara e como

os resultados de coroa, ento o conjunto


de possveis resultados dado por {

}.
b) Lanar um dado com 6 lados uma vez o conjunto de possveis
resultados {1, 2, 3, 4, 5, 6}.
4.2 Espaos amostrais e eventos
O conjunto de todos os possveis resultados chamado de espao
amostral, denotado pela letra grega O. Cada elemento desse conjunto
denominado de ponto amostral. O espao amostral depende do tipo de estudo
que se quer fazer. Por exemplo, no exemplo (b) acima, outro possvel espao
amostral {par, mpar}.
Todo subconjunto A de um espao amostral O considerado um evento.
Se o resultado de um experimento um elemento de A ento dizemos que o
evento A ocorreu. Por exemplo, no exemplo (a) acima, o evento no qual
ocorre apenas uma cara consiste dos pontos amostrais

.
4.2.1 Eventos mutuamente exclusivos e parties
Dizemos que uma sequncia A
i
de eventos mutuamente exclusiva se a
ocorrncia de qualquer evento significa que nenhum dos outros pode ocorrer
simultaneamente, isto : A
i
A
j
= |, i=j.
Dizemos que uma sequncia A
i
de eventos forma uma partio do espao
amostral (tambm chamados de eventos coletivamente exaustivos) se todos os
conjuntos so no vazios e mutuamente excludentes e sua unio igual a O,
isto :
a) A
i
= |, i;
b) A
i
so mutuamente excludentes;
c)

= O.

4.3 Combinao de eventos
Todo evento um conjunto e, assim, operaes entre conjuntos podem
ser interpretadas em funo de combinao de eventos. Sejam A e B dois
eventos de um mesmo espao amostral. Ento as seguintes combinaes so
assim interpretadas:
i) A B: ao menos um dos eventos ocorre;
ii) A B: ambos os eventos ocorre;
iii)

(complementar de A): o evento A no ocorre;


iv) A - B: acontece A, mas no B.
Sendo conjuntos, todas as relaes entre conjuntos so vlidas para
eventos, como, por exemplo, as leis de De Moivre estudadas no ensino mdio.

4.4 Abordagens de probabilidade como veremos nesse curso
A abordagem clssica de probabilidade nos diz que se um evento pode
ocorrer de h maneiras diferentes de um total de n maneiras possveis, todas elas
igualmente provveis, ento a probabilidade do evento

.
A abordagem frequencista nos diz que se aps n repeties de um
experimento (n muito grande) for observado que um evento ocorre em h dessas
repeties, ento a probabilidade do evento

. Essa a chamada
probabilidade emprica do evento.
Podemos ver a probabilidade como uma funo que atribui a cada
elemento do espao amostral um valor no intervalo [0,1]:






P() uma (funo) de probabilidade se goza das seguintes propriedades
(axiomas da probabilidade):
i) Para todo evento A, P(A) > 0;
ii) P(O) = 1;
iii) Para uma sequncia enumervel de eventos A
i
, disjuntos dois a
dois, P(A
1
A
2
...) = P(A
1
)+P(A
2
)+...

4.4.1 Regras prticas do clculo de probabilidades
a) Probabilidade do complementar: De (ii) e (iii) resulta a regra prtica:
P(

) = 1 P(A).
b) Regra especial de multiplicao: Se A
1
e A
2
so dois eventos
independentes, ento segue que: P(AB) = P(A)P(B). Dois eventos
sero considerados independentes se a ocorrncia de um no tem
efeito sobre a probabilidade de ocorrncia do outro. Isto quer dizer
que, para dois eventos independentes A
1
e A
2
(a expanso para mais
de dois eventos direta, contudo, considerando todas as combinaes
de pares, trios, ... de eventos), segue que:
i. A ocorrncia de A
1
no interfere na ocorrncia de A
2
;
ii. A ocorrncia de A
1
no interfere na no ocorrncia de A
2
;
iii. A no ocorrncia de A
1
no interfere na ocorrncia de A
2
;
iv. A no ocorrncia de A
1
no interfere na no ocorrncia de
A
2
.
c) Probabilidade condicional: s vezes til atualizar a probabilidade de
um evento ocorrer sabendo que outro j ocorreu. Essa probabilidade
denotada por P(A|B) (probabilidade de A dado B) e calculada atravs
de:
|


d) Regra geral da multiplicao: Essa regra til quando queremos obter
a probabilidade conjunta de dois eventos ocorrerem. Essa regra
estabelece que para dois eventos A e B, a probabilidade conjunta de
que os dois eventos ocorram obtida pela multiplicao da
probabilidade de que o evento A ocorra pela probabilidade condicional
de B dado que A ocorreu, isto :
P(A B) = P(A) P(B|A).
Note que essa probabilidade simtrica em A e em B.

4.5 Variveis aleatrias e distribuio de probabilidade
Tomemos o espao amostral do exemplo (a) do tpico 4.1. Represente
por X o nmero de caras dos resultados. Para cada ponto amostral h um valor
para X:
Ponto amostral


X 1 2 1 0
X nossa varivel aleatria.
Tambm podemos obter a probabilidade de cada elemento de O.

Ponto amostral


P(.)

Assim, construmos as probabilidades associadas:
P(X=0) = P(

) =
P(X=1) = P(

) = (axioma iii) P(

)+P(

) = + =
P(X=2) = P() =
assim que se distribui a varivel aleatria X. A funo de probabilidade,
denotada por f(X), dada por:

x 0 1 2
f(x)

comum diferenciar a varivel aleatria da sua ocorrncia por
representar a primeira em letra maiscula.
til classificar as distribuies de probabilidade (modelos matemticos)
em contnuas (quando a varivel aleatria est em uma escala contnua) e
discretas (quando a varivel aleatria s pode assumir um conjunto enumervel
de valores).
No caso de distribuies discretas, denota-se a probabilidade de que a
varivel X assuma um dado valor x
0
como P(X=x
0
) = P(x
0
). Contudo, no caso de
variveis contnuas, s podemos associas probabilidades a intervalos, pois a
probabilidade associada a um nmero especfico zero (verifique). Isto :
P(asXsb) =

.










4.5.1 Esperana e varincia de variveis aleatrias
Vimos que medidas de posio e de disperso so duas informaes
importantes a respeito de um conjunto de dados. Aprenderemos aqui como
obter essas duas informaes no contexto de distribuio de probabilidade.
Por fugir ao escopo desse curso, consideraremos apenas distribuies em
que os momentos de ordem 1 e 2 so finitos.
A esperana (tambm conhecida como primeiro momento) de uma
varivel aleatria X coincide com sua mdia e dada por E(X) =


(leia esperana de X).

A varincia de uma varivel aleatria X dada por Var(X) = E(X
2
)-E
2
(X), em
que E(X
2
) (tambm conhecida como segundo momento) dada por
E(X
2
) =

e E
2
(X) = [E(X)]
2
.
Quando a varivel aleatria contnua os somatrios acima so
substitudos por integrais (com as devidas adaptaes).

4.6 Algumas distribuies discretas

4.6.1 Bernoulli
Utilizada para representar experimentos em que h apenas dois
resultados possveis, no necessariamente equiprovveis, isto :
P(X = 1) = p
P(X = 0) = 1-p = q
X=1 considerado como sucesso (ou o evento ocorre).
Exemplo: Numa linha de produo, ao observar um item ao acaso,
verificar se o mesmo defeituoso ou no defeituoso.
Esperana: E(X) =

= 0P(X=0) + 1P(X=1) = p.
E(X
2
) =

= 0
2
P(X=0) + 1
2
P(X=1) = p.
Varincia: Var(X) = E(X
2
)-E
2
(X) = p-p
2
= p(1-p) = pq.

4.6.2 Uniforme discreta
Utilizada para representar experimentos em que todos os pontos
amostrais tm igual probabilidade de ocorrer, isto ,
P(X=k) = 1/n,
em que n o nmero de resultados possveis dessa varivel e k um dos
valores possveis para X.
Exemplo: No lanamento de um dado observado o resultado da face
superior.


Distribuio de probabilidade de uma uniforme discreta com n=6.

Se os x
i
so um conjunto ordenado e igualmente espaado, h uma forma
fechada para a esperana e varincia. Por exemplo, se x
i
= {1, 2, ..., n}, ento:
E(X) =

e Var(X) =

.

4.6.3 Binomial
Utilizada para representar o nmero de sucessos em um conjunto de n
experimentos de Bernoulli independentes e com a mesma probabilidade de
sucesso p. Sua distribuio dada por:
P(X) = (

.
E(X) = np e Var(X) = np(1-p).


4.6.4 Geomtrica
Utilizada para representar o nmero de ensaios at a ocorrncia do
primeiro sucesso em ensaios de Bernoulli independentes com probabilidade de
sucesso p. Sua distribuio dada por:
P(X) = p.(1-p)
x-1
.
E(X) =

e Var(X) =

.

4.6.5 Poisson
Em alguns experimentos aleatrios, de interesse observar o nmero X
de ocorrncias de um evento de interesse num dado intervalo de tempo (ou de
rea, ou de volume, ...). Podemos utilizar a varivel X com parmetro como
modelo para essa contagem quando sua distribuio dada por:
P(X) =

.
Nesse caso, E(X) = Var(X) = .
4.7 Algumas distribuies contnuas
4.7.1 Uniforme
Utilizada quando queremos dizer que X pode assumir qualquer valor de
forma igual dentro de um intervalo contnuo. Sejam a e b (a<b) os limites desse
intervalo. Ento
f(X) =

, para a<x<b.
E(X) =

e Var(X) =

.

4.7.2 Exponencial
Utilizada quando queremos estudar, por exemplo, tempos de vida ou
taxa de sobrevivncia. Sua distribuio dada por
f(X) =

, para x>0.
E(X) =

e Var(X) =

.

4.7.3 Normal (ou gaussiana)
Essa uma varivel aleatria muito importante e utilizada em uma gama
gigantesca de aplicaes. Sua distribuio dada por
f(X) =

, para -<x<.
A notao X ~ N(,o
2
). Essa funo simtrica em torno de e logo,
sua mdia, mediana e moda so iguais: E(X) = . Sua varincia dada por
Var(X) = o
2
.

Infelizmente as integrais decorrentes do clculo de probabilidades para a
distribuio normal no tm frmula fechada. Portanto, til aprender as
seguintes relaes:
a) Se X ~ N(,o
2
), ento Y = aX+b ~ N(a+b,a
2
o
2
), sendo a e b duas
constantes quaisquer.
b) (Decorre de (a) acima) Se X ~ N(,o
2
), ento Z =

~ N(0,1).
Z conhecida como normal reduzida (ou normal padro) e suas
probabilidades so dadas em tabelas. Assim, todo problema envolvendo uma
varivel normal qualquer se reduz a um problema envolvendo uma normal com
mdia 0 e varincia 1.