Você está na página 1de 22

Alejandro Donnangelo

Estatística
Sumário
CAPÍTULO 4 – Probabilidade...........................................................................................05

Introdução.....................................................................................................................05

4.1 Cálculo de probabilidade...........................................................................................05

4.1.1 Conceitos básicos em probabilidade..................................................................06

4.1.2 Eventos compostos – dependência e independência.............................................07

4.1.3 Cálculo da probabilidade de eventos independentes – axiomas da probabilidade e as


operações de conjuntos.............................................................................................08

4.1.4 Calculando a probabilidade de eventos utilizando o diagrama de árvore................11

4.2 Distribuição de probabilidade.....................................................................................12

4.2.1 Probabilidade para variáveis discretas.................................................................12

Síntese...........................................................................................................................21

Referências Bibliográficas.................................................................................................22

03
Capítulo 4 Probabilidade

Introdução
Você imagina qual é a probabilidade de, ao lançar um dado, obter o número 6? E qual e a
chance de 1 entre 10 alunos de uma escola apresentar problemas de aprendizado? A partir do
cálculo de probabilidades, é possível mensurar a possibilidade de um possível desfecho ou de
ocorrer uma determinada situação. O cálculo de probabilidades aplica-se a processos aleatórios
dos quais não conhecemos o resultado a priori. O produto de dois números conhecidos é um
processo determinístico a partir do qual é possível obter um valor absoluto. O mesmo não ocorre
com o resultado do boletim do tempo para o dia seguinte, em que passamos a pensar em termos
de probabilidades.

No âmbito do serviço social, podemos estar interessados na probabilidade de evasão escolar por
bairros de um determinado município, ou na probabilidade de o número de gestantes que fumam
ser maior ou menor que um determinado valor. Para dar início aos estudos de probabilidade,
faz-se necessário apresentar alguns conceitos básicos relacionados a conjuntos. Com auxílio
dos diagramas de Venn, será possível visualizar o que é um espaço amostral e o comportamento
de variáveis dentro desse espaço. Neste estudo, você conhecerá o conceito de probabilidade e
aprenderá a calcular as chances de ocorrência de eventos.

Você verá uma pequena introdução às distribuições de probabilidade de variáveis discretas e


contínuas. Para calcular a probabilidade de variáveis contínuas, é preciso entender um pouco
sobre a distribuição gaussiana e suas propriedades. Assim, você aprenderá por que a distribuição
de Gauss – ou distribuição normal – é a mais importante da estatística e que, para poder des-
frutar de suas propriedades, é necessário que as informações apuradas sigam alguns preceitos.
Distribuições gaussianas são praticamente impossíveis na prática, mas, para lhe ajudar, vamos
introduzir uma técnica de padronização de dados que lhe permitirá traduzir dados mais ou me-
nos normalmente distribuídos para uma distribuição normal padrão. Nem todos os conjuntos de
dados se aproximam tanto de uma gaussiana de modo que lhes seja possível aplicar uma pa-
dronização (para esses casos, existe a possibilidade de trabalhar com transformações ou aplicar
estatística não paramétrica, por isso é importante que você procure informações a respeito em
bibliotecas físicas ou virtuais, a fim de complementar o conhecimento aqui apresentado).

Bons estudos!

4.1 Cálculo de probabilidade


Neste tópico, você vai aprender alguns conceitos básicos em probabilidade, como calcular a
probabilidade de eventos simples como uma pesquisa de opinião. Também vai aprender a cal-
cular probabilidade de eventos compostos como o lançamento de dois dados. Vamos começar?

05
Estatística

4.1.1 Conceitos básicos em probabilidade


Um fenômeno que apresenta diferentes resultados, mesmo quando é repedido várias vezes da
mesma maneira, é chamado de experimento aleatório. Alguns exemplos são:

• lançamento de um dado de seis faces;


• lançamento de uma moeda;
• retirar ao acaso uma carta de um baralho;
• a altura de crianças em certa idade;
• a intensidade sonora do canto de uma cigarra;
• o número de integrantes de famílias de uma determinada localidade;
• o tamanho das folhas de uma árvore;
• a massa em gamas dos grãos de arroz de uma safra.
Espaço amostral
Espaço amostral (S) é o conjunto de todos os possíveis resultados de um experimento aleatório.
Por exemplo, em um lançamento de dado de seis faces, os possíveis resultados serão (1, 2, 3,
4, 5 e 6), dizemos que o espaço amostral é o conjunto dos números inteiros de 1 até seis. Em
notação de conjunto, os possíveis resultados do lançamento de um dado são representados por
S = {1,2,3,4,5,6}. No lançamento de uma moeda, o espaço amostral será S = {C,K}, em que
C = Cara e K = Coroa.

Podemos ter experimentos aleatórios com resultados aos pares, por exemplo, no lançamento
concomitante de duas moedas; nesse caso, teremos como resultado um par ordenado, S =
{(C,C),(C,K),(K,C),(K,K)}. Veja que S contém todos os resultados possíveis.

Evento
Evento é um determinado resultado contido dentro de todos os possíveis resultados de um expe-
rimento aleatório. Um evento pode ser definido como subconjunto do espaço amostral (MON-
TGOMERY, 2003). Utilizando o exemplo do lançamento de um dado, poderíamos estar interes-
sados na probabilidade de um resultado em particular, o de sair um número par. Nesse caso, o
evento (E) seria: E = {2,4,6}. Veja como os possíveis resultados desse experimento ficam repre-
sentados no diagrama de Venn (Figura 1).

1
S
E
2
4
3

6
5

Figura 1 – Diagrama de Venn para os possíveis resultados no lançamento de um dado com ênfase no evento E.
Fonte: Elaborada pelo autor, 2015.

06 Laureate- International Universities


Outro exemplo é quando retiramos ao acaso uma carta em um baralho de 52 cartas, um possível
evento simples será uma carta de oito de copas. Outro evento poderia ser uma carta do naipe de
paus; neste último caso, o evento será composto por todo o conjunto de cartas de paus do baralho.

Probabilidade
Chama-se probabilidade (P) à chance de ocorrência de um evento. Esta pode ser obtida a partir
da observação de um determinado fenômeno por muitas vezes até que se descubra a probabi-
lidade do resultado esperado em relação a todos os resultados possíveis. No caso de eventos
equiprováveis, a probabilidade é calculada por meio da seguinte equação.

ne
P(E) =
n

Em que: ne é o número de resultados do evento que se quer saber a probabilidade;

n é o número total de resultados possíveis do experimento aleatório.

No lançamento de um dado, em que queremos saber a probabilidade de sair um número par


(Figura 1), teremos:

3
P(E) = = 0,5 ou 50%
6

A probabilidade de obter um número ímpar após o lançamento de um dado não viciado é igual
a 0,5 ou 50%. E qual seria a probabilidade de se retirar uma carta de paus em um baralho de
52 cartas?

Nesse caso, ne é o número de cartas de paus do baralho (13) e n é o número total de cartas do
baralho (52), então teremos:

13
P(E) = = 0,25 ou 25%
52

Variável aleatória
Variável aleatória é o valor associado à medida de um parâmetro estudado em um experimento
aleatório. É uma característica numérica do resultado de um experimento (BARBETTA, 2014).

Ela pode ser discreta quando o experimento possui valores inteiros, como, por exemplo, o nú-
mero de integrantes de famílias de uma determinada localidade. Nesse caso, existem apenas
números inteiros para o evento em questão. Ou ela é contínua, em experimentos que possuem
uma infinidade de valores possíveis dentro de um determinado intervalo. Por exemplo, o peso de
um recém-nascido pode assumir qualquer valor dentro de um determinado intervalo do conjunto
dos números reais (dependendo apenas da precisão da balança).

4.1.2 Eventos compostos – dependência e independência


Eventos compostos são formados por dois ou mais eventos simples. Por exemplo, quando lança-
mos uma moeda duas vezes e estamos interessados na probabilidade de ocorrer dois resultados
cara (C,C), esse evento será composto pelos seguintes eventos:

E1 = Obter cara no primeiro lançamento e E2 = Obter cara no segundo lançamento.

07
Estatística

Outro exemplo é o lançamento de dois dados em que se deseja E={6,6}, esse evento será com-
posto pelos seguintes resultados:

E1 = Obter um 6 no primeiro lançamento, E2 = Obter um 6 no segundo.

Muito bem, agora sabemos o que são eventos compostos, mas, para o cálculo de probabilidade
de eventos compostos, precisamos primeiramente classificá-los quanto à sua dependência ou
independência.

Eventos dependentes entre si são aqueles em que a probabilidade da ocorrência de um depen-


de do resultado do outro, como em um sorteio sem reposição. Por exemplo, vamos imaginar um
experimento aleatório no qual vamos retirar ao acaso uma série de bolas de dentro de uma caixa
que contém 20 bolas de tênis – 10 de cor azul e 10 de cor amarela. Os possíveis eventos desse
experimento serão A = a bola retirada é de cor azul, e B = a bola retirada é da cor amarela.

Na primeira repetição do experimento, a probabilidade de sair uma bola azul ou amarela será de:

10
P(A) = P(B) = = 0,5 ou 50%
20

Vamos supor que na primeira realização do experimento retiramos uma bola da cor azul; note
que a quantidade de bolas azuis na caixa passará a ser 9. Portanto, na segunda repetição, a
probabilidade dos eventos se alterou para: P(A) = 9/19 = 0,47 e P(B) = 10/19 = 0,53, e essa
mudança de probabilidade acontecerá em todas repetições.

Contudo, no caso do sorteio com reposição, teremos eventos independentes, pois a proba-
bilidade de ocorrência de um não dependerá de outro. Utilizando o exemplo anterior, se, após
retirarmos uma bola da caixa, houver sua reposição antes de sortear a próxima bola, teremos
sempre a mesma proporção de bolas azuis e amarelas dentro da caixa. Assim sendo, a probabi-
lidade dos eventos não se altera pelo resultado do experimento anterior.

4.1.3 Cálculo da probabilidade de eventos independentes – axiomas da


probabilidade e as operações de conjuntos
Em probabilidade, existem três axiomas, que são premissas sem as quais não existiria nem a
teoria nem o cálculo da probabilidade.

1. A probabilidade de qualquer evento deve ser sempre um valor entre 0 e 1.

2. A probabilidade de o resultado de um experimento estar contido no espaço amostral deve


ser igual a 100%, ou seja, P(S) = 1.

3. A probabilidade do complementar de um evento A (denotado por A’) será sempre P(A’) =


1-P(A).

VOCÊ O CONHECE?
Andrei Nikolaevich Kolmogorov foi um cientista e matemático russo que axiomatizou a
teoria da probabilidade da mesma forma que a geometria foi axiomatizada por Eucli-
des (Euclides de Alexandria – 325 a.C a 265 a.C). Os axiomas foram publicados em
1933, no livro Fundamentos da teoria da probabilidade (VIALI, 2008).

08 Laureate- International Universities


Quando lançamos uma moeda duas vezes e estamos interessados no evento composto por pelo
menos um resultado cara, teremos cara no primeiro ou cara no segundo lançamento. Podería-
mos nos interessar também no evento de ocorrer cara nos dois lançamentos; nesse caso, vamos
ter cara no primeiro e cara no segundo.

Em probabilidade, veremos que a palavra “ou” denota união entre eventos, e a palavra “e”
denota intersecção entre eventos.

Dizemos que intersecção acontece quando um evento é composto pelos resultados que perten-
cem a um “e” outro evento. Representamos intersecção pelo símbolo “∩”. Para calcular a pro-
babilidade de intersecção de dois eventos, utilizamos a mesma equação do cálculo da probabi-
lidade, sendo que o número de elementos favoráveis será igual ao número de resultados contido
nos dois ou mais eventos sob intersecção.

n(A ∩ B)
P(A ∩ B) =
n

Vamos supor que queremos saber a probabilidade de o resultado do lançamento de um dado


ser um número par “e” maior do que 3. Nesse caso, estamos interessados no evento composto
pela intersecção de dois eventos A e B. Evento A = um número par A = {2,4,6} ; Evento B um
número maior do que três B = {4,5,6} (Figura 2).

S
A B
2 5
4

3 1

Figura 2 – Diagrama de Venn com intersecção de dois eventos no lançamento de um dado.


Fonte: Elaborada pelo autor, 2015.

Os resultados favoráveis ao nosso evento estão coloridos de cinza e representam a intersecção


dos dois subconjuntos A e B. Temos que A ∩ B = {4, 6} e podemos calcular a probabilidade
de termos como resultado um número par e maior que três por P(A ∩ B) = 2/6 = 1/3, o que
equivale a 33%.

União – Quando um evento é composto pelo resultado de um “ ou” outro evento – dizemos
que há união de conjuntos e o representamos pelo símbolo “U”. Para conhecer os elementos da
união, podemos somar os elementos dos dois ou mais conjuntos de interesse.

Para calcular a probabilidade da união de dois eventos de forma direta, utilizamos a equação:

P(A ∪ B) = P(A) + P (B) – P(A ∩ B)

Veja que, nessa equação, faz-se necessário restar o evento intersecção para não contar duas
vezes o mesmo evento. Utilizando o exemplo anterior, vamos supor que queremos saber a pro-
babilidade de obtermos um resultado par “ou” maior do que 3 (Figura 3).

09
Estatística

S
A B
2 5
4

3 1

Figura 3 – Diagrama de Venn para união de dois eventos no lançamento de um dado.


Fonte: Elaborada pelo autor, 2015.

Para tanto, utilizamos a equação:

P(A ∪ B) = P(A) + P (B) – P(A ∩ B) = ½ + ½ – 1/3 = 2/3.

Desse modo, obtivemos a probabilidade de obter um número par ou maior que três igual a 66%.

Complementar – Quando queremos saber qual é a probabilidade de não ocorrer um determi-


nado evento – representado por “E”. Por exemplo, se sabemos que a probabilidade de chover no
fim de semana é de 10%, então a possibilidade de não chover será de 90%. Seu valor pode ser
calculado pela equação do terceiro axioma da probabilidade:

P(A') = 1 – P(A).

No exemplo do lançamento dos dados, se quisermos conhecer a probabilidade de obter um


número ímpar, podemos encontrar a probabilidade complementar de o evento A ser um número
par (Figura 4):

3
P(A') = 1 – P(A) = 1 – = 0,5 ou 50%.
6

1
S
A
2
4
3

6
5

Figura 4 – Diagrama de Venn para evento complementar A de números pares no lançamento de um dado.
Fonte: Elaborada pelo autor, 2015.

10 Laureate- International Universities


4.1.4 Calculando a probabilidade de eventos utilizando o diagrama de
árvore
O diagrama de árvore é uma ferramenta que permite mapear as probabilidades em um experi-
mento aleatório. Neste, é possível representar os possíveis resultados de experimentos compostos
em cada estágio. Vamos imaginar o seguinte experimento aleatório: um cliente deseja comprar
uma motocicleta e, pelas suas condições financeiras, ele possui as seguintes opções:

1. marcas Honda ou Yamaha;

2. das duas marcas, há duas opções de motor: 125 e 150 cilindradas;

3. das duas marcas, há três opções de freio: tambor, disco e disco ventilado;

4. e ainda quatro opções para as cores: vermelha, amarela, branca e preta.

Podemos representar esse experimento aleatório pelo diagrama de árvore da Figura 5.

1. Marca
n1 = 2
HONDA YAMAHA p1 = 1/2

2. Motor
125cc 150cc 125cc 150cc n2 = 4
p2 = 1/4
3. Freio
Tambor Disco Tambor Disco Tambor Disco Tambor Disco n3 = 12
ventilado ventilado ventilado ventilado
Disco Disco Disco Disco p3 = 1/12
4. Cor
n4 = 48
p4 = 1/48

Figura 5 – Diagrama de árvore referente a diferentes opções para compra de uma moto.
Fonte: Elaborada pelo autor, 2015.

O resultado é um mapa da combinação de todos os possíveis eventos. Nele, sabemos que o


número total de opções será de n = 48, sendo 2 opções de marca – P(Honda) = ½; P(Yamaha
= ½ – 4 opções de moto diferenciadas pela marca e motor – P(Honda 125cc) = 1/4 ; P(Honda
150 cc) = 1/4 ; P(Yamaha 125cc) = 1/4 ; P(Yamaha 150cc) = 1/4, e assim por diante para os
demais estágios da árvore.

Vamos supor que se deseja conhecer a probabilidade de um cliente comprar uma moto com freio
a tambor, de 125cc da marca Honda. Para calcular essa probabilidade, basta verificar que, no
terceiro estágio da árvore, temos n3 = 12, logo:

1
P(Honda, 125cc e tambor) = = 0,083, ou seja, 8,3%.
12

Se quisermos saber qual é a probabilidade do evento: um cliente escolher uma moto vermelha,
independentemente das demais variáveis, P será:

P(Vermelha) = 12/48 = ¼, ou seja, 25%.

11
Estatística

NÓS QUEREMOS SABER!


O diagrama da árvore permite, de fato, aplicações práticas na esfera do serviço social?
Claro que sim. Qualquer processo probabilístico que se desenvolva de forma dicotô-
mica no âmbito do serviço social é passível da aplicação do referido método. Além do
caráter dicotômico, o processo deve ter um ponto de partida comum, e as probabilida-
des em todas as etapas devem ser conhecidas.

4.2 Distribuição de probabilidade


No tópico anterior, você aprendeu a calcular a probabilidade de eventos simples e de eventos
compostos, a representar eventos com o diagrama de Venn e a mapear a probabilidade utilizan-
do o diagrama da árvore. Mas vamos supor que você deseja saber como os acionistas sabem
qual a melhor commodity para investir no momento. Da mesma maneira que os assistentes so-
ciais sabem a probabilidade de visitar uma criança em estado de desnutrição que more no seu
bairro. Ao final deste tópico, você saberá fundamentalmente como calcular essas probabilidades.

4.2.1 Probabilidade para variáveis discretas


Variáveis discretas normalmente aparecem com valores inteiros, por exemplo, quando temos o
resultado do censo do número de integrantes por família em um determinado país. O histograma
da Figura 6 mostra um resultado hipotético dessa pesquisa em que (X) = número de integrantes
por família pesquisada, µ = 5 pessoas por família e σ = 2.
0.20

0.20
Frequência relativa

Frequência relativa
0.10

0.10
0.00

0.00

0 2 4 6 8 0 2 4 6 8
x x
(a) (b)

Figura 6 – Histograma (a) e probabilidade (b) de valores de X maiores ou iguais do que 4 (destacados em cinza).
Fonte: Elaborada pelo autor, 2015.

Para calcular a probabilidade de encontrarmos famílias com 4 ou mais integrantes, basta somar
as áreas dos retângulos que representam a frequência relativa a valores de x maiores ou iguais
a 4 – retângulos em cinza-escuro da Figura 6 (b).

12 Laureate- International Universities


Em geral, o cálculo de qualquer evento em um experimento aleatório de uma variável discreta
poderá ser feito por esse caminho. Primeiro fazemos um histograma com os resultados das fre-
quências relativas de cada valor da variável aleatória (X) como na Figura 4. Depois calculamos
a área dos retângulos para os valores de X que compõem o evento do qual se estuda a probabi-
lidade. Nesse caso, a probabilidade de X≥4 será:

P(x ≥ 4) = P(4)+P(5)+P(6)+P(7)+P(8) = 0,27+0,26+0,15+0,6+0,1

P(x ≥ 4) = 0,75

Ou seja, 75% das famílias deste país possuem 4 ou mais pessoas.

De forma muito similar é possível obter probabilidades a partir de distribuições contínuas. Para
isso, basta calcular a área sob a curva e teremos a probabilidade desejada. No caso das dis-
tribuições discretas, a soma da área dos retângulos fornece a probabilidade desejada. Mas o
grande problema no caso de distribuições contínuas é saber como calcular a área de uma figura
irregular. Veja a seguir.

A distribuição normal
Pode-se dizer que a distribuição normal ou gaussiana é a distribuição mais importante da esta-
tística. Esta descreve um gráfico unimodal em forma de sino e simétrico em relação à sua média.

Figura 7 – Distribuição normal ou gaussiana, com curva unimodal e simétrica em relação à sua média.
Fonte: Elaborada pelo autor, 2015.

A curtose caracteriza o grau de achatamento de uma curva em relação à gaussiana. Distribuições


com pico alto e base estreita são chamadas leptocúrticas, ao passo que distribuições achatadas
no centro e mais largas na base são chamadas platicúrticas. A distribuição é chamada mesocúr-
tica e possui curtose igual a 3. Claramente dados mais dispersos geram curvas platicúrticas (cur-
tose<3) e dados menos dispersos geram curvas leptocúrticas (curtose>3). A Figura 8 apresenta
3 curvas com diferentes valores de curtose. Note que todas possuem simetria, média igual a 0,
porém diferem quanto ao desvio padrão (σ).

13
Estatística

σ = 0.5
0.5 σ=4
σ=1
0.4
Densidade f(x)

0.3
0.2
0.1
0.0

-4 -2 0 2 4

Figura 8 – Distribuições com diferentes valores de curtose, em que a linha pontilhada re-
presenta a distribuição normal padrão com desvio igual a 1 e curtose igual a 3.
Fonte: Elaborada pelo autor, 2015.

A distribuição normal possui as seguintes propriedades:

• moda, média e mediana possuem o mesmo valor e estão no centro da distribuição –


dividindo 50% dos dados para cada lado da distribuição.

• 68,26% dos valores encontram-se no intervalo de µ±σ;


• 95,46% dos valores encontram-se no intervalo µ±2σ;
• 99,73% dos valores estão em um intervalo de µ±3σ (Figura 6).

3σ 2σ σ σ 2σ 3σ
68,26%
95,46%
99,73%

Figura 9 – Probabilidade de eventos nos intervalos µ ±1σ, µ ±2σ e µ ±3σ dis-


tante de – (válido somente para distribuição normal).
Fonte: Elaborada pelo autor, 2015.

14 Laureate- International Universities


• A função que define a curva normal é:

Essa equação significa que, para cada valor de x calculado, obteremos um valor y correspon-
dente (f(x)) de tal modo que, ao plotar os resultados, obteremos uma curva normal. Vamos ver a
seguir porque isso é tão importante para nós. A equação possui apenas duas entradas: a média
(µ) e o desvio padrão (σ). A primeira indica a posição central da distribuição e a segunda indica
a dispersão em torno da média. A área total abaixo da curva normal é sempre igual a 1. Isso
não é fantástico? Sabendo que a área abaixo da curva normal é sempre um valor entre 0 e 1,
podemos realizar cálculos de probabilidade utilizando essa função. A área abaixo da curva nor-
mal para um determinado intervalo de valores da variável x é dado pela integral da função f(x)
nos intervalos entre x1 e x2.

Vamos supor que estamos interessados em sortear uma viagem de estudo para os alunos do
terceiro ano do ensino médio de uma escola. Qual é a probabilidade de sortear um aluno com
rendimento médio abaixo de uma determinada nota de corte? A Figura 10 apresenta a proba-
bilidade P(x<valor de corte) de sortear um aluno com rendimento médio abaixo da nossa nota
de corte.
0.4
0.3
Densidade f(x)

0.2
0.1
0.0

x
nota mais baixa nota de corte nota mais alta

Figura 10 – Área sob a curva normal para obter a probabilidade de sortear um alu-
no com rendimento médio abaixo da linha de corte P(x<nota de corte).
Fonte: Elaborada pelo autor, 2015.

15
Estatística

Como a aplicação do cálculo integral não parece muito prática para o cálculo de probabilida-
des, para tanto, usaremos a distribuição normal padrão.

Curva normal padrão


A curva normal padrão possui média igual a 0 (µ = 0) e desvio padrão igual a 1(σ = 1). Quando
um experimento aleatório apresentar uma distribuição normal, podemos transformar os valores
da variável aleatória X para a variável padronizada Z por meio da seguinte equação:

x–m
Z=
σ

Esse procedimento é conhecido como padronização dos dados. Valores Z possuem distribuição
normal padrão e as áreas debaixo da curva são dadas pela Tabela Z (anexo).

Antes de prosseguir com o cálculo de probabilidade, é preciso fazer algumas considerações. A


distribuição normal é uma distribuição teórica e, na prática, dados dificilmente geram distribui-
ções normais. De forma geral, distribuições não são perfeitamente simétricas e tampouco meso-
cúrticas. Devemos presumir que nossos dados seguem uma distribuição normal, mesmo que a
sua distribuição de probabilidade não seja perfeitamente simétrica ou que seja mais ou menos
curtótica do que a curva normal (THURMAN, 2012).

O primeiro passo para identificar se nossos dados podem ser considerados normais é plotar
um histograma, polígono de frequência ou boxplot. Se o gráfico obtido for semelhante à curva
normal, podemos pensar em padronizar os dados. O segundo passo é aplicar um teste estatístico
que confirme se, de fato, é possível aproximar a distribuição de nossos dados pela distribuição
normal. Alguns desses testes são o Kolmogorov-Smirnov e Shapiro-Wilk. Mais detalhes sobre
testes estatísticos para verificação de normalidade podem ser encontrados em Devore (2011). É
importante lembrar que, se não for possível assumir a normalidade em nossos dados, tampouco
será possível realizar o cálculo de probabilidade pela curva normal e qualquer resultado obtido
não terá valia alguma.

O que acontece ao padronizar os nossos dados? O valor z fornece o número de desvios padrão
(σ) distantes da média. Vejamos, sabemos que a área total abaixo de nossa distribuição (similar
à normal) é 1, mas desconhecemos a área sob a curva em termos de desvios padrão distantes da
média. Sabemos também que a área abaixo da curva normal descrita pelos valores z novamente
é igual a 1, mas, nesse caso, os valores da área abaixo da curva em termos de desvios padrão
encontram-se tabelados. As médias das distribuições serão diferentes e o valor dos desvios tam-
bém, mas ambas as distribuições irão apresentar a mesma área relativa de um determinado
intervalo. Em outras palavras, as áreas são proporcionais e a densidade de probabilidade será
a mesma para ambas as distribuições. É por esse motivo que fazemos uso da padronização dos
dados para distribuições assumidas normais.

Vamos dar um exemplo adaptado de Devore (2011). Suponha que, a partir de uma pesquisa
sobre saúde infantil, obtivemos dados referentes ao peso, em gramas (g), das crianças de uma
determinada idade. Vamos calcular a probabilidade de sortear ao acaso uma criança com peso
menor a 6.000 g (µ = 5.000 g e σ = 500 g). Lembre-se de que consideramos a normalidade
dos dados já verificada.

Primeiro encontramos o valor de Z para x = 6.000,

x–m 6.000 – 5.000


Z= = =2
σ 500

16 Laureate- International Universities


Agora, utilizando a Tabela Z em anexo, encontramos que o valor z = 2 (Figura 11) indica uma
área igual a 0,9772. A partir de então, concluímos que a probabilidade de sortear uma criança
com massa menor do que 6.000 g será P(x<6.000) = 97,72%.

0.4
0.3
Densidade f(x)

0.2
0.1
0.0

z2
-4 -2 0 2 4
z

Figura 11 – Área sob a função distribuição normal para P(Z<2) igual a 0,9772 ou 97,72%.
Fonte: Elaborada pelo autor, 2015.

Agora vamos supor que desejamos saber qual é a probabilidade de uma criança, escolhida
aleatoriamente, ter mais do que 5.500 g. Primeiramente, vamos calcular o valor de Z para x =
5.500 g:

x–m 5.500 – 5.000


Z= = =1
σ 500

Nosso objetivo é encontrar a probabilidade de Z assumir valores maiores do que 1, P(Z>1), en-
tão vamos encontrar a área sob a curva normal à direita de Z = 1 (Figura 12).
0.4
0.3
Densidade f(x)

0.2
0.1
0.0

z1
-4 -2 0 2 4
z

Figura 12 – Área sob a curva normal padrão para P(Z<1).


Fonte: Elaborada pelo autor, 2015.

17
Estatística

Na Tabela Z, encontramos a área à esquerda (0,8413), ou seja, a probabilidade de valores de Z


menores do que 1. Esse valor representa P(x<5.500), que é o inverso do que queremos calcular
P(x>550). Então fazemos o cálculo da probabilidade complementar:

P(x>550) = 1 – P(x<550) = 1 – 0,8413 = 0,1587 ou 15,87%

A probabilidade de encontrarmos ao acaso uma criança com mais de 5.500 g é igual a 15,87%.

Agora vamos supor que crianças com peso entre 5.500 g e 6.000 g possuam tamanho ideal.
Qual é a probabilidade de encontrarmos ao acaso uma criança nesse intervalo de valores? Veja
que, nesse caso, temos interesse em descobrir a probabilidade de X assumir um valor em um
intervalo definido P(5.500<X<6.000).

Vamos transformar os valores X1 = 5.500 g e X2 = 6.000 g em valores Z1 e Z2 respectivamente.

x1 – m 5.500 – 5.000 x2 – m 6.000 – 5.000


Z1 = = =1 e Z2 = = = 2.
σ 500 σ 500

O interesse agora está na probabilidade P(1<Z<2) (Figura 13).


0.4

0.4

0.4

P(Z<2) P(Z<1) P(1<Z<2)


0.3

0.3

0.3
Densidade f(x)

Densidade f(x)

Densidade f(x)
0.2

0.2

0.2
0.1

0.1

0.1
0.0

0.0

0.0

z2 z1 z1 z2
-4 -2 0 2 4 -4 -2 0 2 4
z z -4 -2 0 2 4
z

Figura 13 – Área sob a função distribuição normal para P(1<Z<2).


Fonte: Elaborada pelo autor, 2015.

Pela tabela, encontramos que P(Z<1) = e P(Z<2) = 0,9772. Para encontrar P(1<Z<2), fazemos
a diferença entre as áreas:

P(1<Z<2) = P(Z<2) – P(Z<1) = 0,9772 – 0,8413 = 0,1359

Assim, a probabilidade de tomarmos ao acaso uma criança com peso ideal (entre 5.500 e
6.000 g) é de 13,59%.

Também é possível utilizar a área sob a curva normal padrão para identificar valores em X conhe-
cendo apenas a média e o desvio padrão. Por exemplo, um relatório apresentado por agentes de
saúde diz que a média de peso das crianças é 5.000 g (σ = 500 g) e que exames indicam que
as crianças com sobrepeso necessitam cuidados especiais. O relatório também diz que esse peso
corresponde a aproximadamente 2,3% das crianças mais pesadas. Qual seria o valor de corte
para seleção dessas crianças? O peso correspondente é igual 100% -2,3% = 97,7%. Veja que
estamos calculando o ponto que divide 97,7% dos valores inferiores dos 2,3% valores superio-
res. Recorremos à Tabela Z e buscamos o valor mais próximo a 97,7% ou 0,977. Encontramos
0,9772, e esse valor corresponde a 2 desvios padrão à direita da normal padrão. Agora pode-
mos encontrar o valor correspondente em gramas fazendo o caminho inverso à padronização:

18 Laureate- International Universities


x1 – m
Z1 = → x1 = (Z1 * σ) + m = 2 * 500 + 5.000 = 6.000 g
σ

Podemos concluir que crianças acima de 6.000 g deverão receber cuidados especiais.

NÃO DEIXE DE VER...


No vídeo Distribuição de Probabilidade: como usar a tabela da distribuição normal, o
professor Allan ensina, de forma minuciosa, a calcular a probabilidade de eventos que
têm uma distribuição normal por meio da transformada para curva normal padrão.
Disponível em: <https://www.youtube.com/watch?v=ec9HWoY2kt8>.

Vimos que os dados raramente são normalmente distribuídos e que, para recorrer à curva nor-
mal, faz-se necessário assumir ou declarar que os dados são normais (THURMAN, 2012). Na
estatística paramétrica, presume-se que os dados apresentam algum tipo de distribuição e torna-
-se possível realizar inferências sobre seus parâmetros. No caso da distribuição normal, os parâ-
metros são a média e o desvio padrão.

NÓS QUEREMOS SABER!


Padronizar os dados é o mesmo que normalizar os dados? A resposta é não. Ao padro-
nizar os dados, estamos calculando os escores z ou distância dos valores em relação à
média (µ) em termos de desvios padrão (σ). Ao normalizar um conjunto de dados que
segue uma distribuição genérica, obtemos como resposta a posição que cada valor
assumiria em uma distribuição normal.

Quando falamos em dados normalmente distribuídos, fazemos uso da estatística paramétrica.


Em muitos casos, os resultados dos testes de normalidade indicam que não é possível assumir
a normalidade dos nossos dados porque as distribuições diferem muito da distribuição normal.
Nesses casos, existem algumas alternativas. Uma delas é aplicar técnicas não paramétricas. A
estatística não paramétrica é aplicada quando não se pode assumir que um conjunto de dados
segue uma distribuição específica. Outra alternativa pode ser transformar as distribuições para
uma distribuição normal, sendo essa operação chamada de normalização dos dados. Uma téc-
nica muito difundida é a transformação Box-Cox.

NÃO DEIXE DE LER...


Uma nota sobre a transformação Box-Cox, de Aguirre (1997), no qual o autor utiliza
a metodologia de normalização de dados chamada Box-Cox e compara os resultados
obtidos em sua análise com e sem a normalização, encontrando variações da ordem
de 2%. Boa leitura!

19
Estatística

Você aprendeu a calcular a probabilidade de distribuições de probabilidade de variáveis discretas


e contínuas. Viu as características da curva normal, que ela é simétrica em relação à média e que
a sua curtose é igual a três. Para as distribuições normais, aprendeu a calcular a probabilidade
de eventos em qualquer intervalo de valor da variável aleatória, por meio do cálculo da integral
de f(x) ou transformando a distribuição para uma distribuição normal padrão e encontrando o
valor da área sob a curva de distribuição de probabilidade na tabela de Z (utilize a Tabela 1). A
partir daí, calculou a probabilidade de eventos com área a esquerda de Z, à direita de Z e entre
dois valores. Observe a Tabela 1: a primeira coluna mostra os valores da unidade e da primeira
casa decimal de Z; a primeira linha traz os valores da segunda casa decimal de Z.

zp
z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8621
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,8830
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9015
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9177
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9319
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9441
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9545
1,8 0,9641 0,9649 0,9656 0,9682 0,9671 0,9678 0,9686 0,9693 0,9699 0,9633
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9706
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9767
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9817
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9857
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9890
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9916
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998

Tabela 1 – Valores da área sob a curva normal padrão – valores da área à esquerda de z.
Fonte: Adaptado de Instituto de Matemática de UFRJ, 2015.

20 Laureate- International Universities


Síntese Síntese
Você concluiu os estudos deste capítulo, em que:

• aprendeu o conceito de probabilidade e suas aplicações;


• identificou o que é um espaço amostral e como calcular probabilidades de eventos para
variáveis aleatórias. Também viu a diferença entre eventos complementares e excludentes
e os casos nos quais devemos trabalhar como operações de união e intersecção de
eventos;

• conheceu o conceito de árvore de probabilidade e viu como é possível o cálculo de


probabilidade por etapas para experimentos binomiais;

• estudou as distribuições de probabilidade para variáveis discretas e contínuas. Nesse


ponto, algo muito importante foi ver que a soma da área das barras de um gráfico
de densidade de probabilidade de uma variável discreta é sempre igual a 1. De forma
análoga, para distribuições contínuas, a integral da área abaixo da curva sempre terá um
valor a 1 ou 100% dos nossos dados;

• conheceu a mais importante das distribuições, a distribuição normal, ou de Gauss.


Também entendeu que, mesmo que esta seja uma curva teórica e que, na prática, quase
nada descreve uma curva normal perfeita, é possível realizar cálculos de probabilidades
de distribuições não tão normais fazendo uso da padronização dos dados;

• por fim, aprendeu que, quando as variáveis apresentam distribuições muito diferentes da
normal, é necessário o uso de estatística paramétrica ou realizar a transformação dos
dados utilizando, por exemplo, a metodologia Box-Cox.

21
Referências Bibliográficas
AGUIRRE, A. Uma nota sobre a transformação Box-Cox. Belo Horizonte: UFMG/Cede-
plar,1997.

AMARO, A.; SILVESTRE, C.; FERNANDES, L. Estatística descritiva. O segredo dos dados. 1. ed.
Lisboa: Editora Lulu, 2009. 114 p.

BARBETTA, P. A. Estatística aplicada às ciências sociais. ed. 9. Florianópolis: UFSC, 2014.

DEVORE, J. L. Probabilidade e estatística para engenharia e ciências. 6. ed. São Paulo:


Cengage Learning, 2011.

MONTGOMERY, D.; RUNGER, G. Estatística aplicada e probabilidade para engenheiros.


Rio de Janeiro: Livros Técnicos e Científicos, 2003.

THURMAN, P. W. Estatística. São Paulo: Saraiva, 2012.

VIALI, L. Algumas considerações sobre a origem da Teoria da Probabilidade. Revista Brasileira


de História da Matemática, Natal, v. 8, n. 16, p. 143-153, 2008.

22 Laureate- International Universities

Você também pode gostar