Você está na página 1de 16

BIOESTATÍSTICA

Juliane Silveira Freire da Silva


Distribuição paramétrica
Objetivos de aprendizagem
Ao final deste texto, você deve apresentar os seguintes aprendizados:

„ Diferenciar uma distribuição de frequência paramétrica de uma não


paramétrica.
„ Definir quais medidas expressam adequadamente uma distribuição
de frequência paramétrica.
„ Expressar o cálculo de probabilidades baseado na tabela da normal
padronizada.

Introdução
Neste texto, você vai estudar a distribuição paramétrica, que tem por
característica uma representação gráfica em histograma representando
uma curva de Gauss. A distribuição paramétrica existe apenas em variáveis
quantitativas que permitem a análise da distribuição de frequências. 

Estatística paramétrica
Técnicas de estatística paramétrica e de estatística não paramétrica são
utilizadas em probabilidade para estimarmos os parâmetros. Na estatística
paramétrica, temos o pressuposto de que os dados são provenientes de uma
distribuição de probabilidades conhecida. Os testes paramétricos são mais
rigorosos, pois possuem mais premissas a serem cumpridas. Na estatística não
paramétrica, não se conhece a distribuição que os dados seguem. Esses testes
não pressupõem uma distribuição de probabilidades conhecida.
2 Distribuição paramétrica

Para a estatística paramétrica, os dados devem seguir uma distribuição


normal, também conhecida como distribuição gaussiana. A distribuição normal
é simétrica em torno da média e, nessa distribuição, a média, a mediana e a
moda são coincidentes. O formato, mais achatado ou mais estreito, depende
da variabilidade dos dados.
Para avaliarmos o formato da distribuição que os dados seguem, podemos
verificar visualmente pelo histograma (gráfico de distribuição de frequências
para dados dispostos em intervalos) e também podemos verificar se os dados
seguem uma distribuição normal com testes específicos (Figura 1).
Algumas vezes, mesmo se verificarmos que os dados não seguem uma
distribuição normal, podemos transformar a variável para aproximar a dis-
tribuição dos dados para uma distribuição normal.

ƒ(x)
σ = 0.5
0.75

σ = 0.75
0.5
σ = 1.0

σ = 1.25

0.25 σ = 1.5

x
-4 -2 -1 1 2 4
µ=0
Figura 1. Exemplos de curvas normais com média zero e desvios
padrão diferentes.
Fonte: Vieira (2016).
Distribuição paramétrica 3

Podemos verificar se os dados amostrais são provenientes de uma distribuição normal


com o teste Shapiro-Wilk, que é o mais utilizado e pode ser aplicado para qualquer
valor de n (tamanho da amostra). Além disso, também podemos utilizar esse ou
outros testes para normalidade, sempre que houver a desconfiança da distribuição
que os dados seguem.

Testes paramétricos e não paramétricos


A verificação sobre os dados seguirem uma distribuição paramétrica ou não
nos servirá como balizador sobre qual teste de probabilidade utilizar nos
nossos dados. Para todo o teste paramétrico, temos outro teste equivalente
não paramétrico. Alguns exemplos estão no Quadro 1.

Quadro 1. Comparação de alguns testes paramétricos e não paramétricos.

Teste Teste não


Objetivo paramétrico paramétrico

Testar duas amostras Teste t Mann-Whitney


independentes

Testar duas amostras Teste t pareado Wilcoxon


pareadas

Testar três ou mais One-Way ANOVA Kruskal-Wallis


amostras independentes

Enquanto os métodos paramétricos só podem ser utilizados para dados


numéricos, os métodos não paramétricos podem ser utilizados para dados não
numéricos (p. ex., escalas ordinais).
Em contrapartida, os métodos paramétricos têm um poder estatístico bas-
tante superior aos métodos não paramétricos. Assim, os testes não paramétricos
requerem uma amostra maior para trabalharmos com mais tranquilidade.
4 Distribuição paramétrica

A distribuição normal
Em estatística, podemos ter distribuições distintas. A mais importante, sem
dúvida, é a distribuição normal, já que a maioria dos dados se comporta
normalmente (Figura 2), mas, quando não se comporta de acordo com a
distribuição normal, desejamos que ela seguisse essa distribuição.
Algumas particularidades da distribuição normal:

a)  a área abaixo da curva normal é 100%, ou seja, tem probabilidade


igual a 1;
b)  não existe probabilidade negativa, ou maior do que 1;
c)  a curva é simétrica em torno da média;
d)  é chamada de curva normal padrão, ou curva normal padronizada, a
distribuição normal com μ = 0 (média igual a 0) e σ = 1 (desvio padrão
igual a 1).

ƒ(z)

0,4

0,3

0,2’

0,1

-3 -2 -1 0 1 2 3 z
68,27%
95,45%
99,73%

Figura 2. Distribuição normal padrão.


Fonte: Spiegel, Schiller e Srinivasan (2015).
Distribuição paramétrica 5

A função matemática que dá forma à distribuição normal é:

(x - µ)2
2σ2
ƒ(x) = 1 e
√2σ

Sendo:
σ = desvio padrão populacional
μ = média populacional
π = constante Pi
e = constante Euler
x = valor da variável
No caso de uma distribuição de probabilidades contínua, que é o caso da
distribuição normal, teríamos que calcular a integral para podermos descobrir
a probabilidade do intervalo que estivéssemos interessados. Porém, existe uma
tabela que pode facilitar e muito os cálculos, uma vez que essa integral é de
difícil resolução. Utilizaremos a tabela normal padrão, cuja particularidade
é ter a média igual a zero e o desvio padrão igual a 1.
Como na natureza, dificilmente encontraremos média igual a zero e desvio
padrão igual a 1, precisamos, então, transformar a nossa variável com qualquer
média e qualquer desvio padrão em uma N(0,1), ou seja, com média zero e
desvio padrão 1. A isso damos o nome de padronizar a variável, ou seja,
transformamos a nossa variável x em uma variável padronizada z.

x-µ
z= σ

Sendo:
x = valor da variável em estudo
μ = média populacional, valor padrão, parâmetro
σ = desvio padrão populacional, valor padrão, parâmetro
Mas antes de padronizarmos qualquer variável, vamos aprender a olhar a
tabela normal padrão. Aqui veremos como utilizar a normal padrão completa
(Tabela 1).
6 Distribuição paramétrica

Tabela 1. Probabilidades da distribuição normal padronizada.


Distribuição paramétrica 7

Há mais de uma tabela normal padrão que podemos utilizar. Existe a normal padrão
completa, em que temos as probabilidades abaixo de toda curva normal, a cauda
negativa (cauda da esquerda para valores de z menores ou iguais a média 0) e a cauda
positiva (cauda da direita para valores de z maiores ou iguais a média 0).
Temos também a normal reduzida, que apresenta apenas metade da curva normal.
Para essa tabela, a maneira de achar as probabilidades é um pouco diferente do
apresentado aqui.

Particularidades da tabela normal padrão completa:

a)  a área total abaixo da curva soma 1;


b)  a tabela possui os valores abaixo e acima da média, ou seja, mostra-nos
a curva completa;
c)  as probabilidades da tabela foram calculadas de forma que nos sejam
fornecidos os valores de P(Z ≤ z) (as probabilidades menores ou iguais
ao ponto que estamos estudando).

Para os exemplos que seguem, já consideraremos média igual a zero e


desvio padrão igual a 1.
Probabilidade de a variável z ser menor ou igual a -0,86, conforme a Figura 3.

P(Z≤ –0,86)

-0,86 0

Figura 3. Área abaixo da curva normal, no ponto -0,86.


Fonte: Montgomery e Runger (2012).
8 Distribuição paramétrica

Como queremos encontrar a probabilidade menor ou igual ao número


-0,86 e essa é justamente a probabilidade que a tabela nos fornece, então
podemos olhar diretamente na tabela e encontrar o valor da probabilidade,
como na Tabela 2.

Tabela 2. Fragmento da tabela normal, cauda da esquerda.


Distribuição paramétrica 9

Olhamos na linha correspondente ao -0,8 e vamos até a coluna 0,06 (que é


a nossa segunda casa decimal). Na junção de linha e coluna, obtemos o valor
0,1949, que corresponde à probabilidade que procurávamos, então:

P(Z ≤ –0,86) = 0,1949

Agora, a probabilidade de a variável z ser maior do que 1,26, como na


Figura 4.

P(Z ≥ 1,26)

=1-

0 1,26 0 1,26

Figura 4. Área abaixo da curva normal, no ponto 1,26.


Fonte: Montgomery e Runger (2012).

Para obtermos a probabilidade acima do ponto 1,26, precisamos utilizar


uma das propriedades das probabilidades, para isso, utilizaremos a propriedade
do complementar. Como já sabemos, a área abaixo da curva normal totaliza
1, logo, se conseguirmos olhar na tabela a probabilidade de ser menor do que
esse número (lembrem, a tabela só fornece os valores menores do que um ponto
na curva), poderemos fazer 1- a probabilidade encontrada para o ponto 1,26.
Então, olhamos o valor da probabilidade na tabela normal, conforme a Tabela 3.
10 Distribuição paramétrica

Tabela 3. Fragmento da tabela normal, cauda da direita.

Assim sendo, a probabilidade resulta em:

P(Z ≥ 1,26) = 1 – P(z ≤ 1,26) = 1 – 0,8962 = 0,1038

Agora, a probabilidade de a variável z estar entre -1,25 e 0,37, como na


Figura 5.

P(–1,25 ≤ Z ≤ 0,37)

= -

-1,25 0 0,37 0 0,37 -1,25 0

Figura 5. Área abaixo da curva normal, nos pontos -1,25 e 0,37.


Fonte: Montgomery e Runger (2012).
Distribuição paramétrica 11

Precisamos agora encontrar a probabilidade desse intervalo, teremos que


olhar dois valores na tabela, que são referentes ao 0,37 e ao -1,25. Para ve-
rificarmos a probabilidade resultante, precisamos pegar o valor do limite
superior do intervalo (valor correspondente ao ponto 0,37) e diminuir do valor
encontrado para o limite inferior do intervalo (valor correspondente a -1,25),
conforme as Tabelas 4 e 5.

Tabela 4. Fragmento da tabela normal, cauda da esquerda.


12 Distribuição paramétrica

Tabela 5. Fragmento da tabela normal, cauda da direita.

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08


0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,5026 0,5064 0,5103
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844

Assim sendo, a probabilidade resulta em:

P(–1,25 ≤ Z ≤ 0,37) = P(Z ≤ 0,37) – P(Z ≤ –1,25) = 0,6443 – 0,1056 = 0,5487

Verifique as formas de utilização das duas tabelas para a


distribuição normal assistindo ao vídeo a seguir.

https://goo.gl/XfjuSf
Distribuição paramétrica 13

Suponha que a idade média de parturientes em determinado hospital seja de 26 anos,


com um desvio padrão de 4 anos. Calcule as seguintes probabilidades:
a) Qual a probabilidade de encontrarmos parturientes com menos de 20 anos.
b) Qual a probabilidade de encontrarmos parturientes com mais de 30 anos.
c) Qual a probabilidade de encontrarmos parturientes entre 18 e 32 anos.
Para resolvermos essas probabilidades, precisaremos padronizar os valores antes
de olhar na tabela, uma vez que a média não é igual a zero e o desvio padrão não é
igual a um.
Padronização:
x-µ
z= σ

(
a) P(X < 20) = P Z <
20 - 26
4 )= P(Z < -1,50) = 0,0668

A probabilidade de encontrarmos uma parturiente com menos de 20 anos é de 6,68%.

( (
b) P(X > 30) - 1 - P(X ≤ 30) = 1 - P Z≤ 30 - 26 = 1 - P(Z ≤ 1,00) = 1 - 0,8413 = 0,1587
4
A probabilidade de encontrarmos uma parturiente com mais de 30 anos é de 15,87%.

) ) )
c) P (18 ≤ X ≤ 32) = P(X ≤ 32) - P(X ≤ 18) = P Z≤ 32 - 26 - P Z ≤ 18 - 26
4 4 )
= P (Z ≤ 1,50) - P (Z ≤ -2,00) = 0,9332 - 0,0228 = 0,9104
A probabilidade de encontrarmos uma parturiente que tenha idade entre 18 e 32
anos é de 91,04%.

MONTGOMERY, D. C.; RUNGER, G. C. Estatística aplicada e probabilidade para engenheiros.


5. ed. Rio de Janeiro: LTC, 2012.
SPIEGEL, M. R.; SCHILLER, J. J.; SRINIVASAN, R. A. Probabilidade e estatística. 3. ed. Porto
Alegre: Bookman, 2015. (Coleção Schaum).
VIEIRA, S. A distribuição gaussiana dos erros de medida. 07 maio 2016. Disponível em:
<http://soniavieira.blogspot.com.br/2016/05/a-distribuicao-gaussiana-dos-erros-de.
html>. Acesso em: 28 out. 2017.
14 Distribuição paramétrica

Os links para sites da web fornecidos neste capítulo foram todos testados, e seu fun-
cionamento foi comprovado no momento da publicação do material. No entanto, a
rede é extremamente dinâmica; suas páginas estão constantemente mudando de
local e conteúdo. Assim, os editores declaram não ter qualquer responsabilidade
sobre qualidade, precisão ou integralidade das informações referidas em tais links.

Você também pode gostar