Você está na página 1de 7

1

ESTATÍSTICA – BREVE REVISÃO

1 Funções estatísticas determinística. Ferramentas estatísticas são


necessárias para tal tarefa.
Existem funções cujo comportamento é
perfeitamente previsível. Estas funções são
denominadas determinísticas. A função f(x) = 2 Distribuição de probabilidade
2x – 4 é uma função determinística, uma vez A soma de dois dados honestos pode resultar
que seu valor está perfeitamente em qualquer número entre 2 e 12. Embora
caracterizado quando x é definido. Funções exista apenas uma única combinação de dados
determinísticas são muito empregadas em que resulte em 2 (1+1), nota-se que existem
modelos matemáticos idealizados. seis diferentes combinações de dados cuja
O mundo real não é apenas dominado por soma resulta em 7 (1+6, 2+5, 3+4, 4+3, 5+2,
funções determinísticas. Certas propriedades, 6+1). As chances de que a soma de dois dados
como por exemplo a resistência mecânica de lançados ao acaso resulte em 7 são maiores do
um material, a vida útil de uma lâmpada, a soma que resultem em 2. Em outras palavras, a
de dois dados honestos jogados ao acaso ou a probabilidade de 7 ser obtido é maior do que
temperatura máxima em Salvador no mês de 2.
janeiro, variam de amostra para amostra. Um A figura 1 melhor caracteriza o universo das
valor médio é sempre obtido. Porém, é possíveis combinações dos dados que levam a
impossível prever exatamente qual o valor a cada soma. No eixo horizontal estão
ser encontrado na própria amostra a ser representados os valores possíveis para a
testada. soma, enquanto que no eixo vertical
Funções que apresentam imprevisibilidade são representa-se o número de combinações que
denominadas de aleatórias. Como são resultam naquela soma, ou seja, a freqüência
imprevisíveis, não podem ser equacionadas com que aquele evento se manifesta. No total
através dos recursos usuais da matemática são 36 combinações possíveis.

Figura 1 – combinação de dois dados honestos


Para determinar a probabilidade de que uma obtido como soma é de 6/36 ou 1/6. As
determinada soma seja obtida, é suficiente chances de se obter 8 são de 5/36.
dividir o número de combinações que resultam
A probabilidade de que um valor situado
naquela soma pelo número de combinações
dentro de uma faixa de valores seja obtido
totais possíveis. A probabilidade de que 7 seja
2

pode ser calculado pela soma das expressa em termos relativos. Para tal, divide-
probabilidades individuais. Assim, as chances se a frequência de cada evento pelo número
de que a soma esteja dentro da faixa 7 ± 1 é total de eventos do universo possível. No caso
calculado por 5/36 + 6/36 + 5/36, Que são as divide-se cada frequência por 36. A figura 2
probabilidades de se obter 6, 7 e 8 mostra o gráfico resultante. Este gráfico das
respectivamente, o que resulta em 16/36 ou frequências relativas recebe o nome de função
4/9. Verifica-se que as chances de que densidade de probabilidade, representada por
qualquer valor entre 2 e 12 seja obtido é de 1 p(x), onde x representa cada evento envolvido
(100 %). e p(x) a probabilidade deste evento ocorrer.
No caso da soma de dois dados honestos, p(7)
O gráfico da figura 1 pode Ter a frequência
= 1/6, p(6 ≤ x ≤ 8) = 4/9, p(-∞ < x < +∞) = 1.

Figura 2 – Densidade de probabilidade


A soma de dois dados é uma variável discreta, O aspecto da função densidade de
isto é, pode assumir apenas alguns valores probabilidade de uma função aleatória
inteiros e bem definidos. Entretanto, contínua é uma curva contínua. A figura 3
freqüentemente, encontra-se na natureza ilustra p(x) para uma ensacadeira com
funções aleatórias contínuas, isto é, podem distribuição normal ou Gassiana. Nota-se
assumir qualquer valor real. Ao se analisar também que p(x) é uma função contínua. Neste
estatisticamente o comportamento de uma caso, não há sentido em determinar a
máquina ensacadeira que, idealmente, deveria probabilidade para um determinado valor real
empacotar 1 kg do produto por saco, verifica- venha a acontecer, mas apenas de que faixas
se, na prática, que isto não ocorre sempre. Por vão ocorrer. Por exemplo, para determinar as
imperfeições no seu mecanismo, sacos com chances de que sacos de (1,00 ± 0,02 ) kg
massas, por exemplo entre 0,98 kg e 1,02 kg sejam obtidos, determina-se a área abaixo da
podem resultar. Embora seja muito difícil curva p(x), representada por p(0,98 ≤ x ≤
calcular teoricamente a função densidade de 1,02), entre estes limites, isto é:
probabilidade desta ensacadeira, é x =1, 02
perfeitamente possível determiná-la
aproximadamente através de um grande
p (0,98 ≤ x ≤ 1,02) = ∫ p( x)dx
x = 0 , 98
número de observações experimentais.
3

Deve notar uma importante propriedade de maior probabilidade de resultar sacos com
p(x): p(-∞ < x < +∞) = 1, isto é, a integral de valores mais próximos do ideal que a primeira,
p(x) entre os limites -∞ e +∞, que corresponde portanto é uma máquina melhor. Já a máquina
à probabilidade de x estar dentro desses que possui pc(x) é a pior de todas por
limites, sempre resulta em 1. apresentar probabilidade relativamente altas
de que valores que se afastam bastante do
A figura 4 apresenta a função densidade de
ideal venham a ocorrer. A característica que
probabilidade de outra ensacadeira com
diferencia estas três ensacadeiras é a
características diferentes. Nota-se que,
chamada dispersão, que é maior quanto maior
embora a área total sob pb(x) seja também
for o “espalhamento” da curva p(x), isto é, a
unitária, esta é uma curva mais fechada que
dispersão pc(x) é maior que a dispersão de
pa(x). A máquina que possui pb(x) apresenta
pb(x).

Figura 3 – Densidade de probabilidade para uma função contínua

O desvio padrão (σ) é um parâmetro uma função aleatória é o seu valor central, isto
estatístico empregado para medir a dispersão é, seu valor médio (µ). µ é calculado por:
de uma função aleatória. É tanto maior quanto
1 ∞
maior for a dispersão. No caso da figura 4 é µ = lim
n→∞ n
∑ xi
evidente que σa < σb < σc i =1

σ é calculado por:
3 Distribuição normal

∑ (x − µ)
i
2 Uma das distribuições estatísticas mais
comuns é a distribuição normal ou gaussiana. O
σ = lim i =1
n→∞ n teorema do limite central demonstra que a
combinação de um grande número de fatores
xi é o valor do evento “i”,
de natureza aleatória, com qualquer
µ é o valor médio de todos os eventos.
distribuição, aproxima-se da distribuição
Outro parâmetro importante que caracteriza normal à medida que aumenta o número de
4

fatores envolvidos. A forma da função 1 −2z


2

densidade de probabilidade p(x) da p( x) = e


distribuição normal assemelha-se a forma de 2π
um sino, como mostrada na figura 3. Apresenta x−µ
simetria em torno do valor central (médio). O onde: z =
σ
desvio padrão desta distribuição corresponde
à distância entre o valor central e o ponto de A distribuição das dimensões de um lote de
inflexão de p(x), isto é, ponto onde a segunda peças fabricadas por uma máquina, a
derivada de p(x) é zero. Sua função densidade distribuição em um alvo de tiros dados por um
de probabilidade é: atirador, os erros de medição, a temperatura
média do dia 26 de março de cada ano são
exemplos de distribuições normais.

Figura 4 – Ensacadeiras diferentes - dispersão


O calculo de que uma dada função aleatória P(µ - 3σ < x < µ + 3σ) = 0,9973
com distribuição normal esteja dentro de uma P(µ - 1,96σ < x < µ + 1,96σ) = 0,95
faixa de valores é também calculada através P(µ - 2,58σ < x < µ + 2,58σ) = 0,99
da integração da curva p(x) entre os limites P(µ - 3,30σ < x < µ + 3,30σ) = 0,999
estabelecidos. No caso da distribuição normal
não se pode exprimir a integral de p(x) como 4 A natureza aleatória do erro de
uma função simples. É comum encontrar esta medição
integral na forma de tabelas normalizadas.
Entretanto, existem alguns valores Sabe-se que é impossível efetuar uma medição
particulares que, por serem muito empregados absolutamente isenta de erros. Seja em
na prática, devem ser citados. função do sistema de medição ou em função do
mensurando ou do operador, o erro de medição
Se tratando de uma função aleatória com está sempre presente. Ao se repetir a medição
distribuição normal, valor médio µ e desvio de um mensurando invariável, com o mesmo
padrão σ, é possível calcular as seguintes sistema de medição e nas mesmas condições,
probabilidades: como por exemplo a medição repetitiva da
P(µ - σ < x < µ + σ) = 0,6826 massa de um peça com a mesma balança,
5

verifica-se, com freqüência, que o valor obtido 5 Amostra versus população


não se repete.
Os conceitos de média (µ) e desvio padrão (σ)
O erro de medição presente em cada indicação são válidos para uma função aleatória. Para
pode ser determinado pela diferença entre a caracterizá-los perfeitamente pelas equações
indicação e o valor verdadeiro convencionado, anteriormente apresentadas, é necessário
isto é, E = I – VVC. Em um sistema de medição envolver um número infinito de valores
ideal, este erro deveria ser sempre nulo. observados desta função, isto é, toda a
Porém nota-se que este erro é na verdade uma população.
função aleatória com distribuição
Na prática, não se tem tempo para coletar um
aproximadamente normal.
número infinito de valores. É comum
O valor médio do erro de medição é o erro considerar apenas uma amostra de n valores
sistemático (Es), que só poderia ser desta população. A média e o desvio padrão da
determinado baseado em um número infinito população são estimados a partir da média, do
de observações por: desvio padrão e do tamanho da amostra. A
média e o desvio padrão da amostra são
Es = MI – VVC,
calculados por:
Onde:
1 n
1 n
MI = ∑ I i x= ∑ xi
n i =1
n i =1
MI é a média de infinitas indicações, n
VVC é o valor verdadeiro convencionado. ∑ ( x − x) i
2

Se um número finito de observações é s= i =1

n −1
envolvido, a equação acima pode ser ainda
usada para estimar o erro sistemático. Neste Esta estimativa só é confiável para valores
caso, esta estimativa recebe o nome específico grandes de n. Se amostras pequenas são
de tendência (Td). envolvidas (n < 200), é necessário aplicar um
coeficiente de correção (t), conhecido como
A parcela aleatória do erro de medição é
coeficiente t – Student. O coeficiente t –
simplesmente chamada de erro aleatório.
Student é função da probabilidade de
Tratando-se de uma função aleatória, cada
enquadramento desejada (p) e do tamanho da
valor medido possui um erro aleatório
amostra (n). Existem tabelas, como a da figura
diferente, e dado por Eai = Ii – MI. A sua
5, que apresentam valores tabelados para “t”
caracterização é realizada através da medida
como função de n e de p. Assim, a
da dispersão da distribuição normal associada,
repetitividade associada ao erro aleatório
isto é, do desvio padrão (σ).
pode ser estimada por:
Define-se a repetitividade (Re), como sendo a
Re = ± t . s
faixa que, com uma probabilidade estatística
definida, conterá o erro aleatório. É comum A média verdadeira da população (µ), calculada
adotar a probabilidade de 95 % como aceitável a partir dos parâmetros da amostra, não pode
para a Re. Assim, 95 % dos erros aleatórios ser determinada exatamente. Alguma
estarão dentro desta faixa. A Re é estimada incerteza ainda resultará. Pode-se mostrar que
por: a média da população estará situada dentro da
seguinte faixa:
Re(95 %) = ± 1,96 σ
t Re
Porém, como será visto a seguir, a estimativa x± s = x±
de σ não é tão direta. n n
onde:

x é a média da amostra,
6

s é o desvio padrão da amostra, n é o tamanho da amostra.


t é o coeficiente t – Student,

k(v)
Probabilidade p(%)
Graus de
liberdade 68,3 90 95 99
1 1,84 6,31 12,71 63,66
2 1,32 2,92 4,30 9,92
3 1,20 2,35 3,18 5,84
4 1,14 2,13 2,78 4,60
5 1,11 2,02 2,57 4,03
6 1,09 1,94 2,45 3,71
7 1,08 1,89 2,36 3,50
8 1,07 1,86 2,31 3,36
9 1,06 1,83 2,26 3,25
10 1,05 1,81 2,23 3,17
15 1,03 1,75 2,13 2,95
20 1,03 1,72 2,09 2,85
40 1,01 1,68 2,02 2,69
50 1,01 1,68 2,01 2,68
100 1,005 1,660 1,984 2,626
infinito 1,000 1,645 1,960 2,576

Figura 5 – Tabela de fatores t - Student

6 Outras distribuições estatísticas a


σ=
Existem situações na prática onde é 3
conveniente modelar certos efeitos ou
b) Distribuição triangular
fenômenos por meio de outras distribuições
distintas da normal. Neste texto, não será É caracterizada por apresentar máxima
discutida a aplicabilidade das diversas probabilidade para o valor central e decrescer
distribuições em problemas de metrologia. linearmente até zero nos limites dados por µ -
a e µ + a, e zero fora destes (figura 7). Seu
a) Distribuição retangular
desvio padrão é dado por:
É caracterizada por apresentar a mesma
a
densidade de probabilidade para todos os σ=
valores dentro dos limites dados por µ - a e µ + 6
a, e zero fora destes (figura 6). Seu desvio
padrão é dado por:
7

Figura 6 – Distribuição retangular

Figura 7 – Distribuição triangular

_____