Você está na página 1de 11

ANEXO III CONCEITOS BSICOS DE ESTATSTICA

Existem funes cujo comportamento perfeitamente previsvel. Estas funes so denominadas determinsticas . A funo f(x) = 2x - 4 uma funo determinstica uma vez que seu valor est perfeitamente caracterizado quando x definido. Funes determinsticas so muito empregadas em modelos matemticos idealizados. O mundo real no composto apenas por funes determinsticas. Certas propriedades, como por exemplo a resistncia mecnica de um material, a vida de uma lmpada, a soma de dois dados honestos jogados ao acaso ou a temperatura mxima em Curitiba no ms de janeiro, variam de amostra para amostra. Um valor mdio obtido, porm impossvel prever exatamente qual o valor a ser encontrado na prpria amostra a ser testada. Funes que apresentam imprevisibilidade so denominadas de aleatrias. Como so imprevisveis, no podem ser equacionadas atravs dos recursos usuais da matemtica determinstica. Ferramentas estatsticas so necessrias para tal.

III.1

Distribuio de Probabilidade

A soma de dois dados honestos pode resultar em qualquer nmero entre 2 e 12. Embora exista apenas uma nica combinao de dados que resulte em 2 (1+1), nota-se que existem seis diferentes combinaes de dados cuja soma resulta em 7 (1+6, 2+5, 3+4, 4+3, 5+2, 6+1). As chances de que a soma de dois dados lanados ao acaso resulte em 7 so maiores do que resultem em 2. Em outras palavras, a probabilidade de 7 ser obtido maior do que 2. A figura III.1 melhor caracteriza o universo das possveis combinaes dos dados que levam a cada soma. No eixo horizontal esto representados os valores possveis para a soma, enquanto que no eixo vertical representa-se o nmero de combinaes que resultam naquela soma, ou seja, a freqncia com que aquele evento se manifesta. No total so 36 combinaes possveis. Para determinar a probabilidade de que uma determinada soma seja obtida, suficiente dividir o nmero de combinaes que resultam naquela soma pelo nmero de combinaes totais possveis. A probabilidade de que 7 seja obtido como soma de 6/36 ou 1/6. As chances de obter 8 so de 5/36. A probabilidade de que um valor situado dentro de uma faixa de valores seja obtido pode ser calculado pela soma das probabilidades individuais. Assim, as chances de que a soma esteja dentro da faixa 7 1 calculado por 5/36 + 6/36 + 5/36, que so as probabilidades de se obter 6, 7 e 8 respectivamente, o que resulta em 16/36 ou 4/9. Verifica-se que as chances de que qualquer valor entre 2 e 12 seja obtido so de 1 (100%). O grfico da figura III.1 pode ter a freqncia expressa em termos relativos. Para tal, divide-se a freqncia de cada evento pelo nmero total de eventos do universo possvel. No caso, divide-se cada freqncia por 36. A figura III.2 mostra o grfico resultante. Este grfico das freqncias relativas recebe o nome de funo densidade de probabilidade, representada por p(x), onde x

O representa cada evento envolvido e p(x) a probabilidade deste evento ocorrer. de dois dados honestos, p(7) = 1/6, p(6 x 8) = 4/9, p(- <x<+) = 1.

No caso da soma

A soma de dois dados uma varivel discreta, isto , pode assumir apenas alguns valores inteiros e bem definidos. Porm, freqentemente, encontra-se na natureza funes aleatrias contnuas, isto , podem assumir qualquer valor real. Ao se analisar estatisticamente o comportamento de uma mquina ensacadeira que, idealmente, deveria empacotar 1,00 kg do produto por saco, verifica-se, na prtica, que isto no ocorre sempre. Por imperfeies no seu mecanismo, sacos com massas, por exemplo entre 0,98 kg e 1,02 kg podem resultar. Embora seja muito difcil calcular teoricamente a funo densidade de probabilidade desta ensacadeira, possvel determina-la aproximadamente atravs de um grande nmero de observaes experimentais. O aspecto da funo densidade de probabilidade de uma funo aleatria contnua uma curva contnua. A figura III.3.a ilustra p(x) para uma ensacadeira com distribuio de probabilidade normal ou gaussiana. Nota-se que p(x) tambm uma funo contnua. Neste caso, no h sentido em se determinar a probabilidade de que um determinado valor real venha a ocorrer, mas apenas de que faixas venham a ocorrer. Por exemplo, para determinar as chances de que sacos 1,00 0,02 kg sejam obtidos determina-se a rea abaixo da curva p(x), representada por P(0,98 x 1,02)1, entre estes limites, isto :

P(0,98 x 1,02) =

x =1, 02

x =0 , 98

p( x) dx

(III.1)

Deve-se notar uma importante propriedade de p(x): P(- < x < + ) = 1, isto , a integral de p(x) entre os limites - e + , que corresponde probabilidade de x estar dentro destes limites, sempre resulta em 1. A figura III.b apresenta a funo densidade de probabilidade de outra ensacadeira com caractersticas diferentes. Nota-se que, embora a rea total sob pb(x) seja tambm unitria, esta uma curva mais fechada que pa(x). A mquina que possui pb(x) apresenta maior probabilidade de resultar sacos com valores mais prximos do ideal que a primeira, portanto uma mquina melhor. J a mquina que possui pc (x) a pior de todas por apresentar probabilidade relativamente altas de que valores que se afastam bastante do ideal venham a ocorrer. A caracterstica que diferencia estas trs ensacadeiras a chamada disperso que maior quanto maior for o "espalhamento" da curva p(x), isto , a disperso de pc (x) maior que a disperso de p b(x). O desvio padro () um parmetro estatstico empregado para medir a disperso de uma funo aleatria. tanto maior quanto maior for a disperso. No caso da figura III.3 evidente que c > a > b. calculado por:

= lim

(x )
i i= 1

(III.2)

onde: xi o valor do evento "i" o valor mdio de todos os eventos


Aqui o smbolo p(x) empregado para a funo densidade de probabilidade enquanto P(y) representa a probabilidade do evento y ocorrer.
1

Outro parmetro importante que caracteriza uma funo aleatria o seu valor central, isto , seu valor mdio (). calculado por:

= lim

1 xi n n i =1

(III.3)

III.2 Distribuio Normal


Uma das distribuies estatsticas mais comumente encontradas na prtica a distribuio normal ou gaussiana. O teorema do limite central demonstra que a combinao de um grande nmero de fatores de natureza aleatria, com qualquer distribuio, aproxima-se da distribuio normal medida que aumenta o nmero dos fatores envolvidos. A forma da funo densidade de probabilidade p(x) da distribuio normal assemelha-se a de um sino, como mostrada na figura III.4. Apresenta simetria em torno do valor central (mdio). O desvio padro desta distribuio corresponde distncia entre o valor central e o ponto de inflexo de p(x), isto , o ponto onde a segunda derivada de p(x) zero. Sua funo densidade de probabilidade :

p( x) = onde: x z=
e

1 z2 /2 e 2
(III.4)

o valor mdio o desvio padro

A distribuio das dimenses de um lote de peas fabricadas por uma mquina, a distribuio em um alvo de tiros dados por um atirador, os erros de medio e a temperatura mdia do dia 21 de abril de cada ano so exemplos de distribuies normais. O clculo da probabilidade de que uma dada funo aleatria com distribuio normal esteja dentro de uma faixa de valores tambm calculada pela equao (III.1), isto , pela integral definida de p(x) entre os limites considerados. No caso da distribuio normal no se pode exprimir a integral de p(x) como uma funo simples. comum encontrar esta integral na forma de tabelas normalizadas. Entretanto, existem alguns valores particulares que, por serem muito empregados na prtica, devem ser citados. Se tratando de uma funo aleatria com distribuio normal, valor mdio e desvio padro , possvel calcular as seguintes probabilidades: P(- < x < + ) = 0.6826 P(-3 < x < +3) = 0.9973 P(-1.96 < x < +1.96 ) = 0.95 P(-2.58 < x < +2.58 ) = 0.99 P(-3.30 < x < +3.30 ) = 0.999

III.3 A Natureza Aleatria do Erro de Medio


Sabe-se que impossvel efetuar uma medio absolutamente isenta de erros. Seja em funo do sistema de medio ou em funo do mensurando ou do operador, o erro de medio est

sempre presente. Ao se repetir a medio de um mensurando invarivel, com o mesmo sistema de medio e nas mesmas condies, como por exemplo a medio repetitiva da massa de uma pea com a mesma balana, verifica-se, com freqncia, que o valor obtido no se repete. O erro de medio presente em cada indicao pode ser determinado pela diferena entre a indicao e o valor verdadeiro convencional, isto , E = I - VVC. Em um SM ideal, este erro deveria ser sempre nulo. Porm, nota-se que este erro na verdade uma funo aleatria com distribuio aproximadamente normal. O valor mdio do erro de medio o erro sistemtico (Es), que s poderia ser determinado baseada em um nmero infinito de observaes, por:
Es = MI VVC onde: MI = 1 n

(III.5)

I
i =1

e MI a mdia de infinitas indicaes VVC o valor verdadeiro convencional Se um nmero finito de observaes envolvido, a equao (III.5) pode ainda ser usada para estimar o erro sistemtico. Neste caso, esta estimativa recebe o nome especfico de tendncia (Td) . A parcela aleatria do erro de medio simplesmente chamada de erro aleatrio. Tratando-se de uma funo aleatria, cada valor medido possui um erro aleatrio diferente, e dado por: Ea i = Ii - MI. A sua caracterizao realizada atravs da medida da disperso da distribuio normal associada, isto , do desvio padro (). Define-se a repetitividade (Re), como sendo a faixa que, com uma probabilidade estatstica definida, 2 conter o erro aleatrio. comum adotar a probabilidade de 95% como aceitvel para a Re ( ). Assim, 95% dos erros aleatrios estaro dentro desta faixa. A Re estimada por:

Re(95%) = 1,96
Porm, como ser visto no prximo item, a estimao de no to direta.

(III.6)

III.4 Amostra Versus Populao


Os conceitos de mdia () e desvio padro () so vlidos para uma funo aleatria. Para caracteriz-los perfeitamente pelas equaes III.2 e III.3 necessrio envolver um nmero infinito de valores observados desta funo, isto , toda a populao. Na prtica, no se tem tempo para coletar um nmero infinito de valores. comum considerar apenas uma amostra de n valores desta populao. A mdia e o desvio padro da populao so estimados a partir da mdia, do desvio padro e do tamanho da amostra. A mdia e o desvio padro da amostra so calculados por:
2

Alguns autores adotam 99,7%, o que corresponde a 3

x=
e

1 n xi n i =1

(III.7)

s=

(x
i =1

x) 2
(III.8)

n 1

Esta estimativa s confivel para valores grandes de n. Se amostras pequenas so envolvidas (n <200), necessrio aplicar um coeficiente de correo (t) conhecido como coeficiente t -Student. O coeficiente t-Student funo da probabilidade de enquadramento desejada (P) e do tamanho da amostra (n). A figura III.5 apresenta valores tabelados para t como funo de n e de P. Assim, a repetitividade associada ao erro aleatrio pode ser estimada por: Re = t. s (III.9)

A mdia verdadeira da populao ( ), calculada a partir dos parmetros da amostra, no pode ser determinada exatamente. Alguma incerteza ainda resultar. Pode-se mostrar que a mdia da populao estar situada dentro da seguinte faixa, determinada de intervalo de confiana da mdia: t Re x s= x (III.9) n n onde:
_

x a mdia da amostra
s o desvio padro da amostra t o coeficiente t-Student n o tamanho da amostra

III.5 Outras Distribuies Estatsticas


Existem situaes na prtica onde conveniente modelar certos efeitos ou fenmenos por meio de outras distribuies distintas da normal. Neste texto, no ser discutida a aplicabilidade das diversas distribuies em problemas de metrologia. a) Distribuio retangular caracterizada por apresentar a mesma densidade de probabilidade para todos os valores dentro dos limites dados por - a e + a, e zero fora destes (figura III.6). Seu desvio padro dado por:
= a 3

b) Distribuio triangular caracterizada por apresentar mxima probabilidade para o valor mdio e decrescer linearmente at zero nos limites dados por - a e + a, e zero fora destes (figura III.7). Seu desvio padro dado a por: = 6

Exerccios para o Anexo III


III.1. Classifique as variveis abaixo como determinsticas ou aleatrias: A) A distncia indicada no odmetro de automveis que percorrem o trecho Florianpolis-Curitiba pela mesma estrada B) O horrio do pr-do-sol de uma mesma cidade ao longo do ano C) A massa de uma pitada de sal que uma cozinheira acrescenta todo dia no feijo D) A vida de uma lmpada de 60W de um mesmo lote de fabricao E) O seno do tero do quadrado de um nmero III.2. Qual a probabilidade da soma de trs dados honestos estar entre 5 e 7 inclusive? III.3. Classifique as seguintes variveis aleatrias como discretas ou connuas: A) A massa de uma pitada de sal B) A medida da massa de uma pitadas de sal obtida de uma balana com resoluo de 0,1g C) A vida de lmpadas de um mesmo lote de fabricao D) O tempo expresso em horas correspondente vida de uma pessoa do sexo masculino residente em uma dada cidade E) As vrias medidas efetuadas da massa de uma mesma pea, efetuadas pela mesma balana III.4. Senso p(x) a funo densidade de probabilidade de uma varivel aleatria contnua, determine expresses para o clculo da probabilidade desta varivel: A) Ser maior que o valor xz B) Ser menor que o valor xb C) Sendo xa>x b, estar entre estes dois valores D) Sendo xa>x b, ser maior que xa ou menor que x III.5. Qual a probabilidade de uma varivel aleatria com distribuio normal com mdia 18,00g e desvio padro 0,12g situar-se dentro da faixa 18,00 0,36g? e na faixa 18,24 0,12g? III.6. Calcule a mdia amostral, o desvio padro amostral e o intervalo de confiana do erro aleatrio dos dados abaixo. Calcule tambm o intervalo de confiana dentro do qual estar a mdia verrdadeira populao completa (equao III.9) 12,8 12,5 13,0 13,1 12,6 12,3 12,9 12,8 13,1 12,6 12,8 12,7

III.7. Supondo que os dados da questo anterior referem-se calibrao de juma balana onde a mesma massa padro de 12,500 0,002g foi medida diversas vezes, o que possvel afirmar sobre o erro sistemtico e sua incerteza?

Você também pode gostar