Você está na página 1de 92

ESCOLA SUPERIOR DE TECNOLOGIA DA

UNIVERSIDADE DO ALGARVE
rea Departamental de Engenharia Alimentar












Apontamentos de Estatstica

Texto de apoio para a disciplina de Mtodos
Estatsticos do Curso de Engenharia Alimentar.











Eduardo Esteves
rea Departamental de Engenharia Alimentar
Escola Superior de Tecnologia













Verso 2.7 E. Esteves, Faro, Fevereiro de 2007
Mtodos Estatsticos Engenharia Alimentar 2
Eduardo Esteves, 2007
NDICE

PREFCIO.......................................................................................................... 4
1. INTRODUO............................................................................................... 4
2. CONCEITOS BSICOS ................................................................................ 4
3. POPULAO.................................................................................................. 5
4. AMOSTRA ...................................................................................................... 7
Distribuio de frequncias .................................................................................................... 8
Clculo do nmero de classes............................................................................................. 8
Clculo dos limites implcitos ............................................................................................ 9
Frequncia absoluta, relativa e relativa acumulada.......................................................... 10
Representao grfica de distribuies de frequncias ........................................................ 10
Medidas de tendncia central e de disperso........................................................................ 12
Medidas de tendncia central ........................................................................................... 12
Medidas de disperso ....................................................................................................... 16
5. CONCEITOS BSICOS DA TEORIA DA PROBABILIDADES........... 19
Provas aleatrias, Acontecimentos possveis, Espao amostral e Evento............................ 20
Conceito de Probabilidade.................................................................................................... 21
Definio clssica de probabilidade ................................................................................. 21
Definio de probabilidade como frequncia relativa...................................................... 22
Definio de probabilidade relacionada com a Teoria dos conjuntos .............................. 22
Postulados das probabilidades.............................................................................................. 22
Teoremas das probabilidades ............................................................................................... 23
Teorema da adio............................................................................................................ 23
Teorema da multiplicao ................................................................................................ 24
Teorema da complementaridade....................................................................................... 24
6. DISTRIBUIO DE PROBABILIDADES ............................................... 24
Varivel aleatria.............................................................................................................. 24
Distribuies de probabilidades de variveis discretas ........................................................ 26
Propriedades da funo densidade.................................................................................... 26
Propriedades da funo distribuio................................................................................. 27
Caratersticas da distribuio de probabilidades .............................................................. 27
Distribuio Binomial .......................................................................................................... 28
Distribuio de Poisson ........................................................................................................ 31
Distribuies de probabilidades de variveis contnuas....................................................... 32
Distribuio normal .............................................................................................................. 36
Distribuio normal reduzida ............................................................................................... 38
Distribuio t de Student ...................................................................................................... 39
7. INFERNCIA ESTATSTICA ................................................................... 41
Amostragem aleatria........................................................................................................... 41
Populaes finitas............................................................................................................. 41
Populaes infinitas.......................................................................................................... 42
Distribuio da mdia na amostragem ................................................................................. 42
Teoria sobre a distribuio de probabilidades da mdia na amostragem............................. 43
Teorema do limite central................................................................................................. 44
Estimao da mdia da populao........................................................................................ 44
Estimao pontual ............................................................................................................ 44
Estimao por intervalos de confiana ............................................................................. 45
Teste (ou Prova) de hipteses............................................................................................... 47
Mtodos Estatsticos Engenharia Alimentar 3
Eduardo Esteves, 2007
Definio de concluses alternativas................................................................................ 47
Definio de regras de deciso sobre que hiptese deve ser aceite.................................. 47
Erros de inferncia................................................................................................................ 48
Erros de tipo I e de tipo II................................................................................................. 48
Testes de hipteses bilaterais para a mdia .......................................................................... 50
Casos em que a varincia da populao
2
conhecida................................................... 50
Casos em que a varincia da populao
2
no conhecida............................................ 50
Testes de hipteses unilaterais para a mdia ........................................................................ 51
Testes de hipteses atravs de estatsticas de teste ........................................................... 53
8. REGRESSO LINEAR SIMPLES............................................................. 54
Relao entre variveis......................................................................................................... 54
Relao funcional entre duas variveis ................................................................................ 54
Relao estatstica entre duas variveis................................................................................ 55
Modelos de regresso simples .............................................................................................. 56
Mtodo dos mnimos quadrados........................................................................................... 56
Recta dos mnimos quadrados........................................................................................... 58
Transformao das variveis na regresso ........................................................................... 61
Coeficiente de correlao linear ........................................................................................... 61
Covariao........................................................................................................................ 62
Covarincia....................................................................................................................... 63
Interpretao da covarincia............................................................................................. 63
Coeficiente de correlao linear ....................................................................................... 63
Interpretao do coeficiente de correlao ....................................................................... 64
Coeficiente de correlao linear amostral r...................................................................... 64
Prova de hipteses sobre o coeficiente de correlao linear populacional {X,Y}.......... 65
Coeficiente de determinao ................................................................................................ 66
9. BIBLIOGRAFIA........................................................................................... 68
EXERCCIOS.................................................................................................... 70
I Amostra ........................................................................................................................... 70
II Probabilidades (variveis discretas)............................................................................... 73
III Probabilidades (distribuies tericas de variveis discretas)...................................... 74
IV Probabilidades (variveis contnuas)............................................................................ 76
V Amostragem aleatria, Estimao de parmetros e Testes de hipteses ....................... 77
VI Regresso linear simples e correlao.......................................................................... 80
VII Solues dos exerccios .............................................................................................. 83
TABELAS .......................................................................................................... 88

Mtodos Estatsticos Engenharia Alimentar 4
Eduardo Esteves, 2007
PREFCIO
Neste texto que, em boa parte, deriva dos textos de apoio e apontamentos preparados pela
Professora Lilia Brinca ao longo de anos de docncia, vamos abordar alguns dos tpicos
introdutrios mais relevantes em Estatstica. Assim, com o objectivo de conhecer a populao
em estudo (Seco 3), falaremos, primeiro, acerca de amostras e da sua representao sumria
e dos parmetros que mais se utilizam para as descrever (Seco 4). Providenciaremos alguns
conceitos bsicos de probabilidades (Seco 5), assim como conhecimentos de algumas
distribuies de probabilidades tericas importantes (seco 6) que permitem obter
criteriosamente as amostras (amostragem aleatria, Seco 7) e testar e eventualmente validar,
hipteses acerca dos resultados obtidos (inferncia estatstica, Seco 7). No final do texto,
sero abordados conceitos e tcnicas relacionadas com a regresso linear simples e correlao
(Seco 8), uma vez que permitem estudar relaes estatsticas entre (duas) variveis. Ao
longo do texto incluem-se exemplos dos assuntos em estudo (identificados por um trao
vertical junto margem esquerda do texto) para auxiliar a compreenso das matrias.
Complementarmente, providenciam-se exerccios, e respectivas solues.
1. INTRODUO
A palavra Estatstica deriva do latim Estate, ou Estado, e foi usada pela primeira vez em
meados do sculo XVIII por um professor alemo, Gottfried Achenwall. A sua utilizao
estava inicialmente relacionada com a oteno de informao vital, como por exemplo
dados demogrficos, vitais para a governao, para o recrutamento militar ou para a
cobrana de impostos. Muitas vezes usada como sinnimo de dados: ouvimos falar em
nmero de candidatos ao ensino superior, percentagem do PIB aplicado na Educao, etc.
No entanto, a ESTATSTICA mais do que isso. Refere-se anlise e interpretao de dados
com vista avaliao objectiva da validade das concluses que se obtiveram. Por MTODOS
ESTATSTICOS entendem-se os mtodos cientficos para colher, organizar, resumir, apresentar
e analisar dados de modo a obter concluses vlidas.
O OBJECTIVO GERAL desta disciplina providenciar, aos alunos do curso de engenharia
alimentar, conhecimentos bsicos de estatstica, tericos e prticos, que lhes permitam
analisar estatisticamente problemas relacionados com o desempenho da actividade.
2. CONCEITOS BSICOS
Antes de mais, devem apresentar-se alguns conceitos importantes e que sero necessrios ao
longo deste texto.
O primeiro dos conceitos de que falaremos o de populao. Simplisticamente, o que se
pretende com a anlise estatstica elaborar concluses sobre um grupo de medies ou
observaes da varivel em estudo. Ora, o conjunto de medies ou observaes realizadas
sobre diferentes elementos de conjuntos bem definidos e rigorosamente condicionados
designa-se por POPULAO.

Mtodos Estatsticos Engenharia Alimentar 5
Eduardo Esteves, 2007
Por exemplo, se quisermos estudar a altura dos alunos da Escola Superior
de Tecnologia (EST): todos os alunos da EST constituem a populao
em estudo. Se pretendermos estudar determinada caracterstica de uma
conserva de sardinha da marca XYZ: ento a populao que estamos a
estudar constituida por todas as latas de conserva de sardinha
produzidas por essa marca.

Se estivermos a estudar uma populao relativamente pequena, digamos as mulheres que j
atravessaram o Canal da Mancha a nado ou o nmero de homens que pisou a Lua, poderemos
examinar toda a populao porque praticvel em tempo til obter a informao que
pretenderamos daquelas mulheres ou desses homens. Assim, quando podemos examinar toda
a populao (neste caso, as ditas senhoras ou os senhores) estamos a realizar um CENSO.
Todavia, em casos particulares, efectua-se o censo de populaes maiores do que aquelas.
Regularmente, de 10 em 10 anos, realiza-se o censo da populao portuguesa com o objectivo
de obter a tal informao vital para a governao designadamente o nmero de habitantes,
as idades, as profisses, se possuem electricidade, gua e telefone, etc.
No entanto, se estamos a estudar uma populao maior, digamos as sardinhas da costa
portuguesa ou a qualidade das sardinhas enlatadas por determinado fabricante, no ser
possvel pesar, medir ou analisar bioquimicamente todos os peixes ou todas as latas. Ento,
poderemos examinar uma parte dessa populao, ou seja, obter uma AMOSTRA. O nmero de
elementos/observaes, isto , o tamanho da mostra designa-se n. Este ser o modo mais
vivel de estudar, do ponto estatstico (e no s!), muitos problemas prticos.
Podem obter-se amostras de uma populao de acordo com vrios critrios. Contudo, para se
elaborarem concluses vlidas, a maoria dos mtodos estatsticos assumem que as amostras
foram obtidas de modo aleatrio, ou seja, cada elemento da populao tem probabilidade
igual de ser (es)colhido. Por outro lado, a escolha de determinado elemento no influencia a
escolha de outro(s). Obtm-se, assim, AMOSTRAS ALEATRIAS.
O conjunto dessa(s) amostra(s) possveis de obter de determinada populao com base em
determinado critrio designado por AMOSTRAGEM. Muitas vezes, no entanto, tambm se
utiliza o termo amostragem para designar o processo de obteno das amostras. Falaremos
neste curso de AMOSTRAGEM ALEATRIA SIMPLES como um exemplo dos vrios critrios de
seleco de amostras.
Depois da colheita de informao, da organizao e resumo desses dados de forma a
apresent-los correctamente, geralmente inteno generalizar os resultados para toda a
populao. A capacidade de elaborar concluses para toda a populao a partir de
caractersticas de amostras corresponde INFERNCIA ESTATSTICA (Fig. 1).
3. POPULAO
O objectivo final dos mtodos estatsticos concluir, com validade, sobre determinado(s)
aspecto(s) da populao, isto , caracterizar todos os elementos do universo em estudo em
termos desse(s) aspecto(s).
J vimos que, o conjunto de medies ou observaes realizadas sobre diferentes elementos
de conjuntos bem definidos e rigorosamente condicionados se denomina populao. A
dimenso da populao designa-se por N.
Mtodos Estatsticos Engenharia Alimentar 6
Eduardo Esteves, 2007
Existem vrios tipos de populaes e podem classificar-se as populaes de acordo com
vrios critrios. Por vezes, as populaes em estudo no existem na realidade, fisicamente. Se,
por exemplo, estivermos a estudar, em laboratrio, o efeito de determinado complemento
alimentar sobre a taxa de crescimento de 40 cobaias; a populao de que estamos a falar no
so as cobaias mas as taxas de crescimento (de todas as cobaias que, eventualmente, poderiam
receber esse complemento alimentar em condies similares). Neste caso, alguns autores
referem-se a populaes imaginrias, hipotticas ou potenciais.

Inferncia Seleco
Populao
Amostragem
Amostra #1, Amostra #2,
Amostra #3, , Amostra #k

Fig. 1 Esquema da relao entre os vrios conceitos bsicos em estatstica.

No entanto, existem classificaes mais consensuais e mais vulgarizadas de tipos de
populaes. Assim, podemos falar em POPULAES FINITAS e INFINITAS. As primeiras so
constituidas por um nmero finito de elementos. Neste caso, quando se obtm uma amostra, a
FRACO DE AMOSTRAGEM f definida por:
N
n
f =
em que n o nmero de elementos da amostra ou tamanho da amostra e N o nmero total de
elementos da populao. Pelo contrrio, as segundas so constituidas por um nmero infinito
de elementos. Assim sendo, a fraco de amostragem praticamente igual a zero, uma vez
que N tende para .
As populaes podem ser definidas por determinados PARMETROS que resumem certas
caractersticas (que veremos a seguir). A esses parmetros da populao so usualmente
atribuidas letras gregas (, , etc.) ou letras maisculas (N, X, etc.), para os distinguir dos
parmetros correspondentes nas amostras (designados por letras minsculas: n, x , s, etc).
Contudo, so raras as possibilidades de os calcular directamente, em virtude da dimenso das
populaes, pelo que na maoria das vezes temos de recorrer s caractersticas das amostras
(que alguns autores designam por ESTATSTICAS) para estudar estatisticamente essas
populaes. Na prxima seco, dedicada aos modos apresentao de amostras, sero
includas referncias aos parmetros da populao sempre que necessrio.
Mtodos Estatsticos Engenharia Alimentar 7
Eduardo Esteves, 2007
4. AMOSTRA
Na maioria dos casos, em virtude da dimenso da populao em estudo, necessrio recorrer
a sub-conjuntos, a amostras, para estudar uma (ou vrias) caracterstica(s) particular(es) de
uma populao. Uma AMOSTRA composta por um nmero determinado de observaes
individuais, geralmente referidas por x
i
em que i=1, 2, , n. Estas observaes individuais
podem ser QUALITATIVAS, como por exemplo a cor, o sexo ou o comportamento, etc, ou
QUANTITATIVAS como por exemplo o peso, a densidade, a taxa de crescimento, etc. O nmero
de elementos que compom uma amostra designa-se por TAMANHO DA AMOSTRA e
representa-se por n. De modo similar, o nmero total de elementos que constituem a
populao (ou o Universo, segundo alguns autores) representado por N. Como j vimos, o
conjunto das amostras obtidas de determinada populao designado por amostragem.
Os elementos da amostra medem ou descrevem determinada caracterstica da populao (por
exemplo, o peso, o sexo ou o comportamento). Essa caracterstica, que descrita ou medida
pelas observaes individuais designa-se por VARIVEL (mais adiante elaboraremos sobre
outras definies de varivel).

Ou seja, se pretendemos estudar o peso dos alunos desta disciplina no
presente ano lectivo (que seria a varivel em estudo), poderamos obter
uma amostra de 20 alunos (tamanho da amostra seria, ento, n=20) e
pesar cada aluno. Obteramos uma lista de n=20 observaes
individuais, geralmente referidas por x
i
, no exemplo o peso de cada aluno
(x
1
=68 kg, x
2
=53 kg, , x
20
=76 kg).

Como para as populaes, e alis como acontece em muitos casos, existem vrios tipos de
variveis organizados segundo diferentes critrios. Por vezes, a varivel em estudo descreve
determinada qualidade ou atributo em vez de medir certa quantidade: a cor, por exemplo.
Alguns autores referem-se a ATRIBUTOS para designar este tipo de variveis. Contudo,
podemos, para facilitar a anlise e a representao, substituir esses atributos por nmeros, isto
em vez de olhos azuis atribuir o valor 1, ou em vez de olhos castanhos considerar o valor 2,
etc.
Em muitos casos, no entanto, as variveis so mensurveis, isto , podem medir-se ou
quantificar-se de alguma forma e, portanto, podem representar-se numericamente. Nestes
casos, podemos considerar dois tipos: VARIVEIS DISCRETAS (e.g. contagens); e VARIVEIS
CONTNUAS (e.g. medies). Nas primeiras, as observaes individuais s podem assumir
determinados valores. Por exemplo, o nmero de folhas no ramo de uma rvore s pode
assumir determinados valores. No segundo caso, a varivel pode assumir um qualquer valor
entre quaisquer limites observados, ou seja, possvel existir um valor entre quaisquer outros
dois valores observados.

Por exemplo, o nmero de folhas numa rvore s pode assumir
determinados valores. possvel contar 37 folhas, mas impossvel
enumerar 37,48 folhas ou 36,125 folhas nesse ramo de rvore varivel
discreta. Se medirmos a altura dos alunos desta turma possvel obter
resultados de 154 cm, ou mesmo 167,3 cm, ou at de 183,92 cm
(depende do equipamento usado para medir). Podemos sempre obter,
Mtodos Estatsticos Engenharia Alimentar 8
Eduardo Esteves, 2007
pelo menos teoricamente, valores de altura dos alunos entre os valores
154 cm e 155 cm, ou 167,0 cm e 167,1 cm, ou 172,03 cm e 172,04 cm,
ou 181,007 cm e 181,008 cm, etc.
DISTRIBUIO DE FREQUNCIAS
Independentemente de estarmos a lidar com populaes ou com amostras, desde que os dados
sejam numerosos, torna-se incmodo apresent-los todos de cada vez que isso seja necessrio.
apresentao total das observaes individuais (ou dos dados), dispostos por ordem
crescente ou decrescente de grandeza, alguns autores (mais antigos) designam por lista ou rol.
Os dados podem, no entanto, ser tratados de forma a simplificar a sua apresentao e
manuseamento. Um processo consiste no seu AGRUPAMENTO, isto na apresentao em
conjunto de todos aqueles cuja grandeza igual. Um dos modos de apresentar os dados
atravs de TABELAS DE FREQUNCIAS (Tab. 1).
Uma tabela de frequncias inclui, geralmente, a seguinte informao: as classes consideradas
(coluna da esquerda na Tab. 1); e as frequncias propriamente ditas (nas colunas mais
direita). Opcionalmente apresentam-se os pontos mdios das classes p
j
. Vamos abordar a
seguir como obter e dispr essa informao.

Tab. 1 Exemplo de uma Tabela de frequncias (simplificada) para uma varivel
que pode assumir quaisquer valores entre 0 e 10. Os dados brutos obtidos so: 7, 6,
5, 7, 8, 9, 6, 7, 4, 6, 7, 10.
Classes Ponto-mdio
(p
j
)
Frequncia absoluta
(F)
Frequncia relativa
(f)
3,5 4,9 4,2 1 0,0833
4,9 6,3 5,6 4 0,3333
6,3 7,7 7,0 4 0,3333
7,7 9,1 8,4 2 0,1667
9,1 10,5 9,8 1 0,0833
Clculo do nmero de classes
Na maioria dos casos, necessrio definir arbitrariamente o nmero de CLASSES, ou
categorias que integram observaes individuais da mesma ordem de grandeza, com que
vamos elaborar a tabela de frequncias.
Quando estamos a trabalhar com variveis contnuas, um modo de resolver esta questo
recorrer seguinte equao (frmula de Sturges) para calcular o nmero de classes NC ou k:
NC = k = (log
2
n) + 1,
em que log
2
o logaritmo de base 2 e n o tamanho da amostra. O resultado arredondado
para o nmero inteiro mais prximo.

Se utilizarmos como exemplo os resultados que deram origem Tab. 1,
Mtodos Estatsticos Engenharia Alimentar 9
Eduardo Esteves, 2007
teramos que:
Para n = 12, k = log
2
12 + 1 = 4 + 1 = 5
neste caso, 2
3
= 8 ou 2
4
= 16, e decidiu-se trabalhar com maior nmero de
classes.

Pode-se obter o nmero de classes k atravs de outra equao, talvez mais simples:
1
2 log
log
+ =
n
k
neste caso, utilizam-se logartmos de base 10. Se n 25 possvel determinar k considerando
que k = n .
Nos casos das variveis qualitativas (atributos) ou das variveis discretas, o procedimento de
elaborao de tabelas de frequncias ligeiramente diferente. Quando temos atibutos,
podemos simplesmente definir como categorias ou classes, os diferentes atributos.
Contabilizando o n de observaes/resultados por atributo preenche-se a tabela de
frequncias. Por outro lado, quando a varivel discreta, o processo de elaborao de tabelas
de frequncias diferente e um pouco subjectivo. A definio das classes depende tanto dos
valores obtidos como do que se pretende ilustrar ou representar na tabela de frequncias.

Exemplo 1: Uma empresa fabrica sete produtos congelados distintos (A a G, para
simplificar) e os resultados das vendas por produto no ltimo trimestre constam
do relatrio da auditoria trimestral. Neste caso (varivel qualitativa produto),
cada produto consitui uma classe diferente e o n de embalagens de cada
produto vendidas no ltimo trimestre corresponde frequncia absoluta nessa
classe.
Exemplo 2: Consideremos que uma varivel discreta pode assumir quaisquer
valores inteiros entre 0 e 20 (por exemplo, as classificaes finais na disciplina de
Mtodos Estatsticos), e que os dados brutos obtidos so: 7, 9, 7, 10, 8, 6, 7, 6, 8,
12, 5, 10, 10, 9, 9, 8, 8, 9, 9, 11, 11 (resultados de 21 alunos num dado ano
lectivo).
Neste caso, o valor mximo = 12 e o valor mnimo = 5. No entanto, podemos
definir vrios agrupamentos diferentes consoante os objectivos: 5 classes (0 a 5; 6
a 9; 10 a 13; 14 a 17; e 18 a 20) que correspondem a Medocre, Insuficiente,
Razovel, Bom e Muito Bom; 4 classes (5-6, 7-8, 9-10 e 11-12); 2 classes
apenas (5-9 e 10-14); ou 20 classes (1, 2, 3, , 19, 20).
Clculo dos limites implcitos
Se estivermos a estudar caractersticas mensurveis, isto , no caso de variveis contnuas,
aps a definio do nmero de classes a considerar no agrupamento dos dados (k), ser
necessrio determinar que valores incluir cada classe, ou seja entre que limites de classe
sero contabilizadas as observaes individuais. Um modo de determinar esses limites
recorrer aos prprios dados, da a designao de LIMITES IMPLCITOS, e utilizar os valores
mnimo e mximo das observaes individuais. Dividindo-se a amplitude dos limites
Mtodos Estatsticos Engenharia Alimentar 10
Eduardo Esteves, 2007
implcitos pelo nmero de classes (k) calculado anteriormente obtm-se as classes para
elaborao da tabela de frequncias (observe-se o exemplo seguinte).

Consideremos que uma varivel pode assumir quaisquer valores entre 0 e 10. Os
dados brutos obtidos so: 7, 6, 5, 7, 8, 9, 6, 7, 4, 6, 7, 10.
Se o valor mximo = 10, ento limite (superior) implcito da ltima classe = 10,5.
Se o valor mnimo = 4, ento limite (inferior) implcito da primeira classe = 3,5.
A amplitude (total) destes limites = 10,5 3,5 = 7.
Uma vez que o nmero de classes proposto 5, ento a amplitude de cada classe
ser igual a 7/5 = 1,4.
Ficam assim definidas as 5 classes: de 3,5 a 4,9; de 4,9 a 6,3; de 6,3 a 7,7; de 7,7
a 9,1; e de 9,1 a 10,5.

Se os valores, mnimo e mximo, das observaes originais fossem, por exemplo, 4,5 e 10,5,
ento os limites implcitos da primeira e da ltima classe seriam 4,45 e 10,55 respectivamente.
Frequncia absoluta, relativa e relativa acumulada
Depois de estabelecidas classes, necessrio contabilizar os casos que esto incluidos em
cada classe e desse modo obter a FREQUNCIA ABSOLUTA (F
j
). Podemos acrescentar (e em
muitos casos melhorar) a informao contida numa tabela de frequncias. O clculo da
FREQUNCIA RELATIVA (f
j
), de acordo com a seguinte equao:
n
F
f
j
j
=
em que F
j
a frequncia absoluta na classe j (j=1,2, ,k) e n nmero total de observaes
individuais (tamanho da amostra). As frequncias relativas permitem comparar duas
distribuies com n diferente, ou seja, a partir de um segundo conjunto de dados (com n igual,
inferior ou superior) poderamos preparar uma tabela de frequncias relativas e desse modo
comparar grosso modo (a forma, a distribuio dos resultados) com a que acabmos de
elaborar.
Mas, e se quisssemos saber quantas observaes individuais com valores entre 4,9 e 9,1
ocorreram na amostra do exemplo anterior? Ou quantas observaes so maiores ou iguais a
7,7? Neste caso, podemos recorrer s FREQUNCIAS RELATIVAS ACUMULADAS (facum) que se
pode obter da soma da frequncia relativa de determinada classe com a(s) frequncia(s)
relativa(s) das classe anteriores. Complementarmente, as frequncias relativas acumuladas
tambm so teis para o clculo de medidas de localizao e disperso da amostra (das quais
falaremos mais adiante). Com esta informao podemos completar a tabela de frequncias
apresentada no incio desta seco (Tab. 2).
REPRESENTAO GRFICA DE DISTRIBUIES DE FREQUNCIAS
A partir de uma tabela de frequncias, que apesar de muito informativa pode ser maadora,
possvel elaborar representaes grficas, HISTOGRAMAS (Fig. 2 e Fig. 3, para variveis
Mtodos Estatsticos Engenharia Alimentar 11
Eduardo Esteves, 2007
contnuas e discretas, respectivamente) e POLGONOS DE FREQUNCIA (Fig. 4), mais
apelativas e que permitem analisar visualmente os dados com maior facilidade.

Tab. 2 Tabela de frequncias para uma varivel que pode assumir
quaisquer valores entre 0 e 10. Os dados brutos obtidos so: 7, 6, 5, 7, 8, 9,
6, 7, 4, 6, 7, 10. Legenda: F frequncia absoluta; F
A
Frequncia absoluta
acumulada; f frequncia relativa; f
A
frequncia relativa acumulada.
Classes p
j
F F
A
f f
A

3,5 4,9 4,2 1 1 0,0833 0,0833
4,9 6,3 5,6 4 5 0,3333 0,4166
6,3 7,7 7,0 4 9 0,3333 0,7499
7,7 9,1 8,4 2 11 0,1667 0,9166
9,1 10,5 9,8 1 12 0,0833 1
12 1

0
1
2
3
4
5
4,2 5,6 7 8,4 9,8
Ponto mdio de classe
F
r
e
q
u

n
c
i
a

a
b
s
o
l
u
t
a

(
F
)

Fig. 2 Histograma (grfico de barras) de varivel contnua (da Tab. 2).
0
0,1
0,2
0,3
0,4
0 a 4 5 a 9 10 a 13 14 a 17 18 a 20
Classes
F
r
e
q
u

n
c
i
a

r
e
l
a
t
i
v
a

(
f
)

Fig. 3 Histograma de frequncias de varivel discreta (cf. Exemplo na pgina 9).
Mtodos Estatsticos Engenharia Alimentar 12
Eduardo Esteves, 2007
0,0
0,1
0,2
0,3
0,4
4,2 5,6 7 8,4 9,8
Ponto mdio de classe
F
r
e
q
u

n
c
i
a

r
e
l
a
t
i
v
a

Fig. 4 Polgono de frequncias (grfico de pontos e linhas) de varivel contnua (da Tab. 2).
MEDIDAS DE TENDNCIA CENTRAL E DE DISPERSO
Para alm das tabelas de frequncias e das suas representaes grficas (histogramas e
polgonos de frequncia), podemos descrever resumidamente a amostra (ou a populao) de
outra forma. Recorrendo a alguns parmetros ou medidas de referncia comum, possvel
caracterizar uma amostra (ou a populao) em termos de localizao (ou tendncia central) e
de disperso. As medidas devem: ser objectivas; conter todas as observaes; ser precisas
quanto sua interpretao; ser fceis de calcular; e variar pouco relativamente s variaes
amostrais.
Por exemplo, quando medimos determinada caracterstica (ou varivel) da amostra,
geralmente parece ocorrer uma preponderncia de valores mdios ou centrais
relativamente amplitude observada. Assim, uma indicao da mdia da amostra (ou da
populao) seria expressiva e til para a sua descrio. Existem vrios PARMETROS ou
MEDIDAS DE TENDNCIA CENTRAL, possveis de obter empriricamente a partir da amostra ou
da populao, sendo que as mais comuns so a mdia, a mediana e a moda.
Tambm importante quantificar a variabilidade, a variao, dos valores observados em torno
dessa medida de tendncia central. Esta informao, resumida em PARMETROS ou MEDIDAS
DE DISPERSO, pode ser quantificada de diversos modos, como por exemplo atravs da
amplitude, do intervalo inter-quartil, da varincia, do desvio-padro ou do coeficiente de
variao.
As medidas que a seguir se apresentam, aplicam-se tanto a amostras como a populaes. No
entanto, a notao utilizada relativamente diferente. Por exemplo, para a mdia e a varincia
populacionais usam-se as letras gregas minsculas e
2
, respectivamente. No caso de
mdias e varincias amostrais utilizam-se x e s
2
respectivamente. Outras diferenas pontuais
sero assinaladas no texto.
Medidas de tendncia central
Como se disse atrs, geralmente os valores, as medies ou as observaes individuais de
Mtodos Estatsticos Engenharia Alimentar 13
Eduardo Esteves, 2007
determinada varivel numa amostra (ou populao), encontram-se preponderantemente
perto do centro da amplitude de valores. Existem vrias medidas ou parmetros de
tendncia central para quantificar esse valor central, nomeadamente a MDIA, a MEDIANA e
a MODA.
A MDIA ARITMTICA a medida de tendncia central mais usada e que, em geral, se designa
simplesmente por mdia (os autores anglfonos utilizam indiscriminadamente mean e
average). Se considerarmos cada medida ou observao individual da varivel X numa
amostra de tamanho n, x
i
em que i=1,2,...n, a mdia aritmtica calcula-se atravs de:
n
x
x
n
i
i

=
=
1

sendo que (l-se sigma) indica o somatrio dos elementos x
i
. Quando se pretende calcular
a mdia a partir de dados agrupados, em tabelas de frequncias com k classes, a mdia obtm-
se com:
n
p F
x
k
j
j j
=

=
1

em que F
j
a frequncia absoluta e p
j
o ponto-mdio da classe j. No caso de populaes, a
mdia aritmtica (l-se mi) pode calcular-se de modo similar por:
N
x
N
i
i
=
=
1


Os dados brutos obtidos so: 7, 6, 5, 7, 8, 9, 6, 7, 4, 6, 7, 10. A mdia (aritmtica)
calculada a partir daqueles dados igual a: ( ) 83 , 6 12 82 = = =

n x x
i
. Se
recorrermos tabela de frequncias entretanto elaborada a partir daqueles dados
(Tab. 2) a mdia ser: ( ) 77 , 6 7 2 , 81 = = =

n p F x
j j
.

Se representarmos os dados, as observaes individuais, por um histograma, a mdia
corresponde (visualmente) ao centro de gravidade do histograma (imaginando que as barras
tm peso proporcional ao tamanho), no local com barra(s) maiores (valores mais vezes
observados) seria mais pesado (cf. Fig. 2).
Existem outras mdias de uso menos frequente, designadamente a mdia geomtrica, a mdia
harmnica e a raz quadrada mdia. A MDIA GEOMTRICA G de um conjunto de n
observaes x
i
(x
1
, x
2
, , x
n
), a raz de ordem n dos produtos daquelas observaes, ou seja:
n
n
i
n
n
n
x x x x G

=
= =
1
2 1
...
em que (l-se pi) designa o produto dos elementos. No caso das observaes estarem
organizadas numa tabela de frequncias poderemos calcular G atravs de:
Mtodos Estatsticos Engenharia Alimentar 14
Eduardo Esteves, 2007
n
k
j
F
j
n
F
k
F F
j k
p p p p G

=
= =
1
2 1
...
2 1

em que n = F
j
, F
j
a frequncia absoluta e p
j
o ponto-mdio na classe j. Na prtica, G
calculada recorrendo aos logaritmos das observaes atravs de:

= ) (log
1
log
i
x
n
G ou

= ) log (
1
log
j i
p F
n
G , respectivamente.
A MDIA HARMNICA H de um conjunto de n observaes individuais recproca da mdia
aritmtica dos recprocos das observaes, ou seja:

= =
n
i
i
n
i
i
x
n
x n
H
1 1 1
1

No caso dos dados agrupados, calcula-se H atravs de:

=
|
|

\
|
=
k
j j
j
p
F
n
H
1

A relao entre as mdias aritmtica, geomtrica e harmnica tal que: H G x para um
conjunto de n observaes x
i
em que i=1,2,...n.
A RAZ QUADRTICA MDIA ou mdia quadrtica de um conjunto de observaes, R,
frequentemente utilizada em fsica e definida por:
n
x
R
n
i
i
=
=
1
2

A MEDIANA uma medida menos usada apesar de, em alguns casos, ser mais apropriada do
que a mdia. Tipicamente, a mediana definida como o valor, ou a observao, ou a medio,
ou o caso, intermdio numa amostra arranjada por ordem de grandeza. Dito de outro modo, a
mediana de um conjunto de nmeros, ordenados por ordem de grandeza, o valor para o qual
metade dos elementos do conjunto so menores do que esse valor e outra metade so maiores
do que esse valor. Podemos expressar este conceito da seguinte forma: num conjunto de
valores ordenados por ordem crescente (ou decrescente, irrelevante!),
i
x em que i=1, 2, ,
n, a mediana M (muitos autores utilizam a notao x
~
) corresponde a
( ) par se
impar se
2
1
~
2 / 1 2 /
2 / ) 1 (
n
n
x x
x
x
n n
n

+
+

em que x
(n+1)/2
a observao individual de ordem (n+1)/2. Quando n par, ento x
~
dado
pela mdia aritmtica dos valores de ordem (n/2) e (1+n/2). No caso de dados agrupados em
tabelas de frequncias a mediana dada por:
a
F
F
n
L x M
mediana

(
(
(
(


+ = =

2 ~

em que L o lmite inferior da classe que contm a mediana, n o tamanho da amostra, F
o somatrio das frequncias das classes anteriores classe que contm a mediana, F
mediana
a
Mtodos Estatsticos Engenharia Alimentar 15
Eduardo Esteves, 2007
frequncia da classe que contm a mediana e a a amplitude dos intervalos de classe (ver
exemplo seguinte). Para saber qual a classe que contm a mediana (essencial para resolver a
equao anterior) deve cruzar-se a informao dada por
2 / ) 1 ( +

n
x (independentemente da
tamanho da amostra) com as frequncias acumuladas F
A
.

Exemplo 1: Os dados brutos obtidos, ordenados por ordem crescente so: 4, 4, 5,
6, 8, 8, 8, 10, 10 (n = 9). A mediana M igual a 8, porque x
(9+1)/2
= x
5
= 8.
Exemplo 2: Se os dados brutos ordenados por ordem crescente forem: 4, 5, 6, 6,
6, 7, 7, 7, 7, 8, 9, 10 (n = 12). M = valor intermdio entre x
6
e x
7
que se calcula
simplesmente como a mdia aritmtica entre os valores correspondentes a x
6
e
x
7
, isto , M = x
~
= (7+7)/2 = 7.
No caso dos mesmos dados, entretanto agrupados como na Tab. 2, o tamanho da
amostra 12, ento (n+1)/2 = 6,5, ou seja a mediana estar entre os valores de
ordem 6 e 7; que est incluido na terceira classe (6,3-7,7) se observarmos a
coluna de frequncias acumuladas. Assim, obtm-se que M= x
~
=6,7 um valor
diferente de x
~
= 7 obtido directamente dos dados brutos e ligeiramente inferior
mdia aritmtica ( x =6,77).

Na sequncia do conceito de mediana, podemos ainda definir outras medidas de localizao,
de utilizao menos comum. Um conjunto de dados organizados por ordem de grandeza,
permite calcular, para alm da mediana (o valor central que divide o conjunto em duas partes
iguais), outros valores que dividem o conjunto em quatro, dez ou cem partes iguais,
respectivamente quartis, decis ou percentis (genericamente designados por QUANTIS). Num
grfico de frequncias relativas acumuladas, os quartis, decis e percentis so as abcissas cujas
ordenadas correspondem ordem z (em que z o quantil pretendido). Podemos particularizar
para os quatro casos de quartis (vulgarmente designados por Q) e considerando as amostras
ordenadas:
1) Quando n=4p (isto , quando o tamanho da amostra mltiplo exacto de quatro), o
primeiro quartil dado por Q
1
=1/2(x
p
+x
p+1
), o segundo quartil Q
2
=M=1/2(x
2p
+x
2p+1
), e o
terceiro quartil Q
3
=1/2(x
3p
+x
3p+1
);
2) Sempre que n=4p+1, ento Q
1
=1/4(x
p
)+3/4(x
p+1
), Q
2
=M=x
2p+1
, e Q
3
=3/4(x
3p+1
)+1/4(x
3p+2
);
3) Quando n=4p+2, logo Q
1
=x
p+1
, Q
2
=M=1/2(x
2p+1
+x
2p+2
), e Q
3
=x
3p+1
; e
4) No caso de n=4p+3, os clculos necessrios sero Q
1
=3/4(x
p+1
)+1/4(x
p+2
), Q
2
=M=x
2p+2
, e
Q
3
=1/4(x
3p+2
)+3/4(x
3p+3
) (cf. exemplo seguinte).

Os dados brutos obtidos, ordenados por ordem crescente so: 4, 4, 4, 5, 5, 6, 6, 8,
8, 8, 8, 10, 10, 11, 11, 12, 15 (n = 17). Neste caso n=4x4+1 portanto estamos
perante o caso 2) ou seja: o primeiro quartil ser Q
1
=1/4(x
4
)+3/4(x
4+1
)=
1/4(5)+3/4(5)=5, o segundo quartil (ou mediana) ser Q
2
=M=x
2x4+1
=8 e o terceiro
quartil Q
3
=3/4(x
3x4+1
)+1/4(x
3x4+2
)=3/4(10)+1/4(11)=7,5+2,75=9,75

Na prtica, obtm-se os quantis a partir dos polgonos de frequncia relativas acumuladas (ou
utilizando uma aplicao informtica adequada, e.g. Microsoft Excel ou OpenOffice Calc).
Aps localizar no eixo das ordenadas (yy) a ordem do quantil pretendido, pode-se procurar a
correspondncia horizontal no polgono de frequncias e, depois, desenhar uma linha vertical
at ao eixo das abcissas (xx). O ponto em que esta perpendicular intersecta o eixo dos xx
indica o resultado o quantil pretendido. Procedendo de modo inverso, pode obter-se a ordem
do quantil correspondente a determinado valor observado (x
i
). Assim, se o quantil de ordem
Mtodos Estatsticos Engenharia Alimentar 16
Eduardo Esteves, 2007
66% de uma amostra 27,1 cm, por exemplo, isso significa que 66% das observaes, ou
medies, so iguais ou inferiores a 27,1 cm.
Uma terceira medida de tendncia central a MODA. A palavra moda vulgarmente usada
noutro contexto embora o seu significado estatstico no seja muito diferente daquele. A moda
(ou normal segundo autores mais antigos), m, designa o valor (ou valores) que mais vezes
ocorre(m) num conjunto de valores x
i
em que i=1,2,...n. Acontece que, por vezes, no
possvel calcular m, pois em algumas sries de valores no existe nenhum repetido. Pelo
contrrio, noutros casos possvel que a srie possua mais do que uma moda. No caso dos
dados se encontrarem agrupados, no possvel identificar directamente a moda, mas
simplesmente saber qual a CLASSE MODAL, isto , a classe que contm a moda.

Os seguintes dados brutos no tm moda: 3, 5, 8, 10, 12, 15, 16.
Se, no entanto, observarmos os seguintes casos, possvel determinar a moda: 2,
2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 (conjunto unimodal). Neste caso, m=9.
Noutro caso anda, possvel observar duas modas: 2, 3, 4, 4, 4, 4, 5, 5, 7, 7, 7, 7,
9, 11 (conjunto polimodal). Neste caso, m
1
=4 e m
2
=7.
Medidas de disperso
fcil constatar que as diferentes medidas de tendncia central proporcionam estimativas
(ligeiramente) distintas da localizao do centro da distribuio de determinada varivel
numa amostra (ou populao). Por outro lado, podemos verificar que a mdia, a mediana e a
moda podem ser iguais em duas amostras que afinal podem ser substancialmente diferentes
entre si. Na Fig. 5, a distribuio a diferente da distribuio b porque os valores em b tm
uma variabilidade maior do que os valores da distribuio a. Sendo assim, necessrio
encontrar uma quantidade, um parmetro anlogo aos que encontrmos para a tendncia
central, que resuma esta variabilidade da distribuio. Existem vrias medidas de disperso
para descrever numericamente essa variabilidade, nomeadamente a AMPLITUDE, o
INTERVALO INTER-QUARTIL, a VARINCIA, o DESVIO-PADRO e o COEFICIENTE DE
VARIAO.

A AMPLITUDE A (ou h) a diferena entre o maior e o menor valor observados numa srie de
dados:
max min
A x x =
Na Fig. 5 possvel observar que as amplitudes de a e b so A (a) = 1,5-(-1,5) = 3 e A(b) = 4-
(-4) = 8, respectivamente. A amplitude fcil de obter e expressa na mesma unidade da
varivel que estamos a estudar.
O INTERVALO INTER-QUARTIL, IQ, obtm-se da diferena entre o 3 e 1 quartis,
1 3
Q Q IQ =
No entanto, so medidas relativamente rudes da disperso dos dados, pois apenas
consideram o valor mximo e o valor mnimo (A) ou o 1 e 3 quartis (IQ).
Outra medida de disperso, bastante mais comum em estatstica e frequentemente utilizada
em anlise estatstica, a VARINCIA s
2
da amostra (ou a varincia da populao
2
em que
l-se sigma). Ser necessrio, entretanto, introduzir alguns conceitos que facilitam a
compreenso do seu significado, nomeadamente os conceitos de desvio, de soma dos
quadrados e de mnimos quadrados.
Mtodos Estatsticos Engenharia Alimentar 17
Eduardo Esteves, 2007
Poderamos usar a informao contida na medida de tendncia central (e.g. a mdia) e
calcular a soma das diferenas entre cada valor individual x
i
e essa medida, x x d
i i
= (Fig.
6), para eventualmente avaliar a disperso dos dados, isto , calcular a soma dos desvios D:
quantidade seguinte:
) (
1 1
x x d D
n
i
i
n
i
i
= =

= =


-5 -4 -3 -2 -1 0 1 2 3 4 5
X
f
(
x
)
a
b

Fig. 5 Representao esquemtica da amplitude de duas distribuies a e b, simtricas e com igual
valor central (neste caso, zero). No primeiro caso (distribuio a), a amplitude = 3 (i.e. de 1,5 a
+1,5), enquanto no caso da distribuio b, a amplitude = 8 (de 4 a +4).

-25
-20
-15
-10
-5
0
5
10
15
Elemento i da amostra
D

Fig. 6 Representao esquemtica dos desvios (D) de cada elemento i da amostra relativamente
mdia, numa amostra de n=12 observaes com mdia igual a 26.

Infelizmente verifica-se que D = 0, pois teoricamente existem tantos valores menores do que
mdia assim como ocorrem valores maiores do que a mdia. Um modo de ultrapassar esta
dificuldade elevar ao quadrado os desvios d
i
e desse modo obter a soma dos quadrados
Mtodos Estatsticos Engenharia Alimentar 18
Eduardo Esteves, 2007
dos desvios ou soma dos quadrados, SQ:
2
1
( )
n
i
i
SQ x x
=
=


Recorrendo ao conceito dos mnimos quadrados, demonstra-se que a SQ relativamente
mdia menor do que a SQ em relao a qualquer outra medida de localizao.
Podemos refinar anda mais esta quantidade e ponderar SQ pelo tamanho da amostra n (ou
dimenso da populao N), e obter a mdia dos quadrados dos desvios dos valores individuais
relativamente mdia. Sendo assim, a varincia da amostra s
2
a mdia dos quadrados dos
desvio dos valores individuais observados relativamente mdia. Uma importante vantagem
desta medida de disperso considerar todos os valores observados (e includos) na amostra,
alis como acontece com a mdia.
A VARINCIA DA AMOSTRA s
2
expressa-se matematicamente por:
1
) (
2
1 2

=
n
x x
s
n
i
i

em que i=1, 2, , n. O denominador n 1, quantidade designada por graus de liberdade ou
g.l. e que pretende considerar o facto de se ter usado um parmetro da amostra (a mdia
amostral x ), permite obter uma estimativa no-enviesada (do ingls unbiased) da varincia
da amostra. No caso de se pretender calcular a varincia da populao
2
, ento utiliza-se
como denominador N em vez de n 1, ou seja, N x
N
i
i
/ ) (
2
1
2

=
=
Se tivermos um conjunto grande de valores, isto , se o tamanho da amostra for grande
(n>30), ento possvel calcular a varincia recorrendo seguinte expresso simplificada:
1
1
2
1 2
2

\
|


=
=
n
n
x
x
s
n
i
n
i
i
i

Pode-se, anda, calcular a varincia numa amostra em que a informao est agrupada em
tabelas de frequncias com k classes de acordo com:
) 1 (
) (
1
2
1
2
2


=

= =
n n
p F p F n
s
k
j
j j
k
j
j j

em que j=1, 2, , k e desde que n30. Segundo alguns autores, o desvio-padro a medida
de disperso mais importante em estatstica paramtrica pois permite expressar a variabilidade
das observaes nas unidades da varivel em estudo, ao contrrio da varincia. O DESVIO-
PADRO da amostra, s, a raz-quadrada positiva da varincia, ou seja:
2
s s =
Por analogia com os parmetros anteriores, o desvio-padro populacional designa-se e
obtm-se atravs de
2
= . Esta medida de disperso expressa nas unidades dos valores
observados, e antes da definio actual (de 1893) que se deve a Karl Pearson [1857-1936],
designava-se por erro-mdio.

Mtodos Estatsticos Engenharia Alimentar 19
Eduardo Esteves, 2007
Uma queijaria regional produz queijos tpicos de pequena dimenso. Obteve-se
uma amostra da produo diria com as seguintes observaes individuais (em g):
302, 374, 364, 318, 294, 343, 385, 348, 279, 365, 378, 357, 317, 304.
O peso mdio dos queijos na amostra de 337,7 g e a varincia dada por:
07 , 1208
13
) 7 , 377 304 ( ... ) 7 , 377 374 ( ) 7 , 377 302 (
2 2 2
2
=
+ + + +
= s g
2
.
Este valor igual ao obtido recorrendo equao simplificada. Tente confirmar
esta afirmao? O peso mdio da amostra de 337,7 g e a varincia 1208,07 g
2
!
Ser melhor apresentar os resultados como 7 , 337 = x g e s = 34,76 g!!

As medidas de disperso de que falmos at agora so por vezes classificadas como medidas
de disperso absolutas pois referem-se variabilidade numa amostra em termos concretos.
Contudo, a comparao entre amostras com valores (e mdias) substancialmente diferentes ou
com unidades de medida diferentes, dificulta a sua utilizao. As medidas de disperso
relativa, que resultam em nmeros abstractos, relacionam numa mesma amostra uma medida
de disperso com uma medida de tendncia central. A mais comum destas medidas o
COEFICIENTE DE VARIAO c.v. que o quociente, em percentagem, entre o desvio-padro e
a mdia de uma amostra, isto :
. . 100%
s
c v
x
=
Para resumir ou descrever a informao duma amostra (ou populao) deve-se apresentar uma
medida de localizao e uma medida de disperso, a mdia e o desvio-padro por exemplo.
At aqui, tm-se abordado tpicos geralmente classificados como pertencentes ao mbito da
ESTATSTICA DESCRITIVA, de definio bvia: amostra, tabelas de frequncias e respectivas
representaes grficas (histogramas e polgonos de frequncias), e medidas de tendncia
central e de disperso.
[Resolver Exerccios Captulo I]
5. CONCEITOS BSICOS DA TEORIA DA PROBABILIDADES
A seleco criteriosa de amostras representativas duma populao ou a inferncia estatstica a
partir dessas amostras baseiam-se em conceitos relacionados com probabilidades. Noes
correntes de possibilidade, previsibilidade ou certeza que vulgarmente no apresentam
dificuldade de compreenso ou de interpretao, so formalizadas e estudados pela TEORIA
DAS PROBABILIDADES. Este ramo da matemtica desenvolveu-se sobretudo nos scs. XVII e
XVIII, fruto do empenho dos franceses Blaise Pascal [1623-1662], Pierre de Fermat [1601-
1665], Abraham de Moivre [1667-1754] e Pierre Laplace [1749-1827] e do suo Jakob
Bernoulli [1654-1705], com o intuito de predizer os resultados de jogos de azar, populares
entre a nobreza francesa daquele tempo. Mais recentemente, na transio entre os sculos XIX
e XX, o russo Andrei Nikolaevich Kolmogorov [1903-1987], entre outros, contribuiu muito
para este ramo da matemtica. Ainda hoje se utilizam exemplos de jogos (dados e cartas) por
causa das primeiras investigaes e aplicaes.
A ideia-base da Estatstica de que as observaes individuais so naturalmente variveis
aleatrias, isto , os seus valores oscilam devido aos efeitos do Acaso. Quando assim no se
verifica, podemos pensar ou considerar que outras causas no-aleatrias esto a actuar
(tratamentos, factores, etc.). Antes de prosseguir para a anlise e inferncia estatstica,
importante sistematizar alguns dos conceitos mais simples relacionados com a Teoria das
probabilidades.
Mtodos Estatsticos Engenharia Alimentar 20
Eduardo Esteves, 2007
PROVAS ALEATRIAS, ACONTECIMENTOS POSSVEIS, ESPAO AMOSTRAL E EVENTO
Uma PROVA ALEATRIA uma actividade a que correspondem dois ou mais
ACONTECIMENTOS POSSVEIS. Antes de realizar a prova aleatria incerto o seu resultado,
isto , qual dos acontecimentos possveis ir ocorrer.

Exemplo 1. Quando se lana um dado, diz-se que se realiza uma prova aleatria.
Nesta prova existem seis acontecimentos possveis: sair a face com 1, ou 2, ou
3, ou 4, ou 5 ou 6 pontos.
Exemplo 2. Quando um tcnico de controlo da qualidade selecciona uma lata de
sardinha (com o objectivo de verificar se a lata defeituosa), diz-se que est a
realizar uma prova aleatria, em que existem dois acontecimentos possveis: a
lata tem defeito, ou no.
Exemplo 3. Lanamento simultneo de dois dados. Nesta prova aleatria existem
36 acontecimentos possveis.

Designa-se por ESPAO AMOSTRAL, referido por S, o conjunto de todos os acontecimentos
possveis de uma prova aleatria.

Exemplo 1. Lanamento de um dado, S = {1, 2, 3, 4, 5, 6} ou genericamente S =
{a
1
, a
2
, a
3
, a
4
, a
5
, a
6
}.
Exemplo 2. Seleco de uma lata de sardinha, S = {defeituosa, no-defeituosa} ou
em termos genricos S = {b
1
, b
2
}.
Exemplo 3. Lanamento simultneo de dois dados S = {11, 12, , 21, 22, , 66}
ou S={c
1
,c
2
,...,c
36
} (Tab. 3).
Nota: a
i
e b
i
e c
i
designam os acontecimentos possveis.

Tab. 3 Acontecimentos possveis no lanamento simultneo
de dois dados honestos de seis faces.
Dados 1 2 3 4 5 6
1 11 21 31 41 51 61
2 12 22 32 42 52 62
3 13 23 33 43 53 63
4 14 24 34 44 54 64
5 15 25 35 45 55 65
6 16 26 36 46 56 66

Frequentemente, interessam sub-conjuntos do espao amostral. Cada sub-conjunto de
acontecimentos possveis de um espao amostral desginado por EVENTO e usualmente
representado por uma letra maiscula (A, B, C, etc.) diferente de S.

No lanamento nico de um dado (ver exemplos anteriores), considere-se o
domnio do evento nmeros pares A={2, 4, 6}. Usualmente, designa-se A como
evento favorvel. Pelo contrrio, os restantes resultados possveis,
complementares de A, referem-se por ~A (alguns autores utilizam a notao A
c
) e
designam-se por evento complementar.
Mtodos Estatsticos Engenharia Alimentar 21
Eduardo Esteves, 2007
Se recorremos ao exemplo que deu origem Tab. 3, o evento B = soma das
pintas igual a sete o sub-conjunto de S constituido pelos acontecimentos
favorveis indicados a sombreado na Tab. 4.

Tab. 4 Informao da tabela anterior. Os acontecimentos do
evento favorvel soma das pintas = 7 esto assinalados.
Dados 1 2 3 4 5 6
1 11 21 31 41 51 61
2 12 22 32 42 52 62
3 13 23 33 43 53 63
4 14 24 34 44 54 64
5 15 25 35 45 55 65
6 16 26 36 46 56 66

CONCEITO DE PROBABILIDADE
Definio clssica de probabilidade
A Teoria das probabilidades pretende formular modelos de fenmenos (naturais) em que se
supe intervir o Acaso, isto , a partir do passado no se pode prever deterministicamente o
futuro mas podem encontrar-se taxas de realizao constantes de certos fenmenos.
A PROBABILIDADE de ocorrer um evento A, designada por P{A}, ou por Prob{A} ou P(A),
definida classicamente como a proporo entre o nmero a de provas aleatrias em que
determinado evento pode ocorrer e o nmero total de provas aleatrias, isto , a + b, em que
b o nmero de provas aleatrias em que o evento no pode ocorrer, desde que todos os
acontecimentos sejam igualmente possveis ou equiprovveis:
b a
a
A P
+
= ) (
Expressa de outro modo, a probabilidade :
N
n
A P
A
= ) (
em que n o nmero de acontecimentos favorveis que podem ocorrer e N o nmero de todos
os acontecimentos possveis. Esta definio de probabilidade (estabelecida por Pierre Laplace
em 1812) e ambas as expresses salientam o seu carcter a priori. Todavia, nem sempre os
acontecimentos so igualmente provveis (nem o espao amostral finito), pelo que a sua
aplicao no geral.

Qual a probabilidade de ocorrer um nmero impar num nico lanamento de um
dado no viciado?
O nmero de acontecimentos possveis 6, enquanto o nmero de
acontecimentos favorveis 3 (isto , faces 1, 3 e 5). Assim, P(A) =
3
/
6
=
1
/
2
.
Se o dado estivesse viciado em favor do 6, por exemplo, j se no poderia aplicar
a definio clssica de probabilidade. Porqu?
Mtodos Estatsticos Engenharia Alimentar 22
Eduardo Esteves, 2007
Definio de probabilidade como frequncia relativa
Pode-se abordar esta questo de outro modo. Relembrem-se as tabelas de frequncias e de
modo similar poderemos definir a frequncia relativa de um evento como a proporo do
nmero total de acontecimentos possveis que esse evento representa. Ou seja, por definio a
PROBABILIDADE o limite da frequncia relativa de determinado evento, quando o nmero de
observaes, isto , o nmero de provas aleatrias cresce infinitamente:
n
A n
n
A P
) (
lim
) (

=
em que n(A) o nmero de provas aleatrias em que o evento A ocorre e n o nmero total de
provas aleatrias. Esta uma definio a posteriori de probabilidade. Genericamente,
podemos descrever esta definio, recorrendo aos conceitos de frequncia relativa f e de
frequncia absoluta F de que se falou anteriormente:
n
F
f
A
A
) (
) (
=
Por exemplo, em mil lances de uma moeda, obtm-se 529 caras. A frequncia
relativa deste evento f = 529/1000 = 0,529. Faam-se outros mil lances da
moeda e obtm-se 493 caras. A frequncia relativa do acontecimento caras
ser: f = (529 + 493)/2000 = 0,511. Ou seja, quanto maior o nmero de lances,
mais prximo se estar da probabilidade de ocorrer caras num nico
lanamento de uma moeda. Nota: Actualmente, considera-se esta probabilidade
como sendo 0,5 (com um nico algarismo significativo).

A interpretao das probabilidades como frequncia-limite, corresponde ao Teorema de
Bernoulli que, em resumo, diz o seguinte: num fenmeno aleatrio no se pode prever o
resultado da prxima prova aleatria, mas pode prever-se globalmente a frequncia da sua
observao numa longa srie de provas.
De facto, a frequncia (de um evento) deve entender-se como uma medio fsica de uma
grandeza terica, a PROBABILIDADE associada a esse evento.
Definio de probabilidade relacionada com a Teoria dos conjuntos
Modernamente, i.e. desde a axiomatizao em 1933 por Andrei N. Kolmogorov, prefere-se
fundamentar os teoremas das probabilidades na Teoria dos conjuntos, pois recorre a menos e
mais simples axiomas. Alis, os conceitos bsicos iniciais que se introduziram anteriormente
derivam dessa abordagem ao problema (Fig. 7).
Neste texto, sero utilizadas as vrias definies de probabilidades consoante o contexto do
problema e a informao disponvel.
POSTULADOS DAS PROBABILIDADES
Os conceitos anteriores e a Teoria das probabilidades baseiam-se em POSTULADOS
1
, ou
axiomas, que se exigem pragmticos e consistentes (ou coerentes e compatveis) dos quais
trs so:

1
Entede-se por postulado, ou axioma, qualquer proposio aceite sem demonstrao (Eric Weisstein. Axiom
Mathworld A Wolfram Web Resource. http://mathworld.wolfram.com, consultado em 10/03/2005).
Mtodos Estatsticos Engenharia Alimentar 23
Eduardo Esteves, 2007
1. Para qualquer acontecimento a
i
, de um espao amostral S, a probabilidade de ocorrer esse
resultado favorvel varia entre zero e um, inclusivamente:
0 P(a
i
) 1
2. Para qualquer evento A do espao amostral S, a probabilidade desse evento o somatrio
das probabilidades dos acontecimentos a
i
favorveis incluidos no evento A:

=
=
n
i
i
a P A P
1
) ( ) (
3. A probabilidade do espao amostral S igual a um e a probabilidade de acontecimentos
impossveis (isto , daqueles que ocorrem fora de S, e que se incluem no conjunto , em
que l-se Fi) zero:
P(S) = 1 e P() = 0

Fig. 7 Representao esquemtica dum espao amostral S associado a uma prova aleatria. Dos
vrios acontecimentos possveis a
i
, apenas alguns pertencem ao evento A.
TEOREMAS DAS PROBABILIDADES
A utilizao prtica dos conceitos (axiomas) expostos anteriormente, permitiu o
desenvolvimento de concluses fundamentais ou TEOREMAS
2
, auxiliares preciosos em estudos
de probabilidades, designadamente:
Teorema da adio
Para dois eventos (ou acontecimentos) MUTUAMENTE EXCLUSIVOS A e B de um espao
amostral S, a probabilidade de ocorrer UM OU O OUTRO evento igual soma das respectivas
probabilidades individuais, ou seja:
) ( ) ( ) ( B P A P B A P + =
em que se l ou. Podemos extender este teorema a mais do que dois eventos mutuamente
exclusivos. Entende-se que eventos mutuamente exclusivos so aqueles que no ocorrem
simultaneamente: se ocorre A, no ocorre B. Dito de outro modo, a interseco dos conjuntos
(eventos) A e B no espao amostral S um conjunto nulo (Fig. 8, painel da esquerda).

2
Teoremas so proposies (ou afirmaes) que se podem provar como verdadeiras, usando operaes e
argumentos matemticos, numa deterinada estrutura lgica (ou sistema axiomtico) (idem, ibidem).

a
1
a
2
a
3
a
4
a
5
a
6
a
7
a
8
... a
n
Espao amostral S

Acontecimento possvel
Evento A
Mtodos Estatsticos Engenharia Alimentar 24
Eduardo Esteves, 2007
Teorema da multiplicao
Para dois eventos INDEPENDENTES C e D de um espao amostral S, a probabilidade de
OCORREREM SIMULTANEAMENTE igual ao produto das probabilidades, isto :
) ( ) ( ) ( D P C P D C P =
em que se l e. Por eventos independentes, entende-se que um dos eventos no determina
ou influencia o resultado do(s) outro(s) (Fig. 8, painel central).


Fig. 8 Diagramas de Venn, representando eventos mutuamente exclusivos (A e B), eventos
independentes (C e D) e complementares (E e ~E) nos respectivos espaos amostrais S. rea
sombreada refere-se s probabilidades que se pretendem determinar de acordo com os Teoremas de
probabilidade.
Teorema da complementaridade
Para qualquer evento E de um espao amostral S, a probabilidade de no ocorrer E, designado
por P(~E) ou P(E
c
), igual a:
(~ ) 1 ( ) P E P E =
sendo que P(~E), representa o evento complementar de E (Fig. 8, painel da direita).

No nico lanamento de um dado no-viciado, a probabilidade de sair qualquer
uma das faces, aontecimento possvel a
i
P(a
i
) =
1
/
6
, ento:
P(evento sarem faces com n par de pontos) =
1
/
6
+
1
/
6
+
1
/
6
=
1
/
2

P(S) =
1
/
6
+
1
/
6
+
1
/
6
+
1
/
6
+
1
/
6
+
1
/
6
= 1
P(evento sair uma face com sete pontos) = 0
[Resolver Exerccios Captulo II]
6. DISTRIBUIO DE PROBABILIDADES
VARIVEL ALEATRIA
At agora, tm-se considerado genericamente espaos de acontecimentos. Porm, certas
experincias (ou provas) aleatrias podem dar origem a resultados numricos (por exemplo,
nmero de reprovaes na disciplina por ano lectivo, durao do efeito de um calmante,
volume duma embalagem, etc.). Noutros casos, substituem-se os resultados no-quantitativos
por nmeros para simplificar ou facilitar a anlise desse resultado. Recorde-se o que se falou,
nas seces anteriores, acerca de variveis (contnuas e discretas) e de amostragem aleatria,
Mtodos Estatsticos Engenharia Alimentar 25
Eduardo Esteves, 2007
como mtodo necessrio para a anlise estatsticamente vlida dos assuntos. Assim sendo,
importante definir o que uma varivel aleatria e as suas principais caractersticas (ou
propriedades), ou seja: X uma VARIVEL ALEATRIA quando o seu valor (numrico)
determinado pelo acontecimento possvel de uma prova aleatria.
A definio que se encontra nos manuais de estatstica , mais ou menos, a seguinte: Sejam
(l-se psilon) uma prova aleatria (ou experincia) e S um espao amostral associado a
essa prova aleatria. Uma funo X que associe a cada acontecimento possvel (elemento) a
i

desse espao amostral um nmero real X(a
i
), ou mais simplesmente x
i
, denominada
VARIVEL ALEATRIA.
A terminologia usada um tanto infeliz mas universalmente aceite. Torna-se claro que X
uma funo, contudo denominamo-la varivel (aleatria)! evidente que nem todas as
funes imaginrias se podem considerar variveis aleatrias. Um requisito importante que
as probabilidades dos acontecimentos e respectivos resultados (da funo varivel) sejam bem
definidos e consistentes com os axiomas bsicos (ver tpico anterior).
Na maior parte das utilizaes no se indica a natureza funcional da varivel aleatria X (neste
texto, usaremos v.a. para referir uma varivel aleatria). Geralmente, interessam mais os
valores possveis da v.a. X do que a sua origem (Fig. 9).

a
1
a
2
a
3
a
4
a
5
a
6
a
7
a
8
... a
n
Espao amostral S
Evento A
x
1
x
2
x
3
x
4
x
5
Funo varivel aleatria, v.a.

Fig. 9 Representao esquemtica do conceito de funo varivel aleatria, v.a. (linhas contnuas no
topo da figura). S espao amostral duma prova aleatria, A evento, a
i
acontecimento possvel, e x
i

resultado possvel.

Exemplo 1: Quando se lanam simultaneamente dois dados, existem 36
acontecimentos possveis diferentes (ver Tab. 3). Se interessar a soma dos
pontos podem obter-se 36 resultados x
i
(varivel aleatria X soma dos
pontos). Se, por outro lado, se pretender estudar o produto dos pontos, ento para
os mesmos acontecimentos possveis obtm-se outros resultados y
i
(agora da v.a.
Y produto dos pontos).
Exemplo 2: Se se pretender estudar determinado sector de actividade, por
exemplo a indstria conserveira, o espao amostral composto por todas as
empresas do sector S={todas as empresas conserveiras}. Para cada empresa
(acontecimento possvel) possvel estudar diferentes aspectos (qualidades ou
caractersticas), por exemplo o n de empregados (v.a. W), o volume de negcios
(v.a. V), etc.

Mtodos Estatsticos Engenharia Alimentar 26
Eduardo Esteves, 2007
As probabilidades dos resultados possveis duma v.a. X, x
i
, tambm se podem estudar. Para
esse fim podem utilizar-se as distribuies (ou leis) de probabilidades.
DISTRIBUIES DE PROBABILIDADES DE VARIVEIS DISCRETAS
No caso das VARIVEIS DISCRETAS, a varivel aleatria X pode tomar valores x
i
com i=1,
2,..., n. funo que estabelece uma correspondncia entre o resultado da varivel aleatria
X(a
i
), ou x
i
, e a respectiva probabilidade denomina-se FUNO DENSIDADE DE
PROBABILIDADE, e representa-se por P(X=x
i
) ou p(x
i
).

Consideremos uma varivel X que pode assumir os valores 0, 1 ou 2
(equiprovveis). Considere-se, anda, o espao amostral S =
{0,0,0,0,0,0,0,0,1,1,1,2}. A funo densidade da probabilidade P(X=xi) faz
corresponder a cada valor de x
i
(resultado do acontecimento possvel) uma
probabilidade P(x
i
), neste caso P(X=0)=
8
/
12
=0,667; P(X=1)=
3
/
12
=0,250 e
P(X=2)=
1
/
12
=0,083.

A funo densidade de probabilidade (de variveis discretas) semelhante s frequncias
relativas. Poderemos representar graficamente esta funo atravs dum histograma de
frequncias relativas (Fig. 10a).
Contudo, poderemos estudar outras questes relativas aos mesmos resultados, para alm de
saber qual a probabilidade P(X=xi) para determinado x
i
. A probabilidade da varivel
aleatria X tomar um valor inferior ou igual a x
i
uma nova funo, que se representa por
P(Xxi) e se designa por FUNO DISTRIBUIO DE PROBABILIDADE. Na prtica, esta funo
similar s frequncias relativas acumuladas.

Consideremos uma v.a. X que pode assumir os valores 0, 1 ou 2 (igualmente
provveis). Considere-se, anda, o espao amostral S = {0,0,0,0,0,0,0,0,1,1,1,2}.
A funo distribuio da probabilidade P(Xx
i
) faz corresponder a cada valor de
x
i
(resultado possvel) o somatrio das probabilidades para os casos em que Xx
i
,
ou seja, P(X0)=
8
/
12
=0.667; P(X1)=
11
/
12
=0.917 e P(X2)=
12
/
12
=1.000.

Como anteriormente, podemos representar graficamente esta funo, agora por um polgono
(de frequncias), por exemplo (Fig. 10b).
Propriedades da funo densidade
a) Para cada resultado de um acontecimento possvel x
i
, com i=1, 2, ..., n, a sua probabilidade
pode variar entre zero e um:
0 P(X=x
i
) 1, i=1, 2, ..., n
b) O somatrio de todas as probabilidades correspondentes a cada resultado dum
acontecimento igual a um:
1 ) (
1
= =

=
n
i
i
x X P
Mtodos Estatsticos Engenharia Alimentar 27
Eduardo Esteves, 2007
Propriedades da funo distribuio
a) P(Xx
i
) sempre um valor entre zero e um:
0 P(Xx
i
) 1, i=1, 2,..., n
b) A funo distribuio (das probabilidades) nunca decresce medida que x
i
aumenta
funo montona crescente.

0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2
X
P
(
X
=
x
i
)

(a)
0
0,2
0,4
0,6
0,8
1
0 0,5 1 1,5 2
X
P
(
X
<
x
i
)

(b)
Fig. 10 (a) Funo densidade de probabilidade P(X=xi) e (b) funo distribuio de probabilidade
P(Xxi) duma v.a. discreta.
Caratersticas da distribuio de probabilidades
possvel definir nas distribuies de probabilidade de determinada varivel aleatria (v.a.),
alguns pontos ou caractersticas com interesse estatstico e que so similares a conceitos de
estatstica descritiva que se abordaram anteriormente para amostras (medidas de localizao e
de disperso), nomeadamente o valor mdio, a varincia e o desvio-padro duma distribuio
de probabilidades.
O VALOR MDIO da distribuio de probabilidades tambm designado por VALOR
ESPERADO ou ESPERANA MATEMTICA, e representado por E{X}. No caso de uma v.a.
discreta X, tal que os resultados dos acontecimentos possveis x
i
em que i=1, 2,.., n, o valor
mdio ser:
1
{ } [ ( )]
n
i i
i
E X x P X x
=
= =


O valor mdio obtm-se a partir da importncia relativa do resultado de cada acontecimento
possvel. Enquanto a mdia emprica, ou experimental, por se obter dos valores observados,
o valor mdio uma noo terica visto ser calculado a partir da distribuio de
probabilidades dos valores observveis (e no dos valores observados!!). Pode interpretar-se
como o valor terico (em geral desconhecido) de que as mdias so medies bastante
prximas, se o nmero de observaes (ou provas aleatrias) bastante grande. O exemplo
seguinte mostra que o valor mdio no necessariamente um valor assumido pela v.a.

Aps o lanamento dum dado no-viciado, a varivel aleatria X
nmero de pontos na face visvel, pode tomar os valores x
i
=1, 2,..., 6. As
Mtodos Estatsticos Engenharia Alimentar 28
Eduardo Esteves, 2007
respectivas probabilidades so P(X=1) = P(X=2) = ... = P(X=6) =
1
/
6
.
Ento, teremos que o valor mdio ser: E{X} = 1(
1
/
6
) + 2(
1
/
6
) + 3(
1
/
6
) +
4(
1
/
6
) + 5(
1
/
6
) + 6(
1
/
6
) =
21
/
6
= 3,5
Nota: curiosamente, podemos verificar agora que a designao valor
esperado no faz muito sentido uma vez que 3,5 no pode realmente
ocorrer neste exemplo! Talvez seja mais adequado utilizar a designao
valor mdio! Se se imaginar a situao de continuados lanamentos
sucessivos dum dado, em cada lanamento o resultado pode ser 1, 2, etc.
A mdia do conjunto dos resultados possveis aps muitas p.a. ser o
valor mdio.

A variabilidade (ou a forma) da distribuio de probabilidades de uma varivel discreta X
pode ser quantificada (ou descrita) pela VARINCIA, V{X}, que dada para os resultados dos
acontecimentos possveis x
i
por:
2
1
{ } [( { }) ( )]
n
i i
i
V X x E X P X x
=
= =


A raz quadrada positiva da varincia } {X V designada por DESVIO-PADRO da distribuio
de probabilidades.

Aps o lanamento dum dado no-viciado, a varivel aleatria X nmero de
pintas na face visvel, pode tomar os valores 1, 2,..., 6. Portanto, E{X} = 3,5
como se viu anteriormente. A varincia
V{X} = (1-3,5)
2
(
1
/
6
) + (2-3,5)
2
(
1
/
6
) + (3-3,5)
2
(
1
/
6
) + (4-3,5)
2
(
1
/
6
) + (5-3,5)
2
(
1
/
6
) +
(6-3,5)
2
(
1
/
6
) = 2,92. Ento { } V = 92 , 2 = 1,71 o desvio-padro.

Existem casos de distribuies (tericas) de probabilidades de variveis discretas que
merecem ateno especial e estudo particular, nomeadamente as distribuies binomiais e de
Poisson.
[Resolver Exerccios Captulo II]
DISTRIBUIO BINOMIAL
Considere-se uma prova (experincia) aleatria que tem apenas dois acontecimentos
possveis: um que se designa por sucesso (a
1
) e o seu complementar designado por
insucesso (a
0
). Em cada p.a. a probabilidade de ocorrer a
1
p e q=(1p) a probabilidadade
do insucesso, ambas constantes prova aleatria de Bernoulli. A distribuio binomial o
modelo probabilstico adequado para os casos em que se consideram repetidas provas
aleatrias independentes como a descrita. Nestes casos, o conjunto de resultados nas
sucessivas provas constitui uma varivel aleatria discreta que segue a distribuio binomial.
De facto, as probabilidades de observar a v.a. X igual a 0, 1, 2,..., n so dados por (1-p)
n
,
n(p)(1-p)
n-1
, n!/2!(n-2)!(p
2
)(1-p)
n-2
, ... p
n
, em que p a probabilidade de realizao do
acontecimento em cada prova. Aquelas quantidades correspondem ao desenvolvimento do
binmio [(1-p)+p]
n
=1, da a designao distribuio binomial.
Na DISTRIBUIO BINOMIAL, devida a Jakob Bernoulli [1654-1705], numa sequncia de n
provas aleatrias, com reposio, a FUNO DENSIDADE DE PROBABILIDADE da v.a. discreta X
nmero de sucessos que pode tomar os valores x
i
= 0, 1, 2,..., n dada por:
Mtodos Estatsticos Engenharia Alimentar 29
Eduardo Esteves, 2007
( ) (1 )
n x n x
i x
P X x C p p

= =
em que p a probabilidade de ocorrer o resultado favorvel (ou sucesso) em cada prova e se
mantm constante de experincia para experincia, n o nmero mximo de tentativas (ou
provas aleatrias) independentes e
n
x
C dado pela expresso de clculo combinatrio:
)! ( !
!
x n x
n
x
n
C
n
x

=
|
|

\
|
=
i.e. em n p.a. independentes existem
n
x
C maneiras diferentes de se obterem x sucessos.
Tambm se pode ler
n
x
C como o n de combinaes de ordem x de um conjunto de cardinal
igual a n (com xn). A funo densidade de probabilidades da distribuio binomial depende
dos parmetros p e n, e usada quando cada prova aleatria tem apenas dois acontecimentos
possveis e de natureza qualitativa: a
1
sucesso ou 1; e a
0
insucesso ou 0. Uma v.a. X que
segue esta distribuio representa-se por X Binomial(n, p) ou X ~ Binomial(n, p).

Em 3 lanamentos de um dado no-viciado (n = 3 provas aleatrias repetidas), a
varivel aleatria X = nmero faces com um ponto, pode tomar os valores x
i
= 1,
2 ou 3 (Fig. 11). Mas, para cada resultado x
i
existem vrios casos
(acontecimentos) possveis! De facto, temos de considerar a ordem de sada das
faces com um ponto. Vamos abordar a questo considerando que o resultado
sada da face com 1 ponto consitui um sucesso e que todos os outros resultados
possveis constituem um insucesso. Adicionalmente, vamos quantificar os
sucessos com 1 e os insucessos com 0. Assim, para cada valor de x
i
(0, 1, 2 ou 3
faces com um ponto) o nmero total de casos possveis ser 1, 3, 3 e 1,
respectivamente (Fig. 11 e Tab. 5).
Em cada uma das provas aleatrias sucessivas do exemplo anterior, a
probabilidade de sair uma face com um ponto (um sucesso) igual a
P(X=x
i
)=
1
/
6
, sendo que a Prob{outras faces}=1-
1
/
6
=
5
/
6
(T. complementaridade).
Ento a probabilidade de se realizar o acontecimento 101, por exemplo,
p(q)p=
1
/
6
(
5
/
6
)
1
/
6
=
5
/
216
(T. multiplicao). Contudo, nem todas situaes permitem
esquematizar e contabilizar todos os casos possveis! Podemos utilizar tcnicas
matemticas para calcular aquelas quantidades combinaes. Ou seja, para um
dado valor X o nmero de combinaes possveis em n provas aleatrias
sucessivas dado por
n
x
C . Assim, podemos calcular P(X=x
i
) para cada um dos
resultados possveis atravs da funo densidade de probabilidades binomial (cf.
Tab. 5).

Fig. 11 Representao esquemtica
dos possveis resultados favorveis
(face com uma pinta) no
lanamento simultneo de trs dados
no-viciados. No entanto, nos casos
em que x
i
=1 e x
i
=2 no esto
representados todas as situaes
possveis, pois no?
Mtodos Estatsticos Engenharia Alimentar 30
Eduardo Esteves, 2007
A FUNO DISTRIBUIO DE PROBABILIDADES P(Xx
i
) duma v.a. com distribuio binomial
obtm-se somando as probabilidades de cada um dos resultados de X x
i
. Existem tabelas
com as probabilidades para determinados valores de n e x que facilitam a resoluo de
problemas envolvendo esta distribuio terica.

Tab. 5 Casos possveis no exemplo anterior (cf. Fig. 11). Probabilidades calculadas por aproximao
e recorrendo funo densidade de probabilidades da distribuio binomial P(X=x
i
).
x
i
Casos (acontecimentos) possveis Por aproximao P(X=x
i
)
0 000 1(5/6)(5/6)(5/6) 0,5787
1 100 010 001 3(1/6)(5/6)(5/6) 0,3472
2 110 101 011 3(1/6)(1/6)(5/6) 0,0694
3 111 1(1/6)(1/6)(1/6) 0,0046

Na distribuio binomial, tambm podemos calcular o valor mdio e a varincia da
distribuio de probabilidades para descrever teoricamente a sua localizao e forma. O
VALOR MDIO da distribuio binomial dado por:
p n X E = } {
em que p a probabilidade de ocorrer o resultado favorvel (sucesso) em cada prova
aleatria e n o nmero provas aleatrias (independentes) realizadas (ou a realizar).
possvel provar a validade desta formulao recorrendo ao exemplo anterior.

Considere-se que o valor mdio da distribuio de probabilidades duma v.a.
discreta dado por [ ]

= = ) ( } {
i i
x X P x X E , logo para o caso descrito
no exemplo anterior, E{X}=0(0,5787)+1(0,0694)+2(0,0694)+3(0,0046)=0,5,
o mesmo que E{X}=np=3(
1
/
6
)=0,5.

A VARINCIA da distribuio binomial pode calcular-se atravs de:
) 1 ( } { p p n X V =
Como se provou para E{X}, tambm possvel provar a aplicao desta formulao para
calcular a varincia da distribuio binomial. Tente demonstrar esta afirmao! A distribuio
binomial desviada para a esquerda quando p<0,5, simtrica quando p=0,5 e desviada
para a direita quando p>0,5 (Fig. 12).

0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0 1 2 3 4 5 6
xi
P
(
X
=
x
i
)
p=0,25 p=0,5 p=0,75

Fig. 12 Modificao da
forma da funo de densidade
de probabilidades da
distribuio binomial com a
alterao de p.Varivel
aleatria X com resultados
possveis x
i
=1,2, , 6.
Mtodos Estatsticos Engenharia Alimentar 31
Eduardo Esteves, 2007
DISTRIBUIO DE POISSON
A distribuio de Poisson (devida a Simon Poisson [1781-1840]) pode entender-se como um
caso particular da distribuio binomial e aplica-se nas situaes em que a probabilidade p de
ocorrer determinado evento muito pequena ou quando n bastante grande (em estatstica
n>30 considerado como grande!)
3
ou seja, quando estamos a estudar acontecimentos
raros. A designao distribuio dos acontecimentos raros, utilizada por alguns autores,
advm das primeiras aplicaes, do prncipio do sc. XX e devidas a von Bortkiewicz. Aquele
matemtico utilizou a distribuio de Poisson para descrever o nmero anual de mortos por
coice de cavalo nos regimentos Prussianos de cavalaria.

A FUNO DENSIDADE DE PROBABILIDADE da distribuio de Poisson dada por:


= = e
x
x X P
i
x
i
i
!
) (
em que p n = ( l-se lambda), > 0 e x
i
=0, 1, ..., n (Fig. 13). Alguns autores referem-
se a como valor mdio da v.a. X, que representada por X Poisson(). Como no caso da
distribuio binomial, a funo distribuio de probabilidades (PXx
i
) obtm-se por adio
das probabilidades dos resultados de X x
i
.
O VALOR MDIO e a VARINCIA da distribuio de Poisson tm valor igual, ou seja,
} { } { X V p n X E = = =
Note-se que o valor mdio e a varincia so iguais. Esta uma propriedade muito interessante
da distribuio de Poisson, se se atender s condies iniciais, n e p0. Para um dado
valore de , possvel consultar tabelas de probabilidades para a funo densidade de
probabilidades da distribuio de Poisson (tabelas com x linhas e colunas) e obter a
probabilidade pretendida.

0
0,05
0,1
0,15
0,2
0,25
0 1 2 3 4 5 6 7 8 9
X
P
(
X
=
x
i
)

(a)
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2 3 4 5 6 7 8 9
Y
P
(
Y
=
y
i
)
(b)
Fig. 13 Funes densidade de probabilidade de v.a. X e Y com distribuio de Poisson com (a) =3
(ver exemplo anterior) ou (b) =0,5, em que x
i
=0, 1, 2, , 9 e y
i
=0, 1, 2, , 9.


3
Alguns autores referem n>20 e np<7, ou ento n>50 e np<5, como condies adequadas para a utilizao da
distribuio de Poisson.
Mtodos Estatsticos Engenharia Alimentar 32
Eduardo Esteves, 2007
O exemplo seguinte facilita a compreenso e sugere a utilidade desta distribuio terica.

Uma fbrica de conservas produz, continua e cadenciadamente, cerca de 2330
latas de sardinha em molho de tomate por periodo de 8 horas de laborao e em
mdia cerca de 7 latas so defeituosas. Qual a probabilidade de encontrarmos 3
latas defeituosas num lote de n=1000 latas adquiridas quela fbrica?
Pode-se obter p = 7/2330 = 0,003 e = n p = 1000(0,003) = 3. Portanto a
probabilidade de trs latas defeituosas num lote de 1000 latas

3
3
3
( 3) 0.2240
! 3!
x
P X e e
x


= = = =
Para calcular a probabilidade de ocorrerem at duas latas defeituosas nesse lote de
1000 latas, determina-se P(X2) = P(X=0) + P(X=1) + P(X=2).

[Resolver Exerccios Captulo III]
DISTRIBUIES DE PROBABILIDADES DE VARIVEIS CONTNUAS
Em muitos problemas, torna-se necessrio ou matematicamente mais simples considerar um
espao amostral para uma varivel aleatria X, no qual todos os nmeros reais possveis (num
intervalo especificado ou conjunto de intervalos) possam ser considerados como resultados
possveis. Da ser necessrio utilizar variveis aleatrias contnuas.
Em contraste com as v.a. discretas, diz-se que uma v.a. X contnua quando: (i) o seu valor
numrico x
i
determinado pelo resultado de uma prova aleatria; e (ii) x
i
(conjunto dos
nmeros reais), ou seja, x
i
pode tomar qualquer um dos infinitos (ou no-enumerveis) valores
num certo intervalo em .

Exemplo 1. O consumo anual de energia elctrica para fins industriais, numa
determinada regio (em 10
9
kW), v.a. W, uma v.a. contnua.
Exemplo 2. O tempo de prateleira (em dias) de determinado produto alimentar,
v.a. T, tambm uma v.a. contnua.

No caso das v.a. contnuas, a densidade de probabilidades est continuamente dispersa pelo
espao amostral S ao invs de se concentrar num conjunto discreto de resultados como
acontece com as v.a. discretas (Fig. 14). Enquanto no caso de v.a. discretas a probabilidade do
espao amostral dividida pelos resultados possveis, nas v.a. contnuas aquela
probabilidade est amassada e distribuida pelos (no-enumerveis) resultados possveis x
i
.
Por esse motivo, a probabilidade da v.a. contnua X tomar um valor particular x
i
nula.
Contudo, um determinado acontecimento possvel (ou resultado) x
i
quase-impossvel mas
no impossvel pois em cada realizao da prova aleatria (ou experincia) obtm-se sempre
um resultado e, por conseguinte, possvel obter x
i
. Por outras palavras, dizer que a
probabilidade pontual sempre nula quer somente traduzir que nula a probabilidade de
acertar exactamente no resultado x
i
. Logo, no caso das v.a. contnuas, as probabilidades
estudam-se para intervalos de valores de X e no para valores exactos de X.
Se se dividir a probabilidade de X tomar um valor do intervalo [x; x+x] pela amplitude desse
intervalo x, obtm-se de forma aproximada a densidade de probabilidade da v.a. X tomar um
valor qualquer do intervalo [x;x+x], ou seja,
Mtodos Estatsticos Engenharia Alimentar 33
Eduardo Esteves, 2007
( )
( )
P x X x x
f x
x
< < +

.
v.a. discreta
X
P
(
X
=
x
i
)




v.a. contnua
X

f
(
x
)

Fig. 14 Ilustrao da relao entre distribuies de probabilidades de v.a. discretas e contnuas
(e.g. funo densidade de probabilidades f(x)).

Rigorosamente, para um intervalo infinitesimal dx de valores de X, a f.d.p. dada por:
Mtodos Estatsticos Engenharia Alimentar 34
Eduardo Esteves, 2007
0
( ) ( )
( ) lim
x
P x X x x dP x X x x
f x
x dx

< < + < < +
= =


ou seja, a FUNO DENSIDADE DE PROBABILIDADE de uma v.a. contnua, designada por f(x)
em vez de P(X=x
i
), genericamente uma funo matemtica para a qual a rea limitada pela
curva y=f(x), pelo eixo das abcissas e pelas rectas Y=x e Y=x+x igual probabilidade da
v.a. contnua X assumir um valor do intervalo infinitesimal [x, x+x] (Fig. 15a).
Podemos re-escrever a equao anterior na forma de:
dx x f x x X x dP ) ( ) ( = + < <
A probabilidade pretendida (graficamente corresponde rea mencionada acima e
representada na Fig. 15) pode ser obtida por integrao de f(x)
4
:

+
= + < <
x x
x
dx x f x x X x P ) ( ) (
Um modo de calcular a probabilidade de X tomar um valor do intervalo [x, x+x] resolver o
integral por primitivao, isto :
) ( ) ( ) ( ) ( x F x x F dx x f x x X x P
x x
x
+ = = + < <

+

em que F(x+x) e F(x) constituem as solues da primitiva de f(x) para os limites do
intervalo considerado.

Introduz-se, assim, a FUNO DISTRIBUIO DE PROBABILIDADES, que se designa F(x) em
vez de P(Xx
i
), e que corresponde probabilidade da v.a. contnua X tomar um valor igual ou
inferior a x
i
e, portanto, corresponde rea sob a curva y=f(x) esquerda de x
i
(Fig. 15b).
Genericamente,


= =
x
i
du u f x X P x F ) ( ) ( ) (
(note-se que o limite superior de integrao x, pelo que h que considerar uma varivel de
integrao distinta de x, no caso a varivel u).
Enquanto no caso discreto, a funo distribuio de probabilidades era obtida somando
P(X=x
i
), em domnios contnuos aquela funo calculada por integrao da funo
densidade de probabilidades (Fig. 15).

A f.d.p. duma v.a. contnua T, que representa o tempo de funcionamento sem
avarias (expresso em dias) dum determinado equipamento, dada por

0 Se
0 Se
0,5e
0
) (
0,5t -

<

t
t
t f
Qual a probabilidade desse equipamento funcionar sem avarias por um
periodo de 1 a 3 dias?
[ ] 3834 , 0 5 , 0 ) ( ) 3 1 (
3
1
5 , 1 5 , 0
3
1
5 , 0 5 , 0
3
1
= = = = = < <


e e e dt e dt t f X P
t t

A funo distribuio pode ser obtida directamente por integrao de f(x), ou
seja:

4
O integral

um objecto matemtico que se pode interpretar como uma rea, ou uma generalizao de uma
rea. Juntamente com as derivadas so os objectos fundamentais do Clculo.
Mtodos Estatsticos Engenharia Alimentar 35
Eduardo Esteves, 2007
[ ]
0 Se
0 Se
1 5 , 0 0,5e
0
) (
5 , 0
0 0
5 , 0 0,5t -

<

= =

t
t
e e du
t F
t
t
t
t


Neste contexto, possvel relacionar as funes densidade e distribuio de probabilidades de
v.a. contnuas,
) (
) (
x f
dx
x dF
= , ou ento, ) ( ) ( x f x F =
em que F(x) a derivada de F(x). Desta relao resultam algumas concluses importantes:
1) f(x) 0 (equao no-negativa) e 0 F(x) 1 (funo montona crescente e contnua)
2)

+

=1 ) ( dx x f (a rea ou probabilidade total igual a 1)
3)

+
+ < < = + =
x x
x
x x X x P x F x x F dx x f ) ( ) ( ) ( ) (
4) P(X=x) = P(X=x+x) = 0

(a)
X
f
(
x
)
Probabilidade = rea
x x+dx

(b)
X
F
(
x
)
x x+dx
F(x+dx)
F(x)
Probabilidade

Fig. 15 Representao grfica (a) duma funo densidade de probabilidades f(x). A rea assinalada
sob curva y = 12x(1 x)
2
, acima dos eixo das abcissas e entre as semi-rectas verticais Y=x e Y=x+dx
corresponde probabilidade da v.a. contnua X assumir um valor do intervalo e (b) da respectiva
funo distribuio de probabilidades F(x)=6x
2
8x
3
+3x
4
.
Mtodos Estatsticos Engenharia Alimentar 36
Eduardo Esteves, 2007
Como no caso das variveis aleatrias discretas, possvel caracterizar resumidamente a
distribuio de probabilidades recorrendo aos conceitos de valor mdio e varincia das
probabilidades. Assim, para uma v.a. contnua X o VALOR MDIO dado por

+

= dx x f x X E ) ( } {
e a VARINCIA por

+

= dx x f X E x X V ) ( }) { ( } {
2

Do ponto de vista formal, a passagem do caso discreto para o caso contnuo (ou vice-versa)
faz-se por dualidade, substituindo-se os somatrios

por integrais

e as probabilidades
P(x) por densidades f(x). Atente-se que no caso contnuo P(X=x
i
)=0 para todo o real x
i
e,
portanto, o que se calcula recorrendo a f(x) a rea correspondente ao intervalo [x, x+x] a
probabilidade mdia nessa poro do continuum.
importante, como se fez no caso das probabilidades de v.a. discretas, estudar algumas
distribuies de probabilidades tericas de utilizao muito generalizada.
DISTRIBUIO NORMAL
Entre as distribuies tericas de probabilidades de variveis aleatrias contnuas destaca-se a
distribuio normal, ou curva normal, ou curva de Gauss (em homenagem a Carl Friedrich
Gauss [1777-1855] que foi pioneiro na sua utilizao, apesar da distribuio se dever a
Abraham de Moivre [1667-1754] que a desenvolveu em 1733 como aproximao binomial).
Curiosamente, verifica-se que em muitas situaes amostrais, a distribuio das variveis
aleatrias contnuas parece concentrar-se perto da mdia e dispersar-se, diminuindo, em
direco aos extremos, de acordo com esta distribuio terica. Por outro lado, a distribuio
normal de manipulao matemtica fcil, o que tem contribuido para o nmero aprecivel
de testes estatsticos dela derivados.
A Fig. 16 ilustra uma curva normal (funo densidade de probabilidades) em forma de sino.
Contudo, nem todas as curvas em forma de sino so curvas normais, mas a curva normal
FUNO DENSIDADE DE PROBABILIDADES DA DISTRIBUIO NORMAL definida pela
seguinte expresso:
[ ]
2
2 ) (
2
1
) (



=
x
e x f
com os parmetros e e em que -<x<+, -<<+, >0, = 3,141659... e e a funo
exponencial. Para indicar que a v.a. contnua X tem distribuio normal usa-se X N (,).
Dado que a funo densidade de probabilidades f(x) da distribuio normal tem dois
parmetros, mdia e desvio-padro , cada par de valores de e origina uma curva com
forma diferente. Contudo, f(x) da distribuio normal sempre simtrica, em forma de sino,
centrada em (que determina a posio da distribuio no eixo das abcissas que corresponde
ao universo de valores de X), e dispersa relativamente a de acordo com o desvio-padro
(Fig. 17).
No caso da distribuio normal, tambm se pode resumir a informao acerca das
probabilidades recorrendo a medidas de localizao e disperso, j referidas anteriormente
VALOR MDIO E{X} e VARINCIA V{X} da distribuio de probabilidades:
= =

+

dx x f x X E ) ( } {
Mtodos Estatsticos Engenharia Alimentar 37
Eduardo Esteves, 2007
2 2
) ( }) { ( } { = =

+

dx x f X E x X V

X
f
(
x
)


Fig. 16 Representao esquemtica da funo densidade de probabilidade da distribuio normal
f(x), com parmetros e , de uma varavel aleatria contnua. A curva est centrada em e a sua
forma (est relacionada com) depende de .

0 10 20 30 40 50
X
f
(
x
)
=12, =3
=15, =3
=15, =6
(a)
(b)
(c)

Fig. 17 Comparao entre a forma de trs curvas normais (funes densidade de probabilidades)
com diferentes parmetros e . As curvas (a) e (b) com mdia diferente mas com desvio-padro
igual. Pelo contrrio, as curvas (b) e (c) possuem igual mdia mas diferente desvio-padro .

Existem algumas caractersticas com importncia nas funes densidade e distribuio de
probabilidades de variveis normais, designadamente aqueles representados na Fig. 18
(pgina seguinte). A mdia corresponde mediana (quantil de 50%). Verifica-se, anda, que
os intervalos +, +2 e +3 incluem, respectivamente, 68.27%, 95,45% e 99,73% das
possveis observaes da varivel contnua normal. Por outras palavras, a probabilidade da
v.a. contnua X tomar um valor desses intervalos 0,6827, 0,9545 e 0,9973 respectivamente.

Mtodos Estatsticos Engenharia Alimentar 38
Eduardo Esteves, 2007

Fig. 18 Alguns pontos importantes das funes densidade e distribuio de probabilidades da
distribuio normal (adaptada de Sokal & Rohlf).
DISTRIBUIO NORMAL REDUZIDA
O clculo da rea sob a curva normal para determinado intervalo da varivel aleatria
contnua, que se efectua por integrao da funo densidade para os valores de e de
pretendidos, seria um trabalho um pouco fastidioso e, infelizmente, no possvel tabelar
todas as combinaes possveis de e . Como resolver este problema?
Um modo de padronizar os resultados recorrer transformao da varivel aleatria X numa
nova varivel Z com mdia igual a 0 e desvio-padro igual a 1, ou seja, Z N (0,1). Deste
modo, se define a DISTRIBUIO NORMAL REDUZIDA Z transformando a v.a. X N (,), da
seguinte forma:
X
Z

=
Esta transformao permite reduzir (ou sintetizar ou padronizar) qualquer distribuio
normal desde que se conheam e daquelas distribuies (Fig. 19). A tabulao da
distribuio de probabilidades de Z, comum em qualquer manual de estatstica, permite obter
com facilidade P(Xx
i
) para qualquer v.a. X N (,). Basta calcular z
i
e, posteriormente,
consultar a tabela de Z (que geralmente apresenta a funo distribuio de probabilidades ou
probabilidades acumuladas) para o valor obtido (ver Tabela A). Por outro lado, a maoria
das calculadoras cientficas e do software (folhas de clculo) permite obter com facilidade a
probabilidade de Z z
i
.
Mtodos Estatsticos Engenharia Alimentar 39
Eduardo Esteves, 2007
0 4 8 12 16 20 24 28 32 36 40
X
f
(
x
)
=20, =3
-2 +2 0
Z

Fig. 19 Ilustrao da relao entre a distribuio dos resultados possveis x
i
da v.a. contnua X e os
valores de Z correspondentes. Tente determinar os valores x
i
correspondentes a z
i
= 2 e +2.

A variao diria da temperatura de determinada cmara de refrigerao pode ser
razoavelmente aproximada por uma distribuio normal com mdia de 0,2% e
desvio-padro de 1,6%. a) Qual a probabilidade da variao da temperatura
ultrapassar 1%? b) E qual a probabilidade dessa variao se situar entre 1% e
1,4%?
a) 3085 , 0 ) 1915 , 0 5 , 0 ( 1 ) 5 , 0 ( 1 ) 5 , 0 ( %) 1 ( = + = < = > = > Z P Z P X P porque,
de acordo com a transformao de X em Z, obtm-se que
5 , 0
% 6 , 1
% 2 , 0 % 1
=

X
i
z e da Tabela A pode-se obter P(Z<z
i
).
b)
0819 , 0 1915 , 0 2734 , 0 ) 5 , 0 ( ) 75 , 0 ( ) 75 , 0 5 , 0 ( %) 4 , 1 % 1 ( = = < < = < < = < < Z P Z P Z P X P
uma vez que 5 , 0
% 6 , 1
% 2 , 0 % 1
=

X
i
z e 75 , 0
% 6 , 1
% 4 , 1 % 1
=

X
i
z .
Novamente, as respectivas probabilidades podem obter-se da Tabela A.

Observe-se com maior ateno a equao associada a esta transformao. Se re-arranjarmos
os termos daquela expresso, teremos que:
Z X + =
ou seja, uma equao da recta do tipo bx + a = y. possvel demonstrar matematicamente
que qualquer funo linear de uma varivel aleatria com distribuio normal , tambm, uma
v.a. com distribuio normal, isto Z N (0,1).
DISTRIBUIO T DE STUDENT
At agora, consideraram-se como conhecidos os parmetros da distribuio normal e ,
claramente relacionados com a populao, ou universo estatstico. Na realidade, raramente se
conhece ou (ou ambos), ou, ento, no possvel recolher tantos dados que permitam
assumir que as estatsticas da amostra (mdia x e desvio-padro s) sejam estimadores
Mtodos Estatsticos Engenharia Alimentar 40
Eduardo Esteves, 2007
correctos dos parmetros da populao, pois geralmente o tamanho da amostra muito
reduzido comparativamente dimenso da populao em estudo. Amostras de tamanho n<30
podem considerar-se como pequenas amostras.
A divulgao da DISTRIBUIO t DE STUDENT, pelo ingls William Gosset [1876-1937] em
1908 (que utilizou o pseudnimo Student para publicar os seus trabalhos), como alternativa a
Z, constituiu um dos maiores avanos nas metodologias estatsticas.
Aquele autor, props a transformao da v.a. contnua X na varivel t da seguinte forma:
s
x X
t

=
em que s o desvio-padro da amostra e se calcula pela expresso ) 1 ( ) (
2
=

n x x s
i
.
A distribuio de t depende dum nico parmetro, o nmero de GRAUS DE LIBERDADE (l-se
ni), com = n 1. Como se prova para Z, tambm a varivel aleatria t se distribui
normalmente, ou seja t N (). A cada valor de , corresponde uma curva diferente dentro
da famlia das distribuies t de Student (Fig. 20).
O procedimento para se obter t e consultar a respectiva tabela de probabilidades idntico ao
descrito para Z, considerando-se, neste caso, = n 1 graus de liberdade da amostra (ver
Tabela B).

t
f
(
x
)
g.l.=80
g.l.=4

Fig. 20 Representao de duas distribuies t de Student para diferentes graus de liberdade (g.l.).

Exemplo 1. A v.a. V segue distribuio de t com 7 g.l. a) Determine o valor
v
0
, tal que P(V>v
0
)=1%; b) Qual a P(0,711<V<2,998)?
a) v
0
=2,998 (obtm-se directamente da tabela para p = 0,99); b) Uma vez que
P(V<2,998)=0,99 e P(V<-0,711)=P(V>0,711)=0,25, ento a probabilidade
pretendida P=0,99 0,25=0,74.
Exemplo 2. O tempo (em minutos) que um grupo de operrios leva a
executar determinada tarefa, v.a. X, tem distribuio normal. Numa semana
de trabalho seleccionada aleatoriamente, realizaram-se 12 medies daquela
varivel e o tempo mdio foi de 107 min com um desvio-padro de 23 min.
Qual o tempo que levam a executar a dita tarefa 90% dos operrios?
Mtodos Estatsticos Engenharia Alimentar 41
Eduardo Esteves, 2007
Uma vez que P(t<t
0
)=90% logo da tabela vem que t
0
=1,363. Como
. min 4 , 138 23 ) 107 ( 363 , 1 ) ( = = =
i
x
i
x s x X t
[Resolver Exerccios Captulo IV]
7. INFERNCIA ESTATSTICA
Um dos objectivos principais da anlise estatstica derivar (ou inferir) concluses vlidas
acerca de uma populao atravs do exame de amostra(s) dessa populao. A inferncia
estatstica pretende responder a dois tipos de questes:
1) Qual o valor de um certo parmetro da populao? (ESTIMAO DE PARMETROS, ver a
seguir)
2) Pode considerar-se que um dado parmetro da populao tem determinado valor? (PROVA,
OU TESTE, DE HIPTESES, ver mais adiante).

Exemplos de 1) Qual a altura mdia dos alunos da EST? Qual o peso
lquido de iogurte nas embalagens produzidas em determinada fbrica?
Exemplos de 2) Ser que a mdia das alturas dos alunos da EST 183 cm?
Ser que as embalagens de iogurte tm um peso lquido de 125 mL?
AMOSTRAGEM ALEATRIA
Recorde-se a representao esquemtica das componentes da anlise estatstica da Fig. 1. At
este captulo, abordaram-se os conceitos bsicos, alguns fundamentos da Teoria das
probabilidades e algumas distribuies de probabilidades tericas. Neste captulo sero
consideradas questes relacionadas com a seleco de amostras e com o estudo da mdia da
amostra, geralmente a estatstica de maior interesse para a maoria dos estudos, como base
para a inferncia estatstica.
A Amostragem , por si s, um vasto campo de investigao em estatstica e continua a ser,
ainda nos dias de hoje, um assunto muito importante e polmico, sobre o qual se produzem
muitos ensaios. Por isso, e porque no propsito deste curso estudar apenas esse assunto,
sero abordados os conceitos e procedimentos mais simples. Outros aspectos, mais complexos
e que derivam dos que aqui se apresentam, podem ser necessrios para um estudo particular e
encontram-se explicados noutros manuais.
Define-se AMOSTRAGEM como o conjunto de todas as amostras, de um certo tamanho n,
possveis de seleccionar com um determinado critrio de uma populao. Tambm se utiliza o
termo amostragem como sinnimo do critrio com que as amostras so seleccionadas ou,
ainda, para indicar o procedimento prtico de recolha dos dados. O seu significado fica,
assim, dependente do contexto em que utilizado.
O tipo de amostragem mais simples a AMOSTRAGEM ALEATRIA SIMPLES (a.a.s.) que d
igual probabilidade de ser seleccionado a qualquer um dos resultados (ou das amostras)
possveis. Poderemos amostrar aleatoriamente, isto ao acaso, populaes finitas ou
infinitas (cujo significado bvio!).
Populaes finitas
Quando se pretendem estudar populaes finitas, a amostragem aleatria simples pode ser
Mtodos Estatsticos Engenharia Alimentar 42
Eduardo Esteves, 2007
feita:
a) COM REPOSIO se cada elemento da populao pode ser escolhido mais de uma vez,
isto , aps recolher informao (medir ou categorizar a varivel em estudo) numa
amostra, o elemento devolvido populao. Na amostragem a.s. com reposio, cada
elemento de uma populao com N elementos tem sempre uma probabilidade p =
1
/
N
de
ser seleccionado. Note-se que, a amostragem com reposio duma populao finita pode
considerar-se teoricamente como infinita.
b) SEM REPOSIO se cada elemento da populao no pode ser escolhido mais de uma
vez. Nestes casos, o procedimento de amostragem o seguinte: seleccionar o primeiro
elemento da amostra dando a cada elemento da populao igual probabilidade de ser
escolhido, ou seja, p =
1
/
N
; seleccionar o segundo elemento da amostra, considerando que
os N 1 elementos restantes possuem igual probabilidade de serem escolhidos, ou seja, a
p =
1
/
(N 1)
; repetir o processo at os N elementos da populao serem seleccionados.

Em qualquer dos casos, a seleco dos elementos da amostra pode ser auxiliada pela
utilizao de uma tabela de nmeros aleatrios (Tabela C, em anexo). Para cada posio na
tabela, os dgitos 0, 1,..., 9 tm igual probabilidade de ocorrerem e as vrias posies na tabela
so independentes.
Populaes infinitas
Nestas populaes, no possvel estabelecer um mecanismo semelhante ao descrito
anteriormente para populaes finitas. Assim, ter de se pressupr (ou verificar) que os n
resultados possveis x
1
, x
2
,..., x
n
gerados por um processo (ou prova aleatria, ou experincia),
constituem uma amostra aleatria quando:

1) Os valores pertencem mesma distribuio de probabilidades; e
2) Os valores so estatisticamente independentes.

Numa determinada linha de produo, a funcionar continuamente, cada
elemento seleccionado tem de ter a mesma probabilidade de ser defeituoso (1
condio). O facto de um elemento seleccionado ser defeituoso no depende, nem
implica, que os outros o sejam (2 condio).
DISTRIBUIO DA MDIA NA AMOSTRAGEM
As questes relacionadas com a amostragem tm muita importncia, pois garantem a validade
das concluses que se pretendem elaborar em estatstica. Na maoria das situaes reais no
possvel estudar toda a populao estatstica, pelo que necessrio seleccionar amostra(s) e
analisar caractersticas dessas amostra(s) de modo a dizer coisas acerca da populao. De
entre as caractersticas da amostra(s), a mdia da amostra x de utilizao generalizada e
constitui um dado importante na prtica estatstica. Assim, possvel e importante estudar a
distribuio (de probabilidades) da mdia na amostragem.
Observe-se com ateno a Fig. 21. A partir de uma populao estatstica com N=8042
elementos, seleccionaram-se aleatoriamente amostras de n=3, n=10 e n=100 elementos e para
cada amostra calculou-se a mdia amostral x . Os polgonos de frequncias absolutas dos
resultados obtidos (a mdia x para cada amostra seleccionada) indicam que:
Mtodos Estatsticos Engenharia Alimentar 43
Eduardo Esteves, 2007
a) O valor mdio da distribuio dos valores de x das amostras aleatrias igual mdia da
populao ;
b) O desvio-padro da distribuio dos valores de x decresce com o aumento do tamanho
amostra;
c) A distribuio dos valores de x vai ficando cada vez mais simtrica medida que o
tamanho da amostra aumenta; este ltimo resultado conhecido como TEOREMA DO
LIMITE CENTRAL (de que falaremos mais adiante).

X
F
N=8042

=30,3

=30,33
X
F
n=3
E{X}=30,3
{X}=17,80

X
F
n=10
E{X}=30,3
{X}=9,13

X
F
n=100
E{X}=30,3
{X}=3,05

Fig. 21 Distribuio na amostragem de x nas amostras possveis de tamanho n=3, n=10 e n=100 que
se podem obter duma populao "original" com N=8042 elementos.
TEORIA SOBRE A DISTRIBUIO DE PROBABILIDADES DA MDIA NA AMOSTRAGEM
Se a seleco de uma amostra fr aleatria, ento a mdia x da amostra resultado duma
varivel aleatria qual est associada uma distribuio de probabilidades. Pode-se, portanto,
recorrer ao valor mdio e varincia para descrever resumidamente aquela distribuio de
probabilidades.
Assim, qualquer que seja o tamanho da amostra n, o valor mdio da distribuio de
probabilidades de x dado por:
= } {X E
e a varincia igual a:
Mtodos Estatsticos Engenharia Alimentar 44
Eduardo Esteves, 2007
n
X V
2
} {

=
O desvio-padro das probabilidades de x , que se designa erro-padro da mdia (usualmente o
desvio-padro dum estimador de um parmetro, i.e. duma estatstica, denomina-se erro-
padro) igual a:
{ } { } X X
n

= =
Por maioria de razo, para um certo tamanho de amostra n, quanto maior a variabilidade da
populao maior a variabilidade da distribuio das mdias na amostragem.
Teorema do limite central
Para a maioria das populaes estatsticas, a distribuio de x na amostragem (isto , o
conjunto das mdias das amostras seleccionadas aleatoriamente) aproximadamente normal
quando o tamanho da amostra n suficientemente grande, ou seja, a distribuio de x na
amostragem assintoticamente normal. Quando a distribuio da varivel aleatria X na
populao normal, a distribuio de x na amostragem sempre normal, qualquer que seja o
tamanho da amostra n.
ESTIMAO DA MDIA DA POPULAO
Um problema importante da inferncia estatstica a estimao de parmetros, tais como a
mdia ou varincia populacionais, deduzidos da estatstica amostral correspondente, isto , da
mdia e da varincia amostrais. Vamos abordar aqui o caso da mdia:

Qual a altura mdia dos alunos da EST? Qual o peso lquido de iogurte
nas embalagens produzidas em determinada fbrica?
Estimao pontual
Quando uma caracterstica da populao estimada por um simples valor, este designado
por ESTIMATIVA PONTUAL. Dito de outro modo: o ESTIMADOR uma varivel aleatria usada
para estimar uma caracterstica da populao. O valor numrico do estimador designa-se por
ESTIMATIVA.

Por exemplo, dizer que a mdia de alturas dos alunos do curso de
Engenharia Alimentar 170 cm recorrer a um estimador (a mdia) e
avanar com uma estimativa pontual (da mdia; no caso, 170 cm, que se
obteve duma amostra aleatria representativa).

A mdia da amostra x um estimador sem-vcio (ou no-enviesado) da mdia da populao
, porque o valor mdio da distribuio de probabilidades x igual a :
= } {X E
Mtodos Estatsticos Engenharia Alimentar 45
Eduardo Esteves, 2007
Prova-se, anda, que a varincia da amostra s
2
(calculada com denominador igual a n 1)
tambm um estimador sem-vcio da varincia da populao
2
porque:
2 2
} { = s E
isto se a amostra fr obtida de uma populao infinita ou, ento, de uma populao finita mas
com reposio. usual designar os estimadores sem-vcio por ESTATSTICAS.
Estimao por intervalos de confiana
Nos casos em que a distribuio de x na amostragem normal, pode-se esperar que a mdia
da populao se encontre nos intervalos x + , x + 2 e x + 3, aproximadamente em
68,27%, 95,45% e 99,73% das vezes, respectivamente (cf. Fig. 18). Por esse motivo, estes
intervalos so denominados INTERVALOS DE CONFIANA de 68,27%, 95,45% e 99,73% (para
avaliao) de . Os nmeros extremos desses intervalos so denominados LIMITES DE
CONFIANA. De modo semelhante, x + 1,96 e x + 2,58 so limites de confiana de 95% e
99% de . A percentagem de confiana c frequentemente denominada NVEL DE
CONFIANA e a probabilidade complementar ( l-se alfa) designada por NVEL DE
SIGNIFICNCIA ou risco
5
sendo que c=1. Os nmeros 1,96 e 2,58 nos limites de
confiana referidos acima so denominados COEFICIENTES DE CONFIANA ou VALORES
CRTICOS. Quando a distribuio de x na amostragem normal, possvel calcular a
probabilidade da mdia populacional ocorrer entre dois valores da distribuio, recorrendo
transformao associada com a DISTRIBUIO NORMAL REDUZIDA , Z.
Conhecendo-se a variabilidade populacional e aplicando a transformao Z mdia na
Amostragem, ou seja,
X
Z
n

=
| |
|
\

teremos, ento, que a probabilidade da mdia da populao assumir valores entre z e +z
ser genericamente:
c z
n
x
z P = + <
|
|

\
|

< } {


ou seja, o mesmo que
c
n
z x
n
z x P = + < < } {


em que c indica o nvel de confiana e c = 1 .
Esta ltima expresso de probabilidade (ou afirmao probabilstica) deve ser interpretada
cuidadosamente! No significa que a probabilidade do parmetro estar incluido no intervalo
especificado c! A mdia populacional um parmetro (e no uma v.a.), e portanto, est ou
no dentro daquele intervalo. A expresso deve ser interpretada do seguinte modo: c a
probabilidade do intervalo especificado conter .
O intervalo [ ) ( ); ( n z x n z x + ] designado por INTERVALO DE CONFIANA de . O

5
vulgar usar propores em vez de percentagens nas indicaes e clculos. Logo 95% de confiana indica-se
por c = 0,95 e um nvel de significncia de 5% designa-se = 0,05.
Mtodos Estatsticos Engenharia Alimentar 46
Eduardo Esteves, 2007
valor de Z arbitrrio, isto , pode ser escolhido (da Tabela A, em anexo) de modo que a
probabilidade (ou confiana) pretendida seja igual a 1. Assim, para cada um dos limites de
confiana, Z ficar definido para 1

/
2
(ou seja, metade de em cada extremo da
distribuio) (cf. Fig. 18 e Fig. 19). Duma forma geral, a probabilidade do intervalo de (1
)100% de confiana de com nvel de confiana de 1 , dada por:


= + < <
(


1 } {
2
1
2
1
n
z x
n
z x P

Suponha-se que a v.a. X representa a durao de vida de cpsulas
metlicas de garrafas de refrigerante. Admita-se que a durao de vida
mdia das cpsulas =5,0 anos, com desvio-padro =0,40 anos. O
intervalo de confiana de 95% de numa amostra 10 cpsulas ser dado
por 95 , 0 }
10
40 , 0
96 , 1 0 , 5
10
40 , 0
96 , 1 0 , 5 { = + < < P em que z
[0.,975]
=1,96 se
obtm da tabela de Z (Tabela A, anexa). Logo, o intervalo ser [4,75 a;
5,25 a].

E se o desvio-padro da populao no conhecido, como alis acontece em muitos casos?
Relembre-se que o valor mdio de s
2
igual varincia populacional
2
, quando s calculado
com n 1 graus de liberdade. Ento pode-se utilizar n s como estimador sem-vcio de
n . Recorde-se, anda, a utilidade da transformao de t para = n 1 graus de liberdade,
quando no se conhece o desvio-padro , ou seja:
x
t
s
n

=
| |
|
\

Assim, a probabilidade de determinado intervalo de confiana da mdia da populao
dada por:

= + < <
(


1 } {
2
1 ,
2
1 ,
n
s
t x
n
s
t x P
De modo similar a z, o valor de t obtido da tabela apropriada para = n 1 graus de
liberdade e probabilidade igual a 1

/
2
(ver Tabela B, anexa).

So realizadas dez medies da resistncia de determinada embalagem
metlica para produtos alimentares (varivel aleatria X com distribuo
normal). Suponha-se que x =10,48 psi e que s=1,36 psi. O intervalo de
confiana da mdia com nvel de significncia de 90% dado por
90 , 0 }
10
36 , 1
83 , 1 48 , 10
10
36 , 1
83 , 1 48 , 10 { = + < < P em que t
(9;0,95)
=1,83 se
obtm da Tabela de t (Tabela B, anexa). O intervalo de confiana ser
[9,693;11,267] psi.

Os intervalos de confiana permitem fazer afirmaes probabilsticas acerca de parmetros da
populao com base em estatsticas amostrais. Com uma dada confiana, o intervalo de
Mtodos Estatsticos Engenharia Alimentar 47
Eduardo Esteves, 2007
confiana calculado dever conter o verdadeiro valor do parmetro populacional em
questo (neste caso, a mdia ).
[Resolver Exerccios Captulo V]
TESTE (OU PROVA) DE HIPTESES
A inferncia estatstica tambm pretende responder a questes do tipo: Pode considerar-se
que um dado parmetro da populao tem determinado valor?

Ser que a mdia das alturas dos alunos da EST 183 cm? Ser que, em mdia,
as embalagens de iogurte da marca W tm um peso lquido de 125 mL?

Como em qualquer procedimento cientfico, o mtodo cientfico (simplificado) pressupe a
definio prvia de hipteses, a sua experimentao (com base numa amostra) e a
elaborao de concluses. Em estatstica o processo no diferente.
Classicamente, os testes de hipteses podem ser resumidos em quatro fases: 1) Definio
das hipteses nula e alternativa; 2) Seleco e obteno de informao, de estatsticas, a partir
da(s) amostra(s) (nestes apontamentos, consideraremos unicamente a mdia da amostra, mas
poderia analisar-se o desvio-padro, etc.); 3) Determinao de valores-limite ou duma
estatstica de teste; e 4) Utilizao das regras de deciso e elaborao de concluses.
Definio das hipteses nula e alternativa
O primeiro passo de um teste de hipteses definir duas HIPTESES (OU CONCLUSES)
ALTERNATIVAS, mutuamente exclusivas, que se designam (geralmente) por H
0
e H
1
. Ou seja,
se a HIPTESE NULA H
0
verdadeira ento a HIPTESE ALTERNATIVA H
1
ser falsa e vice-
versa (alguns autores utilizam a notao H
A
para se referirem hiptese alternativa). No caso
de hipteses bilaterais, a hiptese H
0
contm o valor padro
0
em relao ao qual se faz o
teste (ver a seguir). A designao de hiptese nula est relacionada com o conceito de no
diferente de um valor-padro
0
. Por exemplo, H
0
pode referir-se mdia da populao
como igual (no diferente) de zero, isto , H
0
: = 0 e logo H
1
: 0. Quanto s hipteses
unilaterais, prtica comum definir na hiptese alternativa H
1
o resultado que se deseja
obter. Por exemplo, para testar se, em mdia, a presso em determinado equipamento
superior especificada, as hipteses nula e aternativa seriam H
0
:
0
e H
1
: >
0
,
respectivamente. Saliente-se que, classicamente, ambas as hipteses so definidas a priori.
Esta ser a regra seguida nestes apontamentos.
Definio de regras de deciso sobre que hiptese deve ser aceite
Se, por exemplo, o teste feito sobre a mdia da populao , podem elaborar-se trs tipos de
hipteses:
H
0
: =
0
e H
1
:
0
Hipteses bilaterais
H
0
:
0
e H
1
: >
0
H
0
:
0
e H
1
: <
0

} Hipteses unilaterais

Mtodos Estatsticos Engenharia Alimentar 48
Eduardo Esteves, 2007
Depois de definidas as hipteses nula e alternativa, possvel calcular o(s) limites(s) de
confiana em torno de
0
. Esse(s) valor(es) limitam reas ou regies, que se designam
regies de aceitao e de rejeio, e permitem decidir qual das hipteses concluir em face
da estatstica em estudo, neste caso a mdia da amostra x (Fig. 22, pg. seg.). Na prtica, se
x estiver entre o(s) limite(s) calculado(s) decide-se em favor da hiptese nula (ver adiante).
Caso contrrio, rejeita-se a hiptese nula. Alguns autores referem regio de no-rejeio em
vez de regio de aceitao, pois em estatstica no existem certezas e o resultado pode
variar consoante o nvel de confiana. Essa ser tambm a terminologia utilizada neste texto.
ERROS DE INFERNCIA
aconselhvel fazer aqui um parntesis no texto para se abordarem os erros estatsticos.
No se est isento de errar quando se infere estatisticamente, pois existe sempre risco de
elaborar uma concluso incorrecta quando recorremos a medida(s) da amostra para decidir
estatisticamente em favor duma das hipteses alternativas (relativas a um parmetro da
populao). De facto, teremos de considerar que uma hiptese nula verdadeira ser
ocasionalmente rejeitada. Este tipo de erro ser cometido com probabilidade (frequncia) ,
isto , se H
0
na realidade uma afirmao verdadeira acerca da populao estatstica, no caso
de =0,05, concluir-se- incorrectamente que falsa em 5% das afirmaes. Este erro
conhecido como erro do tipo I. Se, pelo contrrio, H
0
, de facto, falsa, um teste de hipteses
no detectar este resultado algumas vezes e dele se derivar uma concluso errada, no-
rejeitando H
0
, o que se designa por erro de tipo II. A probabilidade de cometer este tipo de
erro (l-se beta). A Tab. 6 resume estes conceitos.

Tab. 6 Resumo dos erros tipo I e II possveis de acontecer em inferncia estatstica.
Alternativas verdadeiras
Concluses tiradas a
partir da amostra (
a
)
H
0
H
1

H
0
Concluso correcta
Erro Tipo II
Probabilidade
H
1

Erro Tipo I
Probabilidade
Concluso correcta
(
a
) Com base nos resultados do teste de hipteses.
Erros de tipo I e de tipo II
Quando H
0
a alternativa verdadeira, inferimos incorrectamente se concluirmos H
1
a partir da
amostra. A probabilidade de cometer este erro de tipo I ou risco designa-se por nvel de
significncia (Tab. 6).
Quando H
1
a alternativa verdadeira, inferimos incorrectamente se concluirmos H
0
a partir da
amostra. A probabilidade de cometer este erro de tipo II designa-se por risco . No
consensual a utilizao da designao risco para se referirem as probabilidades e , mas
em alguns ramos da estatstica aplicada ( engenharia alimentar) usado com frequncia
(Tab. 6).

Mtodos Estatsticos Engenharia Alimentar 49
Eduardo Esteves, 2007
(a)
X

0
L
2
L
1
"Aceitao"
Concluir H
0
Rejeio
Concluir H
1
Rejeio
Concluir H
1

(b)
X

0
L
2
L
1
"Aceitao"
Concluir H
0
Rejeio
Concluir H
1

(c)
X

0
L
2
L
1
"Aceitao"
Concluir H
0
Rejeio
Concluir H
1

Fig. 22 Representao esquemtica do processo de deciso em trs tipos de testes de hipteses
diferentes (ver texto para mais detalhes): (a) hipteses bilaterais e (b) e (c) hipteses unilaterais.

No podemos evitar completamente estes erros, mas podemos tentar minimizar a
probabilidade de os cometer. Os erros de tipo I podero ser reduzidos, directamente, se
diminuirmos (o nvel de significncia) e por conseguinte aumentando a confiana. No
entanto, sabe-se que, para determinado tamanho de amostra n, o valor de est inversamente
relacionado com o valor de , ou seja, menor probabilidade de cometer erros de tipo I est
associada a maior probabilidade de cometer erros de tipo II ( 1 ). O nico modo de
reduzir ambos os erros aumentar o tamanho da amostra n a partir da qual se pretende inferir.
Por outro lado, possvel medir o poder estatstico de um teste estatstico recorrendo
Mtodos Estatsticos Engenharia Alimentar 50
Eduardo Esteves, 2007
quantidade 1 (consultem-se outros manuais para esclarecimentos adicionais sobre este
tpico).
TESTES DE HIPTESES BILATERAIS PARA A MDIA
Com este tipo de hipteses pretende-se responder a perguntas do gnero: Ser que o
volume mdio de sumo nas embalagens de determinada marca igual a 20 cl, ou no?.
Observe-se a Fig. 22(a), onde se ilustra este tipo de testes de hipteses. S se aplicam se a
varivel se distribui normalmente na populao. Caso contrrio, os testes apenas se aplicam
quando o tamanho da amostra grande, por regra n>30 elementos. O procedimento que a
seguir se apresenta utiliza conceitos relacionados com intervalos de confiana.
Casos em que a varincia da populao
2
conhecida
Com referncia distribuio de x na amostragem, e recorrendo distribuio normal
reduzida Z, teremos ento as hipteses nula (H
0
) e alternativa (H
1
):
H
0
: =
0
e H
1
:
0

A partir da(s) amostra(s) calcular a mdia x e confrontar essa estimativa (amostral) com os
limites de confiana apropriados, L
1
e L
2
. Se L
1
x L
2
concluir em favor de H
0
; caso
contrrio, isto , se x < L
1
ou x > L
2
, concluir H
1
( prtica corrente usar a expresso
rejeitar H
0
neste caso).
Os limites inferior e superior de confiana, respectivamente L
1
e L
2
, podem obter-se atravs
de
n
z L


=
2
1
0 1
e
n
z L


+ =
2
1
0 2

O valor de Z obtm-se da Tabela A (anexa) para uma probabilidade 1

/
2
(da a notao
utilizada acima). Na Fig. 23 (pg.seg.), ilustra-se a regra de deciso num caso simples.
Casos em que a varincia da populao
2
no conhecida
Quando no se conhece a varincia populacional, necessrio recorrer distribuio t de
Student, ou seja, utilizar a transformao t com = n 1 graus de liberdade. Assim, no teste
de hipteses sobre a mdia da populao , as hipteses nula e alternativa mantm-se:
H
0
: =
0
e H
1
:
0

A regra de deciso ser novamente concluir H
0
se L
1
x L
2
; caso contrrio, se x < L
1
ou
x > L
2
, concluir H
1
(isto o mesmo que rejeitar H
0
). Contudo, neste caso os limites inferior e
superior de confiana, L
1
e L
2
, calculam-se da seguinte forma:
n
s
t L
n
(


=
2
1 , 1
0 1
e
n
s
t L
n
(


+ =
2
1 , 1
0 2

O valor de t obtm-se da Tabela B (anexa) para n 1 g.l. e uma probabilidade de 1

/
2
(da a
notao usada nas equaes anteriores).

Mtodos Estatsticos Engenharia Alimentar 51
Eduardo Esteves, 2007

Fig. 23 Ilustrao da regra de deciso para H
0
: = 550 e H
1
: 550 (com =0,05). Apresentam-se
duas escalas para as abcissas: os valores-limite na distribuio de Z e os valores da varivel original
X correspondentes queles limites.

Depois de um periodo determinado em que 12 ratos-cobaia foram sujeitos a
uma dieta composta por certo complexo qumico, ser que a alterao de
peso observada significativa, com 95% de confiana? Sabe-se que aps oito
dias a diferena mdia de peso nos ratos-cobaia foi x = -0,65 g e que s
2
=
1,5682 g
2
.
As hipteses alternativas sero: H
0
: = 0 e H
1
: 0 (considere-se que
0
=0
representa uma situao em que a diferena de peso foi nula i.e. a dieta no
teve efeito sobre o peso dos ratos-cobaia). Neste caso, da Tabela B (anexa)
obtm-se
[ ] 975 , 0 ; 11
t =2,201 para =0,05. E os limites seriam, por conseguinte,
L
1
=0-2,201(1,2523/3,4641)=-0,796 g e L
2
=0+2,201(1,2523/3,4641)=0,796 g.
Assim, como L
1
x L
2
conclua-se H
0
, ou seja, com 95% de confiana a
alterao de peso no foi significativamente diferente de zero.
TESTES DE HIPTESES UNILATERAIS PARA A MDIA
Em muitas circunstncias, interessa saber se significativamente maior (ou menor) do que

0
, e nestes casos utilizam-se testes de hiptese unilaterais. Na Fig. 23(b,c) ilustram-se os dois
casos possveis, respectivamente >
0
e <
0
. A definio das hipteses iniciais e alguns
dos clculos envolvidos so diferentes do caso dos testes de hipteses bilaterais.

Recorrendo a um exemplo relacionado com dietas, mas desta vez a questo :
Ser que ocorreu reduo significativa de peso em 12 voluntrios para testar o
efeito de um novo produto de naturopatia (com nvel de confiana de 95%)? As
hipteses alternativas sero: H
0
: 0 e H
1
: < 0 (dado que
0
=0).


0
=550
Z
0
X
L
1
=550-1,96 /n L
2
=550+1,96 /n
1=0,95
z
1
[0,025]= -1,96 z
2
[0,975]= +1,96
No-rejeio
Concluir H
0
Rejeio
Concluir H
1
Rejeio
Concluir H
1
Mtodos Estatsticos Engenharia Alimentar 52
Eduardo Esteves, 2007
Repare-se que, curiosamente, para se estudar a ocorrncia de reduo significativa de peso
neste exemplo se definiram as hipteses como H
0
: 0 e H
1
: < 0. A hiptese alternativa H
1
contm o resultado que se desejava obter (pelo menos, do ponto de vista do fabricante do
produto em questo!). Esta estratgia resulta na rea de rejeio ficar visualmente
esquerda de
0
, o que facilita a compreenso do teste (na medida em que se l da esquerda
para a direita!!). De modo similar, se se pretendsse estudar se o tempo de processamento de
determinado produto agro-alimentar maior do que o especificado no manual de qualidade da
empresa (15 min) as hipteses poderiam ser: H
0
: 15 min e H
1
: > 15 min.
Os clculos envolvidos so diferentes dos apresentados anteriormente em virtude das
diferenas na definio das hipteses iniciais. De facto, recorre-se apenas a um limite em vez
de um intervalo e, portanto, consideram-se os valores (crticos) tericos z
[1-]
ou t
[,1-]
. Assim,
para os casos de hipteses unilaterais as regras de deciso sero:
i) Para as hipteses nula e alternativa H
0
:
0
e H
1
: <
0
; Concluir H
0
, se x L; Caso
contrrio (ou seja, se x < L), concluir H
1
. O limite (inferior) de confiana calcula-se da
seguinte forma:
[ ]
n
z L


=
1 0

quando se conhece a varincia
2
, ou ento, atravs de
[ ]
n
s
t L
n


=
1 , 1 0

ii) Para as hipteses H
0
:
0
e H
1
: >
0
; Se x L, concluir H
0
; caso contrrio, i.e. se x >
L, concluir H
1
. O limite (superior) de confiana, quando se conhece a varincia
2
, calcula-se
da seguinte forma:
[ ]
n
z L


+ =
1 0

ou ento recorrendo distribuio t-Student e varincia amostral s
2
, atravs de:
[ ]
n
s
t L
n


+ =
1 , 1 0

Se a varincia populacional
2
fr conhecida, possvel recorrer distribuio normal
reduzida Z. Nesse caso, os clculos envolvem z
[1-]
em vez de t
[n-1,1-]
e em vez de s, mas as
regras de deciso so, em tudo, semelhantes s mencionadas anteriormente.

(continuao do exemplo anterior) Agora, sabe-se que a diferena mdia
dos pesos ao fim de quinze dias de dieta foi x = -0,61 kg e que s
2
=0,4008
kg
2
. Da Tabela B (anexa) obtm-se, neste caso, que t

= 1,796 para 11 g.l. e
=0,05, logo o limite (inferior) ser: L = = 0 1,796 (0,6331/3,4641) = -
0,3282.
Assim, como x < L conclua-se H
1
, isto , com 95% de confiana ocorreu
reduo significativa do peso mdio.

Note-se, mais uma vez, que no caso de testes de hipoteses unilaterais os valores de z (ou t) so
obtidos para probabilidades de (1 ) em vez de (1

/
2
), em virtude de interessar apenas um
dos limites do intervalo de confiana.
Mtodos Estatsticos Engenharia Alimentar 53
Eduardo Esteves, 2007
TESTES DE HIPTESES ATRAVS DE ESTATSTICAS DE TESTE
Nos tpicos anteriores acerca de testes de hipteses, apresentmos um modo de realizar
aqueles testes acerca da mdia populacional que se baseia no conceito de intervalo de
cconfiana. Se a estatstica amostral, a mdia x , se encontrar dentro de determinados limites,
no se rejeita a H
0
, isto , pode-se afirmar com uma dada confiana que a mdia igual ao
valor
0
.
No entanto, possvel abordar estas questes recorrendo a estatsticas de teste (o
procedimento habitual em estatstica aplicada!). Depois de establecer as hipteses nula e
alternativa, calculam-se estatsticas de teste (e.t.) a partir da(s) amostra(s). Estas so
comparadas com valores tericos (tabelados). Se o valor absoluto da e.t. for maior do que o
valor terico (ou crtico), conclui-se em favor de H
1
; caso contrrio, conclui-se H
0
. Para testar
hipteses relativas mdia , podem usar-se duas e.t. consoante se conhece, ou no, a
variabilidade dos dados (a varincia
2
). Aquelas e.t. derivam das transformaes Z ou t, e
usam as respectivas distribuies tericas de probabilidades. Assim, se se conhecer
2
pode
utilizar-se a e.t. z
0
, ou seja:
|
|

\
|

=
n
x
z

0
0

A comparao de | z
0
| com o valor crtico obtido da tabela apropriada (Tabela A anexa) para
uma probabilidade (1

/
2
) [ou (1 ) no caso de hipteses unilaterais] permite concluir
acerca das hipteses iniciais. Se | z
0
| > z tabelado, rejeita-se a H
0
, isto , a mdia diferente
de (ou maior/menor do que)
0
. De modo semelhante, se utiliza a e.t. t
0
nos casos em que no
se conhece
2
(e se usa, por isso, o desvio-padro amostral s):
|
|

\
|

=
n
s
x
t
0
0


Considerem-se os exemplos anteriores, agora tratados recorrendo a estatsticas de teste.

Depois de um periodo determinado em que 12 ratos-cobaia foram sujeitos a
uma dieta composta por certo complexo qumico, ser que a alterao de
peso observada significativa, com 95% de confiana? Sabe-se que x =
0,65 g e que s
2
= 1,5682 g
2
.
As hipteses alternativas sero: H
0
: = 0 e H
1
: 0 (considere-se que

0
=0). Calcula-se a estatstica de teste t
0
= -1,798. Da Tabela B (anexa) da
distribuio de t obtm-se
[ ] 975 , 0 ; 11
t =2,201 para 11 g.l. e =0,05. Como | t
0
| <
t no se rejeita a H
0
. A concluso idntica obtida anteriormente
recorrendo noo de intervalo de confiana.

Recorrendo a um exemplo relacionado com dietas, mas desta vez a questo
: ser que ocorreu reduo significativa de peso em 12 voluntrios para
testar o efeito de um novo produto de naturopatia (com nvel de confiana de
95%)? E agora, sabe-se que x = -0,61 kg e que s
2
=0,4008 kg
2
.
As hipteses alternativas (unilaterais) sero: H
0
: 0 e H
1
: < 0 (dado que

0
=0). A estatstica de teste t
0
= -3,338 e da Tabela B da distribuio de t
Mtodos Estatsticos Engenharia Alimentar 54
Eduardo Esteves, 2007
obtm-se que
[ ] 95 . 0 , 11
t

= 1,796 para =0,05. Como | t
0
| > t, rejeita-se a H
0
,
isto , a concluso igual quela que se obteve usando limites.

Este o procedimento mais vulgar de realizar testes de hipteses no s acerca da mdia
como para outros parmetros populacionais importantes. Nos manuais de estatstica aplicada
referem-se a estes testes de hipteses com teste de z e teste de t para uma amostra (em ingls,
one-sample z-test ou one-sample t-test).
[Resolver Exerccios Captulo V]
8. REGRESSO LINEAR SIMPLES
RELAO ENTRE VARIVEIS
At aqui tm-se tratado tpicos da estatstica relacionados com uma nica varivel (estatstica
univariada ou univarivel). No entanto, possvel e muitas vezes desejvel, estudar a relao
que existe entre duas ou mais variveis. Considere-se o caso de se pretenderem estudar duas
variveis. Com muita frequncia e em muitos casos prticos, verifica-se que existe uma
relao entre duas variveis. Frequentemente, possvel expressar essas relaes sob a forma
matemtica, estabelecendo uma equao que ligue as variveis.

1) Os permetros das circunferncias dependem dos seus raios,
P=2R; ou 2) O crescimento de microrganismos pode ser descrito
pelo modelo (equao) exponencial: N=N
0
e
kt
.
RELAO FUNCIONAL ENTRE DUAS VARIVEIS
A primeira das relaes apresentadas no exemplo anterior corresponde a uma relao
funcional entre duas variveis que dependem uma da outra, isto , a magnitude de uma das
variveis (designada por VARIVEL DEPENDENTE) assume-se que determinada pela (ou
funo da) outra varivel (ou VARIVEL INDEPENDENTE). Dito de outro modo, uma RELAO
FUNCIONAL entre duas variveis X e Y exacta; a cada valor de X corresponde um nico valor
de Y.

Exemplo 1. O pagamento do aluguer de um motor elctrico de elevada potncia
(Y em euros) est relacionado com o periodo de aluguer (X em horas) pela
seguinte equao: Y=1500+2000X. Tente interpretar o significado dos
parmetros desta equao no contexto em que apresentada.
Exemplo 2. A rea de uma placa quadrada de madeira (Y em cm
2
) est
relacionada com o comprimento de um dos seus lados (X em cm) pela relao
funcional Y=X
2
.

Nestes dois exemplos, as relaes entre as duas variveis so funcionais e todos os valores de
Y esto sobre a linha recta (no primeiro exemplo) ou sobre a curva (no segundo exemplo) que
descrevem aquelas relaes (Fig. 24).

Mtodos Estatsticos Engenharia Alimentar 55
Eduardo Esteves, 2007
0
5000
10000
15000
20000
25000
0 2 4 6 8 10
X
Y

0
20
40
60
80
100
120
0 2 4 6 8 10
X
Y

Fig. 24 Relaes funcionais entre duas variveis X e Y (ver exemplos no texto).
RELAO ESTATSTICA ENTRE DUAS VARIVEIS
No entanto, em vrias situaes no se conhece a relao funcional entre duas variveis X e Y,
mas poder existir uma RELAO ESTATSTICA entre aquelas variveis, como por exemplo na
descrio do crescimento de microrganismos atravs dum model exponencial. De facto, diz-se
relao estatstica porque ser obtida a partir dos resultados, atravs de mtodos estatsticos
apropriados. A Fig. 25 composta por dois DIAGRAMAS DE DISPERSO que mostram relaes
estatsticas lineares e no-lineares entre variveis.

y = 1811,5 + 84,13x
0
2000
4000
6000
8000
10000
12000
0 25 50 75 100
N embalagens
P
e
s
o

(
k
g
)

y = 13,068e
0,2158x
0
150
300
450
600
750
900
1050
0 5 10 15 20
Horas
x
1
0
0
0

U
F
C
/
m
l

Fig. 25 Diagramas de disperso entre o peso e o nmero de embalagens ( esq.) e entre a densidade
de bactrias e o tempo de incubao ( dir.). As linhas (e respectivas equaes) correspondem s
relaes estatsticas (lineares, esq., e no-lineares, dir.) possveis de estabelecer entre as variveis.

Da observao das relaes estatsticas representadas na Fig. 25 possvel resumir as
PRINCIPAIS CARACTERSTICAS das relaes estatsticas, designadamente:
1 Tendncia da varivel dependente Y variar sistematicamente com a varivel independente
X; essa tendncia pode ser descrita por uma recta (relao estatstica linear) ou por uma curva
Mtodos Estatsticos Engenharia Alimentar 56
Eduardo Esteves, 2007
(relao estatstica no-linear)
2 Disperso das observaes em torno de uma recta ou de uma curva, explicada em
determinado grau pela relao estatstica. A explicao da disperso apenas parcial pois:
a) podem existir outros factores envolvidos que afectam Y alm da varivel X; ou b) parte da
variao observada pode ser explicada pela variabilidade inerente de Y.
MODELOS DE REGRESSO SIMPLES
As equaes matemticas ou MODELOS MATEMTICOS so utilizados para descrever a
relao estatstica entre variveis. Nos casos em que uma relao estatstica demonstra
dependncia entre variveis, essa relao designada por REGRESSO. O recurso ao termo
regresso remonta s primeiras abordagens deste assunto. A anlise de regresso foi publicada
inicialmente por Adrien Legendre [1752-1883] em 1805 e por Johann Gauss [1777-1855] em
1809. Sir Francis Galton [1822-1922], no final do sc. XIX, descreveu matematicamente a
tendncia da variao das alturas de filhos relativamente s alturas dos seus pais, contribuindo
dessa forma para o desenvolvimento da anlise de regresso. Mais recentemente, a tcnica
foi aperfeioada por Karl Pearson [1857-1936]. A utilizao da terminologia REGRESSO
SIMPLES est relacionada com o facto de apenas se considerarem duas variveis. Poderiam
considerar-se mais variveis independentes e, nesse caso, utilizaramos a terminologia
regresso mltipla. Este tpico extremamente vasto, e de utilizao muito generalizada
pelo que se aconselha a leitura de manuais mais especficos aquando da sua utilizao em
situaes da vida real. Contudo, nestes apontamentos tentaremos esclarecer os conceitos
mais importantes.
Os MODELOS DE REGRESSO incorporam as caractersticas das relaes estatsticas baseando-
se nos seguintes PRESSUPOSTOS (Fig. 26, pg. seg.):
1 A cada valor da varivel independente X est associada uma distribuio de
probabilidades de Y;
2 As mdias destas distribuies de probabilidades variam de uma forma sistemtica com X
(dependendo do modelo de regresso considerado, a variabilidade de Y estar relacionada com
X de modo diferente).
MTODO DOS MNIMOS QUADRADOS
Para evitar critrios individuais e subjectivos na escolha do modelo de regresso que se ajusta
ao conjunto dos dados (rectas, curvas, etc. cf. Fig. 25), necessrio definir a melhor recta ou
cruva de ajustamento. Para definir, objectivamente, uma das vrias relaes possveis entre
duas variveis X e Y, considere-se a Fig. 27 na qual os dados esto representados pelos n
pontos de coordenadas (x
1
, y
1
), (x
2
, y
2
), ..., (x
n
, y
n
). Assim, para um dado valor de X, digamos
por exemplo x
1
, haver uma diferena entre y
1
e o valor correspondente determinado (ou
estimado
1
y ) pela equao da curva ajustada (representada pela linha C na Fig. 27). Essa
diferena D
1
, designa-se por ERRO, DESVIO ou RESDUO e pode ser positivo, negativo ou nulo.
Se a curva (ou recta, etc.) se distanciar de igual forma de todos os pontos (x
i
, y
i
) ento:

= = 0 ) (
i i i
y y D
Logo, pode obter-se uma medida da qualidade do ajustamento de uma recta (ou curva) a um
conjunto de dados pela quantidade seguinte:

= =
2 2
)

( Y Yi Di SQ
Mtodos Estatsticos Engenharia Alimentar 57
Eduardo Esteves, 2007
Quanto menor for SQ, ento melhor ser o ajustamento. O mtodo dos mnimos quadrados
pretende MINIMIZAR A QUANTIDADE SQ (alguns autores utilizam Q), que a SOMA DOS
QUADRADOS DOS ERROS. Sendo assim, de todas as rectas (ou curvas) que se ajustam a um
conjunto de pontos, aquela que tem a propriedade de resultar no menor valor de SQ
denominada a melhor recta (ou curva) de ajustamento, a equao dos mnimos quadrados.


Fig. 26 Ilustrao (adaptada de Neter et al.) dos conceitos relacionados com a regresso (ver texto).


Fig. 27 Ilustrao do conceito de desvio (mtodo dos mnimos quadrados).
Mtodos Estatsticos Engenharia Alimentar 58
Eduardo Esteves, 2007
RECTA DOS MNIMOS QUADRADOS
A mais simples relao funcional entre duas variveis definida pela equao da recta
X B A Y + =
em que A intercepo ou ordenada na origem e B o declive (Fig. 28). Nesta equao, A e B
so parmetros derivados da(s) amostra(s)
6
. Contudo, independentemente de se estar a estudar
uma amostra ou uma populao, ser invulgar que todos os pares de resultados (x
i
, y
i
) se
posicionem exactamente sobre a recta, pelo que ser mais adequado escrever a equao na
seguinte forma:
+ + = X B A Y
em que (l-se psilon) designa o erro, ou desvio, ou resduo (ou seja, a diferena entre
cada valor de y
i
e o valor estimado
i
y cada diferena D
i
definida anteriormente).

0
10
20
30
40
50
0 2 4 6 8 10
Varivel independente, X
V
a
r
i

v
e
l

d
e
p
e
n
d
e
n
t
e
,

Y
A
B
}e
2

Fig. 28 Ilustrao dos parmetros da equao da recta x y 8 , 4 4 , 4 + = . A ordenada na origem
(A=4,4) corresponde ao valor estimado de Y quando X=0, enquanto que o declive (B=4,8) a variao
do Y por cada alterao unitria do X, isto , se X aumentar de 4 para 5 ento Y aumentar 4,8
unidades. A recta desenhada no coincide com os pontos. As diferenas (distncias verticais) entre os
valores observados (pontos) e estimados (linha) correspondem aos erros (destaca-se o erro relativo
segunda observao, e
2
).

A RECTA DOS MNIMOS QUADRADOS que se ajusta ao conjunto de pontos (x
1
, y
1
), (x
2
, y
2
), ...,
(x
n
, y
n
) em que n=1, 2, , i tem equao:
X B A Y + =


em que Y

(l-se estimador de Y) indica que a cada valor de X (um dado x


i
) corresponde um
valor estimado (ou esperado) de Y na recta ajustada (
i
y ). O mtodo dos mnimos quadrados
considera a distncia vertical entre y
i
e
i
y e tenta mnimizar a soma dos quadrados desses
desvios (ou erros):

6
Os verdadeiros parmetros podem indicar-se por e . Num contexto mais actual da estatstica, as
estimativas que se obtm a partir da amostra, b
0
e b
1
, designam-se por coeficientes de regresso e constituem as
melhores estimativas dos verdadeiros parmetros
0
e
1
, respectivamente a ordenada na origem e o declive.
Mtodos Estatsticos Engenharia Alimentar 59
Eduardo Esteves, 2007

=
2
) (
i i
y y SQ
Alguns autores acrescentam que SQ se refere poro no-explicada da variao de Y.
Simultaneamente, pretende-se calcular os parmetros da equao da recta, os coeficientes A e
B, uma vez que os parmetros reais e exigiriam a anlise de toda a populao, isto , de
todos os pares (X,Y), o que na maoria dos casos impossvel. Assim, podemos calcular o
declive B, da equao da recta de regresso para uma amostra de pares de valores (x
i
,y
i
) da
seguinte forma:


= =
2 2 2 2
) (
) )( (
) (
) )( (
i i
i i i i
i
i i
x x n
y x y x n
x x
y y x x
x
xy
B
em que B a melhor estimativa do DECLIVE DA RECTA ou COEFICIENTE DE REGRESSO,
sendo que - < B < +. A notao utilizada no termo intermdio, xy, indica o clculo da
soma dos produtos cruzados dos desvios da mdia. Sucintamente, pretende reflectir a
distncia em relao aos eixos dos pares de valores. Similarmente, a notao x
2
refere-se
soma dos quadrados dos desvios de x
i
relativamente media x . O termo final designado por
frmula de mquina do declive. O declive pode entender-se como a variao de Y resultante
dum incremento unitrio de X. Se B > 0, ento para aumentos de X, Y aumentar a quantidade
B. Pelo contrrio, se B < 0 ento Y diminuir com o incremento de X. Se B = 0, a recta ser
horizontal, ao nvel de A, e pode afirmar-se que Y no varia relativamente a X.
Demonstra-se matematicamente que o ponto ) , ( Y X , designado por centride, faz sempre
parte da recta ajustada atravs do mtodo dos mnimos quadrados. Sendo assim, podemos
substituir esse ponto na equao da recta e obter:
X B A Y + =
ou, escrito de outra forma,
X B Y A =
em que A a melhor estimativa da INTERCEPO ou ORDENADA NA ORIGEM (ou seja, o valor
de Y quando x
i
= 0). Outra formulao para o clculo de A pode ser:


=
2 2
2
) (
) )( ( ) )( (
i i
i i i i i
x x n
y x x x x
A
As equaes apresentadas para calcular os parmetros da recta dos mnimos quadrados
derivam da resoluo simultnea do SISTEMA DE EQUAES NORMAIS:

+ =
+ =


2
i i i i
i i
x B x A y x
x B n A y


Na Fig. 29 (painel superior esquerdo) representam-se um conjunto de n=4
pontos (x
i
, y
i
) num diagrama de disperso. Os pares de dados so:
(0,9;1,0), (3,4;2,1), (3,9;1,5) e (5,9;2,5). Podemos definir diferentes rectas
e verificar como se ajustam aos dados. Para isso, calcule-se a SQ como
medida simples do ajuste para:
1) Recta horizontal (y = 1,9): a soma dos quadrados dos desvios dada
por SQ=(1,0-1,9)
2
+(2,1-1,9)
2
+(1,5-1,9)
2
+(2,5-1,9)
2
=1,37;
2) Recta oblqua (y = 1,4 + 0,13 x): SQ=0,7+0,07+0,17+0,11=1,05;
3) Para determinar a recta dos mnimos quadrados, ser necessrio
calcular previamente algumas quantidades: x
i
=14,1; y
i
=7,1;
Mtodos Estatsticos Engenharia Alimentar 60
Eduardo Esteves, 2007
x =3,53; y =1,78; (xiyi)=28,64 e, por fim, (x
i
2
)=62,39. Destas,
obtm-se o declive: B =14,45/50,75=0,285 que define uma famlia
de rectas possveis. Sabe-se que a recta dos mnimos quadrados passa
pelo ponto ) , ( Y X , pelo que se pode calcular a intercepo atravs
da equao A=1,780,285(3,53)=0,77. A equao da recta dos
mnimos quadrados , ento, Y=0,77+0,285X. Neste caso, a
SQ=0,0007+0,1303+0,1455+0,0024=0,2789 (um valor bastante
inferior aos obtidos anteriormente para as outras rectas propostas).

0
1
2
3
0 1 2 3 4 5 6 7
X
Y

0
1
2
3
0 1 2 3 4 5 6 7
X
Y
SQ=1,37

0
1
2
3
0 1 2 3 4 5 6 7
X
Y
SQ=1,05

0
1
2
3
0 1 2 3 4 5 6 7
X
Y
SQ=0,28

Fig. 29 Ilustrao (adaptada de Neter et al.) das rectas que se podem ajustar a um conjunto de dados,
incluindo a recta dos mnimos quadrados (com SQ=0,28). Indica-se a SQ para cada tentativa (cf.
exemplo anterior). As linhas tracejadas destacam os erros.

Os modelos de regresso linear simples necessitam que se verifiquem os seguintes
PRESSUPOSTOS:
1) Para cada valor da varivel independente X existem valores da varivel dependente Y
distribuidos normalmente (esta condio tambm pressupe que para cada valor de X,
ocorrem na populao valores do erro, desvio ou resduo distribuidos normalmente);
2) Assume-se que existe homogeneidade das varincias nas distribuies de Y para cada
valor de X;
3) A relao subjacente entre X e Y linear ou, dito de outro modo, os vrios valores de Y
para cada X esto sobre uma linha recta;
4) Os valores de Y foram obtidos aleatoriamente da populao e so independentes entre si;
5) As medies da varivel independente X so obtidas sem erro (ou, pelo menos, com erro
negligencivel).
Mtodos Estatsticos Engenharia Alimentar 61
Eduardo Esteves, 2007
As pequenas violaes destes pressupostos no afectam muito a validade dos resultados do
mtodo dos mnimos quadrados, pois tem sido demonstrada a resistncia deste
procedimento. Contudo, a observncia destas condies contribui para a validade das
concluses que se obtiverem. Por outro lado, podemos resolver as violaes de alguns dos
pressupostos atravs da transformao dos dados (ver a seguir).
[Resolver Exerccios Captulo VI]
TRANSFORMAO DAS VARIVEIS NA REGRESSO
possvel ultrapassar algumas dificuldades com o cumprimento dos pressupostos da
regresso linear simples recorrendo transformao das variveis em estudo. Por exemplo, a
transformao logartmica pode ajudar a contornar problemas de no-homogeneidade das
varincias dos dados, isto , de heteroscedasticidade de Y; tornando os dados mais
homoscedsticos! Por outro lado, possvel estudar relaes no-lineares entre variveis
utilizando tcnicas de transformao de uma das variveis ou de ambas (ver a seguir). Alguns
autores advertem que, transformar os dados, originalmente conformes com os pressupostos,
pode resultar em novos dados que no cumprem as condies e que, portanto, impedem a
regresso linear simples com os dados transformados.
Entre as vrias transformaes possveis, etc. , , , 1 , ln , log
p
x x x x x , a TRANSFORMAO
LOGARTMICA log x das mais frequentemente utilizadas.
Um teste prtico para verificar se a transformao logartmica apropriada e beneficia a
anlise, calcular a razo entre os valores mximo e mnimo duma dada varivel. Se aquele
quociente for superior a dez (ou seja, os valores observados variam mais do que uma ordem
de grandeza), ento provvel que a transformao dos dados seja benfica para a posterior
anlise de regresso.

1) Se a relao estatstica entre X e Y pode ser descrita matematicamente
pela equao exponencial
X B
e A Y

=

, podemos utilizar os logartmos


naturais (logartmos de base e, nmero neperiano) para transformar
(linearizar) aquela equao da seguinte forma:
X B A Y e A Y e A Y
X B X B
+ = + = =

ln

ln ) ln( ln

ln ) ln(

ln
Obtm-se, assim, uma relao linear entre uma varivel transformada
( Y

ln ) e outra original (X) (Fig. 30a, pgina seguinte).


2) Se a relao estatstica entre X e Y pode ser descrita matematicamente
pela equao potncia,
B
X A Y =

, poderemos transformar as variveis


recorrendo a logartmos de base 10 da seguinte forma:
X B A Y X A Y X A Y
B B
log log

log ) log( log

log ) log(

log + = + = =
i.e. uma relao linear, agora entre ambas as variveis transformadas
( Y

log e X log ) (Fig. 30b, pgina seguinte).


COEFICIENTE DE CORRELAO LINEAR
At agora, discutiu-se a forma da relao estatstica entre duas variveis, isto , pretendeu-
se conhecer como a variao de X se reflecte em Y. Para isso, tentou-se modelar a relao de
causa-efeito, de forma a predizer o valor de Y a partir de X.
Mtodos Estatsticos Engenharia Alimentar 62
Eduardo Esteves, 2007
(a)
y = 13.068e
0.216x
0
200
400
600
800
1000
0 5 10 15 20
Horas
x
1
0
0
0

U
F
C
/
m
L


y = 0.216x + 2.570
0
1
2
3
4
5
6
7
8
0 5 10 15 20
Horas
L
n
(
x
1
0
0
0

U
F
C
/
m
L
)

(b)
y = 35.239x
1.463
0
20
40
60
80
100
120
0.8 1.0 1.2 1.4 1.6 1.8 2.0 2.2
Altura (m)
P
e
s
o

(
k
g
)


y = 1.463x + 1.547
0.0
0.5
1.0
1.5
2.0
2.5
0.0 0.1 0.2 0.3
Log(Altura)
L
o
g
(
P
e
s
o
)

Fig. 30 Transformao de variveis na anlise de regresso. (a) Relao exponencial (com B>0)
entre o tempo de incubao (horas) e n de microrganismos (x1000 UFC/mL) linearizada atravs da
transformao de Y em ln(Y); (b) Relao potncia entre a altura (m) e peso (kg) de determinada
amostra de alunos da EST linearizada pela transformao de X e Y em log(X) e log(Y).

Contudo, a aplicao de qualquer ferramenta preditiva sempre acompanhada pela
compreensvel preocupao de avaliar o respectivo grau de preciso. Na tentativa de
quantificar o grau de associao, ou da intensidade da relao, entre duas variveis verifica-
se que os clculos envolvidos so semelhantes aos explicitados para a regresso. De facto,
essa a razo pela confuso matemtica entre os dois conceitos estatsticos, regresso e
correlao. Simplisticamente, podemos dizer que com a regresso se pretende descrever a
dependncia da varivel Y relativamente a X, de modo a predizer o valor de Y a partir de X.
Com a correlao pretende-se avaliar o grau de interdependncia, ou de covariao, entre as
duas variveis, no se sabendo, ou assumindo, qual a varivel-causa ou a varivel-
resposta/efeito nem se descrevendo a relao.
Covariao
Define-se matematicamente a covariao para o par de valores x
i
e y
i
da seguinte forma:
{ } ( ) { } ( ) Y y X x Covariao
i i
=
Mtodos Estatsticos Engenharia Alimentar 63
Eduardo Esteves, 2007
O que se pretende quantificar o comportamento ou a interdependncia entre duas
variveis X e Y, isto , se variam em conjunto (ou covariam). Este o principal objectivo na
anlise de correlao e da a importncia do conceito de covariao.

1) Numa fbrica, a produo diria esperada dos produtos A e B de 5 e
10 toneladas, respectivamente. Num determinado dia, foram produzidos 8
toneladas de ambos os produtos. A respectiva covariao foi nesse dia de:
Covariao=(85)(810)=6. Note-se que a covariao pode ser negativa,
positiva ou nula. No caso, a covariao negativa indica que um dos
produtos foi fabricado em maior quantidade que o esperado (o produto A
neste caso) e outro em menor quantidade (o produto B).
2) Num determinado local, no dia 4 de Julho, esperava-se que a
temperatura do ar atinjisse os 25 C e a humidade relativa fosse de 45%.
A temperatura e humidade relativa registadas nesse dia foram, na
realidade, 30 C e 70%, respectivamente. Agora, a covariao foi de:
Covariao=(3025)(7045)=+125. Neste caso, a covariao positiva
resulta de ambos os valores medidos excederem os valores esperados.
Covarincia
De forma similar ao clculo da varincia, que recorre soma dos quadrados dos desvios e ao
tamanho da amostra (atravs dos graus de liberdade), possvel aperfeioar a medida de
covariao.
A COVARINCIA uma medida de associao entre duas variveis aleatrias X e Y. O valor
mdio, ou esperana matemtica, da distribuio de probabilidades da covarincia de duas
v.a. X e Y, isto , a covarincia mdia em provas aleatrias repetidas, designa-se por {X,Y}
(nestes apontamentos seguiremos essa notao em vez de Cov{X,Y}), e depende da
probabilidade com que x
i
e y
i
ocorrem simultaneamente. Pode obter-se a covarincia para um
conjunto de n pares de valores (X,Y), ou seja, n 1 graus de liberdade, atravs de:
1
) )( (
1
} , {

=

n
y y x x
n
xy
Y X
i i

Interpretao da covarincia
A principal informao fornecida pela covarincia acerca da associao entre X e Y est
relacionada com o sinal de {X,Y}. Quando X varia inversamente com Y, {X,Y} negativa.
Quando X e Y variam directamente, {X,Y} positiva. Quando X e Y so independentes,
ento {X,Y}=0.
A magnitude de {X,Y} no providencia nenhuma informao sobre a associao entre as
duas variveis, uma vez que depende das unidades em que esto expressas as variveis X e Y.
Coeficiente de correlao linear
Neste contexto, uma medida de associao entre duas variveis deve ser independente da
escala de medio original, de modo a ser possvel comparar o grau de associao num
determinado conjunto de pares de variveis com a associao entre variveis noutro conjunto.
Mtodos Estatsticos Engenharia Alimentar 64
Eduardo Esteves, 2007
De facto, como a magnitude da covarincia depende das unidades de X e Y no possvel
fazer uma comparao directa entre vrios pares de variveis, ou seja, entre amostras.
Um modo de contornar este problema, tornar essa medida de associao independente das
unidades, ou seja, dividir a covarincia pelos desvios-padro das variveis X e Y, e deste
modo padronizar os resultados.
Assim, o COEFICIENTE DE CORRELAO LINEAR entre duas variveis aleatrias X e Y
designa-se por {X,Y} ( l-se r) e expressa-se por:
{ , }
{ , }
{ } { }
X Y
X Y
X Y


na prtica, o quociente entre a covarincia (no numerador) e o produto dos desvios-padro das
duas variveis em estudo (no denominador).
Interpretao do coeficiente de correlao
Prova-se que {X,Y} toma valores entre 1 (associao inversa perfeita) e +1 (associao
directa perfeita), ou seja
1 {X,Y} +1
O valor +1 obtido quando existe uma relao funcional entre X e Y de tipo linear com
declive B positivo, isto , Y = A + B X. Para o valor 1 a relao ser similar mas com B
negativo. O resultado {X,Y}=0 indica que no existe associao entre as variveis X e Y, e
diz-se que as duas variveis aleatrias no esto correlacionados linearmente.
Em resumo, quanto mais aproximado de = 1 for o coeficiente de correlao linear, mais
forte o grau de associao entre as duas variveis aleatrias consideradas.
Coeficiente de correlao linear amostral r
Antes de mais, ser apropriado desenvolver uma fundamentao que nos permita calcular o
coeficiente de correlao r numa amostra. Assim, numa amostra constituida por n pares de
valores (x
i
,y
i
) em que i=1, 2, , n, pode calcular-se um estimador sem vcio do COEFICIENTE
DE CORRELAO r atravs de:






=


=
2 2 2 2 2 2
) ( ) (
) )( (
) ( ) (
) )( (
i i i i
i i i i
i i
i i
y y n x x n
y x y x n
y y x x
y y x x
r
O desenvolvimento deste coeficiente deve-se a Karl Pearson (c. 1900), e alguns autores
(particularmente os anglfonos) referem-se a esta quantidade como coeficiente de correlao
do produto-momento.
O termo final da equao apresentada designado por frmula de mquina e permite
calcular o coeficiente de correlao a partir de quantidades entretanto calculadas para a
obteno da recta de regresso dos mnimos quadrados entre duas variveis.
Prova-se, anda, que considerando os desvios-padro amostrais das variveis X e Y, s
X
e s
Y
,
podemos relacionar o coeficiente de correlao linear amostral r e a estimativa do declive da
recta dos mnimos quadrados B atravs de:
Y
X
s
s
B r =
Mtodos Estatsticos Engenharia Alimentar 65
Eduardo Esteves, 2007
Prova de hipteses sobre o coeficiente de correlao linear populacional {X,Y}
No existem pressupostos para o clculo do coeficiente de correlao, mas para a prova de
hipteses acerca do coeficiente de correlao linear populacional {X,Y} necessrio cumprir
algumas condies. Na regresso, assume-se que para cada valor de X os valores de Y
correspondentes provm de forma aleatria de uma populao com distribuio normal. Em
correlao, para alm desse pressuposto, tambm se deve verificar que os valores de X so
aleatoriamente obtidos de uma populao com distribuio normal. Alguns autores referem
que no se verificando estes pressupostos, mesmo aumentando o tamanho da amostra no
possvel diminuir os efeitos adversos da no-normalidade.
O coeficiente de correlao r da amostra uma estimativa pontual do parmetro da populao
(ver seces Estimao da mdia da populao e Teste (ou Prova) de hipteses). O teste
de hiptese mais comum acerca de , saber se o coeficiente de correlao da amostra r
provm duma populao com coeficiente de correlao igual a zero
7
. Em termos mais
simples, ser que existe correlao linear entre as duas variveis? Se existir correlao, ento
r ser significativamente diferente de zero (que o mesmo que concluir em favor de H
1
). As
HIPTESES NULA E ALTERNATIVA so, neste caso particular:
H
0
: = 0 e H
1
: 0.
Ora, se a amostra provm de uma populao com distribuio normal, isto , tanto X como
Y so variveis aleatrias com distribuio normal ento o ERRO-PADRO DO COEFICIENTE
DE CORRELAO s
r
ser igual a:
2
1
2

=
n
r
s
r

Recorde-se que o conceito de erro-padro, ou de desvio-padro de um parmetro, foi
introduzido quando se abordou a distribuio de x na amostragem (ver seco Estimao da
mdia da populao). Deve enfatizar-se que a expresso utilizada acima para calcular o erro-
padro s
r
s se aplica quando pretendemos testar H
0
: = 0 vs. H
1
: 0.
Os testes de hipteses relativos ao coeficiente de correlao recorrem transformao t de
Student para n 2 graus de liberdade seguinte:
[ ] y r
s r t = . Assim, para testar as seguintes
hipteses:
H
0
: = 0 e H
1
: 0
a regra de deciso ser concluir H
0
se L
1
r L
2
; caso contrrio, se r < L
1
ou r > L
2
, rejeitar
H
0
(o mesmo que concluir H
1
). Para as hipteses consideradas, os limites L
1
e L
2
obtm-se
atravs de:
2
1
2,1
2
1
2
n
r
L t
n
(

(

e
2
2
2,1
2
1
2
n
r
L t
n
(

(

= +

.
Um mtodo simples de testar as hipteses alternativas comparar o valor de r obtido com o
valor crtico na tabela de r (Tabela D, em anexo) para n 2 graus de liberdade e um nvel de
significncia . Se | r | < r
[n2; ]
concluir H
0
; caso contrrio, rejeitar H
0
. Um outro
procedimento para testar aquelas hipteses, calcular a estatstica de teste t
[r]
e consultar a
tabela t-Student (Tabela B anexa) para n 2 g.l. Se | t
[r]
| >
[ ] 2 1 ; 2 n
t
rejeitar H
0
, com (1
)100% de confiana.


7
Se =0 ento no existe correlao linear entre X e Y, alis como se viu para a covarincia.
Mtodos Estatsticos Engenharia Alimentar 66
Eduardo Esteves, 2007
Para um r = 0,8652 baseado numa amostra de n = 12 pares de valores,
testar as hipteses H
0
: = 0 e H
1
: 0 com 95% de confiana.
Uma vez que o valor crtico de t = 2,228, os limites L
1
e L
2
so 0,3533 e
+0,3533, respectivamente. Como r>L
2
, rejeita-se H
0
, ou seja existe
correlao linear entre as variveis em causa (com 95% de confiana).
Poderia consultar-se a tabela de r para n 2 = 10 graus de liberdade. O
valor crtico de r para um nvel de significncia de 5% 0,576. Como o
valor de r observado superior ao valor crtico, rejeita-se H
0
. De outro
modo, sabendo que o erro-padro de r dado por
1586 , 0
2 12
2
8652 , 0 1
=

=
r
s , ento
[ ]
456 , 5 = =
r
s
r
r
t .
Consultando, neste caso, a tabela de t (Tabela B anexa) para =0,05 e
n2 graus de liberdade, verificamos que o valor crtico de t = 2,228.
Como o valor | t
r
|>t
crtico
ento rejeita-se a H
0
com 95% de confiana.
Confirmam-se, novamente, os resultados anteriores.
COEFICIENTE DE DETERMINAO
Podem estimar-se os parmetros de uma recta que constitua o melhor modelo de relao
estatstica entre duas variveis aleatrias. Pode-se, anda, determinar o grau de associao das
variveis independentemente do modelo adoptado e testar se significativamente diferente de
zero. No entanto, no se abordou a avaliao da significncia ou utilidade da equao da
recta dos mnimos quadrados para descrever a relao estatstica entre X e Y. Em virtude da
complexidade dos conceitos e das tcnicas envolvidas, relacionadas com a anlise de
varincia (que no fazem parte do programa desta disciplina), este tpico ser abordado, para
j, apenas superficialmente.
possvel interpretar os resultados do mtodo dos mnimos quadrados de outro modo. A
equao resultante permite explicar parte da variabilidade de Y em termos de variao de X.
Analise-se, neste contexto, a Fig. 31. A variabilidade dos resultados observados pode ser
decomposta em duas componentes. Uma parte est relacionada com os desvios dos valores
observados, dos pontos (x
i
,y
i
), recta estimada, ou sejam, as distncias verticais
i i i
y y D =
(por exemplo D
7
na Fig. 31). A partir destes desvios obtm-se a soma dos quadrados dos erros
(ou dos desvios) SQ
E
. Esta poro da variabilidade fica por explicar depois de se ajustar o
modelo de regresso. Outra parte da variabilidade pode ser medida pelas distncias verticais
y y d
i i
= (e.g. d
7
na Fig. 31). Destas distncias se obtm a soma dos quadrados da
regresso SQ
R
, que pretende quantificar a variabilidade que explicada pela equao
obtida
8
. Simplisticamente, podemos afirmar que a variao observada num determinado
problema ou conjunto de dados
9
:
Dados = Ajustamento + Resduos
possvel aproveitar aquela informao e determinar a proporo ou percentagem da
variabilidade total de Y que explicada pelo modelo de regresso. Esta quantidade designa-se
por COEFICIENTE DE DETERMINAO r
2
. Este coeficiente pode ser entendido como um ndice
da bondade do ajuste do modelo que obtivemos por regresso, e calcula-se genericamente

8
Se as variveis no estivessem relacionadas e Y no variasse em funo de X, muito provavelmente o declive da
recta de regresso seria (aproximadamente) igual a zero, ou seja, a recta seria horizontal (ao nvel de y )!
9
Na linguagem da anlise de regresso, a relao pode escrever-se: SQ
T
= SQ
R
+ SQ
E
, em que SQ
T
se refere
variabilidade total observada num conjunto de dados. Esta relao designa-se identidade da ANOVA.
Mtodos Estatsticos Engenharia Alimentar 67
Eduardo Esteves, 2007
atravs de:
T
R
SQ
SQ
r =
2

em que SQ
T
= SQ
R
+ SQ
E
(uma outra forma de escrever a relao Dados=Ajuste+Resduos).

0
2000
4000
6000
8000
10000
12000
0 20 40 60 80 100
N embalagens
P
e
s
o

(
k
g
)
D
7
{
} d
7
(x
7
;y
7
)
x
7
y
7
x
y

Fig. 31 Diagrama de disperso dos resultados relativos a duas v.a. X e Y. Ilustrao dos
conceitos envolvidos na obteno de r
2
. O centride est assinalado por um crculo. As
linhas tracejadas mostram as coordenadas do centride e do ponto de coordenadas (x
7
,y
7
).
Destacam-se, ainda, as diferenas D
7
e d
7
relativas ao ponto (x
7
,y
7
).

Para efeitos de clculo, tem-se que:
( )
( )
( ) ( )
2
2 2
2
2 2 2
2 2
i i i i
i i i i
xy
x
n x y x y
r
y
n x x n y y
(
(
(


= =
( (

( (



O coeficiente de determinao r
2
muito comum na literatura e utilizado como medida da
adequao (ou do ajuste) do modelo de regresso obtido. Pode entender-se como a proporo
(ou percentagem) da variabilidade da v.a. Y que explicada pela varivel X de acordo com o
modelo de regresso obtido (0 r
2
1). Curiosamente, o coeficiente de determinao pode
ser obtido elevando r ao quadrado, da a confuso em alguns textos sobre o seu significado.
Na Fig. 32, apresentam-se diversos exemplos de rectas de regresso (mtodo dos mnimos
quadrados) e respectivos coeficientes de determinao.
Os resultados da anlise de regresso devem ser apresentados sobre a forma de equao,
tamanho da amostra e coeficiente de determinao, por exemplo:

Y

= 2,06 + 3,99X (n = 25, r


2
= 0,957).
Mtodos Estatsticos Engenharia Alimentar 68
Eduardo Esteves, 2007
Deve, ainda, acrescentar-se a informao relativa anlise de varincia da regresso (que
testa a significncia do modelo de regresso obtido) aos resultados indicados
10
.

R
2
= 1
X
Y

R
2
= 0
X
Y

R
2
= 0.8508
X
Y

R
2
= 0.9176
X
Y

Fig. 32 Ilustrao de vrias rectas de regresso obtidas pelos mtodos dos mnimos quadrados e
respectivos coeficientes de determinao.

Em jeito de concluso, os conceitos e mtodos apresentados para o estudo da relao
estatstica entre duas variveis permitem responder as questes do tipo: que aspecto tem a
relao estatstica? (elaborao do diagrama de disperso); qual o grau de associao entre as
variveis? (clculo do coeficiente de correlao); qual o modelo que se ajusta melhor aos
dados? (eventual transformao do dados para linearizar estatstica, e posterior clculo da
recta dos mnimos quadrados); qual o grau de ajuste do modelo obtido aos dados? (clculo
do coeficiente de determinao).
[Resolver Exerccios Captulo VI]
9. BIBLIOGRAFIA E MEDIAGRAFIA

Escola Superior de Tecnologia do Instituto Politcnico de Setbal Matbib. Probabilidades e
estatstica. http://www.est.ips.pt/departamentos/sam/Matbib/ProbEsta.htm (consultado
em 14/03/01)


10
A abordagem deste tpico, em particular, no faz parte do programa desta disciplna mas ser tratado mais
frente no curso de Engenharia Alimentar (por exemplo, em Anlise de Dados e Planeamento Experimental) e
deve ser prtica corrente em estudos que utilizem a anlise de regresso.
Mtodos Estatsticos Engenharia Alimentar 69
Eduardo Esteves, 2007
Grinsted, C.M. & J.L. Snell Introduction to probability. University of Dartmouth.
http://www.darmouth.edu/~chance/teaching_aids/books_articles/probability_book/pdf.h
tml (consultado em 14/03/01)

Neter J., Wasserman W. & G.A. Whitmore Applied Statistics. 3
rd
Edition, Allyn and Bacon
Inc., Boston, 997p.

Reis E., Melo P., Andrade R. & T. Calapez Estatstica aplicada. Volumes I e II. Edies
Slabo, Lisboa, 266p. + 322p.

Santos, F.B. Clculo de probabilidades. Pltano Editora, Lisboa, 319p.

Siegrist, K. et al. Virtual laboratories in probability and statistics. Department of
Mathematical Sciences. University of Alabama in Huntsville. http://www.math.edu./stat
(consultado em 14/03/01)

Sokal, R.R. & F.J. Rohlf Biometry. W.H. Freeman and Co., San Francisco, 776p.

Spiegel, M.R. Estatstica. 2 Edio, MacGraw-Hill, So Paulo, 454p.

Tiago de Oliveira, J. Probabilidades e estatstica. Conceitos, mtodos e aplicaes. Volumes
I e II. McGraw-Hill, Lisboa, 229p. + 295p.

Zar, J. Biostatistical analysis. 3
rd
Edition, Prentice Hall International Editions, USA, 662p. +
App.

Mtodos Estatsticos Engenharia Alimentar 70
Eduardo Esteves, 2007
EXERCCIOS
I AMOSTRA
1. D o domnio de cada uma das seguintes variveis e diga se so variveis discretas ou
contnuas:
a) Nmero G de litros de sumo de fruta num recipiente.
b) Nmero B de caixas de laranjas num armazm.
c) Soma S de pontos obtidos ao lanar um par de dados.
d) Dimetros D de 100 mas de calibre comercial "mdio".
e) Nmero T de toneladas de farinha de trigo produzidas numa moagem.
f) Nmero C de decilitros de vinho em garrafas de vinho.

2. Na linha de enchimento de embalagens de manteiga de uma indstria de lacticnios, so
retiradas periodicamente amostras para controlar o peso lquido do produto. Os pesos lquidos
(em gramas) obtidos numa das amostras foram os seguintes:
256 215 276 256 260 270 280 246 234
273 214 272 293 258 229 284 218
Agrupe os dados em classes e calcule as frequncias absolutas e absolutas acumuladas por
classe (utilize a regra: n classes = log
2
n + 1 e os limites implcitos para cada classe).
Represente graficamente as distribuies obtidas.

3. A percentagem de gua em salsichas do tipo frankfurt controlada, numa determinada
fbrica, retirando periodicamente amostras de salsichas antes do enlatamento. Os resultados
das anlises qumicas a 30 salsichas foram os seguintes:
62 70 62 64 62 71 71 68 66 62 67 72
71 61 64 72 68 72 62 68 62 62 63 66
64 71 62 64 62 61
Agrupe os dados em classes e calcule as frequncias absolutas e relativas por classe (utilize a
regra: n classes = log
2
n + 1 e os limites implcitos para cada classe). Represente
graficamente as distribuies obtidas.

4. Ao controlar os pesos de embalagens de certo produto, obtiveram-se os seguintes valores
(em kg):
16,1 15,9 15,8 16,3 16,2 16,0 16,1 16,0
16,0 16,1 16,0 15,9 16,1 16,0 16,0 15,9
Agrupe os dados em classes e calcule as frequncias relativas e relativas acumuladas por
classe (utilize a regra: n classes = log
2
n + 1 e os limites implcitos para cada classe).
Represente graficamente as distribuies obtidas.

5. Cinco moedas foram lanadas 1000 vezes e, em cada lance, foi anotado o nmero de
"caras". Os nmeros de lances nos quais foram obtidas 0, 1, 2, 3, 4 e 5 "caras" esto indicados
Mtodos Estatsticos Engenharia Alimentar 71
Eduardo Esteves, 2007
na tabela seguinte:
Nmero de "caras" Nmero de lances (frequncia)
0 38
1 144
2 342
3 287
4 164
5 25
Total 1000

a) Represente graficamente os dados incluidos na tabela.
b) Represente numa tabela e graficamente a distribuio de frequncias relativas acumuladas.

6. Foram seleccionados 18 provadores para avaliar sensorialmente o aroma de uma
determinada marca de manteiga. Utilizou-se uma escala de 1 (aroma imperceptvel) a 8
(aroma muito pronunciado). Represente graficamente a distribuio de frequncias relativas
das seguintes clasificaes obtidas no teste:
7 6 7 3 6 6 7 7 6
7 7 4 5 8 6 4 6 6
7. Numa determinada fbrica, pretende-se conhecer a distribuio de frequncias, por calibre
comercial, de 1000 caixas de camaro refrigerado. Num estudo efectuado obtiveram-se os
resultados incluidos na tabela seguinte (os calibres comerciais esto ordenados por ordem
crescente de tamanho do camaro):
Classificao comercial SS S Q K T TG
N de caixas 10 70 60 200 640 20

a) Represente graficamente a distribuio de frequncias absolutas acumuladas.
b) Por leitura do grfico, indique quantas caixas existem com camaro de tamanho inferior ou
igual a S; inferior ou igual a T; e superior a K.

8. Uma amostra constituda pelos seguintes valores:
x
1
=3 x
2
=1 x
3
=2 x
4
=3 x
5
=4 x
6
=5 x
7
=5 x
8
=5 x
9
=9
a) Qual o tamanho da amostra n?
b) Calcule as seguintes medidas: mdia, mediana, moda, menor valor (mnimo), maior valor
(mximo), amplitude total, varincia, desvio-padro e coeficiente de variao.

9. Duas amostras so constituidas pelos seguintes valores:
Amostra #1: 0,9 1,2 1,2 1,3 1,3 1,4 1,4 1,4 1,6
Amostra #2: 1,1 1,1 1,2 1,3 1,3 1,3 1,4 1,4 1,5
Para cada amostra calcule a mdia (sem agrupar os dados) e a amplitude (como medida de
disperso das observaes). Comente os resultados.

Mtodos Estatsticos Engenharia Alimentar 72
Eduardo Esteves, 2007
10. Calcule a mdia, a mediana, o desvio-padro e o coeficiente de variao para: a) a tabela
obtida na questo 2; b) os resultados do problema 3; c) a tabela obtida na questo 4.

11. Utilizando os dados e os resultados do problema 3 calcule:
a) A mdia, a varincia e o desvio-padro sem agrupar os dados.
b) A mdia, a varincia e o desvio-padro com base nos dados agrupados.
c) Compare e comente os resultados obtidos nas alneas anteriores.
d) Determine a mediana utilizando a equao proposta na aula e o polgono de frequncias
relativas acumuladas. Compare os resultados obtidos pelos dois mtodos.

12. Uma amostra de comprimentos de peixe, medidos em cm, foi resumida na seguinte tabela:
Classes de comprimento (cm) N de indivduos
10,5 12,5 2
12,5 14,5 2
14,5 16,5 6
16,5 18,5 8
18,5 20,5 10
20,5 22,5 10
22,5 24,5 36
24,5 26,5 46
26,5 28,5 22
28,5 30,5 6
30,5 32,5 4
32,5 34,5 8
34,5 36,5 6
36,5 38,5 2

a) Qual o intervalo das classes de comprimento? E o ponto mdio de cada classe?
b) Calcule a mdia, a mediana, a varincia, o desvio-padro e o coeficiente de variao da
amostra.
c) Desenhe o histograma da distribuio das frequncias relativas e relativas acumuladas da
amostra, em papel milimtrico.
d) Desenhe o polgono de frequncias relativas acumuladas da amostra em papel milimtrico.
e) Ajuste "a olho" uma curva ao polgono de frequncias desenhado.
f) Com a curva traada, determine o comprimento para o qual 25% dos elementos da amostra
so inferiores (quantil de ordem 25% ou 1 quartil).
g) Determine o quantil de ordem 50% (mediana) e compare com o resultado obtido em b).
h) Marque os quantis de ordem 16% e 84%. Qual o intervalo de comprimentos
compreendido entre os quantis obtidos?
i) Calcule as ordens de quantil correspondentes aos comprimentos x + s, x - s, x + 2s, x - 2s,
x + 3s e x - 3s.
Mtodos Estatsticos Engenharia Alimentar 73
Eduardo Esteves, 2007
j) Calcule a percentagem de elementos da amostra cujos comprimentos esto compreendidos
entre x + 2s e x - 2s.
II PROBABILIDADES (VARIVEIS DISCRETAS)
1. Uma urna de paredes no transparentes contm 6 bolas vermelhas, 4 bolas brancas e 5
bolas azuis, que no se distinguem pelo tacto. Se retirar uma bola da urna, determine a
probabilidade de: a) ser vermelha; b) ser branca; c) ser azul; d) no ser vermelha; e) ser
vermelha ou branca.

2. Determine a probabilidade de cada um dos seguintes eventos: a) surgir um nmero mpar
num nico lance de um dado honesto; b) ocorrer, pelo menos, uma "cara" em dois
lanamentos de uma moeda honesta; c) aparecer o total 7 num nico lanamento de dois
dados; d) surgir o total 2 ou 6 ou 10 num nico lanamento de dois dados; e) aparecer o total
11 num nico lanamento de dois dados, em que um deles est viciado em favor do seis
[P(1)=P(2)=P(3)=P(4)=P(5)=0,16 e P(6)=0,20 em vez de P(i)=0,166(6)].

3. No lanamento simultneo de dois dados, considere o evento "soma dos pontos". a)
Classifique a varivel X ("soma dos pontos") e determine os resultados possveis; b) Calcule a
probabilidade da "soma dos pontos" ser igual a 2 ou 6 ou 10; c) E qual a probabilidade da
"soma dos pontos" ser diferente de 2 ou 6 ou 10?

4. Considere uma populao em que a varivel X tem a seguinte distribuio de
probabilidades:
x
i
2 4
P(X=xi) 0,9 0,1

a) Calcule E{X} e V{X}.
b) Indique todas as amostras possveis, seleccionadas com reposio, de tamanho n=2.
c) Calcule a mdia de cada amostra e a probabilidade de ocorrer cada um desses valores.

5. Considere uma populao em que a varivel Y tem a seguinte distribuio de
probabilidades:
y
i
0 1 2 3 4
P(Y=y
i
) 0,15 0,25 0,30 0,20 0,10

a) Represente graficamente as funes densidade e distribuio de probabilidades.
b) Calcule E{Y}, V{Y} e } {X .
c) Indique todas as amostras possveis, seleccionadas com reposio, de tamanho n=2.
d) Calcule a mdia de cada amostra e a probabilidade de ocorrer cada um desses valores.

6. Considere uma urna com 6 bolas marcadas com os nmeros 2, 6, 8, 10, 10 e 12. Se dessa
urna retirar uma bola, observar e anotar o nmero marcado, repuser a bola na urna e retirar
Mtodos Estatsticos Engenharia Alimentar 74
Eduardo Esteves, 2007
novamente uma bola, os nmeros anotados constituem uma amostra de tamanho n=2 da
varivel X.
a) Construa o espao amostral.
b) Calcule a probabilidade do evento "mdia da amostra igual a 10".
c) Calcule a probabilidade do evento "varincia da amostra igual a 8".

7. Duas mquinas A e B funcionam de forma independente uma da outra. No quadro seguinte,
indicam-se as probabilidades de se verificar o nmero referido de avarias para cada mquina,
no decurso de um dia de trabalho.

N de avarias 0 1 2 3 4 5 6
A 0,1 0,2 0,3 0,2 0,09 0,07 0,04
B 0,3 0,32 0,1 0,08 0,1 0,05 0,05

Calcule: a) a probabilidade do n de avarias em A ser superior a dois; b) a probabilidade do n
total de avarias num dia de trabalho ser inferior a trs; e c) o n mdio de avarias em cada uma
das mquinas.
III PROBABILIDADES (DISTRIBUIES TERICAS DE VARIVEIS DISCRETAS)

1. a) Qual a probabilidade de obter exactamente 2 "caras" em 6 lances de uma moeda no-
viciada? b) Qual a probabilidade de obter, pelo menos, 4 "caras" em 6 lances de uma moeda
no-viciada? c) Em 100 lanamentos de uma moeda no-viciada, qual o nmero esperado de
"caras"?

2. Considerando que 20% dos pacotes de leite embalados por uma mquina so defeituosos,
determine a probabilidade de, entre 4 pacotes, ocorrer: a) 1 defeituoso; b) 0 defeituosos; c) no
mximo 2 pacotes defeituosos.

3. Se a probabilidade de ocorrer um pacote de leite defeituoso apenas de 10%, determine
E{X} e V{X} para uma amostra de 400 pacotes.

4. Supondo que a v.a. X tem distribuio binomial, com parmetros n e p, e que E{X}=5 e
V{X}=4, determine n e p.

5. De uma urna com 6 bolas verdes e 2 bolas brancas, fazem-se 4 extraces repondo, em
cada extraco, a bola na urna.
a) Determine E{X} de sada de bola verde.
b) Determine a probabilidade do valor mdio da distribuio de probabilidades.

6. Considere-se X uma varivel aleatria de distribuio binomial e E{X}=4 e V{X}=8/3.
Calcule n, p e q.

Mtodos Estatsticos Engenharia Alimentar 75
Eduardo Esteves, 2007
7. Considere o lanamento de uma moeda no-viciada. Calcule a probabilidade de, em seis
lanamentos:
a) Sairem 0, 1, 2, 3, 4, 5 e 6 "coroas".
b) Sarem, no mximo, 4 "coroas".
c) Qual o nmero esperado de "coroas" nos 6 lanamentos?
d) Represente a funo densidade de probabilidade da varivel em questo.

8. Uma empresa comercializa garrafas de vinho de 1 litro. Supe-se, no entanto, que 40%
dessas garrafas contm realmente uma menor quantidade de lquido do que o volume indicado
no rtulo. Tendo adquirido 6 dessas garrafas, qual a probabilidade de:
a) Duas delas conterem menos de um litro?
b) No mximo 2 conterem menos de um litro?
c) Pelo menos 2 conterem menos de um litro?
d) Todas conterem menos de um litro?
e) Todas conterem o volume indicado no rtulo?
f) Represente a funo densidade de probabilidade da varivel em questo.

9. Determine a probabilidade de, ao lanar 30 vezes uma moeda, sairem 2 "caras". Determine
o desvio-padro da distribuio de probabilidades.

10. Uma mquina de colocar rtulos em garrafas de vinho no est correctamente calibrada e
origina 3% de garrafas com rtulo mal colocado. Determine a probabilidade de, em 150
garrafas, 4 serem defeituosos.

11. Numa fbrica, 1% dos produtos elaborados so defeituosos. Se seleccionar aleatoriamente
uma amostra de 10 elementos, calcule a probabilidade de:
a) No existir nenhum elemento defeituoso nessa amostra.
b) Existir um elemento defeituoso na amostra.
c) Existir, no mximo, um elemento defeituoso nessa amostra.

12. Numa linha de enchimento de frascos de compota, a falta de calibrao da mquina
origina diariamente 6% de frascos com menos produto do que o pretendido. Se fr
seleccionada aleatoriamente uma amostra de 15 frascos, determine a probabilidade de:
a) Nenhum frasco ser defeituoso.
b) No mximo, 3 frascos terem menos do que o pretendido.

13. Uma fbrica de embalagens, utilizadas para determinado produto alimentar, sabe que em
cada 100 produz duas defeituosas.
a) Qual a probabilidade de um cliente ao comprar 100 embalagens receber todas sem
defeito?
b) Qual a probabilidade de receber, nessa mesma compra, pelo menos 3 embalagens
defeituosas?
Mtodos Estatsticos Engenharia Alimentar 76
Eduardo Esteves, 2007
IV PROBABILIDADES (VARIVEIS CONTNUAS)

1. Calcule, com a ajuda de tabelas, a probabilidade de Z ser:
a) Menor do que +1; b) Menor do que 0; c) Menor do que +2; d) Menor do que +1,96; e)
Menor do que +3.

2. Com a ajuda da tabela de Z, calcule:
a) Prob{1 < Z < 2}; b) Prob{Z > +0,84}; c) Prob{Z < -0,84}.

3. Com a ajuda da tabela de Z, calcule:
a) Prob {-1 < Z < +1}; b) Prob{-2 < Z < +2}; c) Prob{-1 < Z < +3}; d) Prob{-1,96 < Z <
+1,96}.

4. Calcule o valor de z
i
tal que: a) Prob{Z < z
i
}=0,9918; b) Prob{-z
i
< Z < +z
i
}=0,95.

5. Considere a varivel X com distribuio normal, de mdia =3 e varincia
2
=4. Calcule,
recorrendo distribuio normal reduzida e com a ajuda da tabela de z, a Prob{X < 5}.

6. Considere que uma composio de dimetros de ameixas segue uma distribuio normal de
mdia =5 cm e varincia
2
=5,25 cm
2
. Calcule:
a) A probabilidade das ameixas terem dimetros compreendidos entre 3,5 cm e 8 cm.
b) A probabilidade das ameixas terem dimetro maior do que 9,5 cm.
c) A probabilidade das ameixas terem dimetro menor do que 3,5 cm.
d) O dimetro abaixo do qual se encontram 95% das ameixas.
e) O dimetro acima do qual se situa metade da composio de tamanhos das ameixas.
f) O dimetro que corresponde ao quantil de ordem 28%.

7. Considere a v.a. X com distribuio normal de mdia =5 e varincia
2
=9. Calcule A de
modo que Prob{5-A < X < 5+A} seja igual a: a) 68%; b) 95%; c) 99%.

8. Calcule A de modo que:
a) Prob{-A < t <+A}=95% com g.l.=5.
b) Prob{t > A}=2,5% com g.l.=8.
c) Prob{t < A}=95% com g.l.=60.

9. Com a ajuda da tabela de t, calcule:
a) O valor de x tal que Prob{t < x}=0,95 com 40, 60, 120 e graus de liberdade.
b) Compare os valores de x obtidos na alnea anterior com valor de x que se obtm a partir de
Prob{Z < x}=0,95.

10. Considere a distribuio de t para 12 g.l. Determine o valor de t
i
para o qual Prob{t < t
i
}
igual a: a) 0,95; b) 0,90; c) 0,55.
Mtodos Estatsticos Engenharia Alimentar 77
Eduardo Esteves, 2007

11. Determine os valores crticos de t para os quais a rea da extermidade direita da
distribuio de t 0,05 quando: a) g.l.=16; b) g.l.=27; c) g.l.=120.

12. O grfico da distribuio t, com 9 g.l., est representado na figura seguinte. Determine os
valores de t
1
para os quais:
a) A rea sombreada direita = 0,05.
b) A rea sombreada total = 0,05.
c) A rea em branco = 0,99.
d) A rea sombreada esquerda = 0,01.
e) A rea esquerda de t
1
= 0,90.


13. Para a distribuio normal reduzida, os valores de z
i
que satisfazem a afirmao
probabilstica Prob{-z
i
< Z < +z
i
}=0,95 so + 1,96. Para a distribuio t, quais so os valores
correspondentes quando: a) g.l.=9; b) g.l.=20; c) g.l.=30; d) g.l.=60.

14. Admite-se que o tempo de espera num determinado consultrio (v.a. X) se distribui
normalmente. Num dia, seleccionado aleatoriamente, registaram-se os tempos de espera de
onze utentes, calculando-se um tempo mdio de min 41 = x e

= 1690 ) (
2
x x
i
.
a) No mximo, quanto tempo esperar 90% dos utentes daquele consultrio?
b) E qual o tempo mnimo de espera para 95% dos utentes?
V AMOSTRAGEM ALEATRIA, ESTIMAO DE PARMETROS E TESTES DE HIPTESES

1. Considere a seguinte populao estatstica, constituida pelas alturas (em cm) de 39 alunos
de Estatstica do ano lectivo 1992/93 (ver quadro na pgina seguinte).
a) Calcule para a populao a mdia , a varincia
2
e o desvio-padro .
b) Seleccione 5 amostras com critrio aleatrio simples de tamanho n=12, com reposio.
Calcule para cada amostra a mdia x e o desvio-padro s (Utilize a tabela de nmeros
aleatrios; Tabela C anexa, para obter as amostras).
c) Para cada amostra, determine uma estimativa pontual e uma estimativa por intervalo de
confiana da mdia da populao . Compare estas estimativas com o valor de calculado
anteriormente.
Mtodos Estatsticos Engenharia Alimentar 78
Eduardo Esteves, 2007

N de
ordem
Altura
(cm)
N de
ordem
Altura
(cm)
N de
ordem
Altura
(cm)
N de
ordem
Altura
(cm)
1 162 11 163 21 174 31 180
2 170 12 174 22 160 32 153
3 165 13 182 23 170 33 163
4 160 14 162 24 165 34 161
5 157 15 184 25 185 35 172
6 168 16 176 26 172 36 182
7 160 17 158 27 157 37 172
8 158 18 153 28 156 38 160
9 156 19 165 29 167 39 170
10 162 20 166 30 156

2. Pretende-se estimar, com uma confiana de 95%, a mdia de uma populao cuja
varincia
2
=4. Seleccionou-se, aleatoriamente e com reposio, uma amostra de tamanho
n=16. A mdia da amostra foi x =6,8. Apresente uma estimativa pontual de e uma
estimao por intervalos de confiana.

3. Pretende-se estimar a mdia de uma populao com uma confiana de 95%, utilizando
como estimador a mdia de uma amostra seleccionada com critrio aleatrio simples, com
reposio. Assim, recolheram-se 10 elementos com esse critrio, obtendo-se os seguintes
valores: 12, 15, 8, 10, 6, 8, 18, 7, 15 e 11.
a) Calcule a mdia e a varincia da amostra.
b) Calcule um valor aproximado da varincia das mdias na Amostragem.
c) Calcule um valor aproximado do erro-padro das mdias na Amostragem.
d) Calcule o intervalo de confiana de 95% de .

4. Determine o tamanho da amostra n de modo a estimar a mdia de uma populao ,
sabendo que a sua varincia
2
=40 e que o intervalo de confiana de 95% tem amplitude h=4.

5. Considere uma populao com distribuio normal e
2
=0,97, a partir da qual foi
seleccionada, por amostragem aleatria simples com reposio, uma amostra de n=9
elementos. Os valores obtidos foram os seguintes: 10, 12, 14, 11, 15, 14, 10, 13 e 15.
a) Apresente uma estimativa pontual da mdia da populao.
b) Apresente estimativas pontuais da varincia e do erro-padro das mdias na Amostragem.
c) Calcule o intervalo de 95% de confiana da mdia da populao .
d) Calcule a amplitude h do intervalo de confiana obtido na alnea anterior.
e) Se se pretender estimar a mdia populacional com uma amplitude igual a metade da
amplitude calculada na alnea anterior, mantendo o nvel de confiana de 95%, qual o
tamanho aproximado da amostra n que se deveria considerar?
f) Com base nos resultados da alnea anterior, que concluso poder retirar da relao existente
entre a preciso do intervalo de confiana (amplitude h) e o tamanho da amostra, para o
Mtodos Estatsticos Engenharia Alimentar 79
Eduardo Esteves, 2007
mesmo nvel de confiana?
g) Repita os clculos da alnea c) supondo que a varincia da populao no conhecida.
h) Comente os resultados obtidos nas alneas c) e g), explicando tambm a diferena entre
elas.

6. Sabe-se, por experincia, que numa moagem o nmero de sacos de farinha cheios por hora
por uma mquina tem distribuio aproximadamente normal. Em nove dias escolhidos
aleatoriamente foi realizado o controlo do nmero de sacos cheios durante uma hora, tendo-se
obtido os seguintes resultados:

=
=
9
1
10206
i
i
x e

=
=
9
1
2
25688 ) (
i
i
x x
a) Construa um intervalo de confiana de 95% para o nmero mdio de sacos cheios por hora
na fbrica.
b) Construa um intervalo de confiana de 95% para o mesmo parmetro, considerando agora
que =60.
c) Comente os resultados obtidos, explicando tambm a diferena entre eles.

7. Certo equipamento de empacotamento automtico encontra-se regulado para encher
embalagens de 1 kg de determinado produto. O seu deficiente funcionamente origina prejuzo
para a empresa: se a maoria das embalagens tem peso inferior ao estabelecido, haver
reclamaes por parte dos clientes e perda de prestgio; peso excessivo ser, por outro lado,
anti-econmico. Aceita-se, da experincia passada, que o peso das embalagens se comporta
de acordo com a distribuio normal de =12 g. Para verificar a afinao do equipamento,
seleccionaram-se, em certo periodo, nove embalagens cujos pesos foram anotados (em
gramas): 983, 976, 1004, 992, 997, 983, 1011, 1000 e 998.
a) Construa intervalos de confiana para a mdia populacional com os seguintes nveis de
confiana: 90%, 95% e 99%. Como varia a preciso dos intervalos (a sua amplitude h) com o
grau de confiana escolhido?
b) Suponha que, em vez da amostra de nove elementos, tinha sido obtida uma outra aomstra
com 100 embalagens, que aps os necessrios clculos, tinha fornecido um peso mdio
x =994 g. Construa um novo intervalo de confiana de 95%, com base nesta segunda amostra.
Explique a diferena obtida com o aumento do tamanho da amostra.
c) Qual dever ser o tamanho da amostra n a recolher, de tal forma que a amplitude do
intervalo de 95% confiana seja h=2?

8. O contedo (em litros) de garrafas de leo alimentar segue distribuio normal. Admita-se
que os respectivos parmetros so =0,99 litro e =0,02 litro. Nestas condies, qual a
probabilidade de:
a) O contedo mdio numa amostra de 16 garrafas seleccionadas para inspeco ser superior a
1 litro?
b) Numa amostra de 100 garrafas o contedo mdio ser inferior a 9,85 dl?
c) Tendo recolhido uma amostra de 100 garrafas e determinado um contedo mdio inferior a
9,85 dl, que pensaria da hiptese avanada de incio (isto , =0,99 litro)?
d) Encontre um intervalo de confiana tal que a probabilidade de
100
x nele estar contida seja
Mtodos Estatsticos Engenharia Alimentar 80
Eduardo Esteves, 2007
de 0,95, isto encontrar a e b tais que Prob{a <
100
x < b}=0,95.

9. Supe-se que a mdia de uma populao =50 cm. Seleccionou-se uma amostra de
tamanho n=10 com um critrio a.s. com reposio. Obtiveram-se os seguintes valores: x = 53
cm e s=3 cm. Para um nvel de confiana de 99%, verifique se a suposio inicial feita sobre a
mdia populacional verdadeira.

10. Um engenheiro alimentar estudou um processo de reduzir a gordura de um tipo de queijo,
de modo a poder ser consumido por determinado tipo de doentes. Para verificar se o queijo
fabricado pelo novo processo contm, em mdia, menos de 10% de gordura, o engenheiro
pretende realizar um teste de hipteses com base na percentagem mdia de gordura obtida
numa amostra seleccionada aleatoriamente. Assim, verificou-se que, numa amostra de 24
queijos, a percentagem mdia de gordura era de 9,7% e que o desvio-padro era de 1,4%.
a) O que pensar do processo de reduo de gordura no queijo proposto pelo engenheiro (com
confiana de 99%)?
b) Dos dois erros de inferncia provveis de ocorrer neste teste de hipteses, qual lhe parece
ser "o mais perigoso"?

11. Uma fbrica de pasta tomate deve produzir este produto com um pH mdio de 4,5. Sabe-
se que o processo de produo tem =0,25. Para poder controlar o valor da mdia de pH
seleccionou-se, com critrio a.s., uma amostra de 10 embalagens, nas quais foi medido o pH.
Obtiveram-se os seguintes resultados:
4,1 4,2 4,8 4,0 4,2
3,9 4,0 4,7 4,2 4,3
Com uma confiana de 95% pode-se concluir que a pasta de tomate est a ser produzida com
a caracterstica da qualidade indicada?

12. A dose diria recomendada (DDR) de clcio para adultos da classe etria 25 50 anos
800 mg. Duma populao Algarvia, seleccionaram-se com critrio a.s., treze indivduos desse
intervalo de idades, para os quais se determinou a quantidade daquele mineral que ingerem
por dia. Os valores (em mg) para essa amostra da populao foram: 987, 888, 741, 698, 654,
666, 678, 543, 567, 555, 639, 693 e 654.
a) Ser que as pessoas ingerem menor quantidade de clcio do que a DDR?
b) Noutra populao, a quantidade mdia de clcio ingerida (obtida a partir duma amostra a.s.
de vinte adultos) foi de 876 mg (com s = 54 mg). Ser que nesta populao se ingere mais
clcio do que a dose diria recomendada?
VI REGRESSO LINEAR SIMPLES E CORRELAO
1. Considere o seguinte conjunto de 4 pontos [ou pares de dados (x
i
, y
i
)]: (9; 10), (34; 21), (39; 15) e
(59; 25).
a) Represente graficamente aquele conjunto de pontos em papel milimtrico.
b) Que relao parece existir entre os pontos?
c) Calcule a recta dos mnimos quadrados (que melhor se ajusta aos dados).

Mtodos Estatsticos Engenharia Alimentar 81
Eduardo Esteves, 2007
2. Para elaborar uma recta de calibrao que permita quantificar a quantidade de amnia em
amostras de gua obtiveram-se os seguintes pares de valores:

Concentrao (X em mM) 10 20 30 40
ABS (Y x 10
-3
) 182 332 571 699

a) Construa o diagrama de disperso e ajuste uma recta dos mnimos quadrados aos dados.
b) Qual a ABS duma soluo com 25 mM de amnia?
c) Se, numa amostra, a ABS for de 432 (x10
-3
), qual a concentrao de amnia em soluo?
d) Calcule o coeficiente de correlao linear entre as variveis.
e) Teste, com 95% de confiana, se existe correlao linear?
f) Calcule o coeficiente de determinao e interprete o resultado.

3. Durante uma experincia preliminar de cultivo de uma espcie de camaro para eventual
produo em larga escala, obtiveram-se as seguintes taxas de crescimento mdio (em
percentagem) para determinadas temperaturas da gua dos tanques:

Temperatura (X em C) 15 18 21 24
Taxa de crescimento (Y em %) 8,9 9,5 13,1 14,2

a) Construa o diagrama de disperso e ajuste uma recta dos mnimos quadrados aos dados.
b) Qual a taxa de crescimento se a temperatura da gua for de 2 C?
c) Para se atingir uma taxa de crescimento de 10%, qual dever ser a temperatura da gua nos
tanques?
d) Calcule o coeficiente de correlao linear entre as variveis.
e) Teste, com 95% de confiana, se existe correlao linear?
f) Calcule o coeficiente de determinao e interprete o resultado.

4. Numa escola, pretende-se verificar se existe alguma relao entre a altura (em cm) e o peso
(em kg) dos estudantes. Com esse objectivo, foram seleccionados aleatoriamente 100 alunos,
tendo-se obtido os seguintes pesos mdios para diferentes valores de alturas:

Altura 155 150 180 135 156 168 178 160 132 145 139 152
Peso mdio 70 63 72 60 66 70 74 65 62 67 65 68

a) Construa o diagrama de disperso dos dados em papel milimtrico, considerando a altura
como varivel independente. Que tipo de relao parece existir entre as duas variveis?
b) Ajuste uma recta dos mnimos quadrados aos dados da tabela.
c) Calcule o coeficiente de correlao linear r e verifique se significativamente diferente de
zero, para um nvel de significncia de 5%. Que concluso pode retirar da relao entre a
altura e o peso dos estudantes?
d) Que percentagem da variabilidade de Y explicada pelo modelo de regresso obtido?

Mtodos Estatsticos Engenharia Alimentar 82
Eduardo Esteves, 2007
5. O nmero mdio de bactrias por unidade de volume existente numa cultura depois de x
horas apresentado na tabela seguinte:

N horas (X) 0 1 2 3 4 5 6
N Bactrias (Y x10
4
) 32 35 65 80 120 195 275

a) Construa o diagrama de disperso dos dados em papel milimtrico. Que tipo de relao
parece existir entre as duas variveis?
b) Calcule o logartmo neperiano dos valores do nmero mdio de bactrias por unidade de
volume. Construa novo diagrama de disperso, agora com os valores de tempo (N horas) e o
logartmo neperiano do nmero de bactrias, isto , grfico de X versus ln(Y). Que tipo de
relao parece existir entre o tempo e ln(n bactrias)?
c) Ajuste uma recta dos mnimos quadrados aos dados obtidos na alnea anterior.
d) Calcule o coeficiente de correlao linear r. Com uma confiana de 95% e de 99%,
verifique se r diferente de zero. Que concluso pode retirar da relao entre o tempo e e
nmero de bactrias?
e) Calcule o coeficiente de determinao e interprete o resultado que obteve.
f) Estime o nmero esperado de bactrias ao fim de 7 horas de incubao da cultura.

6. A tabela seguinte inclui os valores experimentais da presso P (em lb/in
2
) e respectivo
volume V (in
3
) de uma dada massa de gs.

Volume 54,3 61,8 72,4 88,7 118,6 194,0
Presso 61,2 49,5 37,6 28,4 19,2 10,1

a) Construa o diagrama de disperso a partir dos dados da tabela, considerando o volume
como a varivel independente. Que tipo de relao parece existir entre as duas variveis?
b) Logaritmize os valores obtidos para ambas as variveis e represente os resultados-
transformados num novo diagrama de disperso. Que relao parece extir entre as variveis-
transformadas?
c) Ajuste uma recta dos mnimos quadrados aos resultados da alnea anterior e verifique se
existe correlao linear entre log(Presso) e log(Volume).
d) Verifique que, entre P e V, existe uma relao da forma PV

=C, em que e C so
constantes. Determine os valores de e C.
e) Calcule o coeficiente de determinao e interprete o resultado que obteve.
f) Estime o valor da presso para V=100 in
3
.

Mtodos Estatsticos Engenharia Alimentar 83
Eduardo Esteves, 2007
VII SOLUES DOS EXERCCIOS
I - Amostra.

1.
a) G={qualquer valor desde zero at capacidade mxima do recipiente}; var. contnua.
b) B={0, 1, 2, ... at ao mximo de caixas armazenveis}; var. discreta.
c) S={2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}; var. discreta.
d) D [limte inferior, limite superior]; var. contnua.
e) T R
+
; var. contnua.
f) C ={qualquer valor desde zero at capacidade mxima da garrafa}; var. contnua.

2.
Classes Pi F Facum
213,5 229,5 221,5 4 4
229,5 245,5 237,5 1 5
245,5 261,5 253,5 5 10
261,5 277,5 269,5 4 14
277,5 293,5 285,5 3 17

3.
Classes Pi f Facum
60,5 62,5 61,5 0,37 11
62,5 64,5 63,5 0,17 16
64,5 66,5 65,5 0,07 18
66,5 68,5 67,5 0,13 22
68,5 70,5 69,5 0,03 23
70,5 72,5 71,5 0,23 30

4.
Classes Pi f facum
15,75 15,87 15,81 0,06 0,06
15,87 15,99 15,93 0,19 0,25
15,99 16,11 16,05 0,63 0,88
16,11 16,23 16,17 0,06 0,94
16,23 16,35 16,29 0,06 1,00
5.
N de "caras" facum
0 0,038
1 0,182
2 0,524
3 0,811
4 0,975
5 1,000

6.
Escala f
1 0,000
2 0,000
3 0,056
4 0,111
5 0,056
6 0,389
7 0,333
8 0,056





Mtodos Estatsticos Engenharia Alimentar 84
Eduardo Esteves, 2007

7.
a) b) n
(S)
=80, n
(T)
=980, n
(>K)
=660.
Classes comerciais Facum
SS 10
S 80
Q 140
K 340
T 980
TG 1000

8. a) n=9
b) x =4,11; M=4; moda= 5; mnimo=1; mximo=9; h=8;
2
=5,3611; =2,3154; c.v.=56,32%

9. Amostra #1: x =1,3 e h=0,7; Amostra #2: x =1,3 e h=0.4.

10. a) M=256,7 b) M=64,1 c) M=16,00

11. a) x =65,7;
2
=15,65; =3,96 b) x =65,5;
2
=16,55; =4,07 d) M=64,1

12. a) 2 cm; 11,5 cm; 13,5 cm; 15,5 cm...; 33,5 cm; 35,5 cm; 37,5 cm.
b) x =24,86 cm; s
2
=24,638 cm
2
; s=4,964 cm; c.v.=19,97%
f) 21,7 cm g) 23,9 cm h) [19,1 cm; 27,3 cm]
i) x + s = 29,8 cm 88%; x - s = 19,9 cm 18%; x + 2s = 34,8 cm 98%; x - 2s = 14,9
cm 5%; x + 3s = 39,7 cm e x - 3s = 9,98 cm (estes ltimos resultados encontram-se fora
dos limites dos dados)
j) 93%


II Probabilidades (variveis discretas)

1. a) P{"vermelha"}=2/5 b) P{"branca"}=4/15 c) P{"azul"}=1/3
d) P{~"vermelha"}=3/5 e) P{"vermelha ou branca"}=2/3

2. a) P{impar}=1/2 b) P{cara}=3/4 c) P{total=7}=1/6 d) P(total=2; 6 ou 10)=2/9
e) P{total=11}=3/50=0,06

3. a) X Varivel discreta; x
i
= 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
b) P{soma=2 ou 6 ou 10}=2/9 c) P{soma2 ou 6 ou 10}=3/4

4. a) E{X}=2,2; V{X}=0,36 b) S={(2,2), (2,4), (4,2), (4,4)}
Mtodos Estatsticos Engenharia Alimentar 85
Eduardo Esteves, 2007
c) P{ x =2}=0,81; P{ x =2}=0,18; P{ x =2}=0,01

5. b) E{X}=1,85; V{X}=1,428; V{X}=1,195

6. b) P{ x =10}=1/6 c) P{
2
=8}=2/9 7. a) P{X<3}=0,286 b) E{X
A
}=2,35 e E{X
B
}=1,71

III Probabilidades (distribuies tericas de variveis discretas)

1. a) P{X=2}=0,2344 b) P{X=4}=0,3438 c) E{X}=50

2. a) P{X=1}=0,4096 b) P{X=0}=0,4046 c) P{X2}=0,9728

3. E{X}=40; V{X}=36 4. n=25; p=1/5

5. a) E{X}=3 b) P{X=E{X}}=0,4219 6. n=12; p=1/3; q=2/3

7.
a) P{X=0}=0,0156; P{X=1}=0,0938; P{X=2}=0,2344; P{X=3}=0,3125; P{X=4}=0,2344;
P{X=5}=0,0938; P{X=6}=0,0156
b) P{X4}=0,8907 c) E{X}=3

8. a) P{X<1 l}=0,3110 b) P{X2 l}=0,5443 c) P{X2 l}=0,7667
d) P{X<1 l}=0,0041 e) P{X=1 l}=0,0467

9. P{X=2}=0,0344 x 10
-3
; V{X}=3,873 10. P{X=4}=0,1897

11. a) P{X=0}=0,9048 b) P{X=1}=0,0905 c) P{X1}=0,9953

12. a) P{X=0}=0,4066 b) P{X3}=0,9865

13. a) P{X=0}=0,1353 b) P{X3}=0,3233

IV Probabilidades (variveis contnuas)

1. a) P{Z<+1}=0,8413 b) P{Z<0}=0,5000 c) P{Z<+2}=0,9772
d) P{Z<+1,96}=0,9750 e) P{Z<+3}=0,9987

2. a) P{1<Z<2}=0,1359 b) P{Z>+0,84}=0,2005 c) P{Z<-0,84}=0,2005

3. a) P{-1<Z<+1}=0,6824 b) P{-2<Z<+2}=0,9544 c) P{-1<Z<+3}=0,8400
d) P{-1,96<Z<+1,96}=0,9500
Mtodos Estatsticos Engenharia Alimentar 86
Eduardo Esteves, 2007

4. a) z
i
=2,40 b) z
i
=1,96 5. P{X<5}=0,8413

6. a) P{3,5 cm<X<8,0 cm}=0,6471 b) P{X>9,5 cm}=0,0250
c) P{X<3,5 cm}=0,2578 d) X=8,78 cm e) X=5 cm f) X=3,67 cm

7. a) A=3 b) A=5,88 c) A=7,74

8. a) A=2,571 b) A=2,306 c) A= 1,671

9. a) x
40
=1,684; x
60
=1,671; x
120
=1,658; x

=1,645 b) x=1,645

10. a) t
i
=1,782 b) t
i
=1,356 c) t
i
=0,128

11. a) t=1,746 b) t=1,703 c) t=1,658

12. a) t
1
=1,833 b) t
1
=2,262 c) t
1
=3,250 d) t
1
=2,821
e) t
1
=1,383

13. a) t
i
=2,262 b) t
i
=2,086 c) t
i
=2,042 d) t
i
=2,000

14. a) t=58,8 min b) t=17,4 min

V Amostragem aleatria, Estimao de parmetros e Testes de hiptese

1. a) =166,05 cm;
2
=75,59 cm
2
; =8,69 cm

2. x =6,8; P{5,82<<7,78}=0,95 ou [5,82; 7,78]

3. a) x =11,00; s
2
=15,778 b) V{X}=1,5778 c) V{X}=1,2651
d) P{8,16<<13,83}=0,95 ou [8,16; 13,83] 4. n=39

5. a) x =12,67 b) V{X}=0,1078; V{X}=0,3283 c) [12,03; 13,31]
d) h=1,28 e) n=37 g) [11,13; 14,21]

6. a) [1090,4; 1177,6] b) [1094,8; 1173,2]

7.a) P{987,16<<1000,38}=90%; P{958,94<<1001,62}=95%; P{983,46<<1004,10}=99%
b) P{991,65<<996,35}=95% c) n=554

8. a) P{ x >1 litro}=0,0228 b) P{ x <9,85 dL}=0,0062
Mtodos Estatsticos Engenharia Alimentar 87
Eduardo Esteves, 2007
c) P{0,9861 litro< x <0,9939 litro}=95% logo rejeita-se H
0
: =0,99 litro, i.e. com 95% de
confiana pode-se dizer que a suposio inicial falsa.
d) [9,9861 litro; 0,9939 litro]

9. P{46,92 cm< x <53,08 cm}=99% logo no se rejeita a H
0
porque L
1
< x < L
2
i.e. com uma
confiana de 99% pode-se afirmar que a mdia da populao de 50 cm.

10. a) Como x > (L=9,29%) no se rejeita H
0
com uma confiana de 99%, i.e. pode-se
afirmar que o processo de reduo da gordura no surtiu efeito; b) porque se se rejeitar H
0

ento conclui-se que o teor em gordura <10% quando na realidade no , o que representa
maior perigo para os doentes.

11. P{4,35< x <4,65}=95% e, por isso, rejeita-se H
0
, ou seja, com 95% de confiana, a fbrica
no est a produzir pasta de tomate com pH
mdio
=4,5.

12. a) Como x < (L=794,45 mg) rejeita-se a H
0
, i.e., com 95% de confiana as pessoas esto a
consumir menos do que 800 mg de clcio por dia; b) Uma vez que x > (L=820,88 mg) rejeita-
se a H
0
, ou seja, com 95% de confiana as pessoas esto a consumir mais do que 800 mg de
clcio por dia.

VI Regresso linear e Correlao

1. y =7,71 + 0,29 x 2. a) y = -1,5 + 17,9 x b) y =44610
-3

c) x =24,2 mM d) r=0,9934 e) Como r>(L
2
=0.349), rejeita-se H
0
. f) r
2
=0,987

3. a) y = -1,25 + 0,65 x b) y =0,05% c) x =17,3 C d) r=0,961
e) Como r>(L
2
=0.841), rejeita-se H
0
. f) r
2
=0,924

4. b) y =31,066 + 0,232 x
c) r=0,863. P{-0,356<r<+0,356}=95%, portanto um nvel de confiana de 95% rejeita-se H
0
:
=0, i.e. no existe correlao linear entre variveis d) r
2
=0,745

5. c) ln y=3,339 + 0,375 x
d) r=0,992. P{-0,100<r<+0,100}=0,95 e P{-0,157<r<+0,157}=0,99, logo rejeita-se a H
0
: =0
para ambos os nveis de confiana, ou seja, no existe correlao linear entre variveis
e) r
2
=0,984 f) y
(x=7 h)
=389,2 x 10
4
bactrias (usando forma linearizada da relao)

6. c) log P= 4,203 1,404 log V
r=-0,999; P{-0,073<r<+0,073}=95% e P{-0,122<r<+0,122}=99%, logo rejeita-se H
0
, i.e.
existe correlao linear entre as variveis transformadas.
d) =1,404; C=15971,807 e) r
2
=0,998 f) P

(V=100 in
3
)=24,83 lb/in
2

Mtodos Estatsticos Engenharia Alimentar 88
Eduardo Esteves, 2007
TABELAS

A. Tabela de probabilidades acumuladas da distribuio normal reduzida Z.
B. Tabela de probabilidades acumuladas da distribuio t de Student.
C. Tabela de nmeros aleatrios.
D. Tabela dos valores crticos do coeficiente de correlao r.

Mtodos Estatsticos Engenharia Alimentar 89
Eduardo Esteves, 2007
A. Tabela de probabilidades acumuladas da distribuio normal reduzida Z.
[Os valores na tabela referem-se probabilidade (rea assinalada com p) de Z tomar valores
entre 0 e z
i
pretendido. Nota: esta tabela apenas inclui valores para a poro positiva da
distribuio, da os valores que nela constam variarem entre 0,0000 e 0,5000].
Z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,0319 0,0359
0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753
0,2 0,0793 0,0832 0,0871 0,0910 0,0948 0,0987 0,1026 0,1064 0,1103 0,1141
0,3 0,1179 0,1217 0,1255 0,1293 0,1331 0,1368 0,1406 0,1443 0,1480 0,1517
0,4 0,1554 0,1591 0,1628 0,1664 0,1700 0,1736 0,1772 0,1808 0,1844 0,1879
0,5 0,1915 0,1950 0,1985 0,2019 0,2054 0,2088 0,2123 0,2157 0,2190 0,2224
0,6 0,2257 0,2291 0,2324 0,2357 0,2389 0,2422 0,2454 0,2486 0,2517 0,2549
0,7 0,2580 0,2611 0,2642 0,2673 0,2704 0,2734 0,2764 0,2794 0,2823 0,2852
0,8 0,2881 0,2910 0,2939 0,2967 0,2995 0,3023 0,3051 0,3078 0,3106 0,3133
0,9 0,3159 0,3186 0,3212 0,3238 0,3264 0,3289 0,3315 0,3340 0,3365 0,3389
1,0 0,3413 0,3438 0,3461 0,3485 0,3508 0,3531 0,3554 0,3577 0,3599 0,3621
1,1 0,3643 0,3665 0,3686 0,3708 0,3729 0,3749 0,3770 0,3790 0,3810 0,3830
1,2 0,3849 0,3869 0,3888 0,3907 0,3925 0,3944 0,3962 0,3980 0,3997 0,4015
1,3 0,4032 0,4049 0,4066 0,4082 0,4099 0,4115 0,4131 0,4147 0,4162 0,4177
1,4 0,4192 0,4207 0,4222 0,4236 0,4251 0,4265 0,4279 0,4292 0,4306 0,4319
1,5 0,4332 0,4345 0,4357 0,4370 0,4382 0,4394 0,4406 0,4418 0,4429 0,4441
1,6 0,4452 0,4463 0,4474 0,4484 0,4495 0,4505 0,4515 0,4525 0,4535 0,4545
1,7 0,4554 0,4564 0,4573 0,4582 0,4591 0,4599 0,4608 0,4616 0,4625 0,4633
1,8 0,4641 0,4649 0,4656 0,4664 0,4671 0,4678 0,4686 0,4693 0,4699 0,4706
1,9 0,4713 0,4719 0,4726 0,4732 0,4738 0,4744 0,4750 0,4756 0,4761 0,4767
2,0 0,4772 0,4778 0,4783 0,4788 0,4793 0,4798 0,4803 0,4808 0,4812 0,4817
2,1 0,4821 0,4826 0,4830 0,4834 0,4838 0,4842 0,4846 0,4850 0,4854 0,4857
2,2 0,4861 0,4864 0,4868 0,4871 0,4875 0,4878 0,4881 0,4884 0,4887 0,4890
2,3 0,4893 0,4896 0,4898 0,4901 0,4904 0,4906 0,4909 0,4911 0,4913 0,4916
2,4 0,4918 0,4920 0,4922 0,4925 0,4927 0,4929 0,4931 0,4932 0,4934 0,4936
2,5 0,4938 0,4940 0,4941 0,4943 0,4945 0,4946 0,4948 0,4949 0,4951 0,4952
2,6 0,4953 0,4955 0,4956 0,4957 0,4959 0,4960 0,4961 0,4962 0,4963 0,4964
2,7 0,4965 0,4966 0,4967 0,4968 0,4969 0,4970 0,4971 0,4972 0,4973 0,4974
2,8 0,4974 0,4975 0,4976 0,4977 0,4977 0,4978 0,4979 0,4979 0,4980 0,4981
2,9 0,4981 0,4982 0,4982 0,4983 0,4984 0,4984 0,4985 0,4985 0,4986 0,4986
3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990
3,1 0,4990 0,4991 0,4991 0,4991 0,4992 0,4992 0,4992 0,4992 0,4993 0,4993
3,2 0,4993 0,4993 0,4994 0,4994 0,4994 0,4994 0,4994 0,4995 0,4995 0,4995
3,3 0,4995 0,4995 0,4995 0,4996 0,4996 0,4996 0,4996 0,4996 0,4996 0,4997
3,4 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4997 0,4998
3,5 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998 0,4998
3,6 0,4998 0,4998 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,7 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,8 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999 0,4999
3,9 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000 0,5000
0
0,1
0,2
0,3
0,4
0,5
-4 -2 0 2 4
f
z
i
Z
p


Mtodos Estatsticos Engenharia Alimentar 90
Eduardo Esteves, 2007
B. Tabela de probabilidades acumuladas da distribuio t de Student.
[A tabela apresenta os valores de t para determinadas combinaes do nvel de confiana c
(1 ) e de graus de liberdade ( = n 1). A rea p corresponde probabilidade de t assumir
valores menores do que t
i
].
t
g.l. 0,55 0,75 0,9 0,95 0,975 0,99 0,995 0,9995
1 0,158 1,000 3,078 6,314 12,706 31,821 63,656 636,578
2 0,142 0,816 1,886 2,920 4,303 6,965 9,925 31,600
3 0,137 0,765 1,638 2,353 3,182 4,541 5,841 12,924
4 0,134 0,741 1,533 2,132 2,776 3,747 4,604 8,610
5 0,132 0,727 1,476 2,015 2,571 3,365 4,032 6,869
6 0,131 0,718 1,440 1,943 2,447 3,143 3,707 5,959
7 0,130 0,711 1,415 1,895 2,365 2,998 3,499 5,408
8 0,130 0,706 1,397 1,860 2,306 2,896 3,355 5,041
9 0,129 0,703 1,383 1,833 2,262 2,821 3,250 4,781
10 0,129 0,700 1,372 1,812 2,228 2,764 3,169 4,587
11 0,129 0,697 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,695 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,694 1,350 1,771 2,160 2,650 3,012 4,221
14 0,128 0,692 1,345 1,761 2,145 2,624 2,977 4,140
15 0,128 0,691 1,341 1,753 2,131 2,602 2,947 4,073
16 0,128 0,690 1,337 1,746 2,120 2,583 2,921 4,015
17 0,128 0,689 1,333 1,740 2,110 2,567 2,898 3,965
18 0,127 0,688 1,330 1,734 2,101 2,552 2,878 3,922
19 0,127 0,688 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,687 1,325 1,725 2,086 2,528 2,845 3,850
21 0,127 0,686 1,323 1,721 2,080 2,518 2,831 3,819
22 0,127 0,686 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,685 1,319 1,714 2,069 2,500 2,807 3,768
24 0,127 0,685 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,684 1,316 1,708 2,060 2,485 2,787 3,725
26 0,127 0,684 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,684 1,314 1,703 2,052 2,473 2,771 3,689
28 0,127 0,683 1,313 1,701 2,048 2,467 2,763 3,674
29 0,127 0,683 1,311 1,699 2,045 2,462 2,756 3,660
30 0,127 0,683 1,310 1,697 2,042 2,457 2,750 3,646
35 0,127 0,682 1,306 1,690 2,030 2,438 2,724 3,591
40 0,126 0,681 1,303 1,684 2,021 2,423 2,704 3,551
45 0,126 0,680 1,301 1,679 2,014 2,412 2,690 3,520
50 0,126 0,679 1,299 1,676 2,009 2,403 2,678 3,496
55 0,126 0,679 1,297 1,673 2,004 2,396 2,668 3,476
60 0,126 0,679 1,296 1,671 2,000 2,390 2,660 3,460
65 0,126 0,678 1,295 1,669 1,997 2,385 2,654 3,447
70 0,126 0,678 1,294 1,667 1,994 2,381 2,648 3,435
75 0,126 0,678 1,293 1,665 1,992 2,377 2,643 3,425
80 0,126 0,678 1,292 1,664 1,990 2,374 2,639 3,416
85 0,126 0,677 1,292 1,663 1,988 2,371 2,635 3,409
90 0,126 0,677 1,291 1,662 1,987 2,368 2,632 3,402
95 0,126 0,677 1,291 1,661 1,985 2,366 2,629 3,396
100 0,126 0,677 1,290 1,660 1,984 2,364 2,626 3,390
120 0,126 0,677 1,289 1,658 1,980 2,358 2,617 3,373
0,126 0,675 1,282 1,645 1,960 2,327 2,576 3,291
p
0
0,1
0,2
0,3
0,4
0,5
-4 -2 0 2 4
f

p
t
i
t

Mtodos Estatsticos Engenharia Alimentar 91
Eduardo Esteves, 2007
C. Tabela de nmeros aleatrios
*
.
[Os nmeros desta tabela podem ser escolhidos de qualquer modo, desde que o procedimento
seja sistemtico e determinado a priori].
Linha
1 7 5 8 6 5 2 3 1 2 3 2 9 4 3 3 2 4 5 0 1 8 5 3 1 3 1 0 4 2 6
2 9 9 4 7 1 1 8 8 3 6 4 9 0 7 0 0 4 9 0 5 8 2 7 0 3 4 9 0 6 5
3 0 9 0 1 4 6 0 3 5 7 2 0 7 4 1 5 4 2 5 0 5 8 8 0 8 1 6 9 7 3
4 4 7 7 5 5 9 0 4 7 7 0 7 7 4 8 0 7 0 2 2 2 6 8 9 4 4 7 7 8 6
5 8 6 6 9 9 6 1 9 7 8 2 4 3 2 8 5 2 9 4 8 5 8 6 8 8 3 7 4 8 2
6 1 3 9 9 9 4 5 8 6 0 1 4 9 9 4 3 1 4 5 6 9 2 6 4 2 9 0 5 6 6
7 9 7 2 2 6 7 1 4 7 1 8 4 4 6 1 5 6 4 4 4 2 8 9 2 3 5 3 6 8 7
8 3 7 3 3 0 4 5 5 7 3 8 1 5 7 3 8 0 8 5 6 1 7 7 2 9 1 7 4 6 8
9 3 2 6 9 2 1 9 9 1 2 3 7 9 9 5 6 9 5 5 4 4 5 9 0 9 8 1 4 7 8
10 7 3 3 1 7 7 3 5 5 9 0 2 7 2 5 2 9 3 6 1 6 8 9 4 9 0 0 7 2 4
11 5 6 1 4 6 4 5 8 4 9 4 3 0 7 7 4 8 9 7 7 8 1 9 3 1 5 8 3 2 5
12 0 3 2 5 3 4 1 2 6 3 7 5 8 1 6 3 1 4 9 9 0 8 3 3 4 7 2 5 0 5
13 4 5 8 3 7 8 2 8 7 8 5 1 8 6 2 4 7 3 1 9 2 0 5 8 5 7 2 8 1 1
14 7 2 7 4 7 6 7 2 0 1 6 4 8 1 8 2 4 6 1 7 8 5 6 5 3 2 0 0 5 1
15 6 8 0 9 0 4 7 9 1 3 6 0 7 9 5 6 1 8 7 6 9 6 1 3 4 9 8 8 5 4
16 6 6 4 8 4 2 1 3 2 0 1 7 5 4 0 1 0 2 3 9 3 4 5 5 4 3 3 8 0 5
17 5 1 3 8 7 1 1 3 7 9 8 7 3 6 6 4 5 8 5 8 8 7 4 3 7 5 1 9 9 7
18 1 2 3 2 7 3 9 1 2 5 1 2 3 1 1 7 9 9 2 7 2 4 2 3 7 2 6 4 6 2
19 8 6 4 2 9 5 0 2 3 6 4 1 4 9 3 7 3 4 9 8 6 9 0 2 0 4 2 1 8 9
20 1 9 2 7 5 6 4 2 0 7 0 0 4 3 1 3 2 3 1 1 6 2 4 4 7 9 1 3 2 4
21 0 3 9 7 3 8 8 8 0 1 5 8 8 9 5 7 4 8 5 2 1 7 7 7 8 2 0 8 1 2
22 1 1 1 8 5 7 1 9 5 2 6 1 6 7 4 4 5 5 4 5 2 2 6 6 2 8 4 3 1 4
23 4 5 6 3 8 9 4 1 2 8 5 0 5 8 8 8 7 0 8 9 4 4 6 5 7 1 1 6 1 8
24 6 4 3 6 5 4 5 5 8 6 3 4 5 6 1 9 3 9 7 5 3 0 7 2 1 6 0 7 0 0
25 7 7 1 0 0 0 1 5 3 2 7 2 9 9 1 3 4 6 2 2 2 0 8 0 0 8 9 1 3 1
26 3 5 5 4 3 8 6 4 1 0 0 7 6 4 6 2 7 4 7 3 7 6 7 9 7 9 2 9 1 8
27 5 6 2 1 4 6 9 1 4 2 1 7 6 9 7 0 9 7 7 7 4 6 3 9 1 4 5 6 6 9
28 1 1 5 1 7 3 6 1 5 5 2 3 7 1 5 3 9 8 2 4 4 1 1 9 2 4 5 5 9 6
29 6 6 4 7 1 5 2 4 9 4 8 5 8 4 5 6 6 9 3 4 3 7 0 8 1 3 2 3 9 2
30 9 1 9 6 7 1 9 0 4 9 9 8 8 0 1 2 5 1 3 7 1 3 4 4 9 7 7 8 4 1
31 5 3 2 7 0 8 3 8 1 6 7 3 3 4 3 2 2 3 4 3 4 5 6 2 7 9 4 2 2 0
32 4 3 8 6 0 2 6 3 9 2 0 9 8 8 8 3 0 9 6 7 5 7 4 7 1 8 9 4 7 0
33 0 2 0 1 9 7 4 3 4 6 4 6 4 4 1 1 6 1 1 4 3 4 1 4 3 5 1 4 7 4
34 0 1 2 0 8 2 3 8 4 1 9 4 8 1 3 4 1 8 4 5 5 4 6 0 1 3 1 7 0 9
35 5 1 6 4 2 3 9 4 8 3 6 8 8 9 5 3 6 0 3 1 0 7 9 4 2 5 5 2 3 3
36 3 7 1 2 0 7 2 9 3 2 6 6 2 1 1 9 2 8 7 3 2 9 0 7 4 0 8 7 7 6
37 9 2 0 3 9 7 8 5 2 7 7 7 3 8 8 7 9 7 9 7 3 7 3 6 7 1 4 6 7 7
38 5 2 3 5 2 5 7 2 9 3 9 6 7 5 7 9 6 7 9 8 5 8 4 7 4 5 9 7 4 8
39 7 4 1 3 7 4 2 5 0 7 5 0 3 2 6 4 1 0 1 3 6 1 1 1 2 1 2 2 2 5
40 3 0 0 6 3 0 3 0 5 5 0 4 0 9 9 8 4 5 4 4 8 8 9 5 7 0 1 6 6 3
41 2 1 4 9 5 3 2 1 5 8 9 1 1 5 8 5 2 8 9 4 7 5 7 9 7 4 0 7 9 9
42 2 6 7 4 1 9 0 9 8 7 4 8 5 3 2 3 7 9 8 3 8 8 2 0 2 5 9 4 2 5
43 0 7 4 8 9 6 8 0 4 6 1 1 2 0 8 1 0 7 9 8 0 3 7 8 4 0 9 3 5 8
44 5 0 5 6 6 0 0 5 2 9 9 5 7 9 5 5 0 8 1 6 5 0 5 7 6 0 2 1 3 6
45 0 9 4 7 9 9 0 6 6 5 5 6 6 9 4 5 4 3 5 9 9 9 0 9 1 9 5 2 9 2
46 4 4 7 1 3 6 1 9 8 8 5 6 0 2 8 0 4 9 6 7 7 2 1 0 4 3 6 0 3 8
47 8 4 9 4 5 0 5 2 1 1 8 0 7 3 8 8 2 6 6 3 9 5 2 2 3 5 9 7 6 3
48 4 0 1 5 8 7 3 9 9 0 4 2 8 1 8 0 2 3 3 3 5 2 8 8 9 0 5 7 4 8
49 8 5 0 3 1 0 6 8 5 1 0 3 7 0 9 7 3 7 4 4 7 0 8 6 8 6 4 5 4 1
50 3 7 4 3 7 5 0 2 2 4 7 1 6 6 1 1 1 9 9 5 5 4 6 0 0 0 1 8 2 1
Coluna
1-5 6-10 11-15 16-20 21-25 25-30


*
De facto estes nmeros so pseudo-aleatrios em virtude do software usado para os gerar (Microsoft Excel).
Mtodos Estatsticos Engenharia Alimentar 92
Eduardo Esteves, 2007
D. Tabela dos valores crticos do coeficiente de correlao r.
[Apresentam-se na tabela os valores crticos de r para determinadas combinaes de graus de
liberdade ( = n 2) e de nvel de confiana (1 ). Se r obtido em certa amostra de tamanho
n for superior ao valor crtico apresentado para determinado nvel de significncia ento
rejeita-se a H
0
: = 0, i.e. existe correlao linear entre variveis].
g.l. 0.1 0.05 0.01 0.001
1 0.9877 0.9969 0.9999 1.0000
2 0.9000 0.9500 0.9900 0.9990
3 0.8054 0.8783 0.9587 0.9911
4 0.7293 0.8114 0.9172 0.9741
5 0.6694 0.7545 0.8745 0.9509
6 0.6215 0.7067 0.8343 0.9249
7 0.5822 0.6664 0.7977 0.8983
8 0.5494 0.6319 0.7646 0.8721
9 0.5214 0.6021 0.7348 0.8470
10 0.4973 0.5760 0.7079 0.8233
11 0.4762 0.5529 0.6835 0.8010
12 0.4575 0.5324 0.6614 0.7800
13 0.4409 0.5140 0.6411 0.7604
14 0.4259 0.4973 0.6226 0.7419
15 0.4124 0.4821 0.6055 0.7247
16 0.4000 0.4683 0.5897 0.7084
17 0.3887 0.4555 0.5751 0.6932
18 0.3783 0.4438 0.5614 0.6788
19 0.3687 0.4329 0.5487 0.6652
20 0.3598 0.4227 0.5368 0.6524
21 0.3515 0.4132 0.5256 0.6402
22 0.3438 0.4044 0.5151 0.6287
23 0.3365 0.3961 0.5052 0.6178
24 0.3297 0.3882 0.4958 0.6074
25 0.3233 0.3809 0.4869 0.5974
26 0.3172 0.3739 0.4785 0.5880
27 0.3115 0.3673 0.4705 0.5789
28 0.3061 0.3610 0.4629 0.5703
29 0.3009 0.3550 0.4556 0.5621
30 0.2960 0.3494 0.4487 0.5541
35 0.2746 0.3246 0.4182 0.5189
40 0.2573 0.3044 0.3932 0.4896
45 0.2429 0.2876 0.3721 0.4647
50 0.2306 0.2732 0.3542 0.4432
55 0.2201 0.2609 0.3385 0.4244
60 0.2108 0.2500 0.3248 0.4079
65 0.2027 0.2404 0.3126 0.3931
70 0.1954 0.2319 0.3017 0.3798
75 0.1888 0.2242 0.2919 0.3678
80 0.1829 0.2172 0.2830 0.3568
90 0.1726 0.2050 0.2673 0.3375
100 0.1638 0.1946 0.2540 0.3211
150 0.1339 0.1593 0.2084 0.2643

Você também pode gostar