Você está na página 1de 140

104

Introduo ao e-learning

FMD_i.p65 104 15-01-2004, 10:49


Manual de Exerccios

NDICE
1. INTRODUO ................................................................................. 4
1.1 Definies Gerais ........................................................................ 5
1.1.1. Populao 5
1.1.2. Variveis ou atributos 5
1.1.3. Processo de amostragem 5
1.2 A Estatstica Descritiva e a Estatstica Indutiva ................... 6
2. ESTATSTICA DESCRITIVA ................................................................ 8
2.1 Variveis Qualitativas ................................................................. 8
2.2 Variveis Quantitativas Discretas ............................................. 9
2.3 Variveis Quantitativas Contnuas ............................................ 10
2.4 Medidas de Localizao ............................................................. 11
2.4.1. Mdia 11
2.4.2. Mediana 12
2.4.3. Moda 13
2.5 Medidas de Ordem ...................................................................... 13
2.6 Medidas de Assimetria ............................................................... 14
2.7 Medidas de Disperso ................................................................ 15
2.7.1. Disperso Absoluta 15
2.7.2. Disperso Relativa 16
2.8 Anlise de Concentrao ........................................................... 17
2.8.1. Curva de Lorenz 17
2.8.2. ndice de Gini 18
2.9 Estatstica Descritiva Bidimensional ........................................ 19

Estatstica Aplicada 2
Manual de Exerccios

3. ESTATSTICA INDUTIVA ................................................................... 45


3.1 Noes bsicas de probabilidades ........................................... 45
3.2 Probabilidade condicionada ...................................................... 48
3.3 Funes de Probabilidade ...................................................... 49
3.4 Estimao por Intervalos ........................................................ 76
3.5 Testes de hipteses ................................................................ 89
3.6 Aplicaes Estatsticas: Fiabilidade ......................................... 105
3.6.1. Conceito de fiabilidade 105
3.6.2. Fiabilidade de um sistema 105
3.7 Aplicaes Estatsticas: Controlo Estatstico de Qualidade .. 110
3.8 Aplicaes Estatsticas: Tratamento Estatstico de Inquritos . 114
3.8.1. Teste de independncia do qui-quadrado 114

Estatstica Aplicada 3
Manual de Exerccios

"A estatstica a tcnica de torturar os nmeros at que eles confessem".


Autor desconhecido

1. INTRODUO

Inicialmente, a actividade estatstica surgiu como um ramo da Matemtica.


Limitava-se ao estudo de medies e tcnicas de contagem de fenmenos
naturais e ao clculo de probabilidades de acontecimentos que se podiam
repetir indefinidamente. Actualmente, os mtodos estatsticos so utilizados em
muitos sectores de actividade, tendo como algumas aplicaes estudos de
fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento
de inquritos, sondagens, modelos economtricos, previses, etc.

Exemplo de uma estatstica: os valores da inflao entre 1980 e 1990


constituem uma estatstica. Fazer estatstica sobre estes dados poderia
consistir, por exemplo, em traar grficos, calcular a inflao mdia trimestral
ou prever a inflao para 1991.

A anlise de um problema estatstico desenvolve-se ao longo de vrias fases


distintas:

(i) Definio do Problema


Saber exactamente aquilo que se pretende pesquisar; estabelecer o
objectivo de anlise e definio da populao
(ii) Amostragem e Recolha de Dados
Fase operacional. o processo de seleco e registo sistemtico de dados,
com um objectivo determinado. Os dados podem ser primrios (publicados
pela prpria pessoa ou organizao) ou secundrios (quando so
publicados por outra organizao).
(iii) Tratamento e Apresentao dos Dados
Resumo dos dados atravs da sua contagem e agrupamento. a
classificao de dados, recorrendo a tabelas ou grficos.

Estatstica Aplicada 4
Manual de Exerccios

(iv) Anlise e Interpretao dos Dados


A ltima fase do trabalho estatstico a mais importante e delicada. Est
ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade
principal descrever o comportamento do fenmeno em estudo (estatstica
descritiva). Na estatstica indutiva a interpretao dos dados se
fundamentam na teoria da probabilidade.

1.1. Definies Gerais

1.1.1. Populao

Fazer estatstica pressupe o estudo de um conjunto de objectos bem


delimitado com alguma caracterstica em comum sobre os quais observamos
um certo nmero de atributos designados por variveis.
Exemplo: Empresas existentes em Portugal

1.1.2. Variveis ou atributos

As propriedades de uma populao so estudadas observando um certo


nmero de variveis ou atributos. As variveis podem ser de natureza
qualitativa ou quantitativa. As variveis quantitativas podem ainda dividir-se
entre discretas e contnuas. As variveis discretas assumem apenas um
nmero finito numervel de valores. As variveis contnuas podem assumir um
nmero finito no numervel ou um nmero infinito de valores.
Exemplo: um conjunto de empresas pode ser analisado em termos de sector
de actividade (atributo qualitativo), nmero de trabalhadores (atributo
quantitativo discreto), rcio de autonomia financeira (atributo quantitativo
contnuo), etc

1.1.3. Processo de amostragem

Para conhecer de forma completa a populao, podem efectuar-se:

Estatstica Aplicada 5
Manual de Exerccios

- recenseamentos (indagao completa de todos os elementos da


populao); este processo , no entanto, tipicamente moroso e
dispendioso, sendo esses os motivos porque os Censos so realizados
apenas em cada 10 anos.
- estudos por amostragem (observao de apenas um subconjunto, tido
como representativo do universo). As tcnicas de recolha de amostras
garantem a sua representatividade e aleatoriedade.

1.2. A Estatstica Descritiva e a Estatstica Indutiva

Para alm do ramo de amostragem, a estatstica compreende dois grandes


ramos: a estatstica descritiva e a estatstica indutiva.

A estatstica descritiva o ramo da estatstica que se encarrega do tratamento


e anlise de dados amostrais. Assim, depois de recolhida a amostra de acordo
com tcnicas que garantem a sua representatividade e aleatoriedade, fica
disponvel um conjunto de dados sobre o universo em bruto ou no
classificados. Para que seja possvel retirar qualquer tipo de concluses, torna-
se necessrio classificar os dados, recorrendo a tabelas de frequncias e a
representaes grficas, isto , preciso tratar os dados. Depois de tratados,
ser possvel proceder anlise dos dados atravs de vrias medidas que
descrevem o seu comportamento: localizao, disperso, simetria dos dados,
concentrao, etc. So disso exemplo indicadores numricos bem conhecidos
como a mdia ou a varincia.

A estatstica indutiva o ramo da estatstica que se ocupa em inferir das


concluses retiradas sobre a amostra para a populao. De facto, a amostra
no mais do que um passo intermdio e exequvel de obter informaes
sobre o verdadeiro objecto de estudo, que o universo. A estatstica indutiva
(ou inferncia estatstica) garante a ligao entre amostra e universo: se algo
se concluiu acerca da amostra, at que ponto possvel afirmar algo
semelhante para o universo? nesta fase que se procuram validar as
hipteses formuladas numa fase prvia exploratria. Claro que o processo de

Estatstica Aplicada 6
Manual de Exerccios

induo implica um certo grau de incerteza associado tentativa de


generalizao de concluses da parte (amostra) para o todo (universo). O
conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no
vai ser possvel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade. As inferncias indutivas so assim elaboradas medindo, ao
mesmo tempo, o respectivo grau de incerteza. Da que, na ficha das tcnicas
das sondagens eleitorais, por exemplo, apaream referncias ao nvel de
confiana associado aos resultados e ao erro cometido.

O esquema seguinte ilustra a roda da disciplina de estatstica, relacionando


os seus diferentes ramos:

POPULAO
OU UNIVERSO Previses
Amostragem Estimao
Erros

AMOSTRA INFERIR DA AMOSTRA


PARA O UNIVERSO
Inferncia
Estatstica TRATAMENTO E Estatstica
Descritiva ANLISE DA AMOSTRA

Grficos; tabelas; medidas descritivas

Estatstica Aplicada 7
Manual de Exerccios

2. ESTATSTICA DESCRITIVA

Os resultados da observao de um atributo sobre os elementos do conjunto a


analisar constituem os dados estatsticos. O ramo da estatstica que se ocupa
do tratamento, apresentao e anlise de dados amostrais denomina-se de
estatstica descritiva.

2.1. Variveis Qualitativas

Os dados qualitativos so organizados na forma de uma tabela de frequncias,


que representa o nmero ni de elementos de cada uma das categorias ou
classes e que chamado de frequncia absoluta. A soma de todas as
frequncias igual dimenso da amostra (n).

Numa tabela de frequncias, alm das frequncias absolutas, tambm se


apresentam as frequncias relativas (fi), obtida dividindo a frequncia absoluta
pelo nmero total de observaes.

Modalidades Frequncias absolutas Frequncias relativas


Mod. 1 n1 f1

Mod. j nj fj

Mod. n nn fn
Total n: dimenso da amostra 1

ni
fi = ; ni: n de vezes que cada modalidade da varivel foi observada.
n

Estatstica Aplicada 8
Manual de Exerccios

Estes dados podem tambm ser representados graficamente atravs de:

Diagrama de barras
Para cada modalidade, desenha-se uma barra de altura igual frequncia
absoluta ou relativa (as frequncias relativas so de preferir, pois permitem a
comparao de amostras de diferentes dimenses).

Diagrama sectorial ou circular


Esta representao constituda por um crculo, em que se apresentam tantas
fatias quantas as modalidades em estudo. O ngulo correspondente a cada
modalidade proporcional s frequncias das classes, fazendo corresponder o
total da amostra (n) a 360 Geralmente, juntamente com a identificao da
modalidade, indica-se a frequncia relativa respectiva.

2.2. Variveis Quantitativas Discretas

So variveis que assumem um nmero finito ou infinito numervel de valores.


A apresentao destas amostras semelhante s variveis qualitativas,
fazendo-se uma tabela de frequncias e uma representao grfica recorrendo
ao diagrama de barras.

Valores da varivel Frequncias absolutas Frequncias relativas


X1 n1 f1

Xj nj fj

Xn nn fn
Total n: dimenso da amostra 1

Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi)


acumuladas, como se pode ver no exemplo:

N defeituosos (X) N embalagens (ni) % embalagens (fi) Ni Fi


0 80 40% 80 40%
1 60 30% 80+60 40%+30%
2 30 15% 170 85%
3 20 10% 190 95%
4 10 5% 200 100%
Total 200 1

Estatstica Aplicada 9
Manual de Exerccios

2.3. Variveis Quantitativas Contnuas

Como foi dito anteriormente, uma varivel (ou atributo) contnua quando
assume um nmero infinito no numervel de valores, isto , podem assumir
qualquer valor dentro de um intervalo.

Neste caso, a construo da tabela compreende duas etapas:


(i) Definio de classes de valores disjuntas, correspondentes a intervalos de
nmeros reais fechados esquerda e abertos direita, cuja constituio
obedece a certas regras
(ii) Contagem das observaes pertencentes a cada classe

Regra de construo de classes


(pressupe a formao de classes de igual amplitude)
- Nmero de classes a constituir
Depende de n = dimenso da amostra
Se n25, o nmero de classes a constituir deve ser 5
Se n<25, o nmero de classes a constituir deve ser n
- Amplitude comum a todas as classes
Sendo a amplitude total dos dados dada pela diferena entre o valor
mximo e o valor mnimo observados, ento a amplitude de cada classe
ser:
Valor mximo da varivel observado Valor mnimo da varivel observado
N de classes a constituir

Classes de
Frequncias absolutas Frequncias relativas
valores da varivel
[x1; x2[ n1 f1
[x2; x3[
[x3; x4[ nj fj

[xn-1; xn] n fn
Total n: dimenso da amostra 1

A distribuio de frequncias representa-se atravs de um histograma.


Um histograma uma sucesso de rectngulos adjacentes, em que a base
uma classe e a altura a frequncia (relativa ou absoluta) por unidade de
amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A rea total
do histograma a soma das frequncias relativas, isto , 1.

Estatstica Aplicada 10
Manual de Exerccios

1. Esta distribuio permite visualizar o tipo de distribuio e deve salientar


alguns aspectos mais relevantes desta (moda, classe modal, ...). Como
as classes podem ter amplitudes diferentes, para que todos os
rectngulos (colunas) sejam comparveis necessrio corrigir as
frequncias das classes (calculando as frequncias que se teria se a
amplitude de todas as classes fosse igual e igual a 1)
2. prefervel representar o histograma com fi/hi do que com ni/hi uma vez
que deste modo possvel comparar distribuies com diferente nmero
de observaes amostrais.

Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi)


acumuladas.

2.4. Medidas de localizao

2.4.1. Mdia ( X )

a medida de localizao mais usada, sobretudo pela sua facilidade de


clculo.
Dados no-classificados (no agrupados numa tabela de frequncias)
1 n
x = xi Mdia aritmtica simples
n i =1

Dados classificados (isto , agrupados numa tabela de frequncias)


Variveis discretas
n n
1
x = ni x i = f i xi Mdia ponderada dos valores de X
n i =1 i =1

Dados classificados (isto , agrupados numa tabela de frequncias)


Variveis contnuas
n n
1
x = ni ci = f i ci Mdia ponderada dos pontos mdios das classes
n i =1 i =1

Estatstica Aplicada 11
Manual de Exerccios

lim . inf . + lim . sup .


onde ci o ponto mdio de cada classe ( )
2
A mdia uma medida de localizao que, geralmente, indica o valor central
da distribuio, entendido como o valor em torno do qual se distribuem os
valores observados. Desta forma, a mdia muitas vezes utilizada como valor
representativo da amostra.
No entanto, a mdia tem o grande inconveniente de ser sensvel a valores
muito extremados ou aberrantes da distribuio (outliers). Em casos desses, a
mdia deixa de ser um valor que aparece na parte central da distribuio para
ser empurrada para os extremos. Nestes casos, prefervel recorrer
informao complementar fornecida por outras medidas de localizao, como a
moda e a mediana, que se definem a seguir.

2.4.2. Mediana (Me)

A mediana no se calcula a partir do valor de todas as observaes, mas a


partir da posio dessas observaes.

Dados no-classificados
Se tivermos n valores x1, x2, ... xn
Se n fr mpar,
Me = x n+1
2

Se n fr par,
xn + xn
+1
Me = 2 2

Dados classificados
A mediana o valor tal que Fi = 0,5

Variveis discretas
Se existe um valor de xi para o qual Fi = 0,5, ento fala-se em intervalo
mediano.

Estatstica Aplicada 12
Manual de Exerccios

Se no existe nenhum valor de xi para o qual Fi = 0,5, ento a mediana


o primeiro valor para o qual Fi > 0,5.
Variveis contnuas
Em geral, determina-se o valor para o qual Fi = 0,5 atravs de uma regra
de trs simples, atendendo a que as frequncias acumuladas variam
uniformemente dentro de cada classe.

De uma forma geral:


0.5 FL inf
Me = L inf + xamp. classe mediana
FL sup FL inf

2.4.3. Moda (Mo)


Variveis discretas
A moda valor de X para o qual fi mximo, isto , o valor mais
frequente da distribuio.
Variveis contnuas
A classe modal a classe de valores de X para o qual fi/hi mximo,
isto , a classe a que corresponde maior frequncia por unidade de
amplitude.

2.5. Medidas de ordem

Tal como se definiu para a mediana, possvel definir outros valores de


posio ou valores separadores da distribuio em partes iguais.

Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p.


- Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil
- Se p=0,1; 0,2;...0,9, chama-se ao quantil decil
- Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A
mediana uma caso particular dos quartis (coincide com Q2)

Varivel discreta
O quantil de ordem p o primeiro valor de x para o qual i>p.

Estatstica Aplicada 13
Manual de Exerccios

Varivel contnua
Calcula-se por uma regra de trs simples, como a mediana.
25%
De uma forma geral: maiores

0.25 FL inf
Q1 = L inf + xamp. classe Q1
FL sup FL inf

0.75 FL inf
Q3 = L inf + xamp. classe Q3
FL sup FL inf

A representao grfica destas medidas designa-se de diagrama de


extremos e quartis e serve para realar algumas caractersticas da amostra.
Os valores da amostra compreendidos entre os 1 e 3 quartis so
representados por um rectngulo (caixa) com a mediana indicada por uma
barra. Seguidamente, consideram-se duas linhas que unem os meios dos
lados do rectngulo com os extremos da amostra.

A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos


dados e a sua maior ou menor concentrao:

2.6. Medidas de assimetria

A assimetria tanto maior quanto mais afastados estiverem os valores da


mdia, mediana e moda. Concretamente, se:
X = Me = Mo, a distribuio diz-se simtrica
X > Me > Mo, a distribuio diz-se assimtrica positiva (ou enviesada
esquerda)
X < Me < Mo, a distribuio diz-se assimtrica negativa (ou enviesada
direita)

(Q3 Q 2) (Q 2 Q1)
Coeficiente de assimetria de Bowley (g):
Q3 Q1
Se g = 0 ..............a distribuio simtrica positiva ou equilibrada
Os quartis esto mesma distncia da mediana.
Se g > 0 ..............a distribuio assimtrica positiva ou puxada para

Estatstica Aplicada 14
Manual de Exerccios

a esquerda (se fr = 1, assimetria mxima)


A mediana desliza para o lado do Q1,
logo Q3-Q2 > Q2-Q1
Se g < 0 ..............a distribuio assimtrica negativa ou puxada para
a direita (se fr = -1, assimetria mxima)
A mediana desliza para o lado do Q3,
logo Q2-Q1 > Q3-Q2

Q1 Q2
Q3
Assimtrica positiva

Q1 Q2 Q3
Assimtrica negativa

2.7. Medidas de disperso

Duas distribuies podem distinguir-se na medida em que os valores da


varivel se dispersam relativamente ao ponto de localizao (mdia, mediana,
moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas
consoante a medida de localizao usada para referenciar a disperso das
observaes:

2.7.1 Medidas de disperso absoluta

(i) Em relao mediana


Amplitude inter-quartis = Q = Q3 Q1
Significa que 50% das observaes se situam num intervalo de
amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior
(menor) a disperso em torno da mediana.
(ii) Em relao mdia
Varincia amostral: mede os desvios quadrticos de cada valor
observado em relao mdia, havendo pouca disperso se os desvios
forem globalmente pequenos, e havendo muita disperso se os desvios
forem globalmente grandes.

Estatstica Aplicada 15
Manual de Exerccios

Dados no-classificados

( )
2
1 n
s2 = xi x
n i =1

Dados classificados
Variveis discretas

( ) ( )
2
1 n n
2
s =
2
ni xi x = fi xi x
n i =1 i =1

Dados classificados
Variveis contnuas

( ) ( )
2
1 n n
2
s =
2
ni ci x = fi ci x
n i =1 i =1

onde ci o ponto mdio de cada classe i.


Desvio-padro: Medida de disperso com significado real, mas que s
possvel calcular indirectamente, atravs da raiz quadrada da varincia.
Est expressa nas mesmas unidades da varivel.

2.7.2 Medidas de disperso relativa

Muitas vezes, avaliar a disperso atravs de um indicador de disperso


absoluta no conveniente, assim como comparara a disperso de duas
distribuies, uma vez que estas medidas vm expressas na mesma unidade
da varivel como o caso, por exemplo, da varincia. Assim, de esperar
que os valores da varincia sejam mais elevados quando os valores da varivel
so maiores, o que no significa que a distribuio seja muito dispersa. Para
comparar diferentes distribuies de frequncia so precisas medidas de
disperso relativa:

Disperso absoluta
Disperso relativa =
Medida de localiza o em relao qual est definida

Estatstica Aplicada 16
Manual de Exerccios

Coeficiente de variao
s
CV = x100%
x

Outras medidas
Q3 Q1
Q2

Estas medidas no esto expressas em nenhuma unidade, e permitem


comparar disperses entre duas amostras, pois no so sensveis escala
(eventualmente diferente) em que as variveis estejam expressas.

2.8. Anlise da concentrao

A noo de concentrao apareceu associada ao estudo de desigualdades


econmicas, como a repartio do rendimento ou a distribuio de salrios. O
fenmeno de concentrao est relacionado com a variabilidade ou disperso
dos valores observados, apesar de no poder ser analisado atravs das
medidas de disperso atrs descritas, que apenas medem a disperso dos
valores em relao a um ponto. O objectivo determinar como o atributo
(rendimento, salrios, nmero de empresas) se distribui (se de forma mais ou
menos uniforme) pelos diferentes indivduos da amostra (que devem ser
susceptveis de serem adicionados, isto , a anlise de concentrao no se
aplica a idade, altura, peso, etc).
Se o atributo estiver igualmente repartido pelos indivduos, temos uma situao
extrema de igual distribuio; e vice-versa de o atributo estiver concentrado
num s indivduo, temos uma situao extrema de mxima concentrao. Em
geral, interessa medir o grau de concentrao em situaes intermdias.
Para analisar a concentrao, existem dois instrumentos: a Curva de Lorenz e o ndice
de Gini.

2.8.1 Curva de Lorenz

Estatstica Aplicada 17
Manual de Exerccios

O objectivo comparar a evoluo das frequncias acumuladas (Fi = pi) com a


evoluo da soma dos valores da varivel (qi)

Quadro de dados
Classes de Quantidade Freq.relativa Proporo
ni
valores da varivel atributo acumuladas atrib.acumul,
[x1; x2[ n1 yi p1 q1
[x2; x3[
[x3; x4[ nj yj pj qj

[xn-1; xn[ nn yn pn=1 qn=1


Total n

Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une
a curva de Lorenz. Se houver igual distribuio, a frequncia das observaes
deve ter uma evoluo igual proporo do atributo correspondente, isto ,
pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado,
que designada de recta de igual repartio. Quanto mais a curva se afastar
da recta, maior a concentrao. A zona entre a diagonal e acurva de Lorenz
designa-se, por isso, de zona de concentrao.

2.8.2 ndice de Gini

O ndice de Gini calculado pela seguinte expresso


n 1
( pi qi )
G= i =1
n 1
pi
i =1

Quando G = 0, a concentrao nula, havendo igual repartio. Caso o valor


de G seja 1, a concentrao ser mxima. O valor de G varia entre 0 e 1, e
quanto maior o seu valor, maior a concentrao.

Estatstica Aplicada 18
Manual de Exerccios

2.9. Estatstica Descritiva Bidimensional

Numa situao em que se observam pares de valores (xi; yj), pode ter interesse
estudar as relaes porventura existentes entre os dois fenmenos,
nomeadamente relaes estatsticas. No se trata de estudar relaes
funcionais (isto , a medida em que o valor de uma varivel determinado
exactamente pela outra), mas sim de estudar a forma como a variao de uma
varivel poder afectar a variao da outra, em mdia. (por exemplo, o peso e
a altura normalmente esto relacionados, mas a relao no determinstica).
Duas variveis ligadas por uma relao estatstica dizem-se correlacionadas.
Se as variaes ocorrem, em mdia ou tendencialmente, no mesmo sentido, a
correlao diz-se positiva. Se ocorrem em sentidos opostos, a correlao diz-
se negativa.

Trata-se ento de estudar se:


- Se existe alguma correlao entre os fenmenos ou variveis
observadas
- A existir, se traduzvel por alguma lei matemtica, nem que
tendencialmente
- A existir, se possvel medi-la

Por vezes, a representao grfica do conjunto de dados bivariados sugere o


ajustamento de uma recta a este conjunto de pontos, indicando a existncia de
uma tendencial correlao linear entre as duas variveis, como o caso do
exemplo atrs descrito. A essa recta chama-se recta de regresso de y sobre
x, que permite descrever como se reflectem em y (varivel dependente ou
explicada) as modificaes processadas em x (varivel independente ou
explicativa). Essa recta torna possvel, por exemplo, inferir (em mdia) a altura
de um indivduo, conhecendo o respectivo peso.
Um dos mtodos mais conhecidos de ajustar uma recta a um conjunto de
dados o Mtodo dos Mnimos Quadrados, que consiste em determinar a recta
que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores
de y e os obtidos a partir da recta que se pretende ajustar. Obtm-se assim a

Estatstica Aplicada 19
Manual de Exerccios

recta de regresso ou recta dos mnimos quadrados. Assim, se a recta de


regresso obedecer seguinte frmula geral:

y = a + bx

o mtodo permite minimizar a soma dos desvios quadrticos yi - (a + bxi).


Assim sendo, obtm-se:
xi y i n x y
b= 2
e a = y bx
2
xi n x

Matematicamente, b designa o declive da recta. Em termos estatsticos, b


corresponde ao coeficiente de regresso de y sobre x, que indica a variao
mdia de y que acompanha uma variao unitria de x.

O valor de a designa a ordenada na origem, isto , o valor que y assume


quando x=0.

Quando, quer atravs do diagrama de disperso, quer atravs da recta de


regresso, se verifica a existncia de uma associao linear entre as variveis,
pode-se medir a maior ou menor fora com que as variveis se associam
atravs do coeficiente de correlao linear r:

s xy n
r= , s xy = ( xi x)( y i y )
s xx s yy i =1

Este indicador da correlao tem a vantagem de no depender das unidades


ou da ordem de grandeza em que as variveis esto expressas. O coeficiente
de correlao linear est sempre compreendido entre 1 e 1.
Se r > 0, ento pode dizer-se que existe uma correlao positiva entre as
variveis, isto , as variveis variam no mesmo sentido: um aumento
(diminuio de x) provoca um aumento (diminuio) de y, mas menos que
proporcional.

Estatstica Aplicada 20
Manual de Exerccios

Se r < 0, ento pode dizer-se que existe uma correlao negativa entre as
variveis, isto , as variveis variam em sentidos opostos: um aumento
(diminuio de x) provoca uma diminuio (aumento) de y, mas menos que
proporcional.
Se r = 0, ento pode dizer-se que as variveis no esto correlacionadas
linearmente.
Antes de se efectuar um estudo de correlao, deve-se procurar justificao
terica para a existncia ou inexistncia de correlao. Caso contrrio, poder
acontecer que variveis sem relao de causalidade entre si, variem num certo
sentido por razes exteriores. A esta correlao ilusria, chama-se correlao
espria.

Nos extremos, se r = 1 ou se r = -1, ento pode dizer-se que existe uma


correlao positiva ou negativa perfeita, respectivamente, entre as variveis,
isto , uma variao numa varivel provoca na outra uma variao
exactamente proporcional no mesmo sentido ou em sentido contrrio. Isto , a
correlao mxima.

Correlao ordinal

Por vezes, as variveis vm expressas numa escala ordinal, isto , interessa


mais conhecer a ordenao dos valores do que os valores observados
propriamente ditos. Neste caso, em vez do coeficiente de correlao linear,
calcula-se o coeficiente de correlao ordinal:

n
2
di
x y
rs = 1 6 i =1
, d i = Ri Ri
n(n 1)2

Ordens (ranks) das


observaes de X e
de Y, respectivamente

Estatstica Aplicada 21
Manual de Exerccios

ESTATSTICA DESCRITIVA
Exerccios resolvidos
Exerccio 1
Considere a distribuio de 1000 empresas de um sector de actividade
segundo os resultados lquidos (em milhares de u.m.):

Resultado Lquido Frequncia. Relativa (%)


[0; 1[ 10
[1; 3[ 25
[3; 5[ 35
[5; 15[ 15
[15; 25[ 10
[25; 50[ 5
Total 100

a) Represente a distribuio graficamente.


b) Determine a mdia e a moda da distribuio. Qual o significado dos
valores encontrados?
c) Calcule as frequncias acumuladas e represente-as graficamente.
Determine a mediana da distribuio.
d) Determine os quartis da distribuio. Faa a sua representao grfica.
e) Analise a (as)simetria da distribuio em causa.
f) Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.

Resoluo

a)
fi/hi
0,2
0,18
0,16
0,14
0,12
0,1
0,08
0,06
0,04
0,02
0
0 10 20 30 40 50 60

Estatstica Aplicada 22
Manual de Exerccios

X fi hi fi/hi Fi ci
[0; 1[ 10% 1 0.1 10% 0.5
[1; 3[ 25% 2 0.125 35% 2
[3; 5[ 35% 2 0.175 70% 4
[5; 15[ 15% 10 0.015 85% 10
[15; 25[ 10% 10 0.01 95% 20
[25; 50] 5% 25 0.002 100% 37.5
Total 1

n n
b) x = 1 ni c i = f i ci = (0,5 x10%) + (2 x 25%) + ... + (37.5 x5%) = 7,325
n i =1 i =1

Em mdia, o resultado lquido de uma empresa de 7325 unidades


monetrias.

A classe modal aquela a que corresponde maior frequncia por unidade de


amplitude. Neste caso, o maior valor de fi / hi 0,175. correspondente classe
[3; 5[, isto , os valores de resultado lquido mais provveis para uma empresa
situam-se entre 3000 u.m. e 5000 u.m.

c) A representao grfica das frequncias acumuladas (ver tabela) designa-se


de polgono integral:

Fi

0,8

0,6

0,4

0,2

0
0 20 40 60 80 100 120

Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [3; 5[
3 : Fi=0,35
5 : Fi = 0,7

Estatstica Aplicada 23
Manual de Exerccios

Clculo da mediana:
0,7 - 0,35 ------------ 5 - 3
0,5 0,35 -------------- Me 3
Me = 3 + ((2x0,15)/0,35) = 3,857
50% das empresas apresentam resultados lquidos inferiores a 3857 u.m.

d) Classe a que pertence Q1 (classe a que corresponde uma frequncia


acumulada 0,25): [1; 3[
1 : Fi=0,1
3 : Fi = 0,35

Clculo do Q1:
0,35 - 0,1 ------------ 3 - 1
0,25 0,1 -------------- Q1 1
Q1 = 1 + ((2x0,15)/0,25) = 2,2
25% das empresas apresentam resultados lquidos inferiores a 2200 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequncia


acumulada 0,75): [5; 15[
5 : Fi=0,7
15 : Fi = 0,85

Clculo do Q3:
0,85 - 0,7 ------------ 15 - 5
0,75 0,7 -------------- Q3 5
Q3 = 5 + ((10x0,05)/0,15) = 8,333(3)
75% das empresas apresentam resultados lquidos inferiores a 8333 u.m.

e)
(Q3 Q 2) (Q 2 Q1) (8,333 3,857) (3,857 2,2)
g' = = = 0,4596 > 0
Q3 Q1 8,333 2,2

A distribuio assimtrica positiva ou enviesada esquerda.

Estatstica Aplicada 24
Manual de Exerccios

f)

X fi ni ci Atributo pi (=Fi) qi
[0; 1[ 10% 1000x10%=100 0.5 100x0.5=50 0.1 0.007
[1; 3[ 25% 250 2 250x2=500 0.35 0.075 50 + 500 + 1400
[3; 5[ 35% 350 4 1400 0.7 0.266 7325
[5; 15[ 15% 150 10 1500 0.85 0.471
[15; 25[ 10% 100 20 2000 0.95 0.744
[25; 50[ 5% 50 37.5 1875 1 1
Total 1 n=1000 7325

Res.Liq.Totais

(0,1 0,007) + ... + (0,95 0,744)


G= = 0,47
0,1 + 0,35 + 0,7 + 0,85 + 0,95

A distribuio dos resultados lquidos Curva de Lorenz

apresenta concentrao mdia (G=0,5 1


corresponde ao centro da escala
possvel, entre 0 e 1). Por exemplo, 0,8

70% das empresas apresentavam


0,6
resultados at 5000 u.m., mas isso
representava apenas 26,6% do total 0,4

de resultados das empresas da


0,2
amostra, o que sugere um tecido
empresarial com muitas PMEs, mas
0
em que cada uma tem baixo resultado 0 0,2 0,4 0,6 0,8 1

lquido.

Exerccio 2
Considere a seguinte amostra de dimenso 200, referente aos lucros obtidos
por empresas de um dado sector industrial, expressas numa determinada
unidade monetria.

Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.

Estatstica Aplicada 25
Manual de Exerccios

Resoluo

Lucros ni Lucro total pi (=Fi) qi


[0; 50[ 20 600 0.1 0.02
[50; 100[ 60 4400 0.4 0.16(6)
[100; 200[ 80 14000 0.8 0.63(3)
[200; 300[ 30 7500 0.95 0.883(3)
[300; 500] 10 3500 1 1
Total 200 30000

Curva de Lorenz

0,8

0,6

0,4

0,2

0
0 0,2 0,4 0,6 0,8 1

n 1
( pi qi )
0,546(6)
G= i =1
n 1
= = 0,243
2,25
pi
i =1

Tanto pela anlise da Curva de Lorenz, como pelo valor do ndice de Gini,
conclui-se que esta amostra apresenta concentrao moderada, encontrando-
se os valores razoavelmente repartidos.

Exerccio 3
Considere o exemplo abaixo referente ao peso e altura de 10 indivduos.
a) Represente o diagrama de disperso.
b) Analise a correlao existente entre peso e altura.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima as peso em funo da altura.

Estatstica Aplicada 26
Manual de Exerccios

Indivduo Peso (kg) Altura (cm)


A 72 175
B 65 170
C 80 185
D 57 154
E 60 165
F 77 175
G 83 182
H 79 178
I 67 175
J 68 173

Resoluo Diagrama de Disperso

a) 190

180
Altura (cm)

170

160

150
50 60 70 80 90
Peso (kg)

b) No exemplo, r = 0,90681871, isto , existe uma correlao positiva forte


entre as duas variveis, quase perfeita.

Recta de Regresso
c)
190

y = 0,9016x + 109,36
180
Altura (cm)

170

160

150
50 60 70 80 90
Peso (kg)

Estatstica Aplicada 27
Manual de Exerccios

A equao desta recta traduz-se em


Altura = 109,36 + 0,9016 x Peso
Isto , se um indivduo pesar 70 kg, a altura esperada ser de 109,36 + 0,9016
x 70 = 172,472.
Por cada kg de peso adicional, espera-se que a altura do indivduo aumente
0,9016 cm.

Exerccio 4
O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas
em milhares de u.m.) de uma empresa no perodo de 7 anos:
Ano Vendas Desp. Publicidade
1 10 3
2 13 3
3 18 5
4 19 6
5 25 8
6 30 9
7 35 13

a) Compare as vendas e as despesas em publicidade quanto disperso.


b) Analise a correlao existente entre volume e custo de produo.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima as vendas em funo das despesas em publicidade.

Resoluo
a) Para comparar a disperso das duas distribuies, necessrio calcular os
coeficientes de variao (medidas de disperso relativa):

Dados no-classificados
n n
1 1
x = xi = 21,429 y = yi = 6,714
n i =1 n i =1

(xi x ) (yi y )
n 2 n 2
2 1 2 1
sx = = 69,9408 sy = = 11,0651
n i =1 n i =1

sx 69,9408 sy 11,0651
CV x = = = 0,39 < CV y = = = 0,495
x 21,429 y 6,714

A disperso das despesas em publicidade superior disperso das vendas.

Estatstica Aplicada 28
Manual de Exerccios

b)
1
s xy [(10 21,429)(3 6,714) + ... + (35 21,429)(13 6,714)]
r= = 7 = 0,98
s xx s yy 69,9408 x 11,0651

Existe uma correlao positiva linear forte entre as duas variveis. Em mdia,
quando as despesas em publicidade aumentam (diminuem), as vendas
aumentam (diminuem) de forma quase exactamente proporcional.

Recta de Regresso

c)
y = 2,4649x + 4,8782

30

20
Vendas

10

0
3 8 13
Desp. Public.

Exerccio 5
Considere que 10 estudantes foram sujeitos a uma prova de avaliao no incio
e no final do curso. No quadro abaixo, encontram-se as ordenaes desses 10
estudantes segundo as classificaes obtidas em cada uma das provas:

Prova inicial Prova final di


Aluno
Rix Riy Rix - Riy
A 1 1 0
B 3 2 1
C 2 3 -1
D 5 4 1
E 7 6 1
F 8 8 0
G 9 7 2
H 10 9 1
I 6 10 -4
J 4 5 -1

Estatstica Aplicada 29
Manual de Exerccios

Resoluo
Como no dispomos das classificaes dos alunos, mas sim das ordenaes
das classificaes (do 1 ao 10 classificado), para avaliar a correlao
existente entre as 2 provas calcula-se o coeficiente de correlao ordinal:
n
2
di
6 x(0 + 1 + 1 + 1 + 1 + 0 + 4 + 1 + 16 + 1)
rs = 1 6 i =1
= 1 = 0,8424
n(n 1)2
10 x(100 1)

A correlao positiva e elevada (rs varia entre 1 e 1), isto , os alunos que
tiveram boa nota na prova inicial tiveram, em mdia, igualmente boa nota na
prova final.

Exerccio 6
O quadro que se segue descreve a distribuio do rendimento anual (em
milhares de u.m.) de 2500 famlias da populao de um pas:
Rendimento anual N de famlias
[0, 1[ 250
[1, 2[ 375
[2, 5[ 625
[5, 15[ 750
[15, 25[ 375
[25, 50[ 125

a) Represente as frequncias acumuladas graficamente.


b) Determine o rendimento mdio e mediano.
c) Determine os trs primeiros quartis. Que indicaes lhe do sobre a
(as)simetria?
d) O que pode concluir quanto disperso?
e) Calcule o ndice de Gini. O que conclui sobre a concentrao do
rendimento?

Resoluo
a)
Rendimento anual N de famlias % de famlias Fi (%) ci
[0, 1[ 250 10 10 0.5
[1, 2[ 375 15 25 1.5
[2, 5[ 625 25 50 3.5
[5, 15[ 750 30 80 10
[15, 25[ 375 15 95 20
[25, 50[ 125 5 1 37.5

Estatstica Aplicada 30
Manual de Exerccios

0,8

0,6

0,4

0,2

0
0 10 20 30 40 50 60 70 80 90 100

n n
b) x = 1 ni c i = f i ci = (0,5 x10%) + (1.5 x15%) + ... + (37.5 x5%) = 9,025
n i =1 i =1

Em mdia, o rendimento anual de uma famlia de 9025 unidades monetrias.

Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [2; 5[
5 : Fi = 0,5. Logo, a mediana 5 (50% das famlias tm rendimentos anuais at
5000 unidades monetrias).

c) Classe a que pertence Q1 (classe a que corresponde uma frequncia


acumulada 0,25): [1; 2[
3 : Fi = 0,25
25% das famlias apresentam rendimentos anuais inferiores a 2000 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequncia


acumulada 0,75): [5; 15[
5 : Fi=0,5
15 : Fi = 0,8

Clculo do Q3:
0,8 - 0,5 ------------ 15 - 5
0,75 0,5 -------------- Q3 5
Q3 = 5 + ((10x0,25)/0,3) = 13,333(3)
75% das famlias apresentam rendimentos anuais inferiores a 13333 u.m.

Estatstica Aplicada 31
Manual de Exerccios

(Q3 Q 2) (Q 2 Q1) (13,333 5) (5 2)


g' = = = 0,47 > 0
Q3 Q1 13,333 2

A distribuio assimtrica positiva ou enviesada esquerda.

( )
n 2 n
2 2
d) s x = fi * ci x = fici 2 x = 82,286875
i =1 i =1
2
s x = s x = 82,286875 = 9,071

e)
Rendimento anual ni ci Rend. total pi (=Fi) qi
[0, 1[ 250 0.5 125 0,1 0.00554
[1, 2[ 375 1.5 562,5 0,25 0.0305
[2, 5[ 625 3.5 2187,5 0,5 0.1274
[5, 15[ 750 10 7500 0,8 0.46
[15, 25[ 375 20 7500 0,95 0.7922
[25, 50[ 125 37.5 4687.5 1 1
Total 2500 22562,5

n 1
( pi qi )
1,18436
G= i =1
n 1
= = 0,4555 Concentrao moderada do rendimento
2,6
pi
i =1

Exerccio 7
Considere a seguinte tabela que representa a distribuio dos empregados de
uma instituio bancria segundo a remunerao bruta mensal (em milhares de
unidades monetrias):

Frequncia. Relativa
Remunerao
(%)
[60; 80[ 7.8
[80; 100[ 15.2
[100; 120[ 31.2
[120; 140[ 19.5
[140; 160[ 7.2
[160; 200[ 8.1
[200; 250[ 5.4
[250, 300[ 2.6
[300; 350] 3.0
Total 100

Estatstica Aplicada 32
Manual de Exerccios

a) Calcule os quartis da distribuio.


b) Analise a disperso da distribuio em causa.
c) Analise a assimetria da distribuio em causa.

Resoluo
a)
Fi
Remunerao Frequncia. Relativa (%)
(%)
[60; 80[ 7.8 7.8
[80; 100[ 15.2 23
[100; 120[ 31.2 54.2
[120; 140[ 19.5 73.7
[140; 160[ 7.2 80.9
[160; 200[ 8.1 89
[200; 250[ 5.4 94.4
[250, 300[ 2.6 97
[300; 350] 3.0 100
Total 100

Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada


0,25): [100; 120[
1 : Fi=0,23
3 : Fi = 0,542
Clculo do Q1:
0,542 - 0,23 ------------ 120 - 100
0,25 - 0,23 -------------- Q1 - 100
Q1 = 100 + ((20x0,02)/0,312) = 101,28
25% dos empregados auferem remuneraes inferiores a 101,28 milhares u.m.

Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada


0,5): [100; 120[
100 : Fi=0,23
120 : Fi = 0,542
Clculo do Q2:
0,542 - 0,23 ------------ 120 - 100
0,5 - 0,23 -------------- Q2 - 100
Q2 = 100 + ((20x0,27)/0,312) = 117,3
50% dos empregados auferem remuneraes inferiores a 117,3 milhares u.m.

Estatstica Aplicada 33
Manual de Exerccios

Classe a que pertence Q3 (classe a que corresponde uma frequncia


acumulada 0,75): [140; 160[
120 : Fi=0,737
140 : Fi = 0,809

Clculo do Q3:
0,809 - 0,737 ------------ 160 - 140
0,75 0,737 -------------- Q3 - 140
Q3 = 140 + ((20x0,013)/0,072) = 143,61(1)
75% dos empregados auferem remuneraes inferiores a 143,61(1) milhares u.m.

b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33


(disperso reduzida em torno da mediana)

(Q3 Q 2) (Q 2 Q1) (143,61 117,3) (117,3 101,28)


c) g ' = = = 0,243 > 0
Q3 Q1 143,61 101,28

A distribuio assimtrica positiva ou enviesada esquerda.

Exerccio 8
Os dados seguintes referem-se ao peso, expresso em gramas, do contedo de
uma srie de 100 garrafas que, no decurso de um teste, saram de uma linha
de enchimento automtico:

Frequncia. Relativa
Peso (em gramas)
(%)
[297; 298[ 8
[298; 299[ 21
[299; 300[ 28
[300; 301[ 15
[301; 302[ 11
[302; 303[ 10
[303; 304[ 5
[304; 305[ 1
[305; 306] 1
Total 100

a) Represente graficamente os dados acima.


b) Calcule as frequncias acumuladas e represente-as graficamente.

Estatstica Aplicada 34
Manual de Exerccios

c) Determine o peso mdio, mediano e modal. Qual o seu significado?


d) Determine os quartis da distribuio.
e) Analise a disperso do peso das garrafas.

Resoluo
a) Histograma
0,3
0,25
0,2
0,15
0,1
0,05
0
296 297 298 299 300 301 302 303 304 305 306 307

b)
Peso (em gramas) Frequncia Relativa (%) Fi (%)
[297; 298[ 8 8
[298; 299[ 21 29
[299; 300[ 28 57
[300; 301[ 15 72
[301; 302[ 11 83
[302; 303[ 10 93
[303; 304[ 5 98
[304; 305[ 1 99
[305; 306] 1 100
Total 100

F*
1

0,8

0,6

0,4

0,2

0
295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310

c)
n n
1
x = ni c i = f i ci = (297,5 x8%) + (298,5 x 21%) + ... + (305,5 x1%) = 300,11
n i =1 i =1

O peso mdio das garrafas de 300,11 kg.

Estatstica Aplicada 35
Manual de Exerccios

Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [299;
300[
299 : Fi = 0,29
300 : Fi = 0,57
Clculo do Q2:
0,57 - 0,29 ------------ 300 - 299
0,5 - 0,29 -------------- Q2 - 299
Q2 = 299 + ((1x0,21)/0,28) = 299,75
50% das garrafas tm peso inferior a 299,75 kg.

A classe modal aquela a que corresponde maior frequncia relativa. Neste


caso, o maior valor de fi 0,28 correspondente classe [299; 300[, isto , os
pesos mais provveis das garrafas situam-se entre 299 kg e 300 kg.

d) Classe a que pertence Q1 (classe a que corresponde uma frequncia


acumulada 0,25): [298; 299[
298 : Fi=0,08
299 : Fi = 0,29
Clculo do Q1:
0,29 - 0,08 ------------ 298 - 299
0,25 - 0,08 ------------ Q1 - 299
Q1 = 299 + ((1x0,17)/0,21) = 299,0357
25% das garrafas tm peso inferior a 299,0357 kg.

Classe a que pertence Q3 (classe a que corresponde uma frequncia


acumulada 0,75): [301; 302[
301 : Fi=0,72
302 : Fi = 0,83
Clculo do Q3:
0,83 - 0,72 ------------ 302 - 301
0,75 0,72 -------------- Q3 - 301
Q3 = 301 + ((1x0,03)/0,11) = 301,27(27)
75% das garrafas tm peso inferior a 301,27(27) kg.

Estatstica Aplicada 36
Manual de Exerccios

e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237


(disperso reduzida em torno da mediana)

Exerccio 8
Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:

Altura (em metros) N Alunos


[1,4; 1,5[ 2
[1,5; 1,55[ 10
[1,55; 1,6[ 25
[1,6; 1,65[ 13
[1,65; 1,7[ 17
[1,7; 1,75[ 20
[1,75; 1,8[ 10
[1,8; 1,9] 3
Total 100

a) Represente graficamente os dados acima.


b) Determine a altura mdia e a altura modal. Qual o seu significado?
c) Calcule as frequncias acumuladas e represente-as graficamente.
d) Determine os quartis da distribuio e diga qual o seu significado.
e) Analise a disperso da distribuio.
f) Analise a (as)simetria da distribuio.

Resoluo
a)
Altura (em metros) ni fi ci hi fi/hi Fi
[1,4; 1,5[ 2 0,02 1,45 0,1 0,2 0,02
[1,5; 1,55[ 10 0,1 1,525 0,05 2 0,12
[1,55; 1,6[ 25 0,25 1,575 0,05 5 0,37
[1,6; 1,65[ 13 0,13 1,625 0,05 2,6 0,5
[1,65; 1,7[ 17 0,17 1,675 0,05 3,4 0,67
[1,7; 1,75[ 20 0,2 1,725 0,05 4 0,87
[1,75; 1,8[ 10 0,1 1,775 0,05 2 0,97
[1,8; 1,9] 3 0,03 1,85 0,1 0,3 1
Total 100 1

fi/hi Histograma
6
5
4
3
2
1
0
1,4 1,5 1,6 1,7 1,8 1,9

Estatstica Aplicada 37
Manual de Exerccios

n n
1
b) x = ni c i = f i ci = (1,45x 2%) + (1,525x10%) + ... + (1,85x3%) = 1,65
n i =1 i =1

A altura mdia dos alunos de 1,65 m.

A classe modal aquela a que corresponde maior frequncia por unidade de


amplitude. Neste caso, o maior valor de fi / hi 5. correspondente classe
[1,55; 1,6[, isto , a altura mais provvel de um aluno rondar 1,55m / 1,6m.

c) F*
1
0,8
0,6

0,4
0,2
0
1,3 1,4 1,5 1,6 1,7 1,8 1,9 2

d) Classe a que pertence Q1 (classe a que corresponde uma frequncia


acumulada 0,25): [1,55; 1,6[
1,55 : Fi=0,12
1,6 : Fi = 0,37
Clculo do Q1:
0,37 0,12 ------------ 1,6 1,55
0,25 0,12 ------------ Q1 1,55
Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576
25% dos alunos tm altura inferior a 1,576 m.

Classe a que pertence Q2 (classe a que corresponde uma frequncia


acumulada 0,5): [1,6; 1,65[
1,65 : Fi = 0,5
50% dos alunos tm altura inferior a 1,65 m.

Classe a que pertence Q3 (classe a que corresponde uma frequncia


acumulada 0,75): [1,7; 1,75[
1,7 : Fi=0,67
1,75 : Fi = 0,87

Estatstica Aplicada 38
Manual de Exerccios

Clculo do Q3:
0,87- 0,67------------ 1,75 1,7
0,75 0,67-------------- Q3 1,7
Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72
75% dos alunos tm altura inferior a 1,72 m.

e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 1,576 = 0,144


(disperso reduzida em torno da mediana)

( )
n 2 n
2 2
sx = fi * ci x = fici 2 x = 0,00536875
i =1 i =1
2
s x = s x = 0,00536875 = 0,07327
(disperso reduzida em torno da mdia)

(Q3 Q 2) (Q 2 Q1) (1,72 1,65) (1,65 1,576)


f) g ' = = = 0,027(7) < 0
Q3 Q1 1,72 1,576

A distribuio ligeiramente assimtrica negativa ou enviesada direita


(quase simtrica).

Exerccio 9
Em determinada central telefnica, registou-se a durao das chamadas
realizadas em Dezembro de 2001:

Durao (em minutos) N Chamadas


[0; 5[ 2000
[5; 10[ 1500
[10; 20[ 1000
[20; 30[ 300
[30; 50] 200
Total 5000

a) Represente graficamente as frequncias simples e acumuladas.


b) Determine a durao mdia das chamadas e respectivo desvio-padro.
c) Qual a durao da chamada mediana? Qual o significado do valor
encontrado?

Estatstica Aplicada 39
Manual de Exerccios

d) Sabe-se que as chamadas realizadas durante o ano de 2001


apresentaram uma durao mdia de 10 minutos, com desvio-padro de
8,7 minutos. Compare, quanto disperso, as chamadas efectuadas em
Dezembro com as que tiveram lugar durante todo o ano de 2001.

Resoluo
a)
Durao (em minutos) ni fi hi fi/hi Fi ci
[0; 5[ 2000 0,4 5 0,08 0,4 2,5
[5; 10[ 1500 0,3 5 0,06 0,7 7,5
[10; 20[ 1000 0,2 10 0,02 0,9 15
[20; 30[ 300 0,06 10 0,006 0,96 25
[30; 50] 200 0,04 20 0,002 1 40
Total 5000 1

fi/hi Histograma
0,1
0,08
0,06
0,04
0,02
0
0 10 20 30 40 50 60

F*
1

0,8

0,6

0,4

0,2

0
0 10 20 30 40 50 60 70 80 90 100

n n
b) x = 1 ni c i = f i ci = (2,5 x 40%) + (7,5 x30%) + ... + (40 x 4%) = 9,35
n i =1 i =1

A durao mdia de uma chamada de 9,35 minutos.

( )
n 2 n
2 2
sx = fi * ci x = fici 2 x = 81,4525
i =1 i =1
2
s x = s x = 0,00536875 = 9,025

c) Classe mediana (classe a que corresponde frequncia acumulada 0,5): [5; 10[

Estatstica Aplicada 40
Manual de Exerccios

5 : Fi = 0,4
10 : Fi = 0,7
Clculo da Me:
0,7 - 0,4 ------------ 10 - 5
0,5 - 0,4 ------------ Me - 5
Me = 5 + ((5x0,1)/0,3) = 6,67
50% das chamadas tm durao a 6,67 minutos.

s x 9,025 sy 8,7
d) CV Dez = = = 0,965 > CV2001 = = = 0,87
x 9,35 y 10

Exerccio 10
Uma empresa coligiu dados relativos produo de 12 lotes de um tipo especial
de rolamento. O volume de produo e o custo de produo de cada lote
apresentam-se na tabela:

Lote Volume (unidades) Custo (contos)


1 1500 3100
2 800 1900
3 2600 4200
4 1000 2300
5 600 1200
6 2800 4900
7 1200 2800
8 900 2100
9 400 1400
10 1300 2400
11 1200 2400
12 2000 3800

a) Analise a correlao existente entre volume e custo de produo.


b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima o custo em funo do volume de produo.

Resoluo
1
s xy [(1500 1358,3)(3100 2708,3) + ... + (2000 1358,3)(3800 2708,3)]
a) r = = 12 = 0,98
s xx s yy 520854x 1145944

Correlao positiva quase perfeita.

Estatstica Aplicada 41
Manual de Exerccios

b)
6000

5000 y = 1,4553x + 731,6


4000
Custo

3000

2000

1000

0
0 500 1000 1500 2000 2500 3000
Volume

Exerccio 11
Um conjunto de empresas do sector da Construo e Obras Pblicas cotadas
na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores:
EPS (Earnings per Share): Resultado Lquido por Aco
PBV (Price/Book Value): Preo / Situao Lquida por Aco

Empresa EPS ($) PBV ($)


1 191 0.9
2 32 1.0
3 104 0.8
4 117 0.8
5 210 1.5
6 95 0.7
7 65 0.9
8 201 1.3
9 81 0.4

a) Analise a correlao existente entre aqueles dois indicadores.


b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima a varivel EPS em funo de PBV.

Resoluo
1
s xy [(191 121,7)(0,9 0,92) + ... + (81 121,7)(0,4 0,92)]
a) r = =9 = 0,61
s xx s yy 3669,332 x 0,096933

Correlao positiva moderada.

Estatstica Aplicada 42
Manual de Exerccios

b)
250

200 y = 124,04x + 7,383

150
EPS

100

50

0
0 0,2 0,4 0,6 0,8 1 1,2 1,4 1,6
PBV

Exerccio 12
Recolheu-se uma amostra em 17 cidades do pas relativamente aos seguintes
indicadores:
Ri: Rendimento mdio mensal na cidade i (em 106 unidades monetrias)
Gi: Gasto mdio mensal em bens de luxo na cidade i (em 106 u.m.)

Ri Gi Ri Gi

125 54 144 61
127 56 147 62
130 57 150 62
131 57 152 63
133 58 154 63
135 58 160 64
140 59 162 65
143 59 165 66
169 66

Dados adicionais
2
Ri = 2467 Gi = 1030 Ri = 361073
2
Gi = 62620 Ri Gi = 150270

a) Estude a correlao entre rendimento e despesas em bens de luxo.


b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima a varivel Gi em funo de Ri.

Estatstica Aplicada 43
Manual de Exerccios

Resoluo
a)
2467 1030
Ri G i n R G 150270 17 * *
rXY = = 17 17 = 0,986
2 2 2
(
2
Ri n R )( G nG )
2 2467 1030 2
i (361073 17 * )( 62620 17 * )
17 2 17 2

Correlao positiva forte.

b)
68
y = 0,2604x + 22,801
66
64
62
60
Gasto

58
56
54
52
50
100 120 140 160 180 200
Rendimento

Estatstica Aplicada 44
104
Introduo ao e-learning

FMD_i.p65 104 15-01-2004, 10:49


Manual de Exerccios

3. ESTATSTICA INDUTIVA

A estatstica indutiva o ramo da estatstica que se ocupa em inferir das


concluses retiradas sobre a amostra para a populao. Claro que o processo
de induo implica um certo grau de incerteza associado tentativa de
generalizao de concluses da parte (amostra) para o todo (universo). O
conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no
vai ser possvel afirmar com toda a certeza que o comportamento da amostra
ilustra perfeitamente o comportamento do universo, mas apenas que o faz com
forte probabilidade.
De seguida, sero apresentadas algumas noes simples de probabilidades e
funes de probabilidade, que sero teis a aplicaes de estatstica indutiva
relacionadas com controlo estatstico de qualidade e fiabilidade de
componentes e sistemas.

3.1. Noes bsicas de probabilidade

A teoria das probabilidades um ramo da matemtica extremamente til para o


estudo e a investigao das regularidades dos chamados fenmenos
aleatrios. O exemplo seguinte pretende clarificar o que vulgarmente
designado por experincia aleatria.

Deve entender-se como experincia qualquer processo ou conjunto de


circunstncias capaz de produzir resultados observveis; quando uma
experincia est sujeita influncia de factores casuais e conduz a resultados
incertos, diz-se que a experincia aleatria.
Fundamentalmente, as experincias aleatrias caracterizam-se por:

Estatstica Aplicada 45
Manual de Exerccios

(i) poder repetir-se um grande nmero de vezes nas mesmas condies


ou em condies muito semelhantes
(ii) cada vez que a experincia se realiza, obtm-se um resultado
individual, mas no possvel prever exactamente esse resultado
(iii) os resultados das experincias individuais mostram-se irregulares,
mas os resultados obtidos aps uma longa repetio da experincia
patenteiam uma grande regularidade estatstica no seu conjunto

Alguns autores consideram inserido no conceito de experincia aleatria um


outro, o de espao de resultados. O espao de resultados corresponde ao
conjunto formado por todos os resultados possveis de uma experincia
aleatria. Por exemplo, num lanamento de um dado ordinrio tem-se que o
espao de resultados {1,2,3,4,5,6}.
A importncia da definio deste conceito advm sobretudo por ser o meio
empregue para a definio de acontecimentos, que no sei mais que
subconjuntos do espao de resultados. Por exemplo, no lanamento de um
dado podem definir-se, para alm dos 6 acontecimentos elementares
correspondentes sada de cada uma das faces, outros como sada de um
nmero mpar definido pelo subconjunto {1,3,5}.
Definidos como conjuntos, aos acontecimentos aplicvel toda a construo
disponvel para aqueles, isto , existe um paralelismo perfeito entre lgebra de
conjuntos e lgebra de acontecimentos:
(i) O acontecimento que contem todos os elementos do espao de
resultados chama-se acontecimento certo
(ii) O acontecimento que no contem qualquer elemento do espao de
resultados chama-se acontecimento impossvel
(iii) Dois acontecimentos so mutuamente exclusivos se no tm em
comum qualquer acontecimento do espao de resultados
(iv) A unio de dois acontecimentos A e B representa-se por A B e
formado pelos elementos que pertencem a pelo menos um dos dois,
A ou B
(v) A interseco de dois acontecimentos A e B representa-se por A B e
formado pelos elementos comuns a A e B

Estatstica Aplicada 46
Manual de Exerccios

Probabilidade de um acontecimento expressa na escala de 0 a 1, sendo 0 a


probabilidade associada a um acontecimento impossvel e 1 a probabilidade
associada a um acontecimento certo. A primeira definio foi proposta por
Laplace em 1812. Pode definir-se probabilidade de um acontecimento A
como sendo:
Nmero de casos favorveis ao acontecimento A
P(A) =
Nmero total de casos possveis na exp. aleatria

Uma das principais crticas a esta definio a de que ela s aplicvel


quando o espao de resultados finito e os seus elementos possuem igual
probabilidade; da que ela surja muito ligada aos jogos de azar, que possuem
essas propriedades. o que acontece com as duas faces de uma moeda, as
52 cartas de um baralho, as 6 faces de um dado, etc.

Para se analisar a probabilidade de ocorrncia de determinados


acontecimentos, deve ter-se em ateno o seguinte:
Dois acontecimentos so ditos mutuamente exclusivos se no puderem
acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente
exclusivos, ento:
P(A B) = 0
A probabilidade de unio de dois acontecimentos mutuamente
exclusivos dada por
P (A B) = P(A) + P(B)
Para dois acontecimentos quaisquer, vem que
P (A B) = P(A) + P(B) - P(A B)
Dois acontecimentos dizem-se complementares se:
P(A) = 1 P( A )
Dois acontecimentos so ditos independentes se a ocorrncia de um
no afectar a probabilidade de ocorrncia de outro; a probabilidade de
ocorrncia de dois ou mais acontecimentos independentes o produto
das probabilidades dos respectivos acontecimentos, isto :
P(A B) = P(A) x P(B)

Estatstica Aplicada 47
Manual de Exerccios

Aps a apresentao desta definio, convm ainda referir que, numa outra
perspectiva, a da chamada teoria frequencista, a probabilidade de um
acontecimento definida como sendo o valor para o qual tende a frequncia
relativa do acontecimento quando o nmero de repeties da experincia
aumenta.

3.2. Probabilidade condicionada

Exemplo:
Um grupo de pessoas classificado de acordo com o seu peso e a incidncia
de hipertenso. So as seguintes as propores das vrias categorias:
Obeso Normal Magro Total
Hipertenso 0,1 0,08 0,02 0,2
No Hipertenso 0,15 0,45 0,2 0,8
Total 0,25 0,53 0,22 1,00
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa?
b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resoluo
a) Basta ver que a proporo de hipertensos de 20%
b) H que tomar em ateno que o que se pretende a proporo de
0,1
hipertensos na populao de obesos, isto = 0,4 . Por outras palavras,
0,25
pretende-se calcular a probabilidade do acontecimento ser hipertenso,
sabendo que ocorreu o acontecimento ser obeso. Repare-se que este
quociente resulta da diviso entre a probabilidade de uma pessoa ser
hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode
escrever-se que a probabilidade pretendida dada por:
P( H O)
P( H / O) =
P (O)
onde P(H/O) a probabilidade de ocorrer o acontecimento ser hipertenso,
sabendo que ocorreu ou condicionado pelo acontecimento ser obeso.
Este exemplo corresponde ao clculo de uma probabilidade condicionada.

Estatstica Aplicada 48
Manual de Exerccios

Como se viu anteriormente, dois acontecimentos so ditos independentes se a


ocorrncia de um no afectar a probabilidade de ocorrncia de outro, isto , se:
P(A / B) = P(A) e se P(B / A) = P(B).

Teorema de Bayes
Seja B um acontecimento que se realiza se e s se um dos acontecimentos
mutuamente exclusivos A1, A2,An se verifica. Aos acontecimentos A1, A2,An
d-se o nome de acontecimentos antecedentes. O teorema de Bayes permite
calcular a probabilidade posteriori de A1, A2, An, isto , a probabilidade de
ocorrncia de A1, A2, An calculadas sob a hiptese de que B (acontecimento
consequente) se realizou. De acordo com este teorema:
P ( Ai ).P ( B / Ai )
P ( Ai / B ) = n
P ( Ai ).P ( B / Ai )
i =1

Este Teorema utiliza-se em situaes em que a relao causal est invertida.


n
P ( Ai ).P ( B / Ai ) designa-se de probabilidade total de ocorrncia do
i =1

acontecimento B, isto , a probabilidade de ocorrncia do acontecimento


consequente B face a todos os possveis acontecimentos A1, A2, An que o
podem ter antecedido (ou causado a sua ocorrncia).

3.3. Funes de probabilidade

A probabilidade associada aos acontecimentos possveis numa experincia


aleatria obedecem, por vezes, a um padro. Se associarmos a uma
experincia aleatria uma varivel X (por exemplo, associar aos resultados da
experincia lanamento de um dado - que so 6 (sada de face 1 a 6) a
varivel X:N da face resultante do lanamento de um dado), ento pode ser
constituda uma lei ou funo de probabilidade (f(x)) dessa varivel X, tal que
f(x) = P(X=xi)

Estatstica Aplicada 49
Manual de Exerccios

Por exemplo, para X: n da face resultante do lanamento de um dado, vem


que:
xi 1 2 3 4 5 6
f(xi) 1/6 1/6 1/6 1/6 1/6 1/6

que se designa por lei uniforme.

Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior


nmero de fenmenos estatsticos do que outras. Entre estas, contam-se a lei
Binomial, a lei de Poisson e a lei Exponencial.

(i) Lei Binomial


H alguns acontecimentos que so constitudos por um conjunto de
experincias independentes, cada uma das quais com apenas dois estados
possveis de ocorrncia e com uma probabilidade fixa de ocorrncia para cada
um deles. Por exemplo, os produtos resultantes de uma fbrica podem ser
classificados como sendo defeituosos ou sendo no defeituosos, e o facto de
um ter sado (ou no) defeituoso no influencia os outros serem (ou no). A
distribuio das duas classes possveis discreta e do tipo binomial.
No exemplo anterior, consideremos uma amostra de n artigos retirados da
produo total, em relao aos quais se pretende identificar a varivel X: N de
artigos defeituosos nos n que constituem a amostra. A probabilidade de
ocorrncia do acontecimento artigo defeituoso dada por p: incidncia de
defeituosos na produo (convenientemente calculada atravs de mtodos de
estimao). A probabilidade do acontecimento complementar artigo no-
defeituoso dada por
1p=q

A probabilidade associada a x artigos defeituosos dada por px (p x p x p x


p...x vezes). Se h x defeituosos, restam n-x artigos no-defeituosos, com
probabilidade dada por qn-x. Para calcular o nmero exacto de combinaes de
x artigos defeituosos com n-x artigos no-defeituosos, utiliza-se a figura
combinaes de n, x a x, oriunda das tcnicas de clculo combinatrio. Vem

Estatstica Aplicada 50
Manual de Exerccios

ento que a probabilidade de existncia de x defeituosos (e logo n-x no


defeituosos) igual a:
n!
f ( x) = C xn p x q n x = p x q n x
(n p )! p!

sendo que X segue Bi (n;p), sendo n e p os parmetros caracterizadores da lei.


Um acontecimento deve ter 4 caractersticas para que se possa associar a uma
lei binomial:
- nmero fixo de experincias (n)
- cada experincia ter apenas duas classes de resultados possveis
- todas as experincias terem igual probabilidade de ocorrncia (p)
- as experincias serem independentes
Em sistemas elctricos de energia possvel, por exemplo, aplicar a
distribuio binomial quando se pretende calcular a fiabilidade de uma central
elctrica, com vrias unidades iguais e admitindo que cada unidade apenas
pode residir em dois estados, a funcionar ou avariada.

(ii) Lei de Poisson


A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) d a
probabilidade de um acontecimento ocorrer um dado nmero de vezes num
intervalo de tempo ou espao fixado, quando a taxa de ocorrncia fixa (por
exemplo, n de chamadas que chegam a uma central telefnica por minuto; n
de varias que ocorrem numa mquina por dia). Os nmeros de acontecimentos
de sucesso ocorridos em diferentes intervalos so independentes. O
parmetro caracterizador da distribuio de Poisson , que corresponde ao
nmero mdio de ocorrncias por unidade de tempo ou espao.
Como o nmero mdio de ocorrncias do acontecimento proporcional
amplitude do intervalo de tempo ou espao a que se refere, a varivel X: N de
ocorrncias do acontecimento no intervalo [0,t[ segue lei de Poisson de
parmetro t (isto , se para 1 unidade de tempo o n mdio de ocorrncias
, para t unidades de tempo o nmero mdio de ocorrncias t). A expresso

(t )x e t
x!

Estatstica Aplicada 51
Manual de Exerccios

d a probabilidade de acontecerem x ocorrncias no intervalo de tempo [0,t[, e


corresponde expresso da lei de probabilidade de Poisson : Po(t)
Por exemplo, se X fr o N de avarias que ocorrem no intervalo de tempo
[0,t[, ento a probabilidade de no ocorrerem avarias nesse intervalo, isto , a
fiabilidade do componente/sistema como funo do tempo, dada por:

(t )0 e t = e t
0!

(iii) Lei Exponencial


Seja T a varivel Tempo ou espao que decorre entre ocorrncias
consecutivas de um acontecimento. Ento T segue lei exponencial Exp (),
sendo
1

o tempo que, em mdia, decorre entre ocorrncias sucessivas do
acontecimento.
Note-se que possvel estabelecer uma relao entre a lei exponencial e a lei
de Poisson. Assim, se X fr o N de avarias que ocorrem no intervalo de
tempo [0,t[, e T fr o Tempo que decorre entre avarias consecutivas, ento:

P (T>t) = P(tempo que decorre entre avarias exceder t)


= P(at ao instante t, no ocorre qualquer avaria)
t
= P (ocorrerem zero avarias no intervalo [0,t[) = P(X=0) = e

A distribuio exponencial a mais usada em estudos de fiabilidade, j que a


probabilidade de um componente sobreviver at ao instante t dada por

e t
A probabilidade de avariar at ao instante t dada por

1 e t

Estatstica Aplicada 52
Manual de Exerccios

(iv) Lei Normal


A lei Normal tem como parmetros caracterizadores a mdia e o desvio-
padro . Isto , os valores observados tm uma determinada tendncia
central e uma determinada disperso em torno da tendncia central.

A expresso
1 ( Xi ) 2
1
2
e 2
2

representa a funo densidade de probabilidade da distribuio Normal.

Se se fizer o valor mdio igual a zero e todos os desvios forem medidos em


relao mdia, a equao ser:
X
Z=

que corresponde a uma distribuio normal estandardizada (0;1) com os


valores tabelados, a qual caracterizada por uma curva de Gauss:

Esta distribuio apresenta 99,73% dos valores entre os extremos 3 e 3.

Existem muitos tipos de distribuio, mas a curva normal a forma de


distribuio mais frequente nos processos industriais para caractersticas
mensurveis, e pode considerar-se como estabelecida pela experincia prtica.

Estatstica Aplicada 53
Manual de Exerccios

(v) Lei Qui-Quadrado


Considere-se um conjunto de n variveis aleatrias Zi, obedecendo s
seguintes condies:
- cada varivel Zi segue distribuio N(0,1);
- as variveis Zi so mutuamente independentes

Ento, a varivel aleatria X, construda a partir da soma das n variveis Zi


elevadas ao quadrado, segue distribuio Qui-Quadrado com n graus de
liberdade, denotada por
n
X= Z i2 = Z12 + Z 22 + ... + Z n2
i =1

X n2

O termo Graus de Liberdade (d.f: degrees of freedom) habitualmente usado


para designar o nmero n de parcelas (variveis Zi) adicionadas. possvel
demonstrar que o valor esperado e a varincia da distribuio de uma varivel
Qui-Quadrado so respectivamente
=n
2 = 2n
A distribuio Qui-Quadrado uma distribuio assimtrica esquerda,
aproximando-se da distribuio Normal medida que n cresce.

Estatstica Aplicada 54
Manual de Exerccios

Estatstica Aplicada 55
104
Introduo ao e-learning

FMD_i.p65 104 15-01-2004, 10:49


Manual de Exerccios

PROBABILIDADES
Exerccios resolvidos

Exerccio 1
De um baralho ordinrio (52 cartas) extrai-se ao acaso 1 carta. Determine a
probabilidade dos seguintes acontecimentos:
a) sada de Rei
b) sada de copas
c) sada de Rei ou copas
d) sada de Rei mas no de copas
e) no sada de Rei
f) no sada de Rei nem de copas
g) no sada de Rei ou no sada de copas

Resoluo
A: sada de Rei
B: sada de copas
a) P(A)=1/13
b) P(B)=1/4
c) P(A B) = P(A) + P(B) - P(A B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52)
d) P(A-B) = P(A) P(A B) = 1/13 1/52 = 3/52 (= (4-1)/52)
e) P( A )= 1-1/13 = 12/13 (=(52-4)/52)
f) P( A B ) = P( A B ) = 1 P(A B) = 1 4/13 = 9/13

g) P( A B ) = P( A B ) = 1 P ( A B ) = 1 1/52 = 51/52

Exerccio 2
Um sistema electrnico formado por dois sub-sistemas, A e B. De ensaios
anteriores, sabe-se que:
- a probabilidade de A falhar de 20%
- a probabilidade de B falhar sozinho 15%
- a probabilidade de A e B falharem 15%
Determine a probabilidade de:

Estatstica Aplicada 56
Manual de Exerccios

a) B falhar
b) falhar apenas A
c) falhar A ou B
d) no falhar nem A nem B
e) A e B no falharem simultaneamente

Resoluo
A: o subsistema A falha
B: o subsistema B falha
P(A)=20% P( A )= 80%
P(B-A)=15%
P(A B)=15%
a) P(B) = P(B-A)+ P(A B) = 0,15 + 0,15 = 30%
b) P(A-B) = P(A) P(A B) = 0,2 0,15 = 5%
c) P(A B) = P(A) + P(B) - P(A B) = 0,2 + 0,3 0,15 = 35%
d) P( A B ) = P( A B ) = 1 P(A B) = 1 0,35 = 65%

e) P( A B ) = 1 P ( A B ) = 1 0,15 = 85%

Exerccio 3
Suponha que h 3 jornais, A, B e C, com as seguintes percentagens de leitura:
A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%;
A, B e C: 2,4%
Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa:
a) ler pelo menos um dos jornais
b) ler A e B mas no C
c) ler A mas no ler B nem C

Resoluo
A: a pessoa escolhida l o jornal A
B: a pessoa escolhida l o jornal B
C: a pessoa escolhida l o jornal C

P(A) = 9,8% P(B) = 22,9% P(C) = 12,1%


P(A B) = 5,1% P(A C) = 3,7% P(B C) = 6%
P(A B C) = 2,4%

Estatstica Aplicada 57
Manual de Exerccios

a)
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C )
= 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%
b) P( A B C ) = P( A B ) P ( A B C ) = 0,051 0,024 = 2,7%

c) P ( A B C ) = P(A) - P ( A B ) P ( A C ) + P ( A B C )
= 0,098-0,051-0,037+0,024 = 3,4%

Exerccio 4
Um gerente de uma galeria de arte muito creditada no mercado, est
interessado em comprar um quadro de um pintor famoso para posterior venda.
O gerente sabe que h muitas falsificaes deste pintor no mercado e que
algumas dessa falsificaes so bastante perfeitas o que torna difcil avaliar se
o quadro que ele pretende comprar ou no um original. De facto, sabe-se que
h 4 quadros falsos desse pintor para 1 verdadeiro.
O gerente no quer comprometer o bom nome da galeria para a qual trabalha
comprando um quadro falso. Para obter mais informao o gerente resolve
levar o quadro a um museu de arte e pede para que o especialista do museu o
examine. Este especialista garante-lhe que em 90% dos casos em que lhe
pedido para examinar um quadro genuno daquele pintor, ele identifica-o
correctamente como sendo genuno. Mas em 15% dos casos em que examina
uma falsificao do mesmo pintor, ele identifica-o (erradamente) como sendo
genuno.
Depois de examinar o quadro que o gerente lhe levou, o especialista diz que
acha que o quadro uma falsificao. Qual agora a probabilidade de o
quadro ser realmente uma falsificao?

Resoluo
V: o quadro genuno
F: o quadro falso
I: o quadro identificado correctamente
P(V) = 20%
P(F) = 80%
P(I/V) = 90% P( I / V ) = 10%

P( I / F ) = 15% P(I/F) = 85%

Estatstica Aplicada 58
Manual de Exerccios

P(ser realmente falsificao/especialista identificou como falsificao) =


P( F ) * P( I / F ) 0,8 * 0,85 0,68
= = = = 97,1%
P ( F ) * P ( I / F ) + P (V ) * P ( I / V ) 0,8 * 0,85 + 0,2 * 0,1 0,7

Exerccio 5
Na ida para o emprego, o Sr. scar, polcia de profisso, tem de passar
obrigatoriamente por trs cruzamentos com semforos. No primeiro
cruzamento, o do Largo Azul, a probabilidade do semforo se encontrar com
sinal vermelho de 10%. Em cada um dos cruzamentos seguintes, o Sr. scar
fica parado devido aos sinais vermelhos em metade das vezes que l passa.
O Sr. scar j descobriu que os semforos funcionam separadamente, no
estando ligados entre si por qualquer mecanismo.
Embora goste de cumprir a lei, o guarda scar passa no sinal verde e acelera
no amarelo, s parando mesmo no sinal vermelho.
a) Qual a probabilidade do Sr. scar chegar ao emprego sem ter de parar
em qualquer sinal vermelho?
b) Qual a probabilidade do Sr. scar ter de parar num s semforo?
c) Qual a probabilidade do Sr. scar ter parado no sinal vermelho do
cruzamento do Largo Azul, sabendo que parou num s semforo na sua
ida para o emprego?

Resoluo
A: polcia encontra sinal vermelho no 1 cruzamento
B: polcia encontra sinal vermelho no 2 cruzamento
C: polcia encontra sinal vermelho no 3 cruzamento
P(A)=10% P( A )= 90%

P(B)=50% P( B )= 50%

P(C)=50% P( C )= 50%

a) P( A B C ) = P( A )*P( B )*P( C ) = 0,9*0,5*0,5 = 22,5%

b) P( A B C ) + P( A B C ) +P( A B C ) =

= P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) = 47,5%

Estatstica Aplicada 59
Manual de Exerccios

c) P(polcia parar no 1 cruzamento / polcia parou num s semforo)


P ( A B C ) P ( A) * P ( B ) * P (C )
= = = 5,26%
0,475 0,475

Exerccio 6
Aps alguns testes efectuados personalidade de um indivduo, concluiu-se
que este louco com probabilidade 60%, ladro com probabilidade igual a 70%
e no louco nem ladro com probabilidade 25%. Determine a probabilidade
do indivduo:
a) Ser louco e ladro
b) Ser apenas louco ou apenas ladro
c) Ser ladro, sabendo-se que no louco

Resoluo
A: indivduo louco
B: indivduo ladro
P(A)=60%
P(B)=70%
P( A B ) = 25% = P( A B ) P(A B) = 1 0,25 = 75%

a) P(A B) = P(A) + P(B) - P(A B) 0,75 = 0,6 + 0,7 - P(A B)


P(A B) = 0,6 + 0,7 0,75 = 55%
b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20
P ( B A) P ( B A) 0,15
c) P(B/ A ) = = = = 37,5%
P ( A) 1 0,6 0,4

Exerccio 7
Uma moeda viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem
faces, ento um nmero seleccionado de 1 a 9. Se parecem coroas, um
nmero seleccionado entre 1 e 5. Determine a probabilidade de ser
seleccionado um nmero par.

Resoluo
P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%

Estatstica Aplicada 60
Manual de Exerccios

Exerccio 8
Numa fbrica, 3 mquinas, M1, M2 e M3 fabricam parafusos, sendo a produo
diria total de 10000 unidades. A probabilidade de um parafuso escolhido ao
acaso ter sido produzido por M1 30% da probabilidade de ter sido produzido
por M2. A incidncia de defeituosos na produo de cada mquina :
M1: 3% M2: 1% M3: 2%
Extrai-se ao acaso da produo diria um parafuso. Sabendo que a
probabilidade dele ser defeituoso de 1,65%, determine o nmero de
parafusos que cada mquina produz diariamente.

Resoluo
M1: o parafuso foi produzido por M1
M2: o parafuso foi produzido por M2
M3: o parafuso foi produzido por M3
D: o parafuso defeituoso

n = 10000 unidades
P(M1) = 0,3 P(M2)
P(D / M1) = 3%
P(D / M2) = 1%
P(D / M3) = 2%
P(D) = 1,65%

Prod. 1 = P(M1)*10000 = ?
Prod. 2 = P(M2)*10000 = ?
Prod. 3 = P(M3)*10000 = ?

P( M 1) = 0,3P( M 2)
P( M 1) + P ( M 2) + P( M 3) = 1
P( D) = P( M 1) * P( D / M 1) + P( M 2) * P ( D / M 2) + P( M 3) * P( D / M 3)


1,3P( M 2) + P( M 3) = 1
0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + P( M 3) * 0,02

Estatstica Aplicada 61
Manual de Exerccios


P( M 3) = 1 1,3P( M 2)
0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + (1 1,3P( M 2)) * 0,02

P( M 1) = 0,3 * 0,5 = 15%


P( M 3) = 1 1,3P( M 2) = 1 1,3 * 0,5 = 35%
P( M 2) = 50%

Exerccio 9
O Joo tem sua disposio 3 meios de transporte diferentes para se deslocar
de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
- chegar atrasado escola 60%
- chegar atrasado utilizando o transporte A 80%
- chegar atrasado utilizando o transporte B 50%
- chegar atrasado utilizando o transporte C 60%
- utilizar os transportes B e C a mesma
a) Calcule a probabilidade de o Joo utilizar o transporte A
b) Sabendo que o Joo chegou atrasado escola, calcule a probabilidade
de ter utilizado os transportes B ou C.

Resoluo
T: O Joo chega atrasado
A: o Joo utiliza o transporte A
B: o Joo utiliza o transporte B
C: o Joo utiliza o transporte C
P(T) = 0,6
P(T/A) = 0,8
P(T/B) = 0,5
P(T/C) = 0,6
P(B) = P(C)
P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)

a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)

Estatstica Aplicada 62
Manual de Exerccios

Logo
0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6
e vem que
P(B) = 40%
Ento P(A) = 1 2P(B) = 1 2*0,4 = 20%
P ( B ) * P (T / B ) + P (C ) * P (T / C ) 0,4 * 0,5 + 0,4 * 0,6
b) P(B C / T) = = =73,3%
P (T ) 0,6

Exerccio 10
Uma empresa que se dedica prestao de servios de seleco de pessoal
em relao a um teste psicotcnico para uma profisso especfica sabe o
seguinte:
- as percentagens de indivduos com um quociente de inteligncia (Q.I.)
elevado e mdio so, respectivamente, de 30% e de 60%
- a percentagem de indivduos com Q.I. mdio que ficam aptos no teste
de 50%
- a probabilidade de um indivduo com Q.I. baixo ficar apto no teste de
20%
- finalmente, sabe-se que 70% dos indivduos com Q.I. elevado ficam
aptos no teste
a) Qual a probabilidade de um indivduo escolhido ao acaso ficar apto no
teste?
b) Qual a probabilidade de um indivduo ter Q.I. baixo, sabendo-se que
ficou inapto?

Resoluo
A: indivduo fica apto no teste
E: indivduo tem QI elevado
M: indivduo tem QI mdio
B: indivduo tem QI baixo
P(E) = 30% P(M) = 60% P(B) = 1 0,3 0,6 = 10%
P(A/M) = 50% P(A/B) = 20% P(A/E) = 70%

Estatstica Aplicada 63
Manual de Exerccios

a) P(A)
=P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B)
=0,3*0,7+0,6*0,5+0,1*0,2=53%
P( B ) * P ( A / B) 0,1 * 0,8
b) P(B/ A ) = = = 17%
P ( A) 1 0,53

Exerccio 11
Os resultados de um inqurito aos agregados familiares de uma determinada
cidade forneceram os seguintes dados:
- 35% dos agregados possuem telefone
- 50% dos agregados possuem frigorfico
- 25% dos agregados possuem automvel
- 15% dos agregados possuem telefone e frigorfico
- 20% dos agregados possuem telefone e automvel
- 10% dos agregados possuem frigorfico e automvel
- 5% dos agregados possuem telefone, automvel e frigorfico

a) Calcule a probabilidade de um agregado familiar


1. possuir telefone ou frigorfico
2. no possuir nem telefone nem automvel
b) Calcule a probabilidade de um agregado que possui automvel
1. possuir tambm frigorfico
2. possuir tambm telefone ou frigorfico
c) Calcule a probabilidade de um agregado familiar
1. possuir pelo menos um daqueles trs objectos
2. no possuir nenhum daqueles trs objectos

Resoluo
A: agregado familiar possui telefone
B: agregado familiar possui frigorfico
C: agregado familiar possui automvel
P(A) = 35%
P(B) = 50%
P(C) = 25%

Estatstica Aplicada 64
Manual de Exerccios

P(A B) = 15%
P(A C) = 20%
P(B C) = 10%
P(A B C) = 5%

a) 1. P(A B) = P(A) + P(B) - P(A B) = 0,35 + 0,5 0,15 = 70%


2. P( A C ) = P( A C ) = 1 P(A C) = 1 0,4 = 60%
P(A C) = P(A) + P(C) - P(A C) = 0,35 + 0,25 0,2 = 40%
P( B C ) 0,1
b) krysktsh1. P(B / C) = = = 40%
P (C ) 0,25
2. P(A B/ C) =
P ( A C ) + P ( B C ) P ( A B C ) 0,2 + 0,1 0.05
= = 100%
P (C ) 0,25
c) 1.
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C )
= 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%
2. 1 P( A B C ) = 1 0,7 = 30%

Exerccio 12
Admita que 60% dos seguros no ramo automvel respeitam a condutores com
mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por
ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tm um
ou mais acidentes no mesmo perodo.
a) Qual a probabilidade de um segurado no sofrer qualquer acidente
durante um ano?
b) Qual a probabilidade de um segurado que sofreu pelo menos um
acidente ter idade igual ou inferior a 40 anos?
c) Qual a probabilidade de, numa amostra de trs segurados
1. todos terem idade igual ou inferior a 40 anos?
2. nenhum ter sofrido qualquer acidente durante um ano?
3. Todos terem idade igual ou inferior a 40 anos, dado que cada um
sofreu, pelo menos, um acidente durante o referido perodo?

Estatstica Aplicada 65
Manual de Exerccios

Resoluo
I1: o segurado tem mais de 40 anos de idade
I2: o segurado tem 40 anos ou menos de idade
A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado no sofre nenhum acidente por ano
P(I1) = 60% P(I2) = 1 0,6 = 40%

P(A/I1) = 5% P( A /I1) = 1 0,05 = 95%

P(A/I2) = 3% P( A /I2) = 1 0,03 = 97%

a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8%


P ( A I 2) P ( I 2) * P ( A / I 2) 0,6 * 0,03
b) P(I2/A) = = = = 28,57% = P(B)
P ( A) P ( A) 1 0,958
c) 1. P( I 2 I 2 I 2) = 0,4*0,4*0,4 = 6,4%

2. P( A A A) = 0,958*0,958*0,958 = 87,9%
3. P( B B B ) = 0,2857*0,2857*0,2857 = 2,3%

Estatstica Aplicada 66
104
Introduo ao e-learning

FMD_i.p65 104 15-01-2004, 10:49


Manual de Exerccios

FUNES DE PROBABILIDADE
Exerccios resolvidos

Exerccio 1
Se 20% das bobinas de um determinado cabo elctrico forem defeituosas,
calcule a probabilidade de, entre as 4 bobines necessrias a um determinado
cliente, escolhidas ao acaso uma ser defeituosa.

Resoluo
X: nmero de bobines defeituosas no conjunto de 4 bobines necessrias a um
determinado cliente (0,1,2,3,4)
n=4 p=0,2 q=1-p=0,8
P(X=1)=C4p1q4-1 = 4*0,2*0,83 = 0,4096 = 41%

Exerccio 2
O nmero mdio de chamadas telefnicas a uma central, por minuto, 5. A
central s pode atender um nmero mximo de 8 chamadas por minuto. Qual a
probabilidade de no serem atendidas todas as chamadas no intervalo de
tempo de 1 minuto?

Resoluo
X: nmero de chamadas telefnicas atendidas numa central, por minuto
(0,1,2,3,4, 5, 6, 7, 8)
=5 p=0,2 q=1-p=0,8
8
e 5 5 x
P(X 8) = = 0,932 Logo P(X>8) = 1-0,932 = 0,06
x =0 x!

Exerccio 3
O tempo de funcionamento sem avarias de uma determinada mquina de
produo contnua segue uma lei exponencial negativa com valor esperado
igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no
instante t=0 horas.
Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?

Estatstica Aplicada 67
Manual de Exerccios

Resoluo
Seja
T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de
uma mquina, e
X: numero de avarias que ocorrem no intervalo [0,6[, isto , num perodo de 6h
=1/4,5 corresponde ao nmero de avarias por unidade de tempo (por hora)

Logo
1
*6
P(T 6) = P(X=0)= e
4,5
= e 1,333 = 0,264

Exerccio 4
Considere que o comprimento mdio de determinado fio condutor 120, com
desvio padro 0,5. Qual a percentagem de fio com comprimento superior a 121?

Resoluo
X: comprimento de determinado fio condutor
Calculando a varivel reduzida correspondente, vem:
121 120
Z= =2
0,5
Consultando a tabela, verifica-se que o valor da funo Z P(X 2) = 0,9772.
Logo P(X>2) = 1-0,9772 = 2,28%.

Exerccio 5
Numa praia do litoral portugus existe um servio de aluguer de barcos,
destinado aos turistas que a frequentam. O nmero de turistas que procuram
este servio, por hora, est associado a uma varivel aleatria com distribuio
de Poisson.
Verificou-se que, em mdia, em cada hora, esse servio procurado por 8
turistas interessados em alugar barcos; sabe-se, por outro lado, que esse
servio funciona ininterruptamente das 8 s 20 horas.
a) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5
barcos?
b) Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos
sejam procurados por mais de 25 turistas?

Estatstica Aplicada 68
Manual de Exerccios

Resoluo
X: n de turistas que procuram o servio de aluguer de barcos por hora
X segue Po(=8)
a) Na tabela da Po(=8) vem P(X=5) = 9,16%
b) Y1: n de turistas que procuram o servio de aluguer na 1 hora
Y2: n de de turistas que procuram o servio de aluguer na 2 hora
Logo
Y1+Y2: n de turistas que procuram o servio de aluguer em 2 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2
independentes e que todas seguem Po(8), vem que:
Z=Y1+Y2 segue Po(2*8=16)
Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%

Exerccio 6
O nmero de navios petroleiros que chegam diariamente a certa refinaria
uma varivel com distribuio de Poisson de parmetro 2. Nas actuais
condies, o cais da refinaria pode atender, no mximo, 3 petroleiros por dia.
Atingido este nmero, os restantes que eventualmente apaream devero
seguir para outro porto.
a) Qual a probabilidade de, num qualquer dia, ser preciso mandar
petroleiros para outro porto?
b) De quanto deveriam ser aumentadas as instalaes de forma a
assegurar cais a todos os petroleiros em 99,9% dos dias?
c) Qual o nmero esperado de petroleiros a chegarem por dia?
d) Qual o nmero mais provvel de petroleiros a chegarem por dia?
e) Qual o nmero esperado de petroleiros a serem atendidos diariamente?
f) Qual o nmero esperado de petroleiros que recorrero a outros portos
diariamente?

Resoluo
X: n de petroleiros que chegam diariamente a uma certa refinaria
X segue Po (2)
Capacidade mxima de atendimento da refinaria: 3 petroleiros/dia

Estatstica Aplicada 69
Manual de Exerccios

a) P(X>3) = 1 P(X 3) = 1 F(3) = 1 0,8571 =14,29%


(tab. pg.14)
b) N mximo de petroleiros que podem chegar: 9 (informao da tabela)
Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3)
c) E(X) = 2
d) X = 1 ou X = 2, com probabilidade 27,07%
e) Y: n de petroleiros que so atendidos diariamente numa certa refinaria
(0,1, 2, 3)
g(0) = P(X=0) = 0,1353
g(1) = P(X=1) = 0,2707
g(2) = P(X=2) = 0,2707
g(3) = P(X=3) = 1 P(X<3) = 1 P(X 2) = 1 0,6767 = 0,3233
E(Y) = 0*0,1353 + + 3*0,3233 = 1,782
So atendidos, em mdia, entre 1 e 2 petroleiros diariamente
f) Z: n de petroleiros que recorrem diariamente a outros portos
(0,1, 2, 3, 4, 5, 6)
Logo, Z = X - Y
E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218
Recorrem a outros portos, em mdia, entre 0 e 1 petroleiro por dia
g) W: n de dias em que preciso mandar petroleiros para outro porto num
ms de 30 dias (0,1, 2,...30)
W segue Bi (n = 30; p = P(X>3) = 0,1429)
E(W) = 30*0,1429 = 4,3
Em mdia, preciso enviar petroleiros para outro porto 4 a 5 dias/ms

Exerccio 7
Os Servios Municipalizados de Gs e Electricidade debitam mensalemnte aos
seus clientes um consumo terico T de energia elctrica calculado de tal modo
que a probabilidade de o consumo efectivo o exceder seja de 30,85%.
Suponha um cliente cujo consumo por ms segue lei normal de mdia 400 kwh
e desvio-padro 40 kwh.
a) Qual o consumo terico que lhe mensalmente debitado?
b) 1. Qual a distribuio do consumo efectivo durante 3 meses?

Estatstica Aplicada 70
Manual de Exerccios

2. Qual a probabilidade de que, ao fim de 3 meses, o consumo terico


exceda o efectivo em mais de 100 kwh?

Resoluo
X: consumo efectivo de energia elctrica de um cliente por ms (em kwh)
T: consumo terico (valor fixo) debitado ao cliente por ms (em kwh)
T: P(X>T) = 0,3085
X segue N(400; 1600)
X 400 T 400
a) P(X>T) = 0,3085 P( > ) = 0,3085
40 40
T 400 T 400
P(N(0,1) ) = 0,6915 = 0,5 T = 420
40 40
b) 1.
X1: consumo efectivo de energia elctrica de um cliente no 1ms (em kwh)
X2: consumo efectivo de energia elctrica de um cliente no 2ms (em kwh)
X3: consumo efectivo de energia elctrica de um cliente no 3ms (em kwh)
Logo
X1+X2+X3: consumo efectivo de energia elctrica em 3 meses (em kwh)
Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3
independentes e que todas seguem N(400, 1600), vem que:
Y=X1+X2+X3 segue N(400*3; 1600*3), isto , N(1200; 4800)
1160 1200
2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< )=
4800
= P(N(0,1)<-0,58) = 28,1%

Exerccio 8
Num determinado processo de fabrico, existem 2 cadeias de montagem A e B,
com funcionamento independente.
A cadeia A opera a um ritmo mdio de 2 montagens por hora, e a probabilidade
da cadeia B efectuar pelo menos uma montagem numa hora de 98,71%.
Admitindo que o nmero de montagens efectuadas por hora em ambas as
cadeias uma v.a. Poisson, determine:
a) a probabilidade de se efectuarem mais de 6 montagens numa hora com
a cadeia B

Estatstica Aplicada 71
Manual de Exerccios

b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mximo


10 montagens com a cadeia B
c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de
montagens de B
d) o nmero mdio de montagens efectuadas num dia de trabalho de 8
horas com ambas as cadeiras

Resoluo
X: n de montagens da cadeia A por hora X segue Po(2)
Y: n de montagens da cadeia B por hora
a) Y segue Poisson, mas desconhece-se a mdia (=parmetro )
No entanto, como se sabe que P(Y 1) = 0,9817, vem que
P(Y<1) = 1 0,9817 = 0,0183
Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o
valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a
coluna 4. Logo, = 4.
Na tabela da Po(4), P(Y>6) = 1P(Y 6) = 1F(6) = 1-0,8893=11,07%
b)
Y1: n de montagens da cadeia B na 1 hora
Y2: n de montagens da cadeia B na 2 hora
Y3: n de montagens da cadeia B na 3 hora
Logo
Y1+Y2+Y3: n de montagens da cadeia B em 3 horas
Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3
independentes e que todas seguem Po(4), vem que:
Z=Y1+Y2+Y3 segue Po(4*3=12)
P(Z 10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + + 0,1048 = 34,72%
c) P(X=2Y) = P(X=0 Y=0) + P(X=2 Y=1) + P(X=4 Y=2) +
P(X=6 Y=3) + P(X=8 Y=4) = 0,1353*0,0183 + 0,2707*0,0753 +
0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8%
d) W: n de montagens das 2 cadeias num dia de trabalho de 8 horas
8
W= ( X i + Yi )
i =1

onde Xi + Yi corresponde ao n de montagens das 2 cadeias por hora

Estatstica Aplicada 72
Manual de Exerccios

Pelo Teorema da Aditividade de Poisson, sendo as variveis


independentes e seguindo Po(2) e Po(4) respectivamente, vem que
Xi + Yi segue tambm Po(2+4=6).
E Z , tambm pelo mesmo Teorema, segue Po(6*8=48)
Logo, o nmero mdio de montagens efectuado pelas 2 cadeias num dia
de trabalho de 8 horas de 48.

Exerccio 9
Uma companhia de tabacos recebeu em dada altura um elevado nmero de
queixas quanto qualidade dos cigarros de certa marca que comercializa.
Numa rpida anlise s condies de produo, constata-se que 1% dos filtros
que compem o cigarro saem defeituosos. Nestas condies, determine:
a) a probabilidade de um mao acabado de formar
1. conter 1 cigarro com filtro defeituoso
2. conter 0 cigarros com filtro defeituoso
b) o nmero de maos que, num volume que contm 20, a companhia
espera poder aproveitar se utilizar o critrio:
1. mao aproveitvel se no contiver cigarros defeituosos
2. mao aproveitvel se contiver no mximo 1 cigarro defeituoso

Resoluo
X: n de cigarros com filtro defeituoso em 20 cigarros de um mao
X segue Bi(n=20; p=0,01)
a) 1. P(X=1) = 20*0,01*0,9919 = 16,52%
2. P(X=0) = 0,010*0,9920 = 81,79%
b) 1. Crit. 1: mao aproveitvel se no contiver cigarros defeituosos
Y: n de maos aproveitveis num volume que contem 20 maos
Y segue Bi(n=20; p=P(X=0) = 0,8179)
Logo E(Y) = 20*0,8179 = 16,36
2. Crit. 2: mao aproveitvel se contiver no mximo 1 cigarro defeituoso
Y: n de maos aproveitveis num volume que contem 20 maos
Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831)
Logo E(Y) = 20*0,9831 = 19,66

Estatstica Aplicada 73
Manual de Exerccios

Exerccio 10
O comprimento das peas produzidas por uma mquina uma v.a. Normal
com mdia e varincia 2. Uma pea defeituosa se o seu comprimento diferir
do valor mdio mais do que . Sabemos que 50% das peas produzidas tm
comprimento inferior a 0,25 mm e 47,5% tm comprimento entre 0,25 mm e
0,642 mm.
a) Calcule a mdia e o desvio-padro do comprimento das peas.
b) Determine a probabilidade de uma pea no ser defeituosa.

Resoluo
X: comprimento das peas produzidas por uma mquina
X segue N(; 2)
Pea defeituosa se X> + ou se X< -
P(X<0,25) = 50%
P(0,25<X<0,642) = 47,5%

a) Como P(X<0,25) = 50% vem que


X 0,25
P( < ) = 50%

0,25
Na tabela, tem que ser =0, logo = 0,25

E como
P(0,25<X<0,642) = 47,5% vem que
0,25 0,25 X 0,25 0,642 0,25 0,392
P( < < ) = P (0 < N (0,1) < )=

0,392
=( ) (0) = 0,475

0,392
Sendo (0)=0,5, vem que ( ) = 0,475 + 0,5 = 0,975

0,392
Na tabela 3B da Normal, vem que = 1,96 e logo = 0,2

b) P(pea no defeituosa) = P( - < X < + ) = P(0,05 < X < 0,45) =
P(X<0,45) P(X<0,05) =
0,45 0,25 0,05 0,25
( ) ( ) = (1) (1) = D (1) = 84,13%
0,2 0,2

Estatstica Aplicada 74
Manual de Exerccios

Exerccio 11
Sabe-se que a probabilidade de cura de uma certa doena 20%. Pe-se
prova um novo medicamento, que eleva a probabilidade de cura para 40%,
ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento
eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20.
Calcule a probabilidade de se concluir pela ineficcia do medicamento, ainda
que este eleve de facto a probabilidade de cura para 40%.

Resoluo
X: nmero de doentes curados no grupo de 20 a que ministrado o novo
medicamento (0,1,2...19, 20)
n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4)
P(X 8)=1- F(7) = 41,58%

Exerccio 12
Sabe-se por via experimental que, por cada perodo de 5 minutos, chegam, em
mdia, 4 veculos a determinado posto abastecedor de combustveis. Um
empregado entra ao servio s 8 horas. Qual a probabilidade de ter de
aguardar mais de 10 minutos at chegada de um veculo?

Resoluo
X: n de veculos que chegam ao posto abastecedor por perodo de 5 minutos
X segue Po(4)
Se
X1: n de veculos que chegam ao posto no 1 perodo de 5 minutos
X2: n de veculos que chegam ao posto no 2 perodo de 5 minutos
ento
X1+X2: n de veculos que chegam ao posto abastecedor em 10 minutos
Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes
e que ambas seguem Po(4), vem que X1+X2 tambm segue Po(4+4=8)

Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.

Estatstica Aplicada 75
Manual de Exerccios

3.4. Estimao por intervalos

Conhecendo-se uma amostra em concreto, possvel estimar os valores dos


seus parmetros caracterizadores atravs de mtodos probabilsticos.
Por exemplo, suponhamos que numa fbrica produtora de acar se pretende
averiguar se o peso dos pacotes produzidos est, em mdia, dentro das
normas de qualidade exigveis. Na impossibilidade de medio do peso de
todos os pacotes, pela morosidade e dispndio de recursos que tal implicaria, a
estatstica permite que, a partir da observao de uma nica amostra, seja
possvel inferir entre que valores varia o peso mdio com um grau de confiana
ou probabilidade elevado. Assim, ao recolher um determinado nmero de
pacotes da produo total aleatoriamente, possvel calcular o peso mdio de
acordo com as tcnicas de estatstica descritiva apreendidas atrs. Claro que
nada nos garante que esse valor coincide com o valor do parmetro da
populao em estudo. De facto, at provvel que no coincida e, mais, se
recolhermos outro conjunto idntico de pacotes, o valor seja diferente. Isto ,
para cada amostra de dimenso n recolhida, a estimativa do parmetro
assumiria valores distintos. Ento, como retirar concluses? Como garantir
algum nvel de rigor?

O mtodo a estudar neste captulo a estimao por intervalos permite, a


partir da recolha de uma nica amostra, aferir entre que valores seria de
esperar que variasse o parmetro de interesse se nos empenhssemos a
recolher um nmero infinito de amostras. Isto , por exemplo, caso o valor
amostral fosse de 1,02 kg, este mtodo poderia, por exemplo, permitir afirmar
que seria altamente provvel que o peso dos pacotes produzidos estivesse a
variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nvel de
confiana associado: por exemplo, se dissermos que o nvel de confiana ou
certeza implicado de 95%, tal significa que, se nos fosse possvel observar
um nmero infinito de amostras, o intervalo de valores apresentado
corresponderia aos resultados obtidos em 95% delas (os valores mais
usualmente utilizados so 90%, 95% ou 99% de confiana). Caberia depois
empresa julgar se esses seriam ou no valores aceitveis e proceder aos
eventuais reajustes necessrios.

Estatstica Aplicada 76
Manual de Exerccios

A partir do conceito de intervalo de confiana para um parmetro, fcil


concluir que a sua especificao implica conhecer:
- o estimador do parmetro em causa
- a sua distribuio de probabilidade
- uma estimativa particular daquele parmetro
Como parmetros de interesse e para efeitos de exemplificao, vo
considerar-se duas tipologias de intervalo: o intervalo de confiana para a
mdia de uma populao normal e o intervalo de confiana para a proporo
de uma populao binomial. Para efeitos de simplificao, vo considerar-se
apenas exemplos relativos a amostras de grande dimenso (na prtica, n 100)

(i) Intervalo de confiana para a mdia de uma populao normal

Seja X (mdia amostral) o estimador da mdia da populao. Porque a


distribuio Normal, a distribuio deste estimador ser:

X N ( ; )
n

Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se


necessrio calcular a varivel reduzida correspondente:
X
Z= N (0;1)

n
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a
mdia de uma populao normal:

X c ;X +c
n n

Isto , em torno do valor do estimador, definido um intervalo de variao onde


possvel afirmar que o parmetro a estimar est contido com um grau de
confiana . Esse intervalo de variao depende:
- da dimenso da amostra (n): quanto maior a dimenso da amostra,
menor a amplitude do intervalo. Este resultado explica-se facilmente: no
limite, se fosse possvel observar todo o universo de dados (n= ), o
valor amostral calculado corresponderia ao valor da populao.

Estatstica Aplicada 77
Manual de Exerccios

- do desvio - padro da populao ( ): quanto maior o desvio - padro,


maior a amplitude do intervalo. Como se sabe, o desvio - padro uma
medida que caracteriza a disperso da distribuio. Quanto maior o seu
valor, maior a variabilidade apresentada pelos dados, sendo natural que
a margem de variao de prever em torno do valor amostral recolhido
seja tambm, naturalmente, maior.
- do valor crtico (c): quanto maior o valor c, maior a amplitude do
intervalo. O valor crtico reflecte o nvel de confiana adoptado.
Naturalmente, para que aumente a confiana de que o valor do
parmetro a estimar est contido no intervalo, a sua amplitude deve
aumentar tambm (no limite, se o intervalo se alongasse de - a + a
confiana seria total ou 100%). possvel encontrar o valor c na tabela
da normal (pois esta a lei do estimador), da seguinte forma:
P ( c Z c ) =
j que assim possvel definir a frmula geral do intervalo,
resolvendo a inequao em ordem ao parmetro, :

X
P (c c) = P( X c X c )=
n n
n

Se o desvio - padro da populao fr desconhecido, utiliza-se este intervalo


considerando-se como estimativa de o desvio - padro corrigido da amostra,

( xi x ) 2
ou seja, s= , tal que:
n 1

s' s'
X c ;X +c
n n

(ii) Intervalo de confiana para a proporo p de uma populao binomial

Seja p (proporo amostral ou frequncia observada na amostra) o estimador


da proporo p de uma populao binomial. Sendo a amostra de grande
dimenso, a distribuio deste estimador ser:
p(1 p )
p N ( p; )
n

Estatstica Aplicada 78
Manual de Exerccios

Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se


necessrio calcular a varivel reduzida correspondente:
p p
Z= N (0;1)
p (1 p )
n
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a
proporo p de uma populao binomial:

p (1 p ) p (1 p )
p c ; p + c
n n

(como estimativa de p (1 p ) foi utilizado p (1 p ))

Como bvio, pretende-se que o resultado possua o mximo de confiana


possvel. No entanto, se uma maior confiana pretendida na estimao, esta
conduz a possibilidades de erro maiores, dado que um elevado nvel de
confiana conduz a um intervalo maior e, como tal, a preciso da estimao
diminui.

Exemplo:
Consideremos 3 afirmaes de alunos que aguardam a sada das pautas de
um exame de Estatstica:
Afirm. 1: Tenho a sensao que as pautas sero afixadas durante a manh
Afirm. 2: Tenho quase a certeza que as pautas sero afixadas entre as 10h e
as 11h
Afirm. 3: Tenho a certeza absoluta que as pautas ou so afixadas s 10h30 ou
j no so afixadas hoje

Estas 3 afirmaes permitem constatar facilmente que se se pretende maior


confiana na estatstica, se tem que permitir que a possibilidade de erro
aumente. Por outro lado, se se permitir que o erro diminua, os extremos do
intervalo aumentam, embora o resultado perca alguma preciso. No entanto,
h que ter em ateno que, se um intervalo de confiana tem uma amplitude
demasiado grande, a estimativa no tem utilidade. Cabe ao investigador gerir
este trade-off.

Estatstica Aplicada 79
Manual de Exerccios

Isto leva a uma questo importante: o dimensionamento de amostras. At aqui,


sempre se assumiu que as dimenses so conhecidas partida, sem referir
como se determinam. No entanto, a resoluo deste problema tem um enorme
interesse prtico, j que (i) recolher e tratar uma amostra demasiado grande
para os resultados que se pretendem obter constitui um evidente desperdcio
de recursos e (ii) recolher uma amostra cuja dimenso insuficiente para
retirar concluses constitui um erro.
A dimenso das amostras aumentar se se pretender garantir maior preciso
ao intervalo e/ou maior grau de confiana.

No captulo dedicado a aplicaes estatsticas, ser possvel ver como


possvel utilizar o conceito de intervalo de confiana ao controlo estatstico de
processos de qualidade.

Estatstica Aplicada 80
Manual de Exerccios

INTERVALOS DE CONFIANA
Exerccios

Exerccio 1
Suponha-se que se tem uma populao normal com mdia desconhecida e
desvio - padro 3, N (, 9) e uma amostra de 121 observaes. Deduza um
intervalo de confiana para a com 95% de confiana.

Resoluo
Para os dados deste exerccio, vem:
n=121
=3
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo

X c

n
;X +c

n
= X
1,96 x3
11
;X
1,96 x3
11
[
= X 0,535; X + 0,535 ]
[ ]
O intervalo X 0,535; X + 0,535 contm o verdadeiro valor do parmetro
com probabilidade ou confiana de 95%. Conhecida uma estimativa particular
daquele parmetro, torna-se possvel calcular entre que valores seria de
esperar que, com 95% de confiana, variasse .

Exerccio 2
Numa cidade pretende-se saber qual a proporo da populao favorvel a
certa modificao de trnsito. Faz-se um inqurito a 100 pessoas, e 70
declaram-se favorveis.
Determine um intervalo de confiana a 95% para a proporo de habitantes
dessa cidade favorveis modificao de trnsito.

Resoluo
n=100
70
p = = 0,7
100
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo

Estatstica Aplicada 81
Manual de Exerccios

p (1 p ) p (1 p ) 0,7 x0,3 0,7 x0,3


p c ; p + c = 0,7 1,96 ;0,7 1,96 =
n n 100 100
= [0,6102;0,7898]
O intervalo [0,6102;0,7898] contm o verdadeiro valor do parmetro p com
probabilidade ou confiana de 95%.
Ou seja, a proporo de habitantes favorveis modificao de trnsito est
situada entre 61,02% e 78,98%, com probabilidade de 95%.

Exerccio 3
Uma mquina fabrica cabos cuja resistncia ruptura (em kg/cm2) uma
varivel com distribuio Normal de mdia 100 e desvio - padro 30. Pretende-
se testar uma nova mquina que, segundo indicaes do fabricante, produz
cabos com resistncia mdia superior. Para isso, observam-se 100 cabos
fabricados pela nova mquina, que apresentam uma resistncia mdia de 110
kg/cm2. Admita que o novo processo no altera o desvio padro da resistncia
ruptura dos cabos.
a) Determine um intervalo de confiana a 95% para a resistncia mdia
ruptura dos cabos produzidos pela nova mquina.
b) Suponha que pretendamos obter um intervalo de confiana com a
mesma amplitude do anterior, mas com nvel de confiana de 99%.
Quantos cabos deveriam ser observados?

Resoluo
a)
X segue N(100; 302)
n=100 x =110 =30 =95%
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo
1,96 x30 1,96 x30
X c ;X +c = 110 ;110 = [104,12;115,88]
n n 10 10
Estima-se, com 95% de confiana, que a resistncia mdia ruptura dos cabos
produzidos pela nova mquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.

Estatstica Aplicada 82
Manual de Exerccios

b) Amplitude = 115,88 104,12 = 11,76



Amplitude = Lim.Sup. - Lim.Inf. = ( X + c ) -( X c ) = 2c
n n n

Logo 2c =11,76
n
Sendo que
x =110 =30
c: P (c Z c) = 99% D (c) = 99% c = 2,576
vem que
n = 173 cabos

Exerccio 4
Uma amostra de 20 cigarros analisada para determinar o contedo de
nicotina, observando-se um valor mdio de 1,2 mg. Sabendo que o desvio -
padro do contedo de nicotina de um cigarro 0,2 mg, diga, com 99% de
confiana, entre que valores se situa o teor mdio de nicotina de um cigarro.

Resoluo

X segue N(; 0,22)

n=20 x =1,2 =0,2 =99%


c: P (c Z c) = 99% D (c) = 99% c = 2,576
e logo
2,576 x0,2 2,576 x0,2
X c ;X +c = 1,2 ;1,2 = [1,085;1,315]
n n 20 20
Estima-se, com 99% de confiana, que o teor mdio de nicotina de um cigarro
se situa entre 1,085 mg e 1,315 mg.

Exerccio 5
Admita-se que a altura dos alunos de uma escola segue distribuio Normal
com varincia conhecida e igual a 0,051. Admita-se ainda que foi recolhida
uma amostra aleatria com dimenso n=25 alunos e calculada a respectiva
mdia amostral, tendo-se obtido o valor de 1,70m. Defina um intervalo que,
com probabilidade 95%, contenha o valor esperado da altura .

Estatstica Aplicada 83
Manual de Exerccios

Resoluo

X segue N(; 0,051)

n=25 x =1,70 2=0,051 =95%


c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo

1,96 x 0,051 1,96 x 0,051


X c ;X +c = 1,7 ;1,2 = [1,611;1,788]
n n 25 25

Estima-se, com 95% de confiana, que o teor mdio de nicotina de um cigarro


se situa entre 1,085 mg e 1,315 mg.

Exerccio 6
Numa fbrica, procura conhecer-se a incidncia de defeituosos na produo de
uma mquina. Para tanto, colhe-se uma amostra de dimenso suficientemente
grande (1600 artigos), onde 10% dos artigos so defeituosos. Determine o
intervalo de confiana para a referida proporo com 90% de confiana.

Resoluo
n=1600
p =10%
c: P (c Z c) = 90% D (c) = 90% c = 1,645
e logo

p (1 p ) p (1 p ) 0,1x0,9 0,1x0,9
p c ; p + c = 0,1 1,645 ;0,1 1,645 =
n n 1600 1600
= [0,0876;0,1123]
Estima-se, com 90% de confiana, que a proporo de artigos defeituosos na
produo se situa entre 8,76% e 11,23%.

Exerccio 7
O director fabril de uma empresa industrial que emprega 4000 operrios emitiu
um novo conjunto de normas internas de segurana. Passada uma semana,
seleccionou aleatoriamente 300 operrios e verificou que apenas 75 deles
conheciam suficientemente bem as normas em causa. Construa um intervalo

Estatstica Aplicada 84
Manual de Exerccios

de confiana a 95% para a proporo de operrios que conheciam


adequadamente o conjunto das normas uma semana aps a sua emisso.

Resoluo
n=300
75
p = = 0,25
300
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo

p (1 p ) p (1 p ) 0,25 x0,75 0,25 x0,75


p c ; p + c = 0,25 1,96 ;0,25 1,96 =
n n 300 300
= [0,201;0,299]
Estima-se, com 95% de confiana, que a proporo de operrios que
conheciam adequadamente o conjunto das normas se situa entre 20,1% e
29,9%.

Exerccio 8
A Direco de Marketing de uma empresa pretende conhecer a notoriedade da
marca de determinado produto. Nesse sentido, efectuou um inqurito junto de
1200 pessoas escolhidas aleatoriamente, verificando que 960 a conheciam.
a) Estime a proporo de pessoas conhecedoras da marca atravs de
um intervalo de confiana a 90%.
b) Se se pretender que a amplitude do intervalo de confiana da alnea
anterior no seja superior a 0,034, qual deve ser a dimenso mnima
da amostra?
c) Sabendo que o intervalo de confiana determinado pela Direco de
Marketing foi [0,767; 0,833], calcule o nvel de confiana utilizado

Resoluo
a) n=1200
960
p = = 0,8
1200
c: P (c Z c) = 90% D (c) = 90% c = 1,645
e logo

Estatstica Aplicada 85
Manual de Exerccios

p (1 p ) p (1 p ) 0,8 x0,2 0,8 x0,2


p c ; p + c = 0,8 1,645 ;0,8 1,645 =
n n 1200 1200
= [0,781;0,819]
Estima-se, com 90% de confiana, que a proporo de indivduos
conhecedores da marca se situa entre 78,1% e 81,9%.

p (1 p ) p (1 p ) p (1 p )
b) Amp.=Lim.Sup.-Lim.Inf. = ( p + c ) ( p c ) = 2c
n n n
Logo
p (1 p ) 0,8 * 0,2
2c = 2 *1,645 * 0,034 n 1499
n n

p (1 p )
c) p + c = 0,833
n

0,8 * 0,2
Logo 0,8 + c = 0,833 c = 2,86
1200
E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nvel de
confiana utilizado

Exerccio 9
O gabinete de projectos de uma empresa de material de construo civil
pretende estimar a tenso de ruptura do material usado num determinado tipo
de tubos.
Com base num vasto conjunto de ensaios realizados no passado, estima-se
que o desvio - padro da tenso de ruptura do material em causa de 70 psi.
Deseja-se definir um intervalo de confiana a 99% para o valor esperado da
tenso de ruptura, pretendendo-se que a sua amplitude no exceda 60 psi.
Qual o nmero de ensaios necessrio para definir tal intervalo?

Resoluo

n=? =70 =99%


c: P (c Z c) = 99% D (c) = 99% c = 2,576
70
Amplitude = 2c Logo 2c 60 2 * 2,576 * 60 n 36
n n n

Estatstica Aplicada 86
Manual de Exerccios

Exerccio 10
A empresa SCB controla regularmente a resistncia ruptura dos cabos por si
produzidos. Recentemente, foram analisadas as tenses de ruptura de 10
cabos SCB-33R, seleccionados aleatoriamente a partir de um lote de grandes
dimenses, tendo sido obtida uma mdia de 4537 kg/cm2. Existe uma norma
de 112 kg/cm2 em relao varincia, que respeitada. O director comercial
pretende saber qual o intervalo de confiana, a 95%, para o valor esperado da
tenso de ruptura dos cabos do lote em causa. Defina esse intervalo.

Resoluo

X segue N(; 112)


n=10 x =4537 =10,58 =95%
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo
1,96 x10,58 1,96 x10,58
X c ;X +c = 4537 ;4537 = [4530,5;4543,5]
n n 10 10
Estima-se, com 95% de confiana, que o tenso mdia de ruptura dos cabos
se situa entre 4530,5 kg/cm2 e 4543,5 kg/cm2.

Exerccio 11
Uma amostra de 50 capacetes de proteco, usados por trabalhadores de uma
empresa de construo civil, foram seleccionados aleatoriamente e sujeitos a
um teste de impacto, e em 18 foram observados alguns danos.
Construa um intervalo de confiana, a 95%, para a verdadeira proporo p de
capacetes que sofre danos com este teste. Interprete o resultado obtido.

Resoluo
a) n=50
18
p = = 0,36
50
c: P (c Z c) = 95% D (c) = 95% c = 1,96
e logo

Estatstica Aplicada 87
Manual de Exerccios

p (1 p ) p (1 p ) 0,36 x0,64 0,36 x0,64


p c ; p + c = 0,36 1,96 ;0,36 1,96 =
n n 50 50
= [0,22695;0,49305]
Estima-se, com 95% de confiana, que a proporo de capacetes que sofre
danos se situa entre 22,7% e 49,3%.

Exerccio 12
Qual deve ser o nmero de habitantes da cidade do Porto a seleccionar
aleatoriamente para estudar a proporo de portuenses que usam culos, de
modo a garantir que um intervalo de confiana a 95% para essa proporo
tenha uma amplitude no superior a 8 pontos percentuais?

Resoluo
n=?
p (1 p ) p (1 p ) p (1 p )
Amp.= ( p + c ) ( p c ) = 2c < 0,08
n n n
c: P (c Z c) = 95% D (c) = 95% c = 1,96
Considerando que a proporo amostral a que maximiza a amplitude (pior
dos casos), isto , que a proporo amostral 50% ( p (1 p )' = 1 2 p = 0 ), vem
que:
p (1 p ) 0,5 * 0,5
2c = 2 * 1,96 * < 0,08 n > 600
n n

Estatstica Aplicada 88
Manual de Exerccios

3.5. Testes de hipteses

Todos os dias temos de tomar decises respeitantes a determinadas


populaes, com base em amostras das mesmas (decises estatsticas). Nesta
tomada de decises, til formular hipteses sobre as populaes, hipteses
essas que podem ou no ser verdadeiras. A essas hipteses chamamos
hipteses estatsticas, as quais geralmente se baseiam em afirmaes sobre
as distribuies de probabilidade das populaes ou sobre alguns dos seus
parmetros. Uma hiptese pode ento ser definida como uma conjectura
acerca de uma ou mais populaes.
Desta forma, os testes de hipteses podem considerar-se uma segunda
vertente da inferncia estatstica, tendo por objectivo verificar, a partir de dados
observados numa amostra, a validade de certas hipteses relativas
populao. O resultado do teste corresponde inevitavelmente a uma das duas
respostas possveis para cada questo: afirmativa ou negativa. Em ambos os
casos corre-se o risco de errar. Uma das caractersticas do teste de hipteses
, justamente, a de permitir controlar ou minimizar tal risco.
Nos testes de hipteses, e ao contrrio dos intervalos de confiana, em vez de
procurar uma estimativa ou um intervalo para um parmetro, admite-se ou
avana-se um valor hipottico para o mesmo, utilizando depois a informao da
amostra para confirmar ou rejeitar esse mesmo valor. A hiptese a testar
denomina-se, pois, de H0 ou de hiptese nula. O objectivo verificar se os
factos observados a contradizem, levando a optar pela hiptese alternativa H1.
Isto , a estratgia bsica seguida no mtodo de teste de hipteses consiste
em tentar suportar a validade H1 de uma vez provada a inverosimilhana de H0.

Exemplo:
Registos efectuados durante vrios anos permitiram estabelecer que o nvel de
chuvas numa determinada regio, em milmetros por ano, segue uma lei
normal N(600;100). Certos cientistas afirmavam poder fazer aumentar o nvel
mdio das chuvas em 50 mm. O seu processo foi posto prova e anotaram-
se os valores referentes a 9 anos:
510 614 780 512 501 534 603 788 650
Que se pode concluir? Adopte um nvel de significncia de 5%.

Estatstica Aplicada 89
Manual de Exerccios

Resoluo:
Duas hipteses se colocavam: ou o processo proposto pelos cientistas no
produzia qualquer efeito, ou este aumentava de facto o nvel mdio das chuvas
em 50 mm. Estas hipteses podem formalizar-se do modo seguinte:
H0: =600 mm
H1: =650 mm

Este um problema clssico de teste de hipteses, em que est em causa


aceitar ou rejeitar a hiptese nula, em funo dos resultados de uma amostra.
Ao utilizar uma amostra de uma populao, estamos a lidar com leis de
probabilidades, logo no possvel de saber se a hiptese nula verdadeira
ou falsa, mas apenas medir as probabilidades envolvidas na tomada de
deciso.

Podem-se definir 2 formas de especificar Ho e H1:


(i) hiptese simples contra hiptese simples
Ho: = 0
H1: = 1
(ii) hiptese simples contra hiptese composta
Ho: = 0
H1: > 0 ou < 0 ou 0
Estes testes designam-se respectivamente de teste unilateral
direita, teste unilateral esquerda e teste bilateral

Sendo os testes de hipteses, portanto, um processo de inferncia estatstica


onde se procuram tomar decises sobre a populao com base numa amostra,
natural que envolvam alguma margem de erro e que ocorram em situao de
incerteza. Estes erros no podem ser completamente evitados mas, no
entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao
investigador decidir qual a dose de risco de se enganar em que est disposto a
incorrer. Vamos supor uma probabilidade de erro de, por exemplo, 5%. Nesse
caso, e avanada a hiptese nula Ho, o investigador s estaria disposto a
rejeit-la se o resultado obtido na amostra fizesse parte de um conjunto de
resultados improvveis que teriam apenas, por exemplo, 5 chances em 100 de

Estatstica Aplicada 90
Manual de Exerccios

se produzir. Este tipo de formulao conhecida como postura conservadora.


Ou seja, estamos mais propensos a achar que o novo processo no tem
qualquer efeito sobre o nvel das chuvas (isto , que tudo se mantm igual) do
que investir no novo processo (mudar), arriscando apenas quando houver
evidncias da amostra muito fortes a favor do novo. Para que esta deciso
possa ser tomada de uma forma controlada, conveniente pois que, partida,
se fixe o valor a partir do qual se considera improvvel a validade da hiptese
nula. Tal fixao corresponde fixao da regra de deciso do teste.

A formalizao desta regra passa pela especificao de uma regio de regio


de rejeio. A essa regio, isto , ao conjunto de valores improvveis que
conduzem rejeio da hiptese nula d-se o nome de Regio Crtica. Ao
limite superior de risco, que na maior parte dos casos de 10%, 5% ou 1%, d-
se o nome de Nvel de Significncia do teste, sendo este que permite definir a
condio de rejeio de Ho. O Nvel de Significncia designa-se de e
corresponde, ento, probabilidade de o resultado amostral levar rejeio de
Ho, supondo Ho verdadeira, isto , probabilidade de se estar a cometer aquilo
a que se convenciona chamar de erro de 1 espcie.
Como veremos no exemplo, existem tambm erros de 2 espcie, cuja
probabilidade se designa pela letra . Em resumo:

Quadro de deciso em condio de incerteza

Hiptese nula Ho

Deciso Hiptese Ho ser verdadeira: Hiptese Ho ser falsa

Aceitar Ho Deciso correcta (1-) Erro de tipo II


Beta ()
Rejeitar Ho Erro de tipo I Deciso correcta (1-)
Alfa ()

Como decidir? Visto que se trata de testar o valor de , a varivel de deciso


ser X . Considerando Ho verdadeira vem que
100
X N (600; ).
9

Estatstica Aplicada 91
Manual de Exerccios

Em princpio, grandes valores de X so improvveis, pelo que se opta pela


seguinte regra de deciso:
Se X fr demasiado grande, isto , superior a um valor crtico c que tem
apenas 5 chances em 100 de ser ultrapassado, opta-se por H1 com
probabilidade 5% de se estar a cometer um erro. Se tal no acontecer,
conserva-se Ho, por falta de provas suficientes para no o fazer.

Logo, sendo
P(Rejeitar Ho / Ho) = = 5%, vem que

X c 600
P ( X > c / = 600) = 0,05 P ( > ) = 0,05
100
n 9
100
c = 600 + 1,645 x = 654,83(3)
3

A regra de deciso , ento, a seguinte:


- rejeitar H0 em favor de H1, se o valor amostral fr superior a 654,83(3)
- conservar H0 em detrimento de H1 se fr inferior a 654,83(3)

Isto , a Regio Crtica deste teste, isto , o conjunto de acontecimentos que


levam rejeio de H0 corresponde a todos os valores de X >654,83(3).

RA: Regio RR: Regio


de Aceitao Crtica ou de
Rejeio

RA=(1-)
RR=

= 600 654,83(3) X

Os dados recolhidos indicavam X =610,2 mm, pelo que a deciso conservar


H0 , isto , considerar que o processo cientfico no produz efeitos.

Estatstica Aplicada 92
Manual de Exerccios

No entanto, os erros incorridos no se ficam apenas pelos de 1 espcie.


Existem tambm erros de 2 espcie. Isto , partida parte-se do princpio
que H0 verdadeira e s se rejeitar essa hiptese se ocorrerem
acontecimentos pouco provveis.
No entanto, possvel alternativamente partir do princpio que H1 que
verdadeira, ou seja, considerar que o processo cientfico realmente eficaz no
aumento do nvel mdio das chuvas, mas que, infelizmente, o nmero de
valores observado no permite observar resultados ou esses resultados foram
insuficientes.
Supondo ento que H1 verdadeira (=650 mm), ento vem que:
100
X N (650; )
9


1-
RA RR

= 650 X

A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2


espcie, vem ento igual a:
P(Rejeitar H1 / H1)=
X 654,83(3) 650
P ( X 654,83(3) / = 650) = P ( ) = P ( N (0,1) 0,14) = 55,57%
100
n 9

atravs das probabilidades e que se procura o melhor teste de hipteses,


sendo o teste ideal o que minimiza simultaneamente ambos os valores. No
entanto, e como e se referem a realidades opostas e variam em sentido
contrrio, tal no possvel. O que na maior parte dos casos se faz fixar o
(para amostras de dimenso n) e tentar minimizar .

Estatstica Aplicada 93
Manual de Exerccios

Regio de rejeio e de aceitao da hiptese nula

Unilateral Bilateral Unilateral


esquerda direita
H1: < 600 H1: 600 H1: > 600

RA RA
RA
RR RR
RR RR
/2 /2

1 1 1

Chama-se potncia de um teste probabilidade de rejeitar H0 quando esta


falsa. Esta uma deciso certa, no implica erro, e complementar do erro de
2 espcie. Logo, quanto menor o erro de 2 espcie, maior ser o valor da
potncia do teste e, logo, maior a sua qualidade (diz-se que o teste mais
potente) . Quando H1 uma hiptese composta (>, < ou ), a potncia do teste
varivel, dependendo do valor do parmetro que no fixo. Nesse caso fala-
se em funo potncia do teste = 1 - (1)

Resumindo: passos para construo de um teste de hipteses:

Passo No 1: Formular as hipteses nula e alternativa


Passo No 2: Decidir qual estatstica (estimador) ser usada para julgar a Ho e a
varivel de deciso
Passo No 3: Definir a forma da Regio Crtica, em funo da hiptese H1
Passo N 4: Fixar o nvel de significncia
Passo N 5: Construir a Regio Crtica em funo do nvel de significncia
Passo N 6: Clculo (eventual) da potncia do teste
Passo N 7: Calcular a estatstica da amostra
Passo No 8: Tomar a deciso: rejeio ou no de Ho

Estatstica Aplicada 94
Manual de Exerccios

TESTES DE HIPTESES
Exerccios

Exerccio 1
Suponha que o director de qualidade pretende averiguar se o peso dos pacotes
de arroz produzidos corresponde ao valor assinalado na embalagem. Seja X a
varivel que representa o peso de um pacote de arroz. Suponha que
X N ( ;0,012 ) e que se conhece a seguinte amostra:
1,02 0,98 0,97 1,01 0,97 1,02 0,99 0,98 1,00

Ser que, para um nvel de significncia de 5% se pode dizer que o peso mdio
corresponde ao peso de 1 kg assinalado na embalagem?

Resoluo
Passo 1
Formular as hipteses:
Ho: = 1
H1: < 1

Passo 2
A estatstica a ser utilizada ser a mdia amostral
Passo 3
A regio crtica formada por todos os valores menores ou iguais a c
Passo 4
Assumir um nvel de significncia de 5%
Passo 5
Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo
P(Rejeitar Ho / Ho) = = 5%, vem que

X c 1
P ( X < c / = 1) = 0,05 P ( < ) = 0,05
0,01
n 9
0,01
c = 1 1,645 x = 0,9945
3
Logo, RC = ] ;0,9945]

Estatstica Aplicada 95
Manual de Exerccios

Passo 6
1
Calcular a estatstica X = xi = 0,9933
9

Passo 7
Tomar a deciso
Como o valor da amostra foi 0,9933 e menor que o valor crtico 0,9945,
rejeita-se Ho
Ou seja, considera-se que o arroz contido em cada pacote era inferior ao
indicado. No entanto, h o risco de se mandar parar a produo para reviso
do equipamento sem necessidade. Reduzindo a probabilidade de isso ocorrer
de 5% para 1%, vem:

=1% =5%

RA: Continuar a
produo
RR: Parar a
produo

- 0 +
0,9922 0.9945

Valor da amostra: 0,9933

A nica mudana ser no Valor Crtico, que de 0,9945 para 0,9922. Neste
caso, aceitaremos Ho, ou seja, consideraremos que no h qualquer anomalia
na produo.

Exerccio 2
Numa cidade, pretende-se saber se metade da populao favorvel
construo de um centro comercial. Faz-se um inqurito a 200 pessoas, e 45%
declaram-se favorveis. Estes valores contradizem a hiptese?

Resoluo
Passo 1
Formular as hipteses:
Ho: p = 0,5
H1: p < 0,5

Estatstica Aplicada 96
Manual de Exerccios

Passo 2
A estatstica a ser utilizada ser a proporo amostral, onde o cuidado deve ser
trabalhar com grandes amostras.
Passo 3
A regio crtica formada por todos os valores menores ou iguais a c
Passo 4
Assumir um nvel de significncia de 5%
Passo 5
Para =5%, determinar a regio de rejeio e aceitao.
Logo, sendo
P(Rejeitar Ho / Ho) = = 5%, vem que
p p c 0,5
P ( p < c / p = 0,5) = 0,05 P ( < ) = 0,05
p (1 p ) 0,5(1 0,5)
n 200
0,5(1 0,5)
c = 0,5 1,645 x = 0,442 Logo, RC = ] ;0,442]
200

Passo 6
p =0,45
Passo 7
Como o valor amostral 0,45 maior que o valor crtico 0,442, no se rejeita Ho

RR: No
construir o
centro comercial
=5%

RA: Decidir pela


RR: Parar a construo
construo

- 0 +
Valor amostral: 0,45
0,442

Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor


da construo do centro comercial, essa margem no suficiente para decidir
deixar de o construir.

Estatstica Aplicada 97
Manual de Exerccios

Exerccio 3
O peso dos pacotes de farinha de 1 kg, produzidos por uma fbrica, uma
varivel normalmente distribuda, com desvio padro 0,01. Da produo de
determinado dia retirada uma amostra de 49 pacotes, com peso mdio de
0,998 Kg.
Pode-se afirmar, a um nvel de significncia de 1%, que o peso mdio dos
pacotes de farinha nesse dia no est de acordo com o peso indicado?

Resoluo

X segue N(; 0,012)


n = 49
x = 0,998
= 1%
H0: = 1
H1: < 1
P(Rejeitar Ho/Ho verdadeira) = = 1%
X c 1 c 1
P ( X c / = 1) = 0,01 P ( ) = 0,01 = 2,326 c = 0,997
0,01 0,01
n 49 49

Como x = 0,998 > c = 0,997, no pertence regio crtica, logo no se rejeita


Ho a um nvel de significncia de 1% (no se pode afirmar que o peso mdio
no esteja de acordo com o indicado).

Exerccio 4
Numa regio onde existem entre os maiores de 18 anos 50% de fumadores,
lanada uma intensa campanha anti-tabaco.
Ao fim de trs meses, realiza-se um mini-inqurito junto de 100 cidados com
mais de 18 anos, registando-se 45 fumadores.
a) Com 1% de significncia, pode concluir-se que a campanha surtiu
efeito?
b) Em caso negativo, qual seria a dimenso da amostra a partir da qual
aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em
vista?

Estatstica Aplicada 98
Manual de Exerccios

Resoluo
a) n = 100
p = 0,45

= 1%
H0: p = 0,5 (a campanha no surtiu efeito)
H1: p < 0,5 (a campanha surtiu efeito)
P(Rejeitar Ho/Ho verdadeira) = = 1%
p p c 0,5 c 0,5
P ( X c / p = 0,5) = 0,01 P ( ) = 0,01 = 2,326 c = 0,384
p (1 p ) 0,5 * 0,5 0,5 * 0,5
n 100 100

Como p = 0,45 > c = 0,384, no pertence regio crtica, logo no se rejeita


Ho a um nvel de significncia de 1% (a campanha no surtiu efeito).

p p 0,45 0,5
b) P( X 0,45 / p = 0,5) = 0,01 P( ) = 0,01
p(1 p) 0,5 * 0,5
n n
0,45 0,5
= 2,326 n = 541
0,5 * 0,5
n

Exerccio 5
Um fabricante afirma que o tempo mdio de vida de um certo tipo de bateria
de 240 horas, com desvio-padro de 20 horas. Uma amostra de 18 baterias
forneceu os seguintes valores:
237 242 232
242 248 230
244 243 254
262 234 220
225 236 232
218 228 240

Supondo que o tempo de vida das baterias se distribui normalmente, poder-se-


concluir, a 5% de significncia, que as especificaes no esto a ser cumpridas?

Estatstica Aplicada 99
Manual de Exerccios

Resoluo

X segue N(; 202)


n = 18
1
x = xi = 237,05
18
= 5%
H0: = 240
H1: < 240
P(Rejeitar Ho/Ho verdadeira) = = 1%
X c 240 c 240
P ( X c / = 240) = 0,05 P ( ) = 0,05 = 1,645 c = 232,25
20 20
n 18 18

Como x = 237,05 > c = 232,25, no pertence regio crtica, logo no se


rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que as
especificaes no esto a ser cumpridas).

Exerccio 6
Uma empresa de cermica tem, em dada seco, fornos controlados por
termstatos para manter a temperatura no interior dos fornos a 600 graus
centgrados. A experincia tem demonstrado que a varincia dos valores da
temperatura no interior desses fornos de 360.
A empresa fornecedora dos fornos comercializa agora um novo tipo de
controlador, que anunciado como garantindo que as temperaturas se mantm
dentro do limite desejado. Foram registadas 5 medidas de temperatura de
fornos regulados para 600, utilizando novos controladores:
620 595 585 602 608
Para 5% de significncia, poder-se- concluir que a temperatura no se afasta
significativamente do valor desejado?

Resoluo

X segue N(;360)
n=5

Estatstica Aplicada 100


Manual de Exerccios

1
x = xi = 602
5
= 5%
H0: = 600
H1: > 600
P(Rejeitar Ho/Ho verdadeira) = = 5%
X c 600 c 600
P( X c / = 600) = 0,05 P( ) = 0,95 = 1,645 c = 613,96
360 18,97
n 5 5

Como x = 602 < c = 613,96, no pertence regio crtica, logo no se rejeita


Ho a um nvel de significncia de 1% (a temperatura no se afasta
significativamente do valor desejado).

Exerccio 7
O peso dos ovos de chocolate produzidos numa fbrica segue distribuio
normal com varincia 90,25.
a) O fabricante diz que o peso mdio de 160 g. Foi recolhida uma
amostra de 100 ovos, cujo peso mdio foi de 158, 437 g. Teste, a um
nvel de significncia de 1%, se a afirmao do fabricante pode ser
considerada verdadeira, ou se, pelo contrrio, o verdadeiro peso dos
ovos ser menor.
b) Qual o nvel de significncia a partir do qual a concluso seria diferente?

Resoluo

a) X segue N(; 90,25)


n = 100
x = 158,437
= 1%
H0: = 160
H1: < 160
P(Rejeitar Ho/Ho verdadeira) = = 1%

Estatstica Aplicada 101


Manual de Exerccios

X c 160 c 1
P ( X c / = 160) = 0,01 P ( ) = 0,01 = 2,326 c = 157,79
90,25 9,5
n 100 100

Como x = 158,437 > c = 157,79, no pertence regio crtica, logo no se


rejeita Ho a um nvel de significncia de 1% (a afirmao do fabricante pode
ser considerada verdadeira).

b)
X 158,437 160
P ( X 158,437 / = 160) = P ( ) = F (1,645) = = 5%
90,25
n 100

Exerccio 8
Um jornal semanrio afirma ter atingido, numa regio, a percentagem, at
ento nunca atingida por qualquer semanrio, de 60% de leitores que
regularmente compram um jornal desse tipo.
Efectuando um inqurito junto de 600 leitores, 55% declararam adquirir, por
hbito, o semanrio em causa.
Adoptando um nvel de significncia de 1%, pronuncie-se quanto projeco
que o semanrio reclama.

Resoluo

n = 600 p = 0,55 = 1%
H0: p = 0,6
H1: p < 0,6
P(Rejeitar Ho/Ho verdadeira) = = 1%
p p c 0,6 c 0,6
P ( X c / p = 0,6) = 0,01 P ( ) = 0,01 = 2,326 c = 0,5535
p (1 p ) 0,6 * 0,4 0,6 * 0,4
n 600 600

Como p = 0,55 < c = 0,5535, pertence regio crtica, logo rejeita-se Ho a um


nvel de significncia de 1% (o semanrio no atingiu a projeco que
reclama).

Estatstica Aplicada 102


Manual de Exerccios

Exerccio 9
Um molde de injeco tem produzido peas de um determinado material
isolante trmico com uma resistncia compresso com valor esperado de
5,18 kg/cm2 e varincia 0,0625 (kg/cm2)2. As ltimas 12 peas produzidas
nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistncia
mdia compresso o valor de 4,95 kg/cm2.
a) Poder-se- afirmar, a um nvel de significncia de 5%, que as peas
produzidas recentemente so menos resistentes do que o habitual?
b) Qual a potncia do teste efectuado anteriormente, admitindo que o valor
esperado da resistncia compresso das peas produzidas
2
recentemente de 4,90 kg/cm ?

Resoluo

a) X segue N(; 0,0625)


n = 12
x = 4,95
= 5%
H0: = 5,18
H1: < 5,18
P(Rejeitar Ho/Ho verdadeira) = = 5%
X c 5,18 c 5,18
P ( X c / = 5,18) = 0,05 P ( ) = 0,05 = 1,645 c = 5,061
0,0625 0,25
n 12 12

Como x = 5,18 > c = 5,061, no pertence regio crtica, logo no se rejeita


Ho a um nvel de significncia de 1% (as peas produzidas recentemente no
so menos resistentes do que o habitual).

b) Potncia = 1-
= (Conservar Ho/H1 verdadeira)
X 5,061 4,9
P ( X > 5,061 / = 4,9) = P ( > ) = 1 F (0,01) = 1 0,5040 = 49,6%
0,0625
n 12

Estatstica Aplicada 103


Manual de Exerccios

Exerccio 10
Um jornal desportivo noticiou que o nmero de espectadores de um programa
desportivo que apresentado na televiso aos domingos noite est
igualmente dividido entre homens e mulheres.
De uma amostra aleatria de 400 pessoas que vem regularmente o referido
programa, concluiu-se que 240 so homens.
Pode-se concluir, para um nvel de significncia de 10%, que a notcia falsa?

Resoluo

n = 400 p = 0,6 = 10%


H0: p = 0,5
H1: p > 0,5
P(Rejeitar Ho/Ho verdadeira) = = 10%
p p c 0,5 c 0,5
P ( X c / p = 0,5) = 0,1 P ( ) = 0,9 = 1,282 c = 0,53205
p (1 p ) 0,5 * 0,5 0,5 * 0,5
n 400 400

Como p = 0,6 > c = 0,53205, pertence regio crtica, logo rejeita-se Ho a um


nvel de significncia de 1% (a notcia falsa).

Estatstica Aplicada 104


Manual de Exerccios

3.6. Aplicaes estatsticas


Fiabilidade de componentes e sistemas

3.6.1 Conceito de fiabilidade

Define-se fiabilidade como sendo a probabilidade de um sistema (ou


componente) desempenhar a funo para a qual foi concebido, nas condies
previstas e nos intervalos de tempo em que tal exigido.
A anlise da fiabilidade ser, ento, um mtodo de quantificar o que se espera
que acontea e pode ser usada para indicar mritos relativos de sistemas,
tendo em ateno um pr-definido nvel de fiabilidade.
A fiabilidade de um componente pode ser obtida a partir da sua taxa de
avarias. Se um sistema fr constitudo por vrios componentes, ento a
fiabilidade ser dependente da fiabilidade dos componentes que compem
esse mesmo sistema.
necessrio, quando se apresentam os resultados de um estudo de fiabilidade
saber exp-los, pois os interpretadores podero no ter a noo daquilo que se
est a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou
componente de 0,998 pode no significar muito; no entanto, se tal facto fr
traduzido em que, por ano, o sistema em questo estar fora de servio por
avaria num perodo de 9 horas j significa alguma coisa.

Como o estudo da fiabilidade se trata de um estudo extremamente importante,


pois que muitas vezes esto em jogo vidas humanas, importante desenvolver
um estudo de probabilidade relativo ao funcionamento adequado de um
componente ou sistema.

3.6.2 Fiabilidade de um sistema

Ao analisar a fiabilidade de um sistema constitudo por vrios componentes,


necessrio estudar a fiabilidade desses componentes e a forma como esto
ligados (estrutura do sistema e definio do funcionamento do sistema). De
seguida, so apresentados 3 casos: (i) as associaes de componentes em

Estatstica Aplicada 105


Manual de Exerccios

paralelo; (ii) a associao de n unidades idnticas em paralelo em que


apenas necessrio o funcionamento de m (m<=n) para o sistema funcionar; (iii)
e as associaes em srie.

(i) Associao em paralelo


Consideremos vrios componentes redundantes e independentes:

Uma vez que os componentes so redundantes, basta apenas um para que o


sistema funcione. Considerando um sistema composto por apenas 2
componentes, se cada um dos componentes estiver no seu perodo de vida til,
a fiabilidade do sistema (Rs) dada por:

Rs = P (funcionar pelo menos um componente)


= P (funcionarem 1 ou 2 componentes)
= 1 P (no funcionar nenhum)
= 1 P (no funcionar comp.1 e no funcionar comp.2)
= 1 - P (no funcionar comp.1) x P(no funcionar comp.2)
pois o funcionamento independente
= 1 q1 x q2

onde q1 e q2 so, respectivamente as indisponibilidades (isto , as


probabilidades de no funcionamento) das componentes 1 e 2. Se houver n
componentes ligadas em paralelo, a fiabilidade do sistema dada por
Rs = 1 - q1 x q2 x q3 x x qn = 1 - q
i
i

Estatstica Aplicada 106


Manual de Exerccios

Veja-se que, no caso de sistemas redundantes, a fiabilidade do sistema


aumenta medida que aumenta o nmero de componentes ligadas ao sistema
(que representam como garantias de funcionamento adicionais).

(ii) Associao em paralelo de componentes no redundantes


Se o sistema no fr redundante, as condies de funcionamento e de avaria
para o sistema tm de ser definidos, isto , necessrio saber qual o nmero
mnimo de componentes que necessitam de estar em funcionamento para que
o sistema sobreviva.
Para o efeito, vai considerar-se de novo um sistema composto por quatro
componentes em paralelo. Se as componentes forem todas iguais, com
probabilidade de funcionamento p e de indisponibilidade q, a probabilidade
associada a cada um dos estados possveis (1, 2, 3 ou 4 componentes, no
mnimo, a funcionar), a fiabilidade do sistema dada pelo quadro seguinte:

N mnimo de componentes
necessrias ao funcionamento do Probabilidade de o sistema funcionar
sistema
4 p4
3 p4 + 4p3q
2 p + 4p3q + 6p2q2
4

1 p4 + 4p3q + 6p2q2 + 4pq3

Ou seja, a fiabilidade do sistema funcionar pode ser calculada recorrendo lei


binomial. Assim, por exemplo, para um n mnimo de 3 componentes
necessrias, vem:
Rs = P(pelo menos 3 componentes a funcionar)

= P(funcionarem as 4) + P (funcionarem 3)

= C 44 p 4 q 4 4 + C 34 p 3 q 43

= p 4 + 4 p3q

Por exemplo, se todos os componentes tivessem fiabilidade 0,9 (p=0.9), ento


a fiabilidade de um sistema deste tipo seria 94,77%.

Estatstica Aplicada 107


Manual de Exerccios

(iii) Associao em srie


Quando os componentes se encontram associados em srie, para que o
sistema funcione torna-se necessrio que todos os componentes se encontrem
em bom estado de funcionamento.

1 2 3

No caso mais vulgar de os componentes serem independentes, a fiabilidade do


sistema dada por
Rs = p1 x p2 x p3 x ... x pn

No caso de todas as componentes serem iguais

Rs = pn

Facilmente se depreende que a fiabilidade do sistema diminui medida que


aumenta o nmero de componentes ligadas em srie.
A distribuio exponencial a mais usada em estudos de fiabilidade, j que a
probabilidade de um componente sobreviver at ao instante t dada por

e t
A probabilidade de avariar at ao instante t dada por

1 e t

Num sistema com vrias componentes em srie, em que o componente se


encontra a funcionar no seu perodo de vida til, a fiabilidade do sistema
dada por
n
i t
Rs = e i =1

(iv) Outros sistemas


Quando a estrutura do sistema no puder ser enquadrada em nenhuma das
anteriores, tero que ser analisadas tcnicas mais gerais, tais como a rvore
de avarias. O mtodo consiste basicamente em identificar todos os modos
possveis de avaria e control-los. Assim, supondo que se pretende analisar a
fiabilidade da iluminao de uma sala com uma lmpada.

Estatstica Aplicada 108


Manual de Exerccios

Se o objectivo fr calcular a probabilidade de falta de energia (acontecimento


secundrio) vem
P (avaria) = P (A B) = P (A) + P(B) + P(A)xP(B)

Para o acontecimento prioritrio (sala s escuras) vem:


P(sala s escuras) = P(falta de energia lmpada estragada)
Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de
proteco e esquemas de comando (fiabilidade de msseis e reactores
nucleares, por exemplo).

Sala s
escuras

Falta de Lmpada
energia estragada

Avaria na Actuao da
rede proteco

Estatstica Aplicada 109


Manual de Exerccios

3.7. Aplicaes estatsticas


Controlo Estatstico de Qualidade

do conhecimento geral que nenhum processo de produo executa dois


produtos iguais. Os processos industriais so caracterizados por produzirem
peas cujas caractersticas variam dentro de certos valores tolerveis. As
variaes so inevitveis, podendo ser grandes, pequenas, muito ou pouco
dispersas. O conhecimento do tipo, da extenso e da evoluo dessas
variaes extremamente importante para podermos garantir que nos
possvel produzir produtos que vo cumprir as especificaes, para eles
definidas, a um nvel aceitvel.

Os testes descritos anteriormente referiam-se em situaes em que o estudo


no era cronolgico. simples imaginar situaes onde, pelo contrrio, o
processo a analisar deva ser monitorado ao longo do tempo. Situaes deste
tipo ocorrem em linhas de fabrico de produtos, estudos de conservao de
materiais e mquinas, qualidade de servios. Duma forma geral, entende-se
por controle de qualidade a monitorizao de um processo, cujos resultados de
natureza quantitativa se devem encontrar dentro de determinados limites. Um
processo est sob controle se os resultados esto em conformidade com os
limites impostos; caso contrrio, o processo deve ser investigado para que
sejam detectadas as causas do desvio. A "qualidade" pode referir-se a um
valor fixo, que constitui o objectivo desejado (por exemplo, a conformidade da
mdia relativamente a "limites normais"). A avaliao do processo implica, que
em certos intervalos de tempo se proceda a uma amostragem.
O controlo estatstico de qualidade permite uma interveno nos processos, no
sentido de se ajustarem e corrigirem os processos, antes de qualquer alterao
no natural passar a fazer efeito de forma contnua. As cartas de controlo so
um instrumento poderoso que permite identificar as causas de variao no
natural nos processos.

Ao definir uma carta de controle para a mdia, necessrio comear por definir
a norma para (0) e 2 nveis de controle: os de vigilncia garantida (limites

Estatstica Aplicada 110


Manual de Exerccios

inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e


superior de controle: LIC e LSC). Se a mdia amostral cair fora da rea de
tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve
haver paragem da produo.
Supe-se que a varivel em estudo segue Distribuio Normal, sendo os LIC e
LSC calculados da seguinte forma:

c
LIC / LSC = 0 +/-
n
(metodologia baseada na estimao por intervalos estudada atrs)

Ao definir uma carta de controle para a proporo, por exemplo, de


defeituosos, necessrio comear por definir a norma para p (p0) e 2 nveis de
controle: os de vigilncia garantida (limites inferior e superior de vigilncia: LIV
e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se
a proporo amostral cair fora da rea de tolerncia definida pelos LIC e LSC,
por que h alguma anomalia e deve haver paragem da produo.
Os LIC e LSC calculados da seguinte forma:

Estatstica Aplicada 111


Manual de Exerccios

p (1 p )
LIC / LSC = p0 +/-
n
(metodologia baseada na estimao por intervalos estudada atrs)
As cartas de controlo so instrumentos fceis e simples de aplicar pelos
executantes, no sentido de se obter o controlo contnuo do processo. Podem
ser traadas nos prprios locais de trabalho, dando informaes preciosas
sobre os momentos em que so necessrias aces correctivas.
Desde que o processo esteja sob controlo estatstico, as cartas de controlo
permitem prever de forma adequada o comportamento do processo, e melhorar
os processos, com base na informao disponvel nas cartas, no sentido de
reduzir a sua variabilidade.

As cartas so elaboradas a partir de medies efectuadas de uma


caracterstica do processo (a mdia, por exemplo). Os dados so obtidos de
amostras de tamanho constante, geralmente 3 ou 5 unidades, recolhidas
consecutivamente em intervalos de tempo constantes. Deve ser elaborado um
plano de recolha de dados, que dever ser usado como base para a colheita,
registo e marcao dos dados no grfico. As amostras a utilizar devem ser de
tamanho racional, isto , devem ser eficazes para o controlo sem acarretar
esforo demasiado e desnecessrio na colheita.

A interpretao dos limites de controlo a seguinte: se a variabilidade pea a


pea do processo permanecesse constante e nos nveis encontrados, seria
legtimo concluir que na base de um ponto fora dos limites de controlo estariam
causas que importa conhecer e sanear. Um ponto fora do controlo deve
merecer uma anlise imediata quanto causa.

Pode ser mantido um registo das mdias amostrais por meio de uma carta
como a representada na figura abaixo, denominada carta de controle de
qualidade.
Cada vez que for calculada uma mdia amostral, ela ser representada por um
ponto particular. Enquanto eles carem entre o limite inferior e o superior, o
processo est sob controle. Quando um ponto estiver fora desses limites de

Estatstica Aplicada 112


Manual de Exerccios

controle (como ocorreu com a terceira amostra tomada na quinta-feira), h a


possibilidade de haver alguma anomalia, o que justifica uma investigao.
Os limites de controlo especificados so denominados de limites de confiana.
A escolha, em cada caso, depende das circunstncias particulares de cada
processo.

Mdia
Amostral Segunda-feira Tera-feira Quarta-feira Quinta-feira Sexta-feira
(cm)
LSuperior





50





LInferior

Estatstica Aplicada 113


Manual de Exerccios

3.8. Aplicaes estatsticas


Tratamento estatstico de inquritos

3.8.1 Teste de independncia do qui-quadrado

O teste do muito eficiente para avaliar a associao existente entre


variveis qualitativas. Trata-se de um teste de hipteses semelhante aos
anteriormente estudados, mas que se inclui na categoria dos testes no-
paramtricos, isto , aqueles que no incidem explicitamente sobre um
parmetro de uma ou mais populaes (por exemplo, o valor esperado ou a
proporo, como os estudados anteriormente). No entanto, a lgica de
formulao das hipteses e de definio de uma regra de deciso
equivalente aos testes paramtricos. O princpio bsico deste mtodo no-
paramtrico comparar as divergncias entre as frequncias observadas e as
esperadas.

Este teste encontra aplicabilidade no tratamento estatstico de inquritos. De


facto, para alm do tratamento frequencista dos inquritos, por vezes
interessante aferir da existncia de relaes estatsticas relevantes entre as
diversas questes (por exemplo, testar se h alguma coerncia entre quem
respondeu opo 1 da pergunta X e opo 2 da pergunta Y). O estudo
destas relaes encontra aplicabilidade no campo das anlises de mercado,
em que o objectivo proceder sua segmentao. A existncia de
associaes entre as questes permite determinada um vector comum entre
grupos de inquiridos que responderam de forma semelhante a certo tipo de
questes (concluir algo como que os habitantes de uma dada rea foram
sempre os que assinalaram determinado tipo de respostas e constituem, por
isso, um segmento geogrfico autnomo e com caractersticas prprias de
entre o total dos inquiridos).

De uma maneira geral, pode dizer-se que dois grupos se comportam de modo
semelhante se as diferenas entre as frequncias observadas e as esperadas
em cada categoria forem muito pequenas ou prximas de zero.

Estatstica Aplicada 114


Manual de Exerccios

Exemplo:
Um pesquisador deseja verificar se h associao entre trs cursos de uma
universidade e dependncia de drogas. Entrevistou 120 alunos, sendo 25 de
Medicina, 35 de Farmcia e 60 de Biologia, perguntando sobre o uso de
drogas, admitindo somente duas respostas: sim ou no. Aps o processamento
dos dados, chegou-se seguinte tabela de distribuio de frequncias:

Medicina Farmcia Biologia Total


Usa drogas 10 20 30 60
No usa drogas 15 15 30 60
Total 25 35 60 120

As tabelas como aquela na qual se apresentam os resultados referentes ao


exemplo so habitualmente designadas de tabelas de contingncia. Admita-
se que os resultados que nela figuram resultam de amostras aleatrias. Tais
resultados representam o nmero de observaes includas nas diferentes
combinaes das classes nas quais as duas variveis em estudo se exprimem.

Mod. 1 Mod. 2 Mod. n Total


Modalidade 1 n11 n12 n1.
Modalidade 2 n21 n22 n2.

Modalidade n nnn ni.
Total n.1 n.2 n.j n

onde
nij: frequncia observada na clula ij
n.j: frequncia marginal observada na modalidade j
ni.: frequncia marginal observada na modalidade i
n: dimenso da amostra

Estatstica Aplicada 115


Manual de Exerccios

O objectivo do teste o de verificar se as duas variveis em questo so ou


no relacionadas. As hipteses nula e alternativa so ento as seguintes:
Ho: As variveis so independentes
H1: As variveis no so independentes

As frequncias observadas so obtidas directamente dos dados da amostra,


enquanto que as frequncias esperadas so calculadas a partir destas, sob o
pressuposto de que Ho verdadeira, isto , admitindo a hiptese de
independncia.
Na prtica, a frequncia esperada calculada pela multiplicao do total da
coluna respectiva pelo total da linha a que pertence, dividindo-se o produto pela
dimenso total da amostra:
n i . * n. j
eij =
n

O calculado da seguinte forma:


(nij eij ) 2
=
i j eij

Note-se que o numerador faz referncia diferena entre frequncia observada


e frequncia esperada, que dever ser calculada para cada clula da tabela.
Quando as frequncias observadas so muito prximas das esperadas, o valor
do numerador pequeno; no entanto, quando as discrepncias so grandes, o

valor do numerador passa a ser grande e, consequentemente, o assume


valores altos. Ou seja, quando h fortes discrepncias entre o que de facto foi
observado e o que seria de esperar sob a hiptese de independncia, a

varivel de deciso assume um valor elevado e h motivos ou significncia


estatstica para rejeitar Ho.

No teste qui-quadrado compara-se o valor calculado com o valor crtico


fornecido em uma tabela, considerando o nvel de significncia adoptado e os
graus de liberdade GL ou d.f. (obtidos por (nmero de linhas-1)*(nmero de
colunas-1)).

Estatstica Aplicada 116


Manual de Exerccios

Tome-se o caso de GL (d.f.) = 4:

Para o nvel de significncia de 5%, obtm-se da

tabela de valores crticos da (ver pgina seguinte):

Rejeita-se a hiptese nula se for maior que o valor crtico fornecido na

tabela.

Resoluo:
Como pode ser observado, entre os 120 alunos includos no estudo h um
nmero igual (60) que afirma usar e no usar drogas. No entanto, a distribuio
entre os vrios cursos no ocorre de forma homognea.

Medicina Farmcia Biologia Total


Usa drogas 10 20 30 60
No usa drogas 15 15 30 60
Total 25 35 60 120

Os dados so do tipo qualitativo, pois cada aluno entrevistado foi classificado


sob uma determinada categoria. Neste caso, pode usar-se o teste do qui-
quadrado com duas hipteses de trabalho:
Ho: No h associao entre tipo de curso e dependncia de drogas
H1: H associao entre tipo de curso e dependncia de droga

Estatstica Aplicada 117


Manual de Exerccios

Se o obtido fr maior ou igual ao crtico, Ho dever ser rejeitada.

Para o clculo do recomendam-se os seguintes passos:

n i . * n. j
1. Calcular as frequncias esperadas eij =
n
Por exemplo, se as duas variveis fossem independentes, seria de esperar que
o nmero de estudantes de Medicina a admitir usar drogas fosse de:
ni. * n. j 25 * 60
eij = = = 12,5
n 120
2. As frequncias esperadas devero ser anotadas nas correspondentes
clulas:
Medicina Farmcia Biologia Total
Usa drogas nij 10 20 30 60
eij 12,5 17,5 30,0
No usa drogas nij 15 15 30 60
eij 12,5 17,5 30,0
Total 25 35 60 120

(nij eij ) 2
3. A seguir aplica-se a frmula = = =1,7
i j eij

4. Determinam-se os graus de liberdade na tabela


Os graus de liberdade da tabela so calculados multiplicando
(nmero de linhas-1)*(nmero de colunas-1)= (2-1)*(3-1)=2 GL

5. Por ltimo, compara-se o valor do observado obtido (1,7) com o valor do

crtico, considerando os graus de liberdade (GL) e o nvel de significncia


adoptado (ver tabela anexa).

Vem que o obsv.=1,7 menor do que o valor obtido a partir da tabela, que
5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho
no pode ser rejeitada, concluindo-se que, no grupo estudado, no h
associao entre as variveis. Em mdia, a proporo de alunos que usam ou
no drogas no varia entre os cursos.

Estatstica Aplicada 118


Manual de Exerccios

Observao:
Caso 20% ou mais das clulas tenham frequncias esperadas menores que 5,
ou haja uma ou mais frequncias esperadas com valores menores ou igual a 1,

no se deve usar o teste do . Uma boa alternativa para estes casos o


agrupamento de linhas e colunas adjacentes, desde que tenha algum sentido
lgico, de modo a diminuir os graus de liberdade associados.

Estatstica Aplicada 119


Manual de Exerccios

 
      ! " ! #$&%'($ )"*+, - ./0120

0.995 0.975 0.9 0.5 0.1 0.05 0.025 0.01 0.005 0.001

1 0.000 0.001 0.016 0.455 2.706 3.841 5.024 6.635 7.879 10.827
2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 13.815
3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 12.838 16.266
4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 13.277 14.860 18.466
5 0.412 0.831 1.610 4.351 9.236 11.070 12.832 15.086 16.750 20.515
6 0.676 1.237 2.204 5.348 10.645 12.592 14.449 16.812 18.548 22.457
7 0.989 1.690 2.833 6.346 12.017 14.067 16.013 18.475 20.278 24.321
8 1.344 2.180 3.490 7.344 13.362 15.507 17.535 20.090 21.955 26.124
9 1.735 2.700 4.168 8.343 14.684 16.919 19.023 21.666 23.589 27.877
10 2.156 3.247 4.865 9.342 15.987 18.307 20.483 23.209 25.188 29.588
11 2.603 3.816 5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264
12 3.074 4.404 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909
13 3.565 5.009 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527
14 4.075 5.629 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124
15 4.601 6.262 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698
16 5.142 6.908 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
17 5.697 7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791
18 6.265 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312
19 6.844 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819
20 7.434 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314
21 8.034 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796
22 8.643 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268
23 9.260 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728
24 9.886 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619
26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051
27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475
28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892
29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301
30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702

Estatstica Aplicada 120


Manual de Exerccios

FIABILIDADE
Exerccios

Exerccio 1
Num centro comercial, est instalado um sistema de 10 mquinas para
utilizao de carto multibanco. Diz-se que o sistema est em funcionamento
se pelo menos uma das mquinas funciona. Suponha que cada mquina
funciona independentemente das outras e a probabilidade de funcionamento de
cada mquina 85%. Calcule a probabilidade do sistema estar em
funcionamento.

Resoluo
P(avaria) = 1-0,85 = 15%
P(sistema estar em funcionamento) = 1 P(sistema avariar)
= 1 P(nenhuma das mquinas funcionar)
= 1 P(maq1 no funcionar e...e maq 10 no funcionar)
= 1 0,15*0,15*...*0,15 = 1 (aproximadamente)

2. Quatro componentes de um sistema encontram-se associados de acordo


com a figura junta. Esto no seu perodo de vida til e as taxas mdias de
avarias so 10-4 avarias/hora (A), 2x10-5 avarias/hora (B e C) e 5x10-5
avarias/hora (D).

B
A D
C

Calcule a probabilidade do sistema estar em funcionamento aps 5 000 horas.

Resoluo
104 *5000
A: Rs = e = e 0,5 = 60,6531%
( 5*105 ) *5000
D: Rs = e = e 0, 25 = 77,8801%

Estatstica Aplicada 121


Manual de Exerccios

( 2*105 ) *5000
B e C: Rs = e = e 0,1 = 90,4837%
P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 (1-0,904837)2 = 99,0944%
Logo, P(sistema estar em funcionamento aps 5 000 horas) =
= 0,606531*0,990944*0,778801 = 46,8%

Exerccio 3
Foram ensaiadas durante 3 000 horas, sem que se verificasse qualquer avaria,
cinco unidades idnticas de um equipamento que se sabe ter uma curva de
sobrevivncia que obedece a uma distribuio exponencial, com um MTBF de
17 500 horas.
Calcule a fiabilidade do equipamento.

Resoluo
X: tempo de funcionamento sem avarias da mquina (em horas)
(isto , tempo que decorre entre avarias consecutivas (em horas))
X segue Exp(=1/17500) MTBF = 17500
Y: n de avarias no intervalo [0,3000] horas
3000

Rs = e 17500
= e 0,171429 = 84,25%

Exerccio 4
O tempo de funcionamento sem avarias de uma determinada mquina de
produo contnua segue uma lei exponencial negativa com valor esperado
igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no
instante t=0 horas.
a) Qual a probabilidade de no ocorrerem avarias antes do instante t=6
horas?
b) Admitindo que a mquina se encontrava em funcionamento no instante
t=4 horas, qual a probabilidade de no ocorrerem avarias at t=6 horas?
c) Qual a probabilidade de se verificarem 2 avarias durante as primeiras 6
horas de funcionamento da mquina?

Estatstica Aplicada 122


Manual de Exerccios

Resoluo
a) X: tempo de funcionamento sem avarias da mquina (em horas)
(isto , tempo que decorre entre avarias consecutivas (em horas))
X segue Exp(=1/4,5) MTBF = 4,5
1 6
6 1 4,5
P(X 6) = 1 P ( X < 6) = 1 e dx = e 4,5 = 26,4%
0 4,5
Ou considerando Y: n de avarias no intervalo [0,6] horas, como Y segue
Po(1/4,5), vem que P(X 6) = P(Y=0) = e-t = e-(1/4,5)t = e-(6/4,5) = 26,4%

6

P( X 6 X 4) P( X 6) e 4,5
b) P(X 6/ X 4) = = = 4 = 64,1% = P( X 2)
P( X 4) P( X 4)
e 4 ,5
c) Y: n de avarias no intervalo [0,6] horas
6

e 4,5
x(6 / 4,5) 2
P(Y=2) = = 23,4%
2!

Exerccio 5
Sabe-se que um determinado modelo de lmpadas apresenta no perodo de
vida til (3625 horas) um MTBF de 12 000 horas. Calcular:

a) A probabilidade de falha de uma ou mais lmpadas, num conjunto de 10,


no perodo de vida til.
b) Quantas lmpadas, de um conjunto de 1 000, estaro provavelmente em
funcionamento aps 2 000 horas de utilizao.

Resoluo
3625

a) Rs = e 12000
= e 0,302 = 73,9%
Em 10, 1 - P(falhar nenhuma) = 1 - 0,73910 = 1 0,0488 = 95,12%
2000

b) Rs = e 12000
= e 0,1667 = 84,6% Logo, 0,846x1000 lmpadas = 846

Estatstica Aplicada 123


Manual de Exerccios

Exerccio 6
Num grande centro comercial existem 3 telefones pblicos, colocados
estrategicamente a fim de satisfazer adequadamente os utentes. A observao
prolongada do funcionamento dos telefones levou a concluir que as
probabilidades dos 3 telefones, T1, T2 e T3 se encontrarem avariados so,
respectivamente, 0,15, 0,2 e 0,25 e que as avarias so independentes. O grupo
de telefones satisfaz minimamente o servio se pelo menos 2 estiverem sem
avarias. Qual a probabilidade de pelo menos dois destes telefones estarem
sem avarias?

Resoluo
P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem
sem avarias) = 0,095+0,51=60,5%
P(2 sem avarias) = 0,15*0,2*0,75+0,85*0,2*0,25+0,15*0,8*0,25=9,5%
P(3 sem avarias) = 0,85*0,8*0,75=51%

Exerccio 7
Um sistema constitudo por 5 componentes iguais, sendo 0.05 a
probabilidade de um elemento falhar ao longo de qualquer dia da semana. No
caso de nenhum elemento avariar o sistema funciona normalmente; se um dos
elementos avariar o sistema funciona com probabilidade 0.7; se mais de um
elemento avariar o sistema no funciona. Calcule:
a) a probabilidade do sistema funcionar ao longo do dia.
b) a funo de probabilidade do n de falhas registadas nos seus
componentes ao longo de um dia, indicando o valor mdio de tal
distribuio.

Resoluo
a) P(sist. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar)
= (0,955)* 1 + (5*0,954*0,05)*0,7 = 0,7738 + 0,1425 = 91,63%
b) Bi(n=5;p=0,05) Valor mdio=5*0,05=0,25

Estatstica Aplicada 124


Manual de Exerccios

CONTROLE ESTATSTICO DE QUALIDADE


Exerccios

Exerccio 1
Uma empresa fabrica e comercializa condutores elctricos cujas condies de
controlo da produo e aceitabilidade a seguir se indicam (relativos
resistncia de um componente em ):
Caracterstica sob controlo:
LIC: 49,8775
LSC: 50,1225
n=16
=0,25
Proceder-se- paragem da produo sempre que os limites de controlo
sejam desrespeitados
Um condutor considerado no defeituoso se a sua resistncia em
estiver compreendida entre [49,530; 50, 470]

Nestas condies, determine:


a) O valor da norma 0
b) A probabilidade de se proceder a uma paragem indevida da produo
c) A probabilidade de, estando a norma a ser cumprida, se produzir um
artigo defeituoso.

Resoluo

X: resistncia de um componente em
X N ( ; (0,25) 2 )
c
a) LIC = = 49,8775
n
c
LSC = + = 50,1225
n
c c
Como LIC + LSC = 100 vem que + + = 2 = 100
n n
Logo =100/2 = 50

Estatstica Aplicada 125


Manual de Exerccios

b)
P (parar indevidamente o processo produtivo) =
P( X cair fora dos limites de controlo quando =0) =

1 - P(49,8775 X 50,1225 sendo =50) =


49,8775 50 50,1225 50
1 - P( X )=
0,25 0,25
16 16

1- P(-1,96 X 1,96) =

Na tabela da Normal, vem D(1,96) = 0,95 donde


1 0,95 = 5%

c) P(produzir um artigo defeituoso, sendo a norma respeitada) =


1 P(49,53 X 50,47 sendo =50) =
49,53 50 50,47 50
1 - P( X )=
0,25 0,25
16 16

1 - P(-1,88 X 1,88) =

Na tabela da Normal, vem D(1,88) = 0,9399 donde


1 0,9399 = 6,01%

Exerccio 2
A empresa TRADECHO, SA mantm um diferendo com os seus principais
clientes, que afirmam que os produtos produzidos (em srie) por esta empresa
no obedecem s normas de qualidade estabelecidas e que so:
- a norma para o comprimento mdio das peas de 20 cm;
- a norma para a varincia de 4 e est a ser cumprida;
- a amplitude do intervalo de controle para a mdia deve ser de 1,96;
- a dimenso das amostras a extrair de 16
Afirmam os clientes que a probabilidade de parar indevidamente o processo
produtivo superior quela que decorre das normas.

Estatstica Aplicada 126


Manual de Exerccios

a) Determine a probabilidade referida.


b) Represente a carta de controle para a mdia
c) A recolha de 5 amostras forneceu os seguintes resultados para a mdia:

20,05 19,90 20,00 20,30 20,15

Qual a medida a tomar?

Resoluo
X: comprimento das peas em cm
X N ( ; 4)
a) P (parar indevidamente o processo produtivo) =
P( X cair fora dos limites de controlo quando =0) =

1 - P(20-1,96/2 X 20+1,96/2 sendo =20) =


0,98 0,98
1 - P( X )=
2 2
16 16

1- P(-1,96 X 1,96) =

Na tabela da Normal, vem D(1,96) = 0,95 donde


1 0,95 = 5%

b) e c)

Mdia
Amostral Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5
(cm)
20,98


20,5

20 20,3 20,15
20 19,90




19,02

No necessrio parar o processo produtivo (valores dentro dos limites de


controlo).

Estatstica Aplicada 127


Manual de Exerccios

Exerccio 3
Numa empresa procede-se ao exame das condies de produo relativas
durao (em horas) das lmpadas fabricadas (produo em srie). Sabe-se
que o desvio-padro da durao de uma lmpada de 100 horas.
O Departamento de Produo construiu o seguinte intervalo para a durao
mdia de uma lmpada, a partir de uma amostra de dimenso 100:

[983,55; 1016,45]

parando-se o processo produtivo se o valor mdio amostral se situar fora deste


intervalo.
a) Calcule o valor adoptado para a norma (0)
b) Determine a probabilidade de se parar indevidamente o processo
produtivo.

Resoluo
X: durao das lmpadas em horas
X N ( ; (100) 2 )
c
a) LIC = = 983,55
n
c
LSC = + = 1016,45
n
c c
Como LIC + LSC = 2000 vem que + + = 2 = 2000
n n
Logo =2000/2 = 1000 h

b) P (parar indevidamente o processo produtivo) =


P( X cair fora dos limites de controlo quando =0) =

1 - P(983,55 X 1016,45 sendo =1000) =


983,55 1000 1016,45 1000
1 - P( X )=
100 100
100 100

1- P(-1,645 X 1,645) =

Estatstica Aplicada 128


Manual de Exerccios

Na tabela da Normal, vem D(1,645) = 0,9 donde


1 0,9 = 10%

Exerccio 4
O novo Conselho de Administrao da empresa de componentes elctricas
Alta Tenso, SA resolveu efectuar um estudo aprofundado sobre o controle
estatstico de qualidade das peas produzidas. Assim, definiu com o director de
produo os aspectos considerados relevantes no controle da durao mdia
das componentes:
- o limite superior de qualidade (LSC) deve ser de 10,8 milhares de horas
- a amplitude do intervalo no deve exceder 1,96 milhares de horas
- a probabilidade de se parar indevidamente a produo de 5%
Sabe-se ainda que o desvio padro da durao de uma componente de 4 mil
horas.

a) Determine a dimenso da amostra que necessrio recolher para


cumprir as condies definidas.
b) Calcule a norma.

Resoluo
X: durao das componentes em milhares de horas
X N ( ; ( 4) 2 )
c
a) LSC = + = 10,8
n
D(c)= 5% logo c= 1,96
c 1,96 * 4
2 1,96 logo 2 1,96 n 64
n n
c 1,96 * 4
b) LSC = + = 10,8 logo = 10,8 - = 9,82
n 64

Exerccio 5
O director de produo da empresa DISLIX, SA pretende implementar um
sistema de controle interno de qualidade de um determinado tipo de geradores
fabricados em srie. Para tal, procede verificao da produo de energia

Estatstica Aplicada 129


Manual de Exerccios

elctrica (em kws/hora) tendo e vista a construo de um intervalo de controle


para a produo mdia de energia de um gerador que cumpra os seguintes
objectivos:
- Norma de produo para a mdia: 10
- A amplitude do intervalo no deve exceder 3,92
- A probabilidade de se parar indevidamente a produo no deve
exceder 5%
Sabe-se que o desvio padro da produo da energia elctrica de um gerador
de 4 kws/hora e que a varivel segue distribuio Normal.

a) Determine a dimenso mnima da amostra a utilizar para o controle de


produo.
b) Represente a carta de controle para a mdia.

Resoluo
X: energia elctrica produzida em kws/hora
X N ( ; ( 4) 2 )
a) D(c)= 5% logo c= 1,96
c 1,96 * 4
2 3,92 logo 2 3,92 n 16
n n
b)

Mdia
Amostral Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5
(cm)
11,96





10




8,04

c 1,96 * 4
LIC = = 10 = 8,04
n 16
c 1,96 * 4
LSC = + = 10 + = 11,96
n 16

Estatstica Aplicada 130


Manual de Exerccios

TRATAMENTO ESTATSTICO DE INQURITOS


Exerccios

Exerccio 1
A empresa BrasFruta Lda est a instalar-se em Portugal com um produto
inovador, um concentrado de fruta semelhante a um sumo de fruta natural. A
inteno vender o produto em cafs, esplanadas e bares que passariam a
dispor de uma imitao perfeita de um sumo acabado de fazerva um preo
vantajoso.
Atravs de um estudo qualitativo com consumidores, conseguiu-se apurar que
existia uma grande sensibilidade ao preo. Apesar de haver uma preferncia
generalizada por sumos naturais face a refrigerantes, os consumidores
mostravam-se cpticos em relao qualidade quando se falav em preos
baixos.
Entendeu-se ento levantar a seguinte questo: a sensibilidade ao preo
afectada pelo poder de compra dos clientes? Numa sondagem efectuada a
1973 clientes potenciais, confrontaram-se os inquiridos com trs alternativas:
adquirir sumo natural a preo elevado, adquirir sumo natural a preo baixo ou
adquirir refrigerantes. A sondagem revelou que, dos clientes classes A/B/C1,
598 pagariam um preo mais elevado pelo sumo natural, enquanto 212 no
estariam dispostos a gastar tanto. Em relao aos 977 clientes das classes
C2/D/E, 164 s consumiriam sumo natural se o preo fosse baixo e 285
preferiam refrigerante.
Represente adequadamente e interprete a informao contida nestes dados.
Utilize um nvel de significncia de 1%.

Resoluo
Preo Elevado Preo Baixo Refrigerante Total
A/B/C1 598 212 186 996
C2/D/E 528 164 285 977
Total 1126 376 471 1973

As concluses foram retiradas pelo recurso anlise correlacionada atravs do


teste do qui-quadrado. Estes testes foram elaborados sobretudo com o intuito

Estatstica Aplicada 131


Manual de Exerccios

de segmentar o mercado. As frequncias foram utilizadas para analisar o


mercado como um todo e para interpretar o resultado dos testes de correlao,
para os quais se convencionou a adopo de um nvel de significncia de 5%,
considerado razovel face aos valores normalmente utilizados.

Para o clculo das frequncias esperadas, procedeu-se aplicao de


n i . * n. j
eij = , de que resultou a seguinte tabela:
n
Preo Elevado Preo Baixo Refrigerante Total
A/B/C1 nij 598 212 186 996
eij 568.4 189.8 237.8
C2/D/E nij 528 164 285 977
eij 557.6 186.2 233.2
Total 1126 376 471 1973

Ho: As variveis so independentes


H1: As variveis no so independentes

crtico (GL=2; =0,05)=5,991

observado = 31,141

Vem que o obsv.=31,141 maior do que o valor obtido a partir da tabela,


que 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a
hiptese Ho ser rejeitada, concluindo-se que, no grupo estudado, h
associao entre as variveis. Em mdia, o poder de compra do consumidor
influencia a sensibilidade ao preo.

Exerccio 2
Aos exames de primeira poca de determinada disciplina compareceram 105
alunos, dos quais 20 no tinham prestado qualquer prova durante o ano. O
nmero de aprovaes foi de 33, das quais 3 foram de alunos que no tinham
efectuado provas durante o ano.

Estatstica Aplicada 132


Manual de Exerccios

Diga, com base nestes elementos, se, para um nvel de significncia de 5%, se
pode afirmar que existe independncia entre a comparncia (ou no) a provas
durante o ano de aprovao (ou no) em exame.

Resoluo

Aprovaes Aprovado Reprovado Total


Comparecem
Sim 30 55 85
No 3 17 20
Total 33 72 105

Ho: As variveis so independentes


H1: As variveis no so independentes

crtico (GL=2; =0,05)=3,84

observado = 3,122

Vem que o obsv.= 3,122 menor do que o valor obtido a partir da tabela.
Logo, a hiptese Ho no ser rejeitada (h independncia).

Exerccio 3
Com o objectivo de testar se existe relao entre a formao do gerente de
uma dependncia bancria e a respectiva performance, construiu-se a
seguinte tabela de contingncia, relativa a 300 balces de diferentes bancos:

Formao
Gerente Mdia Superior
Vol. Negcios
Baixo 44 52
Mdio 55 43
Elevado 51 55

Que conclui, a um nvel de significncia de 1%?

Resoluo
Ho: As variveis so independentes
H1: As variveis no so independentes

Estatstica Aplicada 133


Manual de Exerccios

Valores esperados:
Formao
Gerente Mdia Superior
Vol. Negcios
Baixo 48 48
Mdio 49 49
Elevado 53 53

crtico (GL=2; =0,01)=9,21

observado = 2,2876

(44 48) 2 (55 53) 2


Valor obsv. est. teste = + ... + = 2,2876 > 9,21
48 53

Vem que o obsv.= 2,2876 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao
entre as variveis.

Exerccio 4
Pretendendo-se analisar o comportamento do volume de divisas ao longo do
ano, deu-se particular ateno influncia exercida pelas remessas de
emigrantes. Assim, o ano foi dividido em duas pocas: poca de Ponta,
compreendendo os meses de vinda de emigrantes (Vero e Natal) e poca
Normal (restantes meses).
Assim, observou-se o nvel de Disponibilidades Lquidas sobre o Exterior (DLX)
para cada ms, tendo-se obtido:

Volume DLX Baixo/Mdio Elevado


poca
Normal 150 50
Ponta 20 80

A um nvel de significncia de 5%, que pode concluir?

Resoluo
Ho: As variveis so independentes
H1: As variveis no so independentes

Estatstica Aplicada 134


Manual de Exerccios

Valores esperados:
Volume DLX Baixo/Mdio Elevado
poca
Normal 113,33 86,66
Ponta 6,66 43,33

crtico (GL=1; =0,05)=5,991

observado = 85,069
(150 113,33) 2 (80 43,33) 2
Valor obsv. est. teste = + ... + = 85,069 > 3,84
113,33 43,33

Vem que o obsv.= 85,069 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao
entre as variveis.

Exerccio 5
Num estudo que pretendia averiguar a existncia de relao entre a procura de
moeda e a taxa de juro, procedeu-se recolha peridica de elementos sobre
essas variveis, construindo-se a seguinte tabela de contingncia:

Taxa juro Reduzida Mdia Elevada


Proc. Moeda
0-10 20 30 200
10-45 20 400 30
45-70 250 30 20

Utilizando um nvel de significncia de 5%, que concluso pode tirar?

Resoluo
Ho: As variveis so independentes
H1: As variveis no so independentes

Valores esperados:
Taxa juro Reduzida Mdia Elevada
Proc. Moeda
0-10 72.5 115 62.5
10-45 130.5 207 112.5
45-70 87 138 75

Estatstica Aplicada 135


Manual de Exerccios

crtico (GL=4; =0,05)=9,49

observado = 1183,7

Vem que o obsv.= 1183,7 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao
entre as variveis.

Exerccio 6
Um investigador seleccionou trs amostras de estudantes, A, B e C, que fazem
parte de um determinado projecto de estudo e aplicou-lhes uma escala de
atitudes com o objectivo de conhecer as suas opinies em relao ao projecto.
Os resultados de uma amostra de 140 estudantes foram os seguintes:

Grupo de
Tipo estudantes A B C
de atitude
Atitude negativa 30 30 10
Atitude positiva 10 20 40

Utilizando um nvel de significncia de 5%, que concluso pode tirar?

Resoluo
Ho: As variveis so independentes
H1: As variveis no so independentes
Valores esperados:
Grupo de
Tipo estudantes A B C
de atitude
Atitude negativa 20 25 25
Atitude positiva 20 25 25

crtico (GL=2; =0,05)=3,84

observado = 30

Vem que o obsv.= 30 maior do que o valor obtido a partir da tabela,


Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao
entre as variveis.

Estatstica Aplicada 136

Você também pode gostar