Estatistica Aplicada Exercicos Resolvidos

104
Introduo ao e-learning
Manual de Exerccios
NDICE
1. INTRODUO ................................................................................. 1.1 Definies Gerais ........................................................................ 1.1.1. Populao 1.1.2. Variveis ou atributos 1.1.3. Processo de amostragem 1.2 A Estatstica Descritiva e a Estatstica Indutiva ................... 2. ESTATSTICA DESCRITIVA ................................................................ 2.1 Variveis Qualitativas ................................................................. 2.2 Variveis Quantitativas Discretas ............................................. 2.3 Variveis Quantitativas Contnuas ............................................ 2.4 Medidas de Localizao ............................................................. 2.4.1. Mdia 2.4.2. Mediana 2.4.3. Moda 2.5 Medidas de Ordem ...................................................................... 2.6 Medidas de Assimetria ............................................................... 2.7 Medidas de Disperso ................................................................ 2.7.1. Disperso Absoluta 2.7.2. Disperso Relativa 2.8 Anlise de Concentrao ........................................................... 2.8.1. Curva de Lorenz 2.8.2. ndice de Gini 2.9 Estatstica Descritiva Bidimensional ........................................
4 5 5 5 5 6 8 8 9 10 11 11 12 13 13 14 15 15 16 17 17 18 19
Estatstica Aplicada
Manual de Exerccios
3. ESTATSTICA INDUTIVA ................................................................... 3.1 Noes bsicas de probabilidades ........................................... 3.2 Probabilidade condicionada ...................................................... 3.3 Funes de Probabilidade ...................................................... 3.4 Estimao por Intervalos ........................................................ 3.5 Testes de hipteses ................................................................ 3.6 Aplicaes Estatsticas: Fiabilidade ......................................... 3.6.1. Conceito de fiabilidade 3.6.2. Fiabilidade de um sistema 3.7 Aplicaes Estatsticas: Controlo Estatstico de Qualidade .. 3.8 Aplicaes Estatsticas: Tratamento Estatstico de Inquritos . 3.8.1. Teste de independncia do qui-quadrado
45 45 48 49 76 89 105 105 105 110 114 114
Estatstica Aplicada
Manual de Exerccios
"A estatstica a tcnica de torturar os nmeros at que eles confessem". Autor desconhecido
1. INTRODUO
Inicialmente, a actividade estatstica surgiu como um ramo da Matemtica. Limitava-se ao estudo de medies e tcnicas de contagem de fenmenos naturais e ao clculo de probabilidades de acontecimentos que se podiam repetir indefinidamente. Actualmente, os mtodos estatsticos so utilizados em muitos sectores de actividade, tendo como algumas aplicaes estudos de fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento de inquritos, sondagens, modelos economtricos, previses, etc. Exemplo de uma estatstica: os valores da inflao entre 1980 e 1990 constituem uma estatstica. Fazer estatstica sobre estes dados poderia consistir, por exemplo, em traar grficos, calcular a inflao mdia trimestral ou prever a inflao para 1991. A anlise de um problema estatstico desenvolve-se ao longo de vrias fases distintas: (i) Definio do Problema Saber exactamente aquilo que se pretende pesquisar; estabelecer o objectivo de anlise e definio da populao (ii) Amostragem e Recolha de Dados Fase operacional. o processo de seleco e registo sistemtico de dados, com um objectivo determinado. Os dados podem ser primrios (publicados pela prpria pessoa ou organizao) ou secundrios (quando so publicados por outra organizao). (iii) Tratamento e Apresentao dos Dados Resumo dos dados atravs da sua contagem e agrupamento. a classificao de dados, recorrendo a tabelas ou grficos.
Estatstica Aplicada 4
Manual de Exerccios
(iv) Anlise e Interpretao dos Dados A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o comportamento do fenmeno em estudo (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamentam na teoria da probabilidade.
1.1. Definies Gerais

1.1.1. Populao Fazer estatstica pressupe o estudo de um conjunto de objectos bem delimitado com alguma caracterstica em comum sobre os quais observamos um certo nmero de atributos designados por variveis. Exemplo: Empresas existentes em Portugal
1.1.2. Variveis ou atributos
As propriedades de uma populao so estudadas observando um certo nmero de variveis ou atributos. As variveis podem ser de natureza qualitativa ou quantitativa. As variveis quantitativas podem ainda dividir-se entre discretas e contnuas. As variveis discretas assumem apenas um nmero finito numervel de valores. As variveis contnuas podem assumir um nmero finito no numervel ou um nmero infinito de valores. Exemplo: um conjunto de empresas pode ser analisado em termos de sector de actividade (atributo qualitativo), nmero de trabalhadores (atributo quantitativo discreto), rcio de autonomia financeira (atributo quantitativo contnuo), etc
1.1.3. Processo de amostragem Para conhecer de forma completa a populao, podem efectuar-se:
Estatstica Aplicada
Manual de Exerccios
recenseamentos (indagao completa de todos os elementos da populao); este processo , no entanto, tipicamente moroso e dispendioso, sendo esses os motivos porque os Censos so realizados apenas em cada 10 anos.
estudos por amostragem (observao de apenas um subconjunto, tido como representativo do universo). As tcnicas de recolha de amostras garantem a sua representatividade e aleatoriedade.
1.2. A Estatstica Descritiva e a Estatstica Indutiva

Para alm do ramo de amostragem, a estatstica compreende dois grandes ramos: a estatstica descritiva e a estatstica indutiva. A estatstica descritiva o ramo da estatstica que se encarrega do tratamento e anlise de dados amostrais. Assim, depois de recolhida a amostra de acordo com tcnicas que garantem a sua representatividade e aleatoriedade, fica disponvel um conjunto de dados sobre o universo em bruto ou no classificados. Para que seja possvel retirar qualquer tipo de concluses, tornase necessrio classificar os dados, recorrendo a tabelas de frequncias e a representaes grficas, isto , preciso tratar os dados. Depois de tratados, ser possvel proceder anlise dos dados atravs de vrias medidas que descrevem o seu comportamento: localizao, disperso, simetria dos dados, concentrao, etc. So disso exemplo indicadores numricos bem conhecidos como a mdia ou a varincia. A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. De facto, a amostra no mais do que um passo intermdio e exequvel de obter informaes sobre o verdadeiro objecto de estudo, que o universo. A estatstica indutiva (ou inferncia estatstica) garante a ligao entre amostra e universo: se algo se concluiu acerca da amostra, at que ponto possvel afirmar algo semelhante para o universo? nesta fase que se procuram validar as hipteses formuladas numa fase prvia exploratria. Claro que o processo de
Manual de Exerccios
induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. As inferncias indutivas so assim elaboradas medindo, ao mesmo tempo, o respectivo grau de incerteza. Da que, na ficha das tcnicas das sondagens eleitorais, por exemplo, apaream referncias ao nvel de confiana associado aos resultados e ao erro cometido. O esquema seguinte ilustra a roda da disciplina de estatstica, relacionando os seus diferentes ramos:
POPULAO OU UNIVERSO Amostragem AMOSTRA
Previses Estimao Erros INFERIR DA AMOSTRA PARA O UNIVERSO
Estatstica Descritiva
TRATAMENTO E ANLISE DA AMOSTRA
Inferncia Estatstica
Grficos; tabelas; medidas descritivas
Estatstica Aplicada
Manual de Exerccios
2. ESTATSTICA DESCRITIVA
Os resultados da observao de um atributo sobre os elementos do conjunto a analisar constituem os dados estatsticos. O ramo da estatstica que se ocupa do tratamento, apresentao e anlise de dados amostrais denomina-se de estatstica descritiva.
2.1. Variveis Qualitativas

Os dados qualitativos so organizados na forma de uma tabela de frequncias, que representa o nmero ni de elementos de cada uma das categorias ou classes e que chamado de frequncia absoluta. A soma de todas as frequncias igual dimenso da amostra (n). Numa tabela de frequncias, alm das frequncias absolutas, tambm se apresentam as frequncias relativas (fi), obtida dividindo a frequncia absoluta pelo nmero total de observaes.
Modalidades Mod. 1 Mod. j Mod. n Total Frequncias absolutas n1 nj nn n: dimenso da amostra Frequncias relativas f1 fj fn 1
fi =
ni ; ni: n de vezes que cada modalidade da varivel foi observada. n
Estatstica Aplicada
Manual de Exerccios
Estes dados podem tambm ser representados graficamente atravs de: Diagrama de barras Para cada modalidade, desenha-se uma barra de altura igual frequncia absoluta ou relativa (as frequncias relativas so de preferir, pois permitem a comparao de amostras de diferentes dimenses). Diagrama sectorial ou circular Esta representao constituda por um crculo, em que se apresentam tantas fatias quantas as modalidades em estudo. O ngulo correspondente a cada modalidade proporcional s frequncias das classes, fazendo corresponder o total da amostra (n) a 360 Geralmente, juntamente com a identificao da modalidade, indica-se a frequncia relativa respectiva.
2.2. Variveis Quantitativas Discretas

So variveis que assumem um nmero finito ou infinito numervel de valores. A apresentao destas amostras semelhante s variveis qualitativas, fazendo-se uma tabela de frequncias e uma representao grfica recorrendo ao diagrama de barras.
Valores da varivel X1 Xj Xn Total Frequncias absolutas n1 nj nn n: dimenso da amostra Frequncias relativas f1 fj fn 1
Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi) acumuladas, como se pode ver no exemplo:
N defeituosos (X) 0 1 2 3 4 Total N embalagens (ni) 80 60 30 20 10 200 % embalagens (fi) 40% 30% 15% 10% 5% 1 Ni 80 80+60 170 190 200 Fi 40% 40%+30% 85% 95% 100%
Estatstica Aplicada
Manual de Exerccios
2.3. Variveis Quantitativas Contnuas

Como foi dito anteriormente, uma varivel (ou atributo) contnua quando assume um nmero infinito no numervel de valores, isto , podem assumir qualquer valor dentro de um intervalo. Neste caso, a construo da tabela compreende duas etapas: (i) Definio de classes de valores disjuntas, correspondentes a intervalos de nmeros reais fechados esquerda e abertos direita, cuja constituio obedece a certas regras
(ii) Contagem das observaes pertencentes a cada classe
Regra de construo de classes (pressupe a formao de classes de igual amplitude) - Nmero de classes a constituir Depende de n = dimenso da amostra Se n25, o nmero de classes a constituir deve ser 5 Se n<25, o nmero de classes a constituir deve ser n - Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferena entre o valor mximo e o valor mnimo observados, ento a amplitude de cada classe ser:
Valor mximo da varivel observado Valor mnimo da varivel observado N de classes a constituir
Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn] Total
Frequncias absolutas n1 nj n n: dimenso da amostra
Frequncias relativas f1 fj fn 1
A distribuio de frequncias representa-se atravs de um histograma. Um histograma uma sucesso de rectngulos adjacentes, em que a base uma classe e a altura a frequncia (relativa ou absoluta) por unidade de amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A rea total do histograma a soma das frequncias relativas, isto , 1.
Estatstica Aplicada
10
Manual de Exerccios
1. Esta distribuio permite visualizar o tipo de distribuio e deve salientar alguns aspectos mais relevantes desta (moda, classe modal, ...). Como as classes podem ter amplitudes diferentes, para que todos os rectngulos (colunas) sejam comparveis necessrio corrigir as frequncias das classes (calculando as frequncias que se teria se a amplitude de todas as classes fosse igual e igual a 1)
2. prefervel representar o histograma com fi/hi do que com ni/hi uma vez
que deste modo possvel comparar distribuies com diferente nmero de observaes amostrais. Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi) acumuladas.
2.4. Medidas de localizao

2.4.1. Mdia ( X ) a medida de localizao mais usada, sobretudo pela sua facilidade de clculo. Dados no-classificados (no agrupados numa tabela de frequncias)
x =
1 n
n i =1
xi
Mdia aritmtica simples
Dados classificados (isto , agrupados numa tabela de frequncias) Variveis discretas
x =
1 n
n i =1
ni x i
n i =1
f i xi
Mdia ponderada dos valores de X
Dados classificados (isto , agrupados numa tabela de frequncias) Variveis contnuas

x = 1 n
n i =1 n i =1
ni ci
f i ci
Mdia ponderada dos pontos mdios das classes
Estatstica Aplicada
11
Manual de Exerccios
onde ci o ponto mdio de cada classe (
lim . inf . + lim . sup . ) 2
A mdia uma medida de localizao que, geralmente, indica o valor central da distribuio, entendido como o valor em torno do qual se distribuem os valores observados. Desta forma, a mdia muitas vezes utilizada como valor representativo da amostra. No entanto, a mdia tem o grande inconveniente de ser sensvel a valores muito extremados ou aberrantes da distribuio (outliers). Em casos desses, a mdia deixa de ser um valor que aparece na parte central da distribuio para ser empurrada para os extremos. Nestes casos, prefervel recorrer informao complementar fornecida por outras medidas de localizao, como a moda e a mediana, que se definem a seguir.
2.4.2. Mediana (Me) A mediana no se calcula a partir do valor de todas as observaes, mas a partir da posio dessas observaes. Dados no-classificados Se tivermos n valores x1, x2, ... xn Se n fr mpar,
Me = x n+1
2
Se n fr par,
xn + xn Me =
2 2
+1
Dados classificados A mediana o valor tal que Fi = 0,5 Variveis discretas Se existe um valor de xi para o qual Fi = 0,5, ento fala-se em intervalo mediano.
Estatstica Aplicada
12
Manual de Exerccios
Se no existe nenhum valor de xi para o qual Fi = 0,5, ento a mediana o primeiro valor para o qual Fi > 0,5. Variveis contnuas Em geral, determina-se o valor para o qual Fi = 0,5 atravs de uma regra de trs simples, atendendo a que as frequncias acumuladas variam uniformemente dentro de cada classe. De uma forma geral:
Me = L inf +
0.5 FL inf xamp. classe mediana FL sup FL inf
2.4.3. Moda (Mo) Variveis discretas A moda valor de X para o qual fi mximo, isto , o valor mais frequente da distribuio. Variveis contnuas A classe modal a classe de valores de X para o qual fi/hi mximo, isto , a classe a que corresponde maior frequncia por unidade de amplitude.
2.5. Medidas de ordem

Tal como se definiu para a mediana, possvel definir outros valores de posio ou valores separadores da distribuio em partes iguais. Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p. Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil Se p=0,1; 0,2;...0,9, chama-se ao quantil decil Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A mediana uma caso particular dos quartis (coincide com Q2) Varivel discreta O quantil de ordem p o primeiro valor de x para o qual i>p.
Manual de Exerccios
Varivel contnua Calcula-se por uma regra de trs simples, como a mediana. De uma forma geral:
Q1 = L inf + Q3 = L inf +
25% maiores
0.25 FL inf xamp. classe Q1 FL sup FL inf 0.75 FL inf xamp. classe Q3 FL sup FL inf
A representao grfica destas medidas designa-se de diagrama de extremos e quartis e serve para realar algumas caractersticas da amostra. Os valores da amostra compreendidos entre os 1 e 3 quartis so representados por um rectngulo (caixa) com a mediana indicada por uma barra. Seguidamente, consideram-se duas linhas que unem os meios dos lados do rectngulo com os extremos da amostra. A partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos dados e a sua maior ou menor concentrao:
2.6. Medidas de assimetria

A assimetria tanto maior quanto mais afastados estiverem os valores da mdia, mediana e moda. Concretamente, se:
X = Me = Mo, a distribuio diz-se simtrica X > Me > Mo, a distribuio diz-se assimtrica positiva (ou enviesada
esquerda)
X < Me < Mo, a distribuio diz-se assimtrica negativa (ou enviesada
direita) Coeficiente de assimetria de Bowley (g):

(Q3 Q 2) (Q 2 Q1) Q3 Q1
Se g = 0 ..............a distribuio simtrica positiva ou equilibrada Os quartis esto mesma distncia da mediana. Se g > 0 ..............a distribuio assimtrica positiva ou puxada para
Estatstica Aplicada
14
Manual de Exerccios
a esquerda (se fr = 1, assimetria mxima) A mediana desliza para o lado do Q1, logo Q3-Q2 > Q2-Q1 Se g < 0 ..............a distribuio assimtrica negativa ou puxada para a direita (se fr = -1, assimetria mxima) A mediana desliza para o lado do Q3, logo Q2-Q1 > Q3-Q2
Q1 Q2
Q3
Assimtrica positiva
Q2 Q3
Q1
Assimtrica negativa
2.7. Medidas de disperso

Duas distribuies podem distinguir-se na medida em que os valores da varivel se dispersam relativamente ao ponto de localizao (mdia, mediana, moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas consoante a medida de localizao usada para referenciar a disperso das observaes: 2.7.1 Medidas de disperso absoluta
(i)
Em relao mediana Amplitude inter-quartis = Q = Q3 Q1 Significa que 50% das observaes se situam num intervalo de amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior (menor) a disperso em torno da mediana.
(ii)
Em relao mdia Varincia amostral: mede os desvios quadrticos de cada valor observado em relao mdia, havendo pouca disperso se os desvios forem globalmente pequenos, e havendo muita disperso se os desvios forem globalmente grandes.
Estatstica Aplicada
15
Manual de Exerccios
Dados no-classificados 2 1 n s2 = xi x n i =1
Dados classificados Variveis discretas
1 s = n
2
n i =1
ni xi x =
n i =1
fi xi x
Dados classificados Variveis contnuas
1 s = n
2
n i =1
ni ci x
n i =1
fi ci x
onde ci o ponto mdio de cada classe i. Desvio-padro: Medida de disperso com significado real, mas que s possvel calcular indirectamente, atravs da raiz quadrada da varincia. Est expressa nas mesmas unidades da varivel.
2.7.2 Medidas de disperso relativa Muitas vezes, avaliar a disperso atravs de um indicador de disperso absoluta no conveniente, assim como comparara a disperso de duas distribuies, uma vez que estas medidas vm expressas na mesma unidade da varivel como o caso, por exemplo, da varincia. Assim, de esperar que os valores da varincia sejam mais elevados quando os valores da varivel so maiores, o que no significa que a distribuio seja muito dispersa. Para comparar diferentes distribuies de frequncia so precisas medidas de disperso relativa:
Disperso absoluta Medida de localiza o em relao qual est definida
Disperso relativa =
Estatstica Aplicada
16
Manual de Exerccios
Coeficiente de variao
CV = s x100% x
Outras medidas
Q3 Q1 Q2
Estas medidas no esto expressas em nenhuma unidade, e permitem comparar disperses entre duas amostras, pois no so sensveis escala (eventualmente diferente) em que as variveis estejam expressas.
2.8. Anlise da concentrao

A noo de concentrao apareceu associada ao estudo de desigualdades econmicas, como a repartio do rendimento ou a distribuio de salrios. O fenmeno de concentrao est relacionado com a variabilidade ou disperso dos valores observados, apesar de no poder ser analisado atravs das medidas de disperso atrs descritas, que apenas medem a disperso dos valores em relao a um ponto. O objectivo determinar como o atributo (rendimento, salrios, nmero de empresas) se distribui (se de forma mais ou menos uniforme) pelos diferentes indivduos da amostra (que devem ser susceptveis de serem adicionados, isto , a anlise de concentrao no se aplica a idade, altura, peso, etc). Se o atributo estiver igualmente repartido pelos indivduos, temos uma situao extrema de igual distribuio; e vice-versa de o atributo estiver concentrado num s indivduo, temos uma situao extrema de mxima concentrao. Em geral, interessa medir o grau de concentrao em situaes intermdias.
Para analisar a concentrao, existem dois instrumentos: a Curva de Lorenz e o ndice de Gini.
2.8.1 Curva de Lorenz

Manual de Exerccios
O objectivo comparar a evoluo das frequncias acumuladas (Fi = pi) com a evoluo da soma dos valores da varivel (qi)
Quadro de dados
Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn[ Total ni n1 nj nn n Quantidade Freq.relativa Proporo atributo acumuladas atrib.acumul, yi p1 q1 yj yn pj pn=1 qj qn=1
Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une a curva de Lorenz. Se houver igual distribuio, a frequncia das observaes deve ter uma evoluo igual proporo do atributo correspondente, isto , pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado, que designada de recta de igual repartio. Quanto mais a curva se afastar da recta, maior a concentrao. A zona entre a diagonal e acurva de Lorenz designa-se, por isso, de zona de concentrao.
2.8.2 ndice de Gini O ndice de Gini calculado pela seguinte expresso

n 1
( pi qi )
n 1 i =1
G=
i =1
pi
Quando G = 0, a concentrao nula, havendo igual repartio. Caso o valor de G seja 1, a concentrao ser mxima. O valor de G varia entre 0 e 1, e quanto maior o seu valor, maior a concentrao.
Estatstica Aplicada
18
Manual de Exerccios
2.9. Estatstica Descritiva Bidimensional

Numa situao em que se observam pares de valores (xi; yj), pode ter interesse estudar as relaes porventura existentes entre os dois fenmenos, nomeadamente relaes estatsticas. No se trata de estudar relaes funcionais (isto , a medida em que o valor de uma varivel determinado exactamente pela outra), mas sim de estudar a forma como a variao de uma varivel poder afectar a variao da outra, em mdia. (por exemplo, o peso e a altura normalmente esto relacionados, mas a relao no determinstica). Duas variveis ligadas por uma relao estatstica dizem-se correlacionadas. Se as variaes ocorrem, em mdia ou tendencialmente, no mesmo sentido, a correlao diz-se positiva. Se ocorrem em sentidos opostos, a correlao dizse negativa. Trata-se ento de estudar se:
-
Se existe alguma correlao entre os fenmenos ou variveis observadas A existir, se traduzvel por alguma lei matemtica, nem que tendencialmente A existir, se possvel medi-la
Por vezes, a representao grfica do conjunto de dados bivariados sugere o ajustamento de uma recta a este conjunto de pontos, indicando a existncia de uma tendencial correlao linear entre as duas variveis, como o caso do exemplo atrs descrito. A essa recta chama-se recta de regresso de y sobre x, que permite descrever como se reflectem em y (varivel dependente ou explicada) as modificaes processadas em x (varivel independente ou explicativa). Essa recta torna possvel, por exemplo, inferir (em mdia) a altura de um indivduo, conhecendo o respectivo peso. Um dos mtodos mais conhecidos de ajustar uma recta a um conjunto de dados o Mtodo dos Mnimos Quadrados, que consiste em determinar a recta que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. Obtm-se assim a
Estatstica Aplicada
19
Manual de Exerccios
recta de regresso ou recta dos mnimos quadrados. Assim, se a recta de regresso obedecer seguinte frmula geral:
y = a + bx
o mtodo permite minimizar a soma dos desvios quadrticos yi - (a + bxi). Assim sendo, obtm-se:
b= xi y i n x y xi n x
2 2
a = y bx
Matematicamente, b designa o declive da recta. Em termos estatsticos, b corresponde ao coeficiente de regresso de y sobre x, que indica a variao mdia de y que acompanha uma variao unitria de x. O valor de a designa a ordenada na origem, isto , o valor que y assume quando x=0.
Quando, quer atravs do diagrama de disperso, quer atravs da recta de regresso, se verifica a existncia de uma associao linear entre as variveis, pode-se medir a maior ou menor fora com que as variveis se associam atravs do coeficiente de correlao linear r:
r= s xy s xx s yy , s xy =
n i =1
( xi x)( y i y )
Este indicador da correlao tem a vantagem de no depender das unidades ou da ordem de grandeza em que as variveis esto expressas. O coeficiente de correlao linear est sempre compreendido entre 1 e 1. Se r > 0, ento pode dizer-se que existe uma correlao positiva entre as variveis, isto , as variveis variam no mesmo sentido: um aumento (diminuio de x) provoca um aumento (diminuio) de y, mas menos que proporcional.
Estatstica Aplicada
20
Manual de Exerccios
Se r < 0, ento pode dizer-se que existe uma correlao negativa entre as variveis, isto , as variveis variam em sentidos opostos: um aumento (diminuio de x) provoca uma diminuio (aumento) de y, mas menos que proporcional. Se r = 0, ento pode dizer-se que as variveis no esto correlacionadas linearmente. Antes de se efectuar um estudo de correlao, deve-se procurar justificao terica para a existncia ou inexistncia de correlao. Caso contrrio, poder acontecer que variveis sem relao de causalidade entre si, variem num certo sentido por razes exteriores. A esta correlao ilusria, chama-se correlao espria. Nos extremos, se r = 1 ou se r = -1, ento pode dizer-se que existe uma correlao positiva ou negativa perfeita, respectivamente, entre as variveis, isto , uma variao numa varivel provoca na outra uma variao exactamente proporcional no mesmo sentido ou em sentido contrrio. Isto , a correlao mxima.
Correlao ordinal Por vezes, as variveis vm expressas numa escala ordinal, isto , interessa mais conhecer a ordenao dos valores do que os valores observados propriamente ditos. Neste caso, em vez do coeficiente de correlao linear, calcula-se o coeficiente de correlao ordinal:
n
rs = 1 6
i =1
di
2
n(n 1)
, d i = Ri Ri
Ordens (ranks) das observaes de X e de Y, respectivamente
Estatstica Aplicada
21
Manual de Exerccios
ESTATSTICA DESCRITIVA
Exerccios resolvidos
Exerccio 1 Considere a distribuio de 1000 empresas de um sector de actividade segundo os resultados lquidos (em milhares de u.m.):
Resultado Lquido [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total Frequncia. Relativa (%) 10 25 35 15 10 5 100
a) Represente a distribuio graficamente. b) Determine a mdia e a moda da distribuio. Qual o significado dos valores encontrados? c) Calcule as frequncias acumuladas e represente-as graficamente. Determine a mediana da distribuio. d) Determine os quartis da distribuio. Faa a sua representao grfica. e) Analise a (as)simetria da distribuio em causa.
f)
Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.
Resoluo
a)
fi/hi 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 10 20 30 40 50 60
Estatstica Aplicada
22
Manual de Exerccios
[0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50]

Total
fi 10% 25% 35% 15% 10% 5% 1
hi 1 2 2 10 10 25
fi/hi 0.1 0.125 0.175 0.015 0.01 0.002
Fi 10% 35% 70% 85% 95% 100%
ci 0.5 2 4 10 20 37.5
b) x = 1
n i =1
ni c i
n i =1
f i ci
= (0,5 x10%) + (2 x 25%) + ... + (37.5 x5%) = 7,325
Em mdia, o resultado lquido de uma empresa de 7325 unidades monetrias. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 0,175. correspondente classe
[3; 5[, isto , os valores de resultado lquido mais provveis para uma empresa
situam-se entre 3000 u.m. e 5000 u.m. c) A representao grfica das frequncias acumuladas (ver tabela) designa-se de polgono integral:
Fi
1 0,8 0,6 0,4 0,2 0 0 20 40 60 80 100 120
Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [3; 5[ 3 : Fi=0,35 5 : Fi = 0,7
Estatstica Aplicada
23
Manual de Exerccios
Clculo da mediana: 0,7 - 0,35 ------------ 5 - 3 0,5 0,35 -------------- Me 3 Me = 3 + ((2x0,15)/0,35) = 3,857 50% das empresas apresentam resultados lquidos inferiores a 3857 u.m. d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 3[ 1 : Fi=0,1 3 : Fi = 0,35 Clculo do Q1: 0,35 - 0,1 ------------ 3 - 1 0,25 0,1 -------------- Q1 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas apresentam resultados lquidos inferiores a 2200 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,7 15 : Fi = 0,85 Clculo do Q3: 0,85 - 0,7 ------------ 15 - 5 0,75 0,7 -------------- Q3 5 Q3 = 5 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas apresentam resultados lquidos inferiores a 8333 u.m.
e)
g' =
(Q3 Q 2) (Q 2 Q1) (8,333 3,857) (3,857 2,2) = = 0,4596 > 0 Q3 Q1 8,333 2,2
A distribuio assimtrica positiva ou enviesada esquerda.
Estatstica Aplicada
24
Manual de Exerccios f)
X [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total
fi 10% 25% 35% 15% 10% 5% 1
ni 1000x10%=100 250 350 150 100 50 n=1000
ci 0.5 2 4 10 20 37.5
Atributo 100x0.5=50 250x2=500 1400 1500 2000 1875 7325
pi (=Fi) 0.1 0.35 0.7 0.85 0.95 1
qi 0.007 0.075 0.266 0.471 0.744 1
50 + 500 + 1400 7325
Res.Liq.Totais
G=
(0,1 0,007) + ... + (0,95 0,744) = 0,47 0,1 + 0,35 + 0,7 + 0,85 + 0,95
Curva de Lorenz 1
A distribuio dos resultados lquidos apresenta concentrao mdia (G=0,5 corresponde ao centro da escala possvel, entre 0 e 1). Por exemplo, 70% das empresas apresentavam resultados at 5000 u.m., mas isso representava apenas 26,6% do total de resultados das empresas da
0,2 0,8
0,6
0,4
amostra, o que sugere um tecido empresarial com muitas PMEs, mas em que cada uma tem baixo resultado lquido.
0 0 0,2 0,4 0,6 0,8 1
Exerccio 2 Considere a seguinte amostra de dimenso 200, referente aos lucros obtidos por empresas de um dado sector industrial, expressas numa determinada unidade monetria. Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.
Estatstica Aplicada
25
Manual de Exerccios
Resoluo
Lucros [0; 50[ [50; 100[ [100; 200[ [200; 300[ [300; 500] Total
ni 20 60 80 30 10 200
Lucro total 600 4400 14000 7500 3500 30000
pi (=Fi) 0.1 0.4 0.8 0.95 1
qi 0.02 0.16(6) 0.63(3) 0.883(3) 1
Curva de Lorenz 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1
n 1
( pi qi )
n 1 i =1
G=
i =1
= pi
0,546(6) = 0,243 2,25
Tanto pela anlise da Curva de Lorenz, como pelo valor do ndice de Gini, conclui-se que esta amostra apresenta concentrao moderada, encontrandose os valores razoavelmente repartidos.
Exerccio 3 Considere o exemplo abaixo referente ao peso e altura de 10 indivduos. a) Represente o diagrama de disperso. b) Analise a correlao existente entre peso e altura.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima as peso em funo da altura.

Manual de Exerccios
Indivduo A B C D E F G H I J
Resoluo
Peso (kg) 72 65 80 57 60 77 83 79 67 68
Altura (cm) 175 170 185 154 165 175 182 178 175 173
Diagrama de Disperso
190
a)
180 Altura (cm)
170
160
150 50 60 70 Peso (kg) 80 90
b) No exemplo, r = 0,90681871, isto , existe uma correlao positiva forte
entre as duas variveis, quase perfeita. c)

190
Recta de Regresso
180 Altura (cm)
y = 0,9016x + 109,36
170
160
150 50 60 70 Peso (kg) 80 90
Estatstica Aplicada
27
Manual de Exerccios
A equao desta recta traduz-se em Altura = 109,36 + 0,9016 x Peso Isto , se um indivduo pesar 70 kg, a altura esperada ser de 109,36 + 0,9016 x 70 = 172,472. Por cada kg de peso adicional, espera-se que a altura do indivduo aumente 0,9016 cm. Exerccio 4 O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas em milhares de u.m.) de uma empresa no perodo de 7 anos:
Ano 1 2 3 4 5 6 7 Vendas 10 13 18 19 25 30 35 Desp. Publicidade 3 3 5 6 8 9 13
a) Compare as vendas e as despesas em publicidade quanto disperso. b) Analise a correlao existente entre volume e custo de produo.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima as vendas em funo das despesas em publicidade.
Resoluo
a) Para comparar a disperso das duas distribuies, necessrio calcular os
coeficientes de variao (medidas de disperso relativa): Dados no-classificados
x =
sx
2
1 n
n i =1
n i =1
xi = 21,429
2
y =
sy
2
1 n
n i =1
n i =1
yi = 6,714
2
1 = n
(xi x )
= 69,9408
1 = n
(yi y )
= 11,0651
CV x =
sx 69,9408 = = 0,39 x 21,429
<
CV y =
sy y
11,0651 = 0,495 6,714
A disperso das despesas em publicidade superior disperso das vendas.
Estatstica Aplicada
28
Manual de Exerccios b)
r=
s xy s xx s yy
1 [(10 21,429)(3 6,714) + ... + (35 21,429)(13 6,714)] 7 = = 0,98 69,9408 x 11,0651
Existe uma correlao positiva linear forte entre as duas variveis. Em mdia, quando as despesas em publicidade aumentam (diminuem), as vendas aumentam (diminuem) de forma quase exactamente proporcional.
Recta de Regresso
c)
30
y = 2,4649x + 4,8782
Vendas
20
10
0 3 8 Desp. Public. 13
Exerccio 5 Considere que 10 estudantes foram sujeitos a uma prova de avaliao no incio e no final do curso. No quadro abaixo, encontram-se as ordenaes desses 10 estudantes segundo as classificaes obtidas em cada uma das provas:
Aluno A B C D E F G H I J
Estatstica Aplicada
Prova inicial Rix 1 3 2 5 7 8 9 10 6 4
Prova final Riy 1 2 3 4 6 8 7 9 10 5
di Rix - Riy 0 1 -1 1 1 0 2 1 -4 -1
29
Manual de Exerccios
Resoluo
Como no dispomos das classificaes dos alunos, mas sim das ordenaes das classificaes (do 1 ao 10 classificado), para avaliar a correlao existente entre as 2 provas calcula-se o coeficiente de correlao ordinal:
n
rs = 1 6
i =1
di
2
n(n 1)
= 1
6 x(0 + 1 + 1 + 1 + 1 + 0 + 4 + 1 + 16 + 1) = 0,8424 10 x(100 1)
A correlao positiva e elevada (rs varia entre 1 e 1), isto , os alunos que tiveram boa nota na prova inicial tiveram, em mdia, igualmente boa nota na prova final.
Exerccio 6
O quadro que se segue descreve a distribuio do rendimento anual (em milhares de u.m.) de 2500 famlias da populao de um pas:
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ N de famlias 250 375 625 750 375 125
a) Represente as frequncias acumuladas graficamente. b) Determine o rendimento mdio e mediano. c) Determine os trs primeiros quartis. Que indicaes lhe do sobre a (as)simetria? d) O que pode concluir quanto disperso? e) Calcule o ndice de Gini. O que conclui sobre a concentrao do rendimento?
Resoluo
a)
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[
N de famlias 250 375 625 750 375 125
% de famlias 10 15 25 30 15 5
Fi (%) 10 25 50 80 95 1
ci 0.5 1.5 3.5 10 20 37.5

30
Estatstica Aplicada
Manual de Exerccios
1 0,8 0,6 0,4 0,2 0 0 10

n i =1
20
n i =1
30
40
50
60
70
80
90
100
b) x = 1
ni c i
f i ci
= (0,5 x10%) + (1.5 x15%) + ... + (37.5 x5%) = 9,025
Em mdia, o rendimento anual de uma famlia de 9025 unidades monetrias. Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [2; 5[ 5 : Fi = 0,5. Logo, a mediana 5 (50% das famlias tm rendimentos anuais at 5000 unidades monetrias).
c) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 2[ 3 : Fi = 0,25 25% das famlias apresentam rendimentos anuais inferiores a 2000 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,5 15 : Fi = 0,8 Clculo do Q3: 0,8 - 0,5 ------------ 15 - 5 0,75 0,5 -------------- Q3 5 Q3 = 5 + ((10x0,25)/0,3) = 13,333(3) 75% das famlias apresentam rendimentos anuais inferiores a 13333 u.m.
Estatstica Aplicada
31
Manual de Exerccios
g' =
(Q3 Q 2) (Q 2 Q1) (13,333 5) (5 2) = = 0,47 > 0 Q3 Q1 13,333 2
d) s x =
n i =1
2
fi * ci x
n i =1
fici 2 x = 82,286875
s x = s x = 82,286875 = 9,071
e)
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ Total
n 1
ni 250 375 625 750 375 125 2500
ci 0.5 1.5 3.5 10 20 37.5
Rend. total 125 562,5 2187,5 7500 7500 4687.5 22562,5
pi (=Fi) 0,1 0,25 0,5 0,8 0,95 1
qi 0.00554 0.0305 0.1274 0.46 0.7922 1
( pi qi )
n 1 i =1
G=
i =1
= pi
1,18436 = 0,4555 2,6
Concentrao moderada do rendimento
Exerccio 7
Considere a seguinte tabela que representa a distribuio dos empregados de uma instituio bancria segundo a remunerao bruta mensal (em milhares de unidades monetrias):
Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100
Estatstica Aplicada
32
Manual de Exerccios
a) Calcule os quartis da distribuio. b) Analise a disperso da distribuio em causa. c) Analise a assimetria da distribuio em causa.
Resoluo
a)
Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total
Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100
Fi (%) 7.8 23 54.2 73.7 80.9 89 94.4 97 100
Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [100; 120[ 1 : Fi=0,23 3 : Fi = 0,542 Clculo do Q1: 0,542 - 0,23 ------------ 120 - 100 0,25 - 0,23 -------------- Q1 - 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 25% dos empregados auferem remuneraes inferiores a 101,28 milhares u.m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [100; 120[ 100 : Fi=0,23 120 : Fi = 0,542 Clculo do Q2: 0,542 - 0,23 ------------ 120 - 100 0,5 - 0,23 -------------- Q2 - 100 Q2 = 100 + ((20x0,27)/0,312) = 117,3 50% dos empregados auferem remuneraes inferiores a 117,3 milhares u.m.
Estatstica Aplicada
33
Manual de Exerccios
Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [140; 160[ 120 : Fi=0,737 140 : Fi = 0,809 Clculo do Q3: 0,809 - 0,737 ------------ 160 - 140 0,75 0,737 -------------- Q3 - 140 Q3 = 140 + ((20x0,013)/0,072) = 143,61(1) 75% dos empregados auferem remuneraes inferiores a 143,61(1) milhares u.m. b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33 (disperso reduzida em torno da mediana)
(Q3 Q 2) (Q 2 Q1) (143,61 117,3) (117,3 101,28) = = 0,243 > 0 Q3 Q1 143,61 101,28
c) g ' =
Exerccio 8
Os dados seguintes referem-se ao peso, expresso em gramas, do contedo de uma srie de 100 garrafas que, no decurso de um teste, saram de uma linha de enchimento automtico:
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total Frequncia. Relativa (%) 8 21 28 15 11 10 5 1 1 100
a) Represente graficamente os dados acima. b) Calcule as frequncias acumuladas e represente-as graficamente.
Estatstica Aplicada
34
Manual de Exerccios
c) Determine o peso mdio, mediano e modal. Qual o seu significado? d) Determine os quartis da distribuio. e) Analise a disperso do peso das garrafas.
Resoluo
a)
0,3 0,25 0,2 0,15 0,1 0,05
Histograma
0 296 297 298 299 300 301 302 303 304 305 306 307
b)
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total
F* 1 0,8 0,6 0,4 0,2 0 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310
Frequncia Relativa (%) 8 21 28 15 11 10 5 1 1 100
Fi (%) 8 29 57 72 83 93 98 99 100
c)
x = 1 n
n i =1
ni c i
n i =1
f i ci
= (297,5 x8%) + (298,5 x 21%) + ... + (305,5 x1%) = 300,11
O peso mdio das garrafas de 300,11 kg.
Estatstica Aplicada
35
Manual de Exerccios
Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [299; 300[ 299 : Fi = 0,29 300 : Fi = 0,57 Clculo do Q2: 0,57 - 0,29 ------------ 300 - 299 0,5 - 0,29 -------------- Q2 - 299 Q2 = 299 + ((1x0,21)/0,28) = 299,75 50% das garrafas tm peso inferior a 299,75 kg. A classe modal aquela a que corresponde maior frequncia relativa. Neste caso, o maior valor de fi 0,28 correspondente classe [299; 300[, isto , os pesos mais provveis das garrafas situam-se entre 299 kg e 300 kg. d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [298; 299[ 298 : Fi=0,08 299 : Fi = 0,29 Clculo do Q1: 0,29 - 0,08 ------------ 298 - 299 0,25 - 0,08 ------------ Q1 - 299 Q1 = 299 + ((1x0,17)/0,21) = 299,0357 25% das garrafas tm peso inferior a 299,0357 kg. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [301; 302[ 301 : Fi=0,72 302 : Fi = 0,83 Clculo do Q3: 0,83 - 0,72 ------------ 302 - 301 0,75 0,72 -------------- Q3 - 301 Q3 = 301 + ((1x0,03)/0,11) = 301,27(27) 75% das garrafas tm peso inferior a 301,27(27) kg.
Estatstica Aplicada
36
Manual de Exerccios
e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237 (disperso reduzida em torno da mediana)
Exerccio 8
Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:

Altura (em metros) [1,4; 1,5[ [1,5; 1,55[ [1,55; 1,6[ [1,6; 1,65[ [1,65; 1,7[ [1,7; 1,75[ [1,75; 1,8[ [1,8; 1,9] Total N Alunos 2 10 25 13 17 20 10 3 100
a) Represente graficamente os dados acima. b) Determine a altura mdia e a altura modal. Qual o seu significado? c) Calcule as frequncias acumuladas e represente-as graficamente. d) Determine os quartis da distribuio e diga qual o seu significado. e) Analise a disperso da distribuio. f) Analise a (as)simetria da distribuio.
Resoluo
a)
Altura (em metros)
[1,4; 1,5[ [1,5; 1,55[ [1,55; 1,6[ [1,6; 1,65[ [1,65; 1,7[ [1,7; 1,75[ [1,75; 1,8[ [1,8; 1,9] Total
fi/hi
ni 2 10 25 13 17 20 10 3 100
fi 0,02 0,1 0,25 0,13 0,17 0,2 0,1 0,03 1
ci 1,45 1,525 1,575 1,625 1,675 1,725 1,775 1,85
hi 0,1 0,05 0,05 0,05 0,05 0,05 0,05 0,1
fi/hi 0,2 2 5 2,6 3,4 4 2 0,3
Fi 0,02 0,12 0,37 0,5 0,67 0,87 0,97 1
6 5 4 3 2 1 0
Histograma
1,4
1,5
1,6
1,7
1,8
1,9
Estatstica Aplicada
37
Manual de Exerccios
b) x =
1 n
n i =1
ni c i
n i =1
f i ci
= (1,45x 2%) + (1,525x10%) + ... + (1,85x3%) = 1,65
A altura mdia dos alunos de 1,65 m. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 5. correspondente classe
[1,55; 1,6[, isto , a altura mais provvel de um aluno rondar 1,55m / 1,6m.
c)
F* 1 0,8 0,6 0,4 0,2 0 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1,55; 1,6[ 1,55 : Fi=0,12 1,6 : Fi = 0,37 Clculo do Q1: 0,37 0,12 ------------ 1,6 1,55 0,25 0,12 ------------ Q1 1,55 Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576 25% dos alunos tm altura inferior a 1,576 m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [1,6; 1,65[ 1,65 : Fi = 0,5 50% dos alunos tm altura inferior a 1,65 m. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [1,7; 1,75[ 1,7 : Fi=0,67 1,75 : Fi = 0,87
Estatstica Aplicada
38
Manual de Exerccios
Clculo do Q3: 0,87- 0,67------------ 1,75 1,7 0,75 0,67-------------- Q3 1,7 Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72 75% dos alunos tm altura inferior a 1,72 m. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 1,576 = 0,144 (disperso reduzida em torno da mediana)
sx =
n i =1
fi * ci x
2
n i =1
fici 2 x = 0,00536875
s x = s x = 0,00536875 = 0,07327
(disperso reduzida em torno da mdia)

(Q3 Q 2) (Q 2 Q1) (1,72 1,65) (1,65 1,576) = 0,027(7) < 0 = Q3 Q1 1,72 1,576
f) g ' =
A distribuio ligeiramente assimtrica negativa ou enviesada direita (quase simtrica).
Exerccio 9
Em determinada central telefnica, registou-se a durao das chamadas realizadas em Dezembro de 2001:
Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total N Chamadas 2000 1500 1000 300 200 5000
a) Represente graficamente as frequncias simples e acumuladas. b) Determine a durao mdia das chamadas e respectivo desvio-padro. c) Qual a durao da chamada mediana? Qual o significado do valor encontrado?
Estatstica Aplicada
39
Manual de Exerccios
d) Sabe-se que as chamadas realizadas durante o ano de 2001 apresentaram uma durao mdia de 10 minutos, com desvio-padro de 8,7 minutos. Compare, quanto disperso, as chamadas efectuadas em Dezembro com as que tiveram lugar durante todo o ano de 2001.
Resoluo
a)
Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total
fi/hi 0,1 0,08 0,06 0,04 0,02 0 0 F* 1 0,8 0,6 0,4 0,2 0 0 10 20
n i =1
ni 2000 1500 1000 300 200 5000
fi 0,4 0,3 0,2 0,06 0,04 1

Histograma
hi 5 5 10 10 20
fi/hi 0,08 0,06 0,02 0,006 0,002
Fi 0,4 0,7 0,9 0,96 1
ci 2,5 7,5 15 25 40
10
20
30
40
50
60
30
40
50
60
70
80
90
100
b) x = 1
n i =1
ni c i
f i ci
= (2,5 x 40%) + (7,5 x30%) + ... + (40 x 4%) = 9,35
A durao mdia de uma chamada de 9,35 minutos.
sx =
n i =1
fi * ci x
2
n i =1
fici 2 x = 81,4525
s x = s x = 0,00536875 = 9,025
c) Classe mediana (classe a que corresponde frequncia acumulada 0,5): [5; 10[
Manual de Exerccios
5 : Fi = 0,4 10 : Fi = 0,7 Clculo da Me: 0,7 - 0,4 ------------ 10 - 5 0,5 - 0,4 ------------ Me - 5 Me = 5 + ((5x0,1)/0,3) = 6,67 50% das chamadas tm durao a 6,67 minutos. d) CV Dez =
s x 9,025 = = 0,965 > x 9,35 CV2001 = sy y = 8,7 = 0,87 10
Exerccio 10
Uma empresa coligiu dados relativos produo de 12 lotes de um tipo especial de rolamento. O volume de produo e o custo de produo de cada lote apresentam-se na tabela:
Lote 1 2 3 4 5 6 7 8 9 10 11 12 Volume (unidades) 1500 800 2600 1000 600 2800 1200 900 400 1300 1200 2000 Custo (contos) 3100 1900 4200 2300 1200 4900 2800 2100 1400 2400 2400 3800
a) Analise a correlao existente entre volume e custo de produo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima o custo em funo do volume de produo.
Resoluo
a) r =
s xy s xx s yy
1 [(1500 1358,3)(3100 2708,3) + ... + (2000 1358,3)(3800 2708,3)] = 12 = 0,98 520854x 1145944
Correlao positiva quase perfeita.
Estatstica Aplicada
41
Manual de Exerccios
b)
6000 5000 4000 Custo 3000 2000 1000 0 0 500 1000 1500 Volume 2000 2500 3000 y = 1,4553x + 731,6
Exerccio 11
Um conjunto de empresas do sector da Construo e Obras Pblicas cotadas na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: EPS (Earnings per Share): Resultado Lquido por Aco PBV (Price/Book Value): Preo / Situao Lquida por Aco
Empresa 1 2 3 4 5 6 7 8 9
EPS ($) 191 32 104 117 210 95 65 201 81
PBV ($) 0.9 1.0 0.8 0.8 1.5 0.7 0.9 1.3 0.4
a) Analise a correlao existente entre aqueles dois indicadores.

b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
exprima a varivel EPS em funo de PBV.
Resoluo
a) r =
s xy s xx s yy
1 [(191 121,7)(0,9 0,92) + ... + (81 121,7)(0,4 0,92)] =9 = 0,61 3669,332 x 0,096933
Correlao positiva moderada.
Estatstica Aplicada
42
Manual de Exerccios
b)
250 200 150 100 50 0 0 0,2 0,4 0,6 0,8 PBV 1 1,2 1,4 1,6 y = 124,04x + 7,383
Exerccio 12
Recolheu-se uma amostra em 17 cidades do pas relativamente aos seguintes indicadores: Ri: Rendimento mdio mensal na cidade i (em 106 unidades monetrias) Gi: Gasto mdio mensal em bens de luxo na cidade i (em 106 u.m.)
Ri 125 127 130 131 133 135 140 143 169 Dados adicionais Gi 54 56 57 57 58 58 59 59 66 Ri 144 147 150 152 154 160 162 165 Gi 61 62 62 63 63 64 65 66
EPS
Ri = 2467
Gi = 62620
2
Gi = 1030 Ri Gi = 150270
Ri = 361073
a) Estude a correlao entre rendimento e despesas em bens de luxo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima a varivel Gi em funo de Ri.
Estatstica Aplicada
43
Manual de Exerccios
Resoluo
a)
rXY =
Ri G i n R G ( Ri n R )(
2 2
G nG )
2 i
150270 17 *
2
2467 1030 * 17 17
2467 1030 2 (361073 17 * )(62620 17 * ) 17 2 17 2
= 0,986
Correlao positiva forte. b)

68 66 64 62 Gasto 60 58 56 54 52 50 100 120 140 160 180 200 y = 0,2604x + 22,801
Rendimento
Estatstica Aplicada
44
104
Manual de Exerccios
3. ESTATSTICA INDUTIVA
A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. Claro que o processo de induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. De seguida, sero apresentadas algumas noes simples de probabilidades e funes de probabilidade, que sero teis a aplicaes de estatstica indutiva relacionadas com controlo estatstico de qualidade e fiabilidade de componentes e sistemas.
3.1. Noes bsicas de probabilidade

A teoria das probabilidades um ramo da matemtica extremamente til para o estudo e a investigao das regularidades dos chamados fenmenos aleatrios. O exemplo seguinte pretende clarificar o que vulgarmente designado por experincia aleatria. Deve entender-se como experincia qualquer processo ou conjunto de circunstncias capaz de produzir resultados observveis; quando uma experincia est sujeita influncia de factores casuais e conduz a resultados incertos, diz-se que a experincia aleatria. Fundamentalmente, as experincias aleatrias caracterizam-se por:
Estatstica Aplicada
45
Manual de Exerccios
(i) (ii) (iii)
poder repetir-se um grande nmero de vezes nas mesmas condies ou em condies muito semelhantes cada vez que a experincia se realiza, obtm-se um resultado individual, mas no possvel prever exactamente esse resultado os resultados das experincias individuais mostram-se irregulares, mas os resultados obtidos aps uma longa repetio da experincia patenteiam uma grande regularidade estatstica no seu conjunto
Alguns autores consideram inserido no conceito de experincia aleatria um outro, o de espao de resultados. O espao de resultados corresponde ao conjunto formado por todos os resultados possveis de uma experincia aleatria. Por exemplo, num lanamento de um dado ordinrio tem-se que o espao de resultados { ,2,3,4,5,6}. 1 A importncia da definio deste conceito advm sobretudo por ser o meio empregue para a definio de acontecimentos, que no sei mais que subconjuntos do espao de resultados. Por exemplo, no lanamento de um dado podem definir-se, para alm dos 6 acontecimentos elementares correspondentes sada de cada uma das faces, outros como sada de um nmero mpar definido pelo subconjunto { ,3,5}. 1 Definidos como conjuntos, aos acontecimentos aplicvel toda a construo disponvel para aqueles, isto , existe um paralelismo perfeito entre lgebra de
conjuntos e lgebra de acontecimentos:
(i) (ii) (iii) (iv)
O acontecimento que contem todos os elementos do espao de resultados chama-se acontecimento certo O acontecimento que no contem qualquer elemento do espao de resultados chama-se acontecimento impossvel Dois acontecimentos so mutuamente exclusivos se no tm em comum qualquer acontecimento do espao de resultados A unio de dois acontecimentos A e B representa-se por A B e formado pelos elementos que pertencem a pelo menos um dos dois, A ou B
(v)
A interseco de dois acontecimentos A e B representa-se por A B e formado pelos elementos comuns a A e B
Estatstica Aplicada
46
Manual de Exerccios
Probabilidade de um acontecimento expressa na escala de 0 a 1, sendo 0 a probabilidade associada a um acontecimento impossvel e 1 a probabilidade associada a um acontecimento certo. A primeira definio foi proposta por Laplace em 1812. Pode definir-se probabilidade de um acontecimento A como sendo: P(A) = Nmero de casos favorveis ao acontecimento A Nmero total de casos possveis na exp. aleatria
Uma das principais crticas a esta definio a de que ela s aplicvel quando o espao de resultados finito e os seus elementos possuem igual probabilidade; da que ela surja muito ligada aos jogos de azar, que possuem essas propriedades. o que acontece com as duas faces de uma moeda, as 52 cartas de um baralho, as 6 faces de um dado, etc. Para
se
analisar
probabilidade
de
ocorrncia
de
determinados
acontecimentos, deve ter-se em ateno o seguinte: Dois acontecimentos so ditos mutuamente exclusivos se no puderem acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente exclusivos, ento: P(A B) = 0
A probabilidade de unio de dois acontecimentos mutuamente exclusivos dada por P (A B) = P(A) + P(B)
Para dois acontecimentos quaisquer, vem que P (A B) = P(A) + P(B) - P(A B) Dois acontecimentos dizem-se complementares se: P(A) = 1 P( A ) Dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro; a probabilidade de ocorrncia de dois ou mais acontecimentos independentes o produto das probabilidades dos respectivos acontecimentos, isto : P(A B) = P(A) x P(B)
Estatstica Aplicada
47
Manual de Exerccios
Aps a apresentao desta definio, convm ainda referir que, numa outra perspectiva, a da chamada teoria frequencista, a probabilidade de um acontecimento definida como sendo o valor para o qual tende a frequncia relativa do acontecimento quando o nmero de repeties da experincia aumenta.
3.2. Probabilidade condicionada

Exemplo:
Um grupo de pessoas classificado de acordo com o seu peso e a incidncia de hipertenso. So as seguintes as propores das vrias categorias: Obeso Hipertenso No Hipertenso Total 0,1 0,15 0,25 Normal 0,08 0,45 0,53 Magro 0,02 0,2 0,22 Total 0,2 0,8
1,00
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resoluo
a) Basta ver que a proporo de hipertensos de 20% b) H que tomar em ateno que o que se pretende a proporo de hipertensos na populao de obesos, isto
0,1 = 0,4 . Por outras palavras, 0,25
pretende-se calcular a probabilidade do acontecimento ser hipertenso, sabendo que ocorreu o acontecimento ser obeso. Repare-se que este quociente resulta da diviso entre a probabilidade de uma pessoa ser hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode escrever-se que a probabilidade pretendida dada por:
P( H / O) = P( H O) P (O)
onde P(H/O) a probabilidade de ocorrer o acontecimento ser hipertenso, sabendo que ocorreu ou condicionado pelo acontecimento ser obeso. Este exemplo corresponde ao clculo de uma probabilidade condicionada.
Estatstica Aplicada
48
Manual de Exerccios
Como se viu anteriormente, dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro, isto , se: P(A / B) = P(A) e se P(B / A) = P(B).
Teorema de Bayes
Seja B um acontecimento que se realiza se e s se um dos acontecimentos mutuamente exclusivos A1, A2,An se verifica. Aos acontecimentos A1, A2,An d-se o nome de acontecimentos antecedentes. O teorema de Bayes permite calcular a probabilidade posteriori de A1, A2, An, isto , a probabilidade de ocorrncia de A1, A2, An calculadas sob a hiptese de que B (acontecimento consequente) se realizou. De acordo com este teorema:
P ( Ai / B ) = P ( Ai ).P ( B / Ai )
n i =1
P ( Ai ).P ( B / Ai )
Este Teorema utiliza-se em situaes em que a relao causal est invertida.

n i =1
P ( Ai ).P ( B / Ai )
designa-se de probabilidade total de ocorrncia do
acontecimento B, isto , a probabilidade de ocorrncia do acontecimento consequente B face a todos os possveis acontecimentos A1, A2, An que o podem ter antecedido (ou causado a sua ocorrncia).
3.3. Funes de probabilidade

A probabilidade associada aos acontecimentos possveis numa experincia aleatria obedecem, por vezes, a um padro. Se associarmos a uma experincia aleatria uma varivel X (por exemplo, associar aos resultados da experincia lanamento de um dado - que so 6 (sada de face 1 a 6) a varivel X:N da face resultante do lanamento de um dado), ento pode ser constituda uma lei ou funo de probabilidade (f(x)) dessa varivel X, tal que f(x) = P(X=xi)
Estatstica Aplicada
49
Manual de Exerccios
Por exemplo, para X: n da face resultante do lanamento de um dado, vem que: xi f(xi) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6
que se designa por lei uniforme. Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior nmero de fenmenos estatsticos do que outras. Entre estas, contam-se a lei Binomial, a lei de Poisson e a lei Exponencial.
(i) Lei Binomial
H alguns acontecimentos que so constitudos por um conjunto de experincias independentes, cada uma das quais com apenas dois estados possveis de ocorrncia e com uma probabilidade fixa de ocorrncia para cada um deles. Por exemplo, os produtos resultantes de uma fbrica podem ser classificados como sendo defeituosos ou sendo no defeituosos, e o facto de um ter sado (ou no) defeituoso no influencia os outros serem (ou no). A distribuio das duas classes possveis discreta e do tipo binomial. No exemplo anterior, consideremos uma amostra de n artigos retirados da produo total, em relao aos quais se pretende identificar a varivel X: N de artigos defeituosos nos n que constituem a amostra. A probabilidade de ocorrncia do acontecimento artigo defeituoso dada por p: incidncia de defeituosos na produo (convenientemente calculada atravs de mtodos de estimao). A probabilidade do acontecimento complementar artigo nodefeituoso dada por
1p=q
A probabilidade associada a x artigos defeituosos dada por px (p x p x p x p...x vezes). Se h x defeituosos, restam n-x artigos no-defeituosos, com probabilidade dada por qn-x. Para calcular o nmero exacto de combinaes de x artigos defeituosos com n-x artigos no-defeituosos, utiliza-se a figura combinaes de n, x a x, oriunda das tcnicas de clculo combinatrio. Vem
Estatstica Aplicada
50
Manual de Exerccios
ento que a probabilidade de existncia de x defeituosos (e logo n-x no defeituosos) igual a:

f ( x) = C xn p x q n x = n! p x q n x (n p )! p!
sendo que X segue Bi (n;p), sendo n e p os parmetros caracterizadores da lei. Um acontecimento deve ter 4 caractersticas para que se possa associar a uma lei binomial:
-
nmero fixo de experincias (n) cada experincia ter apenas duas classes de resultados possveis todas as experincias terem igual probabilidade de ocorrncia (p) as experincias serem independentes
Em sistemas elctricos de energia possvel, por exemplo, aplicar a distribuio binomial quando se pretende calcular a fiabilidade de uma central elctrica, com vrias unidades iguais e admitindo que cada unidade apenas pode residir em dois estados, a funcionar ou avariada.
(ii) Lei de Poisson
A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) d a probabilidade de um acontecimento ocorrer um dado nmero de vezes num intervalo de tempo ou espao fixado, quando a taxa de ocorrncia fixa (por exemplo, n de chamadas que chegam a uma central telefnica por minuto; n de varias que ocorrem numa mquina por dia). Os nmeros de acontecimentos de sucesso ocorridos em diferentes intervalos so independentes. O parmetro caracterizador da distribuio de Poisson , que corresponde ao nmero mdio de ocorrncias por unidade de tempo ou espao. Como o nmero mdio de ocorrncias do acontecimento proporcional amplitude do intervalo de tempo ou espao a que se refere, a varivel X: N de ocorrncias do acontecimento no intervalo [0,t[ segue lei de Poisson de parmetro t (isto , se para 1 unidade de tempo o n mdio de ocorrncias
, para t unidades de tempo o nmero mdio de ocorrncias t). A expresso
(t )x e t
x!
Estatstica Aplicada
51
Manual de Exerccios
d a probabilidade de acontecerem x ocorrncias no intervalo de tempo [0,t[, e corresponde expresso da lei de probabilidade de Poisson : Po(t) Por exemplo, se X fr o N de avarias que ocorrem no intervalo de tempo
[0,t[, ento a probabilidade de no ocorrerem avarias nesse intervalo, isto , a
fiabilidade do componente/sistema como funo do tempo, dada por:
(t )0 e t = e t
0!
(iii) Lei Exponencial
Seja T a varivel Tempo ou espao que decorre entre ocorrncias consecutivas de um acontecimento. Ento T segue lei exponencial Exp (), sendo
1
o tempo que, em mdia, decorre entre ocorrncias sucessivas do acontecimento. Note-se que possvel estabelecer uma relao entre a lei exponencial e a lei de Poisson. Assim, se X fr o N de avarias que ocorrem no intervalo de tempo [0,t[, e T fr o Tempo que decorre entre avarias consecutivas, ento:
P (T>t)
= P(tempo que decorre entre avarias exceder t) = P(at ao instante t, no ocorre qualquer avaria) = P (ocorrerem zero avarias no intervalo [0,t[)
= P(X=0) = e
t
A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por
e t
A probabilidade de avariar at ao instante t dada por
1 e t
Estatstica Aplicada
52
Manual de Exerccios
(iv) Lei Normal
A lei Normal tem como parmetros caracterizadores a mdia e o desviopadro . Isto , os valores observados tm uma determinada tendncia central e uma determinada disperso em torno da tendncia central. A expresso
1 e 2 2 1 ( Xi ) 2
representa a funo densidade de probabilidade da distribuio Normal. Se se fizer o valor mdio igual a zero e todos os desvios forem medidos em relao mdia, a equao ser:
Z=
que corresponde a uma distribuio normal estandardizada (0;1) com os valores tabelados, a qual caracterizada por uma curva de Gauss:
Esta distribuio apresenta 99,73% dos valores entre os extremos 3 e 3. Existem muitos tipos de distribuio, mas a curva normal a forma de distribuio mais frequente nos processos industriais para caractersticas mensurveis, e pode considerar-se como estabelecida pela experincia prtica.
Estatstica Aplicada
53
Manual de Exerccios
(v) Lei Qui-Quadrado
Considere-se um conjunto de n variveis aleatrias Zi, obedecendo s seguintes condies:

-
cada varivel Zi segue distribuio N(0,1); as variveis Zi so mutuamente independentes
Ento, a varivel aleatria X, construda a partir da soma das n variveis Zi elevadas ao quadrado, segue distribuio Qui-Quadrado com n graus de liberdade, denotada por
n i =1
X=
2 2 Z i2 = Z12 + Z 2 + ... + Z n
2 X n
O termo Graus de Liberdade (d.f: degrees of freedom) habitualmente usado para designar o nmero n de parcelas (variveis Zi) adicionadas. possvel demonstrar que o valor esperado e a varincia da distribuio de uma varivel Qui-Quadrado so respectivamente
=n
2 = 2n
A distribuio Qui-Quadrado uma distribuio assimtrica esquerda, aproximando-se da distribuio Normal medida que n cresce.
Estatstica Aplicada
54
Manual de Exerccios
Estatstica Aplicada
55
104
Manual de Exerccios
PROBABILIDADES
Exerccio 1
De um baralho ordinrio (52 cartas) extrai-se ao acaso 1 carta. Determine a probabilidade dos seguintes acontecimentos: a) sada de Rei b) sada de copas c) sada de Rei ou copas d) sada de Rei mas no de copas e) no sada de Rei f) no sada de Rei nem de copas g) no sada de Rei ou no sada de copas
Resoluo
A: sada de Rei B: sada de copas a) P(A)=1/13 b) P(B)=1/4 c) P(A B) = P(A) + P(B) - P(A B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) d) P(A-B) = P(A) P(A B) = 1/13 1/52 = 3/52 (= (4-1)/52) e) P( A )= 1-1/13 = 12/13 (=(52-4)/52) f) P( A B ) = P( A B ) = 1 P(A B) = 1 4/13 = 9/13 g) P( A B ) = P( A B ) = 1 P ( A B ) = 1 1/52 = 51/52
Exerccio 2
Um sistema electrnico formado por dois sub-sistemas, A e B. De ensaios anteriores, sabe-se que:
-
a probabilidade de A falhar de 20% a probabilidade de B falhar sozinho 15% a probabilidade de A e B falharem 15%
Determine a probabilidade de:
Estatstica Aplicada
56
Manual de Exerccios
a) B falhar b) falhar apenas A c) falhar A ou B d) no falhar nem A nem B e) A e B no falharem simultaneamente

Resoluo
A: o subsistema A falha B: o subsistema B falha P(A)=20% P(B-A)=15% P(A B)=15% a) P(B) = P(B-A)+ P(A B) = 0,15 + 0,15 = 30% b) P(A-B) = P(A) P(A B) = 0,2 0,15 = 5% c) P(A B) = P(A) + P(B) - P(A B) = 0,2 + 0,3 0,15 = 35% d) P( A B ) = P( A B ) = 1 P(A B) = 1 0,35 = 65% e) P( A B ) = 1 P ( A B ) = 1 0,15 = 85%
Exerccio 3
P( A )= 80%
Suponha que h 3 jornais, A, B e C, com as seguintes percentagens de leitura: A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%; A, B e C: 2,4% Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa: a) ler pelo menos um dos jornais b) ler A e B mas no C c) ler A mas no ler B nem C
Resoluo
A: a pessoa escolhida l o jornal A B: a pessoa escolhida l o jornal B C: a pessoa escolhida l o jornal C P(A) = 9,8% P(A B) = 5,1% P(B) = 22,9% P(A C) = 3,7% P(C) = 12,1% P(B C) = 6%
P(A B C) = 2,4%
Manual de Exerccios
a)
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%
b) P( A B C ) = P( A B ) P ( A B C ) = 0,051 0,024 = 2,7% c) P ( A B C ) = P(A) - P ( A B ) P ( A C ) + P ( A B C ) = 0,098-0,051-0,037+0,024 = 3,4%

Exerccio 4
Um gerente de uma galeria de arte muito creditada no mercado, est interessado em comprar um quadro de um pintor famoso para posterior venda. O gerente sabe que h muitas falsificaes deste pintor no mercado e que algumas dessa falsificaes so bastante perfeitas o que torna difcil avaliar se o quadro que ele pretende comprar ou no um original. De facto, sabe-se que h 4 quadros falsos desse pintor para 1 verdadeiro. O gerente no quer comprometer o bom nome da galeria para a qual trabalha comprando um quadro falso. Para obter mais informao o gerente resolve levar o quadro a um museu de arte e pede para que o especialista do museu o examine. Este especialista garante-lhe que em 90% dos casos em que lhe pedido para examinar um quadro genuno daquele pintor, ele identifica-o correctamente como sendo genuno. Mas em 15% dos casos em que examina uma falsificao do mesmo pintor, ele identifica-o (erradamente) como sendo genuno. Depois de examinar o quadro que o gerente lhe levou, o especialista diz que acha que o quadro uma falsificao. Qual agora a probabilidade de o quadro ser realmente uma falsificao?
Resoluo
V: o quadro genuno F: o quadro falso I: o quadro identificado correctamente P(V) = 20% P(F) = 80% P(I/V) = 90% P( I / F ) = 15%
Estatstica Aplicada
P( I / V ) = 10% P(I/F) = 85%

58
Manual de Exerccios
P(ser realmente falsificao/especialista identificou como falsificao) = =

P( F ) * P( I / F ) 0,8 * 0,85 0,68 = = = 97,1% P ( F ) * P ( I / F ) + P (V ) * P ( I / V ) 0,8 * 0,85 + 0,2 * 0,1 0,7
Exerccio 5
Na ida para o emprego, o Sr. scar, polcia de profisso, tem de passar obrigatoriamente por trs cruzamentos com semforos. No primeiro cruzamento, o do Largo Azul, a probabilidade do semforo se encontrar com sinal vermelho de 10%. Em cada um dos cruzamentos seguintes, o Sr. scar fica parado devido aos sinais vermelhos em metade das vezes que l passa. O Sr. scar j descobriu que os semforos funcionam separadamente, no estando ligados entre si por qualquer mecanismo. Embora goste de cumprir a lei, o guarda scar passa no sinal verde e acelera no amarelo, s parando mesmo no sinal vermelho. a) Qual a probabilidade do Sr. scar chegar ao emprego sem ter de parar em qualquer sinal vermelho? b) Qual a probabilidade do Sr. scar ter de parar num s semforo? c) Qual a probabilidade do Sr. scar ter parado no sinal vermelho do cruzamento do Largo Azul, sabendo que parou num s semforo na sua ida para o emprego?
Resoluo
A: polcia encontra sinal vermelho no 1 cruzamento B: polcia encontra sinal vermelho no 2 cruzamento C: polcia encontra sinal vermelho no 3 cruzamento P(A)=10% P(B)=50% P(C)=50% P( A )= 90% P( B )= 50% P( C )= 50%
a) P( A B C ) = P( A )*P( B )*P( C ) = 0,9*0,5*0,5 = 22,5% b) P( A B C ) + P( A B C ) +P( A B C ) = = P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) = 47,5%
Estatstica Aplicada
59
Manual de Exerccios
c) P(polcia parar no 1 cruzamento / polcia parou num s semforo)

=
P ( A B C ) P ( A) * P ( B ) * P (C ) = = 5,26% 0,475 0,475
Exerccio 6
Aps alguns testes efectuados personalidade de um indivduo, concluiu-se que este louco com probabilidade 60%, ladro com probabilidade igual a 70% e no louco nem ladro com probabilidade 25%. Determine a probabilidade do indivduo: a) Ser louco e ladro b) Ser apenas louco ou apenas ladro c) Ser ladro, sabendo-se que no louco
Resoluo
A: indivduo louco B: indivduo ladro P(A)=60% P(B)=70% P( A B ) = 25% = P( A B ) P(A B) = 1 0,25 = 75% 0,75 = 0,6 + 0,7 - P(A B)
a) P(A B) = P(A) + P(B) - P(A B) P(A B) = 0,6 + 0,7 0,75 = 55%
b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20 c) P(B/ A ) =

P ( B A) P ( B A) 0,15 = = = 37,5% 1 0,6 0,4 P ( A)
Exerccio 7
Uma moeda viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem faces, ento um nmero seleccionado de 1 a 9. Se parecem coroas, um nmero seleccionado entre 1 e 5. Determine a probabilidade de ser seleccionado um nmero par.
Resoluo
P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%
Estatstica Aplicada
60
Manual de Exerccios
Exerccio 8
Numa fbrica, 3 mquinas, M1, M2 e M3 fabricam parafusos, sendo a produo diria total de 10000 unidades. A probabilidade de um parafuso escolhido ao acaso ter sido produzido por M1 30% da probabilidade de ter sido produzido por M2. A incidncia de defeituosos na produo de cada mquina : M1: 3% M2: 1% M3: 2% Extrai-se ao acaso da produo diria um parafuso. Sabendo que a probabilidade dele ser defeituoso de 1,65%, determine o nmero de parafusos que cada mquina produz diariamente.
Resoluo
M1: o parafuso foi produzido por M1 M2: o parafuso foi produzido por M2 M3: o parafuso foi produzido por M3 D: o parafuso defeituoso n = 10000 unidades P(M1) = 0,3 P(M2) P(D / M1) = 3% P(D / M2) = 1% P(D / M3) = 2% P(D) = 1,65% Prod. 1 = P(M1)*10000 = ? Prod. 2 = P(M2)*10000 = ? Prod. 3 = P(M3)*10000 = ?
P( M 1) = 0,3P( M 2) P( M 1) + P ( M 2) + P( M 3) = 1 P( D) = P( M 1) * P( D / M 1) + P( M 2) * P ( D / M 2) + P( M 3) * P( D / M 3) 1,3P( M 2) + P( M 3) = 1 0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + P( M 3) * 0,02
Estatstica Aplicada
61
Manual de Exerccios
P( M 3) = 1 1,3P( M 2) 0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + (1 1,3P( M 2)) * 0,02
P( M 1) = 0,3 * 0,5 = 15% P( M 3) = 1 1,3P( M 2) = 1 1,3 * 0,5 = 35% P( M 2) = 50%
Exerccio 9
O Joo tem sua disposio 3 meios de transporte diferentes para se deslocar de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
-
chegar atrasado escola 60% chegar atrasado utilizando o transporte A 80% chegar atrasado utilizando o transporte B 50% chegar atrasado utilizando o transporte C 60% utilizar os transportes B e C a mesma
a) Calcule a probabilidade de o Joo utilizar o transporte A b) Sabendo que o Joo chegou atrasado escola, calcule a probabilidade de ter utilizado os transportes B ou C.
Resoluo
T: O Joo chega atrasado A: o Joo utiliza o transporte A B: o Joo utiliza o transporte B C: o Joo utiliza o transporte C P(T) = 0,6 P(T/A) = 0,8 P(T/B) = 0,5 P(T/C) = 0,6 P(B) = P(C) P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)
a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)
Estatstica Aplicada
62
Manual de Exerccios
Logo 0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6 e vem que P(B) = 40% Ento P(A) = 1 2P(B) = 1 2*0,4 = 20% b) P(B C / T) =
P ( B ) * P (T / B ) + P (C ) * P (T / C ) 0,4 * 0,5 + 0,4 * 0,6 = =73,3% P (T ) 0,6
Exerccio 10
Uma empresa que se dedica prestao de servios de seleco de pessoal em relao a um teste psicotcnico para uma profisso especfica sabe o seguinte:
-
as percentagens de indivduos com um quociente de inteligncia (Q.I.) elevado e mdio so, respectivamente, de 30% e de 60% a percentagem de indivduos com Q.I. mdio que ficam aptos no teste de 50% a probabilidade de um indivduo com Q.I. baixo ficar apto no teste de 20% finalmente, sabe-se que 70% dos indivduos com Q.I. elevado ficam aptos no teste
a) Qual a probabilidade de um indivduo escolhido ao acaso ficar apto no teste? b) Qual a probabilidade de um indivduo ter Q.I. baixo, sabendo-se que ficou inapto?
Resoluo
A: indivduo fica apto no teste E: indivduo tem QI elevado M: indivduo tem QI mdio B: indivduo tem QI baixo P(E) = 30% P(M) = 60% P(A/M) = 50% P(B) = 1 0,3 0,6 = 10% P(A/E) = 70% P(A/B) = 20%
Estatstica Aplicada
63
Manual de Exerccios
a) P(A) =P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B) =0,3*0,7+0,6*0,5+0,1*0,2=53% b) P(B/ A ) =

P( B ) * P ( A / B) 0,1 * 0,8 = = 17% 1 0,53 P ( A)
Exerccio 11
Os resultados de um inqurito aos agregados familiares de uma determinada cidade forneceram os seguintes dados:
-
35% dos agregados possuem telefone 50% dos agregados possuem frigorfico 25% dos agregados possuem automvel 15% dos agregados possuem telefone e frigorfico 20% dos agregados possuem telefone e automvel 10% dos agregados possuem frigorfico e automvel 5% dos agregados possuem telefone, automvel e frigorfico
a) Calcule a probabilidade de um agregado familiar 1. possuir telefone ou frigorfico 2. no possuir nem telefone nem automvel b) Calcule a probabilidade de um agregado que possui automvel 1. possuir tambm frigorfico 2. possuir tambm telefone ou frigorfico c) Calcule a probabilidade de um agregado familiar 1. possuir pelo menos um daqueles trs objectos 2. no possuir nenhum daqueles trs objectos
Resoluo
A: agregado familiar possui telefone B: agregado familiar possui frigorfico C: agregado familiar possui automvel P(A) = 35% P(B) = 50% P(C) = 25%
Manual de Exerccios
P(A B) = 15% P(A C) = 20% P(B C) = 10% P(A B C) = 5% a) 1. P(A B) = P(A) + P(B) - P(A B) = 0,35 + 0,5 0,15 = 70% 2. P( A C ) = P( A C ) = 1 P(A C) = 1 0,4 = 60% P(A C) = P(A) + P(C) - P(A C) = 0,35 + 0,25 0,2 = 40% b) krysktsh1. P(B / C) = 2. P(A B/ C) =
P ( A C ) + P ( B C ) P ( A B C ) 0,2 + 0,1 0.05 = = 100% P (C ) 0,25 P( B C ) 0,1 = = 40% P (C ) 0,25
c) 1.
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%
2. 1 P( A B C ) = 1 0,7 = 30%
Exerccio 12
Admita que 60% dos seguros no ramo automvel respeitam a condutores com mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tm um ou mais acidentes no mesmo perodo. a) Qual a probabilidade de um segurado no sofrer qualquer acidente durante um ano? b) Qual a probabilidade de um segurado que sofreu pelo menos um acidente ter idade igual ou inferior a 40 anos? c) Qual a probabilidade de, numa amostra de trs segurados 1. todos terem idade igual ou inferior a 40 anos? 2. nenhum ter sofrido qualquer acidente durante um ano? 3. Todos terem idade igual ou inferior a 40 anos, dado que cada um sofreu, pelo menos, um acidente durante o referido perodo?
Estatstica Aplicada
65
Manual de Exerccios
Resoluo
I1: o segurado tem mais de 40 anos de idade I2: o segurado tem 40 anos ou menos de idade A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado no sofre nenhum acidente por ano
P(I1) = 60% P(A/I1) = 5% P(A/I2) = 3%
P(I2) = 1 0,6 = 40% P( A /I1) = 1 0,05 = 95% P( A /I2) = 1 0,03 = 97%
a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8% b) P(I2/A) =

P ( A I 2) P ( I 2) * P ( A / I 2) 0,6 * 0,03 = = = 28,57% = P(B) 1 0,958 P ( A) P ( A)
c) 1. P( I 2 I 2 I 2) = 0,4*0,4*0,4 = 6,4% 2. P( A A A) = 0,958*0,958*0,958 = 87,9% 3. P( B B B ) = 0,2857*0,2857*0,2857 = 2,3%
Estatstica Aplicada
66
104
Manual de Exerccios
FUNES DE PROBABILIDADE
Exerccio 1
Se 20% das bobinas de um determinado cabo elctrico forem defeituosas, calcule a probabilidade de, entre as 4 bobines necessrias a um determinado cliente, escolhidas ao acaso uma ser defeituosa.
Resoluo
X: nmero de bobines defeituosas no conjunto de 4 bobines necessrias a um determinado cliente (0,1,2,3,4) n=4 p=0,2 q=1-p=0,8 P(X=1)=C4p1q4-1 = 4*0,2*0,83 = 0,4096 = 41%
Exerccio 2
O nmero mdio de chamadas telefnicas a uma central, por minuto, 5. A central s pode atender um nmero mximo de 8 chamadas por minuto. Qual a probabilidade de no serem atendidas todas as chamadas no intervalo de tempo de 1 minuto?
Resoluo
X: nmero de chamadas telefnicas atendidas numa central, por minuto (0,1,2,3,4, 5, 6, 7, 8)

=5
8
p=0,2
q=1-p=0,8 Logo P(X>8) = 1-0,932 = 0,06
e 5 5 x P(X 8) = = 0,932 x! x =0
Exerccio 3
O tempo de funcionamento sem avarias de uma determinada mquina de produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
Estatstica Aplicada
67
Manual de Exerccios
Resoluo
Seja
T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de uma mquina, e X: numero de avarias que ocorrem no intervalo [0,6[, isto , num perodo de 6h
=1/4,5 corresponde ao nmero de avarias por unidade de tempo (por hora)
Logo
P(T 6) = P(X=0)= e
1 *6 4,5
= e 1,333 = 0,264
Exerccio 4
Considere que o comprimento mdio de determinado fio condutor 120, com desvio padro 0,5. Qual a percentagem de fio com comprimento superior a 121?
Resoluo
X: comprimento de determinado fio condutor Calculando a varivel reduzida correspondente, vem:

121 120 =2 0,5 Consultando a tabela, verifica-se que o valor da funo Z P(X 2) = 0,9772.
Z=
Logo P(X>2) = 1-0,9772 = 2,28%.
Exerccio 5
Numa praia do litoral portugus existe um servio de aluguer de barcos, destinado aos turistas que a frequentam. O nmero de turistas que procuram este servio, por hora, est associado a uma varivel aleatria com distribuio de Poisson. Verificou-se que, em mdia, em cada hora, esse servio procurado por 8 turistas interessados em alugar barcos; sabe-se, por outro lado, que esse servio funciona ininterruptamente das 8 s 20 horas. a) b) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5 barcos? Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos sejam procurados por mais de 25 turistas?
Estatstica Aplicada
68
Manual de Exerccios
Resoluo
X: n de turistas que procuram o servio de aluguer de barcos por hora X segue Po(=8) a) Na tabela da Po(=8) vem P(X=5) = 9,16% b) Y1: n de turistas que procuram o servio de aluguer na 1 hora Y2: n de de turistas que procuram o servio de aluguer na 2 hora Logo Y1+Y2: n de turistas que procuram o servio de aluguer em 2 horas Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2 independentes e que todas seguem Po(8), vem que: Z=Y1+Y2 segue Po(2*8=16) Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%
Exerccio 6
O nmero de navios petroleiros que chegam diariamente a certa refinaria uma varivel com distribuio de Poisson de parmetro 2. Nas actuais condies, o cais da refinaria pode atender, no mximo, 3 petroleiros por dia. Atingido este nmero, os restantes que eventualmente apaream devero seguir para outro porto. a) Qual a probabilidade de, num qualquer dia, ser preciso mandar petroleiros para outro porto? b) De quanto deveriam ser aumentadas as instalaes de forma a assegurar cais a todos os petroleiros em 99,9% dos dias? c) Qual o nmero esperado de petroleiros a chegarem por dia? d) Qual o nmero mais provvel de petroleiros a chegarem por dia? e) Qual o nmero esperado de petroleiros a serem atendidos diariamente? f) Qual o nmero esperado de petroleiros que recorrero a outros portos diariamente?
Resoluo
X: n de petroleiros que chegam diariamente a uma certa refinaria X segue Po (2) Capacidade mxima de atendimento da refinaria: 3 petroleiros/dia
Estatstica Aplicada
69
Manual de Exerccios
a) P(X>3) = 1 P(X 3) = 1 F(3) = 1 0,8571 =14,29% (tab. pg.14) b) N mximo de petroleiros que podem chegar: 9 (informao da tabela) Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3) c) E(X) = 2 d) X = 1 ou X = 2, com probabilidade 27,07% e) Y: n de petroleiros que so atendidos diariamente numa certa refinaria (0,1, 2, 3) g(0) = P(X=0) = 0,1353 g(1) = P(X=1) = 0,2707 g(2) = P(X=2) = 0,2707 g(3) = P(X=3) = 1 P(X<3) = 1 P(X 2) = 1 0,6767 = 0,3233 E(Y) = 0*0,1353 + + 3*0,3233 = 1,782 So atendidos, em mdia, entre 1 e 2 petroleiros diariamente f) Z: n de petroleiros que recorrem diariamente a outros portos (0,1, 2, 3, 4, 5, 6) Logo, Z = X - Y E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218 Recorrem a outros portos, em mdia, entre 0 e 1 petroleiro por dia g) W: n de dias em que preciso mandar petroleiros para outro porto num ms de 30 dias (0,1, 2,...30) W segue Bi (n = 30; p = P(X>3) = 0,1429) E(W) = 30*0,1429 = 4,3 Em mdia, preciso enviar petroleiros para outro porto 4 a 5 dias/ms
Exerccio 7
Os Servios Municipalizados de Gs e Electricidade debitam mensalemnte aos seus clientes um consumo terico T de energia elctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30,85%. Suponha um cliente cujo consumo por ms segue lei normal de mdia 400 kwh e desvio-padro 40 kwh. a) Qual o consumo terico que lhe mensalmente debitado? b) 1. Qual a distribuio do consumo efectivo durante 3 meses?
Estatstica Aplicada
70
Manual de Exerccios
2. Qual a probabilidade de que, ao fim de 3 meses, o consumo terico exceda o efectivo em mais de 100 kwh?
Resoluo
X: consumo efectivo de energia elctrica de um cliente por ms (em kwh) T: consumo terico (valor fixo) debitado ao cliente por ms (em kwh) T: P(X>T) = 0,3085 X segue N(400; 1600) a) P(X>T) = 0,3085 P( P(N(0,1) b) 1. X1: consumo efectivo de energia elctrica de um cliente no 1 ms (em kwh) X2: consumo efectivo de energia elctrica de um cliente no 2 ms (em kwh) X3: consumo efectivo de energia elctrica de um cliente no 3 ms (em kwh) Logo X1+X2+X3: consumo efectivo de energia elctrica em 3 meses (em kwh) Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3 independentes e que todas seguem N(400, 1600), vem que: Y=X1+X2+X3 segue N(400*3; 1600*3), isto , N(1200; 4800) 2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< = P(N(0,1)<-0,58) = 28,1%
1160 1200 )= 4800
X 400 T 400 > ) = 0,3085 40 40
T 400 T 400 ) = 0,6915 = 0,5 T = 420 40 40
Exerccio 8
Num determinado processo de fabrico, existem 2 cadeias de montagem A e B, com funcionamento independente. A cadeia A opera a um ritmo mdio de 2 montagens por hora, e a probabilidade da cadeia B efectuar pelo menos uma montagem numa hora de 98,71%. Admitindo que o nmero de montagens efectuadas por hora em ambas as cadeias uma v.a. Poisson, determine: a) a probabilidade de se efectuarem mais de 6 montagens numa hora com a cadeia B
Estatstica Aplicada
71
Manual de Exerccios
b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mximo 10 montagens com a cadeia B c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de montagens de B d) o nmero mdio de montagens efectuadas num dia de trabalho de 8 horas com ambas as cadeiras
Resoluo
X: n de montagens da cadeia A por hora Y: n de montagens da cadeia B por hora
X segue Po(2)
a) Y segue Poisson, mas desconhece-se a mdia (=parmetro ) No entanto, como se sabe que P(Y 1) = 0,9817, vem que P(Y<1) = 1 0,9817 = 0,0183 Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a coluna 4. Logo, = 4. Na tabela da Po(4), P(Y>6) = 1P(Y 6) = 1F(6) = 1-0,8893=11,07% b) Y1: n de montagens da cadeia B na 1 hora Y2: n de montagens da cadeia B na 2 hora Y3: n de montagens da cadeia B na 3 hora Logo Y1+Y2+Y3: n de montagens da cadeia B em 3 horas Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3 independentes e que todas seguem Po(4), vem que: Z=Y1+Y2+Y3 segue Po(4*3=12) P(Z 10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + + 0,1048 = 34,72% c) P(X=2Y) = P(X=0 Y=0) + P(X=2 Y=1) + P(X=4 Y=2) + P(X=6 Y=3) + P(X=8 Y=4) = 0,1353*0,0183 + 0,2707*0,0753 + 0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8% d) W: n de montagens das 2 cadeias num dia de trabalho de 8 horas W=
8 i =1
( X i + Yi )
onde Xi + Yi corresponde ao n de montagens das 2 cadeias por hora

Manual de Exerccios
Pelo Teorema da Aditividade de Poisson, sendo as variveis independentes e seguindo Po(2) e Po(4) respectivamente, vem que Xi + Yi segue tambm Po(2+4=6). E Z , tambm pelo mesmo Teorema, segue Po(6*8=48) Logo, o nmero mdio de montagens efectuado pelas 2 cadeias num dia de trabalho de 8 horas de 48.
Exerccio 9
Uma companhia de tabacos recebeu em dada altura um elevado nmero de queixas quanto qualidade dos cigarros de certa marca que comercializa. Numa rpida anlise s condies de produo, constata-se que 1% dos filtros que compem o cigarro saem defeituosos. Nestas condies, determine: a) a probabilidade de um mao acabado de formar 1. conter 1 cigarro com filtro defeituoso 2. conter 0 cigarros com filtro defeituoso b) o nmero de maos que, num volume que contm 20, a companhia espera poder aproveitar se utilizar o critrio: 1. mao aproveitvel se no contiver cigarros defeituosos 2. mao aproveitvel se contiver no mximo 1 cigarro defeituoso
Resoluo
X: n de cigarros com filtro defeituoso em 20 cigarros de um mao X segue Bi(n=20; p=0,01) a) 1. P(X=1) = 20*0,01*0,9919 = 16,52% 2. P(X=0) = 0,010*0,9920 = 81,79% b) 1. Crit. 1: mao aproveitvel se no contiver cigarros defeituosos Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0) = 0,8179) Logo E(Y) = 20*0,8179 = 16,36 2. Crit. 2: mao aproveitvel se contiver no mximo 1 cigarro defeituoso Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831) Logo E(Y) = 20*0,9831 = 19,66
Estatstica Aplicada
73
Manual de Exerccios
Exerccio 10
O comprimento das peas produzidas por uma mquina uma v.a. Normal com mdia e varincia 2. Uma pea defeituosa se o seu comprimento diferir do valor mdio mais do que . Sabemos que 50% das peas produzidas tm comprimento inferior a 0,25 mm e 47,5% tm comprimento entre 0,25 mm e 0,642 mm. a) Calcule a mdia e o desvio-padro do comprimento das peas. b) Determine a probabilidade de uma pea no ser defeituosa.
Resoluo
X: comprimento das peas produzidas por uma mquina X segue N(; 2) Pea defeituosa se X> + ou se X< - P(X<0,25) = 50% P(0,25<X<0,642) = 47,5% a) Como P(X<0,25) = 50% vem que P(
X
<
0,25
0,25
) = 50%
Na tabela, E como
tem que ser =0, logo = 0,25
P(0,25<X<0,642) = 47,5% vem que

P(
0,25 0,25
0,392
<
X 0,25
<
0,642 0,25
) = P (0 < N (0,1) <
0,392
)=
=(
) (0) = 0,475 0,392 ) = 0,475 + 0,5 = 0,975 0,392

= 1,96 e logo = 0,2
Sendo (0)=0,5, vem que (
Na tabela 3B da Normal, vem que
b) P(pea no defeituosa) = P( - < X < + ) = P(0,05 < X < 0,45) = P(X<0,45) P(X<0,05) =
0,45 0,25 0,05 0,25 ) ( ) = (1) (1) = D (1) = 84,13% 0,2 0,2
74
Estatstica Aplicada
Manual de Exerccios
Exerccio 11
Sabe-se que a probabilidade de cura de uma certa doena 20%. Pe-se prova um novo medicamento, que eleva a probabilidade de cura para 40%, ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20. Calcule a probabilidade de se concluir pela ineficcia do medicamento, ainda que este eleve de facto a probabilidade de cura para 40%.
Resoluo
X: nmero de doentes curados no grupo de 20 a que ministrado o novo medicamento (0,1,2...19, 20) n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4)
P(X 8)=1- F(7) = 41,58%
Exerccio 12
Sabe-se por via experimental que, por cada perodo de 5 minutos, chegam, em mdia, 4 veculos a determinado posto abastecedor de combustveis. Um empregado entra ao servio s 8 horas. Qual a probabilidade de ter de aguardar mais de 10 minutos at chegada de um veculo?
Resoluo
X: n de veculos que chegam ao posto abastecedor por perodo de 5 minutos X segue Po(4) Se X1: n de veculos que chegam ao posto no 1 perodo de 5 minutos X2: n de veculos que chegam ao posto no 2 perodo de 5 minutos ento X1+X2: n de veculos que chegam ao posto abastecedor em 10 minutos Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes e que ambas seguem Po(4), vem que X1+X2 tambm segue Po(4+4=8) Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.
Estatstica Aplicada
75
Manual de Exerccios
3.4. Estimao por intervalos

Conhecendo-se uma amostra em concreto, possvel estimar os valores dos seus parmetros caracterizadores atravs de mtodos probabilsticos. Por exemplo, suponhamos que numa fbrica produtora de acar se pretende averiguar se o peso dos pacotes produzidos est, em mdia, dentro das normas de qualidade exigveis. Na impossibilidade de medio do peso de todos os pacotes, pela morosidade e dispndio de recursos que tal implicaria, a estatstica permite que, a partir da observao de uma nica amostra, seja possvel inferir entre que valores varia o peso mdio com um grau de confiana ou probabilidade elevado. Assim, ao recolher um determinado nmero de pacotes da produo total aleatoriamente, possvel calcular o peso mdio de acordo com as tcnicas de estatstica descritiva apreendidas atrs. Claro que nada nos garante que esse valor coincide com o valor do parmetro da populao em estudo. De facto, at provvel que no coincida e, mais, se recolhermos outro conjunto idntico de pacotes, o valor seja diferente. Isto , para cada amostra de dimenso n recolhida, a estimativa do parmetro assumiria valores distintos. Ento, como retirar concluses? Como garantir algum nvel de rigor? O mtodo a estudar neste captulo a estimao por intervalos permite, a partir da recolha de uma nica amostra, aferir entre que valores seria de esperar que variasse o parmetro de interesse se nos empenhssemos a recolher um nmero infinito de amostras. Isto , por exemplo, caso o valor amostral fosse de 1,02 kg, este mtodo poderia, por exemplo, permitir afirmar que seria altamente provvel que o peso dos pacotes produzidos estivesse a variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nvel de confiana associado: por exemplo, se dissermos que o nvel de confiana ou certeza implicado de 95%, tal significa que, se nos fosse possvel observar um nmero infinito de amostras, o intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais usualmente utilizados so 90%, 95% ou 99% de confiana). Caberia depois empresa julgar se esses seriam ou no valores aceitveis e proceder aos eventuais reajustes necessrios.
Manual de Exerccios
A partir do conceito de intervalo de confiana para um parmetro, fcil concluir que a sua especificao implica conhecer: o estimador do parmetro em causa a sua distribuio de probabilidade uma estimativa particular daquele parmetro
Como parmetros de interesse e para efeitos de exemplificao, vo considerar-se duas tipologias de intervalo: o intervalo de confiana para a mdia de uma populao normal e o intervalo de confiana para a proporo de uma populao binomial. Para efeitos de simplificao, vo considerar-se apenas exemplos relativos a amostras de grande dimenso (na prtica, n 100)
(i) Intervalo de confiana para a mdia de uma populao normal
Seja X (mdia amostral) o estimador da mdia da populao. Porque a distribuio Normal, a distribuio deste estimador ser:
X N ( ;
Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z= X
N (0;1)
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a mdia de uma populao normal:
X c
;X +c
Isto , em torno do valor do estimador, definido um intervalo de variao onde possvel afirmar que o parmetro a estimar est contido com um grau de confiana . Esse intervalo de variao depende:
-
da dimenso da amostra (n): quanto maior a dimenso da amostra, menor a amplitude do intervalo. Este resultado explica-se facilmente: no limite, se fosse possvel observar todo o universo de dados (n= ), o valor amostral calculado corresponderia ao valor da populao.
Estatstica Aplicada
77
Manual de Exerccios
do desvio - padro da populao ( ): quanto maior o desvio - padro, maior a amplitude do intervalo. Como se sabe, o desvio - padro uma medida que caracteriza a disperso da distribuio. Quanto maior o seu valor, maior a variabilidade apresentada pelos dados, sendo natural que a margem de variao de prever em torno do valor amostral recolhido seja tambm, naturalmente, maior.
do valor crtico (c): quanto maior o valor c, maior a amplitude do intervalo. O valor crtico reflecte o nvel de confiana adoptado. Naturalmente, para que aumente a confiana de que o valor do parmetro a estimar est contido no intervalo, a sua amplitude deve aumentar tambm (no limite, se o intervalo se alongasse de - a + a confiana seria total ou 100%). possvel encontrar o valor c na tabela da normal (pois esta a lei do estimador), da seguinte forma:
P ( c Z c ) =
j que assim possvel definir a frmula geral do intervalo, resolvendo a inequao em ordem ao parmetro, :
P (c X
c) = P( X c
X c
)=
Se o desvio - padro da populao fr desconhecido, utiliza-se este intervalo considerando-se como estimativa de o desvio - padro corrigido da amostra, ou seja, s=
( xi x ) 2
n 1
, tal que:
X c
s' n
;X +c
s' n
(ii) Intervalo de confiana para a proporo p de uma populao binomial

Seja p (proporo amostral ou frequncia observada na amostra) o estimador
da proporo p de uma populao binomial. Sendo a amostra de grande dimenso, a distribuio deste estimador ser:
p N ( p;
p(1 p ) ) n
Estatstica Aplicada
78
Manual de Exerccios
Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z=
p p
p (1 p ) n
N (0;1)
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a proporo p de uma populao binomial:
pc p (1 p ) p (1 p ) ;p+c n n
(como estimativa de p (1 p ) foi utilizado p (1 p ))
Como bvio, pretende-se que o resultado possua o mximo de confiana possvel. No entanto, se uma maior confiana pretendida na estimao, esta conduz a possibilidades de erro maiores, dado que um elevado nvel de confiana conduz a um intervalo maior e, como tal, a preciso da estimao diminui.
Exemplo: Consideremos 3 afirmaes de alunos que aguardam a sada das pautas de
um exame de Estatstica: Afirm. 1: Tenho a sensao que as pautas sero afixadas durante a manh Afirm. 2: Tenho quase a certeza que as pautas sero afixadas entre as 10h e as 11h Afirm. 3: Tenho a certeza absoluta que as pautas ou so afixadas s 10h30 ou j no so afixadas hoje Estas 3 afirmaes permitem constatar facilmente que se se pretende maior confiana na estatstica, se tem que permitir que a possibilidade de erro aumente. Por outro lado, se se permitir que o erro diminua, os extremos do intervalo aumentam, embora o resultado perca alguma preciso. No entanto, h que ter em ateno que, se um intervalo de confiana tem uma amplitude demasiado grande, a estimativa no tem utilidade. Cabe ao investigador gerir este trade-off.
Estatstica Aplicada
79
Manual de Exerccios
Isto leva a uma questo importante: o dimensionamento de amostras. At aqui, sempre se assumiu que as dimenses so conhecidas partida, sem referir como se determinam. No entanto, a resoluo deste problema tem um enorme interesse prtico, j que (i) recolher e tratar uma amostra demasiado grande para os resultados que se pretendem obter constitui um evidente desperdcio de recursos e (ii) recolher uma amostra cuja dimenso insuficiente para retirar concluses constitui um erro. A dimenso das amostras aumentar se se pretender garantir maior preciso ao intervalo e/ou maior grau de confiana. No captulo dedicado a aplicaes estatsticas, ser possvel ver como possvel utilizar o conceito de intervalo de confiana ao controlo estatstico de processos de qualidade.
Estatstica Aplicada
80
Manual de Exerccios
INTERVALOS DE CONFIANA
Exerccios
Exerccio 1
Suponha-se que se tem uma populao normal com mdia desconhecida e desvio - padro 3, N (, 9) e uma amostra de 121 observaes. Deduza um intervalo de confiana para a com 95% de confiana.
Resoluo
Para os dados deste exerccio, vem:
n=121
=3
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo
X c
;X +c
= X
1,96 x3 1,96 x3 ;X = X 0,535; X + 0,535 11 11
O intervalo X 0,535; X + 0,535 contm o verdadeiro valor do parmetro com probabilidade ou confiana de 95%. Conhecida uma estimativa particular daquele parmetro, torna-se possvel calcular entre que valores seria de esperar que, com 95% de confiana, variasse .
Exerccio 2
Numa cidade pretende-se saber qual a proporo da populao favorvel a certa modificao de trnsito. Faz-se um inqurito a 100 pessoas, e 70 declaram-se favorveis. Determine um intervalo de confiana a 95% para a proporo de habitantes dessa cidade favorveis modificao de trnsito.
Resoluo
n=100
p=
70 = 0,7 100
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo
Estatstica Aplicada
81
Manual de Exerccios
pc
= [0,6102;0,7898]
p (1 p ) p (1 p ) 0,7 x0,3 0,7 x0,3 ;p+c = 0,7 1,96 ;0,7 1,96 = n n 100 100
O intervalo [0,6102;0,7898] contm o verdadeiro valor do parmetro p com probabilidade ou confiana de 95%. Ou seja, a proporo de habitantes favorveis modificao de trnsito est situada entre 61,02% e 78,98%, com probabilidade de 95%.
Exerccio 3
Uma mquina fabrica cabos cuja resistncia ruptura (em kg/cm2) uma varivel com distribuio Normal de mdia 100 e desvio - padro 30. Pretendese testar uma nova mquina que, segundo indicaes do fabricante, produz cabos com resistncia mdia superior. Para isso, observam-se 100 cabos fabricados pela nova mquina, que apresentam uma resistncia mdia de 110 kg/cm2. Admita que o novo processo no altera o desvio padro da resistncia ruptura dos cabos. a) Determine um intervalo de confiana a 95% para a resistncia mdia ruptura dos cabos produzidos pela nova mquina. b) Suponha que pretendamos obter um intervalo de confiana com a mesma amplitude do anterior, mas com nvel de confiana de 99%. Quantos cabos deveriam ser observados?
Resoluo
a) X segue N(100; 302) n=100 e logo

X c
x =110
=30
=95%
c: P (c Z c) = 95% D (c) = 95% c = 1,96
;X +c
= 110
1,96 x30 1,96 x30 ;110 = [104,12;115,88] 10 10
Estima-se, com 95% de confiana, que a resistncia mdia ruptura dos cabos produzidos pela nova mquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.
Estatstica Aplicada
82
Manual de Exerccios
b) Amplitude = 115,88 104,12 = 11,76 Amplitude = Lim.Sup. - Lim.Inf. = ( X + c Logo 2c
) -( X c
) = 2c
=11,76 n Sendo que x =110 =30 c: P (c Z c) = 99% D (c) = 99% c = 2,576 vem que n = 173 cabos
Exerccio 4
Uma amostra de 20 cigarros analisada para determinar o contedo de nicotina, observando-se um valor mdio de 1,2 mg. Sabendo que o desvio padro do contedo de nicotina de um cigarro 0,2 mg, diga, com 99% de confiana, entre que valores se situa o teor mdio de nicotina de um cigarro.
Resoluo
X segue N(; 0,22) n=20 e logo

X c
x =1,2
=0,2
=99%
c: P (c Z c) = 99% D (c) = 99% c = 2,576
;X +c
= 1,2
2,576 x0,2 20
;1,2
2,576 x0,2 20
= [1,085;1,315]
Estima-se, com 99% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.
Exerccio 5
Admita-se que a altura dos alunos de uma escola segue distribuio Normal com varincia conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatria com dimenso n=25 alunos e calculada a respectiva mdia amostral, tendo-se obtido o valor de 1,70m. Defina um intervalo que, com probabilidade 95%, contenha o valor esperado da altura .
Estatstica Aplicada
83
Manual de Exerccios
Resoluo
X segue N(; 0,051) n=25 e logo

X c
x =1,70
2=0,051
=95%
c: P (c Z c) = 95% D (c) = 95% c = 1,96
;X +c
= 1,7
1,96 x 0,051 25
;1,2
1,96 x 0,051 25
= [1,611;1,788]
Estima-se, com 95% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.
Exerccio 6
Numa fbrica, procura conhecer-se a incidncia de defeituosos na produo de uma mquina. Para tanto, colhe-se uma amostra de dimenso suficientemente grande (1600 artigos), onde 10% dos artigos so defeituosos. Determine o intervalo de confiana para a referida proporo com 90% de confiana.
Resoluo
n=1600
p =10%
c: P (c Z c) = 90% D (c) = 90% c = 1,645 e logo

pc 0,1x0,9 0,1x0,9 p (1 p ) p (1 p ) ;p+c ;0,1 1,645 = 0,1 1,645 = 1600 1600 n n
= [0,0876;0,1123]
Estima-se, com 90% de confiana, que a proporo de artigos defeituosos na produo se situa entre 8,76% e 11,23%.
Exerccio 7
O director fabril de uma empresa industrial que emprega 4000 operrios emitiu um novo conjunto de normas internas de segurana. Passada uma semana, seleccionou aleatoriamente 300 operrios e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa um intervalo
Manual de Exerccios
de confiana a 95% para a proporo de operrios que conheciam adequadamente o conjunto das normas uma semana aps a sua emisso.
Resoluo
n=300
p=
75 = 0,25 300
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo

pc p (1 p ) p (1 p ) 0,25 x0,75 0,25 x0,75 ;p+c = 0,25 1,96 ;0,25 1,96 = n n 300 300
= [0,201;0,299]
Estima-se, com 95% de confiana, que a proporo de operrios que conheciam adequadamente o conjunto das normas se situa entre 20,1% e 29,9%.
Exerccio 8
A Direco de Marketing de uma empresa pretende conhecer a notoriedade da marca de determinado produto. Nesse sentido, efectuou um inqurito junto de 1200 pessoas escolhidas aleatoriamente, verificando que 960 a conheciam. a) b) Estime a proporo de pessoas conhecedoras da marca atravs de um intervalo de confiana a 90%. Se se pretender que a amplitude do intervalo de confiana da alnea anterior no seja superior a 0,034, qual deve ser a dimenso mnima da amostra? c) Sabendo que o intervalo de confiana determinado pela Direco de Marketing foi [0,767; 0,833], calcule o nvel de confiana utilizado
Resoluo
a) n=1200
p= 960 = 0,8 1200
c: P (c Z c) = 90% D (c) = 90% c = 1,645 e logo

Manual de Exerccios
pc
= [0,781;0,819]
p (1 p ) p (1 p ) 0,8 x0,2 0,8 x0,2 ;p+c = 0,8 1,645 ;0,8 1,645 = n n 1200 1200
Estima-se, com 90% de confiana, que a proporo de indivduos conhecedores da marca se situa entre 78,1% e 81,9%.
b) Amp.=Lim.Sup.-Lim.Inf. = ( p + c
Logo
p(1 p) p(1 p) p(1 p) ) ( pc ) = 2c n n n
2c
p(1 p) 0,8 * 0,2 = 2 *1,645 * 0,034 n 1499 n n
c) p + c
p(1 p) = 0,833 n 0,8 * 0,2 = 0,833 c = 2,86 1200
Logo 0,8 + c
E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nvel de confiana utilizado
Exerccio 9
O gabinete de projectos de uma empresa de material de construo civil pretende estimar a tenso de ruptura do material usado num determinado tipo de tubos. Com base num vasto conjunto de ensaios realizados no passado, estima-se que o desvio - padro da tenso de ruptura do material em causa de 70 psi. Deseja-se definir um intervalo de confiana a 99% para o valor esperado da tenso de ruptura, pretendendo-se que a sua amplitude no exceda 60 psi. Qual o nmero de ensaios necessrio para definir tal intervalo?
Resoluo
n=?
=70
=99%
c: P (c Z c) = 99% D (c) = 99% c = 2,576 Amplitude = 2c
Logo 2c
60 2 * 2,576 *
70
n
60 n 36
Estatstica Aplicada
86
Manual de Exerccios
Exerccio 10
A empresa SCB controla regularmente a resistncia ruptura dos cabos por si produzidos. Recentemente, foram analisadas as tenses de ruptura de 10 cabos SCB-33R, seleccionados aleatoriamente a partir de um lote de grandes dimenses, tendo sido obtida uma mdia de 4537 kg/cm2. Existe uma norma de 112 kg/cm2 em relao varincia, que respeitada. O director comercial pretende saber qual o intervalo de confiana, a 95%, para o valor esperado da tenso de ruptura dos cabos do lote em causa. Defina esse intervalo.
Resoluo
X segue N(; 112) n=10 e logo

X c
x =4537
=10,58
=95%
c: P (c Z c) = 95% D (c) = 95% c = 1,96
;X +c
= 4537
1,96 x10,58 10
;4537
1,96 x10,58 10
= [4530,5;4543,5]
Estima-se, com 95% de confiana, que o tenso mdia de ruptura dos cabos se situa entre 4530,5 kg/cm2 e 4543,5 kg/cm2.
Exerccio 11
Uma amostra de 50 capacetes de proteco, usados por trabalhadores de uma empresa de construo civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18 foram observados alguns danos. Construa um intervalo de confiana, a 95%, para a verdadeira proporo p de capacetes que sofre danos com este teste. Interprete o resultado obtido.
Resoluo
a) n=50
p=
18 = 0,36 50
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo
Estatstica Aplicada
87
Manual de Exerccios
pc
= [0,22695;0,49305]
p (1 p ) p (1 p ) 0,36 x0,64 0,36 x0,64 ;p+c = 0,36 1,96 ;0,36 1,96 = n n 50 50
Estima-se, com 95% de confiana, que a proporo de capacetes que sofre danos se situa entre 22,7% e 49,3%.
Exerccio 12
Qual deve ser o nmero de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar a proporo de portuenses que usam culos, de modo a garantir que um intervalo de confiana a 95% para essa proporo tenha uma amplitude no superior a 8 pontos percentuais?
Resoluo
n=?
Amp.= ( p + c
p(1 p) p(1 p) p(1 p) ) ( pc ) = 2c < 0,08 n n n
c: P (c Z c) = 95% D (c) = 95% c = 1,96 Considerando que a proporo amostral a que maximiza a amplitude (pior
dos casos), isto , que a proporo amostral 50% ( p(1 p)' = 1 2 p = 0 ), vem
que:
2c
p(1 p) 0,5 * 0,5 = 2 * 1,96 * < 0,08 n > 600 n n
Estatstica Aplicada
88
Manual de Exerccios
3.5. Testes de hipteses

Todos os dias temos de tomar decises respeitantes a determinadas populaes, com base em amostras das mesmas (decises estatsticas). Nesta tomada de decises, til formular hipteses sobre as populaes, hipteses essas que podem ou no ser verdadeiras. A essas hipteses chamamos hipteses estatsticas, as quais geralmente se baseiam em afirmaes sobre as distribuies de probabilidade das populaes ou sobre alguns dos seus parmetros. Uma hiptese pode ento ser definida como uma conjectura acerca de uma ou mais populaes. Desta forma, os testes de hipteses podem considerar-se uma segunda vertente da inferncia estatstica, tendo por objectivo verificar, a partir de dados observados numa amostra, a validade de certas hipteses relativas populao. O resultado do teste corresponde inevitavelmente a uma das duas respostas possveis para cada questo: afirmativa ou negativa. Em ambos os casos corre-se o risco de errar. Uma das caractersticas do teste de hipteses , justamente, a de permitir controlar ou minimizar tal risco. Nos testes de hipteses, e ao contrrio dos intervalos de confiana, em vez de procurar uma estimativa ou um intervalo para um parmetro, admite-se ou avana-se um valor hipottico para o mesmo, utilizando depois a informao da amostra para confirmar ou rejeitar esse mesmo valor. A hiptese a testar denomina-se, pois, de H0 ou de hiptese nula. O objectivo verificar se os factos observados a contradizem, levando a optar pela hiptese alternativa H1. Isto , a estratgia bsica seguida no mtodo de teste de hipteses consiste em tentar suportar a validade H1 de uma vez provada a inverosimilhana de H0.
Exemplo: Registos efectuados durante vrios anos permitiram estabelecer que o nvel de
chuvas numa determinada regio, em milmetros por ano, segue uma lei normal N(600;100). Certos cientistas afirmavam poder fazer aumentar o nvel
mdio das chuvas em 50 mm. O seu processo foi posto prova e anotaram-
se os valores referentes a 9 anos: 510 614 780 512 501 534 603 788 650 Que se pode concluir? Adopte um nvel de significncia de 5%.
Estatstica Aplicada
89
Manual de Exerccios
Resoluo: Duas hipteses se colocavam: ou o processo proposto pelos cientistas no
produzia qualquer efeito, ou este aumentava de facto o nvel mdio das chuvas em 50 mm. Estas hipteses podem formalizar-se do modo seguinte: H0: =600 mm H1: =650 mm Este um problema clssico de teste de hipteses, em que est em causa aceitar ou rejeitar a hiptese nula, em funo dos resultados de uma amostra. Ao utilizar uma amostra de uma populao, estamos a lidar com leis de probabilidades, logo no possvel de saber se a hiptese nula verdadeira ou falsa, mas apenas medir as probabilidades envolvidas na tomada de deciso. Podem-se definir 2 formas de especificar Ho e H1: (i) hiptese simples contra hiptese simples Ho: = 0 H1: = 1 (ii) hiptese simples contra hiptese composta Ho: = 0 H1: > 0 ou < 0 ou 0 Estes testes designam-se respectivamente de teste unilateral direita, teste unilateral esquerda e teste bilateral Sendo os testes de hipteses, portanto, um processo de inferncia estatstica onde se procuram tomar decises sobre a populao com base numa amostra, natural que envolvam alguma margem de erro e que ocorram em situao de incerteza. Estes erros no podem ser completamente evitados mas, no entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao investigador decidir qual a dose de risco de se enganar em que est disposto a incorrer. Vamos supor uma probabilidade de erro de, por exemplo, 5%. Nesse caso, e avanada a hiptese nula Ho, o investigador s estaria disposto a rejeit-la se o resultado obtido na amostra fizesse parte de um conjunto de resultados improvveis que teriam apenas, por exemplo, 5 chances em 100 de
Manual de Exerccios
se produzir. Este tipo de formulao conhecida como postura conservadora. Ou seja, estamos mais propensos a achar que o novo processo no tem qualquer efeito sobre o nvel das chuvas (isto , que tudo se mantm igual) do que investir no novo processo (mudar), arriscando apenas quando houver evidncias da amostra muito fortes a favor do novo. Para que esta deciso possa ser tomada de uma forma controlada, conveniente pois que, partida, se fixe o valor a partir do qual se considera improvvel a validade da hiptese nula. Tal fixao corresponde fixao da regra de deciso do teste. A formalizao desta regra passa pela especificao de uma regio de regio de rejeio. A essa regio, isto , ao conjunto de valores improvveis que conduzem rejeio da hiptese nula d-se o nome de Regio Crtica. Ao limite superior de risco, que na maior parte dos casos de 10%, 5% ou 1%, dse o nome de Nvel de Significncia do teste, sendo este que permite definir a condio de rejeio de Ho. O Nvel de Significncia designa-se de e corresponde, ento, probabilidade de o resultado amostral levar rejeio de Ho, supondo Ho verdadeira, isto , probabilidade de se estar a cometer aquilo a que se convenciona chamar de erro de 1 espcie. Como veremos no exemplo, existem tambm erros de 2 espcie, cuja probabilidade se designa pela letra . Em resumo:
Quadro de deciso em condio de incerteza
Hiptese nula Ho Deciso Aceitar Ho Rejeitar Ho Hiptese Ho ser verdadeira: Deciso correcta (1-) Erro de tipo I Alfa () Hiptese Ho ser falsa Erro de tipo II Beta () Deciso correcta (1-)
Como decidir? Visto que se trata de testar o valor de , a varivel de deciso ser X . Considerando Ho verdadeira vem que
X N (600;
100 9
).
Estatstica Aplicada
91
Manual de Exerccios
Em princpio, grandes valores de X so improvveis, pelo que se opta pela seguinte regra de deciso: Se X fr demasiado grande, isto , superior a um valor crtico c que tem apenas 5 chances em 100 de ser ultrapassado, opta-se por H1 com probabilidade 5% de se estar a cometer um erro. Se tal no acontecer, conserva-se Ho, por falta de provas suficientes para no o fazer. Logo, sendo P(Rejeitar Ho / Ho) = = 5%, vem que
P ( X > c / = 600) = 0,05 P (
>
c 600 ) = 0,05 100 9
n
c = 600 + 1,645 x 100 = 654,83(3) 3
A regra de deciso , ento, a seguinte:

-
rejeitar H0 em favor de H1, se o valor amostral fr superior a 654,83(3) conservar H0 em detrimento de H1 se fr inferior a 654,83(3)
Isto , a Regio Crtica deste teste, isto , o conjunto de acontecimentos que levam rejeio de H0 corresponde a todos os valores de X >654,83(3).
RA: Regio de Aceitao
RR: Regio Crtica ou de Rejeio
RA=(1-)
RR=
654,83(3)
X
= 600
Os dados recolhidos indicavam X =610,2 mm, pelo que a deciso conservar H0 , isto , considerar que o processo cientfico no produz efeitos.
Estatstica Aplicada
92
Manual de Exerccios
No entanto, os erros incorridos no se ficam apenas pelos de 1 espcie. Existem tambm erros de 2 espcie. Isto , partida parte-se do princpio que H0 verdadeira e s se rejeitar essa hiptese se ocorrerem acontecimentos pouco provveis. No entanto, possvel alternativamente partir do princpio que H1 que verdadeira, ou seja, considerar que o processo cientfico realmente eficaz no aumento do nvel mdio das chuvas, mas que, infelizmente, o nmero de valores observado no permite observar resultados ou esses resultados foram insuficientes. Supondo ento que H1 verdadeira (=650 mm), ento vem que:
X N (650;
100 9
RA
1-
RR
= 650
A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2 espcie, vem ento igual a: P(Rejeitar H1 / H1)=
P ( X 654,83(3) / = 650) = P ( X
654,83(3) 650 ) = P ( N (0,1) 0,14) = 55,57% 100 9
atravs das probabilidades e que se procura o melhor teste de hipteses, sendo o teste ideal o que minimiza simultaneamente ambos os valores. No entanto, e como e se referem a realidades opostas e variam em sentido contrrio, tal no possvel. O que na maior parte dos casos se faz fixar o (para amostras de dimenso n) e tentar minimizar .
Estatstica Aplicada
93
Manual de Exerccios
Regio de rejeio e de aceitao da hiptese nula
Unilateral esquerda H1: < 600

RA
Bilateral H1: 600 RA
Unilateral direita H1: > 600

RA
RR
RR /2
1
RR /2
1
RR
Chama-se potncia de um teste probabilidade de rejeitar H0 quando esta falsa. Esta uma deciso certa, no implica erro, e complementar do erro de 2 espcie. Logo, quanto menor o erro de 2 espcie, maior ser o valor da potncia do teste e, logo, maior a sua qualidade (diz-se que o teste mais potente) . Quando H1 uma hiptese composta (>, < ou ), a potncia do teste varivel, dependendo do valor do parmetro que no fixo. Nesse caso falase em funo potncia do teste = 1 - (1)
Resumindo: passos para construo de um teste de hipteses: Passo No 1: Formular as hipteses nula e alternativa Passo No 2: Decidir qual estatstica (estimador) ser usada para julgar a Ho e a varivel de deciso Passo No 3: Definir a forma da Regio Crtica, em funo da hiptese H1 Passo N 4: Fixar o nvel de significncia Passo N 5: Construir a Regio Crtica em funo do nvel de significncia Passo N 6: Clculo (eventual) da potncia do teste Passo N 7: Calcular a estatstica da amostra Passo No 8: Tomar a deciso: rejeio ou no de Ho
Estatstica Aplicada
94
Manual de Exerccios
TESTES DE HIPTESES
Exerccios
Exerccio 1
Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos corresponde ao valor assinalado na embalagem. Seja X a varivel que representa o peso de um pacote de arroz. Suponha que
X N ( ;0,012 ) e que se conhece a seguinte amostra:
1,02 0,98 0,97 1,01 0,97 1,02 0,99 0,98 1,00 Ser que, para um nvel de significncia de 5% se pode dizer que o peso mdio corresponde ao peso de 1 kg assinalado na embalagem?
Resoluo
Passo 1
Formular as hipteses: Ho: = 1 H1: < 1

Passo 2
A estatstica a ser utilizada ser a mdia amostral

Passo 3
A regio crtica formada por todos os valores menores ou iguais a c

Passo 4
Assumir um nvel de significncia de 5%

Passo 5
Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo P(Rejeitar Ho / Ho) = = 5%, vem que
P ( X < c / = 1) = 0,05 P (
<
n
0,01 = 0,9945 3 Logo, RC = ] ;0,9945] c = 1 1,645 x
c 1 ) = 0,05 0,01 9
Estatstica Aplicada
95
Manual de Exerccios
Passo 6
Calcular a estatstica X =
Passo 7 Tomar a deciso
1 9
xi = 0,9933
Como o valor da amostra foi 0,9933 e menor que o valor crtico 0,9945, rejeita-se Ho Ou seja, considera-se que o arroz contido em cada pacote era inferior ao indicado. No entanto, h o risco de se mandar parar a produo para reviso do equipamento sem necessidade. Reduzindo a probabilidade de isso ocorrer de 5% para 1%, vem:
=1%
RR: Parar a produo
=5%
RA: Continuar a produo
0,9922 0.9945
Valor da amostra: 0,9933 A nica mudana ser no Valor Crtico, que de 0,9945 para 0,9922. Neste caso, aceitaremos Ho, ou seja, consideraremos que no h qualquer anomalia na produo.
Exerccio 2
Numa cidade, pretende-se saber se metade da populao favorvel construo de um centro comercial. Faz-se um inqurito a 200 pessoas, e 45% declaram-se favorveis. Estes valores contradizem a hiptese?
Resoluo
Passo 1
Formular as hipteses: Ho: p = 0,5 H1: p < 0,5

Manual de Exerccios
Passo 2
A estatstica a ser utilizada ser a proporo amostral, onde o cuidado deve ser trabalhar com grandes amostras.
Passo 3
A regio crtica formada por todos os valores menores ou iguais a c

Passo 4
Assumir um nvel de significncia de 5%

Passo 5
Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo P(Rejeitar Ho / Ho) = = 5%, vem que
P ( p < c / p = 0,5) = 0,05 P (
p p
p (1 p ) n
<
c 0,5 0,5(1 0,5) 200
) = 0,05
c = 0,5 1,645 x
Passo 6
p =0,45
0,5(1 0,5) = 0,442 200
Logo, RC = ] ;0,442]
Passo 7
Como o valor amostral 0,45 maior que o valor crtico 0,442, no se rejeita Ho
RR: No construir o centro comercial RR: Parar a construo
=5%
RA: Decidir pela construo
+ Valor amostral: 0,45 0,442
Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor da construo do centro comercial, essa margem no suficiente para decidir deixar de o construir.
Estatstica Aplicada
97
Manual de Exerccios
Exerccio 3
O peso dos pacotes de farinha de 1 kg, produzidos por uma fbrica, uma varivel normalmente distribuda, com desvio padro 0,01. Da produo de determinado dia retirada uma amostra de 49 pacotes, com peso mdio de 0,998 Kg. Pode-se afirmar, a um nvel de significncia de 1%, que o peso mdio dos pacotes de farinha nesse dia no est de acordo com o peso indicado?
Resoluo
X segue N(; 0,012) n = 49
x = 0,998
= 1%
H0: = 1 H1: < 1 P(Rejeitar Ho/Ho verdadeira) = = 1%

P ( X c / = 1) = 0,01 P ( X c 1 c 1 ) = 0,01 = 2,326 c = 0,997 0,01 0,01
49
49
Como x = 0,998 > c = 0,997, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que o peso mdio no esteja de acordo com o indicado).
Exerccio 4
Numa regio onde existem entre os maiores de 18 anos 50% de fumadores, lanada uma intensa campanha anti-tabaco. Ao fim de trs meses, realiza-se um mini-inqurito junto de 100 cidados com mais de 18 anos, registando-se 45 fumadores. a) Com 1% de significncia, pode concluir-se que a campanha surtiu efeito? b) Em caso negativo, qual seria a dimenso da amostra a partir da qual aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em vista?
Manual de Exerccios
Resoluo
a) n = 100
p = 0,45
= 1%
H0: p = 0,5 (a campanha no surtiu efeito) H1: p < 0,5 (a campanha surtiu efeito) P(Rejeitar Ho/Ho verdadeira) = = 1%
P ( X c / p = 0,5) = 0,01 P (
p p
p (1 p ) n
c 0,5
0,5 * 0,5 100
) = 0,01
c 0,5
0,5 * 0,5 100
= 2,326 c = 0,384
Como p = 0,45 > c = 0,384, no pertence regio crtica, logo no se rejeita
Ho a um nvel de significncia de 1% (a campanha no surtiu efeito).
b) P( X 0,45 / p = 0,5) = 0,01 P(
p p 0,45 0,5 ) = 0,01 p(1 p) 0,5 * 0,5 n n
0,45 0,5 = 2,326 n = 541 0,5 * 0,5 n
Exerccio 5
Um fabricante afirma que o tempo mdio de vida de um certo tipo de bateria de 240 horas, com desvio-padro de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores: 237 242 244 262 225 218 242 248 243 234 236 228 232 230 254 220 232 240
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se- concluir, a 5% de significncia, que as especificaes no esto a ser cumpridas?
Estatstica Aplicada
99
Manual de Exerccios
Resoluo
X segue N(; 202) n = 18

1 18
x =
xi = 237,05
= 5%

P ( X c / = 240) = 0,05 P ( X c 240 c 240 ) = 0,05 = 1,645 c = 232,25 20 20
18
18
Como x = 237,05 > c = 232,25, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que as especificaes no esto a ser cumpridas).
Exerccio 6
Uma empresa de cermica tem, em dada seco, fornos controlados por termstatos para manter a temperatura no interior dos fornos a 600 graus centgrados. A experincia tem demonstrado que a varincia dos valores da temperatura no interior desses fornos de 360. A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que anunciado como garantindo que as temperaturas se mantm dentro do limite desejado. Foram registadas 5 medidas de temperatura de fornos regulados para 600, utilizando novos controladores: 620 595 585 602 608 Para 5% de significncia, poder-se- concluir que a temperatura no se afasta significativamente do valor desejado?
Resoluo
X segue N(;360) n=5
Estatstica Aplicada
100
Manual de Exerccios
x =
1 5
xi = 602
= 5%
H0: = 600 H1: > 600 P(Rejeitar Ho/Ho verdadeira) = = 5%
P( X c / = 600) = 0,05 P(
c 600 360 5
) = 0,95
c 600 = 1,645 c = 613,96 18,97 5
Como x = 602 < c = 613,96, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a temperatura no se afasta significativamente do valor desejado).
Exerccio 7
O peso dos ovos de chocolate produzidos numa fbrica segue distribuio normal com varincia 90,25. a) O fabricante diz que o peso mdio de 160 g. Foi recolhida uma amostra de 100 ovos, cujo peso mdio foi de 158, 437 g. Teste, a um nvel de significncia de 1%, se a afirmao do fabricante pode ser considerada verdadeira, ou se, pelo contrrio, o verdadeiro peso dos ovos ser menor. b) Qual o nvel de significncia a partir do qual a concluso seria diferente?
Resoluo
a) X segue N(; 90,25) n = 100
x = 158,437
= 1%
Estatstica Aplicada
101
Manual de Exerccios
P ( X c / = 160) = 0,01 P (
c 160
90,25 100
) = 0,01
c 1 = 2,326 c = 157,79 9,5
100
Como x = 158,437 > c = 157,79, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a afirmao do fabricante pode ser considerada verdadeira). b)
P ( X 158,437 / = 160) = P ( X
158,437 160 90,25 100
) = F (1,645) = = 5%
Exerccio 8
Um jornal semanrio afirma ter atingido, numa regio, a percentagem, at ento nunca atingida por qualquer semanrio, de 60% de leitores que regularmente compram um jornal desse tipo. Efectuando um inqurito junto de 600 leitores, 55% declararam adquirir, por hbito, o semanrio em causa. Adoptando um nvel de significncia de 1%, pronuncie-se quanto projeco que o semanrio reclama.
Resoluo
n = 600 H0: p = 0,6 H1: p < 0,6
p = 0,55
= 1%
P(Rejeitar Ho/Ho verdadeira) = = 1%

P ( X c / p = 0,6) = 0,01 P (
p p
p (1 p ) n
c 0,6
0,6 * 0,4 600
) = 0,01
c 0,6
0,6 * 0,4 600
= 2,326 c = 0,5535
Como p = 0,55 < c = 0,5535, pertence regio crtica, logo rejeita-se Ho a um
nvel de significncia de 1% (o semanrio no atingiu a projeco que reclama).

Manual de Exerccios
Exerccio 9
Um molde de injeco tem produzido peas de um determinado material isolante trmico com uma resistncia compresso com valor esperado de 5,18 kg/cm2 e varincia 0,0625 (kg/cm2)2. As ltimas 12 peas produzidas nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistncia mdia compresso o valor de 4,95 kg/cm2. a) Poder-se- afirmar, a um nvel de significncia de 5%, que as peas produzidas recentemente so menos resistentes do que o habitual? b) Qual a potncia do teste efectuado anteriormente, admitindo que o valor esperado da resistncia
2
compresso
das
peas
produzidas
recentemente de 4,90 kg/cm ?

Resoluo
a) X segue N(; 0,0625) n = 12
x = 4,95
= 5%
H0: = 5,18 H1: < 5,18 P(Rejeitar Ho/Ho verdadeira) = = 5%

P ( X c / = 5,18) = 0,05 P ( X c 5,18 c 5,18 = 1,645 c = 5,061 0,25
0,0625 12
) = 0,05
12
Como x = 5,18 > c = 5,061, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (as peas produzidas recentemente no so menos resistentes do que o habitual). b) Potncia = 1-
= (Conservar Ho/H1 verdadeira)
P ( X > 5,061 / = 4,9) = P ( X
>
5,061 4,9 0,0625 12
) = 1 F (0,01) = 1 0,5040 = 49,6%
Estatstica Aplicada
103
Manual de Exerccios
Exerccio 10
Um jornal desportivo noticiou que o nmero de espectadores de um programa desportivo que apresentado na televiso aos domingos noite est igualmente dividido entre homens e mulheres. De uma amostra aleatria de 400 pessoas que vem regularmente o referido programa, concluiu-se que 240 so homens. Pode-se concluir, para um nvel de significncia de 10%, que a notcia falsa?
Resoluo
n = 400 H0: p = 0,5 H1: p > 0,5
p = 0,6
= 10%
P(Rejeitar Ho/Ho verdadeira) = = 10%

P ( X c / p = 0,5) = 0,1 P (
p p
p (1 p ) n
c 0,5
0,5 * 0,5 400
) = 0,9
c 0,5
0,5 * 0,5 400
= 1,282 c = 0,53205
Como p = 0,6 > c = 0,53205, pertence regio crtica, logo rejeita-se Ho a um
nvel de significncia de 1% (a notcia falsa).
Estatstica Aplicada
104
Manual de Exerccios
3.6. Aplicaes estatsticas

Fiabilidade de componentes e sistemas 3.6.1 Conceito de fiabilidade
Define-se fiabilidade como sendo a probabilidade de um sistema (ou componente) desempenhar a funo para a qual foi concebido, nas condies previstas e nos intervalos de tempo em que tal exigido. A anlise da fiabilidade ser, ento, um mtodo de quantificar o que se espera que acontea e pode ser usada para indicar mritos relativos de sistemas, tendo em ateno um pr-definido nvel de fiabilidade. A fiabilidade de um componente pode ser obtida a partir da sua taxa de avarias. Se um sistema fr constitudo por vrios componentes, ento a fiabilidade ser dependente da fiabilidade dos componentes que compem esse mesmo sistema. necessrio, quando se apresentam os resultados de um estudo de fiabilidade saber exp-los, pois os interpretadores podero no ter a noo daquilo que se est a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou componente de 0,998 pode no significar muito; no entanto, se tal facto fr traduzido em que, por ano, o sistema em questo estar fora de servio por avaria num perodo de 9 horas j significa alguma coisa. Como o estudo da fiabilidade se trata de um estudo extremamente importante, pois que muitas vezes esto em jogo vidas humanas, importante desenvolver um estudo de probabilidade relativo ao funcionamento adequado de um componente ou sistema.
3.6.2 Fiabilidade de um sistema
Ao analisar a fiabilidade de um sistema constitudo por vrios componentes, necessrio estudar a fiabilidade desses componentes e a forma como esto ligados (estrutura do sistema e definio do funcionamento do sistema). De seguida, so apresentados 3 casos: (i) as associaes de componentes em
Estatstica Aplicada
105
Manual de Exerccios
paralelo; (ii) a associao de n unidades idnticas em paralelo em que apenas necessrio o funcionamento de m (m<=n) para o sistema funcionar; (iii) e as associaes em srie.
(i) Associao em paralelo
Consideremos vrios componentes redundantes e independentes:
Uma vez que os componentes so redundantes, basta apenas um para que o sistema funcione. Considerando um sistema composto por apenas 2 componentes, se cada um dos componentes estiver no seu perodo de vida til, a fiabilidade do sistema (Rs) dada por: Rs = P (funcionar pelo menos um componente) = P (funcionarem 1 ou 2 componentes) = 1 P (no funcionar nenhum) = 1 P (no funcionar comp.1 e no funcionar comp.2) = 1 - P (no funcionar comp.1) x P(no funcionar comp.2) pois o funcionamento independente = 1 q1 x q2 onde q1 e q2 so, respectivamente as indisponibilidades (isto , as probabilidades de no funcionamento) das componentes 1 e 2. Se houver n componentes ligadas em paralelo, a fiabilidade do sistema dada por Rs = 1 - q1 x q2 x q3 x x qn = 1 -
q
i
Estatstica Aplicada
106
Manual de Exerccios
Veja-se que, no caso de sistemas redundantes, a fiabilidade do sistema aumenta medida que aumenta o nmero de componentes ligadas ao sistema (que representam como garantias de funcionamento adicionais).
(ii) Associao em paralelo de componentes no redundantes
Se o sistema no fr redundante, as condies de funcionamento e de avaria para o sistema tm de ser definidos, isto , necessrio saber qual o nmero mnimo de componentes que necessitam de estar em funcionamento para que o sistema sobreviva. Para o efeito, vai considerar-se de novo um sistema composto por quatro componentes em paralelo. Se as componentes forem todas iguais, com probabilidade de funcionamento p e de indisponibilidade q, a probabilidade associada a cada um dos estados possveis (1, 2, 3 ou 4 componentes, no mnimo, a funcionar), a fiabilidade do sistema dada pelo quadro seguinte: N mnimo de componentes necessrias ao funcionamento do sistema 4 3 2 1
Probabilidade de o sistema funcionar p4 p4 + 4p3q 4 p + 4p3q + 6p2q2 p4 + 4p3q + 6p2q2 + 4pq3
Ou seja, a fiabilidade do sistema funcionar pode ser calculada recorrendo lei binomial. Assim, por exemplo, para um n mnimo de 3 componentes necessrias, vem: Rs = P(pelo menos 3 componentes a funcionar) = P(funcionarem as 4) + P (funcionarem 3)
4 = C 4 p 4 q 4 4 + C 34 p 3 q 43
= p 4 + 4 p3q Por exemplo, se todos os componentes tivessem fiabilidade 0,9 (p=0.9), ento a fiabilidade de um sistema deste tipo seria 94,77%.
Estatstica Aplicada
107
Manual de Exerccios
(iii) Associao em srie
Quando os componentes se encontram associados em srie, para que o sistema funcione torna-se necessrio que todos os componentes se encontrem em bom estado de funcionamento.
No caso mais vulgar de os componentes serem independentes, a fiabilidade do sistema dada por Rs = p1 x p2 x p3 x ... x pn No caso de todas as componentes serem iguais Rs = pn Facilmente se depreende que a fiabilidade do sistema diminui medida que aumenta o nmero de componentes ligadas em srie. A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por
e t
A probabilidade de avariar at ao instante t dada por
1 e t
Num sistema com vrias componentes em srie, em que o componente se encontra a funcionar no seu perodo de vida til, a fiabilidade do sistema dada por
Rs = e
(iv) Outros sistemas
n i =1
i t
Quando a estrutura do sistema no puder ser enquadrada em nenhuma das anteriores, tero que ser analisadas tcnicas mais gerais, tais como a rvore
de avarias. O mtodo consiste basicamente em identificar todos os modos
possveis de avaria e control-los. Assim, supondo que se pretende analisar a fiabilidade da iluminao de uma sala com uma lmpada.
Estatstica Aplicada
108
Manual de Exerccios
Se o objectivo fr calcular a probabilidade de falta de energia (acontecimento secundrio) vem P (avaria) = P (A B) = P (A) + P(B) + P(A)xP(B) Para o acontecimento prioritrio (sala s escuras) vem: P(sala s escuras) = P(falta de energia lmpada estragada) Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de proteco e esquemas de comando (fiabilidade de msseis e reactores nucleares, por exemplo).
Sala s escuras
Falta de energia
Lmpada estragada
Avaria na rede
Actuao da proteco
Estatstica Aplicada
109
Manual de Exerccios

Controlo Estatstico de Qualidade
do conhecimento geral que nenhum processo de produo executa dois produtos iguais. Os processos industriais so caracterizados por produzirem peas cujas caractersticas variam dentro de certos valores tolerveis. As variaes so inevitveis, podendo ser grandes, pequenas, muito ou pouco dispersas. O conhecimento do tipo, da extenso e da evoluo dessas variaes extremamente importante para podermos garantir que nos possvel produzir produtos que vo cumprir as especificaes, para eles definidas, a um nvel aceitvel. Os testes descritos anteriormente referiam-se em situaes em que o estudo no era cronolgico. simples imaginar situaes onde, pelo contrrio, o processo a analisar deva ser monitorado ao longo do tempo. Situaes deste tipo ocorrem em linhas de fabrico de produtos, estudos de conservao de materiais e mquinas, qualidade de servios. Duma forma geral, entende-se por controle de qualidade a monitorizao de um processo, cujos resultados de natureza quantitativa se devem encontrar dentro de determinados limites. Um processo est sob controle se os resultados esto em conformidade com os limites impostos; caso contrrio, o processo deve ser investigado para que sejam detectadas as causas do desvio. A "qualidade" pode referir-se a um valor fixo, que constitui o objectivo desejado (por exemplo, a conformidade da mdia relativamente a "limites normais"). A avaliao do processo implica, que em certos intervalos de tempo se proceda a uma amostragem. O controlo estatstico de qualidade permite uma interveno nos processos, no sentido de se ajustarem e corrigirem os processos, antes de qualquer alterao no natural passar a fazer efeito de forma contnua. As cartas de controlo so um instrumento poderoso que permite identificar as causas de variao no natural nos processos. Ao definir uma carta de controle para a mdia, necessrio comear por definir a norma para (0) e 2 nveis de controle: os de vigilncia garantida (limites
Estatstica Aplicada
110
Manual de Exerccios
inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a mdia amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Supe-se que a varivel em estudo segue Distribuio Normal, sendo os LIC e LSC calculados da seguinte forma:
LIC / LSC = 0 +/-
n (metodologia baseada na estimao por intervalos estudada atrs)
Ao definir uma carta de controle para a proporo, por exemplo, de defeituosos, necessrio comear por definir a norma para p (p0) e 2 nveis de controle: os de vigilncia garantida (limites inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a proporo amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Os LIC e LSC calculados da seguinte forma:
Estatstica Aplicada
111
Manual de Exerccios
p(1 p) n (metodologia baseada na estimao por intervalos estudada atrs) As cartas de controlo so instrumentos fceis e simples de aplicar pelos
LIC / LSC = p0 +/-
executantes, no sentido de se obter o controlo contnuo do processo. Podem ser traadas nos prprios locais de trabalho, dando informaes preciosas sobre os momentos em que so necessrias aces correctivas. Desde que o processo esteja sob controlo estatstico, as cartas de controlo permitem prever de forma adequada o comportamento do processo, e melhorar os processos, com base na informao disponvel nas cartas, no sentido de reduzir a sua variabilidade. As cartas so elaboradas a partir de medies efectuadas de uma caracterstica do processo (a mdia, por exemplo). Os dados so obtidos de amostras de tamanho constante, geralmente 3 ou 5 unidades, recolhidas consecutivamente em intervalos de tempo constantes. Deve ser elaborado um plano de recolha de dados, que dever ser usado como base para a colheita, registo e marcao dos dados no grfico. As amostras a utilizar devem ser de tamanho racional, isto , devem ser eficazes para o controlo sem acarretar esforo demasiado e desnecessrio na colheita. A interpretao dos limites de controlo a seguinte: se a variabilidade pea a pea do processo permanecesse constante e nos nveis encontrados, seria legtimo concluir que na base de um ponto fora dos limites de controlo estariam causas que importa conhecer e sanear. Um ponto fora do controlo deve merecer uma anlise imediata quanto causa. Pode ser mantido um registo das mdias amostrais por meio de uma carta como a representada na figura abaixo, denominada carta de controle de qualidade. Cada vez que for calculada uma mdia amostral, ela ser representada por um ponto particular. Enquanto eles carem entre o limite inferior e o superior, o processo est sob controle. Quando um ponto estiver fora desses limites de
Estatstica Aplicada
112
Manual de Exerccios
controle (como ocorreu com a terceira amostra tomada na quinta-feira), h a possibilidade de haver alguma anomalia, o que justifica uma investigao. Os limites de controlo especificados so denominados de limites de confiana. A escolha, em cada caso, depende das circunstncias particulares de cada processo. Mdia Amostral (cm) LSuperior
Segunda-feira
Tera-feira
Quarta-feira
Quinta-feira
Sexta-feira
50 LInferior
Estatstica Aplicada
113
Manual de Exerccios

Tratamento estatstico de inquritos 3.8.1 Teste de independncia do qui-quadrado
O teste do
muito eficiente para avaliar a associao existente entre
variveis qualitativas. Trata-se de um teste de hipteses semelhante aos anteriormente estudados, mas que se inclui na categoria dos testes noparamtricos, isto , aqueles que no incidem explicitamente sobre um parmetro de uma ou mais populaes (por exemplo, o valor esperado ou a proporo, como os estudados anteriormente). No entanto, a lgica de formulao das hipteses e de definio de uma regra de deciso equivalente aos testes paramtricos. O princpio bsico deste mtodo noparamtrico comparar as divergncias entre as frequncias observadas e as esperadas. Este teste encontra aplicabilidade no tratamento estatstico de inquritos. De facto, para alm do tratamento frequencista dos inquritos, por vezes interessante aferir da existncia de relaes estatsticas relevantes entre as diversas questes (por exemplo, testar se h alguma coerncia entre quem respondeu opo 1 da pergunta X e opo 2 da pergunta Y). O estudo destas relaes encontra aplicabilidade no campo das anlises de mercado, em que o objectivo proceder sua segmentao. A existncia de associaes entre as questes permite determinada um vector comum entre grupos de inquiridos que responderam de forma semelhante a certo tipo de questes (concluir algo como que os habitantes de uma dada rea foram sempre os que assinalaram determinado tipo de respostas e constituem, por isso, um segmento geogrfico autnomo e com caractersticas prprias de entre o total dos inquiridos). De uma maneira geral, pode dizer-se que dois grupos se comportam de modo semelhante se as diferenas entre as frequncias observadas e as esperadas em cada categoria forem muito pequenas ou prximas de zero.
Estatstica Aplicada
114
Manual de Exerccios
Exemplo: Um pesquisador deseja verificar se h associao entre trs cursos de uma
universidade e dependncia de drogas. Entrevistou 120 alunos, sendo 25 de Medicina, 35 de Farmcia e 60 de Biologia, perguntando sobre o uso de drogas, admitindo somente duas respostas: sim ou no. Aps o processamento dos dados, chegou-se seguinte tabela de distribuio de frequncias: Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60
120
As tabelas como aquela na qual se apresentam os resultados referentes ao exemplo so habitualmente designadas de tabelas de contingncia. Admitase que os resultados que nela figuram resultam de amostras aleatrias. Tais resultados representam o nmero de observaes includas nas diferentes combinaes das classes nas quais as duas variveis em estudo se exprimem. Mod. 1 Modalidade 1 Modalidade 2 Modalidade n Total onde nij: frequncia observada na clula ij n.j: frequncia marginal observada na modalidade j ni.: frequncia marginal observada na modalidade i n: dimenso da amostra n11 n21 n.1 Mod. 2 n12 n22 n.2 Mod. n nnn n.j Total n1. n2. ni.
n
Estatstica Aplicada
115
Manual de Exerccios
O objectivo do teste o de verificar se as duas variveis em questo so ou no relacionadas. As hipteses nula e alternativa so ento as seguintes: Ho: As variveis so independentes H1: As variveis no so independentes As frequncias observadas so obtidas directamente dos dados da amostra, enquanto que as frequncias esperadas so calculadas a partir destas, sob o pressuposto de que Ho verdadeira, isto , admitindo a hiptese de independncia. Na prtica, a frequncia esperada calculada pela multiplicao do total da coluna respectiva pelo total da linha a que pertence, dividindo-se o produto pela dimenso total da amostra:
eij = n i . * n. j n
calculado da seguinte forma: =

i j
(nij eij ) 2
eij
Note-se que o numerador faz referncia diferena entre frequncia observada e frequncia esperada, que dever ser calculada para cada clula da tabela. Quando as frequncias observadas so muito prximas das esperadas, o valor do numerador pequeno; no entanto, quando as discrepncias so grandes, o valor do numerador passa a ser grande e, consequentemente, o assume
valores altos. Ou seja, quando h fortes discrepncias entre o que de facto foi observado e o que seria de esperar sob a hiptese de independncia, a varivel de deciso assume um valor elevado e h motivos ou significncia
estatstica para rejeitar Ho.
No teste qui-quadrado compara-se o valor
calculado com o valor crtico
fornecido em uma tabela, considerando o nvel de significncia adoptado e os graus de liberdade GL ou d.f. (obtidos por (nmero de linhas-1)*(nmero de colunas-1)).
Estatstica Aplicada
116
Manual de Exerccios
Tome-se o caso de GL (d.f.) = 4:
Para
nvel
de
significncia
de
5%,
obtm-se
da
tabela de valores crticos da
(ver pgina seguinte):
Rejeita-se a hiptese nula se tabela.
for maior que o valor crtico fornecido na
Resoluo: Como pode ser observado, entre os 120 alunos includos no estudo h um
nmero igual (60) que afirma usar e no usar drogas. No entanto, a distribuio entre os vrios cursos no ocorre de forma homognea. Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60 120
Os dados so do tipo qualitativo, pois cada aluno entrevistado foi classificado sob uma determinada categoria. Neste caso, pode usar-se o teste do quiquadrado com duas hipteses de trabalho: Ho: No h associao entre tipo de curso e dependncia de drogas H1: H associao entre tipo de curso e dependncia de droga
Estatstica Aplicada
117
Manual de Exerccios
Se o
obtido fr maior ou igual ao
crtico, Ho dever ser rejeitada.
Para o clculo do
recomendam-se os seguintes passos:

n i . * n. j n
1. Calcular as frequncias esperadas eij =
Por exemplo, se as duas variveis fossem independentes, seria de esperar que o nmero de estudantes de Medicina a admitir usar drogas fosse de:
eij = ni. * n. j n
25 * 60 = 12,5 120
2. As frequncias esperadas devero ser anotadas nas correspondentes clulas: Medicina Usa drogas No usa drogas Total nij eij nij eij 10 12,5 15 12,5 25 Farmcia 20 17,5 15 17,5 35 Biologia 30 30,0 30 30,0 60
120
Total 60 60
3. A seguir aplica-se a frmula
=
i j
(nij eij ) 2
eij
= =1,7
4. Determinam-se os graus de liberdade na tabela Os graus de liberdade da tabela so calculados multiplicando (nmero de linhas-1)*(nmero de colunas-1)= (2-1)*(3-1)=2 GL 5. Por ltimo, compara-se o valor do observado obtido (1,7) com o valor do
crtico, considerando os graus de liberdade (GL) e o nvel de significncia adoptado (ver tabela anexa). Vem que o obsv.=1,7 menor do que o valor obtido a partir da tabela, que
5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho no pode ser rejeitada, concluindo-se que, no grupo estudado, no h associao entre as variveis. Em mdia, a proporo de alunos que usam ou no drogas no varia entre os cursos.
Estatstica Aplicada
118
Manual de Exerccios
Observao: Caso 20% ou mais das clulas tenham frequncias esperadas menores que 5, ou haja uma ou mais frequncias esperadas com valores menores ou igual a 1, no se deve usar o teste do . Uma boa alternativa para estes casos o
agrupamento de linhas e colunas adjacentes, desde que tenha algum sentido lgico, de modo a diminuir os graus de liberdade associados.
Estatstica Aplicada
119
Manual de Exerccios
0.995 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0.975
0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886
0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908
7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619 26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051 27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475 28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892 29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301 30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702
Estatstica Aplicada
G D'A 98 35 34 2 1 '%$" ( H P I H F # E ( C B 4 6 @ 2 7 6 2 0 0 0 ) ( & # !
0.9
0.5
0.1
0.05
0.025
0.01
0.005
0.001
0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865
0.455 1.386 2.366 3.357 4.351
2.706 4.605 6.251 7.779
3.841 5.991 7.815
5.024 7.378
6.635
7.879 10.827
9.210 10.597 13.815
9.348 11.345 12.838 16.266
9.488 11.143 13.277 14.860 18.466
9.236 11.070 12.832 15.086 16.750 20.515
5.348 10.645 12.592 14.449 16.812 18.548 22.457 6.346 12.017 14.067 16.013 18.475 20.278 24.321 7.344 13.362 15.507 17.535 20.090 21.955 26.124 8.343 14.684 16.919 19.023 21.666 23.589 27.877 9.342 15.987 18.307 20.483 23.209 25.188 29.588
5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
120
Manual de Exerccios
FIABILIDADE
Exerccios
Exerccio 1
Num centro comercial, est instalado um sistema de 10 mquinas para utilizao de carto multibanco. Diz-se que o sistema est em funcionamento se pelo menos uma das mquinas funciona. Suponha que cada mquina funciona independentemente das outras e a probabilidade de funcionamento de cada mquina 85%. Calcule a probabilidade do sistema estar em funcionamento.
Resoluo
P(avaria) = 1-0,85 = 15% P(sistema estar em funcionamento) = 1 P(sistema avariar) = 1 P(nenhuma das mquinas funcionar) = 1 P(maq1 no funcionar e...e maq 10 no funcionar) = 1 0,15*0,15*...*0,15 = 1 (aproximadamente)
2. Quatro componentes de um sistema encontram-se associados de acordo com a figura junta. Esto no seu perodo de vida til e as taxas mdias de avarias so 10-4 avarias/hora (A), 2x10-5 avarias/hora (B e C) e 5x10-5 avarias/hora (D).
B A C D
Calcule a probabilidade do sistema estar em funcionamento aps 5 000 horas.

Resoluo
A: Rs = e D: Rs = e
104 *5000
= e 0,5 = 60,6531% = e 0, 25 = 77,8801%
( 5*105 ) *5000
Estatstica Aplicada
121
Manual de Exerccios
B e C: Rs = e
( 2*105 ) *5000
= e 0,1 = 90,4837%
P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 (1-0,904837)2 = 99,0944% Logo, P(sistema estar em funcionamento aps 5 000 horas) = = 0,606531*0,990944*0,778801 = 46,8%
Exerccio 3
Foram ensaiadas durante 3 000 horas, sem que se verificasse qualquer avaria, cinco unidades idnticas de um equipamento que se sabe ter uma curva de sobrevivncia que obedece a uma distribuio exponencial, com um MTBF de 17 500 horas. Calcule a fiabilidade do equipamento.
Resoluo
X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/17500) MTBF = 17500 Y: n de avarias no intervalo [0,3000] horas
Rs = e
Exerccio 4
3000 17500
= e 0,171429 = 84,25%
O tempo de funcionamento sem avarias de uma determinada mquina de produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. a) Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
b) Admitindo que a mquina se encontrava em funcionamento no instante
t=4 horas, qual a probabilidade de no ocorrerem avarias at t=6 horas?

c) Qual a probabilidade de se verificarem 2 avarias durante as primeiras 6
horas de funcionamento da mquina?
Estatstica Aplicada
122
Manual de Exerccios
Resoluo
a) X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/4,5) MTBF = 4,5
6 0 1 4,5 e dx = e 4,5 = 26,4% 4,5 1 6
P(X 6) = 1 P ( X < 6) = 1
Ou considerando Y: n de avarias no intervalo [0,6] horas, como Y segue Po(1/4,5), vem que P(X 6) = P(Y=0) = e-t = e-(1/4,5)t = e-(6/4,5) = 26,4%
6
P( X 6 X 4) P( X 6) e 4,5 b) P(X 6/ X 4) = = = 4 = 64,1% = P( X 2) P( X 4) P( X 4) e 4 ,5

c) Y: n de avarias no intervalo [0,6] horas P(Y=2) =
e
6 4,5
x(6 / 4,5) 2 = 23,4% 2!
Exerccio 5
Sabe-se que um determinado modelo de lmpadas apresenta no perodo de vida til (3625 horas) um MTBF de 12 000 horas. Calcular: a) A probabilidade de falha de uma ou mais lmpadas, num conjunto de 10, no perodo de vida til.
b) Quantas lmpadas, de um conjunto de 1 000, estaro provavelmente em
funcionamento aps 2 000 horas de utilizao.

Resoluo
a) Rs = e
3625 12000
= e 0,302 = 73,9%
Em 10, 1 - P(falhar nenhuma) = 1 - 0,73910 = 1 0,0488 = 95,12% b) Rs = e

2000 12000
= e 0,1667 = 84,6%
Logo, 0,846x1000 lmpadas = 846
Estatstica Aplicada
123
Manual de Exerccios
Exerccio 6
Num grande centro comercial existem 3 telefones pblicos, colocados estrategicamente a fim de satisfazer adequadamente os utentes. A observao prolongada do funcionamento dos telefones levou a concluir que as probabilidades dos 3 telefones, T1, T2 e T3 se encontrarem avariados so, respectivamente, 0,15, 0,2 e 0,25 e que as avarias so independentes. O grupo de telefones satisfaz minimamente o servio se pelo menos 2 estiverem sem avarias. Qual a probabilidade de pelo menos dois destes telefones estarem sem avarias?
Resoluo
P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem sem avarias) = 0,095+0,51=60,5% P(2 sem avarias) = 0,15*0,2*0,75+0,85*0,2*0,25+0,15*0,8*0,25=9,5% P(3 sem avarias) = 0,85*0,8*0,75=51%
Exerccio 7
Um sistema constitudo por 5 componentes iguais, sendo 0.05 a probabilidade de um elemento falhar ao longo de qualquer dia da semana. No caso de nenhum elemento avariar o sistema funciona normalmente; se um dos elementos avariar o sistema funciona com probabilidade 0.7; se mais de um elemento avariar o sistema no funciona. Calcule: a) b) a probabilidade do sistema funcionar ao longo do dia. a funo de probabilidade do n de falhas registadas nos seus componentes ao longo de um dia, indicando o valor mdio de tal distribuio.
Resoluo
a) P(sist. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar) = (0,955)* 1 + (5*0,954*0,05)*0,7 = 0,7738 + 0,1425 = 91,63% b) Bi(n=5;p=0,05) Valor mdio=5*0,05=0,25
Estatstica Aplicada
124
Manual de Exerccios
CONTROLE ESTATSTICO DE QUALIDADE
Exerccios
Exerccio 1
Uma empresa fabrica e comercializa condutores elctricos cujas condies de controlo da produo e aceitabilidade a seguir se indicam (relativos resistncia de um componente em ):

Caracterstica sob controlo: LIC: 49,8775 LSC: 50,1225 n=16

=0,25
Proceder-se- paragem da produo sempre que os limites de controlo sejam desrespeitados Um condutor considerado no defeituoso se a sua resistncia em estiver compreendida entre [49,530; 50, 470]
Nestas condies, determine: a) b) c) O valor da norma 0 A probabilidade de se proceder a uma paragem indevida da produo A probabilidade de, estando a norma a ser cumprida, se produzir um
artigo defeituoso.
Resoluo
X: resistncia de um componente em
X N ( ; (0,25) 2 )
a)
LIC =
c n
c n
= 49,8775
LSC = +
= 50,1225
c n
Como LIC + LSC = 100 vem que Logo =100/2 = 50
+ +
c n
= 2 = 100
Estatstica Aplicada
125
Manual de Exerccios
b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(49,8775 X 50,1225 sendo =50) = 1 - P(
49,8775 50 50,1225 50 X )= 0,25 0,25 16 16
1- P(-1,96 X 1,96) = Na tabela da Normal, vem D(1,96) = 0,95 donde 1 0,95 = 5% c) P(produzir um artigo defeituoso, sendo a norma respeitada) =
49,53 50 50,47 50 X )= 0,25 0,25 16 16
1 P(49,53 X 50,47 sendo =50) = 1 - P(
1 - P(-1,88 X 1,88) = Na tabela da Normal, vem D(1,88) = 0,9399 donde 1 0,9399 = 6,01%
Exerccio 2
A empresa TRADECHO, SA mantm um diferendo com os seus principais clientes, que afirmam que os produtos produzidos (em srie) por esta empresa no obedecem s normas de qualidade estabelecidas e que so:
-
a norma para o comprimento mdio das peas de 20 cm; a norma para a varincia de 4 e est a ser cumprida; a amplitude do intervalo de controle para a mdia deve ser de 1,96; a dimenso das amostras a extrair de 16
Afirmam os clientes que a probabilidade de parar indevidamente o processo produtivo superior quela que decorre das normas.
Estatstica Aplicada
126
Manual de Exerccios
a) Determine a probabilidade referida. b) Represente a carta de controle para a mdia c) A recolha de 5 amostras forneceu os seguintes resultados para a mdia: 20,05 19,90 20,00 20,30 20,15
Qual a medida a tomar?

Resoluo
X: comprimento das peas em cm

X N ( ; 4)
a) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(20-1,96/2 X 20+1,96/2 sendo =20) = 1 - P(
0,98 0,98 X )= 2 2 16 16
1- P(-1,96 X 1,96) = Na tabela da Normal, vem D(1,96) = 0,95 donde 1 0,95 = 5% b) e c) Mdia Amostral (cm) 20,98 20
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Amostra 5
20,5
19,90
20
20,3
20,15
19,02
No necessrio parar o processo produtivo (valores dentro dos limites de controlo).
Estatstica Aplicada
127
Manual de Exerccios
Exerccio 3
Numa empresa procede-se ao exame das condies de produo relativas durao (em horas) das lmpadas fabricadas (produo em srie). Sabe-se que o desvio-padro da durao de uma lmpada de 100 horas. O Departamento de Produo construiu o seguinte intervalo para a durao mdia de uma lmpada, a partir de uma amostra de dimenso 100:
[983,55; 1016,45]
parando-se o processo produtivo se o valor mdio amostral se situar fora deste intervalo. a) Calcule o valor adoptado para a norma (0) b) Determine a probabilidade de se parar indevidamente o processo produtivo.
Resoluo
X: durao das lmpadas em horas

X N ( ; (100) 2 ) c n n
a) LIC = LSC = +
= 983,55
= 1016,45
c n
Como LIC + LSC = 2000 vem que Logo =2000/2 = 1000 h
+ +
c n
= 2 = 2000
b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(983,55 X 1016,45 sendo =1000) = 1 - P(
983,55 1000 1016,45 1000 X )= 100 100 100 100
1- P(-1,645 X 1,645) =
Estatstica Aplicada
128
Manual de Exerccios
Na tabela da Normal, vem D(1,645) = 0,9 donde 1 0,9 = 10%

Exerccio 4
O novo Conselho de Administrao da empresa de componentes elctricas Alta Tenso, SA resolveu efectuar um estudo aprofundado sobre o controle estatstico de qualidade das peas produzidas. Assim, definiu com o director de produo os aspectos considerados relevantes no controle da durao mdia das componentes:
-
o limite superior de qualidade (LSC) deve ser de 10,8 milhares de horas a amplitude do intervalo no deve exceder 1,96 milhares de horas a probabilidade de se parar indevidamente a produo de 5%
Sabe-se ainda que o desvio padro da durao de uma componente de 4 mil horas. a) Determine a dimenso da amostra que necessrio recolher para cumprir as condies definidas.
b) Calcule a norma.
Resoluo
X: durao das componentes em milhares de horas

X N ( ; ( 4) 2 ) c n
a) LSC = +
= 10,8
D(c)= 5% logo c= 1,96

2
c n
1,96 logo 2
c n
1,96 * 4
n
1,96 n 64 1,96 * 4 64
b) LSC = +
= 10,8 logo = 10,8 -
= 9,82
Exerccio 5
O director de produo da empresa DISLIX, SA pretende implementar um sistema de controle interno de qualidade de um determinado tipo de geradores fabricados em srie. Para tal, procede verificao da produo de energia
Manual de Exerccios
elctrica (em kws/hora) tendo e vista a construo de um intervalo de controle para a produo mdia de energia de um gerador que cumpra os seguintes objectivos:
-
Norma de produo para a mdia: 10 A amplitude do intervalo no deve exceder 3,92 A probabilidade de se parar indevidamente a produo no deve exceder 5%
Sabe-se que o desvio padro da produo da energia elctrica de um gerador de 4 kws/hora e que a varivel segue distribuio Normal. a) Determine a dimenso mnima da amostra a utilizar para o controle de produo.
b) Represente a carta de controle para a mdia.
Resoluo
X: energia elctrica produzida em kws/hora

X N ( ; ( 4) 2 )
a) D(c)= 5% logo c= 1,96

2
c n
3,92 logo 2
1,96 * 4
n
3,92 n 16
b) Mdia Amostral (cm) 11,96
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Amostra 5
10 8,04 LIC =
c n c n
= 10
1,96 * 4 16 16
= 8,04 = 11,96
LSC = +
= 10 +
1,96 * 4
Estatstica Aplicada
130
Manual de Exerccios
TRATAMENTO ESTATSTICO DE INQURITOS

Exerccio 1
Exerccios
A empresa BrasFruta Lda est a instalar-se em Portugal com um produto inovador, um concentrado de fruta semelhante a um sumo de fruta natural. A inteno vender o produto em cafs, esplanadas e bares que passariam a dispor de uma imitao perfeita de um sumo acabado de fazerva um preo vantajoso. Atravs de um estudo qualitativo com consumidores, conseguiu-se apurar que existia uma grande sensibilidade ao preo. Apesar de haver uma preferncia generalizada por sumos naturais face a refrigerantes, os consumidores mostravam-se cpticos em relao qualidade quando se falav em preos baixos. Entendeu-se ento levantar a seguinte questo: a sensibilidade ao preo afectada pelo poder de compra dos clientes? Numa sondagem efectuada a 1973 clientes potenciais, confrontaram-se os inquiridos com trs alternativas: adquirir sumo natural a preo elevado, adquirir sumo natural a preo baixo ou adquirir refrigerantes. A sondagem revelou que, dos clientes classes A/B/C1, 598 pagariam um preo mais elevado pelo sumo natural, enquanto 212 no estariam dispostos a gastar tanto. Em relao aos 977 clientes das classes C2/D/E, 164 s consumiriam sumo natural se o preo fosse baixo e 285 preferiam refrigerante. Represente adequadamente e interprete a informao contida nestes dados. Utilize um nvel de significncia de 1%.
Resoluo
Preo Elevado A/B/C1 C2/D/E Total 598 528 1126
Preo Baixo 212 164 376
Refrigerante 186 285 471
Total 996 977 1973
As concluses foram retiradas pelo recurso anlise correlacionada atravs do teste do qui-quadrado. Estes testes foram elaborados sobretudo com o intuito
Estatstica Aplicada
131
Manual de Exerccios
de segmentar o mercado. As frequncias
foram utilizadas para analisar o
mercado como um todo e para interpretar o resultado dos testes de correlao, para os quais se convencionou a adopo de um nvel de significncia de 5%, considerado razovel face aos valores normalmente utilizados. Para o clculo das frequncias esperadas, procedeu-se aplicao de
eij = n i . * n. j n
, de que resultou a seguinte tabela:
Preo Elevado A/B/C1 C2/D/E Total nij eij nij eij 598 568.4 528 557.6 1126
Preo Baixo 212 189.8 164 186.2 376
Refrigerante 186 237.8 285 233.2 471
Total 996 977

1973
Ho: As variveis so independentes H1: As variveis no so independentes
crtico (GL=2; =0,05)=5,991 observado = 31,141
Vem que o
obsv.=31,141 maior do que o valor obtido a partir da tabela,
que 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que, no grupo estudado, h associao entre as variveis. Em mdia, o poder de compra do consumidor influencia a sensibilidade ao preo.
Exerccio 2
Aos exames de primeira poca de determinada disciplina compareceram 105 alunos, dos quais 20 no tinham prestado qualquer prova durante o ano. O nmero de aprovaes foi de 33, das quais 3 foram de alunos que no tinham efectuado provas durante o ano.
Estatstica Aplicada
132
Manual de Exerccios
Diga, com base nestes elementos, se, para um nvel de significncia de 5%, se pode afirmar que existe independncia entre a comparncia (ou no) a provas durante o ano de aprovao (ou no) em exame.
Resoluo
Aprovaes Comparecem Sim No Total
Aprovado 30 3 33
Reprovado 55 17 72
Total 85 20 105
Ho: As variveis so independentes H1: As variveis no so independentes crtico (GL=2; =0,05)=3,84 observado = 3,122
Vem que o
obsv.= 3,122 menor do que o valor obtido a partir da tabela.
Logo, a hiptese Ho no ser rejeitada (h independncia).
Exerccio 3
Com o objectivo de testar se existe relao entre a formao do gerente de uma dependncia bancria e a respectiva performance, construiu-se a seguinte tabela de contingncia, relativa a 300 balces de diferentes bancos: Formao Gerente Vol. Negcios Baixo Mdio Elevado
Mdia 44 55 51
Superior 52 43 55
Que conclui, a um nvel de significncia de 1%?

Resoluo
Estatstica Aplicada
133
Manual de Exerccios
Valores esperados: Formao Gerente Vol. Negcios Baixo Mdio Elevado crtico (GL=2; =0,01)=9,21 observado = 2,2876
(44 48) 2 (55 53) 2 + ... + = 2,2876 > 9,21 48 53
Mdia 48 49 53
Superior 48 49 53
Valor obsv. est. teste = Vem que o
obsv.= 2,2876 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 4
Pretendendo-se analisar o comportamento do volume de divisas ao longo do ano, deu-se particular ateno influncia exercida pelas remessas de emigrantes. Assim, o ano foi dividido em duas pocas: poca de Ponta, compreendendo os meses de vinda de emigrantes (Vero e Natal) e poca Normal (restantes meses). Assim, observou-se o nvel de Disponibilidades Lquidas sobre o Exterior (DLX) para cada ms, tendo-se obtido: Volume DLX Baixo/Mdio 150 20 Elevado 50 80
poca Normal Ponta
A um nvel de significncia de 5%, que pode concluir?
Resoluo
Estatstica Aplicada
134
Manual de Exerccios
Valores esperados: poca Normal Ponta Volume DLX Baixo/Mdio 113,33 6,66 Elevado 86,66 43,33
crtico (GL=1; =0,05)=5,991 observado = 85,069 Valor obsv. est. teste = Vem que o
(150 113,33) 2 (80 43,33) 2 + ... + = 85,069 > 3,84 113,33 43,33
Exerccio 5
Num estudo que pretendia averiguar a existncia de relao entre a procura de moeda e a taxa de juro, procedeu-se recolha peridica de elementos sobre essas variveis, construindo-se a seguinte tabela de contingncia: Taxa juro Proc. Moeda 0-10 10-45 45-70 Reduzida 20 20 250 Mdia 30 400 30 Elevada 200 30 20
Utilizando um nvel de significncia de 5%, que concluso pode tirar?

Resoluo
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Taxa juro Proc. Moeda 0-10 10-45 45-70
Reduzida 72.5 130.5 87
Mdia 115 207 138
Elevada 62.5 112.5 75
Estatstica Aplicada
135
Manual de Exerccios
crtico (GL=4; =0,05)=9,49 observado = 1183,7
Vem que o
Exerccio 6
Um investigador seleccionou trs amostras de estudantes, A, B e C, que fazem parte de um determinado projecto de estudo e aplicou-lhes uma escala de atitudes com o objectivo de conhecer as suas opinies em relao ao projecto. Os resultados de uma amostra de 140 estudantes foram os seguintes: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva
A 30 10
B 30 20
C 10 40
Utilizando um nvel de significncia de 5%, que concluso pode tirar?

Resoluo
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva
A 20 20
B 25 25
C 25 25
crtico (GL=2; =0,05)=3,84 observado = 30 Vem que o obsv.= 30 maior do que o valor obtido a partir da tabela,
Estatstica Aplicada
136

Estatistica Aplicada Exercicos Resolvidos

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Estatistica Aplicada Exercicos Resolvidos

Enviado por

Direitos autorais:

Formatos disponíveis

104

45 45 48 49 76 89 105 105 105 110 114 114

1.1. Definies Gerais

1.1.2. Variveis ou atributos

1.2. A Estatstica Descritiva e a Estatstica Indutiva

POPULAO OU UNIVERSO Amostragem AMOSTRA

Previses Estimao Erros INFERIR DA AMOSTRA PARA O UNIVERSO

TRATAMENTO E ANLISE DA AMOSTRA

Grficos; tabelas; medidas descritivas

2.1. Variveis Qualitativas

ni ; ni: n de vezes que cada modalidade da varivel foi observada. n

2.2. Variveis Quantitativas Discretas

2.3. Variveis Quantitativas Contnuas

Frequncias absolutas n1 nj n n: dimenso da amostra

2.4. Medidas de localizao

Mdia aritmtica simples

Dados classificados (isto , agrupados numa tabela de frequncias) Variveis discretas

Mdia ponderada dos valores de X

Dados classificados (isto , agrupados numa tabela de frequncias) Variveis contnuas

Mdia ponderada dos pontos mdios das classes

onde ci o ponto mdio de cada classe (

lim . inf . + lim . sup . ) 2

0.5 FL inf xamp. classe mediana FL sup FL inf

2.5. Medidas de ordem

2.6. Medidas de assimetria

direita) Coeficiente de assimetria de Bowley (g):

2.7. Medidas de disperso

Dados classificados Variveis discretas

Dados classificados Variveis contnuas

2.8. Anlise da concentrao

2.8.1 Curva de Lorenz

2.8.2 ndice de Gini O ndice de Gini calculado pela seguinte expresso

2.9. Estatstica Descritiva Bidimensional

Ordens (ranks) das observaes de X e de Y, respectivamente

Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.

[0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50]

fi 10% 25% 35% 15% 10% 5% 1

fi/hi 0.1 0.125 0.175 0.015 0.01 0.002

Fi 10% 35% 70% 85% 95% 100%

= (0,5 x10%) + (2 x 25%) + ... + (37.5 x5%) = 7,325

A distribuio assimtrica positiva ou enviesada esquerda.

fi 10% 25% 35% 15% 10% 5% 1

ni 1000x10%=100 250 350 150 100 50 n=1000

Atributo 100x0.5=50 250x2=500 1400 1500 2000 1875 7325

pi (=Fi) 0.1 0.35 0.7 0.85 0.95 1

qi 0.007 0.075 0.266 0.471 0.744 1

50 + 500 + 1400 7325

0 0 0,2 0,4 0,6 0,8 1

Lucro total 600 4400 14000 7500 3500 30000

pi (=Fi) 0.1 0.4 0.8 0.95 1

qi 0.02 0.16(6) 0.63(3) 0.883(3) 1

0,546(6) = 0,243 2,25

exprima as peso em funo da altura.

180 Altura (cm)

150 50 60 70 Peso (kg) 80 90

b) No exemplo, r = 0,90681871, isto , existe uma correlao positiva forte

entre as duas variveis, quase perfeita. c)

180 Altura (cm)

150 50 60 70 Peso (kg) 80 90

exprima as vendas em funo das despesas em publicidade.

a) Para comparar a disperso das duas distribuies, necessrio calcular os

coeficientes de variao (medidas de disperso relativa): Dados no-classificados

sx 69,9408 = = 0,39 x 21,429