Escolar Documentos
Profissional Documentos
Cultura Documentos
NDICE
1. INTRODUO ................................................................................. 1.1 Definies Gerais ........................................................................ 1.1.1. Populao 1.1.2. Variveis ou atributos 1.1.3. Processo de amostragem 1.2 A Estatstica Descritiva e a Estatstica Indutiva ................... 2. ESTATSTICA DESCRITIVA 2.1 Variveis Qualitativas ................................................................. 2.2 Variveis Quantitativas Discretas ............................................. 2.3 Variveis Quantitativas Contnuas ............................................ 2.4 Medidas de Localizao ............................................................. 2.4.1. Mdia 2.4.2. Mediana 2.4.3. Moda 2.5 Medidas de Ordem ...................................................................... 2.6 Medidas de Assimetria ............................................................... 2.7 Medidas de Disperso ................................................................ 2.7.1. Disperso Absoluta 2.7.2. Disperso Relativa 2.8 Anlise de Concentrao ........................................................... 2.8.1. Curva de Lorenz 2.8.2. ndice de Gini 21 17 18 19 6 8 8 10 11 13 4 5
2.9 Estatstica Descritiva Bidimensional ........................................ 2.9.1. Diagrama de disperso 2.9.2. Regresso simples 2.9.3. Correlao linear 2.9.4. Correlao ordinal 3. ESTATSTICA INDUTIVA 3.1 Noes bsicas de probabilidades ........................................... 3.2 Probabilidade condicionada ...................................................... 3.3 Funes de Probabilidade ...................................................... 3.4 Estimao por Intervalos ........................................................ 3.5 Testes de hipteses ................................................................ 3.6 Aplicaes Estatsticas: Fiabilidade ......................................... 3.6.1. Conceito de fiabilidade 3.6.2. Fiabilidade de um sistema 3.7 Aplicaes Estatsticas: Controlo Estatstico de Qualidade .. 3.8 Aplicaes Estatsticas: Tratamento Estatstico de Inquritos . 3.8.1. Teste de independncia do qui-quadrado 3.8.2. Tratamento de inquritos BIBLIOGRAFIA ANEXOS
24
50 50 53 55 82 95 113
118 124
1. INTRODUO
Inicialmente, a actividade estatstica surgiu como um ramo da Matemtica. Limitava-se ao estudo de medies e tcnicas de contagem de fenmenos naturais e ao clculo de probabilidades de acontecimentos que se podiam repetir indefinidamente. Actualmente, os mtodos estatsticos so utilizados em muitos sectores de actividade, tendo como algumas aplicaes estudos de fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento de inquritos, sondagens, modelos economtricos, previses, etc. Exemplo de uma estatstica: os valores da inflao entre 1980 e 1990 constituem uma estatstica. Fazer estatstica sobre estes dados poderia consistir, por exemplo, em traar grficos, calcular a inflao mdia trimestral ou prever a inflao para 1991. A anlise de um problema estatstico desenvolve-se ao longo de vrias fases distintas: (i) Definio do Problema Saber exactamente aquilo que se pretende pesquisar; estabelecer o objectivo de anlise e definio da populao (ii) Amostragem e Recolha de Dados Fase operacional. o processo de seleco e registo sistemtico de dados, com um objectivo determinado. Os dados podem ser primrios (publicados pela prpria pessoa ou organizao) ou secundrios (quando so publicados por outra organizao).
(iii) Tratamento e Apresentao dos Dados Resumo dos dados atravs da sua contagem e agrupamento. a classificao de dados, recorrendo a tabelas ou grficos. (iv) Anlise e Interpretao dos Dados A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o comportamento do fenmeno em estudo (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamentam na teoria da probabilidade.
As propriedades de uma populao so estudadas observando um certo nmero de variveis ou atributos. As variveis podem ser de natureza qualitativa ou quantitativa. As variveis quantitativas podem ainda dividir-se entre discretas e contnuas. As variveis discretas assumem apenas um nmero finito numervel de valores. As variveis contnuas podem assumir um nmero finito no numervel ou um nmero infinito de valores. Exemplo: um conjunto de empresas pode ser analisado em termos de sector de actividade (atributo qualitativo), nmero de trabalhadores (atributo quantitativo discreto), rcio de autonomia financeira (atributo quantitativo contnuo), etc
1.1.3. Processo de amostragem Para conhecer de forma completa a populao, podem efectuar-se: recenseamentos (indagao completa de todos os elementos da populao); este processo , no entanto, tipicamente moroso e dispendioso, sendo esses os motivos porque os Censos so realizados apenas em cada 10 anos. estudos por amostragem (observao de apenas um subconjunto, tido como representativo do universo). As tcnicas de recolha de amostras garantem a sua representatividade e aleatoriedade.
1.2.
Para alm do ramo de amostragem, a estatstica compreende dois grandes ramos: a estatstica descritiva e a estatstica indutiva. A estatstica descritiva o ramo da estatstica que se encarrega do tratamento e anlise de dados amostrais. Assim, depois de recolhida a amostra de acordo com tcnicas que garantem a sua representatividade e aleatoriedade, fica disponvel um conjunto de dados sobre o universo em bruto ou no classificados. Para que seja possvel retirar qualquer tipo de concluses, tornase necessrio classificar os dados, recorrendo a tabelas de frequncias e a representaes grficas, isto , preciso tratar os dados. Depois de tratados, ser possvel proceder anlise dos dados atravs de vrias medidas que descrevem o seu comportamento: localizao, disperso, simetria dos dados, concentrao, etc. So disso exemplo indicadores numricos bem conhecidos como a mdia ou a varincia. A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. De facto, a amostra no mais do que um passo intermdio e exequvel de obter informaes sobre o verdadeiro objecto de estudo, que o universo. A estatstica indutiva (ou inferncia estatstica) garante a ligao entre amostra e universo: se algo
se concluiu acerca da amostra, at que ponto possvel afirmar algo semelhante para o universo? nesta fase que se procuram validar as hipteses formuladas numa fase prvia exploratria. Claro que o processo de induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. As inferncias indutivas so assim elaboradas medindo, ao mesmo tempo, o respectivo grau de incerteza. Da que, na ficha das tcnicas das sondagens eleitorais, por exemplo, apaream referncias ao nvel de confiana associado aos resultados e ao erro cometido. O esquema seguinte ilustra a roda da disciplina de estatstica, relacionando os seus diferentes ramos:
Estatstica Descritiva
Inferncia Estatstica
2. ESTATSTICA DESCRITIVA
Os resultados da observao de um atributo sobre os elementos do conjunto a analisar constituem os dados estatsticos. O ramo da estatstica que se ocupa do tratamento, apresentao e anlise de dados amostrais denomina-se de estatstica descritiva.
fi =
Exemplo: 68 empresas agrupadas por sector de actividade Uma forma de resumir a informao contida nos dados construir uma tabela de frequncias em que se consideram as diferentes modalidades que o sector de actividade pode tomar:
Sector de actividade Indstria transformadora Construo e obras pblicas Comrcio e servios Financeiro Segurador Total N de empresas (ni) 25 6 14 19 4 68 % de empresas (fi) 36,8% 8,8% 20,6% 27,9% 5,9% 1
Diagrama de barras Para cada modalidade, desenha-se uma barra de altura igual frequncia absoluta ou relativa (as frequncias relativas so de preferir, pois permitem a comparao de amostras de diferentes dimenses).
Diagrama sectorial ou circular Esta representao constituda por um crculo, em que se apresentam tantos sectores quantos as modalidades em estudo. O ngulo de cada sector proporcional s frequncias das classes, fazendo corresponder o total da amostra (n) a 360 (por exemplo, para a indstria transformadora, o ngulo ser de 360x36,8%=132,3). Geralmente, juntamente com a identificao da modalidade, indica-se a frequncia relativa respectiva.
Manual Tcnico de Formador 9
6% 28% 36%
IT COB CS F S
21%
9%
0 1
Manual Tcnico de Formador
12
23
34
45
10
Regra de construo de classes (pressupe a formao de classes de igual amplitude) - Nmero de classes a constituir Depende de n = dimenso da amostra Se n25, o nmero de classes a constituir deve ser 5 Se n<25, o nmero de classes a constituir deve ser n - Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferena entre o valor mximo e o valor mnimo observados, ento a amplitude de cada classe ser:
Valor mximo da varivel observado Valor mnimo da varivel observado N de classes a constituir
11
Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn] Total
Frequncias relativas f1 fj fn 1
A distribuio de frequncias representa-se atravs de um histograma. Um histograma uma sucesso de rectngulos adjacentes, em que a base uma classe e a altura a frequncia (relativa ou absoluta) por unidade de amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A rea total do histograma a soma das frequncias relativas, isto , 1.
fi/hi
90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6
racio
12
1. Esta distribuio permite visualizar o tipo de distribuio e deve salientar alguns aspectos mais relevantes desta (moda, classe modal, ...). Como as classes podem ter amplitudes diferentes, para que todos os rectngulos (colunas) sejam comparveis necessrio corrigir as frequncias das classes (calculando as frequncias que se teria se a amplitude de todas as classes fosse igual e igual a 1)
2. prefervel representar o histograma com fi/hi do que com ni/hi uma vez
que deste modo possvel comparar distribuies com diferente nmero de observaes amostrais. Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi) acumuladas:
Rcio (X) [0; 0.5[ [0.5; 1[ [1; 1.5[ [1.5; 2[ [2; 3[ [3; 6] Total N empresas (ni) 4 22 26 10 4 2 68 % empresas (fi) 5.9% 32.4% 38.2% 14.7% 5.9% 2.9% 1 Ni Fi 4 5.9% 4+22 5.9%+32.4% 4+22+26 76.5% 4+22+26+10 91.2% 66 97.1% 68 100%
x =
1 n
n i =1
xi
13
x =
1 n
n i =1
ni x i
n i =1
f i xi
Exemplo 2:
x =
ni ci
f i ci
Exemplo 3:
= 1,2705
A mdia uma medida de localizao que, geralmente, indica o valor central da distribuio, entendido como o valor em torno do qual se distribuem os valores observados. Desta forma, a mdia muitas vezes utilizada como valor representativo da amostra. No entanto, a mdia tem o grande inconveniente de ser sensvel a valores muito extremados ou aberrantes da distribuio (outliers). Em casos desses, a mdia deixa de ser um valor que aparece na parte central da distribuio para ser empurrada para os extremos. Nestes casos, prefervel recorrer informao complementar fornecida por outras medidas de localizao, como a moda e a mediana, que se definem a seguir.
2.4.2. Mediana (Me) A mediana no se calcula a partir do valor de todas as observaes, mas a partir da posio dessas observaes.
14
Me = x n+1
2
Se n fr par,
xn + xn Me =
Exemplo Para n=5 (mpar) 8,9 13
2 2
+1
Me =
x 5+1 =
2
x3 = 13,5
x6 + Me =
2
x6
2
+1
x3 + x 4 11,7 + 12,5 = 2 2
= 12,1
Dados classificados A mediana o valor tal que Fi = 0,5 Variveis discretas Se existe um valor de xi para o qual Fi = 0,5, ento fala-se em intervalo mediano. Se no existe nenhum valor de xi para o qual Fi = 0,5, ento a mediana o primeiro valor para o qual Fi > 0,5.
Manual Tcnico de Formador 15
Exemplo 2: Mediana = 1 (com Fi = 0.7, primeiro valor que ultrapassa 0,5), o que quer dizer que pelo menos em metade das embalagens apareceu 1 artigo defeituoso ou menos.
Variveis contnuas Em geral, determina-se o valor para o qual Fi = 0,5 atravs de uma regra de trs simples, atendendo a que as frequncias acumuladas variam uniformemente dentro de cada classe. Exemplo 3: Classe mediana (classe a que corresponde frequncia acumulada 0,5): 1 : Fi =0,383 1,5 : Fi = 0,765 Clculo da mediana: 0,765 - 0,383 ------------ 1,5 - 1 0,5 0,383 -------------- Me 1 Me = 1+((0,5x0,17)/0,382)= 1,15 Isto , 50% das empresas apresentam rcio de autonomia financeira inferior a 1,15. De uma forma geral:
Me = L inf +
2.4.3. Moda (Mo) Variveis discretas A moda valor de X para o qual fi mximo, isto , o valor mais frequente da distribuio.
Manual Tcnico de Formador 16
Exemplo 2: Mo=0 (com fi=0,4) Variveis contnuas A classe modal a classe de valores de X para o qual fi/hi mximo, isto , a classe a que corresponde maior frequncia por unidade de amplitude. Exemplo 3: Classe modal: [1-1,5[
Varivel discreta O quantil de ordem p o primeiro valor de x para o qual Fi>p. Varivel contnua Calcula-se por uma regra de trs simples, como a mediana. De uma forma geral:
Q1 = L inf +
25% maiores
Q1
Mnimo17
25% menores
A representao grfica destas medidas designa-se de diagrama de extremos e quartis e serve para realar algumas caractersticas da amostra. Os valores da amostra compreendidos entre os 1 e 3 quartis so representados por um rectngulo (caixa) com a mediana indicada por uma barra. Seguidamente, consideram-se duas linhas que unem os meios dos lados do rectngulo com os extremos da amostra. Utilizando os valores do exemplo 3 (Q1=0,795; Q3=1.48), resulta o diagrama da pgina anterior. Esta distribuio est fortemente concentrada em torno de valores baixos da varivel (rcio de autonomia financeira), j que 75% dos valores se encontram num espectro muito reduzido. Ao contrrio, 25% das empresas correspondem a um espectro muito amplo, entre 1,48 (Q3) e 6. Isto , h muitas empresas com baixo rcio de autonomia financeira (at valores um pouco acima de 1) e poucas empresas com rcios elevados. A distribuio diz-se enviesada ou simtrica esquerda. Ou seja, a partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos dados e a sua maior ou menor concentrao:
Dados simtricos
Assimetria direita
Assimetria esquerda
X = Me = Mo, a distribuio diz-se simtrica X > Me > Mo, a distribuio diz-se assimtrica positiva (ou enviesada
esquerda)
X < Me < Mo, a distribuio diz-se assimtrica negativa (ou enviesada
direita)
18
(Q3 Q 2) (Q 2 Q1) Q3 Q1
Se g = 0 ..............a distribuio simtrica positiva ou equilibrada Os quartis esto mesma distncia da mediana. Se g > 0 ..............a distribuio assimtrica positiva ou puxada para a esquerda (se fr = 1, assimetria mxima) A mediana desliza para o lado do Q1, logo Q3-Q2 > Q2-Q1 Se g < 0 ..............a distribuio assimtrica negativa ou puxada para a direita (se fr = -1, assimetria mxima) A mediana desliza para o lado do Q3, logo Q2-Q1 > Q3-Q2
Q1 Q2
Q3
Assimtrica positiva
Q2 Q3
Q1
Assimtrica negativa
Em relao mediana Amplitude inter-quartis = Q = Q3 Q1 Significa que 50% das observaes se situam num intervalo de amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior (menor) a disperso em torno da mediana.
19
(ii)
Em relao mdia Varincia amostral: mede os desvios quadrticos de cada valor observado em relao mdia, havendo pouca disperso se os desvios forem globalmente pequenos, e havendo muita disperso se os desvios forem globalmente grandes. Dados no-classificados 2 1 n 2 s = xi x n i =1
1 s = n
2
n i =1
ni xi x =
n i =1
fi xi x
1 s = n
2
n i =1
ni ci x
n i =1
fi ci x
onde ci o ponto mdio de cada classe i. Desvio-padro: Medida de disperso com significado real, mas que s possvel calcular indirectamente, atravs da raiz quadrada da varincia. Est expressa nas mesmas unidades da varivel.
2.7.2 Medidas de disperso relativa Muitas vezes, avaliar a disperso atravs de um indicador de disperso absoluta no conveniente, assim como comparara a disperso de duas distribuies, uma vez que estas medidas vm expressas na mesma unidade da varivel como o caso, por exemplo, da varincia. Assim, de esperar que os valores da varincia sejam mais elevados quando os valores da varivel so maiores, o que no significa que a distribuio seja muito dispersa. Para
20
Disperso relativa =
Coeficiente de variao
CV = s x100% x
Outras medidas
Q3 Q1 Q2
Estas medidas no esto expressas em nenhuma unidade, e permitem comparar disperses entre duas amostras, pois no so sensveis escala (eventualmente diferente) em que as variveis estejam expressas.
21
num s indivduo, temos uma situao extrema de mxima concentrao. Em geral, interessa medir o grau de concentrao em situaes intermdias.
Para analisar a concentrao, existem dois instrumentos: a Curva de Lorenz e o ndice de Gini.
2.8.1 Curva de Lorenz O objectivo comparar a evoluo das frequncias acumuladas (Fi = pi) com a evoluo da soma dos valores da varivel (qi)
Quadro de dados
Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn[ Total ni n1 nj nn n Quantidade Freq.relativa Proporo atributo acumuladas atrib.acumul, yi p1 q1 yj yn pj pn=1 qj qn=1
Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une a curva de Lorenz. Se houver igual distribuio, a frequncia das observaes deve ter uma evoluo igual proporo do atributo correspondente, isto , pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado, que designada de recta de igual repartio. Quanto mais a curva se afastar da recta, maior a concentrao. A zona entre a diagonal e acurva de Lorenz designa-se, por isso, de zona de concentrao.
22
( pi qi )
n 1 i =1
G=
i =1
pi
Quando G = 0, a concentrao nula, havendo igual repartio. Caso o valor de G seja 1, a concentrao ser mxima. O valor de G varia entre 0 e 1, e quanto maior o seu valor, maior a concentrao. Exemplo Considere-se a seguinte amostra de dimenso 200, referente aos lucros obtidos por empresas de um dado sector industrial, expressas numa determinada unidade monetria.
Lucros [0; 50[ [50; 100[ [100; 200[ [200; 300[ [300; 500] Total ni 20 60 80 30 10 200 Lucro total 600 4400 14000 7500 3500 30000 pi (=Fi) 0.1 0.4 0.8 0.95 1 qi 0.02 0.16(6) 0.63(3) 0.883(3) 1
Curva de Lorenz 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1
23
( pi qi )
n 1 i =1
G=
i =1
= pi
Tanto pela anlise da Curva de Lorenz, como pelo valor do ndice de Gini, conclui-se que esta amostra apresenta concentrao moderada, encontrandose os valores razoavelmente repartidos.
Se existe alguma correlao entre os fenmenos ou variveis observadas A existir, se traduzvel por alguma lei matemtica, nem que tendencialmente A existir, se possvel medi-la
24
Para ilustrar o estudo de dados bivariados (valores emparelhados), considerese o exemplo seguinte referente ao peso e altura de 10 indivduos:
Indivduo A B C D E F G H I J
Peso (kg) 72 65 80 57 60 77 83 79 67 68
Altura (cm) 175 170 185 154 165 175 182 178 175 173
A representao grfica dos dados bivariados designa-se de diagrama de disperso. O diagrama de disperso uma representao grfica em que cada par de dados (xi, yj) representado por um ponto de coordenadas num sistema de eixos ordenados.
Diagrama de Disperso
190
170
160
2.9.2 Regresso Simples Por vezes, a representao grfica do conjunto de dados bivariados sugere o ajustamento de uma recta a este conjunto de pontos, indicando a existncia de uma tendencial correlao linear entre as duas variveis, como o caso do
25
exemplo atrs descrito. A essa recta chama-se recta de regresso de y sobre x, que permite descrever como se reflectem em y (varivel dependente ou explicada) as modificaes processadas em x (varivel independente ou explicativa). Essa recta torna possvel, por exemplo, inferir (em mdia) a altura de um indivduo, conhecendo o respectivo peso. Um dos mtodos mais conhecidos de ajustar uma recta a um conjunto de dados o Mtodo dos Mnimos Quadrados, que consiste em determinar a recta que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. Obtm-se assim a recta de regresso ou recta dos mnimos quadrados. Assim, se a recta de regresso obedecer seguinte frmula geral:
y = a + bx
o mtodo permite minimizar a soma dos desvios quadrticos yi - (a + bxi). Assim sendo, obtm-se:
b= xi y i n x y xi n x
2 2
a = y bx
Matematicamente, b designa o declive da recta. Em termos estatsticos, b corresponde ao coeficiente de regresso de y sobre x, que indica a variao mdia de y que acompanha uma variao unitria de x. O valor de a designa a ordenada na origem, isto , o valor que y assume quando x=0. No exemplo, vem:
Recta de Regresso
190
y = 0,9016x + 109,36
170
160
26
A equao desta recta traduz-se em Altura = 109,36 + 0,9016 x Peso Isto , se um indivduo pesar 70 kg, a altura esperada ser de 109,36 + 0,9016 x 70 = 172,472. Por cada kg de peso adicional, espera-se que a altura do indivduo aumente 0,9016 cm.
2.9.3 Correlao linear Quando, quer atravs do diagrama de disperso, quer atravs da recta de regresso, se verifica a existncia de uma associao linear entre as variveis, pode-se medir a maior ou menor fora com que as variveis se associam atravs do coeficiente de correlao linear r:
r= s xy s xx s yy , s xy =
n i =1
( xi x)( y i y )
Este indicador da correlao tem a vantagem de no depender das unidades ou da ordem de grandeza em que as variveis esto expressas. O coeficiente de correlao linear est sempre compreendido entre 1 e 1. Se r > 0, ento pode dizer-se que existe uma correlao positiva entre as variveis, isto , as variveis variam no mesmo sentido: um aumento (diminuio de x) provoca um aumento (diminuio) de y, mas menos que proporcional. Se r < 0, ento pode dizer-se que existe uma correlao negativa entre as variveis, isto , as variveis variam em sentidos opostos: um aumento (diminuio de x) provoca uma diminuio (aumento) de y, mas menos que proporcional. Se r = 0, ento pode dizer-se que as variveis no esto correlacionadas linearmente. Antes de se efectuar um estudo de correlao, deve-se procurar justificao terica para a existncia ou inexistncia de correlao. Caso contrrio, poder acontecer que variveis sem relao de causalidade entre si, variem num certo
27
sentido por razes exteriores. A esta correlao ilusria, chama-se correlao espria. Nos extremos, se r = 1 ou se r = -1, ento pode dizer-se que existe uma correlao positiva ou negativa perfeita, respectivamente, entre as variveis, isto , uma variao numa varivel provoca na outra uma variao exactamente proporcional no mesmo sentido ou em sentido contrrio. Isto , a correlao mxima. No exemplo, r = 0,90681871, isto , existe uma correlao positiva forte entre as duas variveis, quase perfeita.
2.9.4 Correlao ordinal Por vezes, as variveis vm expressas numa escala ordinal, isto , interessa mais conhecer a ordenao dos valores do que os valores observados propriamente ditos. Neste caso, em vez do coeficiente de correlao linear, calcula-se o coeficiente de correlao ordinal:
rs = 1 6
i =1
di
2
n(n 1)
, d i = Ri Ri
Exemplo Considere que 10 estudantes foram sujeitos a uma prova de avaliao no incio e no final do curso. No quadro abaixo, encontram-se as ordenaes desses 10 estudantes segundo as classificaes obtidas em cada uma das provas:
28
Aluno A B C D E F G H I J
di Rix - Riy 0 1 -1 1 1 0 2 1 -4 -1
Como no dispomos das classificaes dos alunos, mas sim das ordenaes das classificaes (do 1 ao 10 classificado), para avaliar a correlao existente entre as 2 provas necessrio calcular o coeficiente de correlao ordinal:
n
rs = 1 6
i =1
di
2
n(n 1)
= 1
A correlao positiva e elevada (rs varia entre 1 e 1), isto , os alunos que tiveram boa nota na prova inicial tiveram, em mdia, igualmente boa nota na prova final.
29
ESTATSTICA DESCRITIVA
Exerccios resolvidos
Exerccio 1 Considere a distribuio de 1000 empresas de um sector de actividade segundo os resultados lquidos (em milhares de u.m.):
Resultado Lquido [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total Frequncia. Relativa (%) 10 25 35 15 10 5 100
a) Represente a distribuio graficamente. b) Determine a mdia e a moda da distribuio. Qual o significado dos valores encontrados? c) Calcule as frequncias acumuladas e represente-as graficamente. Determine a mediana da distribuio. d) Determine os quartis da distribuio. Faa a sua representao grfica. e) Analise a (as)simetria da distribuio em causa.
f)
Resoluo
a)
fi/hi 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 10 20 30 40 50 60
30
hi 1 2 2 10 10 25
ci 0.5 2 4 10 20 37.5
b) x =
1 n
n i =1
ni c i
n i =1
f i ci
Em mdia, o resultado lquido de uma empresa de 7325 unidades monetrias. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 0,175. correspondente classe
[3; 5[, isto , os valores de resultado lquido mais provveis para uma empresa
situam-se entre 3000 u.m. e 5000 u.m. c) A representao grfica das frequncias acumuladas (ver tabela) designa-se de polgono integral:
Fi
1 0,8 0,6 0,4 0,2 0 0 20 40 60 80 100 120
Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [3; 5[ 3 : Fi=0,35 5 : Fi = 0,7
31
Clculo da mediana: 0,7 - 0,35 ------------ 5 - 3 0,5 0,35 -------------- Me 3 Me = 3 + ((2x0,15)/0,35) = 3,857 50% das empresas apresentam resultados lquidos inferiores a 3857 u.m. d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 3[ 1 : Fi=0,1 3 : Fi = 0,35 Clculo do Q1: 0,35 - 0,1 ------------ 3 - 1 0,25 0,1 -------------- Q1 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas apresentam resultados lquidos inferiores a 2200 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,7 15 : Fi = 0,85 Clculo do Q3: 0,85 - 0,7 ------------ 15 - 5 0,75 0,7 -------------- Q3 5 Q3 = 1 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas apresentam resultados lquidos inferiores a 8333 u.m.
e)
g' =
(Q3 Q 2) (Q 2 Q1) (8,333 3,857) (3,857 2,2) = = 0,4596 > 0 Q3 Q1 8,333 2,2
32
X [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total
ci 0.5 2 4 10 20 37.5
Res.Liq.Totais
G=
(0,1 0,007) + ... + (0,95 0,744) = 0,47 0,1 + 0,35 + 0,7 + 0,85 + 0,95
Curva de Lorenz 1
A distribuio dos resultados lquidos apresenta concentrao mdia (G=0,5 corresponde ao centro da escala possvel, entre 0 e 1). Por exemplo, 70% das empresas apresentavam resultados at 5000 u.m., mas isso representava apenas 26,6% do total de resultados das empresas da
0,2 0,8
0,6
0,4
amostra, o que sugere um tecido empresarial com muitas PMEs, mas em que cada uma tem baixo resultado lquido.
33
Exerccio 2 O quadro que se segue descreve a distribuio do rendimento anual (em milhares de u.m.) de 2500 famlias da populao de um pas:
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ N de famlias 250 375 625 750 375 125
a) Represente as frequncias acumuladas graficamente. b) Determine o rendimento mdio e mediano. c) Determine os 3 primeiros quartis. Que indicaes do sobre a (as)simetria? d) O que pode concluir quanto disperso? e) Calcule o ndice de Gini. O que conclui sobre a concentrao do rendimento?
Resoluo
a)
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[
% de famlias 10 15 25 30 15 5
Fi (%) 10 25 50 80 95 1
b) x = 1
n i =1
ni c i
n i =1
f i ci
34
Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [2; 5[ 5 : Fi = 0,5. Logo, a mediana 5 (50% das famlias tm rendimentos anuais at 5000 unidades monetrias).
c) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 2[ 3 : Fi = 0,25 25% das famlias apresentam rendimentos anuais inferiores a 2000 u.m.
Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,5 15 : Fi = 0,8 Clculo do Q3: 0,8 - 0,5 ------------ 15 - 5 0,75 0,5 -------------- Q3 5 Q3 = 5 + ((10x0,25)/0,3) = 13,333(3) 75% das famlias apresentam rendimentos anuais inferiores a 13333 u.m.
g' = (Q3 Q 2) (Q 2 Q1) (13,333 5) (5 2) = = 0,47 > 0 Q3 Q1 13,333 2
d) s x =
n i =1
2
fi * ci x
n i =1
fici 2 x = 82,286875
s x = s x = 82,286875 = 9,071
e)
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ Total
35
( pi qi )
n 1 i =1
G=
i =1
= pi
Exerccio 3 Considere a seguinte tabela que representa a distribuio dos empregados de uma instituio bancria segundo a remunerao bruta mensal (em milhares de unidades monetrias):
Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100
a) Calcule os quartis da distribuio. b) Analise a disperso da distribuio em causa. c) Analise a assimetria da distribuio em causa.
Resoluo
a)
Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total
Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100
36
Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [100; 120[ 1 : Fi=0,23 3 : Fi = 0,542 Clculo do Q1: 0,542 - 0,23 ------------ 120 - 100 0,25 - 0,23 -------------- Q1 - 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 25% dos empregados auferem remuneraes inferiores a 101,28 milhares u.m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [100; 120[ 100 : Fi=0,23 120 : Fi = 0,542 Clculo do Q2: 0,542 - 0,23 ------------ 120 - 100 0,5 - 0,23 -------------- Q2 - 100 Q2 = 100 + ((20x0,27)/0,312) = 117,3 50% dos empregados auferem remuneraes inferiores a 117,3 milhares u.m. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [140; 160[ 120 : Fi=0,737 140 : Fi = 0,809 Clculo do Q3: 0,809 - 0,737 ------------ 160 - 140 0,75 0,737 -------------- Q3 - 140 Q3 = 140 + ((20x0,013)/0,072) = 143,61(1) 75% dos empregados auferem remuneraes inferiores a 143,61(1) milhares u.m. b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33 (disperso reduzida em torno da mediana)
37
c) g ' =
(Q3 Q 2) (Q 2 Q1) (143,61 117,3) (117,3 101,28) = = 0,243 > 0 Q3 Q1 143,61 101,28
Exerccio 4 Os dados seguintes referem-se ao peso, expresso em gramas, do contedo de uma srie de 100 garrafas que, no decurso de um teste, saram de uma linha de enchimento automtico:
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total Frequncia. Relativa (%) 8 21 28 15 11 10 5 1 1 100
a) Represente graficamente os dados acima. b) Calcule as frequncias acumuladas e represente-as graficamente. c) Determine o peso mdio, mediano e modal. Qual o seu significado? d) Determine os quartis da distribuio. e) Analise a disperso do peso das garrafas.
Resoluo
a)
Histograma
0 296 297 298 299 300 301 302 303 304 305 306 307
38
b)
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total
F* 1 0,8 0,6 0,4 0,2 0 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310
Fi (%) 8 29 57 72 83 93 98 99 100
c)
x = 1 n
n i =1
ni c i
n i =1
f i ci
O peso mdio das garrafas de 300,11 kg. Classe mediana (classe a que corresponde frequncia acumulada 0,5): [299; 300[ 299 : Fi = 0,29 300 : Fi = 0,57 Clculo do Q2: 0,57 - 0,29 ------------ 300 - 299 0,5 - 0,29 -------------- Q2 - 299 Q2 = 299 + ((1x0,21)/0,28) = 299,75 50% das garrafas tm peso inferior a 299,75 kg. A classe modal aquela a que corresponde maior frequncia relativa. Neste caso, o maior valor de fi 0,28 correspondente classe [299; 300[, isto , os pesos mais provveis das garrafas situam-se entre 299 kg e 300 kg.
39
d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [298; 299[ 298 : Fi=0,08 299 : Fi = 0,29 Clculo do Q1: 0,29 - 0,08 ------------ 298 - 299 0,25 - 0,08 ------------ Q1 - 299 Q1 = 299 + ((1x0,17)/0,21) = 299,0357 25% das garrafas tm peso inferior a 299,0357 kg. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [301; 302[ 301 : Fi=0,72 302 : Fi = 0,83 Clculo do Q3: 0,83 - 0,72 ------------ 302 - 301 0,75 0,72 -------------- Q3 - 301 Q3 = 301 + ((1x0,03)/0,11) = 301,27(27) 75% das garrafas tm peso inferior a 301,27(27) kg. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237 (disperso reduzida em torno da mediana)
40
a) Represente graficamente os dados acima. b) Determine a altura mdia e a altura modal. Qual o seu significado? c) Calcule as frequncias acumuladas e represente-as graficamente. d) Determine os quartis da distribuio e diga qual o seu significado. e) Analise a disperso da distribuio. f) Analise a (as)simetria da distribuio.
Resoluo
a)
[1,4; 1,5[ [1,5; 1,55[ [1,55; 1,6[ [1,6; 1,65[ [1,65; 1,7[ [1,7; 1,75[ [1,75; 1,8[ [1,8; 1,9] Total
fi/hi
ni 2 10 25 13 17 20 10 3 100
6 5 4 3 2 1 0
Histograma
1,4
1,5
1,6
1,7
1,8
1,9
b) x = 1
n i =1
ni c i
n i =1
f i ci
A altura mdia dos alunos de 1,65 m. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 5. correspondente classe
[1,55; 1,6[, isto , a altura mais provvel de um aluno rondar 1,55m / 1,6m.
c)
F* 1 0,8 0,6 0,4 0,2 0 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2
41
d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1,55; 1,6[ 1,55 : Fi=0,12 1,6 : Fi = 0,37 Clculo do Q1: 0,37 0,12 ------------ 1,6 1,55 0,25 0,12 ------------ Q1 1,55 Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576 25% dos alunos tm altura inferior a 1,576 m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [1,6; 1,65[ 1,65 : Fi = 0,5 50% dos alunos tm altura inferior a 1,65 m. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [1,7; 1,75[ 1,7 : Fi=0,67 1,75 : Fi = 0,87 Clculo do Q3: 0,87- 0,67------------ 1,75 1,7 0,75 0,67-------------- Q3 1,7 Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72 75% dos alunos tm altura inferior a 1,72 m. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 1,576 = 0,144 (disperso reduzida em torno da mediana)
sx =
n i =1
fi * ci x
2
n i =1
fici 2 x = 0,00536875
s x = s x = 0,00536875 = 0,07327
f) g ' =
A distribuio ligeiramente assimtrica negativa ou enviesada direita (quase simtrica). Exerccio 6 Em determinada central telefnica, registou-se a durao das chamadas realizadas em Dezembro de 2001:
Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total N Chamadas 2000 1500 1000 300 200 5000
a) Represente graficamente as frequncias simples e acumuladas. b) Determine a durao mdia das chamadas e respectivo desvio-padro. c) Qual a durao da chamada mediana? Qual o significado do valor encontrado? d) Sabe-se que as chamadas realizadas durante o ano de 2001 apresentaram uma durao mdia de 10 minutos, com desvio-padro de 8,7 minutos. Compare, quanto disperso, as chamadas efectuadas em Dezembro com as que tiveram lugar durante todo o ano de 2001.
Resoluo
a)
Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total
fi/hi 0,1 0,08 0,06 0,04 0,02 0 0 10
hi 5 5 10 10 20
ci 2,5 7,5 15 25 40
20
30
40
50
60
43
b) x =
1 n
n i =1
ni c i
n i =1
f i ci
sx =
n i =1
fi * ci x
2
n i =1
fici 2 x = 81,4525
s x = s x = 0,00536875 = 9,025
c) Classe mediana (classe a que corresponde frequncia acumulada 0,5): [5; 10[ 5 : Fi = 0,4 10 : Fi = 0,7 Clculo da Me: 0,7 - 0,4 ------------ 10 - 5 0,5 - 0,4 ------------ Me - 5 Me = 5 + ((5x0,1)/0,3) = 6,67 50% das chamadas tm durao a 6,67 minutos. d) CVDez =
s x 9,025 = = 0,965 > x 9,35 CV2001 = sy y = 8,7 = 0,87 10
Exerccio 7 Uma empresa coligiu dados relativos produo de 12 lotes de um tipo especial de rolamento. O volume de produo e o custo de produo de cada lote apresentam-se na tabela:
44
Lote 1 2 3 4 5 6 7 8 9 10 11 12
Volume (unidades) 1500 800 2600 1000 600 2800 1200 900 400 1300 1200 2000
Custo (contos) 3100 1900 4200 2300 1200 4900 2800 2100 1400 2400 2400 3800
a) Analise a correlao existente entre volume e custo de produo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima o custo em funo do volume de produo.
Resoluo
a) r =
s xy s xx s yy
1 [(1500 1358,3)(3100 2708,3) + ... + (2000 1358,3)(3800 2708,3)] 12 = = 0,98 520854x 1145944
Exerccio 8 Um conjunto de empresas do sector da Construo e Obras Pblicas cotadas na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: EPS (Earnings per Share): Resultado Lquido por Aco PBV (Price/Book Value): Preo / Situao Lquida por Aco
45
Empresa 1 2 3 4 5 6 7 8 9
PBV ($) 0.9 1.0 0.8 0.8 1.5 0.7 0.9 1.3 0.4
Resoluo
a) r =
s xy s xx s yy
1 [(191 121,7)(0,9 0,92) + ... + (81 121,7)(0,4 0,92)] =9 = 0,61 3669,332 x 0,096933
250 200 150 100 50 0 0 0,2 0,4 0,6 0,8 PBV 1 1,2 1,4 1,6 y = 124,04x + 7,383
Exerccio 9 Recolheu-se uma amostra em 17 cidades do pas relativamente aos seguintes indicadores: Ri: Rendimento mdio mensal na cidade i (em 106 unidades monetrias) Gi: Gasto mdio mensal em bens de luxo na cidade i (em 106 u.m.)
EPS
46
Ri 125 127 130 131 133 135 140 143 169 Dados adicionais
Gi 54 56 57 57 58 58 59 59 66
Gi 61 62 62 63 63 64 65 66
Ri = 2467
Gi = 62620
2
Gi = 1030 Ri Gi = 150270
Ri = 361073
a) Estude a correlao entre rendimento e despesas em bens de luxo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima a varivel Gi em funo de Ri.
Resoluo
a)
rXY =
Ri Gi n RG ( Ri n R )(
2 2
G nG )
2 i
150270 17 *
2
2467 1030 * 17 17
= 0,986
Rendimento
47
Exerccio 10 O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas em milhares de u.m.) de uma empresa no perodo de 7 anos:
Ano 1 2 3 4 5 6 7 Vendas 10 13 18 19 25 30 35 Desp. Publicidade 3 3 5 6 8 9 13
a) Compare as vendas e as despesas em publicidade quanto disperso. b) Analise a correlao existente entre volume e custo de produo.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que
Resoluo
Dados no-classificados
x =
sx
2
1 n
n i =1
n i =1
xi = 21,429
2
y =
sy
2
1 n
n i =1
n i =1
yi = 6,714
2
1 = n
(xi x )
= 69,9408
1 = n
(yi y )
= 11,0651
CV x =
<
CV y =
sy y
r=
s xy s xx s yy
1 [(10 21,429)(3 6,714) + ... + (35 21,429)(13 6,714)] 7 = = 0,98 69,9408 x 11,0651
48
Existe uma correlao positiva linear forte entre as duas variveis. Em mdia, quando as despesas em publicidade aumentam (diminuem), as vendas aumentam (diminuem) de forma quase exactamente proporcional.
Recta de Regresso
y = 2,4649x + 4,8782 30
c)
Vendas
20
10
0 3 8 Desp. Public. 13
49
3. ESTATSTICA INDUTIVA
A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. Claro que o processo de induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. De seguida, sero apresentadas algumas noes simples de probabilidades e funes de probabilidade, que sero teis a aplicaes de estatstica indutiva relacionadas com controlo estatstico de qualidade e fiabilidade de componentes e sistemas.
No lanamento de uma moeda, os resultados possveis so cara ou coroa. Em cada lanamento no possvel prever o resultado que se ir obter, embora ele seja determinado por causas bem definidas.
50
Deve entender-se como experincia qualquer processo ou conjunto de circunstncias capaz de produzir resultados observveis; quando uma experincia est sujeita influncia de factores casuais e conduz a resultados incertos, diz-se que a experincia aleatria. Fundamentalmente, as experincias aleatrias caracterizam-se por: (i) (ii) (iii) poder repetir-se um grande nmero de vezes nas mesmas condies ou em condies muito semelhantes cada vez que a experincia se realiza, obtm-se um resultado individual, mas no possvel prever exactamente esse resultado os resultados das experincias individuais mostram-se irregulares, mas os resultados obtidos aps uma longa repetio da experincia patenteiam uma grande regularidade estatstica no seu conjunto Alguns autores consideram inserido no conceito de experincia aleatria um outro, o de espao de resultados. O espao de resultados corresponde ao conjunto formado por todos os resultados possveis de uma experincia aleatria. Por exemplo, num lanamento de um dado ordinrio tem-se que o
(i) (ii)
O acontecimento que contem todos os elementos do espao de resultados chama-se acontecimento certo O acontecimento que no contem qualquer elemento do espao de resultados chama-se acontecimento impossvel
51
(iii) (iv)
Dois acontecimentos so mutuamente exclusivos se no tm em comum qualquer acontecimento do espao de resultados A unio de dois acontecimentos A e B representa-se por A B e formado pelos elementos que pertencem a pelo menos um dos dois, A ou B
(v)
Probabilidade de um acontecimento expressa na escala de 0 a 1, sendo 0 a probabilidade associada a um acontecimento impossvel e 1 a probabilidade associada a um acontecimento certo. A primeira definio foi proposta por Laplace em 1812. Pode definir-se probabilidade de um acontecimento A como sendo: P(A) = Nmero de casos favorveis ao acontecimento A Nmero total de casos possveis na exp. aleatria
Uma das principais crticas a esta definio a de que ela s aplicvel quando o espao de resultados finito e os seus elementos possuem igual probabilidade; da que ela surja muito ligada aos jogos de azar, que possuem essas propriedades. o que acontece com as duas faces de uma moeda, as 52 cartas de um baralho, as 6 faces de um dado, etc. Para
se
analisar
probabilidade
de
ocorrncia
de
determinados
acontecimentos, deve ter-se em ateno o seguinte: Dois acontecimentos so ditos mutuamente exclusivos se no puderem acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente exclusivos, ento: P(A B) = 0
A probabilidade de unio de dois acontecimentos mutuamente exclusivos dada por P (A B) = P(A) + P(B)
52
Dois acontecimentos dizem-se complementares se: P(A) = 1 P( A ) Dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro; a probabilidade de ocorrncia de dois ou mais acontecimentos independentes o produto das probabilidades dos respectivos acontecimentos, isto : P(A B) = P(A) x P(B)
Exemplo
Em determinada populao, 9,8% das pessoas adquirem a revista A, 22,9% a revista B e 5,1% ambas. a) Qual a probabilidade de uma pessoa adquirir pelo menos uma das revistas? b) Qual a probabilidade de uma pessoa adquirir somente a revista A?
Resoluo
a) b)
P(A B) = P(A)+P(B)-P(A B) = 0,098+0,229-0,051 = 0,276 P(A B ) = P(A) - P(A B) = 0,098 0,051 = 0,047
Aps a apresentao desta definio, convm ainda referir que, numa outra perspectiva, a da chamada teoria frequencista, a probabilidade de um acontecimento definida como sendo o valor para o qual tende a frequncia relativa do acontecimento quando o nmero de repeties da experincia aumenta.
Um grupo de pessoas classificado de acordo com o seu peso e a incidncia de hipertenso. So as seguintes as propores das vrias categorias: Obeso Hipertenso No Hipertenso 0,1 0,15 Normal 0,08 0,45 Magro 0,02 0,2 Total 0,2 0,8
53
Total
0,25
0,53
0,22
1,00
a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resoluo
a) Basta ver que a proporo de hipertensos de 20% b) H que tomar em ateno que o que se pretende a proporo de hipertensos na populao de obesos, isto
0,1 = 0,4 . Por outras palavras, 0,25
pretende-se calcular a probabilidade do acontecimento ser hipertenso, sabendo que ocorreu o acontecimento ser obeso. Repare-se que este quociente resulta da diviso entre a probabilidade de uma pessoa ser hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode escrever-se que a probabilidade pretendida dada por:
P( H / O) = P( H O) P (O)
onde P(H/O) a probabilidade de ocorrer o acontecimento ser hipertenso, sabendo que ocorreu ou condicionado pelo acontecimento ser obeso. Este exemplo corresponde ao clculo de uma probabilidade condicionada. Como se viu anteriormente, dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro, isto , se: P(A / B) = P(A) e se P(B / A) = P(B).
Teorema de Bayes
Seja B um acontecimento que se realiza se e s se um dos acontecimentos mutuamente exclusivos A1, A2,An se verifica. Aos acontecimentos A1, A2,An d-se o nome de acontecimentos antecedentes. O teorema de Bayes permite calcular a probabilidade posteriori de A1, A2, An, isto , a probabilidade de ocorrncia de A1, A2, An calculadas sob a hiptese de que B (acontecimento consequente) se realizou. De acordo com este teorema:
P ( Ai / B ) = P ( Ai ).P ( B / Ai )
n i =1
P ( Ai ).P ( B / Ai )
54
P ( Ai ).P ( B / Ai )
acontecimento B, isto , a probabilidade de ocorrncia do acontecimento consequente B face a todos os possveis acontecimentos A1, A2, An que o podem ter antecedido (ou causado a sua ocorrncia).
Exemplo:
Considere duas urnas, A e B. A urna A contm 1 bola branca e 999 bolas pretas e a urna B contm 1 bola preta e 999 bolas brancas. escolhida uma urna ao acaso, da qual extrada uma bola. Se esta preta, qual a probabilidade de que a urna A tenha sido escolhida?
Resoluo
Acontecimentos antecedentes A: escolha da urna A, com probabilidade 50% B: escolha da urna B, com probabilidade 50% Acontecimento consequente C extraco de bola preta, cuja probabilidade depende (est condicionada) pela urna escolhida P(C/A) = 999/1000 = 0,999 P(C/B) = 1/1000 = 0,001
P (C A) P ( A) xP (C / A) + P ( B ) xP (C / B )
Logo, pelo Teorema de Bayes, vem que P(A/C) = Substituindo pelos respectivos valores, P(A/C) =
55
varivel X:N da face resultante do lanamento de um dado), ento pode ser constituda uma lei ou funo de probabilidade (f(x)) dessa varivel X, tal que f(x) = P(X=xi) Por exemplo, para X: n da face resultante do lanamento de um dado, vem que: xi f(xi) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6
que se designa por lei uniforme. Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior nmero de fenmenos estatsticos do que outras. Entre estas, contam-se a lei Binomial, a lei de Poisson e a lei Exponencial.
H alguns acontecimentos que so constitudos por um conjunto de experincias independentes, cada uma das quais com apenas dois estados possveis de ocorrncia e com uma probabilidade fixa de ocorrncia para cada um deles. Por exemplo, os produtos resultantes de uma fbrica podem ser classificados como sendo defeituosos ou sendo no defeituosos, e o facto de um ter sado (ou no) defeituoso no influencia os outros serem (ou no). A distribuio das duas classes possveis discreta e do tipo binomial. No exemplo anterior, consideremos uma amostra de n artigos retirados da produo total, em relao aos quais se pretende identificar a varivel X: N de artigos defeituosos nos n que constituem a amostra. A probabilidade de ocorrncia do acontecimento artigo defeituoso dada por p: incidncia de defeituosos na produo (convenientemente calculada atravs de mtodos de estimao). A probabilidade do acontecimento complementar artigo nodefeituoso dada por
1p=q
56
A probabilidade associada a x artigos defeituosos dada por px (p x p x p x p...x vezes). Se h x defeituosos, restam n-x artigos no-defeituosos, com probabilidade dada por qn-x. Para calcular o nmero exacto de combinaes de x artigos defeituosos com n-x artigos no-defeituosos, utiliza-se a figura combinaes de n, x a x, oriunda das tcnicas de clculo combinatrio. Vem ento que a probabilidade de existncia de x defeituosos (e logo n-x no defeituosos) igual a:
f ( x) = C xn p x q n x = n! p x q n x (n p )! p!
sendo que X segue Bi (n;p), sendo n e p os parmetros caracterizadores da lei. Um acontecimento deve ter 4 caractersticas para que se possa associar a uma lei binomial:
-
nmero fixo de experincias (n) cada experincia ter apenas duas classes de resultados possveis todas as experincias terem igual probabilidade de ocorrncia (p) as experincias serem independentes
calcule a probabilidade de, entre as 4 bobines necessrias a um determinado cliente, escolhidas ao acaso uma ser defeituosa.
Resoluo: X: nmero de bobines defeituosas no conjunto de 4 bobines necessrias a um
p=0,2
q=1-p=0,8
P(X=1)=C4p1q4-1 = 4*0,2*0,83 = 0,4096 = 41% Em sistemas elctricos de energia possvel, por exemplo, aplicar a distribuio binomial quando se pretende calcular a fiabilidade de uma central elctrica, com vrias unidades iguais e admitindo que cada unidade apenas pode residir em dois estados, a funcionar ou avariada.
57
A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) d a probabilidade de um acontecimento ocorrer um dado nmero de vezes num intervalo de tempo ou espao fixado, quando a taxa de ocorrncia fixa (por exemplo, n de chamadas que chegam a uma central telefnica por minuto; n de varias que ocorrem numa mquina por dia). Os nmeros de acontecimentos de sucesso ocorridos em diferentes intervalos so independentes. O parmetro caracterizador da distribuio de Poisson , que corresponde ao nmero mdio de ocorrncias por unidade de tempo ou espao. Como o nmero mdio de ocorrncias do acontecimento proporcional amplitude do intervalo de tempo ou espao a que se refere, a varivel X: N de ocorrncias do acontecimento no intervalo [0,t[ segue lei de Poisson de parmetro t (isto , se para 1 unidade de tempo o n mdio de ocorrncias
, para t unidades de tempo o nmero mdio de ocorrncias t). A expresso
(t )x e t
x!
d a probabilidade de acontecerem x ocorrncias no intervalo de tempo [0,t[, e corresponde expresso da lei de probabilidade de Poisson : Po(t)
Exemplo: O nmero mdio de chamadas telefnicas a uma central, por minuto, 5. A
central s pode atender um nmero mximo de 8 chamadas por minuto. Qual a probabilidade de no serem atendidas todas as chamadas no intervalo de tempo de 1 minuto?
Resoluo: X: nmero de chamadas telefnicas atendidas numa central, por minuto (0,1,2,3,4, 5, 6, 7, 8) =5 p=0,2 q=1-p=0,8 5 x 8 e 5 P(X 8) = = 0,932 Logo P(X>8) = 1-0,932 = 0,068 x! x =0
Se X fr o N de avarias que ocorrem no intervalo de tempo [0,t[, ento a probabilidade de no ocorrerem avarias nesse intervalo, isto , a fiabilidade do componente/sistema como funo do tempo, dada por:
58
(t )0 e t = e t
0!
(iii) Lei Exponencial
Seja T a varivel Tempo ou espao que decorre entre ocorrncias consecutivas de um acontecimento. Ento T segue lei exponencial Exp (), sendo
1
o tempo que, em mdia, decorre entre ocorrncias sucessivas do acontecimento. Note-se que possvel estabelecer uma relao entre a lei exponencial e a lei de Poisson. Assim, se X fr o N de avarias que ocorrem no intervalo de tempo [0,t[, e T fr o Tempo que decorre entre avarias consecutivas, ento:
P (T>t)
= P(tempo que decorre entre avarias exceder t) = P(at ao instante t, no ocorre qualquer avaria) = P (ocorrerem zero avarias no intervalo [0,t[)
= P(X=0) = e
t
A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por
e t
A probabilidade de avariar at ao instante t dada por
1 e t
Exemplo: O tempo de funcionamento sem avarias de uma determinada mquina de
produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
Resoluo: Seja
59
T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de uma mquina, e X: numero de avarias que ocorrem no intervalo [0,6[, isto , num perodo de 6h
=1/4,5 corresponde ao nmero de avarias por unidade de tempo (por hora)
= e 1,333 = 0,264
A lei Normal tem como parmetros caracterizadores a mdia e o desviopadro . Isto , os valores observados tm uma determinada tendncia central e uma determinada disperso em torno da tendncia central. A expresso
1 e 2 2 1 ( Xi ) 2
representa a funo densidade de probabilidade da distribuio Normal. Se se fizer o valor mdio igual a zero e todos os desvios forem medidos em relao mdia, a equao ser:
Z=
que corresponde a uma distribuio normal estandardizada (0;1) com os valores tabelados, a qual caracterizada por uma curva de Gauss:
60
Esta distribuio apresenta 99,73% dos valores entre os extremos 3 e 3. Existem muitos tipos de distribuio, mas a curva normal a forma de distribuio mais frequente nos processos industriais para caractersticas mensurveis, e pode considerar-se como estabelecida pela experincia prtica.
Exemplo: Considere que o comprimento mdio de determinado fio condutor 120, com
desvio padro 0,5. Qual a percentagem de fio com comprimento superior a 121?
Resoluo: X: comprimento de determinado fio condutor
61
Ento, a varivel aleatria X, construda a partir da soma das n variveis Zi elevadas ao quadrado, segue distribuio Qui-Quadrado com n graus de liberdade, denotada por
n i =1
X=
2 2 Z i2 = Z12 + Z 2 + ... + Z n
2 X n
O termo Graus de Liberdade (d.f: degrees of freedom) habitualmente usado para designar o nmero n de parcelas (variveis Zi) adicionadas. possvel demonstrar que o valor esperado e a varincia da distribuio de uma varivel Qui-Quadrado so respectivamente
=n
2 = 2n
A distribuio Qui-Quadrado uma distribuio assimtrica esquerda, aproximando-se da distribuio Normal medida que n cresce.
62
PROBABILIDADES
Exerccios resolvidos
Exerccio 1
De um baralho ordinrio (52 cartas) extrai-se ao acaso 1 carta. Determine a probabilidade dos seguintes acontecimentos: a) sada de Rei b) sada de copas c) sada de Rei ou copas d) sada de Rei mas no de copas e) no sada de Rei f) no sada de Rei nem de copas g) no sada de Rei ou no sada de copas
Resoluo
A: sada de Rei B: sada de copas c) P(A)=1/13 d) P(B)=1/4 e) P(A B) = P(A) + P(B) - P(A B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) f) P(A-B) = P(A) P(A B) = 1/13 1/52 = 3/52 (= (4-1)/52) g) P( A )= 1-1/13 = 12/13 (=(52-4)/52) h) P( A B ) = P( A B ) = 1 P(A B) = 1 4/13 = 9/13 i) P( A B ) = P( A B ) = 1 P ( A B ) = 1 1/52 = 51/52
Exerccio 2
Um sistema electrnico formado por dois sub-sistemas, A e B. De ensaios anteriores, sabe-se que:
-
a probabilidade de A falhar de 20% a probabilidade de B falhar sozinho 15% a probabilidade de A e B falharem 15%
63
A: o subsistema A falha B: o subsistema B falha P(A)=20% P(B-A)=15% P(A B)=15% a) P(B) = P(B-A)+ P(A B) = 0,15 + 0,15 = 30% b) P(A-B) = P(A) P(A B) = 0,2 0,15 = 5% c) P(A B) = P(A) + P(B) - P(A B) = 0,2 + 0,3 0,15 = 35% d) P( A B ) = P( A B ) = 1 P(A B) = 1 0,35 = 65% e) P( A B ) = 1 P ( A B ) = 1 0,15 = 85%
Exerccio 3
P( A )= 80%
Suponha que h 3 jornais, A, B e C, com as seguintes percentagens de leitura: A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%; A, B e C: 2,4% Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa: a) ler pelo menos um dos jornais b) ler A e B mas no C c) ler A mas no ler B nem C
Resoluo
A: a pessoa escolhida l o jornal A B: a pessoa escolhida l o jornal B C: a pessoa escolhida l o jornal C P(A) = 9,8% P(A B) = 5,1% P(B) = 22,9% P(A C) = 3,7% P(C) = 12,1% P(B C) = 6%
P(A B C) = 2,4%
Manual Tcnico de Formador 64
a)
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%
Um gerente de uma galeria de arte muito creditada no mercado, est interessado em comprar um quadro de um pintor famoso para posterior venda. O gerente sabe que h muitas falsificaes deste pintor no mercado e que algumas dessa falsificaes so bastante perfeitas o que torna difcil avaliar se o quadro que ele pretende comprar ou no um original. De facto, sabe-se que h 4 quadros falsos desse pintor para 1 verdadeiro. O gerente no quer comprometer o bom nome da galeria para a qual trabalha comprando um quadro falso. Para obter mais informao o gerente resolve levar o quadro a um museu de arte e pede para que o especialista do museu o examine. Este especialista garante-lhe que em 90% dos casos em que lhe pedido para examinar um quadro genuno daquele pintor, ele identifica-o correctamente como sendo genuno. Mas em 15% dos casos em que examina uma falsificao do mesmo pintor, ele identifica-o (erradamente) como sendo genuno. Depois de examinar o quadro que o gerente lhe levou, o especialista diz que acha que o quadro uma falsificao. Qual agora a probabilidade de o quadro ser realmente uma falsificao?
Resoluo
V: o quadro genuno F: o quadro falso I: o quadro identificado correctamente P(V) = 20% P(F) = 80% P(I/V) = 90% P( I / F ) = 15%
Manual Tcnico de Formador
Exerccio 5
Na ida para o emprego, o Sr. scar, polcia de profisso, tem de passar obrigatoriamente por trs cruzamentos com semforos. No primeiro cruzamento, o do Largo Azul, a probabilidade do semforo se encontrar com sinal vermelho de 10%. Em cada um dos cruzamentos seguintes, o Sr. scar fica parado devido aos sinais vermelhos em metade das vezes que l passa. O Sr. scar j descobriu que os semforos funcionam separadamente, no estando ligados entre si por qualquer mecanismo. Embora goste de cumprir a lei, o guarda scar passa no sinal verde e acelera no amarelo, s parando mesmo no sinal vermelho. a) Qual a probabilidade do Sr. scar chegar ao emprego sem ter de parar em qualquer sinal vermelho? b) Qual a probabilidade do Sr. scar ter de parar num s semforo? c) Qual a probabilidade do Sr. scar ter parado no sinal vermelho do cruzamento do Largo Azul, sabendo que parou num s semforo na sua ida para o emprego?
Resoluo
A: polcia encontra sinal vermelho no 1 cruzamento B: polcia encontra sinal vermelho no 2 cruzamento C: polcia encontra sinal vermelho no 3 cruzamento P(A)=10% P(B)=50% P(C)=50% P( A )= 90% P( B )= 50% P( C )= 50%
a) P( A B C ) = P( A )*P( B )*P( C ) = 0,9*0,5*0,5 = 22,5% b) P( A B C ) + P( A B C ) +P( A B C ) = = P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) = 47,5%
66
Exerccio 6
Aps alguns testes efectuados personalidade de um indivduo, concluiu-se que este louco com probabilidade 60%, ladro com probabilidade igual a 70% e no louco nem ladro com probabilidade 25%. Determine a probabilidade do indivduo: a) Ser louco e ladro b) Ser apenas louco ou apenas ladro c) Ser ladro, sabendo-se que no louco
Resoluo
A: indivduo louco B: indivduo ladro P(A)=60% P(B)=70% P( A B ) = 25% = P( A B ) P(A B) = 1 0,25 = 75% 0,75 = 0,6 + 0,7 - P(A B)
Exerccio 7
Uma moeda viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem faces, ento um nmero seleccionado de 1 a 9. Se parecem coroas, um nmero seleccionado entre 1 e 5. Determine a probabilidade de ser seleccionado um nmero par.
Resoluo
67
Exerccio 8
Numa fbrica, 3 mquinas, M1, M2 e M3 fabricam parafusos, sendo a produo diria total de 10000 unidades. A probabilidade de um parafuso escolhido ao acaso ter sido produzido por M1 30% da probabilidade de ter sido produzido por M2. A incidncia de defeituosos na produo de cada mquina : M1: 3% M2: 1% M3: 2% Extrai-se ao acaso da produo diria um parafuso. Sabendo que a probabilidade dele ser defeituoso de 1,65%, determine o nmero de parafusos que cada mquina produz diariamente.
Resoluo
M1: o parafuso foi produzido por M1 M2: o parafuso foi produzido por M2 M3: o parafuso foi produzido por M3 D: o parafuso defeituoso n = 10000 unidades P(M1) = 0,3 P(M2) P(D / M1) = 3% P(D / M2) = 1% P(D / M3) = 2% P(D) = 1,65% Prod. 1 = P(M1)*10000 = ? Prod. 2 = P(M2)*10000 = ? Prod. 3 = P(M3)*10000 = ?
68
Exerccio 9
O Joo tem sua disposio 3 meios de transporte diferentes para se deslocar de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
-
chegar atrasado escola 60% chegar atrasado utilizando o transporte A 80% chegar atrasado utilizando o transporte B 50% chegar atrasado utilizando o transporte C 60% utilizar os transportes B e C a mesma
a) Calcule a probabilidade de o Joo utilizar o transporte A b) Sabendo que o Joo chegou atrasado escola, calcule a probabilidade de ter utilizado os transportes B ou C.
Resoluo
T: O Joo chega atrasado A: o Joo utiliza o transporte A B: o Joo utiliza o transporte B C: o Joo utiliza o transporte C P(T) = 0,6 P(T/A) = 0,8 P(T/B) = 0,5 P(T/C) = 0,6 P(B) = P(C) P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)
69
Logo 0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6 e vem que P(B) = 40% Ento P(A) = 1 2P(B) = 1 2*0,4 = 20% b) P(B C / T) =
P ( B ) * P (T / B ) + P (C ) * P (T / C ) 0,4 * 0,5 + 0,4 * 0,6 = =73,3% P (T ) 0,6
Exerccio 10
Uma empresa que se dedica prestao de servios de seleco de pessoal em relao a um teste psicotcnico para uma profisso especfica sabe o seguinte:
-
as percentagens de indivduos com um quociente de inteligncia (Q.I.) elevado e mdio so, respectivamente, de 30% e de 60% a percentagem de indivduos com Q.I. mdio que ficam aptos no teste de 50% a probabilidade de um indivduo com Q.I. baixo ficar apto no teste de 20% finalmente, sabe-se que 70% dos indivduos com Q.I. elevado ficam aptos no teste
a) Qual a probabilidade de um indivduo escolhido ao acaso ficar apto no teste? b) Qual a probabilidade de um indivduo ter Q.I. baixo, sabendo-se que ficou inapto?
Resoluo
A: indivduo fica apto no teste E: indivduo tem QI elevado M: indivduo tem QI mdio B: indivduo tem QI baixo P(E) = 30% P(M) = 60% P(A/M) = 50% P(B) = 1 0,3 0,6 = 10% P(A/E) = 70% P(A/B) = 20%
70
Exerccio 11
Os resultados de um inqurito aos agregados familiares de uma determinada cidade forneceram os seguintes dados:
-
35% dos agregados possuem telefone 50% dos agregados possuem frigorfico 25% dos agregados possuem automvel 15% dos agregados possuem telefone e frigorfico 20% dos agregados possuem telefone e automvel 10% dos agregados possuem frigorfico e automvel 5% dos agregados possuem telefone, automvel e frigorfico
a) Calcule a probabilidade de um agregado familiar 1. possuir telefone ou frigorfico 2. no possuir nem telefone nem automvel b) Calcule a probabilidade de um agregado que possui automvel 1. possuir tambm frigorfico 2. possuir tambm telefone ou frigorfico c) Calcule a probabilidade de um agregado familiar 1. possuir pelo menos um daqueles trs objectos 2. no possuir nenhum daqueles trs objectos
Resoluo
A: agregado familiar possui telefone B: agregado familiar possui frigorfico C: agregado familiar possui automvel P(A) = 35% P(B) = 50% P(C) = 25%
Manual Tcnico de Formador 71
P(A B) = 15% P(A C) = 20% P(B C) = 10% P(A B C) = 5% a) 1. P(A B) = P(A) + P(B) - P(A B) = 0,35 + 0,5 0,15 = 70% 2. P( A C ) = P( A C ) = 1 P(A C) = 1 0,4 = 60% P(A C) = P(A) + P(C) - P(A C) = 0,35 + 0,25 0,2 = 40% b) 1. P(B / C) =
P( B C ) 0,1 = = 40% P (C ) 0,25
2. P(A B/ C) =
P ( A C ) + P ( B C ) P ( A B C ) 0,2 + 0,1 0.05 = = 100% P (C ) 0,25
c) 1.
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%
2. 1 P( A B C ) = 1 0,7 = 30%
Exerccio 12
Admita que 60% dos seguros no ramo automvel respeitam a condutores com mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tm um ou mais acidentes no mesmo perodo. a) Qual a probabilidade de um segurado no sofrer qualquer acidente durante um ano? b) Qual a probabilidade de um segurado que sofreu pelo menos um acidente ter idade igual ou inferior a 40 anos? c) Qual a probabilidade de, numa amostra de trs segurados 1. todos terem idade igual ou inferior a 40 anos? 2. nenhum ter sofrido qualquer acidente durante um ano? 3. Todos terem idade igual ou inferior a 40 anos, dado que cada um sofreu, pelo menos, um acidente durante o referido perodo?
72
Resoluo
I1: o segurado tem mais de 40 anos de idade I2: o segurado tem 40 anos ou menos de idade A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado no sofre nenhum acidente por ano
73
FUNES DE PROBABILIDADE
Exerccios resolvidos
Exerccio 1
Numa praia do litoral portugus existe um servio de aluguer de barcos, destinado aos turistas que a frequentam. O nmero de turistas que procuram este servio, por hora, est associado a uma varivel aleatria com distribuio de Poisson. Verificou-se que, em mdia, em cada hora, esse servio procurado por 8 turistas interessados em alugar barcos; sabe-se, por outro lado, que esse servio funciona ininterruptamente das 8 s 20 horas. a) b) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5 barcos? Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos sejam procurados por mais de 25 turistas?
Resoluo
X: n de turistas que procuram o servio de aluguer de barcos por hora X segue Po(=8) a) Na tabela da Po(=8) vem P(X=5) = 9,16% b) Y1: n de turistas que procuram o servio de aluguer na 1 hora Y2: n de de turistas que procuram o servio de aluguer na 2 hora Logo Y1+Y2: n de turistas que procuram o servio de aluguer em 2 horas Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2 independentes e que todas seguem Po(8), vem que: Z=Y1+Y2 segue Po(2*8=16) Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%
Exerccio 2
O nmero de navios petroleiros que chegam diariamente a certa refinaria uma varivel com distribuio de Poisson de parmetro 2. Nas actuais condies, o cais da refinaria pode atender, no mximo, 3 petroleiros por dia.
74
Atingido este nmero, os restantes que eventualmente apaream devero seguir para outro porto. a) Qual a probabilidade de, num qualquer dia, ser preciso mandar petroleiros para outro porto? b) De quanto deveriam ser aumentadas as instalaes de forma a assegurar cais a todos os petroleiros em 99,9% dos dias? c) Qual o nmero esperado de petroleiros a chegarem por dia? d) Qual o nmero mais provvel de petroleiros a chegarem por dia? e) Qual o nmero esperado de petroleiros a serem atendidos diariamente? f) Qual o nmero esperado de petroleiros que recorrero a outros portos diariamente?
Resoluo
X: n de petroleiros que chegam diariamente a uma certa refinaria X segue Po (2) Capacidade mxima de atendimento da refinaria: 3 petroleiros/dia a) P(X>3) = 1 P(X 3) = 1 F(3) = 1 0,8571 =14,29% (tab. pg.14) b) N mximo de petroleiros que podem chegar: 9 (informao da tabela) Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3) c) E(X) = 2 d) X = 1 ou X = 2, com probabilidade 27,07% e) Y: n de petroleiros que so atendidos diariamente numa certa refinaria (0,1, 2, 3) g(0) = P(X=0) = 0,1353 g(1) = P(X=1) = 0,2707 g(2) = P(X=2) = 0,2707 g(3) = P(X=3) = 1 P(X<3) = 1 P(X 2) = 1 0,6767 = 0,3233 E(Y) = 0*0,1353 + + 3*0,3233 = 1,782 So atendidos, em mdia, entre 1 e 2 petroleiros diariamente f) Z: n de petroleiros que recorrem diariamente a outros portos (0,1, 2, 3, 4, 5, 6) Logo, Z = X - Y E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218
Manual Tcnico de Formador 75
Recorrem a outros portos, em mdia, entre 0 e 1 petroleiro por dia g) W: n de dias em que preciso mandar petroleiros para outro porto num ms de 30 dias (0,1, 2,...30) W segue Bi (n = 30; p = P(X>3) = 0,1429) E(W) = 30*0,1429 = 4,3 Em mdia, preciso enviar petroleiros para outro porto 4 a 5 dias/ms
Exerccio 3
Os Servios Municipalizados de Gs e Electricidade debitam mensalemnte aos seus clientes um consumo terico T de energia elctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30,85%. Suponha um cliente cujo consumo por ms segue lei normal de mdia 400 kwh e desvio-padro 40 kwh. a) Qual o consumo terico que lhe mensalmente debitado? b) 1. Qual a distribuio do consumo efectivo durante 3 meses? 2. Qual a probabilidade de que, ao fim de 3 meses, o consumo terico exceda o efectivo em mais de 100 kwh?
Resoluo
X: consumo efectivo de energia elctrica de um cliente por ms (em kwh) T: consumo terico (valor fixo) debitado ao cliente por ms (em kwh) T: P(X>T) = 0,3085 X segue N(400; 1600) a) P(X>T) = 0,3085 P( P(N(0,1) b) 1. X1: consumo efectivo de energia elctrica de um cliente no 1 ms (em kwh) X2: consumo efectivo de energia elctrica de um cliente no 2 ms (em kwh) X3: consumo efectivo de energia elctrica de um cliente no 3 ms (em kwh) Logo X1+X2+X3: consumo efectivo de energia elctrica em 3 meses (em kwh)
X 400 T 400 > ) = 0,3085 40 40
76
Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3 independentes e que todas seguem N(400, 1600), vem que: Y=X1+X2+X3 segue N(400*3; 1600*3), isto , N(1200; 4800) 2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< = P(N(0,1)<-0,58) = 28,1%
1160 1200 )= 4800
Exerccio 4
Num determinado processo de fabrico, existem 2 cadeias de montagem A e B, com funcionamento independente. A cadeia A opera a um ritmo mdio de 2 montagens por hora, e a probabilidade da cadeia B efectuar pelo menos uma montagem numa hora de 98,71%. Admitindo que o nmero de montagens efectuadas por hora em ambas as cadeias uma v.a. Poisson, determine: a) a probabilidade de se efectuarem mais de 6 montagens numa hora com a cadeia B b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mximo 10 montagens com a cadeia B c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de montagens de B d) o nmero mdio de montagens efectuadas num dia de trabalho de 8 horas com ambas as cadeiras
Resoluo
X segue Po(2)
a) Y segue Poisson, mas desconhece-se a mdia (=parmetro ) No entanto, como se sabe que P(Y 1) = 0,9817, vem que P(Y<1) = 1 0,9817 = 0,0183 Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a coluna 4. Logo, = 4. Na tabela da Po(4), P(Y>6) = 1P(Y 6) = 1F(6) = 1-0,8893=11,07%
77
b) Y1: n de montagens da cadeia B na 1 hora Y2: n de montagens da cadeia B na 2 hora Y3: n de montagens da cadeia B na 3 hora Logo Y1+Y2+Y3: n de montagens da cadeia B em 3 horas Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3 independentes e que todas seguem Po(4), vem que: Z=Y1+Y2+Y3 segue Po(4*3=12) P(Z 10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + + 0,1048 = 34,72% c) P(X=2Y) = P(X=0 Y=0) + P(X=2 Y=1) + P(X=4 Y=2) + P(X=6 Y=3) + P(X=8 Y=4) = 0,1353*0,0183 + 0,2707*0,0753 + 0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8% d) W: n de montagens das 2 cadeias num dia de trabalho de 8 horas W=
8
i =1
( X i + Yi )
onde Xi + Yi corresponde ao n de montagens das 2 cadeias por hora Pelo Teorema da Aditividade de Poisson, sendo as variveis independentes e seguindo Po(2) e Po(4) respectivamente, vem que Xi + Yi segue tambm Po(2+4=6). E Z , tambm pelo mesmo Teorema, segue Po(6*8=48) Logo, o nmero mdio de montagens efectuado pelas 2 cadeias num dia de trabalho de 8 horas de 48.
Exerccio 5
Uma companhia de tabacos recebeu em dada altura um elevado nmero de queixas quanto qualidade dos cigarros de certa marca que comercializa. Numa rpida anlise s condies de produo, constata-se que 1% dos filtros que compem o cigarro saem defeituosos. Nestas condies, determine: a) a probabilidade de um mao acabado de formar 1. conter 1 cigarro com filtro defeituoso 2. conter 0 cigarros com filtro defeituoso
78
b) o nmero de maos que, num volume que contm 20, a companhia espera poder aproveitar se utilizar o critrio: 1. mao aproveitvel se no contiver cigarros defeituosos 2. mao aproveitvel se contiver no mximo 1 cigarro defeituoso
Resoluo
X: n de cigarros com filtro defeituoso em 20 cigarros de um mao X segue Bi(n=20; p=0,01) a) 1. P(X=1) = 20*0,01*0,9919 = 16,52% 2. P(X=0) = 0,010*0,9920 = 81,79% b) 1. Crit. 1: mao aproveitvel se no contiver cigarros defeituosos Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0) = 0,8179) Logo E(Y) = 20*0,8179 = 16,36 2. Crit. 2: mao aproveitvel se contiver no mximo 1 cigarro defeituoso Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831) Logo E(Y) = 20*0,9831 = 19,66
Exerccio 6
O comprimento das peas produzidas por uma mquina uma v.a. Normal com mdia e varincia 2. Uma pea defeituosa se o seu comprimento diferir do valor mdio mais do que . Sabemos que 50% das peas produzidas tm comprimento inferior a 0,25 mm e 47,5% tm comprimento entre 0,25 mm e 0,642 mm. a) b)
Resoluo
Calcule a mdia e o desvio-padro do comprimento das peas. Determine a probabilidade de uma pea no ser defeituosa.
X: comprimento das peas produzidas por uma mquina X segue N(; 2) Pea defeituosa se X> + ou se X< - P(X<0,25) = 50% P(0,25<X<0,642) = 47,5%
79
<
0,25
0,25
) = 50%
Na tabela, E como
0,25 0,25
0,392
<
X 0,25
<
0,642 0,25
0,392
)=
=(
b) P(pea no defeituosa) = P( - < X < + ) = P(0,05 < X < 0,45) = P(X<0,45) P(X<0,05) =
0,45 0,25 0,05 0,25 ) ( ) = (1) (1) = D (1) = 84,13% 0,2 0,2
Exerccio 7
Sabe-se que a probabilidade de cura de uma certa doena 20%. Pe-se prova um novo medicamento, que eleva a probabilidade de cura para 40%, ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20. Calcule a probabilidade de se concluir pela ineficcia do medicamento, ainda que este eleve de facto a probabilidade de cura para 40%.
Resoluo
X: nmero de doentes curados no grupo de 20 a que ministrado o novo medicamento (0,1,2...19, 20) n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4) P(X 8)=1- F(7) = 41,58%
80
Exerccio 8
Sabe-se por via experimental que, por cada perodo de 5 minutos, chegam, em mdia, 4 veculos a determinado posto abastecedor de combustveis. Um empregado entra ao servio s 8 horas. Qual a probabilidade de ter de aguardar mais de 10 minutos at chegada de um veculo?
Resoluo
X: n de veculos que chegam ao posto abastecedor por perodo de 5 minutos X segue Po(4) Se X1: n de veculos que chegam ao posto no 1 perodo de 5 minutos X2: n de veculos que chegam ao posto no 2 perodo de 5 minutos ento X1+X2: n de veculos que chegam ao posto abastecedor em 10 minutos Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes e que ambas seguem Po(4), vem que X1+X2 tambm segue Po(4+4=8) Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.
81
A partir do conceito de intervalo de confiana para um parmetro, fcil concluir que a sua especificao implica conhecer: o estimador do parmetro em causa a sua distribuio de probabilidade uma estimativa particular daquele parmetro
Como parmetros de interesse e para efeitos de exemplificao, vo considerar-se duas tipologias de intervalo: o intervalo de confiana para a mdia de uma populao normal e o intervalo de confiana para a proporo de uma populao binomial. Para efeitos de simplificao, vo considerar-se apenas exemplos relativos a amostras de grande dimenso (na prtica, n 100)
(i) Intervalo de confiana para a mdia de uma populao normal
Seja X (mdia amostral) o estimador da mdia da populao. Porque a distribuio Normal, a distribuio deste estimador ser:
X N ( ;
Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z= X
N (0;1)
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a mdia de uma populao normal:
X c
;X +c
Isto , em torno do valor do estimador, definido um intervalo de variao onde possvel afirmar que o parmetro a estimar est contido com um grau de confiana . Esse intervalo de variao depende:
-
da dimenso da amostra (n): quanto maior a dimenso da amostra, menor a amplitude do intervalo. Este resultado explica-se facilmente: no limite, se fosse possvel observar todo o universo de dados (n= ), o valor amostral calculado corresponderia ao valor da populao.
83
do desvio - padro da populao ( ): quanto maior o desvio - padro, maior a amplitude do intervalo. Como se sabe, o desvio - padro uma medida que caracteriza a disperso da distribuio. Quanto maior o seu valor, maior a variabilidade apresentada pelos dados, sendo natural que a margem de variao de prever em torno do valor amostral recolhido seja tambm, naturalmente, maior.
do valor crtico (c): quanto maior o valor c, maior a amplitude do intervalo. O valor crtico reflecte o nvel de confiana adoptado. Naturalmente, para que aumente a confiana de que o valor do parmetro a estimar est contido no intervalo, a sua amplitude deve aumentar tambm (no limite, se o intervalo se alongasse de - a + a confiana seria total ou 100%). possvel encontrar o valor c na tabela da normal (pois esta a lei do estimador), da seguinte forma:
P ( c Z c ) =
j que assim possvel definir a frmula geral do intervalo, resolvendo a inequao em ordem ao parmetro, :
P (c X
c) = P( X c
X c
)=
Exemplo: Suponha-se que se tem uma populao normal com mdia desconhecida e
desvio - padro 3, N (, 9) e uma amostra de 121 observaes. Deduza um intervalo de confiana para a com 95% de confiana.
Resoluo: Para os dados deste exemplo, vem:
n=121
=3
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo
X c
;X +c
= X
84
O intervalo X 0,535; X + 0,535 contm o verdadeiro valor do parmetro com probabilidade ou confiana de 95%. Conhecida uma estimativa particular daquele parmetro, torna-se possvel calcular entre que valores seria de esperar que, com 95% de confiana, variasse .
Se o desvio - padro da populao fr desconhecido, utiliza-se este intervalo considerando-se como estimativa de o desvio - padro corrigido da amostra, ou seja, s=
( xi x ) 2
n 1
, tal que:
X c
s' n
;X +c
s' n
da proporo p de uma populao binomial. Sendo a amostra de grande dimenso, a distribuio deste estimador ser:
N ( p; p
p(1 p ) ) n
Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z=
p p
p (1 p ) n
N (0;1)
Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a proporo p de uma populao binomial:
c p (1 p ) (1 p ) p p +c ;p n n
85
certa modificao de trnsito. Faz-se um inqurito a 100 pessoas, e 70 declaram-se favorveis. Determine um intervalo de confiana a 95% para a proporo de habitantes dessa cidade favorveis modificao de trnsito.
Resoluo: n=100
= p 70 = 0,7 100
= [0,6102;0,7898]
O intervalo [0,6102;0,7898] contm o verdadeiro valor do parmetro p com probabilidade ou confiana de 95%. Ou seja, a proporo de habitantes favorveis modificao de trnsito est situada entre 61,02% e 78,98%, com probabilidade de 95%.
Como bvio, pretende-se que o resultado possua o mximo de confiana possvel. No entanto, se uma maior confiana pretendida na estimao, esta conduz a possibilidades de erro maiores, dado que um elevado nvel de confiana conduz a um intervalo maior e, como tal, a preciso da estimao diminui.
Exemplo: Consideremos 3 afirmaes de alunos que aguardam a sada das pautas de
um exame de Estatstica: Afirm. 1: Tenho a sensao que as pautas sero afixadas durante a manh Afirm. 2: Tenho quase a certeza que as pautas sero afixadas entre as 10h e as 11h
86
Afirm. 3: Tenho a certeza absoluta que as pautas ou so afixadas s 10h30 ou j no so afixadas hoje Estas 3 afirmaes permitem constatar facilmente que se se pretende maior confiana na estatstica, se tem que permitir que a possibilidade de erro aumente. Por outro lado, se se permitir que o erro diminua, os extremos do intervalo aumentam, embora o resultado perca alguma preciso. No entanto, h que ter em ateno que, se um intervalo de confiana tem uma amplitude demasiado grande, a estimativa no tem utilidade. Cabe ao investigador gerir este trade-off. Isto leva a uma questo importante: o dimensionamento de amostras. At aqui, sempre se assumiu que as dimenses so conhecidas partida, sem referir como se determinam. No entanto, a resoluo deste problema tem um enorme interesse prtico, j que (i) recolher e tratar uma amostra demasiado grande para os resultados que se pretendem obter constitui um evidente desperdcio de recursos e (ii) recolher uma amostra cuja dimenso insuficiente para retirar concluses constitui um erro. A dimenso das amostras aumentar se se pretender garantir maior preciso ao intervalo e/ou maior grau de confiana. No captulo dedicado a aplicaes estatsticas, ser possvel ver como possvel utilizar o conceito de intervalo de confiana ao controlo estatstico de processos de qualidade.
87
INTERVALOS DE CONFIANA
Exerccios
Exerccio 1
Uma mquina fabrica cabos cuja resistncia ruptura (em kg/cm2) uma varivel com distribuio Normal de mdia 100 e desvio - padro 30. Pretendese testar uma nova mquina que, segundo indicaes do fabricante, produz cabos com resistncia mdia superior. Para isso, observam-se 100 cabos fabricados pela nova mquina, que apresentam uma resistncia mdia de 110 kg/cm2. Admita que o novo processo no altera o desvio padro da resistncia ruptura dos cabos. a) Determine um intervalo de confiana a 95% para a resistncia mdia ruptura dos cabos produzidos pela nova mquina. b) Suponha que pretendamos obter um intervalo de confiana com a mesma amplitude do anterior, mas com nvel de confiana de 99%. Quantos cabos deveriam ser observados?
Resoluo
x =110
=30
=95%
;X +c
= 110
Estima-se, com 95% de confiana, que a resistncia mdia ruptura dos cabos produzidos pela nova mquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2. b) Amplitude = 115,88 104,12 = 11,76 Amplitude = Lim.Sup. - Lim.Inf. = ( X + c =11,76 n Sendo que x =110 =30
Manual Tcnico de Formador 88
) -( X c
) = 2c
Logo 2c
Exerccio 2
Uma amostra de 20 cigarros analisada para determinar o contedo de nicotina, observando-se um valor mdio de 1,2 mg. Sabendo que o desvio padro do contedo de nicotina de um cigarro 0,2 mg, diga, com 99% de confiana, entre que valores se situa o teor mdio de nicotina de um cigarro.
Resoluo
x =1,2
=0,2
=99%
;X +c
= 1,2
2,576 x0,2 20
;1,2
2,576 x0,2 20
= [1,085;1,315]
Estima-se, com 99% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.
Exerccio 3
Admita-se que a altura dos alunos de uma escola segue distribuio Normal com varincia conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatria com dimenso n=25 alunos e calculada a respectiva mdia amostral, tendo-se obtido o valor de 1,70m. Defina um intervalo que, com probabilidade 95%, contenha o valor esperado da altura .
Resoluo
x =1,70
2=0,051
=95%
89
X c
;X +c
= 1,7
1,96 x 0,051 25
;1,2
1,96 x 0,051 25
= [1,611;1,788]
Estima-se, com 95% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.
Exerccio 4
Numa fbrica, procura conhecer-se a incidncia de defeituosos na produo de uma mquina. Para tanto, colhe-se uma amostra de dimenso suficientemente grande (1600 artigos), onde 10% dos artigos so defeituosos. Determine o intervalo de confiana para a referida proporo com 90% de confiana.
Resoluo
n=1600
=10% p
= [0,0876;0,1123]
Estima-se, com 90% de confiana, que a proporo de artigos defeituosos na produo se situa entre 8,76% e 11,23%.
Exerccio 5
O director fabril de uma empresa industrial que emprega 4000 operrios emitiu um novo conjunto de normas internas de segurana. Passada uma semana, seleccionou aleatoriamente 300 operrios e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa um intervalo de confiana a 95% para a proporo de operrios que conheciam adequadamente o conjunto das normas uma semana aps a sua emisso.
Resoluo
n=300
90
= p
75 = 0,25 300
= [0,201;0,299]
Estima-se, com 95% de confiana, que a proporo de operrios que conheciam adequadamente o conjunto das normas se situa entre 20,1% e 29,9%.
Exerccio 6
A Direco de Marketing de uma empresa pretende conhecer a notoriedade da marca de determinado produto. Nesse sentido, efectuou um inqurito junto de 1200 pessoas escolhidas aleatoriamente, verificando que 960 a conheciam. a) b) Estime a proporo de pessoas conhecedoras da marca atravs de um intervalo de confiana a 90%. Se se pretender que a amplitude do intervalo de confiana da alnea anterior no seja superior a 0,034, qual deve ser a dimenso mnima da amostra? c) Sabendo que o intervalo de confiana determinado pela Direco de Marketing foi [0,767; 0,833], calcule o nvel de confiana utilizado
Resoluo
a) n=1200
= p 960 = 0,8 1200
= [0,781;0,819]
91
Estima-se, com 90% de confiana, que a proporo de indivduos conhecedores da marca se situa entre 78,1% e 81,9%.
+c b) Amp.=Lim.Sup.-Lim.Inf. = ( p
Logo
(1 p ) (1 p ) (1 p ) p p p c )(p ) = 2c n n n
2c
+c c) p
Logo 0,8 + c
E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nvel de confiana utilizado
Exerccio 7
O gabinete de projectos de uma empresa de material de construo civil pretende estimar a tenso de ruptura do material usado num determinado tipo de tubos. Com base num vasto conjunto de ensaios realizados no passado, estima-se que o desvio - padro da tenso de ruptura do material em causa de 70 psi. Deseja-se definir um intervalo de confiana a 99% para o valor esperado da tenso de ruptura, pretendendo-se que a sua amplitude no exceda 60 psi. Qual o nmero de ensaios necessrio para definir tal intervalo?
Resoluo
n=?
=70
=99%
Logo 2c
60 2 * 2,576 *
70
n
60 n 36
92
Exerccio 8
A empresa SCB controla regularmente a resistncia ruptura dos cabos por si produzidos. Recentemente, foram analisadas as tenses de ruptura de 10 cabos SCB-33R, seleccionados aleatoriamente a partir de um lote de grandes dimenses, tendo sido obtida uma mdia de 4537 kg/cm2. Existe uma norma de 112 kg/cm2 em relao varincia, que respeitada. O director comercial pretende saber qual o intervalo de confiana, a 95%, para o valor esperado da tenso de ruptura dos cabos do lote em causa. Defina esse intervalo.
Resoluo
x =4537
=10,58
=95%
;X +c
= 4537
1,96 x10,58 10
;4537
1,96 x10,58 10
= [4530,5;4543,5]
Estima-se, com 95% de confiana, que o tenso mdia de ruptura dos cabos se situa entre 4530,5 kg/cm2 e 4543,5 kg/cm2.
Exerccio 9
Uma amostra de 50 capacetes de proteco, usados por trabalhadores de uma empresa de construo civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18 foram observados alguns danos. Construa um intervalo de confiana, a 95%, para a verdadeira proporo p de capacetes que sofre danos com este teste. Interprete o resultado obtido.
Resoluo
a) n=50
= p
18 = 0,36 50
93
c p
= [0,22695;0,49305]
Estima-se, com 95% de confiana, que a proporo de capacetes que sofre danos se situa entre 22,7% e 49,3%.
Exerccio 10
Qual deve ser o nmero de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar a proporo de portuenses que usam culos, de modo a garantir que um intervalo de confiana a 95% para essa proporo tenha uma amplitude no superior a 8 pontos percentuais?
Resoluo
n=?
+c Amp.= ( p
c: P (c Z c) = 95% D (c) = 95% c = 1,96 Considerando que a proporo amostral a que maximiza a amplitude (pior
2c
94
chuvas numa determinada regio, em milmetros por ano, segue uma lei normal N(600;100). Certos cientistas afirmavam poder fazer aumentar o nvel
mdio das chuvas em 50 mm. O seu processo foi posto prova e anotaram-
se os valores referentes a 9 anos: 510 614 780 512 501 534 603 788 650 Que se pode concluir? Adopte um nvel de significncia de 5%.
95
produzia qualquer efeito, ou este aumentava de facto o nvel mdio das chuvas em 50 mm. Estas hipteses podem formalizar-se do modo seguinte: H0: =600 mm H1: =650 mm Este um problema clssico de teste de hipteses, em que est em causa aceitar ou rejeitar a hiptese nula, em funo dos resultados de uma amostra. Ao utilizar uma amostra de uma populao, estamos a lidar com leis de probabilidades, logo no possvel de saber se a hiptese nula verdadeira ou falsa, mas apenas medir as probabilidades envolvidas na tomada de deciso. Podem-se definir 2 formas de especificar Ho e H1: (i) hiptese simples contra hiptese simples Ho: = 0 H1: = 1 (ii) hiptese simples contra hiptese composta Ho: = 0 H1: > 0 ou < 0 ou 0 Estes testes designam-se respectivamente de teste unilateral direita, teste unilateral esquerda e teste bilateral Sendo os testes de hipteses, portanto, um processo de inferncia estatstica onde se procuram tomar decises sobre a populao com base numa amostra, natural que envolvam alguma margem de erro e que ocorram em situao de incerteza. Estes erros no podem ser completamente evitados mas, no entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao investigador decidir qual a dose de risco de se enganar em que est disposto a incorrer. Vamos supor uma probabilidade de erro de, por exemplo, 5%. Nesse caso, e avanada a hiptese nula Ho, o investigador s estaria disposto a rejeit-la se o resultado obtido na amostra fizesse parte de um conjunto de resultados improvveis que teriam apenas, por exemplo, 5 chances em 100 de
Manual Tcnico de Formador 96
se produzir. Este tipo de formulao conhecida como postura conservadora. Ou seja, estamos mais propensos a achar que o novo processo no tem qualquer efeito sobre o nvel das chuvas (isto , que tudo se mantm igual) do que investir no novo processo (mudar), arriscando apenas quando houver evidncias da amostra muito fortes a favor do novo. Para que esta deciso possa ser tomada de uma forma controlada, conveniente pois que, partida, se fixe o valor a partir do qual se considera improvvel a validade da hiptese nula. Tal fixao corresponde fixao da regra de deciso do teste. A formalizao desta regra passa pela especificao de uma regio de regio de rejeio. A essa regio, isto , ao conjunto de valores improvveis que conduzem rejeio da hiptese nula d-se o nome de Regio Crtica. Ao limite superior de risco, que na maior parte dos casos de 10%, 5% ou 1%, dse o nome de Nvel de Significncia do teste, sendo este que permite definir a condio de rejeio de Ho. O Nvel de Significncia designa-se de e corresponde, ento, probabilidade de o resultado amostral levar rejeio de Ho, supondo Ho verdadeira, isto , probabilidade de se estar a cometer aquilo a que se convenciona chamar de erro de 1 espcie. Como veremos no exemplo, existem tambm erros de 2 espcie, cuja probabilidade se designa pela letra . Em resumo:
Quadro de deciso em condio de incerteza
Hiptese nula Ho Deciso Aceitar Ho Rejeitar Ho Hiptese Ho ser verdadeira: Deciso correcta (1-) Erro de tipo I Alfa () Hiptese Ho ser falsa Erro de tipo II Beta () Deciso correcta (1-)
Como decidir? Visto que se trata de testar o valor de , a varivel de deciso ser X . Considerando Ho verdadeira vem que
X N (600;
100 9
).
97
Em princpio, grandes valores de X so improvveis, pelo que se opta pela seguinte regra de deciso: Se X fr demasiado grande, isto , superior a um valor crtico c que tem apenas 5 chances em 100 de ser ultrapassado, opta-se por H1 com probabilidade 5% de se estar a cometer um erro. Se tal no acontecer, conserva-se Ho, por falta de provas suficientes para no o fazer. Logo, sendo P(Rejeitar Ho / Ho) = = 5%, vem que
>
n
c = 600 + 1,645 x 100 = 654,83(3) 3
rejeitar H0 em favor de H1, se o valor amostral fr superior a 654,83(3) conservar H0 em detrimento de H1 se fr inferior a 654,83(3)
Isto , a Regio Crtica deste teste, isto , o conjunto de acontecimentos que levam rejeio de H0 corresponde a todos os valores de X >654,83(3).
RA=(1-)
RR=
654,83(3)
X
= 600
Os dados recolhidos indicavam X =610,2 mm, pelo que a deciso conservar H0 , isto , considerar que o processo cientfico no produz efeitos.
98
No entanto, os erros incorridos no se ficam apenas pelos de 1 espcie. Existem tambm erros de 2 espcie. Isto , partida parte-se do princpio que H0 verdadeira e s se rejeitar essa hiptese se ocorrerem acontecimentos pouco provveis. No entanto, possvel alternativamente partir do princpio que H1 que verdadeira, ou seja, considerar que o processo cientfico realmente eficaz no aumento do nvel mdio das chuvas, mas que, infelizmente, o nmero de valores observado no permite observar resultados ou esses resultados foram insuficientes. Supondo ento que H1 verdadeira (=650 mm), ento vem que:
X N (650;
100 9
RA
1-
RR
= 650
A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2 espcie, vem ento igual a: P(Rejeitar H1 / H1)=
P ( X 654,83(3) / = 650) = P ( X
atravs das probabilidades e que se procura o melhor teste de hipteses, sendo o teste ideal o que minimiza simultaneamente ambos os valores. No entanto, e como e se referem a realidades opostas e variam em sentido contrrio, tal no possvel. O que na maior parte dos casos se faz fixar o (para amostras de dimenso n) e tentar minimizar .
99
RR
RR /2
1
RR /2
1
RR
Chama-se potncia de um teste probabilidade de rejeitar H0 quando esta falsa. Esta uma deciso certa, no implica erro, e complementar do erro de 2 espcie. Logo, quanto menor o erro de 2 espcie, maior ser o valor da potncia do teste e, logo, maior a sua qualidade (diz-se que o teste mais potente) . Quando H1 uma hiptese composta (>, < ou ), a potncia do teste varivel, dependendo do valor do parmetro que no fixo. Nesse caso falase em funo potncia do teste = 1 - (1)
Resumindo: passos para construo de um teste de hipteses: Passo No 1: Formular as hipteses nula e alternativa Passo No 2: Decidir qual estatstica (estimador) ser usada para julgar a Ho e a varivel de deciso Passo No 3: Definir a forma da Regio Crtica, em funo da hiptese H1 Passo N 4: Fixar o nvel de significncia Passo N 5: Construir a Regio Crtica em funo do nvel de significncia Passo N 6: Clculo (eventual) da potncia do teste Passo N 7: Calcular a estatstica da amostra Passo No 8: Tomar a deciso: rejeio ou no de Ho
100
Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos corresponde ao valor assinalado na embalagem. Seja X a varivel que representa o peso de um pacote de arroz. Suponha que
X N ( ;0,012 ) e que se conhece a seguinte amostra:
1,02 0,98 0,97 1,01 0,97 1,02 0,99 0,98 1,00 Ser que, para um nvel de significncia de 5% se pode dizer que o peso mdio corresponde ao peso de 1 kg assinalado na embalagem?
Notao
Peso de um pacote de arroz Quantidade mdia de arroz por pacote produzido Quantidade mdia de arroz por pacote da amostra Valor da mdia daquela amostra
Hiptese nula Hiptese alternativa Erro de tipo I Alfa () Erro de tipo II Beta ()
Ho: = 1 H1: < 1 Considerar que o peso mdio corresponde ao da embalagem quando inferior Considerar que o arroz contido em cada pacote era inferior ao indicado quando estava de facto de acordo com o valor da embalagem
Resoluo Passo 1 Formular as hipteses: Ho: = 1 H1: < 1 Passo 2 A estatstica a ser utilizada ser a mdia amostral
101
Passo 3 A regio crtica formada por todos os valores menores ou iguais a c Passo 4 Assumir um nvel de significncia de 5% Passo 5 Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo
P ( X < c / = 1) = 0,05 P (
<
n
0,01 = 0,9945 3 Logo, RC = ] ;0,9945] c = 1 1,645 x
c 1 ) = 0,05 0,01 9
A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2 espcie, vem ento igual a: P(Rejeitar H1 / H1)=. Logo a potncia do teste ser dada por 1- :
P ( X 0,9945 / = 0,99) = P ( X
Passo 7
Calcular a estatstica X =
Passo 8 Tomar a deciso
1 9
xi = 0,9933
Como o valor da amostra foi 0,9933 e menor que o valor crtico 0,9945, rejeita-se Ho Ou seja, considera-se que o arroz contido em cada pacote era inferior ao indicado. No entanto, h o risco de se mandar parar a produo para reviso do equipamento sem necessidade. Reduzindo a probabilidade de isso ocorrer de 5% para 1%, vem:
102
=1%
RR: Parar a produo
=5%
RA: Continuar a produo
0,9922 0.9945
Valor da amostra: 0,9933 A nica mudana ser no Valor Crtico, que de 0,9945 para 0,9922. Neste caso, aceitaremos Ho, ou seja, consideraremos que no h qualquer anomalia na produo.
Seja (x1, x2, , xn) uma amostra aleatria de uma populao com parmetro p desconhecido, e considere-se que n grande (na prtica, n>100). Vamos supor que se pretende testar o valor terico da percentagem (parmetro p). Fixando-se o nvel de significncia, determina-se a regio crtica. Sendo o estimador a proporo amostral, a varivel de deciso
Z=
p p
p (1 p ) n
N (0;1)
Exemplo
Numa cidade, pretende-se saber se metade da populao favorvel construo de um centro comercial. Faz-se um inqurito a 200 pessoas, e 45% declaram-se favorveis. Estes valores contradizem a hiptese? Conceitos Populao Amostra Notao Definio Os habitantes da cidade Os habitantes inquiridos
103
Conceitos Parmetro
Notao p
Definio Percentagem ou proporo de habitantes da cidade favorveis construo de um centro comercial Percentagem ou proporo de habitantes da amostra favorveis construo de um centro comercial Valor da proporo daquela amostra
Estimador
Estimativa Hiptese nula Hiptese alternativa Erro de tipo I Alfa () Erro de tipo II Beta ()
Resoluo Passo 1 Formular as hipteses: Ho: p = 0,5 H1: p < 0,5
Ho: p = 0,5 H1: p < 0,5 Considerar que a maioria dos habitantes no favorvel construo do centro comercial quando de facto so Considerar que a maioria dos habitantes favorvel construo do centro comercial quando so contra
Passo 2 A estatstica a ser utilizada ser a proporo amostral, onde o cuidado deve ser trabalhar com grandes amostras. Passo 3 A regio crtica formada por todos os valores menores ou iguais a c Passo 4 Assumir um nvel de significncia de 5% Passo 5 Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo
p p
p (1 p ) n
<
) = 0,05
c = 0,5 1,645 x
Logo, RC = ] ;0,442]
104
Passo 7 =0,45 p Passo 8 Como o valor amostral 0,45 maior que o valor crtico 0,442, no se rejeita Ho
=5%
RA: Continuar a produo
+ Valor amostral: 0,45 0,442 Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor 0 da construo do centro comercial, essa margem no suficiente para decidir deixar de o construir.
105
TESTES DE HIPTESES
Exerccios
Exerccio 1
O peso dos pacotes de farinha de 1 kg, produzidos por uma fbrica, uma varivel normalmente distribuda, com desvio padro 0,01. Da produo de determinado dia retirada uma amostra de 49 pacotes, com peso mdio de 0,998 Kg. Pode-se afirmar, a um nvel de significncia de 1%, que o peso mdio dos pacotes de farinha nesse dia no est de acordo com o peso indicado?
Resoluo
x = 0,998
= 1%
49
49
Como x = 0,998 > c = 0,997, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que o peso mdio no esteja de acordo com o indicado).
Exerccio 2
Numa regio onde existem entre os maiores de 18 anos 50% de fumadores, lanada uma intensa campanha anti-tabaco. Ao fim de trs meses, realiza-se um mini-inqurito junto de 100 cidados com mais de 18 anos, registando-se 45 fumadores. a) Com 1% de significncia, pode concluir-se que a campanha surtiu efeito?
Manual Tcnico de Formador 106
b) Em caso negativo, qual seria a dimenso da amostra a partir da qual aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em vista?
Resoluo
a) n = 100
= 0,45 p
= 1%
H0: p = 0,5 (a campanha no surtiu efeito) H1: p < 0,5 (a campanha surtiu efeito) P(Rejeitar Ho/Ho verdadeira) = = 1%
P ( X c / p = 0,5) = 0,01 P (
p p
p (1 p ) n
c 0,5
) = 0,01
c 0,5
= 2,326 c = 0,384
b)
Exerccio 3
Um fabricante afirma que o tempo mdio de vida de um certo tipo de bateria de 240 horas, com desvio-padro de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores: 237 242 244 262 225 218 242 248 243 234 236 228 232 230 254 220 232 240
107
Supondo que o tempo de vida das baterias se distribui normalmente, poder-se- concluir, a 5% de significncia, que as especificaes no esto a ser cumpridas?
Resoluo
x =
xi = 237,05
= 5%
18
18
Como x = 237,05 > c = 232,25, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que as especificaes no esto a ser cumpridas).
Exerccio 4
Uma empresa de cermica tem, em dada seco, fornos controlados por termstatos para manter a temperatura no interior dos fornos a 600 graus centgrados. A experincia tem demonstrado que a varincia dos valores da temperatura no interior desses fornos de 360. A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que anunciado como garantindo que as temperaturas se mantm dentro do limite desejado. Foram registadas 5 medidas de temperatura de fornos regulados para 600, utilizando novos controladores: 620 595 585 602 608 Para 5% de significncia, poder-se- concluir que a temperatura no se afasta significativamente do valor desejado?
108
Resoluo
x =
xi = 602
= 5%
P( X c / = 600) = 0,05 P(
c 600 360 5
) = 0,95
Como x = 602 < c = 613,96, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a temperatura no se afasta significativamente do valor desejado).
Exerccio 5
O peso dos ovos de chocolate produzidos numa fbrica segue distribuio normal com varincia 90,25. a) O fabricante diz que o peso mdio de 160 g. Foi recolhida uma amostra de 100 ovos, cujo peso mdio foi de 158, 437 g. Teste, a um nvel de significncia de 1%, se a afirmao do fabricante pode ser considerada verdadeira, ou se, pelo contrrio, o verdadeiro peso dos ovos ser menor. b) Qual o nvel de significncia a partir do qual a concluso seria diferente?
Resoluo
x = 158,437
= 1%
H0: = 160
Manual Tcnico de Formador 109
90,25 100
) = 0,01
100
Como x = 158,437 > c = 157,79, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a afirmao do fabricante pode ser considerada verdadeira). b)
P ( X 158,437 / = 160) = P ( X
) = F (1,645) = = 5%
Exerccio 6
Um jornal semanrio afirma ter atingido, numa regio, a percentagem, at ento nunca atingida por qualquer semanrio, de 60% de leitores que regularmente compram um jornal desse tipo. Efectuando um inqurito junto de 600 leitores, 55% declararam adquirir, por hbito, o semanrio em causa. Adoptando um nvel de significncia de 1%, pronuncie-se quanto projeco que o semanrio reclama.
Resoluo
= 0,55 p
= 1%
p p
p (1 p ) n
c 0,6
) = 0,01
c 0,6
= 2,326 c = 0,5535
110
Um molde de injeco tem produzido peas de um determinado material isolante trmico com uma resistncia compresso com valor esperado de 5,18 kg/cm2 e varincia 0,0625 (kg/cm2)2. As ltimas 12 peas produzidas nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistncia mdia compresso o valor de 4,95 kg/cm2. a) Poder-se- afirmar, a um nvel de significncia de 5%, que as peas produzidas recentemente so menos resistentes do que o habitual? b) Qual a potncia do teste efectuado anteriormente, admitindo que o valor esperado da resistncia compresso das peas produzidas recentemente de 4,90 kg/cm2?
Resoluo
x = 4,95
= 5%
0,0625 12
) = 0,05
12
Como x = 5,18 > c = 5,061, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (as peas produzidas recentemente no so menos resistentes do que o habitual).
111
b) Potncia = 1-
= (Conservar Ho/H1 verdadeira)
P ( X > 5,061 / = 4,9) = P ( X
>
Exerccio 8
Um jornal desportivo noticiou que o nmero de espectadores de um programa desportivo que apresentado na televiso aos domingos noite est igualmente dividido entre homens e mulheres. De uma amostra aleatria de 400 pessoas que vem regularmente o referido programa, concluiu-se que 240 so homens. Pode-se concluir, para um nvel de significncia de 10%, que a notcia falsa?
Resoluo
= 0,6 p
= 10%
p p
p (1 p ) n
c 0,5
) = 0,9
c 0,5
= 1,282 c = 0,53205
112
Define-se fiabilidade como sendo a probabilidade de um sistema (ou componente) desempenhar a funo para a qual foi concebido, nas condies previstas e nos intervalos de tempo em que tal exigido. A anlise da fiabilidade ser, ento, um mtodo de quantificar o que se espera que acontea e pode ser usada para indicar mritos relativos de sistemas, tendo em ateno um pr-definido nvel de fiabilidade. A fiabilidade de um componente pode ser obtida a partir da sua taxa de avarias. Se um sistema fr constitudo por vrios componentes, ento a fiabilidade ser dependente da fiabilidade dos componentes que compem esse mesmo sistema. necessrio, quando se apresentam os resultados de um estudo de fiabilidade saber exp-los, pois os interpretadores podero no ter a noo daquilo que se est a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou componente de 0,998 pode no significar muito; no entanto, se tal facto fr traduzido em que, por ano, o sistema em questo estar fora de servio por avaria num perodo de 9 horas j significa alguma coisa. Como o estudo da fiabilidade se trata de um estudo extremamente importante, pois que muitas vezes esto em jogo vidas humanas, importante desenvolver um estudo de probabilidade relativo ao funcionamento adequado de um componente ou sistema.
Ao analisar a fiabilidade de um sistema constitudo por vrios componentes, necessrio estudar a fiabilidade desses componentes e a forma como esto ligados (estrutura do sistema e definio do funcionamento do sistema). De seguida, so apresentados 3 casos: (i) as associaes de componentes em
113
paralelo; (ii) a associao de n unidades idnticas em paralelo em que apenas necessrio o funcionamento de m (m<=n) para o sistema funcionar; (iii) e as associaes em srie.
Uma vez que os componentes so redundantes, basta apenas um para que o sistema funcione. Considerando um sistema composto por apenas 2 componentes, se cada um dos componentes estiver no seu perodo de vida til, a fiabilidade do sistema (Rs) dada por: Rs = P (funcionar pelo menos um componente) = P (funcionarem 1 ou 2 componentes) = 1 P (no funcionar nenhum) = 1 P (no funcionar comp.1 e no funcionar comp.2) = 1 - P (no funcionar comp.1) x P(no funcionar comp.2) pois o funcionamento independente = 1 q1 x q2 onde q1 e q2 so, respectivamente as indisponibilidades (isto , as probabilidades de no funcionamento) das componentes 1 e 2. Se houver n componentes ligadas em paralelo, a fiabilidade do sistema dada por Rs = 1 - q1 x q2 x q3 x x qn = 1 -
q
i
114
Veja-se que, no caso de sistemas redundantes, a fiabilidade do sistema aumenta medida que aumenta o nmero de componentes ligadas ao sistema (que representam como garantias de funcionamento adicionais).
Se o sistema no fr redundante, as condies de funcionamento e de avaria para o sistema tm de ser definidos, isto , necessrio saber qual o nmero mnimo de componentes que necessitam de estar em funcionamento para que o sistema sobreviva. Para o efeito, vai considerar-se de novo um sistema composto por quatro componentes em paralelo. Se as componentes forem todas iguais, com probabilidade de funcionamento p e de indisponibilidade q, a probabilidade associada a cada um dos estados possveis (1, 2, 3 ou 4 componentes, no mnimo, a funcionar), a fiabilidade do sistema dada pelo quadro seguinte: N mnimo de componentes necessrias ao funcionamento do sistema 4 3 2 1
Ou seja, a fiabilidade do sistema funcionar pode ser calculada recorrendo lei binomial. Assim, por exemplo, para um n mnimo de 3 componentes necessrias, vem: Rs = P(pelo menos 3 componentes a funcionar) = P(funcionarem as 4) + P (funcionarem 3)
4 4 44 = C4 p q + C 34 p 3 q 43
= p 4 + 4 p3q Por exemplo, se todos os componentes tivessem fiabilidade 0,9 (p=0.9), ento a fiabilidade de um sistema deste tipo seria 94,77%.
115
Quando os componentes se encontram associados em srie, para que o sistema funcione torna-se necessrio que todos os componentes se encontrem em bom estado de funcionamento.
No caso mais vulgar de os componentes serem independentes, a fiabilidade do sistema dada por Rs = p1 x p2 x p3 x ... x pn No caso de todas as componentes serem iguais Rs = pn Facilmente se depreende que a fiabilidade do sistema diminui medida que aumenta o nmero de componentes ligadas em srie. A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por
e t
A probabilidade de avariar at ao instante t dada por
1 e t
Num sistema com vrias componentes em srie, em que o componente se encontra a funcionar no seu perodo de vida til, a fiabilidade do sistema dada por
Rs = e
(iv) Outros sistemas
n i =1
i t
Quando a estrutura do sistema no puder ser enquadrada em nenhuma das anteriores, tero que ser analisadas tcnicas mais gerais, tais como a rvore
de avarias. O mtodo consiste basicamente em identificar todos os modos
possveis de avaria e control-los. Assim, supondo que se pretende analisar a fiabilidade da iluminao de uma sala com uma lmpada.
116
Se o objectivo fr calcular a probabilidade de falta de energia (acontecimento secundrio) vem P (avaria) = P (A B) = P (A) + P(B) + P(A)xP(B) Para o acontecimento prioritrio (sala s escuras) vem: P(sala s escuras) = P(falta de energia lmpada estragada) Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de proteco e esquemas de comando (fiabilidade de msseis e reactores nucleares, por exemplo).
Sala s escuras
Falta de energia
Lmpada estragada
Avaria na rede
Actuao da proteco
117
do conhecimento geral que nenhum processo de produo executa dois produtos iguais. Os processos industriais so caracterizados por produzirem peas cujas caractersticas variam dentro de certos valores tolerveis. As variaes so inevitveis, podendo ser grandes, pequenas, muito ou pouco dispersas. O conhecimento do tipo, da extenso e da evoluo dessas variaes extremamente importante para podermos garantir que nos possvel produzir produtos que vo cumprir as especificaes, para eles definidas, a um nvel aceitvel. Os testes descritos anteriormente referiam-se em situaes em que o estudo no era cronolgico. simples imaginar situaes onde, pelo contrrio, o processo a analisar deva ser monitorado ao longo do tempo. Situaes deste tipo ocorrem em linhas de fabrico de produtos, estudos de conservao de materiais e mquinas, qualidade de servios. Duma forma geral, entende-se por controle de qualidade a monitorizao de um processo, cujos resultados de natureza quantitativa se devem encontrar dentro de determinados limites. Um processo est sob controle se os resultados esto em conformidade com os limites impostos; caso contrrio, o processo deve ser investigado para que sejam detectadas as causas do desvio. A "qualidade" pode referir-se a um valor fixo, que constitui o objectivo desejado (por exemplo, a conformidade da mdia relativamente a "limites normais"). A avaliao do processo implica, que em certos intervalos de tempo se proceda a uma amostragem. O controlo estatstico de qualidade permite uma interveno nos processos, no sentido de se ajustarem e corrigirem os processos, antes de qualquer alterao no natural passar a fazer efeito de forma contnua. As cartas de controlo so um instrumento poderoso que permite identificar as causas de variao no natural nos processos. Ao definir uma carta de controle para a mdia, necessrio comear por definir a norma para (0) e 2 nveis de controle: os de vigilncia garantida (limites
118
inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a mdia amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Supe-se que a varivel em estudo segue Distribuio Normal, sendo os LIC e LSC calculados da seguinte forma:
LIC / LSC = 0 +/-
Ao definir uma carta de controle para a proporo, por exemplo, de defeituosos, necessrio comear por definir a norma para p (p0) e 2 nveis de controle: os de vigilncia garantida (limites inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a proporo amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Os LIC e LSC calculados da seguinte forma:
119
As cartas de controlo so instrumentos fceis e simples de aplicar pelos executantes, no sentido de se obter o controlo contnuo do processo. Podem ser traadas nos prprios locais de trabalho, dando informaes preciosas sobre os momentos em que so necessrias aces correctivas. Desde que o processo esteja sob controlo estatstico, as cartas de controlo permitem prever de forma adequada o comportamento do processo, e melhorar os processos, com base na informao disponvel nas cartas, no sentido de reduzir a sua variabilidade. As cartas so elaboradas a partir de medies efectuadas de uma caracterstica do processo (a mdia, por exemplo). Os dados so obtidos de amostras de tamanho constante, geralmente 3 ou 5 unidades, recolhidas consecutivamente em intervalos de tempo constantes. Deve ser elaborado um plano de recolha de dados, que dever ser usado como base para a colheita, registo e marcao dos dados no grfico. As amostras a utilizar devem ser de tamanho racional, isto , devem ser eficazes para o controlo sem acarretar esforo demasiado e desnecessrio na colheita. A interpretao dos limites de controlo a seguinte: se a variabilidade pea a pea do processo permanecesse constante e nos nveis encontrados, seria legtimo concluir que na base de um ponto fora dos limites de controlo estariam causas que importa conhecer e sanear. Um ponto fora do controlo deve merecer uma anlise imediata quanto causa.
Exemplo Uma empresa fabrica e comercializa condutores elctricos cujas condies de
120
Proceder-se- paragem da produo sempre que os limites de controlo Um condutor considerado no defeituoso se a sua resistncia em
sejam desrespeitados estiver compreendida entre [49,530; 50, 470] Nestas condies, determine: a) b) c) O valor da norma 0 A probabilidade de se proceder a uma paragem indevida da produo A probabilidade de, estando a norma a ser cumprida, se produzir um
artigo defeituoso.
Resoluo
X: resistncia de um componente em
X N ( ; (0,25) 2 )
a)
LIC =
c n
c n
= 49,8775
LSC = +
= 50,1225
c n
+ +
c n
= 2 = 100
b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(49,8775 X 50,1225 sendo =50) =
121
1 - P(
1- P(-1,96 X 1,96) = Na tabela da Normal, vem D(1,96) = 0,95 donde 1 0,95 = 5% c) P(produzir um artigo defeituoso, sendo a norma respeitada) =
49,53 50 50,47 50 X )= 0,25 0,25 16 16
1 - P(-1,88 X 1,88) =
Pode ser mantido um registo das mdias amostrais por meio de uma carta como a representada na figura abaixo, denominada carta de controle de qualidade.
Segunda-feira
Tera-feira
Quarta-feira
Quinta-feira
Sexta-feira
50 49,8775
122
Cada vez que for calculada uma mdia amostral, ela ser representada por um ponto particular. Enquanto eles carem entre o limite inferior, 49,8775 , e o superior, 50,1225 , o processo est sob controle. Quando um ponto estiver fora desses limites de controle (como ocorreu com a terceira amostra tomada na quinta-feira), h a possibilidade de haver alguma anomalia, o que justifica uma investigao. Os limites de controlo especificados so denominados de limites de confiana. A escolha, em cada caso, depende das circunstncias particulares de cada processo.
123
O teste do
variveis qualitativas. Trata-se de um teste de hipteses semelhante aos anteriormente estudados, mas que se inclui na categoria dos testes noparamtricos, isto , aqueles que no incidem explicitamente sobre um parmetro de uma ou mais populaes (por exemplo, o valor esperado ou a proporo, como os estudados anteriormente). No entanto, a lgica de formulao das hipteses e de definio de uma regra de deciso equivalente aos testes paramtricos. O princpio bsico deste mtodo noparamtrico comparar as divergncias entre as frequncias observadas e as esperadas. Este teste encontra aplicabilidade no tratamento estatstico de inquritos. De facto, para alm do tratamento frequencista dos inquritos, por vezes interessante aferir da existncia de relaes estatsticas relevantes entre as diversas questes (por exemplo, testar se h alguma coerncia entre quem respondeu opo 1 da pergunta X e opo 2 da pergunta Y). O estudo destas relaes encontra aplicabilidade no campo das anlises de mercado, em que o objectivo proceder sua segmentao. A existncia de associaes entre as questes permite determinada um vector comum entre grupos de inquiridos que responderam de forma semelhante a certo tipo de questes (concluir algo como que os habitantes de uma dada rea foram sempre os que assinalaram determinado tipo de respostas e constituem, por isso, um segmento geogrfico autnomo e com caractersticas prprias de entre o total dos inquiridos). De uma maneira geral, pode dizer-se que dois grupos se comportam de modo semelhante se as diferenas entre as frequncias observadas e as esperadas em cada categoria forem muito pequenas ou prximas de zero.
124
universidade e dependncia de drogas. Entrevistou 120 alunos, sendo 25 de Medicina, 35 de Farmcia e 60 de Biologia, perguntando sobre o uso de drogas, admitindo somente duas respostas: sim ou no. Aps o processamento dos dados, chegou-se seguinte tabela de distribuio de frequncias: Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60
120
As tabelas como aquela na qual se apresentam os resultados referentes ao exemplo so habitualmente designadas de tabelas de contingncia. Admitase que os resultados que nela figuram resultam de amostras aleatrias. Tais resultados representam o nmero de observaes includas nas diferentes combinaes das classes nas quais as duas variveis em estudo se exprimem. Mod. 1 Modalidade 1 Modalidade 2 Modalidade n Total onde nij: frequncia observada na clula ij n.j: frequncia marginal observada na modalidade j ni.: frequncia marginal observada na modalidade i n: dimenso da amostra n11 n21 n.1 Mod. 2 n12 n22 n.2 Mod. n nnn n.j Total n1. n2. ni.
n
125
O objectivo do teste o de verificar se as duas variveis em questo so ou no relacionadas. As hipteses nula e alternativa so ento as seguintes: Ho: As variveis so independentes H1: As variveis no so independentes As frequncias observadas so obtidas directamente dos dados da amostra, enquanto que as frequncias esperadas so calculadas a partir destas, sob o pressuposto de que Ho verdadeira, isto , admitindo a hiptese de independncia. Na prtica, a frequncia esperada calculada pela multiplicao do total da coluna respectiva pelo total da linha a que pertence, dividindo-se o produto pela dimenso total da amostra:
eij = n i . * n. j n
(nij eij ) 2
eij
Note-se que o numerador faz referncia diferena entre frequncia observada e frequncia esperada, que dever ser calculada para cada clula da tabela. Quando as frequncias observadas so muito prximas das esperadas, o valor do numerador pequeno; no entanto, quando as discrepncias so grandes, o valor do numerador passa a ser grande e, consequentemente, o assume
valores altos. Ou seja, quando h fortes discrepncias entre o que de facto foi observado e o que seria de esperar sob a hiptese de independncia, a varivel de deciso assume um valor elevado e h motivos ou significncia
fornecido em uma tabela, considerando o nvel de significncia adoptado e os graus de liberdade GL ou d.f. (obtidos por (nmero de linhas-1)*(nmero de colunas-1)).
126
Para
nvel
de
significncia
de
5%,
obtm-se
da
Resoluo: Como pode ser observado, entre os 120 alunos includos no estudo h um
nmero igual (60) que afirma usar e no usar drogas. No entanto, a distribuio entre os vrios cursos no ocorre de forma homognea. Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60 120
Os dados so do tipo qualitativo, pois cada aluno entrevistado foi classificado sob uma determinada categoria. Neste caso, pode usar-se o teste do quiquadrado com duas hipteses de trabalho: Ho: No h associao entre tipo de curso e dependncia de drogas H1: H associao entre tipo de curso e dependncia de droga
127
Se o
Para o clculo do
Por exemplo, se as duas variveis fossem independentes, seria de esperar que o nmero de estudantes de Medicina a admitir usar drogas fosse de:
eij = ni. * n. j n
25 * 60 = 12,5 120
2. As frequncias esperadas devero ser anotadas nas correspondentes clulas: Medicina Usa drogas No usa drogas Total nij eij nij eij 10 12,5 15 12,5 25 Farmcia 20 17,5 15 17,5 35 Biologia 30 30,0 30 30,0 60
120
Total 60 60
=
i j
(nij eij ) 2
eij
= =1,7
4. Determinam-se os graus de liberdade na tabela Os graus de liberdade da tabela so calculados multiplicando (nmero de linhas-1)*(nmero de colunas-1)= (2-1)*(3-1)=2 GL 5. Por ltimo, compara-se o valor do observado obtido (1,7) com o valor do
crtico, considerando os graus de liberdade (GL) e o nvel de significncia adoptado (ver tabela anexa). Vem que o obsv.=1,7 menor do que o valor obtido a partir da tabela, que
5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho no pode ser rejeitada, concluindo-se que, no grupo estudado, no h associao entre as variveis. Em mdia, a proporo de alunos que usam ou no drogas no varia entre os cursos.
128
Observao: Caso 20% ou mais das clulas tenham frequncias esperadas menores que 5, ou haja uma ou mais frequncias esperadas com valores menores ou igual a 1, no se deve usar o teste do lgico. . Uma boa alternativa para estes casos o
A empresa BrasFruta Lda est a instalar-se em Portugal com um produto inovador, um concentrado de fruta semelhante a um sumo de fruta natural. A inteno vender o produto em cafs, esplanadas e bares que passariam a dispor de uma imitao perfeita de um sumo acabado de fazerva um preo vantajoso. Atravs de um estudo qualitativo com consumidores, conseguiu-se apurar que existia uma grande sensibilidade ao preo. Apesar de haver uma preferncia generalizada por sumos naturais face a refrigerantes, os consumidores mostravam-se cpticos em relao qualidade quando se falav em preos baixos. Entendeu-se ento levantar a seguinte questo: a sensibilidade ao preo afectada pelo poder de compra dos clientes? Numa sondagem efectuada a 1973 clientes potenciais, confrontaram-se os inquiridos com trs alternativas: adquirir sumo natural a preo elevado, adquirir sumo natural a preo baixo ou adquirir refrigerantes. A sondagem revelou que, dos clientes classes A/B/C1, 598 pagariam um preo mais elevado pelo sumo natural, enquanto 212 no estariam dispostos a gastar tanto. Em relao aos 977 clientes das classes C2/D/E, 164 s consumiriam sumo natural se o preo fosse baixo e 285 preferiam refrigerante. Cruzaram-se ento os dados e construiu-se a tabela que se segue:
129
As concluses foram retiradas pelo recurso anlise correlacionada atravs do teste do qui-quadrado. Estes testes foram elaborados sobretudo com o intuito de segmentar o mercado. As frequncias foram utilizadas para analisar o mercado como um todo e para interpretar o resultado dos testes de correlao, para os quais se convencionou a adopo de um nvel de significncia de 5%, considerado razovel face aos valores normalmente utilizados. Para o clculo das frequncias esperadas, procedeu-se aplicao de
eij = n i . * n. j n
Preo Elevado A/B/C1 C2/D/E Total nij eij nij eij 598 568.4 528 557.6 1126
Vem que o
que 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que, no grupo estudado, no h associao entre as variveis. Em mdia, o poder de compra do consumidor influencia a sensibilidade ao preo.
Manual Tcnico de Formador 130
Sempre que surgir alguma dificuldade em validar os testes, as diferentes alternativas por questo devem ser agregadas (isto , o nmero de classes era reduzido) de modo a diminuir os graus de liberdade associados, mas garantindo a manuteno de menos de 20% de ei<5 ou de nenhum ei<1. Relaes estatisticamente relevantes, mas sem qualquer lgica subjacente ou demasiado bvias, no foram consideradas.
131
0.995 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886
0.975
0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908
0.9
0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865
0.5
0.455 1.386 2.366 3.357 4.351
0.1
2.706 4.605 6.251 7.779
0.05
3.841 5.991 7.815
0.025
5.024 7.378
0.01
6.635
0.005
0.001
7.879 10.827
5.348 10.645 12.592 14.449 16.812 18.548 22.457 6.346 12.017 14.067 16.013 18.475 20.278 24.321 7.344 13.362 15.507 17.535 20.090 21.955 26.124 8.343 14.684 16.919 19.023 21.666 23.589 27.877 9.342 15.987 18.307 20.483 23.209 25.188 29.588
5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252
7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179
25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619 26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051 27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475 28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892 29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301 30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702
132
FIABILIDADE
Exerccios
Exerccio 1
Num centro comercial, est instalado um sistema de 10 mquinas para utilizao de carto multibanco. Diz-se que o sistema est em funcionamento se pelo menos uma das mquinas funciona. Suponha que cada mquina funciona independentemente das outras e a probabilidade de funcionamento de cada mquina 85%. Calcule a probabilidade do sistema estar em funcionamento.
Resoluo
P(avaria) = 1-0,85 = 15% P(sistema estar em funcionamento) = 1 P(sistema avariar) = 1 P(nenhuma das mquinas funcionar) = 1 P(maq1 no funcionar e...e maq 10 no funcionar) = 1 0,15*0,15*...*0,15 = 1 (aproximadamente)
2. Quatro componentes de um sistema encontram-se associados de acordo com a figura junta. Esto no seu perodo de vida til e as taxas mdias de avarias so 10-4 avarias/hora (A), 2x10-5 avarias/hora (B e C) e 5x10-5 avarias/hora (D).
B A C D
A: Rs = e D: Rs = e
104 *5000
( 5*105 ) *5000
133
B e C: Rs = e
( 2*105 ) *5000
= e 0,1 = 90,4837%
P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 (1-0,904837)2 = 99,0944% Logo, P(sistema estar em funcionamento aps 5 000 horas) = = 0,606531*0,990944*0,778801 = 46,8%
Exerccio 3
Foram ensaiadas durante 3 000 horas, sem que se verificasse qualquer avaria, cinco unidades idnticas de um equipamento que se sabe ter uma curva de sobrevivncia que obedece a uma distribuio exponencial, com um MTBF de 17 500 horas. Calcule a fiabilidade do equipamento.
Resoluo
X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/17500) MTBF = 17500 Y: n de avarias no intervalo [0,3000] horas
Rs = e
Exerccio 4
3000 17500
= e 0,171429 = 84,25%
O tempo de funcionamento sem avarias de uma determinada mquina de produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. a) Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
b) Admitindo que a mquina se encontrava em funcionamento no instante
134
Resoluo
a) X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/4,5) MTBF = 4,5
6 0 1 4,5 e dx = e 4,5 = 26,4% 4,5 1 6
P(X 6) = 1 P ( X < 6) = 1
Ou considerando Y: n de avarias no intervalo [0,6] horas, como Y segue Po(1/4,5), vem que P(X 6) = P(Y=0) = e-t = e-(1/4,5)t = e-(6/4,5) = 26,4%
6
6 4,5
Exerccio 5
Sabe-se que um determinado modelo de lmpadas apresenta no perodo de vida til (3625 horas) um MTBF de 12 000 horas. Calcular: a) A probabilidade de falha de uma ou mais lmpadas, num conjunto de 10, no perodo de vida til.
b) Quantas lmpadas, de um conjunto de 1 000, estaro provavelmente em
a) Rs = e
3625 12000
= e 0,302 = 73,9%
= e 0,1667 = 84,6%
135
Exerccio 6
Num grande centro comercial existem 3 telefones pblicos, colocados estrategicamente a fim de satisfazer adequadamente os utentes. A observao prolongada do funcionamento dos telefones levou a concluir que as probabilidades dos 3 telefones, T1, T2 e T3 se encontrarem avariados so, respectivamente, 0,15, 0,2 e 0,25 e que as avarias so independentes. O grupo de telefones satisfaz minimamente o servio se pelo menos 2 estiverem sem avarias. Qual a probabilidade de pelo menos dois destes telefones estarem sem avarias?
Resoluo
P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem sem avarias) = 0,095+0,51=60,5% P(2 sem avarias) = 0,15*0,2*0,75+0,85*0,2*0,25+0,15*0,8*0,25=9,5% P(3 sem avarias) = 0,85*0,8*0,75=51%
Exerccio 7
Um sistema constitudo por 5 componentes iguais, sendo 0.05 a probabilidade de um elemento falhar ao longo de qualquer dia da semana. No caso de nenhum elemento avariar o sistema funciona normalmente; se um dos elementos avariar o sistema funciona com probabilidade 0.7; se mais de um elemento avariar o sistema no funciona. Calcule: a) b) a probabilidade do sistema funcionar ao longo do dia. a funo de probabilidade do n de falhas registadas nos seus componentes ao longo de um dia, indicando o valor mdio de tal distribuio.
Resoluo
a) P(sist. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar) = (0,955)* 1 + (5*0,954*0,05)*0,7 = 0,7738 + 0,1425 = 91,63% b) Bi(n=5;p=0,05) Valor mdio=5*0,05=0,25
136
Exerccios
Exerccio 1
A empresa TRADECHO, SA mantm um diferendo com os seus principais clientes, que afirmam que os produtos produzidos (em srie) por esta empresa no obedecem s normas de qualidade estabelecidas e que so:
-
a norma para o comprimento mdio das peas de 20 cm; a norma para a varincia de 4 e est a ser cumprida; a amplitude do intervalo de controle para a mdia deve ser de 1,96; a dimenso das amostras a extrair de 16
Afirmam os clientes que a probabilidade de parar indevidamente o processo produtivo superior quela que decorre das normas. a) Determine a probabilidade referida. b) Represente a carta de controle para a mdia c) A recolha de 5 amostras forneceu os seguintes resultados para a mdia: 20,05 19,90 20,00 20,30 20,15
a) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(20-1,96/2 X 20+1,96/2 sendo =20) = 1 - P(
0,98 0,98 X )= 2 2
16 16
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Amostra 5
20,5
19,90
20
20,3
20,15
19,02
Numa empresa procede-se ao exame das condies de produo relativas durao (em horas) das lmpadas fabricadas (produo em srie). Sabe-se que o desvio-padro da durao de uma lmpada de 100 horas. O Departamento de Produo construiu o seguinte intervalo para a durao mdia de uma lmpada, a partir de uma amostra de dimenso 100:
[983,55; 1016,45]
parando-se o processo produtivo se o valor mdio amostral se situar fora deste intervalo. a) Calcule o valor adoptado para a norma (0) b) Determine a probabilidade de se parar indevidamente o processo produtivo.
Resoluo
a) LIC = LSC = +
= 983,55
= 1016,45
138
c n
+ +
c n
= 2 = 2000
b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(983,55 X 1016,45 sendo =1000) = 1 - P(
983,55 1000 1016,45 1000 X )= 100 100 100 100
1- P(-1,645 X 1,645) = Na tabela da Normal, vem D(1,645) = 0,9 donde 1 0,9 = 10%
Exerccio 3
O novo Conselho de Administrao da empresa de componentes elctricas Alta Tenso, SA resolveu efectuar um estudo aprofundado sobre o controle estatstico de qualidade das peas produzidas. Assim, definiu com o director de produo os aspectos considerados relevantes no controle da durao mdia das componentes:
-
o limite superior de qualidade (LSC) deve ser de 10,8 milhares de horas a amplitude do intervalo no deve exceder 1,96 milhares de horas a probabilidade de se parar indevidamente a produo de 5%
Sabe-se ainda que o desvio padro da durao de uma componente de 4 mil horas. a) Determine a dimenso da amostra que necessrio recolher para cumprir as condies definidas.
b) Calcule a norma.
Resoluo
139
a) LSC = +
c n
= 10,8
1,96 logo 2
c n
1,96 * 4
n
1,96 n 64
1,96 * 4 64
b) LSC = +
= 9,82
Exerccio 4
O director de produo da empresa DISLIX, SA pretende implementar um sistema de controle interno de qualidade de um determinado tipo de geradores fabricados em srie. Para tal, procede verificao da produo de energia elctrica (em kws/hora) tendo e vista a construo de um intervalo de controle para a produo mdia de energia de um gerador que cumpra os seguintes objectivos:
-
Norma de produo para a mdia: 10 A amplitude do intervalo no deve exceder 3,92 A probabilidade de se parar indevidamente a produo no deve exceder 5%
Sabe-se que o desvio padro da produo da energia elctrica de um gerador de 4 kws/hora e que a varivel segue distribuio Normal. a) Determine a dimenso mnima da amostra a utilizar para o controle de produo.
b) Represente a carta de controle para a mdia.
Resoluo
3,92 logo 2
1,96 * 4
n
3,92 n 16
140
Amostra 1
Amostra 2
Amostra 3
Amostra 4
Amostra 5
10 8,04 LIC =
c n c n
= 10
1,96 * 4 16 16
= 8,04 = 11,96
LSC = +
= 10 +
1,96 * 4
141
Exerccios
Aos exames de primeira poca de determinada disciplina compareceram 105 alunos, dos quais 20 no tinham prestado qualquer prova durante o ano. O nmero de aprovaes foi de 33, das quais 3 foram de alunos que no tinham efectuado provas durante o ano. Diga, com base nestes elementos, se, para um nvel de significncia de 5%, se pode afirmar que existe independncia entre a comparncia (ou no) a provas durante o ano de aprovao (ou no) em exame.
Resoluo
Aprovado 30 3 33
Reprovado 55 17 72
Total 85 20 105
Ho: As variveis so independentes H1: As variveis no so independentes crtico (GL=2; =0,05)=3,84 observado = 3,122 Vem que o obsv.= 3,122 menor do que o valor obtido a partir da tabela.
Exerccio 2
Com o objectivo de testar se existe relao entre a formao do gerente de uma dependncia bancria e a respectiva performance, construiu-se a seguinte tabela de contingncia, relativa a 300 balces de diferentes bancos: Formao Gerente Vol. Negcios Baixo Mdio Elevado
Mdia 44 55 51
Superior 52 43 55
142
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Formao Gerente Vol. Negcios Baixo Mdio Elevado crtico (GL=2; =0,01)=9,21 observado = 2,2876 Valor obsv. est. teste = Vem que o
(44 48) 2 (55 53) 2 + ... + = 2,2876 > 9,21 48 53
Mdia 48 49 53
Superior 48 49 53
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 3
Pretendendo-se analisar o comportamento do volume de divisas ao longo do ano, deu-se particular ateno influncia exercida pelas remessas de emigrantes. Assim, o ano foi dividido em duas pocas: poca de Ponta, compreendendo os meses de vinda de emigrantes (Vero e Natal) e poca Normal (restantes meses). Assim, observou-se o nvel de Disponibilidades Lquidas sobre o Exterior (DLX) para cada ms, tendo-se obtido: Volume DLX Baixo/Mdio 150 20 Elevado 50 80
143
Resoluo
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Volume DLX poca Normal Ponta Baixo/Mdio 113,33 6,66 Elevado 86,66 43,33
(150 113,33) 2 (80 43,33) 2 Valor obsv. est. teste = + ... + = 85,069 > 3,84 113,33 43,33
Vem que o obsv.= 85,069 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 4
Num estudo que pretendia averiguar a existncia de relao entre a procura de moeda e a taxa de juro, procedeu-se recolha peridica de elementos sobre essas variveis, construindo-se a seguinte tabela de contingncia: Taxa juro Proc. Moeda 0-10 10-45 45-70 Reduzida 20 20 250 Mdia 30 400 30 Elevada 200 30 20
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Taxa juro Proc. Moeda 0-10 10-45 45-70 Reduzida 72.5 130.5 87 Mdia 115 207 138 Elevada 62.5 112.5 75
144
Vem que o
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 5
Um investigador seleccionou trs amostras de estudantes, A, B e C, que fazem parte de um determinado projecto de estudo e aplicou-lhes uma escala de atitudes com o objectivo de conhecer as suas opinies em relao ao projecto. Os resultados de uma amostra de 140 estudantes foram os seguintes: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva
A 30 10
B 30 20
C 10 40
Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva
A 20 20
B 25 25
C 25 25
crtico (GL=2; =0,05)=3,84 observado = 30 Vem que o obsv.= 30 maior do que o valor obtido a partir da tabela,
Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
145
BIBLIOGRAFIA
Murteira, Bento; Black, George; Estatstica Descritiva, Mc-Graw-Hill Murteira, Bento; Anlise Exploratria de Dados, Mc-Graw-Hill Murteira, Bento; Probabilidades e Estatstica, Vol. I, II, Mc-Graw-Hill Oliveira, Tiago; Probabilidades e Estatstica, Vol. I, II, Mc-Graw-Hill Guimares, Rui C.; Sarsfield Cabral, J. A.; Estatstica, Mc-Graw-Hill Kreyszig, Erwin; Introductory Mathematical Statistics, Wiley Fisz, Marek; Probability Theory and Mathematical Statistics, Wiley Mood, Graybill and Boes; Introduction to the Theory of Statistics, McGraw-Hill Wonanacot, T.H.; Wonnacot; R.J.; Introductory Statistics, Wiley Siegel, A. F.; Practical Business Statistics, 3 ed., Irwin, Boston
146
ANEXOS ACETATOS
147
VARIVEL CONTNUA
Exerccio 1 Tabela de frequncias
[0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50]
Total X fi 10% 25% 35% 15% 10% 5% 1 hi 1 2 2 10 10 25 fi/hi 0.1 0.125 0.175 0.015 0.01 0.002 Fi 10% 35% 70% 85% 95% 100% ci 0.5 2 4 10 20 37.5
Histograma
fi/hi 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 10 20 30 40 50 60
148
Polgono Integral
Fi
1 0,8 0,6 0,4 0,2 0 0 20 40 60 80 100 120
Mediana
Fi
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 20 40 60 80 100 120
149
0,75
0,5
0,25
0 0 Q1 Q2 Q3 10 20 30 40 50
Classe a que pertence Q1: [1; 3[ 0,35 - 0,1 ------------ 3 - 1 0,25 0,1 -------------- Q1 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas tm res. lquidos inferiores a 2200 u.m. Classe a que pertence Q3: [5; 15[ 0,85 - 0,7 ------------ 15 - 5 0,75 0,7 -------------- Q3 5 Q3 = 1 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas tm res. lquidos inferiores a 8333 u.m.
Manual Tcnico de Formador 150
0,75
0,5
0,25
0 0
Q1
1 1,15
Q2 Q3
Classe a que pertence Q1: [0,5; 1[ 0,383 - 0,059 ------------ 1 0,5 0,25 0,059 -------------- Q1 0,5 Q1 = 0,5 + ((0,5x0,191)/0,324) = 0,795 25% das empresas tm rcio inferior a 0,795 Classe a que pertence Q3: [1; 1,5[ 0,765 - 0,383 ------------ 1,5 - 1 0,75 0,383 -------------- Me 1 Me = 1 + ((0,5x0,367)/0,382) = 1,48 75% das empresas tm rcio inferior a 1,48
Manual Tcnico de Formador 151
Fi
0,75
0,5
0,25
Classe a que pertence Q1: [100; 120[ 0,542 - 0,23 ------------ 120 100 0,25 0,23 -------------- Q1 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 Classe a que pertence Q2: [100; 120[ 0,542 - 0,23 ------------ 120 100 0,5 0,23 --------------- Q2 100 Q2 = 100 + ((20x0,27)/0,312) = 117,31
50% dos
Classe a que pertence Q3: [140; 160[ 0,809 - 0,737 ------------ 160 - 140 0,75 0,737 -------------- Q3 140 Me = 140 + ((20x0,013)/0,072) = 143,61
75% dos
152
RECTA DE REGRESSO
Exerccio 10
x = 1 n
n i =1
n i =1
n i =1
xi = 21,429
2
y =
1 n
n i =1
y i = 6,714
sx
sy
1 = n
1 = n
(xi x )
(yi y )
= 69,9408
= 11,0651
CV x =
<
CV y =
sy y
Recta de Regresso
y = 2,4649x + 4,8782 30
Vendas
20
r=
s xy s xx s yy
= 0,98
10
r= s xy s xx s yy
1 [(10 21,429)(3 11.0651) + ... + (35 21,429)(13 11,0651)] 7 = = 0,98 69,9408 x 11,0651
0 3 8 Desp. Public. 13
153
ANLISE DE CONCENTRAO
Exemplo: Amostra de 200 empresas de um dado sector industrial, referente aos lucros obtidos em u.m.
Lucros [0; 50[ [50; 100[ [100; 200[ [200; 300[ [300; 500] Total ni 20 60 80 30 10 200
n 1
( pi qi)
n 1 i =1
G=
i =1
= pi
0,2
0,4
0,6
0,8
1
154