P. 1
43173796 Estatistica Aplicada Exercicos Resolvidos

43173796 Estatistica Aplicada Exercicos Resolvidos

|Views: 52|Likes:
Publicado pormelinaguimaraes

More info:

Published by: melinaguimaraes on Nov 10, 2012
Direitos Autorais:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

12/04/2012

pdf

text

original

Sections

  • 3.4. Estimação por intervalos
  • 3.5. Testes de hipóteses
  • 3.6.1 Conceito de fiabilidade
  • 3.6.2 Fiabilidade de um sistema
  • 3.8.1 Teste de independência do qui-quadrado

104

Introdução ao e-learning

Manual de Exercícios

ÍNDICE
1. INTRODUÇÃO .............................................….................................... 1.1 Definições Gerais ........................................................................ 1.1.1. População 1.1.2. Variáveis ou atributos 1.1.3. Processo de amostragem 1.2 A Estatística Descritiva e a Estatística Indutiva .............…...... 2. ESTATÍSTICA DESCRITIVA .............................................…................... 2.1 Variáveis Qualitativas ................................................................. 2.2 Variáveis Quantitativas Discretas ............................................. 2.3 Variáveis Quantitativas Contínuas ............................................ 2.4 Medidas de Localização ............................................................. 2.4.1. Média 2.4.2. Mediana 2.4.3. Moda 2.5 Medidas de Ordem ...................................................................... 2.6 Medidas de Assimetria ............................................................... 2.7 Medidas de Dispersão ................................................................ 2.7.1. Dispersão Absoluta 2.7.2. Dispersão Relativa 2.8 Análise de Concentração ........................................................... 2.8.1. Curva de Lorenz 2.8.2. Índice de Gini 2.9 Estatística Descritiva Bidimensional ........................................
4 5 5 5 5 6 8 8 9 10 11 11 12 13 13 14 15 15 16 17 17 18 19

Estatística Aplicada

2

..........3 Funções de Probabilidade ................…..…....... Teste de independência do qui-quadrado 45 45 48 49 76 89 105 105 105 110 114 114 Estatística Aplicada 3 .................. 3................................8......... 3... 3...1 Noções básicas de probabilidades ................1....5 Testes de hipóteses ................ 3................6 Aplicações Estatísticas: Fiabilidade ............6....7 Aplicações Estatísticas: Controlo Estatístico de Qualidade . ESTATÍSTICA INDUTIVA ..... 3...Manual de Exercícios 3............. 3.......…....................................................... Fiabilidade de um sistema 3.............2..4 Estimação por Intervalos .....................2 Probabilidade condicionada ....................1.. 3.......... 3.... Conceito de fiabilidade 3..........................................8 Aplicações Estatísticas: Tratamento Estatístico de Inquéritos .........6.............. 3.....….......

INTRODUÇÃO Inicialmente. estabelecer o objectivo de análise e definição da população (ii) Amostragem e Recolha de Dados Fase operacional. Os dados podem ser primários (publicados pela própria pessoa ou organização) ou secundários (quando são publicados por outra organização). tratamento de inquéritos. Estatística Aplicada 4 . em traçar gráficos.Manual de Exercícios "A estatística é a técnica de torturar os números até que eles confessem". Exemplo de uma estatística: os valores da inflação entre 1980 e 1990 constituem uma estatística. É o processo de selecção e registo sistemático de dados. pesquisas de mercado. previsões. (iii) Tratamento e Apresentação dos Dados Resumo dos dados através da sua contagem e agrupamento. etc. por exemplo. Actualmente. Autor desconhecido 1. os métodos estatísticos são utilizados em muitos sectores de actividade. Fazer estatística sobre estes dados poderia consistir. A análise de um problema estatístico desenvolve-se ao longo de várias fases distintas: (i) Definição do Problema Saber exactamente aquilo que se pretende pesquisar. testes de controle de qualidade. É a classificação de dados. modelos econométricos. tendo como algumas aplicações estudos de fiabilidade. com um objectivo determinado. sondagens. a actividade estatística surgiu como um ramo da Matemática. Limitava-se ao estudo de medições e técnicas de contagem de fenómenos naturais e ao cálculo de probabilidades de acontecimentos que se podiam repetir indefinidamente. recorrendo a tabelas ou gráficos. calcular a inflação média trimestral ou prever a inflação para 1991.

Manual de Exercícios (iv) Análise e Interpretação dos Dados A última fase do trabalho estatístico é a mais importante e delicada. 1. Definições Gerais 1.1. Exemplo: um conjunto de empresas pode ser analisado em termos de sector de actividade (atributo qualitativo). População Fazer estatística pressupõe o estudo de um conjunto de objectos bem delimitado com alguma característica em comum sobre os quais observamos um certo número de atributos designados por variáveis. Variáveis ou atributos As propriedades de uma população são estudadas observando um certo número de variáveis ou atributos.2.1. Exemplo: Empresas existentes em Portugal 1.1. número de trabalhadores (atributo quantitativo discreto). As variáveis contínuas podem assumir um número finito não numerável ou um número infinito de valores.3. Está ligada essencialmente ao cálculo de medidas e coeficientes. Processo de amostragem Para conhecer de forma completa a população. Na estatística indutiva a interpretação dos dados se fundamentam na teoria da probabilidade. As variáveis podem ser de natureza qualitativa ou quantitativa.1. As variáveis quantitativas podem ainda dividir-se entre discretas e contínuas. As variáveis discretas assumem apenas um número finito numerável de valores.1. podem efectuar-se: Estatística Aplicada 5 . etc 1. rácio de autonomia financeira (atributo quantitativo contínuo). cuja finalidade principal é descrever o comportamento do fenómeno em estudo (estatística descritiva).

Claro que o processo de Estatística Aplicada 6 . tipicamente moroso e dispendioso. que é o universo. será possível proceder à análise dos dados através de várias medidas que descrevem o seu comportamento: localização. tido como representativo do universo). fica disponível um conjunto de dados sobre o universo “em bruto” ou não classificados. recorrendo a tabelas de frequências e a representações gráficas. concentração. é preciso tratar os dados. De facto. A estatística indutiva (ou inferência estatística) garante a ligação entre amostra e universo: se algo se concluiu acerca da amostra. - estudos por amostragem (observação de apenas um subconjunto. isto é. a estatística compreende dois grandes ramos: a estatística descritiva e a estatística indutiva. Assim. tornase necessário classificar os dados. As técnicas de recolha de amostras garantem a sua representatividade e aleatoriedade. simetria dos dados. até que ponto é possível afirmar algo semelhante para o universo? É nesta fase que se procuram validar as hipóteses formuladas numa fase prévia exploratória. etc. Para que seja possível retirar qualquer tipo de conclusões.2. A estatística descritiva é o ramo da estatística que se encarrega do tratamento e análise de dados amostrais. sendo esses os motivos porque os Censos são realizados apenas em cada 10 anos. depois de recolhida a amostra de acordo com técnicas que garantem a sua representatividade e aleatoriedade. 1. A Estatística Descritiva e a Estatística Indutiva Para além do ramo de amostragem. a amostra não é mais do que um passo intermédio e exequível de obter informações sobre o verdadeiro objecto de estudo. dispersão. A estatística indutiva é o ramo da estatística que se ocupa em inferir das conclusões retiradas sobre a amostra para a população. este processo é. São disso exemplo indicadores numéricos bem conhecidos como a média ou a variância.Manual de Exercícios - recenseamentos (indagação completa de todos os elementos da população). Depois de tratados. no entanto.

ao mesmo tempo. então. medidas descritivas Estatística Aplicada 7 . As inferências indutivas são assim elaboradas medindo. relacionando os seus diferentes ramos: POPULAÇÃO OU UNIVERSO Amostragem AMOSTRA Previsões Estimação Erros INFERIR DA AMOSTRA PARA O UNIVERSO Estatística Descritiva TRATAMENTO E ANÁLISE DA AMOSTRA Inferência Estatística Gráficos.Manual de Exercícios indução implica um certo grau de incerteza associado à tentativa de generalização de conclusões da “parte” (amostra) para o “todo” (universo). por exemplo. tabelas. O esquema seguinte ilustra a “roda” da disciplina de estatística. o respectivo grau de incerteza. mas apenas que o faz com forte probabilidade. um papel fundamental. na ficha das técnicas das sondagens eleitorais. não vai ser possível afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo. Daí que. O conceito de probabilidade vai ter aqui. Isto é. apareçam referências ao “nível de confiança” associado aos resultados e ao “erro” cometido.

1 Mod. além das frequências absolutas.1. O ramo da estatística que se ocupa do tratamento. ni: nº de vezes que cada modalidade da variável foi observada. Variáveis Qualitativas Os dados qualitativos são organizados na forma de uma tabela de frequências. Modalidades Mod. 2. também se apresentam as frequências relativas (fi). j Mod. que representa o número ni de elementos de cada uma das categorias ou classes e que é chamado de frequência absoluta. n Total Frequências absolutas n1 nj nn n: dimensão da amostra Frequências relativas f1 fj fn 1 fi = ni .Manual de Exercícios 2. apresentação e análise de dados amostrais denomina-se de estatística descritiva. A soma de todas as frequências é igual à dimensão da amostra (n). n Estatística Aplicada 8 . Numa tabela de frequências. obtida dividindo a frequência absoluta pelo número total de observações. ESTATÍSTICA DESCRITIVA Os resultados da observação de um atributo sobre os elementos do conjunto a analisar constituem os dados estatísticos.

A apresentação destas amostras é semelhante às variáveis qualitativas. fazendo corresponder o total da amostra (n) a 360º Geralmente. fazendo-se uma tabela de frequências e uma representação gráfica recorrendo ao diagrama de barras. Valores da variável X1 Xj Xn Total Frequências absolutas n1 nj nn n: dimensão da amostra Frequências relativas f1 fj fn 1 Também é possível calcular as frequências (absolutas – Ni . como se pode ver no exemplo: Nº defeituosos (X) 0 1 2 3 4 Total Nº embalagens (ni) 80 60 30 20 10 200 % embalagens (fi) 40% 30% 15% 10% 5% 1 Ni 80 80+60 170 190 200 Fi 40% 40%+30% 85% 95% 100% Estatística Aplicada 9 .e relativas .2. pois permitem a comparação de amostras de diferentes dimensões).Manual de Exercícios Estes dados podem também ser representados graficamente através de: Diagrama de barras Para cada modalidade. indica-se a frequência relativa respectiva. O ângulo correspondente a cada modalidade é proporcional às frequências das classes.Fi) acumuladas. Variáveis Quantitativas Discretas São variáveis que assumem um número finito ou infinito numerável de valores. 2. juntamente com a identificação da modalidade. desenha-se uma barra de altura igual à frequência absoluta ou relativa (as frequências relativas são de preferir. Diagrama sectorial ou circular Esta representação é constituída por um círculo. em que se apresentam tantas “fatias” quantas as modalidades em estudo.

Neste caso. Variáveis Quantitativas Contínuas Como foi dito anteriormente. sendo a amplitude de cada classe ai=ei-ei-1. em que a base é uma classe e a altura a frequência (relativa ou absoluta) por unidade de amplitude (ni/ai ou fi/ai). a construção da tabela compreende duas etapas: (i) Definição de classes de valores disjuntas. correspondentes a intervalos de números reais fechados à esquerda e abertos à direita.Número de classes a constituir Depende de n = dimensão da amostra Se n≥25.3. o número de classes a constituir deve ser n . 1. A área total do histograma é a soma das frequências relativas. cuja constituição obedece a certas regras (ii) Contagem das observações pertencentes a cada classe Regra de construção de classes (pressupõe a formação de classes de igual amplitude) . x4[ [xn-1. o número de classes a constituir deve ser 5 Se n<25. Um histograma é uma sucessão de rectângulos adjacentes. podem assumir qualquer valor dentro de um intervalo. então a amplitude de cada classe será: Valor máximo da variável observado – Valor mínimo da variável observado Nº de classes a constituir Classes de valores da variável [x1.Manual de Exercícios 2. x3[ [x3. isto é. isto é. x2[ [x2.Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferença entre o valor máximo e o valor mínimo observados. Estatística Aplicada 10 . xn] Total Frequências absolutas n1 nj n n: dimensão da amostra Frequências relativas f1 fj fn 1 A distribuição de frequências representa-se através de um histograma. uma variável (ou atributo) é contínua quando assume um número infinito não numerável de valores.

.e relativas . Também é possível calcular as frequências (absolutas – Ni .Manual de Exercícios 1. Medidas de localização 2. Esta distribuição permite visualizar o tipo de distribuição e deve salientar alguns aspectos mais relevantes desta (moda. agrupados numa tabela de frequências) Variáveis discretas x = 1 n n i =1 ni x i = n i =1 f i xi Média ponderada dos valores de X Dados classificados (isto é.. agrupados numa tabela de frequências) Variáveis contínuas x = 1 n n i =1 n i =1 ni ci = f i ci Média ponderada dos pontos médios das classes Estatística Aplicada 11 .Fi) acumuladas. É preferível representar o histograma com fi/hi do que com ni/hi uma vez que deste modo é possível comparar distribuições com diferente número de observações amostrais.4.4.). classe modal. Dados não-classificados (não agrupados numa tabela de frequências) x = 1 n n i =1 xi Média aritmética simples Dados classificados (isto é. Média ( X ) É a medida de localização mais usada. sobretudo pela sua facilidade de cálculo. para que todos os rectângulos (colunas) sejam comparáveis é necessário corrigir as frequências das classes (calculando as frequências que se teria se a amplitude de todas as classes fosse igual e igual a 1) 2. . 2. Como as classes podem ter amplitudes diferentes.1.

. sup . inf . Dados não-classificados Se tivermos n valores x1. é preferível recorrer à informação complementar fornecida por outras medidas de localização. Estatística Aplicada 12 . Desta forma. indica o valor central da distribuição.5. Me = x n+1 2 Se n fôr par..4.Manual de Exercícios onde ci é o ponto médio de cada classe ( lim . a média tem o grande inconveniente de ser sensível a valores muito extremados ou aberrantes da distribuição (outliers). + lim . mas a partir da posição dessas observações.. então fala-se em intervalo mediano. x2. entendido como o valor em torno do qual se distribuem os valores observados. como a moda e a mediana. Nestes casos. geralmente. 2. Em casos desses. Mediana (Me) A mediana não se calcula a partir do valor de todas as observações. que se definem a seguir. xn + xn Me = 2 2 +1 2 Dados classificados A mediana é o valor tal que Fi = 0.2. xn Se n fôr ímpar. ) 2 A média é uma medida de localização que. a média deixa de ser um valor que aparece na parte central da distribuição para ser “empurrada” para os extremos. a média é muitas vezes utilizada como valor representativo da amostra.5 Variáveis discretas Se existe um valor de xi para o qual Fi = 0. No entanto.

determina-se o valor para o qual Fi = 0. A mediana é uma caso particular dos quartis (coincide com Q2) Variável discreta O quantil de ordem p é o primeiro valor de x para o qual i>p. é o valor mais frequente da distribuição.0. classe mediana FL sup − FL inf 2.5... 2. 0. De uma forma geral: Me = L inf + 0.99. isto é...5. 0. então a mediana é o primeiro valor para o qual Fi > 0.4.9.. atendendo a que as frequências acumuladas variam uniformemente dentro de cada classe. Se p=0. Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p.75. chama-se ao quantil QUARTIL (Q1.. Q2 e Q3).3. Medidas de ordem Tal como se definiu para a mediana.25.. 0. Moda (Mo) Variáveis discretas A moda é valor de X para o qual fi é máximo.1.2. Estatística Aplicada 13 .5 através de uma regra de três simples.0. chama-se ao quantil decil Se p=0.02.Manual de Exercícios Se não existe nenhum valor de xi para o qual Fi = 0. é a classe a que corresponde maior frequência por unidade de amplitude. 0. chama-se ao quantil percentil Se p=0.5 − FL inf xamp..5. é possível definir outros valores de posição ou valores separadores da distribuição em partes iguais.5. isto é. Variáveis contínuas Em geral.01. Variáveis contínuas A classe modal é a classe de valores de X para o qual fi/hi é máximo.

6. se: − − − X = Me = Mo. a distribuição diz-se assimétrica positiva (ou enviesada à esquerda) X < Me < Mo... A partir deste diagrama.. classe Q3 FL sup − FL inf A representação gráfica destas medidas designa-se de diagrama de extremos e quartis e serve para realçar algumas características da amostra. mediana e moda... Os valores da amostra compreendidos entre os 1º e 3º quartis são representados por um rectângulo (caixa) com a mediana indicada por uma barra.Manual de Exercícios Variável contínua Calcula-se por uma regra de três simples. classe Q1 FL sup − FL inf 0. como a mediana.75 − FL inf xamp.. a distribuição diz-se simétrica X > Me > Mo.. Seguidamente. Se g’ > 0 ... De uma forma geral: Q1 = L inf + Q3 = L inf + 25% maiores 0. Concretamente....a distribuição é assimétrica positiva ou “puxada” para Estatística Aplicada 14 .......a distribuição é simétrica positiva ou equilibrada Os quartis estão à mesma distância da mediana.... consideram-se duas linhas que unem os meios dos lados do rectângulo com os extremos da amostra. Medidas de assimetria A assimetria é tanto maior quanto mais afastados estiverem os valores da média. a distribuição diz-se assimétrica negativa (ou enviesada à direita) Coeficiente de assimetria de Bowley (g’): (Q3 − Q 2) − (Q 2 − Q1) Q3 − Q1 Se g’ = 0 ...25 − FL inf xamp.. pode reconhecer-se a simetria ou enviesamento dos dados e a sua maior ou menor concentração: 2...

... (ii) Em relação à média Variância amostral: mede os desvios quadráticos de cada valor observado em relação à média. assimetria é máxima) A mediana desliza para o lado do Q3. moda)...a distribuição é assimétrica negativa ou “puxada” para a direita (se fôr = -1. logo Q2-Q1 > Q3-Q2 Q1 Q2 Q3 Assimétrica positiva Q2 Q3 Q1 Assimétrica negativa 2. e havendo muita dispersão se os desvios forem globalmente grandes.. Medidas de dispersão Duas distribuições podem distinguir-se na medida em que os valores da variável se dispersam relativamente ao ponto de localização (média. logo Q3-Q2 > Q2-Q1 Se g’ < 0 . Estatística Aplicada 15 ...7.. maior (menor) a dispersão em torno da mediana.7..Manual de Exercícios a esquerda (se fôr = 1.1 Medidas de dispersão absoluta (i) Em relação à mediana Amplitude inter-quartis = Q = Q3 – Q1 Significa que 50% das observações se situam num intervalo de amplitude Q.. assimetria é máxima) A mediana desliza para o lado do Q1. havendo pouca dispersão se os desvios forem globalmente pequenos. classificadas consoante a medida de localização usada para referenciar a dispersão das observações: 2. Apresentam-se de seguida algumas das mais utilizadas. Quanto maior (menor) a amplitude do intervalo... mediana.

Está expressa nas mesmas unidades da variável.2 Medidas de dispersão relativa Muitas vezes. por exemplo. Assim. avaliar a dispersão através de um indicador de dispersão absoluta não é conveniente. através da raiz quadrada da variância. Desvio-padrão: Medida de dispersão com significado real. uma vez que estas medidas vêm expressas na mesma unidade da variável – como é o caso. 2. mas que só é possível calcular indirectamente. o que não significa que a distribuição seja muito dispersa. é de esperar que os valores da variância sejam mais elevados quando os valores da variável são maiores. assim como comparara a dispersão de duas distribuições. Para comparar diferentes distribuições de frequência são precisas medidas de dispersão relativa: Dispersão absoluta Medida de localizaçã o em relação à qual está definida Dispersão relativa = Estatística Aplicada 16 .Manual de Exercícios Dados não-classificados 2 1 n s2 = xi − x n i =1 ( ) Dados classificados Variáveis discretas 1 s = n 2 n i =1 ni xi − x = ( ) 2 n i =1 fi xi − x ( ) 2 Dados classificados Variáveis contínuas 1 s = n 2 n i =1 ni ci − x ( ) 2 = n i =1 fi ci − x ( ) 2 onde ci é o ponto médio de cada classe i.7. da variância.

número de empresas) se distribui (se de forma mais ou menos uniforme) pelos diferentes indivíduos da amostra (que devem ser susceptíveis de serem adicionados. isto é. pois não são sensíveis à escala (eventualmente diferente) em que as variáveis estejam expressas. e vice-versa de o atributo estiver concentrado num só indivíduo. etc). que apenas medem a dispersão dos valores em relação a um ponto.1 Curva de Lorenz Estatística Aplicada 17 . Se o atributo estiver igualmente repartido pelos indivíduos. O fenómeno de concentração está relacionado com a variabilidade ou dispersão dos valores observados. e permitem comparar dispersões entre duas amostras. temos uma situação extrema de máxima concentração. interessa medir o grau de concentração em situações intermédias. peso. salários. apesar de não poder ser analisado através das medidas de dispersão atrás descritas. 2. O objectivo é determinar como o atributo (rendimento.8. como a repartição do rendimento ou a distribuição de salários. Para analisar a concentração. existem dois instrumentos: a Curva de Lorenz e o Índice de Gini. altura.Manual de Exercícios Coeficiente de variação CV = s x100% x Outras medidas Q3 − Q1 Q2 Estas medidas não estão expressas em nenhuma unidade. 2. Análise da concentração A noção de concentração apareceu associada ao estudo de desigualdades económicas. a análise de concentração não se aplica a idade.8. Em geral. temos uma situação extrema de igual distribuição.

1) por (0. isto é. por isso. A zona entre a diagonal e acurva de Lorenz designa-se. a frequência das observações deve ter uma evolução igual à proporção do atributo correspondente. O valor de G varia entre 0 e 1.1).relativa Proporção atributo acumuladas atrib.qi) pertencem ao quadrado (0. Estatística Aplicada 18 . a concentração é nula. a curva de Lorenz coincide com a diagonal do quadrado. de zona de concentração. Se houver igual distribuição. que é designada de recta de igual repartição. Caso o valor de G seja 1. havendo igual repartição. x4[ [xn-1.8. A curva que os une é a curva de Lorenz. 2.Manual de Exercícios O objectivo é comparar a evolução das frequências acumuladas (Fi = pi) com a evolução da soma dos valores da variável (qi) Quadro de dados Classes de valores da variável [x1.acumul. Quanto mais a curva se afastar da recta. maior a concentração.2 Índice de Gini O índice de Gini é calculado pela seguinte expressão n −1 ( pi − qi ) n −1 i =1 G= i =1 pi Quando G = 0. maior é a concentração. Nesse caso. a concentração será máxima. pi=qi. e quanto maior o seu valor. xn[ Total ni n1 nj nn n Quantidade Freq. x3[ [x3. x2[ [x2. yi p1 q1 yj yn pj pn=1 qj qn=1 Os pontos (pi.

mas sim de estudar a forma como a variação de uma variável poderá afectar a variação da outra. que permite descrever como se reflectem em y (variável dependente ou explicada) as modificações processadas em x (variável independente ou explicativa). como é o caso do exemplo atrás descrito. nem que tendencialmente A existir. Duas variáveis ligadas por uma relação estatística dizem-se correlacionadas. a medida em que o valor de uma variável é determinado exactamente pela outra). Estatística Descritiva Bidimensional Numa situação em que se observam pares de valores (xi. a correlação dizse negativa. conhecendo o respectivo peso. se é traduzível por alguma lei matemática. Um dos métodos mais conhecidos de ajustar uma recta a um conjunto de dados é o Método dos Mínimos Quadrados. em média ou tendencialmente. a representação gráfica do conjunto de dados bivariados sugere o ajustamento de uma recta a este conjunto de pontos. indicando a existência de uma tendencial correlação linear entre as duas variáveis. Se ocorrem em sentidos opostos. que consiste em determinar a recta que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. Se as variações ocorrem.9. em média. por exemplo. yj). pode ter interesse estudar as relações porventura existentes entre os dois fenómenos. se é possível medi-la Por vezes. inferir (em média) a altura de um indivíduo. Essa recta torna possível. no mesmo sentido. nomeadamente relações estatísticas. Não se trata de estudar relações funcionais (isto é.Manual de Exercícios 2. A essa recta chama-se recta de regressão de y sobre x. (por exemplo. a correlação diz-se positiva. mas a relação não é determinística). Trata-se então de estudar se: - Se existe alguma correlação entre os fenómenos ou variáveis observadas A existir. o peso e a altura normalmente estão relacionados. Obtém-se assim a Estatística Aplicada 19 .

obtém-se: b= xi y i − n x y xi − n x 2 2 e a = y − bx Matematicamente. Assim. Quando. o valor que y assume quando x=0. pode-se medir a maior ou menor força com que as variáveis se associam através do coeficiente de correlação linear r: r= s xy s xx s yy . quer através do diagrama de dispersão. então pode dizer-se que existe uma correlação positiva entre as variáveis. se a recta de regressão obedecer à seguinte fórmula geral: y = a + bx o método permite minimizar a soma dos desvios quadráticos yi . O valor de a designa a ordenada na origem. O coeficiente de correlação linear está sempre compreendido entre –1 e 1. b corresponde ao coeficiente de regressão de y sobre x. as variáveis variam no mesmo sentido: um aumento (diminuição de x) provoca um aumento (diminuição) de y. quer através da recta de regressão.Manual de Exercícios recta de regressão ou recta dos mínimos quadrados. s xy = n i =1 ( xi − x)( y i − y ) Este indicador da correlação tem a vantagem de não depender das unidades ou da ordem de grandeza em que as variáveis estão expressas. isto é. mas menos que proporcional. Em termos estatísticos. que indica a variação média de y que acompanha uma variação unitária de x. isto é.(a + bxi). Se r > 0. Estatística Aplicada 20 . b designa o declive da recta. Assim sendo. se verifica a existência de uma associação linear entre as variáveis.

a correlação é máxima. deve-se procurar justificação teórica para a existência ou inexistência de correlação. isto é. poderá acontecer que variáveis sem relação de causalidade entre si. as variáveis variam em sentidos opostos: um aumento (diminuição de x) provoca uma diminuição (aumento) de y. em vez do coeficiente de correlação linear. Isto é. então pode dizer-se que as variáveis não estão correlacionadas linearmente. isto é. entre as variáveis. Caso contrário. chama-se correlação espúria. Nos extremos. Se r = 0.Manual de Exercícios Se r < 0. mas menos que proporcional. d i = Ri − Ri x y Ordens (“ranks”) das observações de X e de Y. Neste caso. uma variação numa variável provoca na outra uma variação exactamente proporcional no mesmo sentido ou em sentido contrário. então pode dizer-se que existe uma correlação positiva ou negativa perfeita. então pode dizer-se que existe uma correlação negativa entre as variáveis. A esta correlação ilusória. se r = 1 ou se r = -1. variem num certo sentido por razões exteriores. Antes de se efectuar um estudo de correlação. respectivamente Estatística Aplicada 21 . respectivamente. interessa mais conhecer a ordenação dos valores do que os valores observados propriamente ditos. isto é. as variáveis vêm expressas numa escala ordinal. Correlação ordinal Por vezes. calcula-se o coeficiente de correlação ordinal: n rs = 1 − 6 i =1 di 2 2 n(n − 1) .

Determine a mediana da distribuição. 50[ Total Frequência.08 0.m. e) Analise a (as)simetria da distribuição em causa. Relativa (%) 10 25 35 15 10 5 100 a) Represente a distribuição graficamente.02 0 0 10 20 30 40 50 60 Estatística Aplicada 22 . Resolução a) fi/hi 0. Qual o significado dos valores encontrados? c) Calcule as frequências acumuladas e represente-as graficamente.16 0. f) Analise a concentração através do Índice de Gini e da Curva de Lorenz.2 0.14 0. 5[ [5. b) Determine a média e a moda da distribuição.12 0. d) Determine os quartis da distribuição. 15[ [15.18 0.): Resultado Líquido [0. 3[ [3.04 0.06 0.Manual de Exercícios ESTATÍSTICA DESCRITIVA Exercícios resolvidos Exercício 1 Considere a distribuição de 1000 empresas de um sector de actividade segundo os resultados líquidos (em milhares de u. 1[ [1. Faça a sua representação gráfica. 25[ [25.1 0.

. c) A representação gráfica das frequências acumuladas (ver tabela) designa-se de polígono integral: Fi 1 0. 5[ 3 : Fi=0. o maior valor de fi / hi é 0.175 0.5 x5%) = 7. o resultado líquido de uma empresa é de 7325 unidades monetárias. 3[ [3.175.6 0. 5[ [5. os valores de resultado líquido mais prováveis para uma empresa situam-se entre 3000 u. e 5000 u. 5[.m. isto é. + (37..4 0. 1[ [1.8 0.5 b) x = 1 n i =1 n ni c i = n i =1 f i ci = (0. correspondente à classe [3.35 5 : Fi = 0.015 0.01 0.1 0.5): [3.7 Estatística Aplicada 23 .5 2 4 10 20 37. Neste caso.002 Fi 10% 35% 70% 85% 95% 100% ci 0.m. 25[ [25. A classe modal é aquela a que corresponde maior frequência por unidade de amplitude.325 Em média.125 0.2 0 0 20 40 60 80 100 120 Classe mediana (classe a que corresponde uma frequência acumulada 0.Manual de Exercícios [0.5 x10%) + (2 x 25%) + . 50] Total X fi 10% 25% 35% 15% 10% 5% 1 hi 1 2 2 10 10 25 fi/hi 0. 15[ [15.

857 50% das empresas apresentam resultados líquidos inferiores a 3857 u.1 -------------.4596 > 0 Q3 − Q1 8.333 − 2.35 -------------.15)/0.2 A distribuição é assimétrica positiva ou enviesada à esquerda.7 .857 − 2.7 -------------.85 Cálculo do Q3: 0.85 .3 .75): [5.35 -----------. d) Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 0. e) g' = (Q3 − Q 2) − (Q 2 − Q1) (8.857) − (3.Q3 – 5 Q3 = 5 + ((10x0.15 .m.25): [1.5 0.7 15 : Fi = 0.0.Q1 – 1 Q1 = 1 + ((2x0.35 Cálculo do Q1: 0.Me – 3 Me = 3 + ((2x0. Classe a que pertence Q3 (classe a que corresponde uma frequência acumulada 0.5 – 0.25 – 0.3 0.2) = = 0. 3[ 1 : Fi=0.15)/0.1 0.0.75 – 0. Estatística Aplicada 24 .Manual de Exercícios Cálculo da mediana: 0.1 3 : Fi = 0.m.1 -----------.0.m.333 − 3.333(3) 75% das empresas apresentam resultados líquidos inferiores a 8333 u.05)/0.2 25% das empresas apresentam resultados líquidos inferiores a 2200 u.15) = 8. 15[ 5 : Fi=0.5 .35) = 3.35 .25) = 2.7 -----------.

expressas numa determinada unidade monetária.007 0.m.5 corresponde ao centro da escala possível.5 Atributo 100x0. 0 0 0..1 − 0.1 + 0. 15[ [15. Por exemplo.6 0. + (0.5 2 4 10 20 37.2 0. mas isso representava apenas 26.. mas em que cada uma tem baixo resultado líquido.Totais G= (0.5=50 250x2=500 1400 1500 2000 1875 7325 pi (=Fi) 0.Manual de Exercícios f) X [0.075 0.85 + 0.95 1 qi 0.6 0. 3[ [3. 1[ [1.8 1 Exercício 2 Considere a seguinte amostra de dimensão 200. 25[ [25.85 0.. 50[ Total fi 10% 25% 35% 15% 10% 5% 1 ni 1000x10%=100 250 350 150 100 50 n=1000 ci 0. 5[ [5.7 0. o que sugere um tecido empresarial com muitas PMEs.7 + 0. 70% das empresas apresentavam resultados até 5000 u. entre 0 e 1).6% do total de resultados das empresas da 0.1 0.744 1 50 + 500 + 1400 7325 Res. Analise a concentração através do Índice de Gini e da Curva de Lorenz.744) = 0.471 0.007) + .95 − 0.95 Curva de Lorenz 1 A distribuição dos resultados líquidos apresenta concentração média (G=0.2 0.4 0.8 0.266 0.Liq.4 amostra. referente aos lucros obtidos por empresas de um dado sector industrial.35 + 0.35 0.47 0. Estatística Aplicada 25 .

encontrandose os valores razoavelmente repartidos. pelo Método dos Mínimos Quadrados.25 Tanto pela análise da Curva de Lorenz.8 0. 300[ [300. uma função linear que exprima as peso em função da altura.6 0.2 0 0 0.546(6) = 0.4 0.02 0. c) Ajuste.2 0. 100[ [100. 200[ [200. como pelo valor do Índice de Gini. Estatística Aplicada 26 .4 0.95 1 qi 0. conclui-se que esta amostra apresenta concentração moderada.16(6) 0.8 1 n −1 ( pi − qi ) n −1 i =1 G= i =1 = pi 0.883(3) 1 Curva de Lorenz 1 0.63(3) 0. 50[ [50.Manual de Exercícios Resolução Lucros [0.6 0. a) Represente o diagrama de dispersão.243 2. 500] Total ni 20 60 80 30 10 200 Lucro total 600 4400 14000 7500 3500 30000 pi (=Fi) 0. b) Analise a correlação existente entre peso e altura.1 0.8 0. Exercício 3 Considere o exemplo abaixo referente ao peso e altura de 10 indivíduos.4 0.

isto é. r = 0.90681871.36 170 160 150 50 60 70 Peso (kg) 80 90 Estatística Aplicada 27 .9016x + 109. quase perfeita. c) 190 Recta de Regressão 180 Altura (cm) y = 0. existe uma correlação positiva forte entre as duas variáveis.Manual de Exercícios Indivíduo A B C D E F G H I J Resolução Peso (kg) 72 65 80 57 60 77 83 79 67 68 Altura (cm) 175 170 185 154 165 175 182 178 175 173 Diagrama de Dispersão 190 a) 180 Altura (cm) 170 160 150 50 60 70 Peso (kg) 80 90 b) No exemplo.

714 A dispersão das despesas em publicidade é superior à dispersão das vendas.0651 = 0. se um indivíduo pesar 70 kg. é necessário calcular os coeficientes de variação (medidas de dispersão relativa): Dados não-classificados x = sx 2 1 n n i =1 n i =1 xi = 21.m. Exercício 4 O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas em milhares de u.39 x 21. uma função linear que exprima as vendas em função das despesas em publicidade.714 2 1 = n (xi − x ) = 69.36 + 0. Estatística Aplicada 28 .495 6.429 < CV y = sy y = 11.472. c) Ajuste. espera-se que a altura do indivíduo aumente 0.) de uma empresa no período de 7 anos: Ano 1 2 3 4 5 6 7 Vendas 10 13 18 19 25 30 35 Desp. pelo Método dos Mínimos Quadrados. b) Analise a correlação existente entre volume e custo de produção.9408 = = 0.0651 CV x = sx 69.36 + 0.9016 x 70 = 172.429 2 y = sy 2 1 n n i =1 n i =1 yi = 6.Manual de Exercícios A equação desta recta traduz-se em Altura = 109. Resolução a) Para comparar a dispersão das duas distribuições.9016 cm. Publicidade 3 3 5 6 8 9 13 a) Compare as vendas e as despesas em publicidade quanto à dispersão. a altura esperada será de 109.9016 x Peso Isto é.9408 1 = n (yi − y ) = 11. Por cada kg de peso adicional.

quando as despesas em publicidade aumentam (diminuem). + (35 − 21. encontram-se as ordenações desses 10 estudantes segundo as classificações obtidas em cada uma das provas: Aluno A B C D E F G H I J Estatística Aplicada Prova inicial Rix 1 3 2 5 7 8 9 10 6 4 Prova final Riy 1 2 3 4 6 8 7 9 10 5 di Rix .98 69. Public. Recta de Regressão c) 30 y = 2. Em média.0651 Existe uma correlação positiva linear forte entre as duas variáveis.. as vendas aumentam (diminuem) de forma quase exactamente proporcional. No quadro abaixo. 13 Exercício 5 Considere que 10 estudantes foram sujeitos a uma prova de avaliação no início e no final do curso.714) + .429)(13 − 6.429)(3 − 6.714)] 7 = = 0.8782 Vendas 20 10 0 3 8 Desp.9408 x 11.4649x + 4..Manual de Exercícios b) r= s xy s xx s yy 1 [(10 − 21.Riy 0 1 -1 1 1 0 2 1 -4 -1 29 .

Exercício 6 O quadro que se segue descreve a distribuição do rendimento anual (em milhares de u. para avaliar a correlação existente entre as 2 provas calcula-se o coeficiente de correlação ordinal: n rs = 1 − 6 i =1 di 2 2 n(n − 1) = 1− 6 x(0 + 1 + 1 + 1 + 1 + 0 + 4 + 1 + 16 + 1) = 0. isto é.m. 25[ [25.8424 10 x(100 − 1) A correlação é positiva e elevada (rs varia entre –1 e 1). 2[ [2. 1[ [1.) de 2500 famílias da população de um país: Rendimento anual [0. 5[ [5. b) Determine o rendimento médio e mediano. 1[ [1. 15[ [15. Que indicações lhe dão sobre a (as)simetria? d) O que pode concluir quanto à dispersão? e) Calcule o índice de Gini.5 30 Estatística Aplicada . os alunos que tiveram boa nota na prova inicial tiveram.5 3. 5[ [5. mas sim das ordenações das classificações (do 1º ao 10º classificado).5 1. 50[ Nº de famílias 250 375 625 750 375 125 a) Represente as frequências acumuladas graficamente.5 10 20 37.Manual de Exercícios Resolução Como não dispomos das classificações dos alunos. 15[ [15. 25[ [25. igualmente boa nota na prova final. 50[ Nº de famílias 250 375 625 750 375 125 % de famílias 10 15 25 30 15 5 Fi (%) 10 25 50 80 95 1 ci 0. c) Determine os três primeiros quartis. O que conclui sobre a concentração do rendimento? Resolução a) Rendimento anual [0. 2[ [2. em média.

5 -------------.5 x15%) + . 15[ 5 : Fi=0. 2[ 3 : Fi = 0.25 25% das famílias apresentam rendimentos anuais inferiores a 2000 u.8 .3) = 13.2 0 0 10 n i =1 20 n i =1 30 40 50 60 70 80 90 100 b) x = 1 n ni c i = f i ci = (0.5 x5%) = 9. Classe a que pertence Q3 (classe a que corresponde uma frequência acumulada 0.333(3) 75% das famílias apresentam rendimentos anuais inferiores a 13333 u. a mediana é 5 (50% das famílias têm rendimentos anuais até 5000 unidades monetárias).0. Estatística Aplicada 31 .Q3 – 5 Q3 = 5 + ((10x0. o rendimento anual de uma família é de 9025 unidades monetárias.75 – 0.15 . c) Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 0. 5[ 5 : Fi = 0. + (37.5): [2.25): [1.6 0.5.8 Cálculo do Q3: 0.25)/0.025 Em média. Classe mediana (classe a que corresponde uma frequência acumulada 0.Manual de Exercícios 1 0.5 -----------.8 0.4 0.5 0.m..5 x10%) + (1.m. Logo.75): [5..5 15 : Fi = 0.

300[ [300.Manual de Exercícios g' = (Q3 − Q 2) − (Q 2 − Q1) (13.5 pi (=Fi) 0. 160[ [160.7922 1 ( pi − qi ) n −1 i =1 G= i =1 = pi 1. 1[ [1.5 0. 100[ [100.5 22562. 120[ [120. Relativa (%) 7.4 2.6 3.4555 2.2 8.95 1 qi 0. 2[ [2.0 100 Estatística Aplicada 32 . 25[ [25.5 3.47 > 0 Q3 − Q1 13.8 0.18436 = 0.2 31.8 15.6 Concentração moderada do rendimento Exercício 7 Considere a seguinte tabela que representa a distribuição dos empregados de uma instituição bancária segundo a remuneração bruta mensal (em milhares de unidades monetárias): Remuneração [60. 140[ [140.286875 = 9.5 7. 15[ [15.5 2187.1274 0.333 − 5) − (5 − 2) = = 0. 200[ [200. 350] Total Frequência.46 0.286875 2 s x = s x = 82.5 7500 7500 4687.1 5. 250[ [250.1 0.333 − 2 A distribuição é assimétrica positiva ou enviesada à esquerda.25 0.2 19. 80[ [80. 50[ Total n −1 ni 250 375 625 750 375 125 2500 ci 0. 5[ [5.071 e) Rendimento anual [0. d) s x = 2 n i =1 2 fi * ci − x ( ) 2 = n i =1 fici 2 − x = 82.5 1.00554 0. total 125 562.5 10 20 37.0305 0.5 Rend.

Resolução a) Remuneração [60.23 -------------.27)/0.0 100 Fi (%) 7.100 Q1 = 100 + ((20x0.28 milhares u.5 .120 .25): [100.0.2 8.2 19. Classe a que pertence Q2 (classe a que corresponde uma frequência acumulada 0. c) Analise a assimetria da distribuição em causa.120 .5 7.542 Cálculo do Q2: 0.Q2 . 200[ [200.23 -------------. 160[ [160.7 80.2 31.100 0.02)/0.5): [100.8 23 54. 100[ [100.542 .23 -----------.100 0.28 25% dos empregados auferem remunerações inferiores a 101. 350] Total Frequência.Q1 .0. 80[ [80.4 2. 140[ [140.23 3 : Fi = 0. 120[ [120.2 73. 250[ [250.3 50% dos empregados auferem remunerações inferiores a 117. 120[ 1 : Fi=0.6 3.m. Relativa (%) 7.8 15.312) = 117.4 97 100 Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 0.100 Q2 = 100 + ((20x0.3 milhares u. 120[ 100 : Fi=0.0.0.542 .23 120 : Fi = 0.1 5.25 .m.23 -----------. 300[ [300.542 Cálculo do Q1: 0. b) Analise a dispersão da distribuição em causa.312) = 101.9 89 94. Estatística Aplicada 33 .Manual de Exercícios a) Calcule os quartis da distribuição.

737 -----------. saíram de uma linha de enchimento automático: Peso (em gramas) [297.28 c) g ' = A distribuição é assimétrica positiva ou enviesada à esquerda. 300[ [300.737 -------------.61(1) 75% dos empregados auferem remunerações inferiores a 143.140 Q3 = 140 + ((20x0. 303[ [303. do conteúdo de uma série de 100 garrafas que.61(1) milhares u. Exercício 8 Os dados seguintes referem-se ao peso. expresso em gramas. 306] Total Frequência. 160[ 120 : Fi=0.072) = 143.Q1 = 143.809 Cálculo do Q3: 0.28 = 42.m. 299[ [299. 304[ [304.140 0.3 − 101.243 > 0 Q3 − Q1 143.0.75 – 0.101.3) − (117.737 140 : Fi = 0. Estatística Aplicada 34 .160 .33 (dispersão reduzida em torno da mediana) (Q3 − Q 2) − (Q 2 − Q1) (143.28) = = 0.809 .61 − 117.013)/0. b) Amplitude do intervalo inter-quartis = Q3 . 298[ [298. Relativa (%) 8 21 28 15 11 10 5 1 1 100 a) Represente graficamente os dados acima. 305[ [305.61(1) . 301[ [301.61 − 101. 302[ [302.Manual de Exercícios Classe a que pertence Q3 (classe a que corresponde uma frequência acumulada 0. no decurso de um teste. b) Calcule as frequências acumuladas e represente-as graficamente.Q3 .75): [140.

. + (305.05 Histograma 0 296 297 298 299 300 301 302 303 304 305 306 307 b) Peso (em gramas) [297. Resolução a) 0. 300[ [300.11 kg.3 0.5 x 21%) + ..8 0.2 0. e) Analise a dispersão do peso das garrafas. 305[ [305. 306] Total F* 1 0.5 x8%) + (298.11 O peso médio das garrafas é de 300. Estatística Aplicada 35 . 299[ [299.4 0.15 0.6 0. 301[ [301. 304[ [304. 303[ [303. 298[ [298.2 0 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310 Frequência Relativa (%) 8 21 28 15 11 10 5 1 1 100 Fi (%) 8 29 57 72 83 93 98 99 100 c) x = 1 n n i =1 ni c i = n i =1 f i ci = (297. 302[ [302. mediano e modal.5 x1%) = 300.Manual de Exercícios c) Determine o peso médio.1 0.25 0. Qual o seu significado? d) Determine os quartis da distribuição.

21)/0.Manual de Exercícios Classe mediana (classe a que corresponde uma frequência acumulada 0. d) Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 0.Q1 .299 Q1 = 299 + ((1x0.75 50% das garrafas têm peso inferior a 299.21) = 299. os pesos mais prováveis das garrafas situam-se entre 299 kg e 300 kg.299 0.0.72 302 : Fi = 0.75 kg.27(27) 75% das garrafas têm peso inferior a 301. Estatística Aplicada 36 .57 . 299[ 298 : Fi=0.299 Q2 = 299 + ((1x0.Q2 .83 Cálculo do Q3: 0.29 300 : Fi = 0.03)/0.0357 kg.25 .0. o maior valor de fi é 0.299 0. 300[.17)/0.08 -----------.29 -----------. Neste caso.72 -----------.0.57 Cálculo do Q2: 0.83 .Q3 .25): [298.29 -------------.0.29 .11) = 301.27(27) kg.75 – 0.301 Q3 = 301 + ((1x0.28) = 299.72 -------------. Classe a que pertence Q3 (classe a que corresponde uma frequência acumulada 0. 300[ 299 : Fi = 0. A classe modal é aquela a que corresponde maior frequência relativa.5): [299.0357 25% das garrafas têm peso inferior a 299. 302[ 301 : Fi=0.08 -----------.302 .29 Cálculo do Q1: 0. isto é.300 .5 .08 299 : Fi = 0.0.301 0.75): [301.298 .28 correspondente à classe [299.

05 0. 1.25 0.05 0.2 0.6.8.05 0. 1.75.5[ [1.87 0.45 1. 1.9] Total fi/hi ni 2 10 25 13 17 20 10 3 100 fi 0. 1.65. d) Determine os quartis da distribuição e diga qual o seu significado. 1.575 1.5. 1.65[ [1. mediram-se as alturas de 100 alunos do primeiro ano: Altura (em metros) [1.5.65[ [1.8[ [1.02 0.9] Total Nº Alunos 2 10 25 13 17 20 10 3 100 a) Represente graficamente os dados acima.1 fi/hi 0.55[ [1. 1. 1.237 (dispersão reduzida em torno da mediana) Exercício 8 Numa faculdade.2 2 5 2.85 hi 0. b) Determine a altura média e a altura modal. Qual o seu significado? c) Calcule as frequências acumuladas e represente-as graficamente. 1. 1.8.8 1.Q1 = 301.1 0.0357 = 2.12 0.625 1.299.9 Estatística Aplicada 37 .13 0.1 0.7 1. 1.4.5 0.725 1.3 Fi 0.1 0.6[ [1.7.6.27(27) .55.525 1.02 0.6[ [1. e) Analise a dispersão da distribuição. 1.05 0. 1.55[ [1.8[ [1.75.17 0.4 4 2 0.4.Manual de Exercícios e) Amplitude do intervalo inter-quartis = Q3 .4 1.5[ [1. 1.75[ [1. 1.6 3.7[ [1.7.05 0. 1.7[ [1.55.05 0. f) Analise a (as)simetria da distribuição.03 1 ci 1. Resolução a) Altura (em metros) [1.675 1.6 1.75[ [1.65.5 1.37 0.97 1 6 5 4 3 2 1 0 Histograma 1.775 1.67 0.

37 – 0.25 – 0.5 1.65[ 1.75[ 1.6[ 1.6 – 1.7 1.1. Neste caso. Classe a que pertence Q2 (classe a que corresponde uma frequência acumulada 0.525x10%) + .8 0.65 m.55.45x 2%) + (1. 1.6 0. c) F* 1 0.576 25% dos alunos têm altura inferior a 1.Manual de Exercícios b) x = 1 n n i =1 ni c i = n i =1 f i ci = (1.25): [1.75 : Fi = 0.55 Q1 = 1.12 -----------.4 0. + (1.67 1.6.6 : Fi = 0. A classe modal é aquela a que corresponde maior frequência por unidade de amplitude.37 Cálculo do Q1: 0.6 1.12 1.3 1.55m / 1. 1.87 Estatística Aplicada 38 .65 m.75): [1.55 0.85x3%) = 1.65 A altura média dos alunos é de 1.25) = 1..Q1 – 1.55 + ((0. Classe a que pertence Q3 (classe a que corresponde uma frequência acumulada 0.7.6m. isto é.65 : Fi = 0.5 50% dos alunos têm altura inferior a 1.5): [1.12 -----------.8 1.6[.4 1. a altura mais provável de um aluno rondará 1..576 m. 1.7 : Fi=0. correspondente à classe [1.55 : Fi=0.55.13)/0. 1.9 2 d) Classe a que pertence Q1 (classe a que corresponde uma frequência acumulada 0.2 0 1. o maior valor de fi / hi é 5.05x0.

576 = 0.75 – 0.Q3 – 1.72 − 1. registou-se a duração das chamadas realizadas em Dezembro de 2001: Duração (em minutos) [0. 30[ [30.72 − 1.08)/0.07327 (dispersão reduzida em torno da média) (Q3 − Q 2) − (Q 2 − Q1) (1.1.72 75% dos alunos têm altura inferior a 1. 10[ [10. Exercício 9 Em determinada central telefónica.Manual de Exercícios Cálculo do Q3: 0.65) − (1.144 (dispersão reduzida em torno da mediana) sx = 2 n i =1 fi * ci − x 2 ( ) 2 = n i =1 fici 2 − x = 0. 50] Total Nº Chamadas 2000 1500 1000 300 200 5000 a) Represente graficamente as frequências simples e acumuladas.75 – 1.67-----------.027(7) < 0 = Q3 − Q1 1.7 + ((0.67-------------.05*0.576) = −0.65 − 1.576 f) g ' = A distribuição é ligeiramente assimétrica negativa ou enviesada à direita (quase simétrica). 20[ [20.Q1 = 1.7 Q3 = 1. c) Qual a duração da chamada mediana? Qual o significado do valor encontrado? Estatística Aplicada 39 .87.00536875 2 s x = s x = 0. e) Amplitude do intervalo inter-quartis = Q3 . b) Determine a duração média das chamadas e respectivo desvio-padrão. 5[ [5.00536875 = 0.72 – 1.0.7 0.72 m.2) = 1.

quanto à dispersão.006 0.2 0 0 10 20 n i =1 ni 2000 1500 1000 300 200 5000 fi 0.025 c) Classe mediana (classe a que corresponde frequência acumulada 0.5): [5.4 0.06 0. 50] Total fi/hi 0.5 15 25 40 10 20 30 40 50 60 30 40 50 60 70 80 90 100 b) x = 1 n i =1 n ni c i = f i ci = (2.02 0 0 F* 1 0. com desvio-padrão de 8.9 0.4525 2 s x = s x = 0.08 0.35 A duração média de uma chamada é de 9.35 minutos.04 1 Histograma hi 5 5 10 10 20 fi/hi 0. 10[ Estatística Aplicada 40 .00536875 = 9.5 x 40%) + (7.02 0. 30[ [30.5 7. 20[ [20.7 minutos.2 0. 10[ [10. sx = 2 n i =1 fi * ci − x 2 ( ) 2 = n i =1 fici 2 − x = 81.4 0.8 0.06 0.5 x30%) + .06 0.4 0.7 0.04 0. 5[ [5. Compare. Resolução a) Duração (em minutos) [0.6 0.. + (40 x 4%) = 9.Manual de Exercícios d) Sabe-se que as chamadas realizadas durante o ano de 2001 apresentaram uma duração média de 10 minutos.96 1 ci 2..08 0.3 0.002 Fi 0. as chamadas efectuadas em Dezembro com as que tiveram lugar durante todo o ano de 2001.1 0.

Estatística Aplicada 41 .Manual de Exercícios 5 : Fi = 0.965 > x 9.5 . pelo Método dos Mínimos Quadrados.67 minutos.3)(3100 − 2708.025 = = 0..98 520854x 1145944 Correlação positiva quase perfeita.4 10 : Fi = 0.5 Me = 5 + ((5x0. b) Ajuste.67 50% das chamadas têm duração a 6.3) = 6.0.7 .0.1)/0. O volume de produção e o custo de produção de cada lote apresentam-se na tabela: Lote 1 2 3 4 5 6 7 8 9 10 11 12 Volume (unidades) 1500 800 2600 1000 600 2800 1200 900 400 1300 1200 2000 Custo (contos) 3100 1900 4200 2300 1200 4900 2800 2100 1400 2400 2400 3800 a) Analise a correlação existente entre volume e custo de produção.87 10 Exercício 10 Uma empresa coligiu dados relativos à produção de 12 lotes de um tipo especial de rolamento.4 -----------.7 = 0.3)(3800 − 2708. d) CV Dez = s x 9. + (2000 − 1358.3)] = 12 = 0.7 Cálculo da Me: 0.Me . uma função linear que exprima o custo em função do volume de produção.5 0.3) + .4 -----------.35 CV2001 = sy y = 8. Resolução a) r = s xy s xx s yy 1 [(1500 − 1358.10 ..

5 0.92)] =9 = 0..9 1. Resolução a) r = s xy s xx s yy 1 [(191 − 121. + (81 − 121. pelo Método dos Mínimos Quadrados. Estatística Aplicada 42 .7 0.3 0.0 0. b) Ajuste.096933 Correlação positiva moderada..4 − 0.8 1.7)(0.7)(0.61 3669. uma função linear que exprima a variável EPS em função de PBV.332 x 0.92) + .4553x + 731.4 a) Analise a correlação existente entre aqueles dois indicadores.8 0.9 − 0.9 1.Manual de Exercícios b) 6000 5000 4000 Custo 3000 2000 1000 0 0 500 1000 1500 Volume 2000 2500 3000 y = 1.6 Exercício 11 Um conjunto de empresas do sector da Construção e Obras Públicas cotadas na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: EPS (Earnings per Share): Resultado Líquido por Acção PBV (Price/Book Value): Preço / Situação Líquida por Acção Empresa 1 2 3 4 5 6 7 8 9 EPS ($) 191 32 104 117 210 95 65 201 81 PBV ($) 0.

pelo Método dos Mínimos Quadrados.Manual de Exercícios b) 250 200 150 100 50 0 0 0.4 1.6 y = 124. uma função linear que exprima a variável Gi em função de Ri.383 Exercício 12 Recolheu-se uma amostra em 17 cidades do país relativamente aos seguintes indicadores: Ri: Rendimento médio mensal na cidade i (em 106 unidades monetárias) Gi: Gasto médio mensal em bens de luxo na cidade i (em 106 u.8 PBV 1 1.) Ri 125 127 130 131 133 135 140 143 169 Dados adicionais Gi 54 56 57 57 58 58 59 59 66 Ri 144 147 150 152 154 160 162 165 Gi 61 62 62 63 63 64 65 66 EPS Ri = 2467 Gi = 62620 2 Gi = 1030 Ri Gi = 150270 Ri = 361073 2 a) Estude a correlação entre rendimento e despesas em bens de luxo.04x + 7.4 0.6 0. Estatística Aplicada 43 .m.2 0. b) Ajuste.2 1.

2604x + 22. b) 68 66 64 62 Gasto 60 58 56 54 52 50 100 120 140 160 180 200 y = 0.801 Rendimento Estatística Aplicada 44 .Manual de Exercícios Resolução a) rXY = Ri G i − n R G ( Ri − n R )( 2 2 G − nG ) 2 i 2 = 150270 − 17 * 2 2467 1030 * 17 17 2467 1030 2 (361073 − 17 * )(62620 − 17 * ) 17 2 17 2 = 0.986 Correlação positiva forte.

104 Introdução ao e-learning .

que serão úteis a aplicações de estatística indutiva relacionadas com controlo estatístico de qualidade e fiabilidade de componentes e sistemas. então. Claro que o processo de indução implica um certo grau de incerteza associado à tentativa de generalização de conclusões da “parte” (amostra) para o “todo” (universo). serão apresentadas algumas noções simples de probabilidades e funções de probabilidade. O exemplo seguinte pretende clarificar o que vulgarmente é designado por experiência aleatória. um papel fundamental. Deve entender-se como experiência qualquer processo ou conjunto de circunstâncias capaz de produzir resultados observáveis. ESTATÍSTICA INDUTIVA A estatística indutiva é o ramo da estatística que se ocupa em inferir das conclusões retiradas sobre a amostra para a população. quando uma experiência está sujeita à influência de factores casuais e conduz a resultados incertos.1. 3. não vai ser possível afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo. O conceito de probabilidade vai ter aqui. mas apenas que o faz com forte probabilidade. Noções básicas de probabilidade A teoria das probabilidades é um ramo da matemática extremamente útil para o estudo e a investigação das regularidades dos chamados fenómenos aleatórios. as experiências aleatórias caracterizam-se por: Estatística Aplicada 45 . Isto é. diz-se que a experiência é aleatória.Manual de Exercícios 3. De seguida. Fundamentalmente.

5.4. Por exemplo. num lançamento de um dado ordinário tem-se que o espaço de resultados é { . obtém-se um resultado individual. mas não é possível prever exactamente esse resultado os resultados das experiências individuais mostram-se irregulares. existe um paralelismo perfeito entre álgebra de conjuntos e álgebra de acontecimentos: (i) (ii) (iii) (iv) O acontecimento que contem todos os elementos do espaço de resultados chama-se acontecimento certo O acontecimento que não contem qualquer elemento do espaço de resultados chama-se acontecimento impossível Dois acontecimentos são mutuamente exclusivos se não têm em comum qualquer acontecimento do espaço de resultados A união de dois acontecimentos A e B representa-se por A ∪ B e é formado pelos elementos que pertencem a pelo menos um dos dois. aos acontecimentos é aplicável toda a construção disponível para aqueles.6}. A ou B (v) A intersecção de dois acontecimentos A e B representa-se por A ∩ B e é formado pelos elementos comuns a A e B Estatística Aplicada 46 . 1 A importância da definição deste conceito advém sobretudo por ser o meio empregue para a definição de acontecimentos.2.3. Por exemplo.Manual de Exercícios (i) (ii) (iii) poder repetir-se um grande número de vezes nas mesmas condições ou em condições muito semelhantes cada vez que a experiência se realiza. O espaço de resultados corresponde ao conjunto formado por todos os resultados possíveis de uma experiência aleatória.5}. que não sei mais que subconjuntos do espaço de resultados. o de espaço de resultados. mas os resultados obtidos após uma longa repetição da experiência patenteiam uma grande regularidade estatística no seu conjunto Alguns autores consideram inserido no conceito de experiência aleatória um outro. outros como “saída de um número ímpar” definido pelo subconjunto { . no lançamento de um dado podem definir-se.3. para além dos 6 acontecimentos elementares correspondentes à saída de cada uma das faces. 1 Definidos como conjuntos. isto é.

aleatória Uma das principais críticas a esta definição é a de que ela só é aplicável quando o espaço de resultados é finito e os seus elementos possuem igual probabilidade. a probabilidade de ocorrência de dois ou mais acontecimentos independentes é o produto das probabilidades dos respectivos acontecimentos. se dois acontecimentos forem mutuamente exclusivos. vem que P (A ∪ B) = P(A) + P(B) . então: P(A ∩ B) = 0 − A probabilidade de união de dois acontecimentos mutuamente exclusivos é dada por P (A ∪ B) = P(A) + P(B) − − − Para dois acontecimentos quaisquer. deve ter-se em atenção o seguinte: Dois acontecimentos são ditos mutuamente exclusivos se não puderem acontecer ao mesmo tempo. as 6 faces de um dado. sendo 0 a probabilidade associada a um acontecimento impossível e 1 a probabilidade associada a um acontecimento certo. que possuem essas propriedades. A primeira definição foi proposta por Laplace em 1812. isto é: P(A ∩ B) = P(A) x P(B) Estatística Aplicada 47 . daí que ela surja muito ligada aos “jogos de azar”. etc. Para − se analisar a probabilidade de ocorrência de determinados acontecimentos.Manual de Exercícios Probabilidade de um acontecimento é expressa na escala de 0 a 1. as 52 cartas de um baralho.P(A ∩ B) Dois acontecimentos dizem-se complementares se: P(A) = 1 – P( A ) Dois acontecimentos são ditos independentes se a ocorrência de um não afectar a probabilidade de ocorrência de outro. Pode definir-se probabilidade de um acontecimento A como sendo: P(A) = Número de casos favoráveis ao acontecimento A Número total de casos possíveis na exp. É o que acontece com as duas faces de uma moeda.

3.2 0. Por outras palavras.15 0. sabendo que ocorreu o acontecimento “ser obeso”.00 a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? b) Qual a probabilidade de uma pessoa obesa ser hipertensa? Resolução a) Basta ver que a proporção de hipertensos é de 20% b) Há que tomar em atenção que o que se pretende é a proporção de hipertensos na população de obesos. Probabilidade condicionada Exemplo: Um grupo de pessoas é classificado de acordo com o seu peso e a incidência de hipertensão.22 Total 0.2.4 .1 = 0.45 0. Este exemplo corresponde ao cálculo de uma probabilidade condicionada. Pode escrever-se que a probabilidade pretendida é dada por: P( H / O) = P( H ∩ O) P (O) onde P(H/O) é a probabilidade de ocorrer o acontecimento “ser hipertenso”.8 1.25 pretende-se calcular a probabilidade do acontecimento “ser hipertenso”. numa outra perspectiva. a da chamada teoria frequencista.Manual de Exercícios Após a apresentação desta definição.02 0. Repare-se que este quociente resulta da divisão entre a probabilidade de uma pessoa ser hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Estatística Aplicada 48 .53 Magro 0. a probabilidade de um acontecimento é definida como sendo o valor para o qual tende a frequência relativa do acontecimento quando o número de repetições da experiência aumenta. isto é 0.2 0.1 0.25 Normal 0.08 0. São as seguintes as proporções das várias categorias: Obeso Hipertenso Não Hipertenso Total 0. convém ainda referir que. 0. sabendo que ocorreu ou condicionado pelo acontecimento “ser obeso”.

… An calculadas sob a hipótese de que B (acontecimento consequente) se realizou.…An dá-se o nome de acontecimentos antecedentes. por vezes. dois acontecimentos são ditos independentes se a ocorrência de um não afectar a probabilidade de ocorrência de outro. 3. A2.Manual de Exercícios Como se viu anteriormente. A2. Aos acontecimentos A1. Se associarmos a uma experiência aleatória uma variável X (por exemplo. A2. Funções de probabilidade A probabilidade associada aos acontecimentos possíveis numa experiência aleatória obedecem. então pode ser constituída uma lei ou função de probabilidade (f(x)) dessa variável X.P ( B / Ai ) n i =1 P ( Ai ).P ( B / Ai ) designa-se de probabilidade total de ocorrência do acontecimento B.… An que o podem ter antecedido (ou causado a sua ocorrência). De acordo com este teorema: P ( Ai / B ) = P ( Ai ). se: P(A / B) = P(A) e se P(B / A) = P(B). Teorema de Bayes Seja B um acontecimento que se realiza se e só se um dos acontecimentos mutuamente exclusivos A1.3.P ( B / Ai ) Este Teorema utiliza-se em situações em que a relação causal está invertida. associar aos resultados da experiência lançamento de um dado . A2. n i =1 P ( Ai ).… An. A2.que são 6 (saída de face 1 a 6) – a variável X:“Nº da face resultante do lançamento de um dado”). isto é. a um padrão. a probabilidade de ocorrência de A1. tal que f(x) = P(X=xi) Estatística Aplicada 49 .…An se verifica. isto é. isto é. O teorema de Bayes permite calcular a probabilidade à posteriori de A1. é a probabilidade de ocorrência do acontecimento consequente B face a todos os possíveis acontecimentos A1.

Se há x defeituosos. Entre estas. Para calcular o número exacto de combinações de x artigos defeituosos com n-x artigos não-defeituosos. para X: nº da face resultante do lançamento de um dado. Vem Estatística Aplicada 50 . os produtos resultantes de uma fábrica podem ser classificados como sendo defeituosos ou sendo não defeituosos. vem que: xi f(xi) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 que se designa por lei uniforme. com probabilidade dada por qn-x. oriunda das técnicas de cálculo combinatório. cada uma das quais com apenas dois estados possíveis de ocorrência e com uma probabilidade fixa de ocorrência para cada um deles. A probabilidade do acontecimento complementar “artigo é nãodefeituoso” é dada por 1–p=q A probabilidade associada a x artigos defeituosos é dada por px (p x p x p x p. A probabilidade de ocorrência do acontecimento “artigo é defeituoso” é dada por p: incidência de defeituosos na produção (convenientemente calculada através de métodos de estimação).Manual de Exercícios Por exemplo. A distribuição das duas classes possíveis é discreta e do tipo binomial.. a lei de Poisson e a lei Exponencial. em relação aos quais se pretende identificar a variável X: “Nº de artigos defeituosos nos n que constituem a amostra”. contam-se a lei Binomial.x vezes). (i) Lei Binomial Há alguns acontecimentos que são constituídos por um conjunto de experiências independentes. Por exemplo. restam n-x artigos não-defeituosos. No exemplo anterior. Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior número de fenómenos estatísticos do que outras. utiliza-se a figura “combinações de n. x a x. e o facto de um ter saído (ou não) defeituoso não influencia os outros serem (ou não).. consideremos uma amostra de n artigos retirados da produção total.

Como o número médio de ocorrências do acontecimento é proporcional à amplitude do intervalo de tempo ou espaço a que se refere. a funcionar ou avariada. que corresponde ao número médio de ocorrências por unidade de tempo ou espaço. O parâmetro caracterizador da distribuição de Poisson é λ. nº de varias que ocorrem numa máquina por dia). Os números de acontecimentos de “sucesso” ocorridos em diferentes intervalos são independentes.Manual de Exercícios então que a probabilidade de existência de x defeituosos (e logo n-x não defeituosos) é igual a: f ( x) = C xn p x q n − x = n! p x q n− x (n − p )! p! sendo que X segue Bi (n. aplicar a distribuição binomial quando se pretende calcular a fiabilidade de uma central eléctrica. a variável X: “Nº de ocorrências do acontecimento no intervalo [0. Um acontecimento deve ter 4 características para que se possa associar a uma lei binomial: - número fixo de experiências (n) cada experiência ter apenas duas classes de resultados possíveis todas as experiências terem igual probabilidade de ocorrência (p) as experiências serem independentes Em sistemas eléctricos de energia é possível.p).t[” segue lei de Poisson de parâmetro λt (isto é. sendo n e p os parâmetros caracterizadores da lei. por exemplo. quando a taxa de ocorrência é fixa (por exemplo. com várias unidades iguais e admitindo que cada unidade apenas pode residir em dois estados. (ii) Lei de Poisson A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) dá a probabilidade de um acontecimento ocorrer um dado número de vezes num intervalo de tempo ou espaço fixado. se para 1 unidade de tempo o nº médio de ocorrências é λ. A expressão (λt )x e −λt x! Estatística Aplicada 51 . nº de chamadas que chegam a uma central telefónica por minuto. para t unidades de tempo o número médio de ocorrências é λt).

se X fôr o “Nº de avarias que ocorrem no intervalo de tempo [0. é dada por: (λt )0 e −λt = e −λt 0! (iii) Lei Exponencial Seja T a variável “Tempo ou espaço que decorre entre ocorrências consecutivas de um acontecimento”.t[”. não ocorre qualquer avaria) = P (ocorrerem zero avarias no intervalo [0. a fiabilidade do componente/sistema como função do tempo. Então T segue lei exponencial Exp (λ). Note-se que é possível estabelecer uma relação entre a lei exponencial e a lei de Poisson.t[”. Assim. decorre entre ocorrências sucessivas do acontecimento. e corresponde à expressão da lei de probabilidade de Poisson : Po(λt) Por exemplo. então: P (T>t) = P(tempo que decorre entre avarias exceder t) = P(até ao instante t.Manual de Exercícios dá a probabilidade de acontecerem x ocorrências no intervalo de tempo [0. isto é. já que a probabilidade de um componente sobreviver até ao instante t é dada por e − λt A probabilidade de avariar até ao instante t é dada por 1 − e − λt Estatística Aplicada 52 . então a probabilidade de não ocorrerem avarias nesse intervalo. sendo 1 λ o tempo que. em média. e T fôr o “Tempo que decorre entre avarias consecutivas”.t[) = P(X=0) = e − λt A distribuição exponencial é a mais usada em estudos de fiabilidade. se X fôr o “Nº de avarias que ocorrem no intervalo de tempo [0.t[.

A expressão − 1 e 2 σ 2∏ 1 ( Xi − µ ) 2 σ2 representa a função densidade de probabilidade da distribuição Normal. Existem muitos tipos de distribuição.Manual de Exercícios (iv) Lei Normal A lei Normal tem como parâmetros caracterizadores a média µ e o desviopadrão σ. Se se fizer o valor médio µ igual a zero e todos os desvios forem medidos em relação à média. Estatística Aplicada 53 . a qual é caracterizada por uma curva de Gauss: Esta distribuição apresenta 99. a equação será: Z= X −µ σ que corresponde a uma distribuição normal estandardizada (0. os valores observados têm uma determinada tendência central e uma determinada dispersão em torno da tendência central. Isto é. mas a curva normal é a forma de distribuição mais frequente nos processos industriais para características mensuráveis. e pode considerar-se como estabelecida pela experiência prática.73% dos valores entre os extremos –3 e 3.1) com os valores tabelados.

É possível demonstrar que o valor esperado e a variância da distribuição de uma variável Qui-Quadrado são respectivamente µ =n σ 2 = 2n A distribuição Qui-Quadrado é uma distribuição assimétrica à esquerda.f: degrees of freedom) é habitualmente usado para designar o número n de parcelas (variáveis Zi) adicionadas. + Z n 2 X ∩ χn O termo “Graus de Liberdade” (d.1). as variáveis Zi são mutuamente independentes Então. Estatística Aplicada 54 . obedecendo às seguintes condições: - cada variável Zi segue distribuição N(0. denotada por n i =1 X= 2 2 Z i2 = Z12 + Z 2 + .. aproximando-se da distribuição Normal à medida que n cresce.. construída a partir da soma das n variáveis Zi elevadas ao quadrado. a variável aleatória X.Manual de Exercícios (v) Lei Qui-Quadrado Considere-se um conjunto de n variáveis aleatórias Zi. segue distribuição Qui-Quadrado com n graus de liberdade.

Manual de Exercícios Estatística Aplicada 55 .

104 Introdução ao e-learning .

De ensaios anteriores. Determine a probabilidade dos seguintes acontecimentos: a) saída de Rei b) saída de copas c) saída de Rei ou copas d) saída de Rei mas não de copas e) não saída de Rei f) não saída de Rei nem de copas g) não saída de Rei ou não saída de copas Resolução A: saída de Rei B: saída de copas a) P(A)=1/13 b) P(B)=1/4 c) P(A ∪ B) = P(A) + P(B) .P(A ∩ B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) d) P(A-B) = P(A) – P(A ∩ B) = 1/13 – 1/52 = 3/52 (= (4-1)/52) e) P( A )= 1-1/13 = 12/13 (=(52-4)/52) f) P( A ∩ B ) = P( A ∪ B ) = 1 – P(A ∪ B) = 1 – 4/13 = 9/13 g) P( A ∪ B ) = P( A ∩ B ) = 1 – P ( A ∩ B ) = 1 – 1/52 = 51/52 Exercício 2 Um sistema electrónico é formado por dois sub-sistemas. A e B.Manual de Exercícios PROBABILIDADES Exercícios resolvidos Exercício 1 De um baralho ordinário (52 cartas) extrai-se ao acaso 1 carta. sabe-se que: - a probabilidade de A falhar é de 20% a probabilidade de B falhar sozinho é 15% a probabilidade de A e B falharem é 15% Determine a probabilidade de: Estatística Aplicada 56 .

3 – 0. com as seguintes percentagens de leitura: A: 9.15 = 35% d) P( A ∩ B ) = P( A ∪ B ) = 1 – P(A ∪ B) = 1 – 0. A e B: 5. A.1% P(B) = 22. B e C.15 = 5% c) P(A ∪ B) = P(A) + P(B) .1%.1% P(B ∩ C) = 6% P(A ∩ B ∩ C) = 2. A.4% Escolhe-se uma pessoa ao acaso.9% P(A ∩ C) = 3.Manual de Exercícios a) B falhar b) falhar apenas A c) falhar A ou B d) não falhar nem A nem B e) A e B não falharem simultaneamente Resolução A: o subsistema A falha B: o subsistema B falha P(A)=20% P(B-A)=15% P(A ∩ B)=15% a) P(B) = P(B-A)+ P(A ∩ B) = 0.35 = 65% e) P( A ∩ B ) = 1 – P ( A ∩ B ) = 1 – 0.2 + 0. C: 12.15 = 85% Exercício 3 P( A )= 80% Suponha que há 3 jornais.P(A ∩ B) = 0. A e C: 3.2 – 0. B e C: 2.8%.8% P(A ∩ B) = 5. B: 22.15 = 30% b) P(A-B) = P(A) – P(A ∩ B) = 0.1%.7%.7% P(C) = 12. B e C: 6%.4% Estatística Aplicada 57 .15 + 0. Calcule a probabilidade dessa pessoa: a) ler pelo menos um dos jornais b) ler A e B mas não C c) ler A mas não ler B nem C Resolução A: a pessoa escolhida lê o jornal A B: a pessoa escolhida lê o jornal B C: a pessoa escolhida lê o jornal C P(A) = 9.9%.

Manual de Exercícios

a)
P ( A ∪ B ∪ C ) = P ( A) + P ( B ) + P (C ) − P ( A ∩ B ) − P ( A ∩ C ) − P ( B ∩ C ) + P ( A ∩ B ∩ C ) = 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%

b) P( A ∩ B ∩ C ) = P( A ∩ B ) − P ( A ∩ B ∩ C ) = 0,051 – 0,024 = 2,7% c) P ( A ∩ B ∩ C ) = P(A) - P ( A ∩ B ) − P ( A ∩ C ) + P ( A ∩ B ∩ C ) = 0,098-0,051-0,037+0,024 = 3,4%
Exercício 4

Um gerente de uma galeria de arte muito creditada no mercado, está interessado em comprar um quadro de um pintor famoso para posterior venda. O gerente sabe que há muitas falsificações deste pintor no mercado e que algumas dessa falsificações são bastante perfeitas o que torna difícil avaliar se o quadro que ele pretende comprar é ou não um original. De facto, sabe-se que há 4 quadros falsos desse pintor para 1 verdadeiro. O gerente não quer comprometer o “bom nome” da galeria para a qual trabalha comprando um quadro falso. Para obter mais informação o gerente resolve levar o quadro a um museu de arte e pede para que o especialista do museu o examine. Este especialista garante-lhe que em 90% dos casos em que lhe é pedido para examinar um quadro genuíno daquele pintor, ele identifica-o correctamente como sendo genuíno. Mas em 15% dos casos em que examina uma falsificação do mesmo pintor, ele identifica-o (erradamente) como sendo genuíno. Depois de examinar o quadro que o gerente lhe levou, o especialista diz que acha que o quadro é uma falsificação. Qual é agora a probabilidade de o quadro ser realmente uma falsificação?
Resolução

V: o quadro é genuíno F: o quadro é falso I: o quadro é identificado correctamente P(V) = 20% P(F) = 80% P(I/V) = 90% P( I / F ) = 15%
Estatística Aplicada

P( I / V ) = 10% P(I/F) = 85%
58

Manual de Exercícios

P(ser realmente falsificação/especialista identificou como falsificação) = =
P( F ) * P( I / F ) 0,8 * 0,85 0,68 = = = 97,1% P ( F ) * P ( I / F ) + P (V ) * P ( I / V ) 0,8 * 0,85 + 0,2 * 0,1 0,7

Exercício 5

Na ida para o emprego, o Sr. Óscar, polícia de profissão, tem de passar obrigatoriamente por três cruzamentos com semáforos. No primeiro cruzamento, o do Largo Azul, a probabilidade do semáforo se encontrar com sinal vermelho é de 10%. Em cada um dos cruzamentos seguintes, o Sr. Óscar fica parado devido aos sinais vermelhos em metade das vezes que lá passa. O Sr. Óscar já descobriu que os semáforos funcionam separadamente, não estando ligados entre si por qualquer mecanismo. Embora goste de cumprir a lei, o guarda Óscar passa no sinal verde e acelera no amarelo, só parando mesmo no sinal vermelho. a) Qual a probabilidade do Sr. Óscar chegar ao emprego sem ter de parar em qualquer sinal vermelho? b) Qual a probabilidade do Sr. Óscar ter de parar num só semáforo? c) Qual a probabilidade do Sr. Óscar ter parado no sinal vermelho do cruzamento do Largo Azul, sabendo que parou num só semáforo na sua ida para o emprego?
Resolução

A: polícia encontra sinal vermelho no 1º cruzamento B: polícia encontra sinal vermelho no 2º cruzamento C: polícia encontra sinal vermelho no 3º cruzamento P(A)=10% P(B)=50% P(C)=50% P( A )= 90% P( B )= 50% P( C )= 50%

a) P( A ∩ B ∩ C ) = P( A )*P( B )*P( C ) = 0,9*0,5*0,5 = 22,5% b) P( A ∩ B ∩ C ) + P( A ∩ B ∩ C ) +P( A ∩ B ∩ C ) = = P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) = 47,5%

Estatística Aplicada

59

Manual de Exercícios

c) P(polícia parar no 1º cruzamento / polícia parou num só semáforo)
=
P ( A ∩ B ∩ C ) P ( A) * P ( B ) * P (C ) = = 5,26% 0,475 0,475

Exercício 6

Após alguns testes efectuados à personalidade de um indivíduo, concluiu-se que este é louco com probabilidade 60%, ladrão com probabilidade igual a 70% e não é louco nem ladrão com probabilidade 25%. Determine a probabilidade do indivíduo: a) Ser louco e ladrão b) Ser apenas louco ou apenas ladrão c) Ser ladrão, sabendo-se que não é louco
Resolução

A: indivíduo é louco B: indivíduo é ladrão P(A)=60% P(B)=70% P( A ∩ B ) = 25% = P( A ∪ B ) P(A ∪ B) = 1 – 0,25 = 75% 0,75 = 0,6 + 0,7 - P(A ∩ B)

a) P(A ∪ B) = P(A) + P(B) - P(A ∩ B) P(A ∩ B) = 0,6 + 0,7 – 0,75 = 55%

b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20í c) P(B/ A ) =
P ( B ∩ A) P ( B − A) 0,15 = = = 37,5% 1 − 0,6 0,4 P ( A)

Exercício 7

Uma moeda é viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem faces, então um número é seleccionado de 1 a 9. Se parecem coroas, um número é seleccionado entre 1 e 5. Determine a probabilidade de ser seleccionado um número par.
Resolução

P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%

Estatística Aplicada

60

3 máquinas. A incidência de defeituosos na produção de cada máquina é: M1: 3% M2: 1% M3: 2% Extrai-se ao acaso da produção diária um parafuso. 2 = P(M2)*10000 = ? Prod.Manual de Exercícios Exercício 8 Numa fábrica.65% Prod.01 + P( M 3) * 0. M1. M2 e M3 fabricam parafusos.3 P(M2) P(D / M1) = 3% P(D / M2) = 1% P(D / M3) = 2% P(D) = 1. Sabendo que a probabilidade dele ser defeituoso é de 1.02 Estatística Aplicada 61 . 1 = P(M1)*10000 = ? Prod.03 + P( M 2) * 0. A probabilidade de um parafuso escolhido ao acaso ter sido produzido por M1 é 30% da probabilidade de ter sido produzido por M2.65%. sendo a produção diária total de 10000 unidades.3P( M 2) + P( M 3) = 1 ⇔ 0.3P( M 2) P( M 1) + P ( M 2) + P( M 3) = 1 ⇔ P( D) = P( M 1) * P( D / M 1) + P( M 2) * P ( D / M 2) + P( M 3) * P( D / M 3) − 1. determine o número de parafusos que cada máquina produz diariamente.3P( M 2) * 0. Resolução M1: o parafuso foi produzido por M1 M2: o parafuso foi produzido por M2 M3: o parafuso foi produzido por M3 D: o parafuso é defeituoso n = 10000 unidades P(M1) = 0. 3 = P(M3)*10000 = ? P( M 1) = 0.0165 = 0.

02 P( M 1) = 0.3 * 0.Manual de Exercícios − ⇔ P( M 3) = 1 − 1.3 * 0.8 P(T/B) = 0.3P( M 2)) * 0. B ou C.6 P(T/A) = 0.01 + (1 − 1. Sabe-se que a probabilidade de: - chegar atrasado à escola é 60% chegar atrasado utilizando o transporte A é 80% chegar atrasado utilizando o transporte B é 50% chegar atrasado utilizando o transporte C é 60% utilizar os transportes B e C é a mesma a) Calcule a probabilidade de o João utilizar o transporte A b) Sabendo que o João chegou atrasado à escola.0165 = 0.3P( M 2) = 1 − 1. Resolução T: O João chega atrasado A: o João utiliza o transporte A B: o João utiliza o transporte B C: o João utiliza o transporte C P(T) = 0.5 = 15% P( M 3) = 1 − 1. calcule a probabilidade de ter utilizado os transportes B ou C.5 = 35% P( M 2) = 50% Exercício 9 O João tem à sua disposição 3 meios de transporte diferentes para se deslocar de casa para a escola: os transportes A.03 + P( M 2) * 0.3P( M 2) * 0.2P(B) a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C) Estatística Aplicada 62 .5 P(T/C) = 0.3P( M 2) 0.6 P(B) = P(C) P(A)+P(B)+P(C) = 1 P(A) = 1.

I.5 + 0.Manual de Exercícios Logo 0.6 Exercício 10 Uma empresa que se dedica à prestação de serviços de selecção de pessoal em relação a um teste psicotécnico para uma profissão específica sabe o seguinte: - as percentagens de indivíduos com um quociente de inteligência (Q.6 = (1-2P(B))*0.4 * 0.6 e vem que P(B) = 40% Então P(A) = 1 – 2P(B) = 1 – 2*0. respectivamente. médio que ficam aptos no teste é de 50% a probabilidade de um indivíduo com Q.4 * 0. sabe-se que 70% dos indivíduos com Q.) elevado e médio são. baixo ficar apto no teste é de 20% finalmente.3 – 0. baixo. de 30% e de 60% a percentagem de indivíduos com Q. sabendo-se que ficou inapto? Resolução A: indivíduo fica apto no teste E: indivíduo tem QI elevado M: indivíduo tem QI médio B: indivíduo tem QI baixo P(E) = 30% P(M) = 60% P(A/M) = 50% P(B) = 1 –0. elevado ficam aptos no teste a) Qual a probabilidade de um indivíduo escolhido ao acaso ficar apto no teste? b) Qual a probabilidade de um indivíduo ter Q.6 = =73.I.5 + P(B)*0.I.3% P (T ) 0.8 + P(B)*0.I.I.6 = 10% P(A/E) = 70% P(A/B) = 20% Estatística Aplicada 63 .4 = 20% b) P(B ∪ C / T) = P ( B ) * P (T / B ) + P (C ) * P (T / C ) 0.

possuir também frigorífico 2.8 = = 17% 1 − 0. não possuir nem telefone nem automóvel b) Calcule a probabilidade de um agregado que possui automóvel 1.6*0. possuir pelo menos um daqueles três objectos 2. possuir telefone ou frigorífico 2.Manual de Exercícios a) P(A) =P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B) =0.1 * 0.5+0.3*0. não possuir nenhum daqueles três objectos Resolução A: agregado familiar possui telefone B: agregado familiar possui frigorífico C: agregado familiar possui automóvel P(A) = 35% P(B) = 50% P(C) = 25% Estatística Aplicada 64 .53 P ( A) Exercício 11 Os resultados de um inquérito aos agregados familiares de uma determinada cidade forneceram os seguintes dados: - 35% dos agregados possuem telefone 50% dos agregados possuem frigorífico 25% dos agregados possuem automóvel 15% dos agregados possuem telefone e frigorífico 20% dos agregados possuem telefone e automóvel 10% dos agregados possuem frigorífico e automóvel 5% dos agregados possuem telefone. possuir também telefone ou frigorífico c) Calcule a probabilidade de um agregado familiar 1.1*0.2=53% b) P(B/ A ) = P( B ) * P ( A / B) 0. automóvel e frigorífico a) Calcule a probabilidade de um agregado familiar 1.7+0.

um acidente durante o referido período? Estatística Aplicada 65 .1 − 0.15-0.05 = 70% 2. 3% têm um ou mais acidentes no mesmo período. P(B / C) = 2. todos terem idade igual ou inferior a 40 anos? 2.35 + 0.05 = = 100% P (C ) 0.2 + 0.25-0.2-0.P(A ∩ C) = 0.1 = = 40% P (C ) 0. nenhum ter sofrido qualquer acidente durante um ano? 3.7 = 30% Exercício 12 Admita que 60% dos seguros no ramo automóvel respeitam a condutores com mais de 40 anos de idade.25 P( B ∩ C ) 0.P(A ∩ B) = 0.35+0.25 c) 1. De entre os segurados com idade igual ou inferior a 40 anos. a) Qual a probabilidade de um segurado não sofrer qualquer acidente durante um ano? b) Qual a probabilidade de um segurado que sofreu pelo menos um acidente ter idade igual ou inferior a 40 anos? c) Qual a probabilidade de. P(A ∪ B/ C) = P ( A ∩ C ) + P ( B ∩ C ) − P ( A ∩ B ∩ C ) 0.Manual de Exercícios P(A ∩ B) = 15% P(A ∩ C) = 20% P(B ∩ C) = 10% P(A ∩ B ∩ C) = 5% a) 1.1+0. 1 – P( A ∪ B ∪ C ) = 1 – 0.15 = 70% 2. numa amostra de três segurados 1.5 – 0.5+0. pelo menos. dos quais 5% sofrem. P( A ∩ C ) = P( A ∪ C ) = 1 – P(A ∪ C) = 1 – 0.25 – 0. Todos terem idade igual ou inferior a 40 anos. um acidente por ano. dado que cada um sofreu. pelo menos.4 = 60% P(A ∪ C) = P(A) + P(C) . P(A ∪ B) = P(A) + P(B) . P ( A ∪ B ∪ C ) = P ( A) + P ( B ) + P (C ) − P ( A ∩ B ) − P ( A ∩ C ) − P ( B ∩ C ) + P ( A ∩ B ∩ C ) = 0.2 = 40% b) krysktsh1.35 + 0.

4 = 6.958*0.4*0.958*0.9% 3. P( I 2 ∩ I 2 ∩ I 2) = 0.2857 = 2. P( B ∩ B ∩ B ) = 0.Manual de Exercícios Resolução I1: o segurado tem mais de 40 anos de idade I2: o segurado tem 40 anos ou menos de idade A: o segurado sofre pelo menos 1 acidente por ano A : o segurado não sofre nenhum acidente por ano P(I1) = 60% P(A/I1) = 5% P(A/I2) = 3% P(I2) = 1 – 0.3% Estatística Aplicada 66 .4% 2.958 P ( A) P ( A) c) 1.8% b) P(I2/A) = P ( A ∩ I 2) P ( I 2) * P ( A / I 2) 0.97 = 95.05 = 95% P( A /I2) = 1 – 0.958 = 87.57% = P(B) 1 − 0.2857*0.03 = = = 28. P( A ∩ A ∩ A) = 0.2857*0.6*0.6 * 0.95 + 0.6 = 40% P( A /I1) = 1 – 0.03 = 97% a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0.4*0.4*0.

104 Introdução ao e-learning .

3.4096 = 41% Exercício 2 O número médio de chamadas telefónicas a uma central. 8) λ=5 8 p=0. Qual a probabilidade de não serem atendidas todas as chamadas no intervalo de tempo de 1 minuto? Resolução X: número de chamadas telefónicas atendidas numa central.4) n=4 p=0. 6.Manual de Exercícios FUNÇÕES DE PROBABILIDADE Exercícios resolvidos Exercício 1 Se 20% das bobinas de um determinado cabo eléctrico forem defeituosas.5 horas.2*0. calcule a probabilidade de. 7. entre as 4 bobines necessárias a um determinado cliente. por minuto (0.83 = 0.2 q=1-p=0. escolhidas ao acaso uma ser defeituosa.2. é 5. 5.1. Resolução X: número de bobines defeituosas no conjunto de 4 bobines necessárias a um determinado cliente (0. Qual a probabilidade de não ocorrerem avarias antes do instante t=6 horas? Estatística Aplicada 67 .8 P(X=1)=C4p1q4-1 = 4*0.2 q=1-p=0.1. por minuto.3.8 Logo P(X>8) = 1-0.2.06 e −5 5 x P(X ≤ 8) = = 0.932 x! x =0 Exercício 3 O tempo de funcionamento sem avarias de uma determinada máquina de produção contínua segue uma lei exponencial negativa com valor esperado igual a 4.4. Imagine que a máquina é (re)colocada em funcionamento no instante t=0 horas. A central só pode atender um número máximo de 8 chamadas por minuto.932 = 0.

a) b) Qual a probabilidade de que.333 = 0. verifica-se que o valor da função Z é P(X ≤ 2) = 0. destinado aos turistas que a frequentam.9772.5 Consultando a tabela. os barcos sejam procurados por mais de 25 turistas? Estatística Aplicada 68 . Qual a percentagem de fio com comprimento superior a 121? Resolução X: comprimento de determinado fio condutor Calculando a variável reduzida correspondente.264 Exercício 4 Considere que o comprimento médio de determinado fio condutor é 120.Manual de Exercícios Resolução Seja T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de uma máquina.5. O número de turistas que procuram este serviço. entre as 8 e as 9 horas. num período de 6h λ=1/4.28%.5 corresponde ao número de avarias por unidade de tempo (por hora) Logo P(T ≥ 6) = P(X=0)= e − 1 *6 4.5 = e −1.6[. em média. se aluguem 5 barcos? Qual a probabilidade de que. em cada hora.9772 = 2. está associado a uma variável aleatória com distribuição de Poisson. sabe-se. Verificou-se que. e X: numero de avarias que ocorrem no intervalo [0. esse serviço é procurado por 8 turistas interessados em alugar barcos. Z= Logo P(X>2) = 1-0. que esse serviço funciona ininterruptamente das 8 às 20 horas. por outro lado. entre as 9 e as 11 horas. com desvio padrão 0. por hora. vem: 121 − 120 =2 0. Exercício 5 Numa praia do litoral português existe um serviço de aluguer de barcos. isto é.

.0001 = 1.16% b) Y1: nº de turistas que procuram o serviço de aluguer na 1ª hora Y2: nº de de turistas que procuram o serviço de aluguer na 2ª hora Logo Y1+Y2: nº de turistas que procuram o serviço de aluguer em 2 horas Pelo Teorema da Aditividade da Poisson..9% dos dias? c) Qual o número esperado de petroleiros a chegarem por dia? d) Qual o número mais provável de petroleiros a chegarem por dia? e) Qual o número esperado de petroleiros a serem atendidos diariamente? f) Qual o número esperado de petroleiros que recorrerão a outros portos diariamente? Resolução X: nº de petroleiros que chegam diariamente a uma certa refinaria X segue Po (2) Capacidade máxima de atendimento da refinaria: 3 petroleiros/dia Estatística Aplicada 69 .. 3 petroleiros por dia. a) Qual a probabilidade de. os restantes que eventualmente apareçam deverão seguir para outro porto. no máximo. considerando Y1 e Y2 independentes e que todas seguem Po(8). ser preciso mandar petroleiros para outro porto? b) De quanto deveriam ser aumentadas as instalações de forma a assegurar cais a todos os petroleiros em 99. + 0.. o cais da refinaria pode atender. vem que: Z=Y1+Y2 segue Po(2*8=16) Logo P(Z>25) = f(26) +.32% Exercício 6 O número de navios petroleiros que chegam diariamente a certa refinaria é uma variável com distribuição de Poisson de parâmetro 2. + f(33) = 0.Manual de Exercícios Resolução X: nº de turistas que procuram o serviço de aluguer de barcos por hora X segue Po(λ=8) a) Na tabela da Po(λ=8) vem P(X=5) = 9. Atingido este número. Nas actuais condições. num qualquer dia.0057 + .

.782 São atendidos.1.3233 E(Y) = 0*0.6767 = 0. 2. em média.3233 = 1.1. p = P(X>3) = 0.85%. 4.2707 g(3) = P(X=3) = 1 – P(X<3) = 1 – P(X ≤ 2) = 1 – 0. 2.30) W segue Bi (n = 30. 3. pg..Manual de Exercícios a) P(X>3) = 1 – P(X ≤ 3) = 1 – F(3) = 1 – 0. com probabilidade 27.1.2707 g(2) = P(X=2) = 0.1. entre 0 e 1 petroleiro por dia g) W: nº de dias em que é preciso mandar petroleiros para outro porto num mês de 30 dias (0. 3) g(0) = P(X=0) = 0. a) Qual o consumo teórico que lhe é mensalmente debitado? b) 1. 2.1353 + … + 3*0. entre 1 e 2 petroleiros diariamente f) Z: nº de petroleiros que recorrem diariamente a outros portos (0. em média. 6) Logo.E(Y) = 2 .1429 = 4.8571 =14.29% (tab. 5. Suponha um cliente cujo consumo por mês segue lei normal de média 400 kwh e desvio-padrão 40 kwh..1353 g(1) = P(X=1) = 0.218 Recorrem a outros portos.07% e) Y: nº de petroleiros que são atendidos diariamente numa certa refinaria (0. Qual a distribuição do consumo efectivo durante 3 meses? Estatística Aplicada 70 .14) b) Nº máximo de petroleiros que podem chegar: 9 (informação da tabela) Logo.1429) E(W) = 30*0.3 Em média. Z = X .782 = 0. a capacidade devia aumentar em 6 petroleiros/dia (9-3) c) E(X) = 2 d) X = 1 ou X = 2.Y E(Z) = E(X -Y) = E(X) . é preciso enviar petroleiros para outro porto 4 a 5 dias/mês Exercício 7 Os Serviços Municipalizados de Gás e Electricidade debitam mensalemnte aos seus clientes um consumo teórico T de energia eléctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30.

o consumo teórico exceda o efectivo em mais de 100 kwh? Resolução X: consumo efectivo de energia eléctrica de um cliente por mês (em kwh) T: consumo teórico (valor fixo) debitado ao cliente por mês (em kwh) T: P(X>T) = 0.Manual de Exercícios 2. A cadeia A opera a um ritmo médio de 2 montagens por hora.3085 ⇔ P( P(N(0.1)< = P(N(0. Admitindo que o número de montagens efectuadas por hora em ambas as cadeias é uma v.a.3085 ⇔ 40 40 T − 400 T − 400 ) = 0.1)<-0. N(1200. P(3*420-Y > 100) = P(Y < 1160) = P(N(0.3085 X segue N(400. Poisson. 1600).1% 1160 − 1200 )= 4800 X − 400 T − 400 > ) = 0.1) ≤ b) 1. ao fim de 3 meses. 4800) 2.58) = 28. Qual a probabilidade de que. isto é. considerando X1. X2 e X3 independentes e que todas seguem N(400.71%. com funcionamento independente. X1: consumo efectivo de energia eléctrica de um cliente no 1º mês (em kwh) X2: consumo efectivo de energia eléctrica de um cliente no 2º mês (em kwh) X3: consumo efectivo de energia eléctrica de um cliente no 3º mês (em kwh) Logo X1+X2+X3: consumo efectivo de energia eléctrica em 3 meses (em kwh) Pelo Teorema da Aditividade da Normal.5 ⇔ T = 420 40 40 Exercício 8 Num determinado processo de fabrico. 1600*3). vem que: Y=X1+X2+X3 segue N(400*3.6915 ⇔ = 0. 1600) a) P(X>T) = 0. existem 2 cadeias de montagem A e B. determine: a) a probabilidade de se efectuarem mais de 6 montagens numa hora com a cadeia B Estatística Aplicada 71 . e a probabilidade da cadeia B efectuar pelo menos uma montagem numa hora é de 98.

vem que: Z=Y1+Y2+Y3 segue Po(4*3=12) P(Z ≤ 10) = f(0) + f(1) +. Na tabela da Po(4).Manual de Exercícios b) a probabilidade de. considerando Y1.8893=11.07% b) Y1: nº de montagens da cadeia B na 1ª hora Y2: nº de montagens da cadeia B na 2ª hora Y3: nº de montagens da cadeia B na 3ª hora Logo Y1+Y2+Y3: nº de montagens da cadeia B em 3 horas Pelo Teorema da Aditividade da Poisson.0183 + 0. a cadeia A efectuar o dobro de montagens de B d) o número médio de montagens efectuadas num dia de trabalho de 8 horas com ambas as cadeiras Resolução X: nº de montagens da cadeia A por hora Y: nº de montagens da cadeia B por hora X segue Po(2) a) Y segue Poisson. + f(10) = 0 + 0.9817.72% c) P(X=2Y) = P(X=0 ∩ Y=0) + P(X=2 ∩ Y=1) + P(X=4 ∩ Y=2) + P(X=6 ∩ Y=3) + P(X=8 ∩ Y=4) = 0. numa hora. percorrendo as linhas de valor = 0. mas desconhece-se a média (=parâmetro λ) No entanto.0183 Na tabela da Poisson.0183 pode ser encontrado no cruzamento da linha 0 com a coluna 4.8% d) W: nº de montagens das 2 cadeias num dia de trabalho de 8 horas W= 8 i =1 ( X i + Yi ) onde Xi + Yi corresponde ao nº de montagens das 2 cadeias por hora Estatística Aplicada 72 .0001 + … + 0.0753 + 0.012*0. Logo.0009*0.1954 + 0. vem que o valor 0. Y2 e Y3 independentes e que todas seguem Po(4).1954 = 3. se efectuarem no máximo 10 montagens com a cadeia B c) a probabilidade de. em 3 horas de trabalho. λ = 4. como se sabe que P(Y ≥ 1) = 0.9817 = 0..2707*0.0902*0. vem que P(Y<1) = 1 – 0.1465 + 0.1048 = 34. P(Y>6) = 1–P(Y ≤ 6) = 1–F(6) = 1-0..1353*0.

01) a) 1. Nestas condições. num volume que contém 20.01*0. E Z .79% b) 1.8179 = 16. P(X=0) = 0. Crit.Manual de Exercícios Pelo Teorema da Aditividade de Poisson. p=P(X=0)+P(X=1)= 0.010*0.8179+0.1652 = 0. P(X=1) = 20*0.9920 = 81.9831) Logo E(Y) = 20*0. maço é aproveitável se não contiver cigarros defeituosos 2.36 2.9831 = 19. segue Po(6*8=48) Logo. p=0. sendo as variáveis independentes e seguindo Po(2) e Po(4) respectivamente. vem que Xi + Yi segue também Po(2+4=6). Crit.8179) Logo E(Y) = 20*0. Exercício 9 Uma companhia de tabacos recebeu em dada altura um elevado número de queixas quanto à qualidade dos cigarros de certa marca que comercializa. a companhia espera poder aproveitar se utilizar o critério: 1. maço é aproveitável se contiver no máximo 1 cigarro defeituoso Resolução X: nº de cigarros com filtro defeituoso em 20 cigarros de um maço X segue Bi(n=20.66 Estatística Aplicada 73 . 2: maço é aproveitável se contiver no máximo 1 cigarro defeituoso Y: nº de maços aproveitáveis num volume que contem 20 maços Y segue Bi(n=20. constata-se que 1% dos filtros que compõem o cigarro saem defeituosos. conter 0 cigarros com filtro defeituoso b) o número de maços que. determine: a) a probabilidade de um maço acabado de formar 1. Numa rápida análise às condições de produção. conter 1 cigarro com filtro defeituoso 2. o número médio de montagens efectuado pelas 2 cadeias num dia de trabalho de 8 horas é de 48.52% 2. também pelo mesmo Teorema. 1: maço é aproveitável se não contiver cigarros defeituosos Y: nº de maços aproveitáveis num volume que contem 20 maços Y segue Bi(n=20. p=P(X=0) = 0.9919 = 16.

475 + 0.975 0. Uma peça defeituosa se o seu comprimento diferir do valor médio mais do que σ.392 σ )= =θ( σ ) − θ (0) = 0.5% têm comprimento entre 0.25<X<0.05 < X < 0.1) < 0.642) = 47. Resolução X: comprimento das peças produzidas por uma máquina X segue N(µ. σ2) Peça defeituosa se X>µ + σ ou se X< µ .45) – P(X<0. E como σ tem que ser =0.5% a) Como P(X<0. vem que θ ( σ Na tabela 3B da Normal.a.σ P(X<0.25 σ < 0.2 74 θ( Estatística Aplicada . vem que σ b) P(peça não defeituosa) = P(µ .σ < X < µ + σ) = P(0.25 P(0. logo µ = 0.2 Sendo θ (0)=0.45) = P(X<0.05 − 0.45 − 0.25 mm e 0.642 mm.2 0.25 − µ σ 0. b) Determine a probabilidade de uma peça não ser defeituosa.392 ) = 0. a) Calcule a média e o desvio-padrão do comprimento das peças. Sabemos que 50% das peças produzidas têm comprimento inferior a 0.25 ) −θ ( ) = θ (1) − θ (−1) = D (1) = 84.25 − 0.25 σ ) = P (0 < N (0.392 = 1.392 < X − 0.5.13% 0.25 − µ ) = 50% Na tabela.25 0.96 e logo σ = 0. Normal com média µ e variância σ2.05) = 0.25) = 50% vem que P( X −µ σ < 0.642) = 47.25<X<0.5 = 0.25 σ 0.5% vem que P( 0.Manual de Exercícios Exercício 10 O comprimento das peças produzidas por uma máquina é uma v.25 mm e 47.475 0.642 − 0.25) = 50% P(0.

2. 8 doentes em 20.19. Põe-se à prova um novo medicamento. 0.03%. ministrando-o a um grupo de 20 doentes.F(7) = 41.. considerando X1 e X2 independentes e que ambas seguem Po(4). por cada período de 5 minutos. Estatística Aplicada 75 . em média.. pelo menos. 20) n=20 p=0. que eleva a probabilidade de cura para 40%. Calcule a probabilidade de se concluir pela ineficácia do medicamento.Manual de Exercícios Exercício 11 Sabe-se que a probabilidade de cura de uma certa doença é 20%. Um empregado entra ao serviço às 8 horas. Resolução X: número de doentes curados no grupo de 20 a que é ministrado o novo medicamento (0. ainda que este eleve de facto a probabilidade de cura para 40%. vem que X1+X2 também segue Po(4+4=8) Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0.6 X segue Bi (20. 4 veículos a determinado posto abastecedor de combustíveis. Qual a probabilidade de ter de aguardar mais de 10 minutos até à chegada de um veículo? Resolução X: nº de veículos que chegam ao posto abastecedor por período de 5 minutos X segue Po(4) Se X1: nº de veículos que chegam ao posto no 1º período de 5 minutos X2: nº de veículos que chegam ao posto no 2º período de 5 minutos então X1+X2: nº de veículos que chegam ao posto abastecedor em 10 minutos Pelo Teorema da Aditividade de Poisson.4) P(X ≥ 8)=1.1.4 q=1-p=0. chegam.58% Exercício 12 Sabe-se por via experimental que. Admite-se que o medicamento é eficaz no caso de contribuir para a cura de.

se nos fosse possível observar um número infinito de amostras. dentro das normas de qualidade exigíveis. para cada amostra de dimensão n recolhida. como retirar conclusões? Como garantir algum nível de rigor? O método a estudar neste capítulo – a estimação por intervalos – permite. seja possível inferir entre que valores varia o peso médio com um grau de confiança ou probabilidade elevado. a estimativa do parâmetro assumiria valores distintos. Estimação por intervalos Conhecendo-se uma amostra em concreto. é até provável que não coincida e. Na impossibilidade de medição do peso de todos os pacotes. a partir da recolha de uma única amostra. Então. por exemplo. aferir entre que valores seria de esperar que variasse o parâmetro de interesse se nos empenhássemos a recolher um número infinito de amostras. a partir da observação de uma única amostra. se recolhermos outro conjunto idêntico de pacotes.92 kg e 1. a estatística permite que. é possível calcular o peso médio de acordo com as técnicas de estatística descritiva apreendidas atrás. Caberia depois à empresa julgar se esses seriam ou não valores aceitáveis e proceder aos eventuais reajustes necessários. permitir afirmar que seria altamente provável que o peso dos pacotes produzidos estivesse a variar entre 0. tal significa que. Isto é. Assim. este método poderia. em média. Isto é. suponhamos que numa fábrica produtora de açúcar se pretende averiguar se o peso dos pacotes produzidos está. 95% ou 99% de confiança). o valor seja diferente. E esse resultado tem um determinado nível de confiança associado: por exemplo. por exemplo. caso o valor amostral fosse de 1. De facto. Estatística Aplicada 76 . ao recolher um determinado número de pacotes da produção total aleatoriamente. Por exemplo. pela morosidade e dispêndio de recursos que tal implicaria. Claro que nada nos garante que esse valor coincide com o valor do parâmetro da população em estudo. o intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais usualmente utilizados são 90%. mais.Manual de Exercícios 3.02 kg.4. é possível estimar os valores dos seus parâmetros caracterizadores através de métodos probabilísticos.12 kg. se dissermos que o nível de confiança ou certeza implicado é de 95%.

vão considerar-se apenas exemplos relativos a amostras de grande dimensão (na prática. σ n ) Uma vez que apenas se encontra tabelada a distribuição N(0. é fácil concluir que a sua especificação implica conhecer: o estimador do parâmetro em causa a sua distribuição de probabilidade uma estimativa particular daquele parâmetro Como parâmetros de interesse e para efeitos de exemplificação. torna-se necessário calcular a variável reduzida correspondente: Z= X −µ σ ∩ N (0. se fosse possível observar todo o universo de dados (n= ∞ ).Manual de Exercícios A partir do conceito de intervalo de confiança para um parâmetro.1) n Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a média µ de uma população normal: X −c σ n . a distribuição deste estimador será: X ∩ N (µ . Para efeitos de simplificação. vão considerar-se duas tipologias de intervalo: o intervalo de confiança para a média de uma população normal e o intervalo de confiança para a proporção de uma população binomial. menor a amplitude do intervalo. n ≥ 100) (i) Intervalo de confiança para a média µ de uma população normal Seja X (média amostral) o estimador da média da população. Este resultado explica-se facilmente: no limite. em torno do valor do estimador. Esse intervalo de variação depende: - da dimensão da amostra (n): quanto maior a dimensão da amostra.X +c σ n Isto é.1). é definido um intervalo de variação onde é possível afirmar que o parâmetro a estimar está contido com um grau de confiança δ . Estatística Aplicada 77 . o valor amostral calculado corresponderia ao valor da população. Porque a distribuição é Normal.

para que aumente a confiança de que o valor do parâmetro a estimar está contido no intervalo.∞ a + ∞ a confiança seria total ou 100%). o desvio . p(1 − p ) ) n Estatística Aplicada 78 . O valor crítico reflecte o nível de confiança adoptado. Sendo a amostra de grande dimensão.padrão é uma medida que caracteriza a dispersão da distribuição. - do valor crítico (c): quanto maior o valor c. maior a amplitude do intervalo.padrão corrigido da amostra. Quanto maior o seu valor. maior a variabilidade apresentada pelos dados. da seguinte forma: P ( −c ≤ Z ≤ c ) = δ já que assim é possível definir a fórmula geral do intervalo. tal que: X −c s' n . a distribuição deste estimador será: ˆ p ∩ N ( p. maior a amplitude do intervalo. maior. µ : P (−c ≤ X −µ σ ≤ c) = δ ⇔ P( X − c σ n ≤ µ ≤ X −c σ n )=δ n Se o desvio . naturalmente.Manual de Exercícios - do desvio . Naturalmente. utiliza-se este intervalo considerando-se como estimativa de σ o desvio . ou seja. resolvendo a inequação em ordem ao parâmetro.X +c s' n (ii) Intervalo de confiança para a proporção p de uma população binomial ˆ Seja p (proporção amostral ou frequência observada na amostra) o estimador da proporção p de uma população binomial. É possível encontrar o valor c na tabela da normal (pois esta é a lei do estimador). a sua amplitude deve aumentar também (no limite. Como se sabe. se o intervalo se alongasse de .padrão da população fôr desconhecido.padrão da população ( σ ): quanto maior o desvio .padrão. s’= ( xi − x ) 2 n −1 . sendo natural que a margem de variação de prever em torno do valor amostral recolhido seja também.

Por outro lado. torna-se necessário calcular a variável reduzida correspondente: Z= ˆ p− p p (1 − p ) n ∩ N (0. embora o resultado perca alguma precisão.Manual de Exercícios Uma vez que apenas se encontra tabelada a distribuição N(0.1) Esta variável permitirá deduzir a fórmula geral do intervalo de confiança para a proporção p de uma população binomial: ˆ p−c ˆ ˆ ˆ ˆ p (1 − p ) p (1 − p ) ˆ . a precisão da estimação diminui. 1: “Tenho a sensação que as pautas serão afixadas durante a manhã” Afirm.1). Exemplo: Consideremos 3 afirmações de alunos que aguardam a saída das pautas de um exame de Estatística: Afirm. No entanto. como tal. se uma maior confiança é pretendida na estimação. esta conduz a possibilidades de erro maiores. pretende-se que o resultado possua o máximo de confiança possível. se um intervalo de confiança tem uma amplitude demasiado grande. se se permitir que o erro diminua. os extremos do intervalo aumentam. se tem que permitir que a possibilidade de erro aumente. 3: “Tenho a certeza absoluta que as pautas ou são afixadas às 10h30 ou já não são afixadas hoje” Estas 3 afirmações permitem constatar facilmente que se se pretende maior confiança na estatística. Estatística Aplicada 79 .p+c n n ˆ ˆ (como estimativa de p (1 − p ) foi utilizado p (1 − p )) Como é óbvio. dado que um elevado nível de confiança conduz a um intervalo maior e. No entanto. a estimativa não tem utilidade. Cabe ao investigador gerir este “trade-off”. 2: “Tenho quase a certeza que as pautas serão afixadas entre as 10h e as 11h Afirm. há que ter em atenção que.

Manual de Exercícios

Isto leva a uma questão importante: o dimensionamento de amostras. Até aqui, sempre se assumiu que as dimensões são conhecidas à partida, sem referir como se determinam. No entanto, a resolução deste problema tem um enorme interesse prático, já que (i) recolher e tratar uma amostra demasiado grande para os resultados que se pretendem obter constitui um evidente desperdício de recursos e (ii) recolher uma amostra cuja dimensão é insuficiente para retirar conclusões constitui um erro. A dimensão das amostras aumentará se se pretender garantir maior precisão ao intervalo e/ou maior grau de confiança. No capítulo dedicado a aplicações estatísticas, será possível ver como é possível utilizar o conceito de intervalo de confiança ao controlo estatístico de processos de qualidade.

Estatística Aplicada

80

Manual de Exercícios

INTERVALOS DE CONFIANÇA
Exercícios

Exercício 1

Suponha-se que se tem uma população normal com média µ desconhecida e desvio - padrão 3, N (µ, 9) e uma amostra de 121 observações. Deduza um intervalo de confiança para a µ com 95% de confiança.
Resolução

Para os dados deste exercício, vem:

n=121

σ =3
c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1,96 e logo
X −c

σ
n

;X +c

σ
n

= X−

1,96 x3 1,96 x3 ;X − = X − 0,535; X + 0,535 11 11

[

]

O intervalo X − 0,535; X + 0,535 contém o verdadeiro valor do parâmetro µ com probabilidade ou confiança de 95%. Conhecida uma estimativa particular daquele parâmetro, torna-se possível calcular entre que valores seria de esperar que, com 95% de confiança, variasse µ .
Exercício 2

[

]

Numa cidade pretende-se saber qual a proporção da população favorável a certa modificação de trânsito. Faz-se um inquérito a 100 pessoas, e 70 declaram-se favoráveis. Determine um intervalo de confiança a 95% para a proporção de habitantes dessa cidade favoráveis à modificação de trânsito.
Resolução

n=100
ˆ p=

70 = 0,7 100

c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1,96 e logo

Estatística Aplicada

81

Manual de Exercícios

ˆ p−c

= [0,6102;0,7898]

ˆ ˆ ˆ ˆ p (1 − p ) p (1 − p ) 0,7 x0,3 0,7 x0,3 ˆ ;p+c = 0,7 − 1,96 ;0,7 − 1,96 = n n 100 100

O intervalo [0,6102;0,7898] contém o verdadeiro valor do parâmetro p com probabilidade ou confiança de 95%. Ou seja, a proporção de habitantes favoráveis à modificação de trânsito está situada entre 61,02% e 78,98%, com probabilidade de 95%.

Exercício 3

Uma máquina fabrica cabos cuja resistência à ruptura (em kg/cm2) é uma variável com distribuição Normal de média 100 e desvio - padrão 30. Pretendese testar uma nova máquina que, segundo indicações do fabricante, produz cabos com resistência média superior. Para isso, observam-se 100 cabos fabricados pela nova máquina, que apresentam uma resistência média de 110 kg/cm2. Admita que o novo processo não altera o desvio padrão da resistência à ruptura dos cabos. a) Determine um intervalo de confiança a 95% para a resistência média à ruptura dos cabos produzidos pela nova máquina. b) Suponha que pretendíamos obter um intervalo de confiança com a mesma amplitude do anterior, mas com nível de confiança de 99%. Quantos cabos deveriam ser observados?
Resolução

a) X segue N(100; 302) n=100 e logo
X −c

x =110

σ=30

γ=95%

c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1,96

σ
n

;X +c

σ
n

= 110 −

1,96 x30 1,96 x30 ;110 − = [104,12;115,88] 10 10

Estima-se, com 95% de confiança, que a resistência média à ruptura dos cabos produzidos pela nova máquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2.

Estatística Aplicada

82

Manual de Exercícios b) Amplitude = 115.085.2 20 .576 x0.085 mg e 1.051.X +c σ n = 1.2 σ=0.1.Inf.315] Estima-se.2 mg. com 99% de confiança. observando-se um valor médio de 1. com probabilidade 95%.315 mg. entre que valores se situa o teor médio de nicotina de um cigarro.2 γ=99% c: P (−c ≤ Z ≤ c) = 99% ⇔ D (c) = 99% ⇔ c = 2. Admita-se ainda que foi recolhida uma amostra aleatória com dimensão n=25 alunos e calculada a respectiva média amostral. . Estatística Aplicada 83 .12 = 11.76 n Sendo que x =110 σ=30 c: P (−c ≤ Z ≤ c) = 99% ⇔ D (c) = 99% ⇔ c = 2.576 σ n . Sabendo que o desvio padrão do conteúdo de nicotina de um cigarro é 0. com 99% de confiança.22) n=20 e logo X −c x =1.76 Amplitude = Lim.2 20 = [1. diga.88 – 104. = ( X + c Logo 2c σ n ) -( X − c σ n ) = 2c σ n =11.1.2 − 2. Exercício 5 Admita-se que a altura dos alunos de uma escola segue distribuição Normal com variância conhecida e igual a 0.2 − 2. Defina um intervalo que.576 vem que n = 173 cabos σ Exercício 4 Uma amostra de 20 cigarros é analisada para determinar o conteúdo de nicotina.Lim. 0.2 mg. que o teor médio de nicotina de um cigarro se situa entre 1.576 x0.70m. tendo-se obtido o valor de 1. contenha o valor esperado da altura µ. Resolução X segue N(µ.Sup.

788] Estima-se. Exercício 7 O director fabril de uma empresa industrial que emprega 4000 operários emitiu um novo conjunto de normas internas de segurança. Para tanto.051) n=25 e logo X −c x =1.645 e logo ˆ p−c ˆ ˆ ˆ ˆ 0.051 25 .96 σ n .96 x 0.051 γ=95% c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1. Determine o intervalo de confiança para a referida proporção com 90% de confiança.051 25 = [1.p+c .645 = 0. que a proporção de artigos defeituosos na produção se situa entre 8.7 − 1.0.1. Resolução n=1600 ˆ p =10% c: P (−c ≤ Z ≤ c) = 90% ⇔ D (c) = 90% ⇔ c = 1.645 = 1600 1600 n n = [0. colhe-se uma amostra de dimensão suficientemente grande (1600 artigos).1 − 1. que o teor médio de nicotina de um cigarro se situa entre 1.1.0.1 − 1. Exercício 6 Numa fábrica. com 90% de confiança. com 95% de confiança. 0.76% e 11. Construa um intervalo Estatística Aplicada 84 .2 − 1. procura conhecer-se a incidência de defeituosos na produção de uma máquina.23%.X +c σ n = 1.611. Passada uma semana.70 σ2=0.085 mg e 1.1x0.Manual de Exercícios Resolução X segue N(µ.9 p (1 − p ) p (1 − p ) ˆ .9 0.315 mg.1x0. onde 10% dos artigos são defeituosos.0876.96 x 0.1123] Estima-se. seleccionou aleatoriamente 300 operários e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa.

0.25 x0.833]. a) b) Estime a proporção de pessoas conhecedoras da marca através de um intervalo de confiança a 90%. que a proporção de operários que conheciam adequadamente o conjunto das normas se situa entre 20.25 − 1.Manual de Exercícios de confiança a 95% para a proporção de operários que conheciam adequadamente o conjunto das normas uma semana após a sua emissão.p+c = 0.9%.0.034.299] Estima-se.25 − 1.96 e logo ˆ p−c ˆ ˆ ˆ ˆ p (1 − p ) p (1 − p ) 0. calcule o nível de confiança utilizado Resolução a) n=1200 ˆ p= 960 = 0.25 x0.645 e logo Estatística Aplicada 85 .75 0. efectuou um inquérito junto de 1200 pessoas escolhidas aleatoriamente.75 ˆ .96 .1% e 29. Se se pretender que a amplitude do intervalo de confiança da alínea anterior não seja superior a 0. Nesse sentido.96 = n n 300 300 = [0. Exercício 8 A Direcção de Marketing de uma empresa pretende conhecer a notoriedade da marca de determinado produto.8 1200 c: P (−c ≤ Z ≤ c) = 90% ⇔ D (c) = 90% ⇔ c = 1. com 95% de confiança.25 300 c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1. verificando que 960 a conheciam. qual deve ser a dimensão mínima da amostra? c) Sabendo que o intervalo de confiança determinado pela Direcção de Marketing foi [0.767. 0. Resolução n=300 ˆ p= 75 = 0.201.

estima-se que o desvio .8 − 1.576 Amplitude = 2c σ n Logo 2c σ n ≤ 60 ⇔ 2 * 2.8 x0.8 * 0.6%.2 0.8 − 1.819] ˆ ˆ ˆ ˆ p (1 − p ) p (1 − p ) 0. com 90% de confiança.645 = n n 1200 1200 Estima-se.2 = 2 *1. a que corresponde o nível de confiança utilizado Exercício 9 O gabinete de projectos de uma empresa de material de construção civil pretende estimar a tensão de ruptura do material usado num determinado tipo de tubos.9%.Manual de Exercícios ˆ p−c = [0.781. = ( p + c Logo ˆ ˆ ˆ ˆ ˆ ˆ p(1 − p) p(1 − p) p(1 − p) ˆ ) – ( p−c ) = 2c n n n 2c ˆ ˆ p(1 − p) 0. Qual o número de ensaios necessário para definir tal intervalo? Resolução n=? σ=70 γ=99% c: P (−c ≤ Z ≤ c) = 99% ⇔ D (c) = 99% ⇔ c = 2.0.86 1200 Logo 0.833 ⇔ c = 2.645 * ≤ 0.1% e 81. Com base num vasto conjunto de ensaios realizados no passado.8 x0.=Lim.1) vem igual a 99.833 n 0. pretendendo-se que a sua amplitude não exceda 60 psi.Inf.p+c = 0.2 = 0.padrão da tensão de ruptura do material em causa é de 70 psi.Sup. Deseja-se definir um intervalo de confiança a 99% para o valor esperado da tensão de ruptura.2 ˆ . que a proporção de indivíduos conhecedores da marca se situa entre 78.034 ⇔ n ≥ 1499 n n ˆ c) p + c ˆ ˆ p(1 − p) = 0.8 + c E D(2.0.-Lim.8 * 0.576 * 70 n ≤ 60 ⇔ n ≥ 36 Estatística Aplicada 86 . ˆ b) Amp.86) na tabela N(0.645 .

foram analisadas as tensões de ruptura de 10 cabos SCB-33R. Resolução X segue N(µ.5] Estima-se. a 95%.4537 − 1. para o valor esperado da tensão de ruptura dos cabos do lote em causa.58 10 .96 σ n . e em 18 foram observados alguns danos. usados por trabalhadores de uma empresa de construção civil. foram seleccionados aleatoriamente e sujeitos a um teste de impacto.5 kg/cm2. 112) n=10 e logo X −c x =4537 σ=10. Exercício 11 Uma amostra de 50 capacetes de protecção. a 95%. que é respeitada.4543.96 x10. Existe uma norma de 112 kg/cm2 em relação à variância.58 γ=95% c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1. Interprete o resultado obtido.96 e logo Estatística Aplicada 87 .96 x10. para a verdadeira proporção p de capacetes que sofre danos com este teste.X +c σ n = 4537 − 1. Defina esse intervalo.5 kg/cm2 e 4543. seleccionados aleatoriamente a partir de um lote de grandes dimensões. Recentemente. que o tensão média de ruptura dos cabos se situa entre 4530. tendo sido obtida uma média de 4537 kg/cm2. Construa um intervalo de confiança. com 95% de confiança.58 10 = [4530. Resolução a) n=50 ˆ p= 18 = 0. O director comercial pretende saber qual o intervalo de confiança.36 50 c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1.Manual de Exercícios Exercício 10 A empresa SCB controla regularmente a resistência à ruptura dos cabos por si produzidos.5.

64 ˆ .7% e 49.36 x0.36 − 1.36 − 1.= ( p + c ˆ ˆ ˆ ˆ ˆ ˆ p(1 − p) p(1 − p) p(1 − p) ˆ ) – ( p−c ) = 2c < 0. vem que: 2c ˆ ˆ p(1 − p) 0.49305] ˆ ˆ ˆ ˆ p (1 − p ) p (1 − p ) 0. isto é. com 95% de confiança.5 * 0. que a proporção amostral é 50% ( p(1 − p)' = 1 − 2 p = 0 ).p+c = 0.0.36 x0.96 = n n 50 50 Estima-se.5 = 2 * 1. que a proporção de capacetes que sofre danos se situa entre 22.22695.08 ⇔ n > 600 n n Estatística Aplicada 88 .96 Considerando que a proporção amostral é a que maximiza a amplitude (pior ˆ ˆ ˆ dos casos).96 .08 n n n c: P (−c ≤ Z ≤ c) = 95% ⇔ D (c) = 95% ⇔ c = 1.96 * < 0. de modo a garantir que um intervalo de confiança a 95% para essa proporção tenha uma amplitude não superior a 8 pontos percentuais? Resolução n=? ˆ Amp.3%.Manual de Exercícios ˆ p−c = [0.64 0. Exercício 12 Qual deve ser o número de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar a proporção de portuenses que usam óculos.0.

em vez de procurar uma estimativa ou um intervalo para um parâmetro.5. Desta forma. Uma das características do teste de hipóteses é. O objectivo é verificar se os factos observados a contradizem. A essas hipóteses chamamos hipóteses estatísticas. A hipótese a testar denomina-se. as quais geralmente se baseiam em afirmações sobre as distribuições de probabilidade das populações ou sobre alguns dos seus parâmetros. Estatística Aplicada 89 . segue uma lei normal N(600. em milímetros por ano. justamente. a partir de dados observados numa amostra. tendo por objectivo verificar. é útil formular hipóteses sobre as populações. Em ambos os casos corre-se o risco de errar. levando a optar pela hipótese alternativa H1. Certos cientistas afirmavam poder fazer aumentar o nível médio µ das chuvas em 50 mm. hipóteses essas que podem ou não ser verdadeiras. com base em amostras das mesmas (decisões estatísticas). Testes de hipóteses Todos os dias temos de tomar decisões respeitantes a determinadas populações. a validade de certas hipóteses relativas à população. a de permitir controlar ou minimizar tal risco. pois. Uma hipótese pode então ser definida como uma conjectura acerca de uma ou mais populações. O resultado do teste corresponde inevitavelmente a uma das duas respostas possíveis para cada questão: afirmativa ou negativa. utilizando depois a informação da amostra para confirmar ou rejeitar esse mesmo valor. Isto é.Manual de Exercícios 3.100). Exemplo: Registos efectuados durante vários anos permitiram estabelecer que o nível de chuvas numa determinada região. Nos testes de hipóteses. a estratégia básica seguida no método de teste de hipóteses consiste em tentar suportar a validade H1 de uma vez provada a inverosimilhança de H0. Nesta tomada de decisões. os testes de hipóteses podem considerar-se uma segunda vertente da inferência estatística. de H0 ou de hipótese nula. e ao contrário dos intervalos de confiança. O seu processo foi posto à prova e anotaram- se os valores referentes a 9 anos: 510 614 780 512 501 534 603 788 650 Que se pode concluir? Adopte um nível de significância de 5%. admite-se ou avança-se um valor hipotético para o mesmo.

por exemplo. Vamos supor uma probabilidade de erro de. logo não é possível de saber se a hipótese nula é verdadeira ou falsa. estamos a lidar com leis de probabilidades. Nesse caso. 5 chances em 100 de Estatística Aplicada 90 . é natural que envolvam alguma margem de erro e que ocorram em situação de incerteza. o investigador só estaria disposto a rejeitá-la se o resultado obtido na amostra fizesse parte de um conjunto de resultados improváveis que teriam apenas. um processo de inferência estatística onde se procuram tomar decisões sobre a população com base numa amostra. Compete ao investigador decidir qual a dose de risco de se enganar em que está disposto a incorrer. em função dos resultados de uma amostra. pode-se manter pequena a probabilidade de os cometer. portanto. mas apenas medir as probabilidades envolvidas na tomada de decisão. em que está em causa aceitar ou rejeitar a hipótese nula. no entanto. por exemplo. 5%. teste unilateral à esquerda e teste bilateral Sendo os testes de hipóteses. Estes erros não podem ser completamente evitados mas. Estas hipóteses podem formalizar-se do modo seguinte: H0: µ=600 mm H1: µ=650 mm Este é um problema clássico de teste de hipóteses. ou este aumentava de facto o nível médio das chuvas em 50 mm.Manual de Exercícios Resolução: Duas hipóteses se colocavam: ou o processo proposto pelos cientistas não produzia qualquer efeito. Ao utilizar uma amostra de uma população. e avançada a hipótese nula Ho. Podem-se definir 2 formas de especificar Ho e H1: (i) hipótese simples contra hipótese simples Ho: θ = θ0 H1: θ = θ1 (ii) hipótese simples contra hipótese composta Ho: θ = θ0 H1: θ > θ0 ou θ < θ0 ou θ ≠ θ0 Estes testes designam-se respectivamente de teste unilateral à direita.

ao conjunto de valores “improváveis” que conduzem à rejeição da hipótese nula dá-se o nome de Região Crítica. Como veremos no exemplo. Ao limite superior de risco. A formalização desta regra passa pela especificação de uma região de região de rejeição. Tal fixação corresponde à fixação da regra de decisão do teste. então. 100 9 ). Considerando Ho verdadeira vem que X ∩ N (600. isto é. a variável de decisão será X . supondo Ho verdadeira. existem também erros de 2ª espécie. Este tipo de formulação é conhecida como postura conservadora. cuja probabilidade se designa pela letra β. que na maior parte dos casos é de 10%. à probabilidade de o resultado amostral levar à rejeição de Ho. A essa região. sendo este que permite definir a condição de rejeição de Ho. Em resumo: Quadro de decisão em condição de incerteza Hipótese nula Ho Decisão Aceitar Ho Rejeitar Ho Hipótese Ho ser verdadeira: Decisão correcta (1-α) Erro de tipo I Alfa (α) Hipótese Ho ser falsa Erro de tipo II Beta (β) Decisão correcta (1-β) Como decidir? Visto que se trata de testar o valor de µ. O Nível de Significância designa-se de α e corresponde. estamos mais propensos a achar que o novo processo não tem qualquer efeito sobre o nível das chuvas (isto é. se fixe o valor a partir do qual se considera improvável a validade da hipótese nula. Ou seja. dáse o nome de Nível de Significância do teste. à partida. arriscando apenas quando houver evidências da amostra muito fortes a favor do novo. é conveniente pois que. à probabilidade de se estar a cometer aquilo a que se convenciona chamar de erro de 1ª espécie. 5% ou 1%. Estatística Aplicada 91 . Para que esta decisão possa ser tomada de uma forma controlada. isto é.Manual de Exercícios se produzir. que tudo se mantém igual) do que investir no novo processo (mudar).

05 ⇔ P ( X −µ σ > c − 600 ) = 0.2 mm. isto é. por falta de provas suficientes para não o fazer.83(3) X µ = 600 Os dados recolhidos indicavam X =610. a seguinte: - rejeitar H0 em favor de H1.83(3) conservar H0 em detrimento de H1 se fôr inferior a 654. opta-se por H1 com probabilidade 5% de se estar a cometer um erro.83(3) 3 A regra de decisão é. pelo que se opta pela seguinte regra de decisão: Se X fôr demasiado grande. grandes valores de X são improváveis. Se tal não acontecer.05 ⇔ 100 9 n ⇔ c = 600 + 1. se o valor amostral fôr superior a 654. superior a um valor crítico c que tem apenas 5 chances em 100 de ser ultrapassado. conserva-se Ho. considerar que o processo científico não produz efeitos. então. pelo que a decisão é conservar H0 . isto é. Logo.Manual de Exercícios Em princípio. sendo P(Rejeitar Ho / Ho) = α = 5%. Estatística Aplicada 92 . o conjunto de acontecimentos que levam à rejeição de H0 corresponde a todos os valores de X >654.645 x 100 = 654. RA: Região de Aceitação RR: Região Crítica ou de Rejeição RA=(1-α) RR=α 654.83(3) Isto é. isto é.83(3). a Região Crítica deste teste. vem que P ( X > c / µ = 600) = 0.

83(3) − 650 ) = P ( N (0. Isto é. os erros incorridos não se ficam apenas pelos de 1ª espécie. No entanto. então vem que: X ∩ N (650. O que na maior parte dos casos se faz é fixar o α (para amostras de dimensão n) e tentar minimizar β. Supondo então que H1 é verdadeira (µ=650 mm). Estatística Aplicada 93 . à partida parte-se do princípio que H0 é verdadeira e só se rejeitará essa hipótese se ocorrerem acontecimentos pouco prováveis. 100 9 ) RA β 1-β β RR µ = 650 X A probabilidade de rejeitar H1 erradamente. mas que. Existem também erros de 2ª espécie.1) ≤ 0. infelizmente.83(3) / µ = 650) = P ( X −µ σ ≤ n 654. o número de valores observado não permite observar resultados ou esses resultados foram insuficientes.Manual de Exercícios No entanto. isto é.14) = 55. sendo o teste ideal o que minimiza simultaneamente ambos os valores. e como α e β se referem a realidades opostas e variam em sentido contrário. de se cometer um erro de 2ª espécie. considerar que o processo científico é realmente eficaz no aumento do nível médio das chuvas. vem então igual a: P(Rejeitar H1 / H1)=β P ( X ≤ 654. tal não é possível. No entanto.57% 100 9 É através das probabilidades α e β que se procura o melhor teste de hipóteses. ou seja. é possível alternativamente partir do princípio que é H1 que é verdadeira.

dependendo do valor do parâmetro que não é fixo. Quando H1 é uma hipótese composta (>. a potência do teste é variável. em função da hipótese H1 Passo Nº 4: Fixar o nível de significância Passo Nº 5: Construir a Região Crítica em função do nível de significância Passo Nº 6: Cálculo (eventual) da potência do teste Passo Nº 7: Calcular a estatística da amostra Passo No 8: Tomar a decisão: rejeição ou não de Ho Estatística Aplicada 94 . Logo. e é complementar do erro de 2ª espécie. < ou ≠ ). Esta é uma decisão certa. Nesse caso falase em função potência do teste = 1 -β (µ1) Resumindo: passos para construção de um teste de hipóteses: Passo No 1: Formular as hipóteses nula e alternativa Passo No 2: Decidir qual estatística (estimador) será usada para julgar a Ho e a variável de decisão Passo No 3: Definir a forma da Região Crítica. logo. maior será o valor da potência do teste e. quanto menor o erro de 2ª espécie.Manual de Exercícios Região de rejeição e de aceitação da hipótese nula Unilateral à esquerda H1: µ < 600 RA Bilateral H1: µ ≠ 600 RA Unilateral à direita H1: µ > 600 RA RR α RR α/2 1−α RR α/2 1−α RR 1−α α Chama-se potência de um teste à probabilidade de rejeitar H0 quando esta é falsa. não implica erro. maior a sua qualidade (diz-se que o teste é mais potente) .

02 0.012 ) e que se conhece a seguinte amostra: 1.00 Será que.Manual de Exercícios TESTES DE HIPÓTESES Exercícios Exercício 1 Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos corresponde ao valor assinalado na embalagem. vem que P ( X < c / µ = 1) = 0.645 x c −1 ) = 0.9945 3 Logo.99 0. Logo.01 9 Estatística Aplicada 95 . para um nível de significância de 5% se pode dizer que o peso médio corresponde ao peso de 1 kg assinalado na embalagem? Resolução Passo 1 Formular as hipóteses: Ho: µ = 1 H1: µ < 1 Passo 2 A estatística a ser utilizada será a média amostral Passo 3 A região crítica é formada por todos os valores menores ou iguais a c Passo 4 Assumir um nível de significância de 5% Passo 5 Para α=5%.02 0.98 1. Suponha que X ∩ N ( µ . determinar a região de rejeição e aceitação.0.9945] ⇔ c = 1 − 1. sendo P(Rejeitar Ho / Ho) = α = 5%.01 0.01 = 0.97 1.05 ⇔ 0.98 0.05 ⇔ P ( X −µ σ < n 0.0. RC = ]− ∞. Seja X a variável que representa o peso de um pacote de arroz.97 1.

e 45% declaram-se favoráveis.9922.5 Estatística Aplicada 96 . vem: α=1% RR: Parar a produção α=5% RA: Continuar a produção -∞ 0 0.9945. Exercício 2 Numa cidade.Manual de Exercícios Passo 6 Calcular a estatística X = Passo 7 Tomar a decisão 1 9 xi = 0. Reduzindo a probabilidade de isso ocorrer de 5% para 1%. Neste caso. que de 0.9933 e é menor que o valor crítico 0.5 H1: p < 0. No entanto.9945 para 0. Estes valores contradizem a hipótese? Resolução Passo 1 Formular as hipóteses: Ho: p = 0.9933 A única mudança será no Valor Crítico. ou seja. consideraremos que não há qualquer anomalia na produção.9922 0. Faz-se um inquérito a 200 pessoas. há o risco de se mandar parar a produção para revisão do equipamento sem necessidade. aceitaremos Ho.9945 +∞ Valor da amostra: 0. pretende-se saber se metade da população é favorável à construção de um centro comercial.9933 Como o valor da amostra foi 0. considera-se que o arroz contido em cada pacote era inferior ao indicado. rejeita-se Ho Ou seja.

5(1 − 0. vem que ˆ P ( p < c / p = 0.442] Passo 7 Como o valor amostral 0. Estatística Aplicada 97 . onde o cuidado deve ser trabalhar com grandes amostras. sendo P(Rejeitar Ho / Ho) = α = 5%. apesar de apenas 45% dos habitantes se terem manifestado a favor da construção do centro comercial.0.05 ⇔ ⇔ c = 0. não se rejeita Ho RR: Não construir o centro comercial RR: Parar a construção α=5% RA: Decidir pela construção -∞ 0 +∞ Valor amostral: 0.Manual de Exercícios Passo 2 A estatística a ser utilizada será a proporção amostral.5) = 0.5 0.442.645 x Passo 6 ˆ p =0.5(1 − 0.5) 200 ) = 0.5 − 1. RC = ]− ∞.45 é maior que o valor crítico 0. Logo.45 0. Passo 3 A região crítica é formada por todos os valores menores ou iguais a c Passo 4 Assumir um nível de significância de 5% Passo 5 Para α=5%.442 Ou seja. determinar a região de rejeição e aceitação. essa margem não é suficiente para decidir deixar de o construir.442 200 Logo.05 ⇔ P ( ˆ p− p p (1 − p ) n < c − 0.45 0.5) = 0.

pode concluir-se que a campanha surtiu efeito? b) Em caso negativo.01 ⇔ P ( X −µ c −1 c −1 ) = 0. realiza-se um mini-inquérito junto de 100 cidadãos com mais de 18 anos. Pode-se afirmar. não pertence à região crítica.01 0.998 α = 1% H0: µ = 1 H1: µ < 1 P(Rejeitar Ho/Ho verdadeira) = α = 1% P ( X ≤ c / µ = 1) = 0. Da produção de determinado dia é retirada uma amostra de 49 pacotes.326 ⇔ c = 0. produzidos por uma fábrica.997. a um nível de significância de 1%.01. logo não se rejeita Ho a um nível de significância de 1% (não se pode afirmar que o peso médio não esteja de acordo com o indicado). 0. com peso médio de 0.997 0. Exercício 4 Numa região onde existem entre os maiores de 18 anos 50% de fumadores.012) n = 49 x = 0. com desvio padrão 0.01 ⇔ = −2.998 > c = 0.998 Kg. registando-se 45 fumadores. Ao fim de três meses. que o peso médio dos pacotes de farinha nesse dia não está de acordo com o peso indicado? Resolução X segue N(µ. é lançada uma intensa campanha anti-tabaco. a) Com 1% de significância.Manual de Exercícios Exercício 3 O peso dos pacotes de farinha de 1 kg. qual seria a dimensão da amostra a partir da qual aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em vista? Estatística Aplicada 98 .01 σ ≤ n 49 49 Como x = 0. é uma variável normalmente distribuída.

5 * 0.5 ≤ ) = 0.5 * 0.45 α = 1% H0: p = 0.45 − 0.384 ˆ Como p = 0.45 > c = 0. com desvio-padrão de 20 horas.Manual de Exercícios Resolução a) n = 100 ˆ p = 0.5 (a campanha não surtiu efeito) H1: p < 0.5 n n ⇔ 0.5 * 0. poder-se-á concluir.01 ⇔ p(1 − p) 0.5 100 = −2.5) = 0.5 * 0. b) P( X ≤ 0.5 n Exercício 5 Um fabricante afirma que o tempo médio de vida de um certo tipo de bateria é de 240 horas.01 ⇔ P ( ˆ p− p p (1 − p ) n ≤ c − 0.01 ⇔ c − 0.5 0. que as especificações não estão a ser cumpridas? Estatística Aplicada 99 .45 / p = 0. Uma amostra de 18 baterias forneceu os seguintes valores: 237 242 244 262 225 218 242 248 243 234 236 228 232 230 254 220 232 240 Supondo que o tempo de vida das baterias se distribui normalmente.326 ⇔ n = 541 0.01 ⇔ P( ˆ p− p 0. logo não se rejeita Ho a um nível de significância de 1% (a campanha não surtiu efeito). a 5% de significância.5 = −2.326 ⇔ c = 0.5) = 0. não pertence à região crítica.45 − 0.5 (a campanha surtiu efeito) P(Rejeitar Ho/Ho verdadeira) = α = 1% P ( X ≤ c / p = 0.384.5 100 ) = 0.5 0.

645 ⇔ c = 232. Foram registadas 5 medidas de temperatura de fornos regulados para 600º. A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador.25. fornos controlados por termóstatos para manter a temperatura no interior dos fornos a 600 graus centígrados. logo não se rejeita Ho a um nível de significância de 1% (não se pode afirmar que as especificações não estão a ser cumpridas). não pertence à região crítica. poder-se-á concluir que a temperatura não se afasta significativamente do valor desejado? Resolução X segue N(µ.05 ⇔ = −1. A experiência tem demonstrado que a variância dos valores da temperatura no interior desses fornos é de 360.Manual de Exercícios Resolução X segue N(µ.05 ⇔ P ( X −µ c − 240 c − 240 ) = 0.360) n=5 Estatística Aplicada 100 . Exercício 6 Uma empresa de cerâmica tem. que é anunciado como garantindo que as temperaturas se mantêm dentro do limite desejado. em dada secção.05 α = 5% H0: µ = 240 H1: µ < 240 P(Rejeitar Ho/Ho verdadeira) = α = 1% P ( X ≤ c / µ = 240) = 0.05 > c = 232. 202) n = 18 1 18 x = xi = 237.25 20 20 σ ≤ n 18 18 Como x = 237. utilizando novos controladores: 620º 595º 585º 602º 608º Para 5% de significância.

Teste. b) Qual o nível de significância a partir do qual a conclusão seria diferente? Resolução a) X segue N(µ. ou se. logo não se rejeita Ho a um nível de significância de 1% (a temperatura não se afasta significativamente do valor desejado). Exercício 7 O peso dos ovos de chocolate produzidos numa fábrica segue distribuição normal com variância 90. a) O fabricante diz que o peso médio é de 160 g.97 5 n Como x = 602 < c = 613.25) n = 100 x = 158. Foi recolhida uma amostra de 100 ovos.25.96 18.645 ⇔ c = 613. pelo contrário.96.95 ⇔ c − 600 = 1.05 ⇔ P( X −µ σ ≤ c − 600 360 5 ) = 0. 437 g. se a afirmação do fabricante pode ser considerada verdadeira. 90. o verdadeiro peso dos ovos será menor.437 α = 1% H0: µ = 160 H1: µ < 160 P(Rejeitar Ho/Ho verdadeira) = α = 1% Estatística Aplicada 101 .Manual de Exercícios x = 1 5 xi = 602 α = 5% H0: µ = 600 H1: µ > 600 P(Rejeitar Ho/Ho verdadeira) = α = 5% P( X ≥ c / µ = 600) = 0. não pertence à região crítica. cujo peso médio foi de 158. a um nível de significância de 1%.

5535. por hábito.6 * 0. 55% declararam adquirir. logo rejeita-se Ho a um nível de significância de 1% (o semanário não atingiu a projecção que reclama). até então nunca atingida por qualquer semanário. pertence à região crítica.437 > c = 157.79 9. de 60% de leitores que regularmente compram um jornal desse tipo.79. b) P ( X ≤ 158. Estatística Aplicada 102 .01 ⇔ c − 0.25 100 ) = α ⇔ F (−1.326 ⇔ c = 0.4 600 ) = 0.Manual de Exercícios P ( X ≤ c / µ = 160) = 0.55 < c = 0. numa região.6 0.01 ⇔ c −1 = −2.6 H1: p < 0.25 100 ) = 0.645) = α ⇔ α = 5% n Exercício 8 Um jornal semanário afirma ter atingido.437 / µ = 160) = α ⇔ P ( X −µ σ ≤ 158.437 − 160 90.5 n 100 Como x = 158.326 ⇔ c = 157. Resolução n = 600 H0: p = 0.01 ⇔ P ( ˆ p− p p (1 − p ) n ≤ c − 0. não pertence à região crítica.6 * 0.4 600 = −2.01 ⇔ P ( X −µ σ ≤ c − 160 90.6 ˆ p = 0. Efectuando um inquérito junto de 600 leitores.55 α = 1% P(Rejeitar Ho/Ho verdadeira) = α = 1% P ( X ≤ c / p = 0. pronuncie-se quanto à projecção que o semanário reclama. o semanário em causa. logo não se rejeita Ho a um nível de significância de 1% (a afirmação do fabricante pode ser considerada verdadeira). Adoptando um nível de significância de 1%.6) = 0. a percentagem.5535 ˆ Como p = 0.6 0.

95 kg/cm2.0625 (kg/cm2)2. admitindo que o valor esperado da resistência à 2 compressão das peças produzidas recentemente é de 4.18 > c = 5.9) = P ( X −µ σ > 5.0625 12 ) = 0.6% n Estatística Aplicada 103 .05 ⇔ n 12 Como x = 5.18 c − 5.25 σ ≤ 0.0625) n = 12 x = 4.18 = −1.90 kg/cm ? Resolução a) X segue N(µ. que as peças produzidas recentemente são menos resistentes do que o habitual? b) Qual a potência do teste efectuado anteriormente.18 kg/cm2 e variância 0. não pertence à região crítica.061 − 4.01) = 1 − 0. 0.061. a um nível de significância de 5%.0625 12 ) = 1 − F (0. tendo-se obtido para a resistência média à compressão o valor de 4.18) = 0. a) Poder-se-á afirmar.645 ⇔ c = 5.061 0. As últimas 12 peças produzidas nesse molde foram recolhidas e ensaiadas. b) Potência = 1-β β = (Conservar Ho/H1 verdadeira) P ( X > 5.Manual de Exercícios Exercício 9 Um molde de injecção tem produzido peças de um determinado material isolante térmico com uma resistência à compressão com valor esperado de 5.5040 = 49.05 ⇔ P ( X −µ c − 5.061 / µ = 4.95 α = 5% H0: µ = 5.9 0.18 H1: µ < 5. logo não se rejeita Ho a um nível de significância de 1% (as peças produzidas recentemente não são menos resistentes do que o habitual).18 P(Rejeitar Ho/Ho verdadeira) = α = 5% P ( X ≤ c / µ = 5.

Manual de Exercícios

Exercício 10

Um jornal desportivo noticiou que o número de espectadores de um programa desportivo que é apresentado na televisão aos domingos à noite está igualmente dividido entre homens e mulheres. De uma amostra aleatória de 400 pessoas que vêem regularmente o referido programa, concluiu-se que 240 são homens. Pode-se concluir, para um nível de significância de 10%, que a notícia é falsa?
Resolução

n = 400 H0: p = 0,5 H1: p > 0,5

ˆ p = 0,6

α = 10%

P(Rejeitar Ho/Ho verdadeira) = α = 10%
P ( X ≥ c / p = 0,5) = 0,1 ⇔ P (

ˆ p− p
p (1 − p ) n

c − 0,5

0,5 * 0,5 400

) = 0,9 ⇔

c − 0,5

0,5 * 0,5 400

= 1,282 ⇔ c = 0,53205

ˆ Como p = 0,6 > c = 0,53205, pertence à região crítica, logo rejeita-se Ho a um

nível de significância de 1% (a notícia é falsa).

Estatística Aplicada

104

Manual de Exercícios

3.6. Aplicações estatísticas
Fiabilidade de componentes e sistemas 3.6.1 Conceito de fiabilidade

Define-se fiabilidade como sendo a probabilidade de um sistema (ou componente) desempenhar a função para a qual foi concebido, nas condições previstas e nos intervalos de tempo em que tal é exigido. A análise da fiabilidade será, então, um método de quantificar o que se espera que aconteça e pode ser usada para indicar méritos relativos de sistemas, tendo em atenção um pré-definido nível de fiabilidade. A fiabilidade de um componente pode ser obtida a partir da sua taxa de avarias. Se um sistema fôr constituído por vários componentes, então a fiabilidade será dependente da fiabilidade dos componentes que compõem esse mesmo sistema. É necessário, quando se apresentam os resultados de um estudo de fiabilidade saber expô-los, pois os interpretadores poderão não ter a noção daquilo que se está a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou componente é de 0,998 pode não significar muito; no entanto, se tal facto fôr traduzido em que, por ano, o sistema em questão estará fora de serviço por avaria num período de 9 horas já significa alguma coisa. Como o estudo da fiabilidade se trata de um estudo extremamente importante, pois que muitas vezes estão em jogo vidas humanas, é importante desenvolver um estudo de probabilidade relativo ao funcionamento adequado de um componente ou sistema.

3.6.2 Fiabilidade de um sistema

Ao analisar a fiabilidade de um sistema constituído por vários componentes, é necessário estudar a fiabilidade desses componentes e a forma como estão ligados (estrutura do sistema e definição do funcionamento do sistema). De seguida, são apresentados 3 casos: (i) as associações de componentes em

Estatística Aplicada

105

Manual de Exercícios

paralelo; (ii) a associação de n unidades idênticas em paralelo em que é apenas necessário o funcionamento de m (m<=n) para o sistema funcionar; (iii) e as associações em série.

(i) Associação em paralelo

Consideremos vários componentes redundantes e independentes:

1

2

3

4

Uma vez que os componentes são redundantes, basta apenas um para que o sistema funcione. Considerando um sistema composto por apenas 2 componentes, se cada um dos componentes estiver no seu período de vida útil, a fiabilidade do sistema (Rs) é dada por: Rs = P (funcionar pelo menos um componente) = P (funcionarem 1 ou 2 componentes) = 1 – P (não funcionar nenhum) = 1 – P (não funcionar comp.1 e não funcionar comp.2) = 1 - P (não funcionar comp.1) x P(não funcionar comp.2) pois o funcionamento é independente = 1 – q1 x q2 onde q1 e q2 são, respectivamente as indisponibilidades (isto é, as probabilidades de não funcionamento) das componentes 1 e 2. Se houver n componentes ligadas em paralelo, a fiabilidade do sistema é dada por Rs = 1 - q1 x q2 x q3 x … x qn = 1 -

∏q
i

i

Estatística Aplicada

106

no caso de sistemas redundantes. a fiabilidade do sistema funcionar pode ser calculada recorrendo à lei binomial. 3 ou 4 componentes. (ii) Associação em paralelo de componentes não redundantes Se o sistema não fôr redundante. as condições de funcionamento e de avaria para o sistema têm de ser definidos. se todos os componentes tivessem fiabilidade 0. vem: Rs = P(pelo menos 3 componentes a funcionar) = P(funcionarem as 4) + P (funcionarem 3) 4 = C 4 p 4 q 4− 4 + C 34 p 3 q 4−3 = p 4 + 4 p3q Por exemplo. a probabilidade associada a cada um dos estados possíveis (1. para um nº mínimo de 3 componentes necessárias.9 (p=0. por exemplo. vai considerar-se de novo um sistema composto por quatro componentes em paralelo. com probabilidade de funcionamento p e de indisponibilidade q. Para o efeito. é necessário saber qual o número mínimo de componentes que necessitam de estar em funcionamento para que o sistema sobreviva. Estatística Aplicada 107 .Manual de Exercícios Veja-se que. Se as componentes forem todas iguais. isto é. a funcionar). a fiabilidade do sistema aumenta à medida que aumenta o número de componentes ligadas ao sistema (que representam como garantias de funcionamento adicionais).9). 2. então a fiabilidade de um sistema deste tipo seria 94.77%. no mínimo. a fiabilidade do sistema é dada pelo quadro seguinte: Nº mínimo de componentes necessárias ao funcionamento do sistema 4 3 2 1 Probabilidade de o sistema funcionar p4 p4 + 4p3q 4 p + 4p3q + 6p2q2 p4 + 4p3q + 6p2q2 + 4pq3 Ou seja. Assim.

1 2 3 No caso mais vulgar de os componentes serem independentes. Assim. Estatística Aplicada 108 . a fiabilidade do sistema é dada por Rs = p1 x p2 x p3 x . já que a probabilidade de um componente sobreviver até ao instante t é dada por e − λt A probabilidade de avariar até ao instante t é dada por 1 − e − λt Num sistema com várias componentes em série. em que o componente se encontra a funcionar no seu período de vida útil. terão que ser analisadas técnicas mais gerais. O método consiste basicamente em identificar todos os modos possíveis de avaria e controlá-los.Manual de Exercícios (iii) Associação em série Quando os componentes se encontram associados em série. para que o sistema funcione torna-se necessário que todos os componentes se encontrem em bom estado de funcionamento. supondo que se pretende analisar a fiabilidade da iluminação de uma sala com uma lâmpada. tais como a árvore de avarias... x pn No caso de todas as componentes serem iguais Rs = pn Facilmente se depreende que a fiabilidade do sistema diminui à medida que aumenta o número de componentes ligadas em série. a fiabilidade do sistema é dada por Rs = e (iv) Outros sistemas − n i =1 λi t Quando a estrutura do sistema não puder ser enquadrada em nenhuma das anteriores. A distribuição exponencial é a mais usada em estudos de fiabilidade.

Manual de Exercícios Se o objectivo fôr calcular a probabilidade de falta de energia (acontecimento secundário) vem P (avaria) = P (A ∪ B) = P (A) + P(B) + P(A)xP(B) Para o acontecimento prioritário (sala às escuras) vem: P(sala às escuras) = P(falta de energia ∪ lâmpada estragada) Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de protecção e esquemas de comando (fiabilidade de mísseis e reactores nucleares. Sala às escuras Falta de energia Lâmpada estragada Avaria na rede Actuação da protecção Estatística Aplicada 109 . por exemplo).

da extensão e da evolução dessas variações é extremamente importante para podermos garantir que nos é possível produzir produtos que vão cumprir as especificações. As variações são inevitáveis. muito ou pouco dispersas. O controlo estatístico de qualidade permite uma intervenção nos processos. entende-se por controle de qualidade a monitorização de um processo. podendo ser grandes. no sentido de se ajustarem e corrigirem os processos. Ao definir uma carta de controle para a média. que constitui o objectivo desejado (por exemplo. pequenas. o processo a analisar deva ser monitorado ao longo do tempo. para eles definidas. a um nível aceitável. Situações deste tipo ocorrem em linhas de fabrico de produtos. A "qualidade" pode referir-se a um valor fixo. pelo contrário. antes de qualquer alteração não natural passar a fazer efeito de forma contínua. Duma forma geral. O conhecimento do tipo.Manual de Exercícios 3. A avaliação do processo implica. Aplicações estatísticas Controlo Estatístico de Qualidade É do conhecimento geral que nenhum processo de produção executa dois produtos iguais. que em certos intervalos de tempo se proceda a uma amostragem. Os processos industriais são caracterizados por produzirem peças cujas características variam dentro de certos valores toleráveis. a conformidade da média relativamente a "limites normais"). cujos resultados de natureza quantitativa se devem encontrar dentro de determinados limites. É simples imaginar situações onde.7. qualidade de serviços. estudos de conservação de materiais e máquinas. Os testes descritos anteriormente referiam-se em situações em que o estudo não era cronológico. caso contrário. Um processo está sob controle se os resultados estão em conformidade com os limites impostos. o processo deve ser investigado para que sejam detectadas as causas do desvio. é necessário começar por definir a norma para µ (µ0) e 2 níveis de controle: os de vigilância “garantida” (limites Estatística Aplicada 110 . As cartas de controlo são um instrumento poderoso que permite identificar as causas de variação não natural nos processos.

por exemplo. é necessário começar por definir a norma para p (p0) e 2 níveis de controle: os de vigilância “garantida” (limites inferior e superior de vigilância: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). sendo os LIC e LSC calculados da seguinte forma: LIC / LSC = µ0 +/- cσ n (metodologia baseada na estimação por intervalos estudada atrás) Ao definir uma carta de controle para a proporção. Se a média amostral cair fora da área de tolerância definida pelos LIC e LSC. Os LIC e LSC calculados da seguinte forma: Estatística Aplicada 111 . é por que há alguma anomalia e deve haver paragem da produção.Manual de Exercícios inferior e superior de vigilância: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). é por que há alguma anomalia e deve haver paragem da produção. Se a proporção amostral cair fora da área de tolerância definida pelos LIC e LSC. Supõe-se que a variável em estudo segue Distribuição Normal. de defeituosos.

as cartas de controlo permitem prever de forma adequada o comportamento do processo. ela será representada por um ponto particular. devem ser eficazes para o controlo sem acarretar esforço demasiado e desnecessário na colheita. no sentido de reduzir a sua variabilidade. e melhorar os processos. recolhidas consecutivamente em intervalos de tempo constantes. Os dados são obtidos de amostras de tamanho constante. As amostras a utilizar devem ser de tamanho racional. Quando um ponto estiver fora desses limites de Estatística Aplicada 112 . no sentido de se obter o controlo contínuo do processo. por exemplo). Pode ser mantido um registo das médias amostrais por meio de uma carta como a representada na figura abaixo. que deverá ser usado como base para a colheita. isto é. Enquanto eles caírem entre o limite inferior e o superior. com base na informação disponível nas cartas. registo e marcação dos dados no gráfico. Desde que o processo esteja sob controlo estatístico. o processo está sob controle. Podem ser traçadas nos próprios locais de trabalho. As cartas são elaboradas a partir de medições efectuadas de uma característica do processo (a média. Deve ser elaborado um plano de recolha de dados. A interpretação dos limites de controlo é a seguinte: se a variabilidade peça a peça do processo permanecesse constante e nos níveis encontrados. Cada vez que for calculada uma média amostral.Manual de Exercícios ˆ ˆ p(1 − p) n (metodologia baseada na estimação por intervalos estudada atrás) As cartas de controlo são instrumentos fáceis e simples de aplicar pelos LIC / LSC = p0 +/- executantes. seria legítimo concluir que na base de um ponto fora dos limites de controlo estariam causas que importa conhecer e sanear. dando informações preciosas sobre os momentos em que são necessárias acções correctivas. denominada carta de controle de qualidade. Um ponto fora do controlo deve merecer uma análise imediata quanto à causa. geralmente 3 ou 5 unidades.

Média Amostral (cm) LSuperior • Segunda-feira Terça-feira Quarta-feira Quinta-feira Sexta-feira • • • • • • • • • • • • • • • • • • • • • • • 50 LInferior • • Estatística Aplicada 113 . Os limites de controlo especificados são denominados de limites de confiança. A escolha. há a possibilidade de haver alguma anomalia. o que justifica uma investigação. em cada caso.Manual de Exercícios controle (como ocorreu com a terceira amostra tomada na quinta-feira). depende das circunstâncias particulares de cada processo.

é por vezes interessante aferir da existência de relações estatísticas relevantes entre as diversas questões (por exemplo. No entanto.8.1 Teste de independência do qui-quadrado O teste do é muito eficiente para avaliar a associação existente entre variáveis qualitativas. um segmento geográfico autónomo e com características próprias de entre o total dos inquiridos). Este teste encontra aplicabilidade no tratamento estatístico de inquéritos. o valor esperado ou a proporção. De uma maneira geral. A existência de associações entre as questões permite determinada um vector comum entre grupos de inquiridos que responderam de forma semelhante a certo tipo de questões (concluir algo como que os habitantes de uma dada área foram sempre os que assinalaram determinado tipo de respostas e constituem. Aplicações estatísticas Tratamento estatístico de inquéritos 3. pode dizer-se que dois grupos se comportam de modo semelhante se as diferenças entre as frequências observadas e as esperadas em cada categoria forem muito pequenas ou próximas de zero. mas que se inclui na categoria dos testes nãoparamétricos.Manual de Exercícios 3. em que o objectivo é proceder à sua segmentação. O estudo destas relações encontra aplicabilidade no campo das análises de mercado. Estatística Aplicada 114 . O princípio básico deste método nãoparamétrico é comparar as divergências entre as frequências observadas e as esperadas. para além do tratamento frequencista dos inquéritos. aqueles que não incidem explicitamente sobre um parâmetro de uma ou mais populações (por exemplo. testar se há alguma coerência entre quem respondeu à opção 1 da pergunta X e à opção 2 da pergunta Y). por isso. Trata-se de um teste de hipóteses semelhante aos anteriormente estudados. a lógica de formulação das hipóteses e de definição de uma regra de decisão é equivalente aos testes paramétricos.8. De facto. isto é. como os estudados anteriormente).

Tais resultados representam o número de observações incluídas nas diferentes combinações das classes nas quais as duas variáveis em estudo se exprimem.Manual de Exercícios Exemplo: Um pesquisador deseja verificar se há associação entre três cursos de uma universidade e dependência de drogas. admitindo somente duas respostas: sim ou não.j: frequência marginal observada na modalidade j ni.j Total n1. … ni. sendo 25 de Medicina.2 … … … … … … Mod. n Estatística Aplicada 115 . n … … … nnn n. Admitase que os resultados que nela figuram resultam de amostras aleatórias. 1 Modalidade 1 Modalidade 2 … Modalidade n Total onde nij: frequência observada na célula ij n. 2 n12 n22 … … n. Mod. 35 de Farmácia e 60 de Biologia.1 Mod. chegou-se à seguinte tabela de distribuição de frequências: Medicina Usa drogas Não usa drogas Total 10 15 25 Farmácia 20 15 35 Biologia 30 30 60 Total 60 60 120 As tabelas como aquela na qual se apresentam os resultados referentes ao exemplo são habitualmente designadas de tabelas de contingência. Entrevistou 120 alunos.: frequência marginal observada na modalidade i n: dimensão da amostra n11 n21 … … n. Após o processamento dos dados. perguntando sobre o uso de drogas. n2.

quando as discrepâncias são grandes. Quando as frequências observadas são muito próximas das esperadas. isto é. a frequência esperada é calculada pela multiplicação do total da coluna respectiva pelo total da linha a que pertence. (obtidos por (número de linhas-1)*(número de colunas-1)). Estatística Aplicada 116 .f. Na prática. a variável de decisão assume um valor elevado e há motivos ou significância estatística para rejeitar Ho.Manual de Exercícios O objectivo do teste é o de verificar se as duas variáveis em questão são ou não relacionadas. dividindo-se o produto pela dimensão total da amostra: eij = n i . no entanto. o valor do numerador passa a ser grande e. considerando o nível de significância adoptado e os graus de liberdade GL ou d. admitindo a hipótese de independência. No teste qui-quadrado compara-se o valor calculado com o valor crítico fornecido em uma tabela. Ou seja. As hipóteses nula e alternativa são então as seguintes: Ho: As variáveis são independentes H1: As variáveis não são independentes As frequências observadas são obtidas directamente dos dados da amostra. quando há fortes discrepâncias entre o que de facto foi observado e o que seria de esperar sob a hipótese de independência. o assume valores altos. enquanto que as frequências esperadas são calculadas a partir destas. * n. que deverá ser calculada para cada célula da tabela. j n O é calculado da seguinte forma: = i j (nij − eij ) 2 eij Note-se que o numerador faz referência à diferença entre frequência observada e frequência esperada. o valor do numerador é pequeno. sob o pressuposto de que Ho é verdadeira. consequentemente.

entre os 120 alunos incluídos no estudo há um número igual (60) que afirma usar e não usar drogas.f. a distribuição entre os vários cursos não ocorre de forma homogénea. Neste caso. for maior que o valor crítico fornecido na Resolução: Como pode ser observado. pode usar-se o teste do quiquadrado com duas hipóteses de trabalho: Ho: Não há associação entre tipo de curso e dependência de drogas H1: Há associação entre tipo de curso e dependência de droga Estatística Aplicada 117 . Medicina Usa drogas Não usa drogas Total 10 15 25 Farmácia 20 15 35 Biologia 30 30 60 Total 60 60 120 Os dados são do tipo qualitativo. obtém-se da tabela de valores críticos da (ver página seguinte): Rejeita-se a hipótese nula se tabela. pois cada aluno entrevistado foi classificado sob uma determinada categoria.) = 4: Para o nível de significância de 5%.Manual de Exercícios Tome-se o caso de GL (d. No entanto.

Por último. considerando os graus de liberdade (GL) e o nível de significância adoptado (ver tabela anexa). Calcular as frequências esperadas eij = Por exemplo.0 60 120 Total 60 60 3. j n = 25 * 60 = 12.5 120 2. concluindo-se que. que é 5. a hipótese Ho não pode ser rejeitada. se as duas variáveis fossem independentes. compara-se o valor do observado obtido (1. A seguir aplica-se a fórmula = i j (nij − eij ) 2 eij = …=1. Ho deverá ser rejeitada. Assim sendo.5 25 Farmácia 20 17.5 15 12.=1. j n 1. Em média. seria de esperar que o número de estudantes de Medicina a admitir usar drogas fosse de: eij = ni. * n.7) com o valor do crítico.0 30 30. não há associação entre as variáveis. Estatística Aplicada 118 . Determinam-se os graus de liberdade na tabela Os graus de liberdade da tabela são calculados multiplicando (número de linhas-1)*(número de colunas-1)= (2-1)*(3-1)=2 GL 5.991 (cruzamento da linha 2 com a coluna 0. * n.05). As frequências esperadas deverão ser anotadas nas correspondentes células: Medicina Usa drogas Não usa drogas Total nij eij nij eij 10 12. no grupo estudado.Manual de Exercícios Se o obtido fôr maior ou igual ao crítico.7 é menor do que o valor obtido a partir da tabela. a proporção de alunos que usam ou não drogas não varia entre os cursos.5 15 17. Vem que o obsv.5 35 Biologia 30 30. Para o cálculo do recomendam-se os seguintes passos: n i .7 4.

Estatística Aplicada 119 . não se deve usar o teste do . Uma boa alternativa para estes casos é o agrupamento de linhas e colunas adjacentes. desde que tenha algum sentido lógico. ou haja uma ou mais frequências esperadas com valores menores ou igual a 1.Manual de Exercícios Observação: Caso 20% ou mais das células tenham frequências esperadas menores que 5. de modo a diminuir os graus de liberdade associados.

312 8.5 0.666 23.923 45.885 41.987 18.892 53.144 32.364 42.582 43.Manual de Exercícios 0.963 49.527 7.047 19.196 36.121 16.312 15.386 2.262 6.277 14.267 39.342 15.013 18.404 5.565 4.629 6.791 8.9 0.718 40.344 13.308 18.336 35.337 32.773 46.304 11.646 44.290 54.697 6.401 15.610 2.700 3.484 0.409 35.932 41.725 26.689 14.848 22.815 5.05 0.412 0.210 10.547 14.841 5.865 0.645 12.877 9.801 37.207 0.247 3.991 7.455 1.488 11.180 2.256 43.507 17.535 20.638 44.024 7.283 13.520 13.204 30.791 20.659 23.382 37.346 12.000 0.120 16.997 45.141 31.01 0.340 18.643 9.563 38.741 40.337 30.587 30.087 42.860 18.805 37.769 27.479 38.113 43.172 38.651 18.265 6.292 25.340 19.168 4.475 20.975 0.909 7.564 10.722 49.300 32.076 41.236 11.278 24.188 29.252 120 .676 0.275 19.490 4.124 8.928 52.337 33.070 12.296 28.362 15.548 22.819 9.615 32.337 34.750 20.348 11.844 17.119 29.025 0.051 27 11.907 11.844 7.366 3.994 56.589 27.336 37.892 29 13.635 7.591 12.336 39.179 25 10.075 4.796 10.980 45.023 21.086 16.955 26.156 2.064 23.005 0.216 0.114 26.336 36.812 22.289 42.920 24.566 39.041 12.675 21.341 17.339 21.684 16.051 0.886 0.034 8.412 31.264 6.339 22.457 6.268 11.337 28.599 29.832 15.064 1.808 14.181 49.584 1.690 2.672 59.558 51.314 46.344 1.549 21.337 29.812 18.833 3.461 15.924 36.240 20.642 48.449 16.515 5.827 9.671 35.908 7.645 55.335 58.410 34.813 33.652 40.074 3.007 35.026 23.605 6.009 5.781 40.601 5.796 48.237 1.768 28.483 23.000 34.787 16.191 33.336 40.415 39.728 12.338 24.307 20.041 21.578 10.142 5.378 6.321 7.698 9.338 27.838 16.319 36.343 14.578 32.251 7.688 29.845 32.195 46.072 0.143 13.989 1.170 37.401 46.067 16.852 36.831 1.362 24.001 0.191 38.001 0.865 17.475 28 12.351 2.982 14.879 10.557 45.597 13.266 9.735 2.996 27.209 25.278 50.016 0.757 31.337 44.434 8.488 30.588 5.085 16.010 0.702 Estatística Aplicada ¢¦¢¢¢G¦¢ ¢¦¤D¦¢¢'¦A ¦¢98¦¥ 35 ¥ 34 ¦2 1¢¢ ¢'¢%$" ¢  ¢¢¢©¢¢¦¤¥¢¢  ( H P I H  F # E ( § § C B 4 6 @ 2 7 6 2 0 0 0 ) (    ¡ & ¨ # !    ¨   ¤ ¨ § ¡ £ ¡ 0.301 30 13.979 50.916 41.816 4.939 27.526 34.338 23.919 19.357 4.779 3.815 9.790 13.588 52.348 10.017 14.1 0.706 4.989 28.217 28.819 34.461 48.090 21.685 26.466 9.211 0.542 26.124 8.603 3.995 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.160 13.473 24.736 27.260 9.156 42.338 25.337 26.619 26 11.592 14.307 24.314 10.869 31.204 2.573 18.345 12.443 19.231 10.

15*0.Manual de Exercícios FIABILIDADE Exercícios Exercício 1 Num centro comercial. Diz-se que o sistema está em funcionamento se pelo menos uma das máquinas funciona.15*... 2x10-5 avarias/hora (B e C) e 5x10-5 avarias/hora (D).. Estão no seu período de vida útil e as taxas médias de avarias são 10-4 avarias/hora (A).*0.6531% = e −0. Suponha que cada máquina funciona independentemente das outras e a probabilidade de funcionamento de cada máquina é 85%.e maq 10 não funcionar) = 1 – 0. B A C D Calcule a probabilidade do sistema estar em funcionamento após 5 000 horas.5 = 60. Calcule a probabilidade do sistema estar em funcionamento.. Resolução A: Rs = e D: Rs = e −10−4 *5000 = e −0. 25 = 77. Resolução P(avaria) = 1-0.15 = 1 (aproximadamente) 2.8801% − ( 5*10−5 ) *5000 Estatística Aplicada 121 . Quatro componentes de um sistema encontram-se associados de acordo com a figura junta. está instalado um sistema de 10 máquinas para utilização de cartão multibanco.85 = 15% P(sistema estar em funcionamento) = 1 – P(sistema avariar) = 1 – P(nenhuma das máquinas funcionar) = 1 – P(maq1 não funcionar e.

5 horas.Manual de Exercícios B e C: Rs = e − ( 2*10−5 ) *5000 = e −0.606531*0.0944% Logo. a) Qual a probabilidade de não ocorrerem avarias antes do instante t=6 horas? b) Admitindo que a máquina se encontrava em funcionamento no instante t=4 horas.990944*0.778801 = 46.3000] horas Rs = e Exercício 4 − 3000 17500 = e −0. tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(α=1/17500) MTBF = 17500 Y: nº de avarias no intervalo [0. P(sistema estar em funcionamento após 5 000 horas) = = 0. com um MTBF de 17 500 horas.171429 = 84. Resolução X: tempo de funcionamento sem avarias da máquina (em horas) (isto é. Calcule a fiabilidade do equipamento. cinco unidades idênticas de um equipamento que se sabe ter uma curva de sobrevivência que obedece a uma distribuição exponencial.8% Exercício 3 Foram ensaiadas durante 3 000 horas.4837% P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 – (1-0.25% O tempo de funcionamento sem avarias de uma determinada máquina de produção contínua segue uma lei exponencial negativa com valor esperado igual a 4. sem que se verificasse qualquer avaria. qual a probabilidade de não ocorrerem avarias até t=6 horas? c) Qual a probabilidade de se verificarem 2 avarias durante as primeiras 6 horas de funcionamento da máquina? Estatística Aplicada 122 .1 = 90. Imagine que a máquina é (re)colocada em funcionamento no instante t=0 horas.904837)2 = 99.

1 .6% Logo. no período de vida útil. Calcular: a) A probabilidade de falha de uma ou mais lâmpadas.5 e dx = e 4.1% = P( X ≥ 2) − P( X ≥ 4) P( X ≥ 4) e 4 .5 c) Y: nº de avarias no intervalo [0.0488 = 95.1667 = 84.0.5).6] horas P(Y=2) = e − − 6 4. Resolução a) Rs = e − 3625 12000 = e −0. vem que P(X ≥ 6) = P(Y=0) = e-λt = e-(1/4.4% 2! Exercício 5 Sabe-se que um determinado modelo de lâmpadas apresenta no período de vida útil (3625 horas) um MTBF de 12 000 horas.302 = 73.73910 = 1 – 0. como Y segue Po(1/4.Manual de Exercícios Resolução a) X: tempo de funcionamento sem avarias da máquina (em horas) (isto é. num conjunto de 10. b) Quantas lâmpadas.4% 4.12% b) Rs = e − 2000 12000 = e −0.9% Em 10.5) 2 = 23.4% 6 P( X ≥ 6 ∩ X ≥ 4) P( X ≥ 6) e 4. 0. tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(α=1/4.5 1 6 P(X ≥ 6) = 1 − P ( X < 6) = 1 − Ou considerando Y: nº de avarias no intervalo [0.5 x(6 / 4.P(falhar nenhuma) = 1 .6] horas.846x1000 lâmpadas = 846 Estatística Aplicada 123 . de um conjunto de 1 000.5 = 26.5 b) P(X ≥ 6/ X ≥ 4) = = = 4 = 64. estarão provavelmente em funcionamento após 2 000 horas de utilização.5 6 0 − 1 − 4.5) = 26.5) MTBF = 4.5)t = e-(6/4.

8*0.05=0.Manual de Exercícios Exercício 6 Num grande centro comercial existem 3 telefones públicos.8*0. se mais de um elemento avariar o sistema não funciona.p=0.25=9. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar) = (0.25 e que as avarias são independentes. sendo 0.63% b) Bi(n=5. O grupo de telefones satisfaz minimamente o serviço se pelo menos 2 estiverem sem avarias.2*0.25 Estatística Aplicada 124 .15*0. Calcule: a) b) a probabilidade do sistema funcionar ao longo do dia.2*0.75+0. Resolução a) P(sist. colocados estrategicamente a fim de satisfazer adequadamente os utentes.5% P(3 sem avarias) = 0.51=60.75=51% Exercício 7 Um sistema é constituído por 5 componentes iguais.954*0. 0.05 a probabilidade de um elemento falhar ao longo de qualquer dia da semana. A observação prolongada do funcionamento dos telefones levou a concluir que as probabilidades dos 3 telefones.1425 = 91. indicando o valor médio de tal distribuição.85*0. No caso de nenhum elemento avariar o sistema funciona normalmente.7. se um dos elementos avariar o sistema funciona com probabilidade 0. 0.15*0.25+0. T2 e T3 se encontrarem avariados são.15.2 e 0.7738 + 0. respectivamente.5% P(2 sem avarias) = 0.85*0.095+0.7 = 0.955)* 1 + (5*0. Qual a probabilidade de pelo menos dois destes telefones estarem sem avarias? Resolução P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem sem avarias) = 0.05) Valor médio=5*0. T1.05)*0. a função de probabilidade do nº de falhas registadas nos seus componentes ao longo de um dia.

530. Resolução X: resistência de um componente em Ω X ∩ N ( µ .Manual de Exercícios CONTROLE ESTATÍSTICO DE QUALIDADE Exercícios Exercício 1 Uma empresa fabrica e comercializa condutores eléctricos cujas condições de controlo da produção e aceitabilidade a seguir se indicam (relativos à resistência de um componente em Ω): − − − − − − − Característica sob controlo: µ LIC: 49. estando a norma a ser cumprida. 50.8775 LSC: 50.8775 LSC = µ + = 50.25 Proceder-se-á à paragem da produção sempre que os limites de controlo sejam desrespeitados Um condutor é considerado não defeituoso se a sua resistência em Ω estiver compreendida entre [49. determine: a) b) c) O valor da norma µ0 A probabilidade de se proceder a uma paragem indevida da produção A probabilidade de.1225 cσ n Como LIC + LSC = 100 vem que µ − Logo µ=100/2 = 50 Ω + µ+ cσ n = 2 µ = 100 Estatística Aplicada 125 . se produzir um artigo defeituoso. 470] Nestas condições.25) 2 ) a) LIC = µ − cσ n cσ n = 49. (0.1225 n=16 σ=0.

96) = 0.9399 = 6.88) = Na tabela da Normal.1225 − 50 ≤X ≤ )= 0.P(49.1225 sendo µ=50) = 1 .8775 ≤ X ≤ 50.Manual de Exercícios b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando µ=µ0) = 1 .25 16 16 1.9399 donde 1 – 0.53 − 50 50.01% Exercício 2 A empresa “TRADECHO.53 ≤ X ≤ 50.P(-1.8775 − 50 50. sendo a norma respeitada) = 49.25 16 16 1 – P(49. a norma para a variância é de 4 e está a ser cumprida.25 0.47 sendo µ=50) = 1 . SA” mantém um diferendo com os seus principais clientes.P( 1 .96. a amplitude do intervalo de controle para a média deve ser de 1.88 ≤ X ≤ 1.25 0.P(-1. que afirmam que os produtos produzidos (em série) por esta empresa não obedecem às normas de qualidade estabelecidas e que são: - a norma para o comprimento médio das peças é de 20 cm. vem D(1. vem D(1.47 − 50 ≤X ≤ )= 0. a dimensão das amostras a extrair é de 16 Afirmam os clientes que a probabilidade de parar indevidamente o processo produtivo é superior àquela que decorre das normas.P( 49. Estatística Aplicada 126 .96 ≤ X ≤ 1.95 donde 1 – 0.96) = Na tabela da Normal.95 = 5% c) P(produzir um artigo defeituoso.88) = 0.

Manual de Exercícios a) Determine a probabilidade referida.30 20.P(20-1.P(-1.98 20 • Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5 • •20. 4) a) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando µ=µ0) = 1 . b) Represente a carta de controle para a média c) A recolha de 5 amostras forneceu os seguintes resultados para a média: 20.95 = 5% b) e c) Média Amostral (cm) 20.98 0.98 ≤X ≤ )= 2 2 16 16 1.90 • • • • • 20 • • • •20.96 ≤ X ≤ 1.96) = 0.02 Não é necessário parar o processo produtivo (valores dentro dos limites de controlo).05 19.00 20. vem D(1.96/2 sendo µ=20) = 1 .96) = Na tabela da Normal.5 • • • • 19.96/2 ≤ X ≤ 20+1.90 20.P( − 0.15 • • • • • 19.3 • • • • •20.15 Qual a medida a tomar? Resolução X: comprimento das peças em cm X ∩ N ( µ . Estatística Aplicada 127 .95 donde 1 – 0.

45 cσ n Como LIC + LSC = 2000 vem que µ − Logo µ=2000/2 = 1000 h + µ+ cσ n = 2 µ = 2000 b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando µ=µ0) = 1 .645 ≤ X ≤ 1.45] parando-se o processo produtivo se o valor médio amostral se situar fora deste intervalo.P( 983. a partir de uma amostra de dimensão 100: [983. Sabe-se que o desvio-padrão da duração de uma lâmpada é de 100 horas.55 cσ = 1016.645) = Estatística Aplicada 128 . O Departamento de Produção construiu o seguinte intervalo para a duração média de uma lâmpada.45 sendo µ=1000) = 1 .55 ≤ X ≤ 1016.P(-1.55.45 − 1000 ≤X ≤ )= 100 100 100 100 1. (100) 2 ) cσ n n a) LIC = µ − LSC = µ + = 983.Manual de Exercícios Exercício 3 Numa empresa procede-se ao exame das condições de produção relativas à duração (em horas) das lâmpadas fabricadas (produção em série).55 − 1000 1016. Resolução X: duração das lâmpadas em horas X ∩ N ( µ . a) Calcule o valor adoptado para a norma (µ0) b) Determine a probabilidade de se parar indevidamente o processo produtivo.P(983. 1016.

8 - = 9.8 D(c)= 5% logo c= 1.96 milhares de horas a probabilidade de se parar indevidamente a produção é de 5% Sabe-se ainda que o desvio padrão da duração de uma componente é de 4 mil horas. SA pretende implementar um sistema de controle interno de qualidade de um determinado tipo de geradores fabricados em série.9 = 10% Exercício 4 O novo Conselho de Administração da empresa de componentes eléctricas “Alta Tensão.96 * 4 64 b) LSC = µ + = 10.96 2 cσ n ≤ 1. Para tal.Manual de Exercícios Na tabela da Normal. vem D(1.8 milhares de horas a amplitude do intervalo não deve exceder 1.96 * 4 n ≤ 1. a) Determine a dimensão da amostra que é necessário recolher para cumprir as condições definidas. SA” resolveu efectuar um estudo aprofundado sobre o controle estatístico de qualidade das peças produzidas. ( 4) 2 ) cσ n a) LSC = µ + = 10.96 logo 2 cσ n 1. definiu com o director de produção os aspectos considerados relevantes no controle da duração média das componentes: - o limite superior de qualidade (LSC) deve ser de 10.8 logo µ = 10.645) = 0. Resolução X: duração das componentes em milhares de horas X ∩ N ( µ . procede à verificação da produção de energia Estatística Aplicada 129 . Assim.82 Exercício 5 O director de produção da empresa DISLIX.9 donde 1 – 0. b) Calcule a norma.96 ⇔ n ≥ 64 1.

04 = 11.96 * 4 n ≤ 3. Resolução X: energia eléctrica produzida em kws/hora X ∩ N ( µ . a) Determine a dimensão mínima da amostra a utilizar para o controle de produção. ( 4) 2 ) a) D(c)= 5% logo c= 1.96 * 4 Estatística Aplicada 130 .96 • Amostra 1 Amostra 2 Amostra 3 Amostra 4 Amostra 5 • • • • • • • • • • • • • • • • • • • • • • 10 8.96 * 4 16 16 = 8. b) Represente a carta de controle para a média.92 ⇔ n ≥ 16 b) Média Amostral (cm) 11.04 LIC = µ − cσ n cσ n • • • = 10 − 1.96 2 cσ n ≤ 3.96 LSC = µ + = 10 + 1.92 A probabilidade de se parar indevidamente a produção não deve exceder 5% Sabe-se que o desvio padrão da produção da energia eléctrica de um gerador é de 4 kws/hora e que a variável segue distribuição Normal.92 logo 2 1.Manual de Exercícios eléctrica (em kws/hora) tendo e vista a construção de um intervalo de controle para a produção média de energia de um gerador que cumpra os seguintes objectivos: - Norma de produção para a média: 10 A amplitude do intervalo não deve exceder 3.

Estes testes foram elaborados sobretudo com o intuito Estatística Aplicada 131 . Entendeu-se então levantar a seguinte questão: “a sensibilidade ao preço é afectada pelo poder de compra dos clientes?” Numa sondagem efectuada a 1973 clientes potenciais. A sondagem revelou que. Utilize um nível de significância de 1%. enquanto 212 não estariam dispostos a gastar tanto. dos clientes classes A/B/C1. Represente adequadamente e interprete a informação contida nestes dados. 598 pagariam um preço mais elevado pelo sumo natural. confrontaram-se os inquiridos com três alternativas: adquirir sumo natural a preço elevado. Em relação aos 977 clientes das classes C2/D/E.Manual de Exercícios TRATAMENTO ESTATÍSTICO DE INQUÉRITOS Exercício 1 Exercícios A empresa BrasFruta Lda está a instalar-se em Portugal com um produto inovador. um concentrado de fruta semelhante a um sumo de fruta natural. 164 só consumiriam sumo natural se o preço fosse baixo e 285 preferiam refrigerante. os consumidores mostravam-se cépticos em relação à qualidade quando se falav em preços baixos. adquirir sumo natural a preço baixo ou adquirir refrigerantes. conseguiu-se apurar que existia uma grande sensibilidade ao preço. A intenção é vender o produto em cafés. esplanadas e bares que passariam a dispor de uma imitação perfeita de um sumo acabado de fazerva um preço vantajoso. Resolução Preço Elevado A/B/C1 C2/D/E Total 598 528 1126 Preço Baixo 212 164 376 Refrigerante 186 285 471 Total 996 977 1973 As conclusões foram retiradas pelo recurso à análise correlacionada através do teste do qui-quadrado. Apesar de haver uma preferência generalizada por sumos naturais face a refrigerantes. Através de um estudo qualitativo com consumidores.

Exercício 2 Aos exames de primeira época de determinada disciplina compareceram 105 alunos. * n. há associação entre as variáveis. O número de aprovações foi de 33. Para o cálculo das frequências esperadas.05). concluindo-se que. que é 5. dos quais 20 não tinham prestado qualquer prova durante o ano.8 285 233. para os quais se convencionou a adopção de um nível de significância de 5%. α=0. no grupo estudado. das quais 3 foram de alunos que não tinham efectuado provas durante o ano. As frequências foram utilizadas para analisar o mercado como um todo e para interpretar o resultado dos testes de correlação. j n . de que resultou a seguinte tabela: Preço Elevado A/B/C1 C2/D/E Total nij eij nij eij 598 568. a hipótese Ho será rejeitada.4 528 557.05)=5. Assim sendo.991 (cruzamento da linha 2 com a coluna 0.Manual de Exercícios de segmentar o mercado.2 471 Total 996 977 1973 Ho: As variáveis são independentes H1: As variáveis não são independentes crítico (GL=2.991 observado = 31. Em média.141 Vem que o obsv.141 é maior do que o valor obtido a partir da tabela. considerado razoável face aos valores normalmente utilizados.=31. procedeu-se à aplicação de eij = n i .6 1126 Preço Baixo 212 189.2 376 Refrigerante 186 237. o poder de compra do consumidor influencia a sensibilidade ao preço.8 164 186. Estatística Aplicada 132 .

Exercício 3 Com o objectivo de testar se existe relação entre a formação do gerente de uma dependência bancária e a respectiva “performance”. se pode afirmar que existe independência entre a comparência (ou não) a provas durante o ano de aprovação (ou não) em exame. construiu-se a seguinte tabela de contingência.05)=3. com base nestes elementos. Negócios Baixo Médio Elevado Média 44 55 51 Superior 52 43 55 Que conclui.84 observado = 3. se.122 é menor do que o valor obtido a partir da tabela. a um nível de significância de 1%? Resolução Ho: As variáveis são independentes H1: As variáveis não são independentes Estatística Aplicada 133 . Logo. relativa a 300 balcões de diferentes bancos: Formação Gerente Vol.Manual de Exercícios Diga. a hipótese Ho não será rejeitada (há independência).= 3. Resolução Aprovações Comparecem Sim Não Total Aprovado 30 3 33 Reprovado 55 17 72 Total 85 20 105 Ho: As variáveis são independentes H1: As variáveis não são independentes crítico (GL=2. α=0.122 Vem que o obsv. para um nível de significância de 5%.

+ = 2. tendo-se obtido: Volume DLX Baixo/Médio 150 20 Elevado 50 80 Época Normal Ponta A um nível de significância de 5%. Negócios Baixo Médio Elevado crítico (GL=2. a hipótese Ho será rejeitada. α=0.21 48 53 Média 48 49 53 Superior 48 49 53 Valor obsv.2876 > 9. concluindo-se que há associação entre as variáveis.21 observado = 2. Assim.Manual de Exercícios Valores esperados: Formação Gerente Vol. que pode concluir? Resolução Ho: As variáveis são independentes H1: As variáveis não são independentes Estatística Aplicada 134 .. teste = Vem que o obsv. o ano foi dividido em duas épocas: Época de Ponta. est. compreendendo os meses de vinda de emigrantes (Verão e Natal) e Época Normal (restantes meses).2876 é maior do que o valor obtido a partir da tabela.01)=9.. deu-se particular atenção à influência exercida pelas remessas de emigrantes. observou-se o nível de Disponibilidades Líquidas sobre o Exterior (DLX) para cada mês. Assim.2876 (44 − 48) 2 (55 − 53) 2 + .= 2. Assim sendo. Exercício 4 Pretendendo-se analisar o comportamento do volume de divisas ao longo do ano.

Moeda 0-10 10-45 45-70 Reduzida 20 20 250 Média 30 400 30 Elevada 200 30 20 Utilizando um nível de significância de 5%.05)=5. teste = Vem que o (150 − 113.33 crítico (GL=1. Moeda 0-10 10-45 45-70 Reduzida 72.991 observado = 85. a hipótese Ho será rejeitada..5 87 Média 115 207 138 Elevada 62. Assim sendo.33 obsv. + = 85..5 130.5 112.069 > 3.66 43.Manual de Exercícios Valores esperados: Época Normal Ponta Volume DLX Baixo/Médio 113. α=0. que conclusão pode tirar? Resolução Ho: As variáveis são independentes H1: As variáveis não são independentes Valores esperados: Taxa juro Proc.069 Valor obsv. procedeu-se à recolha periódica de elementos sobre essas variáveis.5 75 Estatística Aplicada 135 . concluindo-se que há associação entre as variáveis.= 85. est.069 é maior do que o valor obtido a partir da tabela.33 43. construindo-se a seguinte tabela de contingência: Taxa juro Proc.33) 2 + . Exercício 5 Num estudo que pretendia averiguar a existência de relação entre a procura de moeda e a taxa de juro.84 113.33) 2 (80 − 43.33 6.66 Elevado 86.

Assim sendo. a hipótese Ho será rejeitada. Estatística Aplicada 136 . que fazem parte de um determinado projecto de estudo e aplicou-lhes uma escala de atitudes com o objectivo de conhecer as suas opiniões em relação ao projecto.05)=3. α=0. Assim sendo. B e C. que conclusão pode tirar? Resolução Ho: As variáveis são independentes H1: As variáveis não são independentes Valores esperados: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva A 20 20 B 25 25 C 25 25 crítico (GL=2. concluindo-se que há associação entre as variáveis. Exercício 6 Um investigador seleccionou três amostras de estudantes. Os resultados de uma amostra de 140 estudantes foram os seguintes: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva A 30 10 B 30 20 C 10 40 Utilizando um nível de significância de 5%.7 é maior do que o valor obtido a partir da tabela. α=0.49 observado = 1183. concluindo-se que há associação entre as variáveis.Manual de Exercícios crítico (GL=4.= 1183. a hipótese Ho será rejeitada.05)=9.= 30 é maior do que o valor obtido a partir da tabela.84 observado = 30 Vem que o obsv. A.7 Vem que o obsv.

You're Reading a Free Preview

Descarregar
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->