Você está na página 1de 154

Manual de Estatstica Aplicada

NDICE
1. INTRODUO ................................................................................. 1.1 Definies Gerais ........................................................................ 1.1.1. Populao 1.1.2. Variveis ou atributos 1.1.3. Processo de amostragem 1.2 A Estatstica Descritiva e a Estatstica Indutiva ................... 2. ESTATSTICA DESCRITIVA 2.1 Variveis Qualitativas ................................................................. 2.2 Variveis Quantitativas Discretas ............................................. 2.3 Variveis Quantitativas Contnuas ............................................ 2.4 Medidas de Localizao ............................................................. 2.4.1. Mdia 2.4.2. Mediana 2.4.3. Moda 2.5 Medidas de Ordem ...................................................................... 2.6 Medidas de Assimetria ............................................................... 2.7 Medidas de Disperso ................................................................ 2.7.1. Disperso Absoluta 2.7.2. Disperso Relativa 2.8 Anlise de Concentrao ........................................................... 2.8.1. Curva de Lorenz 2.8.2. ndice de Gini 21 17 18 19 6 8 8 10 11 13 4 5

Manual Tcnico de Formador

Manual de Estatstica Aplicada

2.9 Estatstica Descritiva Bidimensional ........................................ 2.9.1. Diagrama de disperso 2.9.2. Regresso simples 2.9.3. Correlao linear 2.9.4. Correlao ordinal 3. ESTATSTICA INDUTIVA 3.1 Noes bsicas de probabilidades ........................................... 3.2 Probabilidade condicionada ...................................................... 3.3 Funes de Probabilidade ...................................................... 3.4 Estimao por Intervalos ........................................................ 3.5 Testes de hipteses ................................................................ 3.6 Aplicaes Estatsticas: Fiabilidade ......................................... 3.6.1. Conceito de fiabilidade 3.6.2. Fiabilidade de um sistema 3.7 Aplicaes Estatsticas: Controlo Estatstico de Qualidade .. 3.8 Aplicaes Estatsticas: Tratamento Estatstico de Inquritos . 3.8.1. Teste de independncia do qui-quadrado 3.8.2. Tratamento de inquritos BIBLIOGRAFIA ANEXOS

24

50 50 53 55 82 95 113

118 124

Manual Tcnico de Formador

Manual de Estatstica Aplicada


"A estatstica a tcnica de torturar os nmeros at que eles confessem". Autor desconhecido

1. INTRODUO

Inicialmente, a actividade estatstica surgiu como um ramo da Matemtica. Limitava-se ao estudo de medies e tcnicas de contagem de fenmenos naturais e ao clculo de probabilidades de acontecimentos que se podiam repetir indefinidamente. Actualmente, os mtodos estatsticos so utilizados em muitos sectores de actividade, tendo como algumas aplicaes estudos de fiabilidade, pesquisas de mercado, testes de controle de qualidade, tratamento de inquritos, sondagens, modelos economtricos, previses, etc. Exemplo de uma estatstica: os valores da inflao entre 1980 e 1990 constituem uma estatstica. Fazer estatstica sobre estes dados poderia consistir, por exemplo, em traar grficos, calcular a inflao mdia trimestral ou prever a inflao para 1991. A anlise de um problema estatstico desenvolve-se ao longo de vrias fases distintas: (i) Definio do Problema Saber exactamente aquilo que se pretende pesquisar; estabelecer o objectivo de anlise e definio da populao (ii) Amostragem e Recolha de Dados Fase operacional. o processo de seleco e registo sistemtico de dados, com um objectivo determinado. Os dados podem ser primrios (publicados pela prpria pessoa ou organizao) ou secundrios (quando so publicados por outra organizao).

Manual Tcnico de Formador

Manual de Estatstica Aplicada

(iii) Tratamento e Apresentao dos Dados Resumo dos dados atravs da sua contagem e agrupamento. a classificao de dados, recorrendo a tabelas ou grficos. (iv) Anlise e Interpretao dos Dados A ltima fase do trabalho estatstico a mais importante e delicada. Est ligada essencialmente ao clculo de medidas e coeficientes, cuja finalidade principal descrever o comportamento do fenmeno em estudo (estatstica descritiva). Na estatstica indutiva a interpretao dos dados se fundamentam na teoria da probabilidade.

1.1. Definies Gerais


1.1.1. Populao Fazer estatstica pressupe o estudo de um conjunto de objectos bem delimitado com alguma caracterstica em comum sobre os quais observamos um certo nmero de atributos designados por variveis. Exemplo: Empresas existentes em Portugal

1.1.2. Variveis ou atributos

As propriedades de uma populao so estudadas observando um certo nmero de variveis ou atributos. As variveis podem ser de natureza qualitativa ou quantitativa. As variveis quantitativas podem ainda dividir-se entre discretas e contnuas. As variveis discretas assumem apenas um nmero finito numervel de valores. As variveis contnuas podem assumir um nmero finito no numervel ou um nmero infinito de valores. Exemplo: um conjunto de empresas pode ser analisado em termos de sector de actividade (atributo qualitativo), nmero de trabalhadores (atributo quantitativo discreto), rcio de autonomia financeira (atributo quantitativo contnuo), etc

Manual Tcnico de Formador

Manual de Estatstica Aplicada

1.1.3. Processo de amostragem Para conhecer de forma completa a populao, podem efectuar-se: recenseamentos (indagao completa de todos os elementos da populao); este processo , no entanto, tipicamente moroso e dispendioso, sendo esses os motivos porque os Censos so realizados apenas em cada 10 anos. estudos por amostragem (observao de apenas um subconjunto, tido como representativo do universo). As tcnicas de recolha de amostras garantem a sua representatividade e aleatoriedade.

1.2.

A Estatstica Descritiva e a Estatstica Indutiva

Para alm do ramo de amostragem, a estatstica compreende dois grandes ramos: a estatstica descritiva e a estatstica indutiva. A estatstica descritiva o ramo da estatstica que se encarrega do tratamento e anlise de dados amostrais. Assim, depois de recolhida a amostra de acordo com tcnicas que garantem a sua representatividade e aleatoriedade, fica disponvel um conjunto de dados sobre o universo em bruto ou no classificados. Para que seja possvel retirar qualquer tipo de concluses, tornase necessrio classificar os dados, recorrendo a tabelas de frequncias e a representaes grficas, isto , preciso tratar os dados. Depois de tratados, ser possvel proceder anlise dos dados atravs de vrias medidas que descrevem o seu comportamento: localizao, disperso, simetria dos dados, concentrao, etc. So disso exemplo indicadores numricos bem conhecidos como a mdia ou a varincia. A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. De facto, a amostra no mais do que um passo intermdio e exequvel de obter informaes sobre o verdadeiro objecto de estudo, que o universo. A estatstica indutiva (ou inferncia estatstica) garante a ligao entre amostra e universo: se algo

Manual Tcnico de Formador

Manual de Estatstica Aplicada

se concluiu acerca da amostra, at que ponto possvel afirmar algo semelhante para o universo? nesta fase que se procuram validar as hipteses formuladas numa fase prvia exploratria. Claro que o processo de induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. As inferncias indutivas so assim elaboradas medindo, ao mesmo tempo, o respectivo grau de incerteza. Da que, na ficha das tcnicas das sondagens eleitorais, por exemplo, apaream referncias ao nvel de confiana associado aos resultados e ao erro cometido. O esquema seguinte ilustra a roda da disciplina de estatstica, relacionando os seus diferentes ramos:

POPULAO OU UNIVERSO Amostragem AMOSTRA

Previses Estimao Erros INFERIR DA AMOSTRA PARA O UNIVERSO

Estatstica Descritiva

TRATAMENTO E ANLISE DA AMOSTRA

Inferncia Estatstica

Grficos; tabelas; medidas descritivas

Manual Tcnico de Formador

Manual de Estatstica Aplicada

2. ESTATSTICA DESCRITIVA

Os resultados da observao de um atributo sobre os elementos do conjunto a analisar constituem os dados estatsticos. O ramo da estatstica que se ocupa do tratamento, apresentao e anlise de dados amostrais denomina-se de estatstica descritiva.

2.1. Variveis Qualitativas


Os dados qualitativos so organizados na forma de uma tabela de frequncias, que representa o nmero ni de elementos de cada uma das categorias ou classes e que chamado de frequncia absoluta. A soma de todas as frequncias igual dimenso da amostra (n). Numa tabela de frequncias, alm das frequncias absolutas, tambm se apresentam as frequncias relativas (fi), obtida dividindo a frequncia absoluta pelo nmero total de observaes.
Modalidades Mod. 1 Mod. j Mod. n Total Frequncias absolutas n1 nj nn n: dimenso da amostra Frequncias relativas f1 fj fn 1

fi =

ni ; ni: n de vezes que cada modalidade da varivel foi observada. n

Manual Tcnico de Formador

Manual de Estatstica Aplicada

Exemplo: 68 empresas agrupadas por sector de actividade Uma forma de resumir a informao contida nos dados construir uma tabela de frequncias em que se consideram as diferentes modalidades que o sector de actividade pode tomar:
Sector de actividade Indstria transformadora Construo e obras pblicas Comrcio e servios Financeiro Segurador Total N de empresas (ni) 25 6 14 19 4 68 % de empresas (fi) 36,8% 8,8% 20,6% 27,9% 5,9% 1

Estes dados podem tambm ser representados graficamente atravs de:

Diagrama de barras Para cada modalidade, desenha-se uma barra de altura igual frequncia absoluta ou relativa (as frequncias relativas so de preferir, pois permitem a comparao de amostras de diferentes dimenses).

40% 30% 20% 10% 0% IT COB CS F S

Diagrama sectorial ou circular Esta representao constituda por um crculo, em que se apresentam tantos sectores quantos as modalidades em estudo. O ngulo de cada sector proporcional s frequncias das classes, fazendo corresponder o total da amostra (n) a 360 (por exemplo, para a indstria transformadora, o ngulo ser de 360x36,8%=132,3). Geralmente, juntamente com a identificao da modalidade, indica-se a frequncia relativa respectiva.
Manual Tcnico de Formador 9

Manual de Estatstica Aplicada

6% 28% 36%

IT COB CS F S

21%

9%

2.2. Variveis Quantitativas Discretas


So variveis que assumem um nmero finito ou infinito numervel de valores. A apresentao destas amostras semelhante s variveis qualitativas, fazendo-se uma tabela de frequncias e uma representao grfica recorrendo ao diagrama de barras.
Valores da varivel X1 Xj Xn Total Frequncias absolutas n1 nj nn n: dimenso da amostra Frequncias relativas f1 fj fn 1

Exemplo: X o n de defeituosos por embalagem numa amostra de 200


N de defeituosos (X) 0 1 2 3 4 Total N de embalagens (ni) 80 60 30 20 10 200 % de embalagens (fi) 40% 30% 15% 10% 5% 1

50% 40% 30% 20% 10% 0%

0 1
Manual Tcnico de Formador

12

23

34

45
10

Manual de Estatstica Aplicada

Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi) acumuladas:


N defeituosos (X) 0 1 2 3 4 Total N embalagens (ni) 80 60 30 20 10 200 % embalagens (fi) 40% 30% 15% 10% 5% 1 Ni 80 80+60 170 190 200 Fi 40% 40%+30% 85% 95% 100%

2.3. Variveis Quantitativas Contnuas


Como foi dito anteriormente, uma varivel (ou atributo) contnua quando assume um nmero infinito no numervel de valores, isto , podem assumir qualquer valor dentro de um intervalo. Neste caso, a construo da tabela compreende duas etapas: (i) Definio de classes de valores disjuntas, correspondentes a intervalos de nmeros reais fechados esquerda e abertos direita, cuja constituio obedece a certas regras
(ii) Contagem das observaes pertencentes a cada classe

Regra de construo de classes (pressupe a formao de classes de igual amplitude) - Nmero de classes a constituir Depende de n = dimenso da amostra Se n25, o nmero de classes a constituir deve ser 5 Se n<25, o nmero de classes a constituir deve ser n - Amplitude comum a todas as classes Sendo a amplitude total dos dados dada pela diferena entre o valor mximo e o valor mnimo observados, ento a amplitude de cada classe ser:

Valor mximo da varivel observado Valor mnimo da varivel observado N de classes a constituir

Manual Tcnico de Formador

11

Manual de Estatstica Aplicada

Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn] Total

Frequncias absolutas n1 nj n n: dimenso da amostra

Frequncias relativas f1 fj fn 1

Exemplo: Estudo do rcio de autonomia financeira de uma amostra de 68 empresas


Rcio (X) [0; 0.5[ [0.5; 1[ [1; 1.5[ [1.5; 2[ [2; 3[ [3; 6] Total N de empresas (ni) 4 22 26 10 4 2 68 % de empresas (fi) 5.9% 32.4% 38.2% 14.7% 5.9% 2.9% 1 Amplit (hi) 0.5 0.5 0.5 0.5 1.0 3.0 fi/hi 11.8% 64.7% 76.5% 29.4% 5.9% 1%

A distribuio de frequncias representa-se atravs de um histograma. Um histograma uma sucesso de rectngulos adjacentes, em que a base uma classe e a altura a frequncia (relativa ou absoluta) por unidade de amplitude (ni/ai ou fi/ai), sendo a amplitude de cada classe ai=ei-ei-1. A rea total do histograma a soma das frequncias relativas, isto , 1.

fi/hi

90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 0 0,5 1 1,5 2 2,5 3 3,5 4 4,5 5 5,5 6

racio

Manual Tcnico de Formador

12

Manual de Estatstica Aplicada

1. Esta distribuio permite visualizar o tipo de distribuio e deve salientar alguns aspectos mais relevantes desta (moda, classe modal, ...). Como as classes podem ter amplitudes diferentes, para que todos os rectngulos (colunas) sejam comparveis necessrio corrigir as frequncias das classes (calculando as frequncias que se teria se a amplitude de todas as classes fosse igual e igual a 1)
2. prefervel representar o histograma com fi/hi do que com ni/hi uma vez

que deste modo possvel comparar distribuies com diferente nmero de observaes amostrais. Tambm possvel calcular as frequncias (absolutas Ni - e relativas - Fi) acumuladas:
Rcio (X) [0; 0.5[ [0.5; 1[ [1; 1.5[ [1.5; 2[ [2; 3[ [3; 6] Total N empresas (ni) 4 22 26 10 4 2 68 % empresas (fi) 5.9% 32.4% 38.2% 14.7% 5.9% 2.9% 1 Ni Fi 4 5.9% 4+22 5.9%+32.4% 4+22+26 76.5% 4+22+26+10 91.2% 66 97.1% 68 100%

2.4. Medidas de localizao


2.4.1. Mdia ( X ) a medida de localizao mais usada, sobretudo pela sua facilidade de clculo. Dados no-classificados (no agrupados numa tabela de frequncias)

x =

1 n

n i =1

xi

Mdia aritmtica simples

Dados classificados (isto , agrupados numa tabela de frequncias) Variveis discretas

Manual Tcnico de Formador

13

Manual de Estatstica Aplicada

x =

1 n

n i =1

ni x i

n i =1

f i xi

Mdia ponderada dos valores de X

Exemplo 2:

x =

0 x80 + ... + 4 x10 = 1,1 200

Dados classificados (isto , agrupados numa tabela de frequncias) Variveis contnuas


x = 1 n
n i =1 n i =1

ni ci

f i ci

Mdia ponderada dos pontos mdios das classes


lim . inf . + lim . sup . ) 2

onde ci o ponto mdio de cada classe (

Exemplo 3:

x = 0,059 x0,25 + ... + 0.029 x 4,5

= 1,2705

A mdia uma medida de localizao que, geralmente, indica o valor central da distribuio, entendido como o valor em torno do qual se distribuem os valores observados. Desta forma, a mdia muitas vezes utilizada como valor representativo da amostra. No entanto, a mdia tem o grande inconveniente de ser sensvel a valores muito extremados ou aberrantes da distribuio (outliers). Em casos desses, a mdia deixa de ser um valor que aparece na parte central da distribuio para ser empurrada para os extremos. Nestes casos, prefervel recorrer informao complementar fornecida por outras medidas de localizao, como a moda e a mediana, que se definem a seguir.

2.4.2. Mediana (Me) A mediana no se calcula a partir do valor de todas as observaes, mas a partir da posio dessas observaes.

Manual Tcnico de Formador

14

Manual de Estatstica Aplicada

Dados no-classificados Se tivermos n valores x1, x2, ... xn Se n fr mpar,

Me = x n+1
2

Se n fr par,

xn + xn Me =
Exemplo Para n=5 (mpar) 8,9 13
2 2

+1

13,5 20,2 105,8

Me =

x 5+1 =
2

x3 = 13,5

Para n=6 (par) 7,2 7,6 11,7 12,5 13,6 191

x6 + Me =
2

x6
2

+1

x3 + x 4 11,7 + 12,5 = 2 2

= 12,1

Dados classificados A mediana o valor tal que Fi = 0,5 Variveis discretas Se existe um valor de xi para o qual Fi = 0,5, ento fala-se em intervalo mediano. Se no existe nenhum valor de xi para o qual Fi = 0,5, ento a mediana o primeiro valor para o qual Fi > 0,5.
Manual Tcnico de Formador 15

Manual de Estatstica Aplicada

Exemplo 2: Mediana = 1 (com Fi = 0.7, primeiro valor que ultrapassa 0,5), o que quer dizer que pelo menos em metade das embalagens apareceu 1 artigo defeituoso ou menos.

Variveis contnuas Em geral, determina-se o valor para o qual Fi = 0,5 atravs de uma regra de trs simples, atendendo a que as frequncias acumuladas variam uniformemente dentro de cada classe. Exemplo 3: Classe mediana (classe a que corresponde frequncia acumulada 0,5): 1 : Fi =0,383 1,5 : Fi = 0,765 Clculo da mediana: 0,765 - 0,383 ------------ 1,5 - 1 0,5 0,383 -------------- Me 1 Me = 1+((0,5x0,17)/0,382)= 1,15 Isto , 50% das empresas apresentam rcio de autonomia financeira inferior a 1,15. De uma forma geral:
Me = L inf +

0.5 FL inf xamp. classe mediana FL sup FL inf

2.4.3. Moda (Mo) Variveis discretas A moda valor de X para o qual fi mximo, isto , o valor mais frequente da distribuio.
Manual Tcnico de Formador 16

Manual de Estatstica Aplicada

Exemplo 2: Mo=0 (com fi=0,4) Variveis contnuas A classe modal a classe de valores de X para o qual fi/hi mximo, isto , a classe a que corresponde maior frequncia por unidade de amplitude. Exemplo 3: Classe modal: [1-1,5[

2.5. Medidas de ordem


Tal como se definiu para a mediana, possvel definir outros valores de posio ou valores separadores da distribuio em partes iguais. Chama-se quantil de ordem p ao valor de x a que corresponde Fi = p. Se p=0,01; 0,02;.....0,99, chama-se ao quantil percentil Se p=0,1; 0,2;...0,9, chama-se ao quantil decil Se p=0,25, 0,5, 0,75, chama-se ao quantil QUARTIL (Q1, Q2 e Q3). A mediana uma caso particular dos quartis (coincide com Q2)
Mximo

Varivel discreta O quantil de ordem p o primeiro valor de x para o qual Fi>p. Varivel contnua Calcula-se por uma regra de trs simples, como a mediana. De uma forma geral:
Q1 = L inf +
25% maiores

0.25 FL inf xamp. classe Q1 FL sup FL inf


Q3
Mediana

0.75 FL inf Q3 = L inf + xamp. classe Q3 FL sup FL inf


Manual Tcnico de Formador

50% mais centrais

Q1

Mnimo17

25% menores

Manual de Estatstica Aplicada

A representao grfica destas medidas designa-se de diagrama de extremos e quartis e serve para realar algumas caractersticas da amostra. Os valores da amostra compreendidos entre os 1 e 3 quartis so representados por um rectngulo (caixa) com a mediana indicada por uma barra. Seguidamente, consideram-se duas linhas que unem os meios dos lados do rectngulo com os extremos da amostra. Utilizando os valores do exemplo 3 (Q1=0,795; Q3=1.48), resulta o diagrama da pgina anterior. Esta distribuio est fortemente concentrada em torno de valores baixos da varivel (rcio de autonomia financeira), j que 75% dos valores se encontram num espectro muito reduzido. Ao contrrio, 25% das empresas correspondem a um espectro muito amplo, entre 1,48 (Q3) e 6. Isto , h muitas empresas com baixo rcio de autonomia financeira (at valores um pouco acima de 1) e poucas empresas com rcios elevados. A distribuio diz-se enviesada ou simtrica esquerda. Ou seja, a partir deste diagrama, pode reconhecer-se a simetria ou enviesamento dos dados e a sua maior ou menor concentrao:

Dados simtricos

Assimetria direita

Assimetria esquerda

2.6. Medidas de assimetria


A assimetria tanto maior quanto mais afastados estiverem os valores da mdia, mediana e moda. Concretamente, se:

X = Me = Mo, a distribuio diz-se simtrica X > Me > Mo, a distribuio diz-se assimtrica positiva (ou enviesada

esquerda)
X < Me < Mo, a distribuio diz-se assimtrica negativa (ou enviesada

direita)

Manual Tcnico de Formador

18

Manual de Estatstica Aplicada

Coeficiente de assimetria de Bowley (g):

(Q3 Q 2) (Q 2 Q1) Q3 Q1

Se g = 0 ..............a distribuio simtrica positiva ou equilibrada Os quartis esto mesma distncia da mediana. Se g > 0 ..............a distribuio assimtrica positiva ou puxada para a esquerda (se fr = 1, assimetria mxima) A mediana desliza para o lado do Q1, logo Q3-Q2 > Q2-Q1 Se g < 0 ..............a distribuio assimtrica negativa ou puxada para a direita (se fr = -1, assimetria mxima) A mediana desliza para o lado do Q3, logo Q2-Q1 > Q3-Q2
Q1 Q2

Q3

Assimtrica positiva
Q2 Q3

Q1

Assimtrica negativa

2.7. Medidas de disperso


Duas distribuies podem distinguir-se na medida em que os valores da varivel se dispersam relativamente ao ponto de localizao (mdia, mediana, moda). Apresentam-se de seguida algumas das mais utilizadas, classificadas consoante a medida de localizao usada para referenciar a disperso das observaes: 2.7.1 Medidas de disperso absoluta
(i)

Em relao mediana Amplitude inter-quartis = Q = Q3 Q1 Significa que 50% das observaes se situam num intervalo de amplitude Q. Quanto maior (menor) a amplitude do intervalo, maior (menor) a disperso em torno da mediana.

Manual Tcnico de Formador

19

Manual de Estatstica Aplicada

(ii)

Em relao mdia Varincia amostral: mede os desvios quadrticos de cada valor observado em relao mdia, havendo pouca disperso se os desvios forem globalmente pequenos, e havendo muita disperso se os desvios forem globalmente grandes. Dados no-classificados 2 1 n 2 s = xi x n i =1

Dados classificados Variveis discretas

1 s = n
2

n i =1

ni xi x =

n i =1

fi xi x

Dados classificados Variveis contnuas

1 s = n
2

n i =1

ni ci x

n i =1

fi ci x

onde ci o ponto mdio de cada classe i. Desvio-padro: Medida de disperso com significado real, mas que s possvel calcular indirectamente, atravs da raiz quadrada da varincia. Est expressa nas mesmas unidades da varivel.

2.7.2 Medidas de disperso relativa Muitas vezes, avaliar a disperso atravs de um indicador de disperso absoluta no conveniente, assim como comparara a disperso de duas distribuies, uma vez que estas medidas vm expressas na mesma unidade da varivel como o caso, por exemplo, da varincia. Assim, de esperar que os valores da varincia sejam mais elevados quando os valores da varivel so maiores, o que no significa que a distribuio seja muito dispersa. Para

Manual Tcnico de Formador

20

Manual de Estatstica Aplicada

comparar diferentes distribuies de frequncia so precisas medidas de disperso relativa:


Disperso absoluta Medida de localiza o em relao qual est definida

Disperso relativa =

Coeficiente de variao
CV = s x100% x

Outras medidas
Q3 Q1 Q2

Estas medidas no esto expressas em nenhuma unidade, e permitem comparar disperses entre duas amostras, pois no so sensveis escala (eventualmente diferente) em que as variveis estejam expressas.

2.8. Anlise da concentrao


A noo de concentrao apareceu associada ao estudo de desigualdades econmicas, como a repartio do rendimento ou a distribuio de salrios. O fenmeno de concentrao est relacionado com a variabilidade ou disperso dos valores observados, apesar de no poder ser analisado atravs das medidas de disperso atrs descritas, que apenas medem a disperso dos valores em relao a um ponto. O objectivo determinar como o atributo (rendimento, salrios, nmero de empresas) se distribui (se de forma mais ou menos uniforme) pelos diferentes indivduos da amostra (que devem ser susceptveis de serem adicionados, isto , a anlise de concentrao no se aplica a idade, altura, peso, etc). Se o atributo estiver igualmente repartido pelos indivduos, temos uma situao extrema de igual distribuio; e vice-versa de o atributo estiver concentrado

Manual Tcnico de Formador

21

Manual de Estatstica Aplicada

num s indivduo, temos uma situao extrema de mxima concentrao. Em geral, interessa medir o grau de concentrao em situaes intermdias.
Para analisar a concentrao, existem dois instrumentos: a Curva de Lorenz e o ndice de Gini.

2.8.1 Curva de Lorenz O objectivo comparar a evoluo das frequncias acumuladas (Fi = pi) com a evoluo da soma dos valores da varivel (qi)

Quadro de dados
Classes de valores da varivel [x1; x2[ [x2; x3[ [x3; x4[ [xn-1; xn[ Total ni n1 nj nn n Quantidade Freq.relativa Proporo atributo acumuladas atrib.acumul, yi p1 q1 yj yn pj pn=1 qj qn=1

Os pontos (pi;qi) pertencem ao quadrado (0,1) por (0,1). A curva que os une a curva de Lorenz. Se houver igual distribuio, a frequncia das observaes deve ter uma evoluo igual proporo do atributo correspondente, isto , pi=qi. Nesse caso, a curva de Lorenz coincide com a diagonal do quadrado, que designada de recta de igual repartio. Quanto mais a curva se afastar da recta, maior a concentrao. A zona entre a diagonal e acurva de Lorenz designa-se, por isso, de zona de concentrao.

2.8.2 ndice de Gini O ndice de Gini calculado pela seguinte expresso

Manual Tcnico de Formador

22

Manual de Estatstica Aplicada


n 1

( pi qi )
n 1 i =1

G=

i =1

pi

Quando G = 0, a concentrao nula, havendo igual repartio. Caso o valor de G seja 1, a concentrao ser mxima. O valor de G varia entre 0 e 1, e quanto maior o seu valor, maior a concentrao. Exemplo Considere-se a seguinte amostra de dimenso 200, referente aos lucros obtidos por empresas de um dado sector industrial, expressas numa determinada unidade monetria.
Lucros [0; 50[ [50; 100[ [100; 200[ [200; 300[ [300; 500] Total ni 20 60 80 30 10 200 Lucro total 600 4400 14000 7500 3500 30000 pi (=Fi) 0.1 0.4 0.8 0.95 1 qi 0.02 0.16(6) 0.63(3) 0.883(3) 1

Curva de Lorenz 1 0,8 0,6 0,4 0,2 0 0 0,2 0,4 0,6 0,8 1

Manual Tcnico de Formador

23

Manual de Estatstica Aplicada


n 1

( pi qi )
n 1 i =1

G=

i =1

= pi

0,546(6) = 0,243 2,25

Tanto pela anlise da Curva de Lorenz, como pelo valor do ndice de Gini, conclui-se que esta amostra apresenta concentrao moderada, encontrandose os valores razoavelmente repartidos.

2.9. Estatstica Descritiva Bidimensional


Numa situao em que se observam pares de valores (xi; yj), pode ter interesse estudar as relaes porventura existentes entre os dois fenmenos, nomeadamente relaes estatsticas. No se trata de estudar relaes funcionais (isto , a medida em que o valor de uma varivel determinado exactamente pela outra), mas sim de estudar a forma como a variao de uma varivel poder afectar a variao da outra, em mdia. (por exemplo, o peso e a altura normalmente esto relacionados, mas a relao no determinstica). Duas variveis ligadas por uma relao estatstica dizem-se correlacionadas. Se as variaes ocorrem, em mdia ou tendencialmente, no mesmo sentido, a correlao diz-se positiva. Se ocorrem em sentidos opostos, a correlao dizse negativa. Trata-se ento de estudar se:
-

Se existe alguma correlao entre os fenmenos ou variveis observadas A existir, se traduzvel por alguma lei matemtica, nem que tendencialmente A existir, se possvel medi-la

2.9.1 Diagrama de disperso

Manual Tcnico de Formador

24

Manual de Estatstica Aplicada

Para ilustrar o estudo de dados bivariados (valores emparelhados), considerese o exemplo seguinte referente ao peso e altura de 10 indivduos:

Indivduo A B C D E F G H I J

Peso (kg) 72 65 80 57 60 77 83 79 67 68

Altura (cm) 175 170 185 154 165 175 182 178 175 173

A representao grfica dos dados bivariados designa-se de diagrama de disperso. O diagrama de disperso uma representao grfica em que cada par de dados (xi, yj) representado por um ponto de coordenadas num sistema de eixos ordenados.
Diagrama de Disperso
190

180 Altura (cm)

170

160

150 50 60 70 Peso (kg) 80 90

2.9.2 Regresso Simples Por vezes, a representao grfica do conjunto de dados bivariados sugere o ajustamento de uma recta a este conjunto de pontos, indicando a existncia de uma tendencial correlao linear entre as duas variveis, como o caso do

Manual Tcnico de Formador

25

Manual de Estatstica Aplicada

exemplo atrs descrito. A essa recta chama-se recta de regresso de y sobre x, que permite descrever como se reflectem em y (varivel dependente ou explicada) as modificaes processadas em x (varivel independente ou explicativa). Essa recta torna possvel, por exemplo, inferir (em mdia) a altura de um indivduo, conhecendo o respectivo peso. Um dos mtodos mais conhecidos de ajustar uma recta a um conjunto de dados o Mtodo dos Mnimos Quadrados, que consiste em determinar a recta que minimiza a soma dos quadrados dos desvios entre os verdadeiros valores de y e os obtidos a partir da recta que se pretende ajustar. Obtm-se assim a recta de regresso ou recta dos mnimos quadrados. Assim, se a recta de regresso obedecer seguinte frmula geral:

y = a + bx
o mtodo permite minimizar a soma dos desvios quadrticos yi - (a + bxi). Assim sendo, obtm-se:
b= xi y i n x y xi n x
2 2

a = y bx

Matematicamente, b designa o declive da recta. Em termos estatsticos, b corresponde ao coeficiente de regresso de y sobre x, que indica a variao mdia de y que acompanha uma variao unitria de x. O valor de a designa a ordenada na origem, isto , o valor que y assume quando x=0. No exemplo, vem:
Recta de Regresso
190

180 Altura (cm)

y = 0,9016x + 109,36

170

160

150 50 60 70 Peso (kg) 80 90

Manual Tcnico de Formador

26

Manual de Estatstica Aplicada

A equao desta recta traduz-se em Altura = 109,36 + 0,9016 x Peso Isto , se um indivduo pesar 70 kg, a altura esperada ser de 109,36 + 0,9016 x 70 = 172,472. Por cada kg de peso adicional, espera-se que a altura do indivduo aumente 0,9016 cm.

2.9.3 Correlao linear Quando, quer atravs do diagrama de disperso, quer atravs da recta de regresso, se verifica a existncia de uma associao linear entre as variveis, pode-se medir a maior ou menor fora com que as variveis se associam atravs do coeficiente de correlao linear r:
r= s xy s xx s yy , s xy =
n i =1

( xi x)( y i y )

Este indicador da correlao tem a vantagem de no depender das unidades ou da ordem de grandeza em que as variveis esto expressas. O coeficiente de correlao linear est sempre compreendido entre 1 e 1. Se r > 0, ento pode dizer-se que existe uma correlao positiva entre as variveis, isto , as variveis variam no mesmo sentido: um aumento (diminuio de x) provoca um aumento (diminuio) de y, mas menos que proporcional. Se r < 0, ento pode dizer-se que existe uma correlao negativa entre as variveis, isto , as variveis variam em sentidos opostos: um aumento (diminuio de x) provoca uma diminuio (aumento) de y, mas menos que proporcional. Se r = 0, ento pode dizer-se que as variveis no esto correlacionadas linearmente. Antes de se efectuar um estudo de correlao, deve-se procurar justificao terica para a existncia ou inexistncia de correlao. Caso contrrio, poder acontecer que variveis sem relao de causalidade entre si, variem num certo

Manual Tcnico de Formador

27

Manual de Estatstica Aplicada

sentido por razes exteriores. A esta correlao ilusria, chama-se correlao espria. Nos extremos, se r = 1 ou se r = -1, ento pode dizer-se que existe uma correlao positiva ou negativa perfeita, respectivamente, entre as variveis, isto , uma variao numa varivel provoca na outra uma variao exactamente proporcional no mesmo sentido ou em sentido contrrio. Isto , a correlao mxima. No exemplo, r = 0,90681871, isto , existe uma correlao positiva forte entre as duas variveis, quase perfeita.

2.9.4 Correlao ordinal Por vezes, as variveis vm expressas numa escala ordinal, isto , interessa mais conhecer a ordenao dos valores do que os valores observados propriamente ditos. Neste caso, em vez do coeficiente de correlao linear, calcula-se o coeficiente de correlao ordinal:

rs = 1 6

i =1

di
2

n(n 1)

, d i = Ri Ri

Ordens (ranks) das observaes de X e de Y, respectivamente

Exemplo Considere que 10 estudantes foram sujeitos a uma prova de avaliao no incio e no final do curso. No quadro abaixo, encontram-se as ordenaes desses 10 estudantes segundo as classificaes obtidas em cada uma das provas:

Manual Tcnico de Formador

28

Manual de Estatstica Aplicada

Aluno A B C D E F G H I J

Prova inicial Rix 1 3 2 5 7 8 9 10 6 4

Prova final Riy 1 2 3 4 6 8 7 9 10 5

di Rix - Riy 0 1 -1 1 1 0 2 1 -4 -1

Como no dispomos das classificaes dos alunos, mas sim das ordenaes das classificaes (do 1 ao 10 classificado), para avaliar a correlao existente entre as 2 provas necessrio calcular o coeficiente de correlao ordinal:
n

rs = 1 6

i =1

di
2

n(n 1)

= 1

6 x(0 + 1 + 1 + 1 + 1 + 0 + 4 + 1 + 16 + 1) = 0,8424 10 x(100 1)

A correlao positiva e elevada (rs varia entre 1 e 1), isto , os alunos que tiveram boa nota na prova inicial tiveram, em mdia, igualmente boa nota na prova final.

Manual Tcnico de Formador

29

Manual de Estatstica Aplicada

ESTATSTICA DESCRITIVA
Exerccios resolvidos
Exerccio 1 Considere a distribuio de 1000 empresas de um sector de actividade segundo os resultados lquidos (em milhares de u.m.):
Resultado Lquido [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total Frequncia. Relativa (%) 10 25 35 15 10 5 100

a) Represente a distribuio graficamente. b) Determine a mdia e a moda da distribuio. Qual o significado dos valores encontrados? c) Calcule as frequncias acumuladas e represente-as graficamente. Determine a mediana da distribuio. d) Determine os quartis da distribuio. Faa a sua representao grfica. e) Analise a (as)simetria da distribuio em causa.
f)

Analise a concentrao atravs do ndice de Gini e da Curva de Lorenz.

Resoluo

a)

fi/hi 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 10 20 30 40 50 60

Manual Tcnico de Formador

30

Manual de Estatstica Aplicada

[0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50]


Total

fi 10% 25% 35% 15% 10% 5% 1

hi 1 2 2 10 10 25

fi/hi 0.1 0.125 0.175 0.015 0.01 0.002

Fi 10% 35% 70% 85% 95% 100%

ci 0.5 2 4 10 20 37.5

b) x =

1 n

n i =1

ni c i

n i =1

f i ci

= (0,5 x10%) + (2 x 25%) + ... + (37.5 x5%) = 7,325

Em mdia, o resultado lquido de uma empresa de 7325 unidades monetrias. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 0,175. correspondente classe
[3; 5[, isto , os valores de resultado lquido mais provveis para uma empresa

situam-se entre 3000 u.m. e 5000 u.m. c) A representao grfica das frequncias acumuladas (ver tabela) designa-se de polgono integral:
Fi
1 0,8 0,6 0,4 0,2 0 0 20 40 60 80 100 120

Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [3; 5[ 3 : Fi=0,35 5 : Fi = 0,7

Manual Tcnico de Formador

31

Manual de Estatstica Aplicada

Clculo da mediana: 0,7 - 0,35 ------------ 5 - 3 0,5 0,35 -------------- Me 3 Me = 3 + ((2x0,15)/0,35) = 3,857 50% das empresas apresentam resultados lquidos inferiores a 3857 u.m. d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 3[ 1 : Fi=0,1 3 : Fi = 0,35 Clculo do Q1: 0,35 - 0,1 ------------ 3 - 1 0,25 0,1 -------------- Q1 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas apresentam resultados lquidos inferiores a 2200 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,7 15 : Fi = 0,85 Clculo do Q3: 0,85 - 0,7 ------------ 15 - 5 0,75 0,7 -------------- Q3 5 Q3 = 1 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas apresentam resultados lquidos inferiores a 8333 u.m.

e)
g' =

(Q3 Q 2) (Q 2 Q1) (8,333 3,857) (3,857 2,2) = = 0,4596 > 0 Q3 Q1 8,333 2,2

A distribuio assimtrica positiva ou enviesada esquerda.

Manual Tcnico de Formador

32

Manual de Estatstica Aplicada f)

X [0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50[ Total

fi 10% 25% 35% 15% 10% 5% 1

ni 1000x10%=100 250 350 150 100 50 n=1000

ci 0.5 2 4 10 20 37.5

Atributo 100x0.5=50 250x2=500 1400 1500 2000 1875 7325

pi (=Fi) 0.1 0.35 0.7 0.85 0.95 1

qi 0.007 0.075 0.266 0.471 0.744 1

50 + 500 + 1400 7325

Res.Liq.Totais

G=

(0,1 0,007) + ... + (0,95 0,744) = 0,47 0,1 + 0,35 + 0,7 + 0,85 + 0,95
Curva de Lorenz 1

A distribuio dos resultados lquidos apresenta concentrao mdia (G=0,5 corresponde ao centro da escala possvel, entre 0 e 1). Por exemplo, 70% das empresas apresentavam resultados at 5000 u.m., mas isso representava apenas 26,6% do total de resultados das empresas da
0,2 0,8

0,6

0,4

amostra, o que sugere um tecido empresarial com muitas PMEs, mas em que cada uma tem baixo resultado lquido.

0 0 0,2 0,4 0,6 0,8 1

Manual Tcnico de Formador

33

Manual de Estatstica Aplicada

Exerccio 2 O quadro que se segue descreve a distribuio do rendimento anual (em milhares de u.m.) de 2500 famlias da populao de um pas:
Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ N de famlias 250 375 625 750 375 125

a) Represente as frequncias acumuladas graficamente. b) Determine o rendimento mdio e mediano. c) Determine os 3 primeiros quartis. Que indicaes do sobre a (as)simetria? d) O que pode concluir quanto disperso? e) Calcule o ndice de Gini. O que conclui sobre a concentrao do rendimento?
Resoluo

a)

Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[

N de famlias 250 375 625 750 375 125

% de famlias 10 15 25 30 15 5

Fi (%) 10 25 50 80 95 1

ci 0.5 1.5 3.5 10 20 37.5

1 0,8 0,6 0,4 0,2 0 0 10 20 30 40 50 60 70 80 90 100

b) x = 1

n i =1

ni c i

n i =1

f i ci

= (0,5 x10%) + (1.5 x15%) + ... + (37.5 x5%) = 9,025

Em mdia, o rendimento anual de uma famlia de 9025 unidades monetrias.

Manual Tcnico de Formador

34

Manual de Estatstica Aplicada

Classe mediana (classe a que corresponde uma frequncia acumulada 0,5): [2; 5[ 5 : Fi = 0,5. Logo, a mediana 5 (50% das famlias tm rendimentos anuais at 5000 unidades monetrias).

c) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1; 2[ 3 : Fi = 0,25 25% das famlias apresentam rendimentos anuais inferiores a 2000 u.m.

Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [5; 15[ 5 : Fi=0,5 15 : Fi = 0,8 Clculo do Q3: 0,8 - 0,5 ------------ 15 - 5 0,75 0,5 -------------- Q3 5 Q3 = 5 + ((10x0,25)/0,3) = 13,333(3) 75% das famlias apresentam rendimentos anuais inferiores a 13333 u.m.
g' = (Q3 Q 2) (Q 2 Q1) (13,333 5) (5 2) = = 0,47 > 0 Q3 Q1 13,333 2

A distribuio assimtrica positiva ou enviesada esquerda.

d) s x =

n i =1
2

fi * ci x

n i =1

fici 2 x = 82,286875

s x = s x = 82,286875 = 9,071

e)

Rendimento anual [0, 1[ [1, 2[ [2, 5[ [5, 15[ [15, 25[ [25, 50[ Total

ni 250 375 625 750 375 125 2500

ci 0.5 1.5 3.5 10 20 37.5

Rend. total 125 562,5 2187,5 7500 7500 4687.5 22562,5

pi (=Fi) 0,1 0,25 0,5 0,8 0,95 1

qi 0.00554 0.0305 0.1274 0.46 0.7922 1

Manual Tcnico de Formador

35

Manual de Estatstica Aplicada


n 1

( pi qi )
n 1 i =1

G=

i =1

= pi

1,18436 = 0,4555 2,6

Concentrao moderada do rendimento

Exerccio 3 Considere a seguinte tabela que representa a distribuio dos empregados de uma instituio bancria segundo a remunerao bruta mensal (em milhares de unidades monetrias):
Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100

a) Calcule os quartis da distribuio. b) Analise a disperso da distribuio em causa. c) Analise a assimetria da distribuio em causa.

Resoluo

a)

Remunerao [60; 80[ [80; 100[ [100; 120[ [120; 140[ [140; 160[ [160; 200[ [200; 250[ [250, 300[ [300; 350] Total

Frequncia. Relativa (%) 7.8 15.2 31.2 19.5 7.2 8.1 5.4 2.6 3.0 100

Fi (%) 7.8 23 54.2 73.7 80.9 89 94.4 97 100

Manual Tcnico de Formador

36

Manual de Estatstica Aplicada

Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [100; 120[ 1 : Fi=0,23 3 : Fi = 0,542 Clculo do Q1: 0,542 - 0,23 ------------ 120 - 100 0,25 - 0,23 -------------- Q1 - 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 25% dos empregados auferem remuneraes inferiores a 101,28 milhares u.m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [100; 120[ 100 : Fi=0,23 120 : Fi = 0,542 Clculo do Q2: 0,542 - 0,23 ------------ 120 - 100 0,5 - 0,23 -------------- Q2 - 100 Q2 = 100 + ((20x0,27)/0,312) = 117,3 50% dos empregados auferem remuneraes inferiores a 117,3 milhares u.m. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [140; 160[ 120 : Fi=0,737 140 : Fi = 0,809 Clculo do Q3: 0,809 - 0,737 ------------ 160 - 140 0,75 0,737 -------------- Q3 - 140 Q3 = 140 + ((20x0,013)/0,072) = 143,61(1) 75% dos empregados auferem remuneraes inferiores a 143,61(1) milhares u.m. b) Amplitude do intervalo inter-quartis = Q3 - Q1 = 143,61(1) - 101,28 = 42,33 (disperso reduzida em torno da mediana)

Manual Tcnico de Formador

37

Manual de Estatstica Aplicada

c) g ' =

(Q3 Q 2) (Q 2 Q1) (143,61 117,3) (117,3 101,28) = = 0,243 > 0 Q3 Q1 143,61 101,28

A distribuio assimtrica positiva ou enviesada esquerda.

Exerccio 4 Os dados seguintes referem-se ao peso, expresso em gramas, do contedo de uma srie de 100 garrafas que, no decurso de um teste, saram de uma linha de enchimento automtico:
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total Frequncia. Relativa (%) 8 21 28 15 11 10 5 1 1 100

a) Represente graficamente os dados acima. b) Calcule as frequncias acumuladas e represente-as graficamente. c) Determine o peso mdio, mediano e modal. Qual o seu significado? d) Determine os quartis da distribuio. e) Analise a disperso do peso das garrafas.
Resoluo

a)

0,3 0,25 0,2 0,15 0,1 0,05

Histograma

0 296 297 298 299 300 301 302 303 304 305 306 307

Manual Tcnico de Formador

38

Manual de Estatstica Aplicada

b)
Peso (em gramas) [297; 298[ [298; 299[ [299; 300[ [300; 301[ [301; 302[ [302; 303[ [303; 304[ [304; 305[ [305; 306] Total
F* 1 0,8 0,6 0,4 0,2 0 295 296 297 298 299 300 301 302 303 304 305 306 307 308 309 310

Frequncia Relativa (%) 8 21 28 15 11 10 5 1 1 100

Fi (%) 8 29 57 72 83 93 98 99 100

c)
x = 1 n
n i =1

ni c i

n i =1

f i ci

= (297,5 x8%) + (298,5 x 21%) + ... + (305,5 x1%) = 300,11

O peso mdio das garrafas de 300,11 kg. Classe mediana (classe a que corresponde frequncia acumulada 0,5): [299; 300[ 299 : Fi = 0,29 300 : Fi = 0,57 Clculo do Q2: 0,57 - 0,29 ------------ 300 - 299 0,5 - 0,29 -------------- Q2 - 299 Q2 = 299 + ((1x0,21)/0,28) = 299,75 50% das garrafas tm peso inferior a 299,75 kg. A classe modal aquela a que corresponde maior frequncia relativa. Neste caso, o maior valor de fi 0,28 correspondente classe [299; 300[, isto , os pesos mais provveis das garrafas situam-se entre 299 kg e 300 kg.

Manual Tcnico de Formador

39

Manual de Estatstica Aplicada

d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [298; 299[ 298 : Fi=0,08 299 : Fi = 0,29 Clculo do Q1: 0,29 - 0,08 ------------ 298 - 299 0,25 - 0,08 ------------ Q1 - 299 Q1 = 299 + ((1x0,17)/0,21) = 299,0357 25% das garrafas tm peso inferior a 299,0357 kg. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [301; 302[ 301 : Fi=0,72 302 : Fi = 0,83 Clculo do Q3: 0,83 - 0,72 ------------ 302 - 301 0,75 0,72 -------------- Q3 - 301 Q3 = 301 + ((1x0,03)/0,11) = 301,27(27) 75% das garrafas tm peso inferior a 301,27(27) kg. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 301,27(27) - 299,0357 = 2,237 (disperso reduzida em torno da mediana)

Exerccio 5 Numa faculdade, mediram-se as alturas de 100 alunos do primeiro ano:


Altura (em metros) [1,4; 1,5[ [1,5; 1,55[ [1,55; 1,6[ [1,6; 1,65[ [1,65; 1,7[ [1,7; 1,75[ [1,75; 1,8[ [1,8; 1,9] Total N Alunos 2 10 25 13 17 20 10 3 100

Manual Tcnico de Formador

40

Manual de Estatstica Aplicada

a) Represente graficamente os dados acima. b) Determine a altura mdia e a altura modal. Qual o seu significado? c) Calcule as frequncias acumuladas e represente-as graficamente. d) Determine os quartis da distribuio e diga qual o seu significado. e) Analise a disperso da distribuio. f) Analise a (as)simetria da distribuio.
Resoluo

a)

Altura (em metros)

[1,4; 1,5[ [1,5; 1,55[ [1,55; 1,6[ [1,6; 1,65[ [1,65; 1,7[ [1,7; 1,75[ [1,75; 1,8[ [1,8; 1,9] Total
fi/hi

ni 2 10 25 13 17 20 10 3 100

fi 0,02 0,1 0,25 0,13 0,17 0,2 0,1 0,03 1

ci 1,45 1,525 1,575 1,625 1,675 1,725 1,775 1,85

hi 0,1 0,05 0,05 0,05 0,05 0,05 0,05 0,1

fi/hi 0,2 2 5 2,6 3,4 4 2 0,3

Fi 0,02 0,12 0,37 0,5 0,67 0,87 0,97 1

6 5 4 3 2 1 0

Histograma

1,4

1,5

1,6

1,7

1,8

1,9

b) x = 1

n i =1

ni c i

n i =1

f i ci

= (1,45x 2%) + (1,525x10%) + ... + (1,85x3%) = 1,65

A altura mdia dos alunos de 1,65 m. A classe modal aquela a que corresponde maior frequncia por unidade de amplitude. Neste caso, o maior valor de fi / hi 5. correspondente classe
[1,55; 1,6[, isto , a altura mais provvel de um aluno rondar 1,55m / 1,6m.

c)

F* 1 0,8 0,6 0,4 0,2 0 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2

Manual Tcnico de Formador

41

Manual de Estatstica Aplicada

d) Classe a que pertence Q1 (classe a que corresponde uma frequncia acumulada 0,25): [1,55; 1,6[ 1,55 : Fi=0,12 1,6 : Fi = 0,37 Clculo do Q1: 0,37 0,12 ------------ 1,6 1,55 0,25 0,12 ------------ Q1 1,55 Q1 = 1,55 + ((0,05x0,13)/0,25) = 1,576 25% dos alunos tm altura inferior a 1,576 m. Classe a que pertence Q2 (classe a que corresponde uma frequncia acumulada 0,5): [1,6; 1,65[ 1,65 : Fi = 0,5 50% dos alunos tm altura inferior a 1,65 m. Classe a que pertence Q3 (classe a que corresponde uma frequncia acumulada 0,75): [1,7; 1,75[ 1,7 : Fi=0,67 1,75 : Fi = 0,87 Clculo do Q3: 0,87- 0,67------------ 1,75 1,7 0,75 0,67-------------- Q3 1,7 Q3 = 1,7 + ((0,05*0,08)/0,2) = 1,72 75% dos alunos tm altura inferior a 1,72 m. e) Amplitude do intervalo inter-quartis = Q3 - Q1 = 1,72 1,576 = 0,144 (disperso reduzida em torno da mediana)

sx =

n i =1

fi * ci x
2

n i =1

fici 2 x = 0,00536875

s x = s x = 0,00536875 = 0,07327

(disperso reduzida em torno da mdia)


(Q3 Q 2) (Q 2 Q1) (1,72 1,65) (1,65 1,576) = = 0,027(7) < 0 Q3 Q1 1,72 1,576
42

f) g ' =

Manual Tcnico de Formador

Manual de Estatstica Aplicada

A distribuio ligeiramente assimtrica negativa ou enviesada direita (quase simtrica). Exerccio 6 Em determinada central telefnica, registou-se a durao das chamadas realizadas em Dezembro de 2001:
Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total N Chamadas 2000 1500 1000 300 200 5000

a) Represente graficamente as frequncias simples e acumuladas. b) Determine a durao mdia das chamadas e respectivo desvio-padro. c) Qual a durao da chamada mediana? Qual o significado do valor encontrado? d) Sabe-se que as chamadas realizadas durante o ano de 2001 apresentaram uma durao mdia de 10 minutos, com desvio-padro de 8,7 minutos. Compare, quanto disperso, as chamadas efectuadas em Dezembro com as que tiveram lugar durante todo o ano de 2001.
Resoluo

a)

Durao (em minutos) [0; 5[ [5; 10[ [10; 20[ [20; 30[ [30; 50] Total
fi/hi 0,1 0,08 0,06 0,04 0,02 0 0 10

ni 2000 1500 1000 300 200 5000

fi 0,4 0,3 0,2 0,06 0,04 1


Histograma

hi 5 5 10 10 20

fi/hi 0,08 0,06 0,02 0,006 0,002

Fi 0,4 0,7 0,9 0,96 1

ci 2,5 7,5 15 25 40

20

30

40

50

60

Manual Tcnico de Formador

43

Manual de Estatstica Aplicada

F* 1 0,8 0,6 0,4 0,2 0 0 10 20 30 40 50 60 70 80 90 100

b) x =

1 n

n i =1

ni c i

n i =1

f i ci

= (2,5 x 40%) + (7,5 x30%) + ... + (40 x 4%) = 9,35

A durao mdia de uma chamada de 9,35 minutos.

sx =

n i =1

fi * ci x
2

n i =1

fici 2 x = 81,4525

s x = s x = 0,00536875 = 9,025

c) Classe mediana (classe a que corresponde frequncia acumulada 0,5): [5; 10[ 5 : Fi = 0,4 10 : Fi = 0,7 Clculo da Me: 0,7 - 0,4 ------------ 10 - 5 0,5 - 0,4 ------------ Me - 5 Me = 5 + ((5x0,1)/0,3) = 6,67 50% das chamadas tm durao a 6,67 minutos. d) CVDez =
s x 9,025 = = 0,965 > x 9,35 CV2001 = sy y = 8,7 = 0,87 10

Exerccio 7 Uma empresa coligiu dados relativos produo de 12 lotes de um tipo especial de rolamento. O volume de produo e o custo de produo de cada lote apresentam-se na tabela:

Manual Tcnico de Formador

44

Manual de Estatstica Aplicada

Lote 1 2 3 4 5 6 7 8 9 10 11 12

Volume (unidades) 1500 800 2600 1000 600 2800 1200 900 400 1300 1200 2000

Custo (contos) 3100 1900 4200 2300 1200 4900 2800 2100 1400 2400 2400 3800

a) Analise a correlao existente entre volume e custo de produo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima o custo em funo do volume de produo.
Resoluo

a) r =

s xy s xx s yy

1 [(1500 1358,3)(3100 2708,3) + ... + (2000 1358,3)(3800 2708,3)] 12 = = 0,98 520854x 1145944

Correlao positiva quase perfeita. b)


6000 5000 4000 Custo 3000 2000 1000 0 0 500 1000 1500 Volume 2000 2500 3000 y = 1,4553x + 731,6

Exerccio 8 Um conjunto de empresas do sector da Construo e Obras Pblicas cotadas na Bolsa de Valores foram analisadas relativamente aos seguintes indicadores: EPS (Earnings per Share): Resultado Lquido por Aco PBV (Price/Book Value): Preo / Situao Lquida por Aco

Manual Tcnico de Formador

45

Manual de Estatstica Aplicada

Empresa 1 2 3 4 5 6 7 8 9

EPS ($) 191 32 104 117 210 95 65 201 81

PBV ($) 0.9 1.0 0.8 0.8 1.5 0.7 0.9 1.3 0.4

a) Analise a correlao existente entre aqueles dois indicadores.


b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que

exprima a varivel EPS em funo de PBV.

Resoluo

a) r =

s xy s xx s yy

1 [(191 121,7)(0,9 0,92) + ... + (81 121,7)(0,4 0,92)] =9 = 0,61 3669,332 x 0,096933

Correlao positiva moderada. b)

250 200 150 100 50 0 0 0,2 0,4 0,6 0,8 PBV 1 1,2 1,4 1,6 y = 124,04x + 7,383

Exerccio 9 Recolheu-se uma amostra em 17 cidades do pas relativamente aos seguintes indicadores: Ri: Rendimento mdio mensal na cidade i (em 106 unidades monetrias) Gi: Gasto mdio mensal em bens de luxo na cidade i (em 106 u.m.)

EPS

Manual Tcnico de Formador

46

Manual de Estatstica Aplicada

Ri 125 127 130 131 133 135 140 143 169 Dados adicionais

Gi 54 56 57 57 58 58 59 59 66

Ri 144 147 150 152 154 160 162 165

Gi 61 62 62 63 63 64 65 66

Ri = 2467
Gi = 62620
2

Gi = 1030 Ri Gi = 150270

Ri = 361073

a) Estude a correlao entre rendimento e despesas em bens de luxo. b) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que exprima a varivel Gi em funo de Ri.

Resoluo

a)

rXY =

Ri Gi n RG ( Ri n R )(
2 2

G nG )
2 i

150270 17 *
2

2467 1030 * 17 17

2467 1030 2 (361073 17 * )( 62620 17 * ) 17 2 17 2

= 0,986

Correlao positiva forte. b)


68 66 64 62 Gasto 60 58 56 54 52 50 100 120 140 160 180 200 y = 0,2604x + 22,801

Rendimento

Manual Tcnico de Formador

47

Manual de Estatstica Aplicada

Exerccio 10 O quadro abaixo apresenta as vendas e as despesas em publicidade (ambas em milhares de u.m.) de uma empresa no perodo de 7 anos:
Ano 1 2 3 4 5 6 7 Vendas 10 13 18 19 25 30 35 Desp. Publicidade 3 3 5 6 8 9 13

a) Compare as vendas e as despesas em publicidade quanto disperso. b) Analise a correlao existente entre volume e custo de produo.
c) Ajuste, pelo Mtodo dos Mnimos Quadrados, uma funo linear que

exprima as vendas em funo das despesas em publicidade.

Resoluo

a) Para comparar a disperso das duas distribuies, necessrio calcular os

coeficientes de variao (medidas de disperso relativa):


CV = s x

Dados no-classificados

x =
sx
2

1 n
n i =1

n i =1

xi = 21,429
2

y =
sy
2

1 n
n i =1

n i =1

yi = 6,714
2

1 = n

(xi x )

= 69,9408

1 = n

(yi y )

= 11,0651

CV x =

sx 69,9408 = = 0,39 x 21,429

<

CV y =

sy y

11,0651 = 0,495 6,714

A disperso das despesas em publicidade superior disperso das vendas. b)

r=

s xy s xx s yy

1 [(10 21,429)(3 6,714) + ... + (35 21,429)(13 6,714)] 7 = = 0,98 69,9408 x 11,0651

Manual Tcnico de Formador

48

Manual de Estatstica Aplicada

Existe uma correlao positiva linear forte entre as duas variveis. Em mdia, quando as despesas em publicidade aumentam (diminuem), as vendas aumentam (diminuem) de forma quase exactamente proporcional.
Recta de Regresso
y = 2,4649x + 4,8782 30

c)

Vendas

20

10

0 3 8 Desp. Public. 13

Manual Tcnico de Formador

49

Manual de Estatstica Aplicada

3. ESTATSTICA INDUTIVA

A estatstica indutiva o ramo da estatstica que se ocupa em inferir das concluses retiradas sobre a amostra para a populao. Claro que o processo de induo implica um certo grau de incerteza associado tentativa de generalizao de concluses da parte (amostra) para o todo (universo). O conceito de probabilidade vai ter aqui, ento, um papel fundamental. Isto , no vai ser possvel afirmar com toda a certeza que o comportamento da amostra ilustra perfeitamente o comportamento do universo, mas apenas que o faz com forte probabilidade. De seguida, sero apresentadas algumas noes simples de probabilidades e funes de probabilidade, que sero teis a aplicaes de estatstica indutiva relacionadas com controlo estatstico de qualidade e fiabilidade de componentes e sistemas.

3.1. Noes bsicas de probabilidade


A teoria das probabilidades um ramo da matemtica extremamente til para o estudo e a investigao das regularidades dos chamados fenmenos aleatrios. O exemplo seguinte pretende clarificar o que vulgarmente designado por experincia aleatria.
Exemplo

No lanamento de uma moeda, os resultados possveis so cara ou coroa. Em cada lanamento no possvel prever o resultado que se ir obter, embora ele seja determinado por causas bem definidas.

Manual Tcnico de Formador

50

Manual de Estatstica Aplicada

Deve entender-se como experincia qualquer processo ou conjunto de circunstncias capaz de produzir resultados observveis; quando uma experincia est sujeita influncia de factores casuais e conduz a resultados incertos, diz-se que a experincia aleatria. Fundamentalmente, as experincias aleatrias caracterizam-se por: (i) (ii) (iii) poder repetir-se um grande nmero de vezes nas mesmas condies ou em condies muito semelhantes cada vez que a experincia se realiza, obtm-se um resultado individual, mas no possvel prever exactamente esse resultado os resultados das experincias individuais mostram-se irregulares, mas os resultados obtidos aps uma longa repetio da experincia patenteiam uma grande regularidade estatstica no seu conjunto Alguns autores consideram inserido no conceito de experincia aleatria um outro, o de espao de resultados. O espao de resultados corresponde ao conjunto formado por todos os resultados possveis de uma experincia aleatria. Por exemplo, num lanamento de um dado ordinrio tem-se que o

1,2,3,4,5,6}. espao de resultados {


A importncia da definio deste conceito advm sobretudo por ser o meio empregue para a definio de acontecimentos, que no sei mais que subconjuntos do espao de resultados. Por exemplo, no lanamento de um dado podem definir-se, para alm dos 6 acontecimentos elementares correspondentes sada de cada uma das faces, outros como sada de um nmero mpar definido pelo subconjunto { 1,3,5}. Definidos como conjuntos, aos acontecimentos aplicvel toda a construo disponvel para aqueles, isto , existe um paralelismo perfeito entre lgebra de
conjuntos e lgebra de acontecimentos:

(i) (ii)

O acontecimento que contem todos os elementos do espao de resultados chama-se acontecimento certo O acontecimento que no contem qualquer elemento do espao de resultados chama-se acontecimento impossvel

Manual Tcnico de Formador

51

Manual de Estatstica Aplicada

(iii) (iv)

Dois acontecimentos so mutuamente exclusivos se no tm em comum qualquer acontecimento do espao de resultados A unio de dois acontecimentos A e B representa-se por A B e formado pelos elementos que pertencem a pelo menos um dos dois, A ou B

(v)

A interseco de dois acontecimentos A e B representa-se por A B e formado pelos elementos comuns a A e B

Probabilidade de um acontecimento expressa na escala de 0 a 1, sendo 0 a probabilidade associada a um acontecimento impossvel e 1 a probabilidade associada a um acontecimento certo. A primeira definio foi proposta por Laplace em 1812. Pode definir-se probabilidade de um acontecimento A como sendo: P(A) = Nmero de casos favorveis ao acontecimento A Nmero total de casos possveis na exp. aleatria

Uma das principais crticas a esta definio a de que ela s aplicvel quando o espao de resultados finito e os seus elementos possuem igual probabilidade; da que ela surja muito ligada aos jogos de azar, que possuem essas propriedades. o que acontece com as duas faces de uma moeda, as 52 cartas de um baralho, as 6 faces de um dado, etc. Para

se

analisar

probabilidade

de

ocorrncia

de

determinados

acontecimentos, deve ter-se em ateno o seguinte: Dois acontecimentos so ditos mutuamente exclusivos se no puderem acontecer ao mesmo tempo; se dois acontecimentos forem mutuamente exclusivos, ento: P(A B) = 0

A probabilidade de unio de dois acontecimentos mutuamente exclusivos dada por P (A B) = P(A) + P(B)

Para dois acontecimentos quaisquer, vem que P (A B) = P(A) + P(B) - P(A B)

Manual Tcnico de Formador

52

Manual de Estatstica Aplicada

Dois acontecimentos dizem-se complementares se: P(A) = 1 P( A ) Dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro; a probabilidade de ocorrncia de dois ou mais acontecimentos independentes o produto das probabilidades dos respectivos acontecimentos, isto : P(A B) = P(A) x P(B)

Exemplo

Em determinada populao, 9,8% das pessoas adquirem a revista A, 22,9% a revista B e 5,1% ambas. a) Qual a probabilidade de uma pessoa adquirir pelo menos uma das revistas? b) Qual a probabilidade de uma pessoa adquirir somente a revista A?
Resoluo

a) b)

P(A B) = P(A)+P(B)-P(A B) = 0,098+0,229-0,051 = 0,276 P(A B ) = P(A) - P(A B) = 0,098 0,051 = 0,047

Aps a apresentao desta definio, convm ainda referir que, numa outra perspectiva, a da chamada teoria frequencista, a probabilidade de um acontecimento definida como sendo o valor para o qual tende a frequncia relativa do acontecimento quando o nmero de repeties da experincia aumenta.

3.2. Probabilidade condicionada


Exemplo:

Um grupo de pessoas classificado de acordo com o seu peso e a incidncia de hipertenso. So as seguintes as propores das vrias categorias: Obeso Hipertenso No Hipertenso 0,1 0,15 Normal 0,08 0,45 Magro 0,02 0,2 Total 0,2 0,8

Manual Tcnico de Formador

53

Manual de Estatstica Aplicada

Total

0,25

0,53

0,22

1,00

a) Qual a probabilidade de uma pessoa escolhida ao acaso ser hipertensa? b) Qual a probabilidade de uma pessoa obesa ser hipertensa?
Resoluo

a) Basta ver que a proporo de hipertensos de 20% b) H que tomar em ateno que o que se pretende a proporo de hipertensos na populao de obesos, isto
0,1 = 0,4 . Por outras palavras, 0,25

pretende-se calcular a probabilidade do acontecimento ser hipertenso, sabendo que ocorreu o acontecimento ser obeso. Repare-se que este quociente resulta da diviso entre a probabilidade de uma pessoa ser hipertensa e obesa e a probabilidade de uma pessoa ser obesa. Pode escrever-se que a probabilidade pretendida dada por:
P( H / O) = P( H O) P (O)

onde P(H/O) a probabilidade de ocorrer o acontecimento ser hipertenso, sabendo que ocorreu ou condicionado pelo acontecimento ser obeso. Este exemplo corresponde ao clculo de uma probabilidade condicionada. Como se viu anteriormente, dois acontecimentos so ditos independentes se a ocorrncia de um no afectar a probabilidade de ocorrncia de outro, isto , se: P(A / B) = P(A) e se P(B / A) = P(B).
Teorema de Bayes

Seja B um acontecimento que se realiza se e s se um dos acontecimentos mutuamente exclusivos A1, A2,An se verifica. Aos acontecimentos A1, A2,An d-se o nome de acontecimentos antecedentes. O teorema de Bayes permite calcular a probabilidade posteriori de A1, A2, An, isto , a probabilidade de ocorrncia de A1, A2, An calculadas sob a hiptese de que B (acontecimento consequente) se realizou. De acordo com este teorema:
P ( Ai / B ) = P ( Ai ).P ( B / Ai )
n i =1

P ( Ai ).P ( B / Ai )

Este Teorema utiliza-se em situaes em que a relao causal est invertida.

Manual Tcnico de Formador

54

Manual de Estatstica Aplicada


n i =1

P ( Ai ).P ( B / Ai )

designa-se de probabilidade total de ocorrncia do

acontecimento B, isto , a probabilidade de ocorrncia do acontecimento consequente B face a todos os possveis acontecimentos A1, A2, An que o podem ter antecedido (ou causado a sua ocorrncia).
Exemplo:

Considere duas urnas, A e B. A urna A contm 1 bola branca e 999 bolas pretas e a urna B contm 1 bola preta e 999 bolas brancas. escolhida uma urna ao acaso, da qual extrada uma bola. Se esta preta, qual a probabilidade de que a urna A tenha sido escolhida?
Resoluo

Acontecimentos antecedentes A: escolha da urna A, com probabilidade 50% B: escolha da urna B, com probabilidade 50% Acontecimento consequente C extraco de bola preta, cuja probabilidade depende (est condicionada) pela urna escolhida P(C/A) = 999/1000 = 0,999 P(C/B) = 1/1000 = 0,001
P (C A) P ( A) xP (C / A) + P ( B ) xP (C / B )

Logo, pelo Teorema de Bayes, vem que P(A/C) = Substituindo pelos respectivos valores, P(A/C) =

0,5 x0,999 = 0,999 0,5 x0,999 + 0,5 x0,001

3.3. Funes de probabilidade


A probabilidade associada aos acontecimentos possveis numa experincia aleatria obedecem, por vezes, a um padro. Se associarmos a uma experincia aleatria uma varivel X (por exemplo, associar aos resultados da experincia lanamento de um dado - que so 6 (sada de face 1 a 6) a

Manual Tcnico de Formador

55

Manual de Estatstica Aplicada

varivel X:N da face resultante do lanamento de um dado), ento pode ser constituda uma lei ou funo de probabilidade (f(x)) dessa varivel X, tal que f(x) = P(X=xi) Por exemplo, para X: n da face resultante do lanamento de um dado, vem que: xi f(xi) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

que se designa por lei uniforme. Algumas leis de probabilidade servem para explicar (ou aplicam-se a) um maior nmero de fenmenos estatsticos do que outras. Entre estas, contam-se a lei Binomial, a lei de Poisson e a lei Exponencial.

(i) Lei Binomial

H alguns acontecimentos que so constitudos por um conjunto de experincias independentes, cada uma das quais com apenas dois estados possveis de ocorrncia e com uma probabilidade fixa de ocorrncia para cada um deles. Por exemplo, os produtos resultantes de uma fbrica podem ser classificados como sendo defeituosos ou sendo no defeituosos, e o facto de um ter sado (ou no) defeituoso no influencia os outros serem (ou no). A distribuio das duas classes possveis discreta e do tipo binomial. No exemplo anterior, consideremos uma amostra de n artigos retirados da produo total, em relao aos quais se pretende identificar a varivel X: N de artigos defeituosos nos n que constituem a amostra. A probabilidade de ocorrncia do acontecimento artigo defeituoso dada por p: incidncia de defeituosos na produo (convenientemente calculada atravs de mtodos de estimao). A probabilidade do acontecimento complementar artigo nodefeituoso dada por
1p=q

Manual Tcnico de Formador

56

Manual de Estatstica Aplicada

A probabilidade associada a x artigos defeituosos dada por px (p x p x p x p...x vezes). Se h x defeituosos, restam n-x artigos no-defeituosos, com probabilidade dada por qn-x. Para calcular o nmero exacto de combinaes de x artigos defeituosos com n-x artigos no-defeituosos, utiliza-se a figura combinaes de n, x a x, oriunda das tcnicas de clculo combinatrio. Vem ento que a probabilidade de existncia de x defeituosos (e logo n-x no defeituosos) igual a:
f ( x) = C xn p x q n x = n! p x q n x (n p )! p!

sendo que X segue Bi (n;p), sendo n e p os parmetros caracterizadores da lei. Um acontecimento deve ter 4 caractersticas para que se possa associar a uma lei binomial:
-

nmero fixo de experincias (n) cada experincia ter apenas duas classes de resultados possveis todas as experincias terem igual probabilidade de ocorrncia (p) as experincias serem independentes

Exemplo: Se 20% das bobinas de um determinado cabo elctrico forem defeituosas,

calcule a probabilidade de, entre as 4 bobines necessrias a um determinado cliente, escolhidas ao acaso uma ser defeituosa.
Resoluo: X: nmero de bobines defeituosas no conjunto de 4 bobines necessrias a um

determinado cliente (0,1,2,3,4) n=4


1

p=0,2

q=1-p=0,8

P(X=1)=C4p1q4-1 = 4*0,2*0,83 = 0,4096 = 41% Em sistemas elctricos de energia possvel, por exemplo, aplicar a distribuio binomial quando se pretende calcular a fiabilidade de uma central elctrica, com vrias unidades iguais e admitindo que cada unidade apenas pode residir em dois estados, a funcionar ou avariada.

Manual Tcnico de Formador

57

Manual de Estatstica Aplicada

(ii) Lei de Poisson

A lei de Poisson (ou lei dos acontecimentos raros ou cadenciados) d a probabilidade de um acontecimento ocorrer um dado nmero de vezes num intervalo de tempo ou espao fixado, quando a taxa de ocorrncia fixa (por exemplo, n de chamadas que chegam a uma central telefnica por minuto; n de varias que ocorrem numa mquina por dia). Os nmeros de acontecimentos de sucesso ocorridos em diferentes intervalos so independentes. O parmetro caracterizador da distribuio de Poisson , que corresponde ao nmero mdio de ocorrncias por unidade de tempo ou espao. Como o nmero mdio de ocorrncias do acontecimento proporcional amplitude do intervalo de tempo ou espao a que se refere, a varivel X: N de ocorrncias do acontecimento no intervalo [0,t[ segue lei de Poisson de parmetro t (isto , se para 1 unidade de tempo o n mdio de ocorrncias
, para t unidades de tempo o nmero mdio de ocorrncias t). A expresso

(t )x e t
x!
d a probabilidade de acontecerem x ocorrncias no intervalo de tempo [0,t[, e corresponde expresso da lei de probabilidade de Poisson : Po(t)
Exemplo: O nmero mdio de chamadas telefnicas a uma central, por minuto, 5. A

central s pode atender um nmero mximo de 8 chamadas por minuto. Qual a probabilidade de no serem atendidas todas as chamadas no intervalo de tempo de 1 minuto?
Resoluo: X: nmero de chamadas telefnicas atendidas numa central, por minuto (0,1,2,3,4, 5, 6, 7, 8) =5 p=0,2 q=1-p=0,8 5 x 8 e 5 P(X 8) = = 0,932 Logo P(X>8) = 1-0,932 = 0,068 x! x =0

Se X fr o N de avarias que ocorrem no intervalo de tempo [0,t[, ento a probabilidade de no ocorrerem avarias nesse intervalo, isto , a fiabilidade do componente/sistema como funo do tempo, dada por:

Manual Tcnico de Formador

58

Manual de Estatstica Aplicada

(t )0 e t = e t
0!
(iii) Lei Exponencial

Seja T a varivel Tempo ou espao que decorre entre ocorrncias consecutivas de um acontecimento. Ento T segue lei exponencial Exp (), sendo
1

o tempo que, em mdia, decorre entre ocorrncias sucessivas do acontecimento. Note-se que possvel estabelecer uma relao entre a lei exponencial e a lei de Poisson. Assim, se X fr o N de avarias que ocorrem no intervalo de tempo [0,t[, e T fr o Tempo que decorre entre avarias consecutivas, ento:
P (T>t)

= P(tempo que decorre entre avarias exceder t) = P(at ao instante t, no ocorre qualquer avaria) = P (ocorrerem zero avarias no intervalo [0,t[)
= P(X=0) = e
t

A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por

e t
A probabilidade de avariar at ao instante t dada por

1 e t
Exemplo: O tempo de funcionamento sem avarias de uma determinada mquina de

produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
Resoluo: Seja

Manual Tcnico de Formador

59

Manual de Estatstica Aplicada

T: tempo de funcionamento sem avarias (ou entre avarias consecutivas) de uma mquina, e X: numero de avarias que ocorrem no intervalo [0,6[, isto , num perodo de 6h
=1/4,5 corresponde ao nmero de avarias por unidade de tempo (por hora)

Logo P(T 6) = P(X=0)= e


1 *6 4,5

= e 1,333 = 0,264

(iv) Lei Normal

A lei Normal tem como parmetros caracterizadores a mdia e o desviopadro . Isto , os valores observados tm uma determinada tendncia central e uma determinada disperso em torno da tendncia central. A expresso
1 e 2 2 1 ( Xi ) 2

representa a funo densidade de probabilidade da distribuio Normal. Se se fizer o valor mdio igual a zero e todos os desvios forem medidos em relao mdia, a equao ser:

Z=

que corresponde a uma distribuio normal estandardizada (0;1) com os valores tabelados, a qual caracterizada por uma curva de Gauss:

Manual Tcnico de Formador

60

Manual de Estatstica Aplicada

Esta distribuio apresenta 99,73% dos valores entre os extremos 3 e 3. Existem muitos tipos de distribuio, mas a curva normal a forma de distribuio mais frequente nos processos industriais para caractersticas mensurveis, e pode considerar-se como estabelecida pela experincia prtica.

Exemplo: Considere que o comprimento mdio de determinado fio condutor 120, com

desvio padro 0,5. Qual a percentagem de fio com comprimento superior a 121?
Resoluo: X: comprimento de determinado fio condutor

Calculando a varivel reduzida correspondente, vem:


121 120 =2 0,5 Consultando a tabela, verifica-se que o valor da funo Z P(X 2) = 0,9772.
Z=

Logo P(X>2) = 1-0,9772 = 2,28%.

Manual Tcnico de Formador

61

Manual de Estatstica Aplicada

(v) Lei Qui-Quadrado

Considere-se um conjunto de n variveis aleatrias Zi, obedecendo s seguintes condies:


-

cada varivel Zi segue distribuio N(0,1); as variveis Zi so mutuamente independentes

Ento, a varivel aleatria X, construda a partir da soma das n variveis Zi elevadas ao quadrado, segue distribuio Qui-Quadrado com n graus de liberdade, denotada por
n i =1

X=

2 2 Z i2 = Z12 + Z 2 + ... + Z n

2 X n

O termo Graus de Liberdade (d.f: degrees of freedom) habitualmente usado para designar o nmero n de parcelas (variveis Zi) adicionadas. possvel demonstrar que o valor esperado e a varincia da distribuio de uma varivel Qui-Quadrado so respectivamente

=n

2 = 2n
A distribuio Qui-Quadrado uma distribuio assimtrica esquerda, aproximando-se da distribuio Normal medida que n cresce.

Manual Tcnico de Formador

62

Manual de Estatstica Aplicada

PROBABILIDADES

Exerccios resolvidos

Exerccio 1

De um baralho ordinrio (52 cartas) extrai-se ao acaso 1 carta. Determine a probabilidade dos seguintes acontecimentos: a) sada de Rei b) sada de copas c) sada de Rei ou copas d) sada de Rei mas no de copas e) no sada de Rei f) no sada de Rei nem de copas g) no sada de Rei ou no sada de copas
Resoluo

A: sada de Rei B: sada de copas c) P(A)=1/13 d) P(B)=1/4 e) P(A B) = P(A) + P(B) - P(A B) = 1/13+1/4-1/52 = 4/13 (=(13+3)/52) f) P(A-B) = P(A) P(A B) = 1/13 1/52 = 3/52 (= (4-1)/52) g) P( A )= 1-1/13 = 12/13 (=(52-4)/52) h) P( A B ) = P( A B ) = 1 P(A B) = 1 4/13 = 9/13 i) P( A B ) = P( A B ) = 1 P ( A B ) = 1 1/52 = 51/52

Exerccio 2

Um sistema electrnico formado por dois sub-sistemas, A e B. De ensaios anteriores, sabe-se que:
-

a probabilidade de A falhar de 20% a probabilidade de B falhar sozinho 15% a probabilidade de A e B falharem 15%

Determine a probabilidade de:

Manual Tcnico de Formador

63

Manual de Estatstica Aplicada

a) B falhar b) falhar apenas A c) falhar A ou B d) no falhar nem A nem B e) A e B no falharem simultaneamente


Resoluo

A: o subsistema A falha B: o subsistema B falha P(A)=20% P(B-A)=15% P(A B)=15% a) P(B) = P(B-A)+ P(A B) = 0,15 + 0,15 = 30% b) P(A-B) = P(A) P(A B) = 0,2 0,15 = 5% c) P(A B) = P(A) + P(B) - P(A B) = 0,2 + 0,3 0,15 = 35% d) P( A B ) = P( A B ) = 1 P(A B) = 1 0,35 = 65% e) P( A B ) = 1 P ( A B ) = 1 0,15 = 85%
Exerccio 3

P( A )= 80%

Suponha que h 3 jornais, A, B e C, com as seguintes percentagens de leitura: A: 9,8%; B: 22,9%; C: 12,1%; A e B: 5,1%; A e C: 3,7%; B e C: 6%; A, B e C: 2,4% Escolhe-se uma pessoa ao acaso. Calcule a probabilidade dessa pessoa: a) ler pelo menos um dos jornais b) ler A e B mas no C c) ler A mas no ler B nem C
Resoluo

A: a pessoa escolhida l o jornal A B: a pessoa escolhida l o jornal B C: a pessoa escolhida l o jornal C P(A) = 9,8% P(A B) = 5,1% P(B) = 22,9% P(A C) = 3,7% P(C) = 12,1% P(B C) = 6%

P(A B C) = 2,4%
Manual Tcnico de Formador 64

Manual de Estatstica Aplicada

a)
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,098+0,229+0,121-0,051-0,037-0,06+0,024 = 32,4%

b) P( A B C ) = P( A B ) P ( A B C ) = 0,051 0,024 = 2,7% c) P ( A B C ) = P(A) - P ( A B ) P ( A C ) + P ( A B C ) = 0,098-0,051-0,037+0,024 = 3,4%


Exerccio 4

Um gerente de uma galeria de arte muito creditada no mercado, est interessado em comprar um quadro de um pintor famoso para posterior venda. O gerente sabe que h muitas falsificaes deste pintor no mercado e que algumas dessa falsificaes so bastante perfeitas o que torna difcil avaliar se o quadro que ele pretende comprar ou no um original. De facto, sabe-se que h 4 quadros falsos desse pintor para 1 verdadeiro. O gerente no quer comprometer o bom nome da galeria para a qual trabalha comprando um quadro falso. Para obter mais informao o gerente resolve levar o quadro a um museu de arte e pede para que o especialista do museu o examine. Este especialista garante-lhe que em 90% dos casos em que lhe pedido para examinar um quadro genuno daquele pintor, ele identifica-o correctamente como sendo genuno. Mas em 15% dos casos em que examina uma falsificao do mesmo pintor, ele identifica-o (erradamente) como sendo genuno. Depois de examinar o quadro que o gerente lhe levou, o especialista diz que acha que o quadro uma falsificao. Qual agora a probabilidade de o quadro ser realmente uma falsificao?
Resoluo

V: o quadro genuno F: o quadro falso I: o quadro identificado correctamente P(V) = 20% P(F) = 80% P(I/V) = 90% P( I / F ) = 15%
Manual Tcnico de Formador

P( I / V ) = 10% P(I/F) = 85%


65

Manual de Estatstica Aplicada

P(ser realmente falsificao/especialista identificou como falsificao) = =


P( F ) * P( I / F ) 0,8 * 0,85 0,68 = = = 97,1% P ( F ) * P ( I / F ) + P (V ) * P ( I / V ) 0,8 * 0,85 + 0,2 * 0,1 0,7

Exerccio 5

Na ida para o emprego, o Sr. scar, polcia de profisso, tem de passar obrigatoriamente por trs cruzamentos com semforos. No primeiro cruzamento, o do Largo Azul, a probabilidade do semforo se encontrar com sinal vermelho de 10%. Em cada um dos cruzamentos seguintes, o Sr. scar fica parado devido aos sinais vermelhos em metade das vezes que l passa. O Sr. scar j descobriu que os semforos funcionam separadamente, no estando ligados entre si por qualquer mecanismo. Embora goste de cumprir a lei, o guarda scar passa no sinal verde e acelera no amarelo, s parando mesmo no sinal vermelho. a) Qual a probabilidade do Sr. scar chegar ao emprego sem ter de parar em qualquer sinal vermelho? b) Qual a probabilidade do Sr. scar ter de parar num s semforo? c) Qual a probabilidade do Sr. scar ter parado no sinal vermelho do cruzamento do Largo Azul, sabendo que parou num s semforo na sua ida para o emprego?
Resoluo

A: polcia encontra sinal vermelho no 1 cruzamento B: polcia encontra sinal vermelho no 2 cruzamento C: polcia encontra sinal vermelho no 3 cruzamento P(A)=10% P(B)=50% P(C)=50% P( A )= 90% P( B )= 50% P( C )= 50%

a) P( A B C ) = P( A )*P( B )*P( C ) = 0,9*0,5*0,5 = 22,5% b) P( A B C ) + P( A B C ) +P( A B C ) = = P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) + P( A )*P( B )*P( C ) = 47,5%

Manual Tcnico de Formador

66

Manual de Estatstica Aplicada

c) P(polcia parar no 1 cruzamento / polcia parou num s semforo)


=
P ( A B C ) P ( A) * P ( B ) * P (C ) = = 5,26% 0,475 0,475

Exerccio 6

Aps alguns testes efectuados personalidade de um indivduo, concluiu-se que este louco com probabilidade 60%, ladro com probabilidade igual a 70% e no louco nem ladro com probabilidade 25%. Determine a probabilidade do indivduo: a) Ser louco e ladro b) Ser apenas louco ou apenas ladro c) Ser ladro, sabendo-se que no louco
Resoluo

A: indivduo louco B: indivduo ladro P(A)=60% P(B)=70% P( A B ) = 25% = P( A B ) P(A B) = 1 0,25 = 75% 0,75 = 0,6 + 0,7 - P(A B)

a) P(A B) = P(A) + P(B) - P(A B) P(A B) = 0,6 + 0,7 0,75 = 55%

b) P(A-B) + P(B-A) = (0,6-0,55) + (0,7-0,55) = 20 c) P(B/ A ) =


P ( B A) P ( B A) 0,15 = = = 37,5% 1 0,6 0,4 P ( A)

Exerccio 7

Uma moeda viciada, de tal modo que P(F) = 2/3 e P(C) = 1/3. Se aparecem faces, ento um nmero seleccionado de 1 a 9. Se parecem coroas, um nmero seleccionado entre 1 e 5. Determine a probabilidade de ser seleccionado um nmero par.
Resoluo

P(Par) = 2/3*4/9 + 1/3*2/5 = 42,96%

Manual Tcnico de Formador

67

Manual de Estatstica Aplicada

Exerccio 8

Numa fbrica, 3 mquinas, M1, M2 e M3 fabricam parafusos, sendo a produo diria total de 10000 unidades. A probabilidade de um parafuso escolhido ao acaso ter sido produzido por M1 30% da probabilidade de ter sido produzido por M2. A incidncia de defeituosos na produo de cada mquina : M1: 3% M2: 1% M3: 2% Extrai-se ao acaso da produo diria um parafuso. Sabendo que a probabilidade dele ser defeituoso de 1,65%, determine o nmero de parafusos que cada mquina produz diariamente.
Resoluo

M1: o parafuso foi produzido por M1 M2: o parafuso foi produzido por M2 M3: o parafuso foi produzido por M3 D: o parafuso defeituoso n = 10000 unidades P(M1) = 0,3 P(M2) P(D / M1) = 3% P(D / M2) = 1% P(D / M3) = 2% P(D) = 1,65% Prod. 1 = P(M1)*10000 = ? Prod. 2 = P(M2)*10000 = ? Prod. 3 = P(M3)*10000 = ?

P( M 1) = 0,3P( M 2) P( M 1) + P ( M 2) + P( M 3) = 1 P( D) = P( M 1) * P( D / M 1) + P( M 2) * P ( D / M 2) + P( M 3) * P( D / M 3) 1,3P( M 2) + P( M 3) = 1 0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + P( M 3) * 0,02

Manual Tcnico de Formador

68

Manual de Estatstica Aplicada

P( M 3) = 1 1,3P( M 2) 0,0165 = 0,3P( M 2) * 0,03 + P( M 2) * 0,01 + (1 1,3P( M 2)) * 0,02

P( M 1) = 0,3 * 0,5 = 15% P( M 3) = 1 1,3P( M 2) = 1 1,3 * 0,5 = 35% P( M 2) = 50%

Exerccio 9

O Joo tem sua disposio 3 meios de transporte diferentes para se deslocar de casa para a escola: os transportes A, B ou C. Sabe-se que a probabilidade de:
-

chegar atrasado escola 60% chegar atrasado utilizando o transporte A 80% chegar atrasado utilizando o transporte B 50% chegar atrasado utilizando o transporte C 60% utilizar os transportes B e C a mesma

a) Calcule a probabilidade de o Joo utilizar o transporte A b) Sabendo que o Joo chegou atrasado escola, calcule a probabilidade de ter utilizado os transportes B ou C.
Resoluo

T: O Joo chega atrasado A: o Joo utiliza o transporte A B: o Joo utiliza o transporte B C: o Joo utiliza o transporte C P(T) = 0,6 P(T/A) = 0,8 P(T/B) = 0,5 P(T/C) = 0,6 P(B) = P(C) P(A)+P(B)+P(C) = 1 P(A) = 1- 2P(B)

a) P(T) = P(A)*P(T/A) + P(B)*P(T/B) + P(C)*P(T/C)

Manual Tcnico de Formador

69

Manual de Estatstica Aplicada

Logo 0,6 = (1-2P(B))*0,8 + P(B)*0,5 + P(B)*0,6 e vem que P(B) = 40% Ento P(A) = 1 2P(B) = 1 2*0,4 = 20% b) P(B C / T) =
P ( B ) * P (T / B ) + P (C ) * P (T / C ) 0,4 * 0,5 + 0,4 * 0,6 = =73,3% P (T ) 0,6

Exerccio 10

Uma empresa que se dedica prestao de servios de seleco de pessoal em relao a um teste psicotcnico para uma profisso especfica sabe o seguinte:
-

as percentagens de indivduos com um quociente de inteligncia (Q.I.) elevado e mdio so, respectivamente, de 30% e de 60% a percentagem de indivduos com Q.I. mdio que ficam aptos no teste de 50% a probabilidade de um indivduo com Q.I. baixo ficar apto no teste de 20% finalmente, sabe-se que 70% dos indivduos com Q.I. elevado ficam aptos no teste

a) Qual a probabilidade de um indivduo escolhido ao acaso ficar apto no teste? b) Qual a probabilidade de um indivduo ter Q.I. baixo, sabendo-se que ficou inapto?
Resoluo

A: indivduo fica apto no teste E: indivduo tem QI elevado M: indivduo tem QI mdio B: indivduo tem QI baixo P(E) = 30% P(M) = 60% P(A/M) = 50% P(B) = 1 0,3 0,6 = 10% P(A/E) = 70% P(A/B) = 20%

Manual Tcnico de Formador

70

Manual de Estatstica Aplicada

a) P(A) =P(E)*P(A/E)+P(M)*P(A/M)+P(B)*P(A/B) =0,3*0,7+0,6*0,5+0,1*0,2=53% b) P(B/ A ) =


P( B ) * P ( A / B) 0,1 * 0,8 = = 17% 1 0,53 P ( A)

Exerccio 11

Os resultados de um inqurito aos agregados familiares de uma determinada cidade forneceram os seguintes dados:
-

35% dos agregados possuem telefone 50% dos agregados possuem frigorfico 25% dos agregados possuem automvel 15% dos agregados possuem telefone e frigorfico 20% dos agregados possuem telefone e automvel 10% dos agregados possuem frigorfico e automvel 5% dos agregados possuem telefone, automvel e frigorfico

a) Calcule a probabilidade de um agregado familiar 1. possuir telefone ou frigorfico 2. no possuir nem telefone nem automvel b) Calcule a probabilidade de um agregado que possui automvel 1. possuir tambm frigorfico 2. possuir tambm telefone ou frigorfico c) Calcule a probabilidade de um agregado familiar 1. possuir pelo menos um daqueles trs objectos 2. no possuir nenhum daqueles trs objectos
Resoluo

A: agregado familiar possui telefone B: agregado familiar possui frigorfico C: agregado familiar possui automvel P(A) = 35% P(B) = 50% P(C) = 25%
Manual Tcnico de Formador 71

Manual de Estatstica Aplicada

P(A B) = 15% P(A C) = 20% P(B C) = 10% P(A B C) = 5% a) 1. P(A B) = P(A) + P(B) - P(A B) = 0,35 + 0,5 0,15 = 70% 2. P( A C ) = P( A C ) = 1 P(A C) = 1 0,4 = 60% P(A C) = P(A) + P(C) - P(A C) = 0,35 + 0,25 0,2 = 40% b) 1. P(B / C) =
P( B C ) 0,1 = = 40% P (C ) 0,25

2. P(A B/ C) =
P ( A C ) + P ( B C ) P ( A B C ) 0,2 + 0,1 0.05 = = 100% P (C ) 0,25

c) 1.
P ( A B C ) = P ( A) + P ( B ) + P (C ) P ( A B ) P ( A C ) P ( B C ) + P ( A B C ) = 0,35+0,5+0,25-0,15-0,2-0,1+0,05 = 70%

2. 1 P( A B C ) = 1 0,7 = 30%
Exerccio 12

Admita que 60% dos seguros no ramo automvel respeitam a condutores com mais de 40 anos de idade, dos quais 5% sofrem, pelo menos, um acidente por ano. De entre os segurados com idade igual ou inferior a 40 anos, 3% tm um ou mais acidentes no mesmo perodo. a) Qual a probabilidade de um segurado no sofrer qualquer acidente durante um ano? b) Qual a probabilidade de um segurado que sofreu pelo menos um acidente ter idade igual ou inferior a 40 anos? c) Qual a probabilidade de, numa amostra de trs segurados 1. todos terem idade igual ou inferior a 40 anos? 2. nenhum ter sofrido qualquer acidente durante um ano? 3. Todos terem idade igual ou inferior a 40 anos, dado que cada um sofreu, pelo menos, um acidente durante o referido perodo?

Manual Tcnico de Formador

72

Manual de Estatstica Aplicada

Resoluo

I1: o segurado tem mais de 40 anos de idade I2: o segurado tem 40 anos ou menos de idade A: o segurado sofre pelo menos 1 acidente por ano
A : o segurado no sofre nenhum acidente por ano

P(I1) = 60% P(A/I1) = 5% P(A/I2) = 3%

P(I2) = 1 0,6 = 40% P( A /I1) = 1 0,05 = 95% P( A /I2) = 1 0,03 = 97%

a) P( A ) = P(I1)* P( A /I1) + P(I2)* P( A /I2) = 0,6*0,95 + 0,4*0,97 = 95,8% b) P(I2/A) =


P ( A I 2) P ( I 2) * P ( A / I 2) 0,6 * 0,03 = = = 28,57% = P(B) 1 0,958 P ( A) P ( A)

c) 1. P( I 2 I 2 I 2) = 0,4*0,4*0,4 = 6,4% 2. P( A A A) = 0,958*0,958*0,958 = 87,9% 3. P( B B B ) = 0,2857*0,2857*0,2857 = 2,3%

Manual Tcnico de Formador

73

Manual de Estatstica Aplicada

FUNES DE PROBABILIDADE

Exerccios resolvidos

Exerccio 1

Numa praia do litoral portugus existe um servio de aluguer de barcos, destinado aos turistas que a frequentam. O nmero de turistas que procuram este servio, por hora, est associado a uma varivel aleatria com distribuio de Poisson. Verificou-se que, em mdia, em cada hora, esse servio procurado por 8 turistas interessados em alugar barcos; sabe-se, por outro lado, que esse servio funciona ininterruptamente das 8 s 20 horas. a) b) Qual a probabilidade de que, entre as 8 e as 9 horas, se aluguem 5 barcos? Qual a probabilidade de que, entre as 9 e as 11 horas, os barcos sejam procurados por mais de 25 turistas?
Resoluo

X: n de turistas que procuram o servio de aluguer de barcos por hora X segue Po(=8) a) Na tabela da Po(=8) vem P(X=5) = 9,16% b) Y1: n de turistas que procuram o servio de aluguer na 1 hora Y2: n de de turistas que procuram o servio de aluguer na 2 hora Logo Y1+Y2: n de turistas que procuram o servio de aluguer em 2 horas Pelo Teorema da Aditividade da Poisson, considerando Y1 e Y2 independentes e que todas seguem Po(8), vem que: Z=Y1+Y2 segue Po(2*8=16) Logo P(Z>25) = f(26) +... + f(33) = 0,0057 + ... + 0,0001 = 1,32%

Exerccio 2

O nmero de navios petroleiros que chegam diariamente a certa refinaria uma varivel com distribuio de Poisson de parmetro 2. Nas actuais condies, o cais da refinaria pode atender, no mximo, 3 petroleiros por dia.

Manual Tcnico de Formador

74

Manual de Estatstica Aplicada

Atingido este nmero, os restantes que eventualmente apaream devero seguir para outro porto. a) Qual a probabilidade de, num qualquer dia, ser preciso mandar petroleiros para outro porto? b) De quanto deveriam ser aumentadas as instalaes de forma a assegurar cais a todos os petroleiros em 99,9% dos dias? c) Qual o nmero esperado de petroleiros a chegarem por dia? d) Qual o nmero mais provvel de petroleiros a chegarem por dia? e) Qual o nmero esperado de petroleiros a serem atendidos diariamente? f) Qual o nmero esperado de petroleiros que recorrero a outros portos diariamente?
Resoluo

X: n de petroleiros que chegam diariamente a uma certa refinaria X segue Po (2) Capacidade mxima de atendimento da refinaria: 3 petroleiros/dia a) P(X>3) = 1 P(X 3) = 1 F(3) = 1 0,8571 =14,29% (tab. pg.14) b) N mximo de petroleiros que podem chegar: 9 (informao da tabela) Logo, a capacidade devia aumentar em 6 petroleiros/dia (9-3) c) E(X) = 2 d) X = 1 ou X = 2, com probabilidade 27,07% e) Y: n de petroleiros que so atendidos diariamente numa certa refinaria (0,1, 2, 3) g(0) = P(X=0) = 0,1353 g(1) = P(X=1) = 0,2707 g(2) = P(X=2) = 0,2707 g(3) = P(X=3) = 1 P(X<3) = 1 P(X 2) = 1 0,6767 = 0,3233 E(Y) = 0*0,1353 + + 3*0,3233 = 1,782 So atendidos, em mdia, entre 1 e 2 petroleiros diariamente f) Z: n de petroleiros que recorrem diariamente a outros portos (0,1, 2, 3, 4, 5, 6) Logo, Z = X - Y E(Z) = E(X -Y) = E(X) - E(Y) = 2 - 1,782 = 0,218
Manual Tcnico de Formador 75

Manual de Estatstica Aplicada

Recorrem a outros portos, em mdia, entre 0 e 1 petroleiro por dia g) W: n de dias em que preciso mandar petroleiros para outro porto num ms de 30 dias (0,1, 2,...30) W segue Bi (n = 30; p = P(X>3) = 0,1429) E(W) = 30*0,1429 = 4,3 Em mdia, preciso enviar petroleiros para outro porto 4 a 5 dias/ms

Exerccio 3

Os Servios Municipalizados de Gs e Electricidade debitam mensalemnte aos seus clientes um consumo terico T de energia elctrica calculado de tal modo que a probabilidade de o consumo efectivo o exceder seja de 30,85%. Suponha um cliente cujo consumo por ms segue lei normal de mdia 400 kwh e desvio-padro 40 kwh. a) Qual o consumo terico que lhe mensalmente debitado? b) 1. Qual a distribuio do consumo efectivo durante 3 meses? 2. Qual a probabilidade de que, ao fim de 3 meses, o consumo terico exceda o efectivo em mais de 100 kwh?
Resoluo

X: consumo efectivo de energia elctrica de um cliente por ms (em kwh) T: consumo terico (valor fixo) debitado ao cliente por ms (em kwh) T: P(X>T) = 0,3085 X segue N(400; 1600) a) P(X>T) = 0,3085 P( P(N(0,1) b) 1. X1: consumo efectivo de energia elctrica de um cliente no 1 ms (em kwh) X2: consumo efectivo de energia elctrica de um cliente no 2 ms (em kwh) X3: consumo efectivo de energia elctrica de um cliente no 3 ms (em kwh) Logo X1+X2+X3: consumo efectivo de energia elctrica em 3 meses (em kwh)
X 400 T 400 > ) = 0,3085 40 40

T 400 T 400 = 0,5 T = 420 ) = 0,6915 40 40

Manual Tcnico de Formador

76

Manual de Estatstica Aplicada

Pelo Teorema da Aditividade da Normal, considerando X1, X2 e X3 independentes e que todas seguem N(400, 1600), vem que: Y=X1+X2+X3 segue N(400*3; 1600*3), isto , N(1200; 4800) 2. P(3*420-Y > 100) = P(Y < 1160) = P(N(0,1)< = P(N(0,1)<-0,58) = 28,1%
1160 1200 )= 4800

Exerccio 4

Num determinado processo de fabrico, existem 2 cadeias de montagem A e B, com funcionamento independente. A cadeia A opera a um ritmo mdio de 2 montagens por hora, e a probabilidade da cadeia B efectuar pelo menos uma montagem numa hora de 98,71%. Admitindo que o nmero de montagens efectuadas por hora em ambas as cadeias uma v.a. Poisson, determine: a) a probabilidade de se efectuarem mais de 6 montagens numa hora com a cadeia B b) a probabilidade de, em 3 horas de trabalho, se efectuarem no mximo 10 montagens com a cadeia B c) a probabilidade de, numa hora, a cadeia A efectuar o dobro de montagens de B d) o nmero mdio de montagens efectuadas num dia de trabalho de 8 horas com ambas as cadeiras
Resoluo

X: n de montagens da cadeia A por hora Y: n de montagens da cadeia B por hora

X segue Po(2)

a) Y segue Poisson, mas desconhece-se a mdia (=parmetro ) No entanto, como se sabe que P(Y 1) = 0,9817, vem que P(Y<1) = 1 0,9817 = 0,0183 Na tabela da Poisson, percorrendo as linhas de valor = 0, vem que o valor 0,0183 pode ser encontrado no cruzamento da linha 0 com a coluna 4. Logo, = 4. Na tabela da Po(4), P(Y>6) = 1P(Y 6) = 1F(6) = 1-0,8893=11,07%

Manual Tcnico de Formador

77

Manual de Estatstica Aplicada

b) Y1: n de montagens da cadeia B na 1 hora Y2: n de montagens da cadeia B na 2 hora Y3: n de montagens da cadeia B na 3 hora Logo Y1+Y2+Y3: n de montagens da cadeia B em 3 horas Pelo Teorema da Aditividade da Poisson, considerando Y1, Y2 e Y3 independentes e que todas seguem Po(4), vem que: Z=Y1+Y2+Y3 segue Po(4*3=12) P(Z 10) = f(0) + f(1) +... + f(10) = 0 + 0,0001 + + 0,1048 = 34,72% c) P(X=2Y) = P(X=0 Y=0) + P(X=2 Y=1) + P(X=4 Y=2) + P(X=6 Y=3) + P(X=8 Y=4) = 0,1353*0,0183 + 0,2707*0,0753 + 0,0902*0,1465 + 0,012*0,1954 + 0,0009*0,1954 = 3,8% d) W: n de montagens das 2 cadeias num dia de trabalho de 8 horas W=
8

i =1

( X i + Yi )

onde Xi + Yi corresponde ao n de montagens das 2 cadeias por hora Pelo Teorema da Aditividade de Poisson, sendo as variveis independentes e seguindo Po(2) e Po(4) respectivamente, vem que Xi + Yi segue tambm Po(2+4=6). E Z , tambm pelo mesmo Teorema, segue Po(6*8=48) Logo, o nmero mdio de montagens efectuado pelas 2 cadeias num dia de trabalho de 8 horas de 48.

Exerccio 5

Uma companhia de tabacos recebeu em dada altura um elevado nmero de queixas quanto qualidade dos cigarros de certa marca que comercializa. Numa rpida anlise s condies de produo, constata-se que 1% dos filtros que compem o cigarro saem defeituosos. Nestas condies, determine: a) a probabilidade de um mao acabado de formar 1. conter 1 cigarro com filtro defeituoso 2. conter 0 cigarros com filtro defeituoso

Manual Tcnico de Formador

78

Manual de Estatstica Aplicada

b) o nmero de maos que, num volume que contm 20, a companhia espera poder aproveitar se utilizar o critrio: 1. mao aproveitvel se no contiver cigarros defeituosos 2. mao aproveitvel se contiver no mximo 1 cigarro defeituoso
Resoluo

X: n de cigarros com filtro defeituoso em 20 cigarros de um mao X segue Bi(n=20; p=0,01) a) 1. P(X=1) = 20*0,01*0,9919 = 16,52% 2. P(X=0) = 0,010*0,9920 = 81,79% b) 1. Crit. 1: mao aproveitvel se no contiver cigarros defeituosos Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0) = 0,8179) Logo E(Y) = 20*0,8179 = 16,36 2. Crit. 2: mao aproveitvel se contiver no mximo 1 cigarro defeituoso Y: n de maos aproveitveis num volume que contem 20 maos Y segue Bi(n=20; p=P(X=0)+P(X=1)= 0,8179+0,1652 = 0,9831) Logo E(Y) = 20*0,9831 = 19,66
Exerccio 6

O comprimento das peas produzidas por uma mquina uma v.a. Normal com mdia e varincia 2. Uma pea defeituosa se o seu comprimento diferir do valor mdio mais do que . Sabemos que 50% das peas produzidas tm comprimento inferior a 0,25 mm e 47,5% tm comprimento entre 0,25 mm e 0,642 mm. a) b)
Resoluo

Calcule a mdia e o desvio-padro do comprimento das peas. Determine a probabilidade de uma pea no ser defeituosa.

X: comprimento das peas produzidas por uma mquina X segue N(; 2) Pea defeituosa se X> + ou se X< - P(X<0,25) = 50% P(0,25<X<0,642) = 47,5%

Manual Tcnico de Formador

79

Manual de Estatstica Aplicada

a) Como P(X<0,25) = 50% vem que P(


X

<

0,25

0,25

) = 50%

Na tabela, E como

tem que ser =0, logo = 0,25

P(0,25<X<0,642) = 47,5% vem que


P(

0,25 0,25

0,392

<

X 0,25

<

0,642 0,25

) = P (0 < N (0,1) <

0,392

)=

=(

) (0) = 0,475 0,392 ) = 0,475 + 0,5 = 0,975 0,392


= 1,96 e logo = 0,2

Sendo (0)=0,5, vem que (

Na tabela 3B da Normal, vem que

b) P(pea no defeituosa) = P( - < X < + ) = P(0,05 < X < 0,45) = P(X<0,45) P(X<0,05) =
0,45 0,25 0,05 0,25 ) ( ) = (1) (1) = D (1) = 84,13% 0,2 0,2

Exerccio 7

Sabe-se que a probabilidade de cura de uma certa doena 20%. Pe-se prova um novo medicamento, que eleva a probabilidade de cura para 40%, ministrando-o a um grupo de 20 doentes. Admite-se que o medicamento eficaz no caso de contribuir para a cura de, pelo menos, 8 doentes em 20. Calcule a probabilidade de se concluir pela ineficcia do medicamento, ainda que este eleve de facto a probabilidade de cura para 40%.
Resoluo

X: nmero de doentes curados no grupo de 20 a que ministrado o novo medicamento (0,1,2...19, 20) n=20 p=0,4 q=1-p=0,6 X segue Bi (20; 0,4) P(X 8)=1- F(7) = 41,58%

Manual Tcnico de Formador

80

Manual de Estatstica Aplicada

Exerccio 8

Sabe-se por via experimental que, por cada perodo de 5 minutos, chegam, em mdia, 4 veculos a determinado posto abastecedor de combustveis. Um empregado entra ao servio s 8 horas. Qual a probabilidade de ter de aguardar mais de 10 minutos at chegada de um veculo?
Resoluo

X: n de veculos que chegam ao posto abastecedor por perodo de 5 minutos X segue Po(4) Se X1: n de veculos que chegam ao posto no 1 perodo de 5 minutos X2: n de veculos que chegam ao posto no 2 perodo de 5 minutos ento X1+X2: n de veculos que chegam ao posto abastecedor em 10 minutos Pelo Teorema da Aditividade de Poisson, considerando X1 e X2 independentes e que ambas seguem Po(4), vem que X1+X2 tambm segue Po(4+4=8) Logo P(X1+X2=0) na tabela da Po(8) vem igual a 0,03%.

Manual Tcnico de Formador

81

Manual de Estatstica Aplicada

3.4. Estimao por intervalos


Conhecendo-se uma amostra em concreto, possvel estimar os valores dos seus parmetros caracterizadores atravs de mtodos probabilsticos. Por exemplo, suponhamos que numa fbrica produtora de acar se pretende averiguar se o peso dos pacotes produzidos est, em mdia, dentro das normas de qualidade exigveis. Na impossibilidade de medio do peso de todos os pacotes, pela morosidade e dispndio de recursos que tal implicaria, a estatstica permite que, a partir da observao de uma nica amostra, seja possvel inferir entre que valores varia o peso mdio com um grau de confiana ou probabilidade elevado. Assim, ao recolher um determinado nmero de pacotes da produo total aleatoriamente, possvel calcular o peso mdio de acordo com as tcnicas de estatstica descritiva apreendidas atrs. Claro que nada nos garante que esse valor coincide com o valor do parmetro da populao em estudo. De facto, at provvel que no coincida e, mais, se recolhermos outro conjunto idntico de pacotes, o valor seja diferente. Isto , para cada amostra de dimenso n recolhida, a estimativa do parmetro assumiria valores distintos. Ento, como retirar concluses? Como garantir algum nvel de rigor? O mtodo a estudar neste captulo a estimao por intervalos permite, a partir da recolha de uma nica amostra, aferir entre que valores seria de esperar que variasse o parmetro de interesse se nos empenhssemos a recolher um nmero infinito de amostras. Isto , por exemplo, caso o valor amostral fosse de 1,02 kg, este mtodo poderia, por exemplo, permitir afirmar que seria altamente provvel que o peso dos pacotes produzidos estivesse a variar entre 0,92 kg e 1,12 kg. E esse resultado tem um determinado nvel de confiana associado: por exemplo, se dissermos que o nvel de confiana ou certeza implicado de 95%, tal significa que, se nos fosse possvel observar um nmero infinito de amostras, o intervalo de valores apresentado corresponderia aos resultados obtidos em 95% delas (os valores mais usualmente utilizados so 90%, 95% ou 99% de confiana). Caberia depois empresa julgar se esses seriam ou no valores aceitveis e proceder aos eventuais reajustes necessrios.
Manual Tcnico de Formador 82

Manual de Estatstica Aplicada

A partir do conceito de intervalo de confiana para um parmetro, fcil concluir que a sua especificao implica conhecer: o estimador do parmetro em causa a sua distribuio de probabilidade uma estimativa particular daquele parmetro

Como parmetros de interesse e para efeitos de exemplificao, vo considerar-se duas tipologias de intervalo: o intervalo de confiana para a mdia de uma populao normal e o intervalo de confiana para a proporo de uma populao binomial. Para efeitos de simplificao, vo considerar-se apenas exemplos relativos a amostras de grande dimenso (na prtica, n 100)
(i) Intervalo de confiana para a mdia de uma populao normal

Seja X (mdia amostral) o estimador da mdia da populao. Porque a distribuio Normal, a distribuio deste estimador ser:
X N ( ;

Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z= X

N (0;1)

Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a mdia de uma populao normal:
X c

;X +c

Isto , em torno do valor do estimador, definido um intervalo de variao onde possvel afirmar que o parmetro a estimar est contido com um grau de confiana . Esse intervalo de variao depende:
-

da dimenso da amostra (n): quanto maior a dimenso da amostra, menor a amplitude do intervalo. Este resultado explica-se facilmente: no limite, se fosse possvel observar todo o universo de dados (n= ), o valor amostral calculado corresponderia ao valor da populao.

Manual Tcnico de Formador

83

Manual de Estatstica Aplicada

do desvio - padro da populao ( ): quanto maior o desvio - padro, maior a amplitude do intervalo. Como se sabe, o desvio - padro uma medida que caracteriza a disperso da distribuio. Quanto maior o seu valor, maior a variabilidade apresentada pelos dados, sendo natural que a margem de variao de prever em torno do valor amostral recolhido seja tambm, naturalmente, maior.

do valor crtico (c): quanto maior o valor c, maior a amplitude do intervalo. O valor crtico reflecte o nvel de confiana adoptado. Naturalmente, para que aumente a confiana de que o valor do parmetro a estimar est contido no intervalo, a sua amplitude deve aumentar tambm (no limite, se o intervalo se alongasse de - a + a confiana seria total ou 100%). possvel encontrar o valor c na tabela da normal (pois esta a lei do estimador), da seguinte forma:
P ( c Z c ) =

j que assim possvel definir a frmula geral do intervalo, resolvendo a inequao em ordem ao parmetro, :
P (c X

c) = P( X c

X c

)=

Exemplo: Suponha-se que se tem uma populao normal com mdia desconhecida e

desvio - padro 3, N (, 9) e uma amostra de 121 observaes. Deduza um intervalo de confiana para a com 95% de confiana.
Resoluo: Para os dados deste exemplo, vem:

n=121

=3
c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo
X c

;X +c

= X

1,96 x3 1,96 x3 ;X = X 0,535; X + 0,535 11 11

Manual Tcnico de Formador

84

Manual de Estatstica Aplicada

O intervalo X 0,535; X + 0,535 contm o verdadeiro valor do parmetro com probabilidade ou confiana de 95%. Conhecida uma estimativa particular daquele parmetro, torna-se possvel calcular entre que valores seria de esperar que, com 95% de confiana, variasse .

Se o desvio - padro da populao fr desconhecido, utiliza-se este intervalo considerando-se como estimativa de o desvio - padro corrigido da amostra, ou seja, s=
( xi x ) 2
n 1

, tal que:

X c

s' n

;X +c

s' n

(ii) Intervalo de confiana para a proporo p de uma populao binomial


(proporo amostral ou frequncia observada na amostra) o estimador Seja p

da proporo p de uma populao binomial. Sendo a amostra de grande dimenso, a distribuio deste estimador ser:

N ( p; p

p(1 p ) ) n

Uma vez que apenas se encontra tabelada a distribuio N(0,1), torna-se necessrio calcular a varivel reduzida correspondente:
Z=

p p
p (1 p ) n

N (0;1)

Esta varivel permitir deduzir a frmula geral do intervalo de confiana para a proporo p de uma populao binomial:
c p (1 p ) (1 p ) p p +c ;p n n

(1 p )) (como estimativa de p (1 p ) foi utilizado p

Manual Tcnico de Formador

85

Manual de Estatstica Aplicada

Exemplo: Numa cidade pretende-se saber qual a proporo da populao favorvel a

certa modificao de trnsito. Faz-se um inqurito a 100 pessoas, e 70 declaram-se favorveis. Determine um intervalo de confiana a 95% para a proporo de habitantes dessa cidade favorveis modificao de trnsito.
Resoluo: n=100
= p 70 = 0,7 100

c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo


c p (1 p ) (1 p ) p 0,7 x0,3 p 0,7 x0,3 +c ;p = 0,7 1,96 ;0,7 1,96 = n 100 n 100

= [0,6102;0,7898]

O intervalo [0,6102;0,7898] contm o verdadeiro valor do parmetro p com probabilidade ou confiana de 95%. Ou seja, a proporo de habitantes favorveis modificao de trnsito est situada entre 61,02% e 78,98%, com probabilidade de 95%.

Como bvio, pretende-se que o resultado possua o mximo de confiana possvel. No entanto, se uma maior confiana pretendida na estimao, esta conduz a possibilidades de erro maiores, dado que um elevado nvel de confiana conduz a um intervalo maior e, como tal, a preciso da estimao diminui.
Exemplo: Consideremos 3 afirmaes de alunos que aguardam a sada das pautas de

um exame de Estatstica: Afirm. 1: Tenho a sensao que as pautas sero afixadas durante a manh Afirm. 2: Tenho quase a certeza que as pautas sero afixadas entre as 10h e as 11h

Manual Tcnico de Formador

86

Manual de Estatstica Aplicada

Afirm. 3: Tenho a certeza absoluta que as pautas ou so afixadas s 10h30 ou j no so afixadas hoje Estas 3 afirmaes permitem constatar facilmente que se se pretende maior confiana na estatstica, se tem que permitir que a possibilidade de erro aumente. Por outro lado, se se permitir que o erro diminua, os extremos do intervalo aumentam, embora o resultado perca alguma preciso. No entanto, h que ter em ateno que, se um intervalo de confiana tem uma amplitude demasiado grande, a estimativa no tem utilidade. Cabe ao investigador gerir este trade-off. Isto leva a uma questo importante: o dimensionamento de amostras. At aqui, sempre se assumiu que as dimenses so conhecidas partida, sem referir como se determinam. No entanto, a resoluo deste problema tem um enorme interesse prtico, j que (i) recolher e tratar uma amostra demasiado grande para os resultados que se pretendem obter constitui um evidente desperdcio de recursos e (ii) recolher uma amostra cuja dimenso insuficiente para retirar concluses constitui um erro. A dimenso das amostras aumentar se se pretender garantir maior preciso ao intervalo e/ou maior grau de confiana. No captulo dedicado a aplicaes estatsticas, ser possvel ver como possvel utilizar o conceito de intervalo de confiana ao controlo estatstico de processos de qualidade.

Manual Tcnico de Formador

87

Manual de Estatstica Aplicada

INTERVALOS DE CONFIANA
Exerccios

Exerccio 1

Uma mquina fabrica cabos cuja resistncia ruptura (em kg/cm2) uma varivel com distribuio Normal de mdia 100 e desvio - padro 30. Pretendese testar uma nova mquina que, segundo indicaes do fabricante, produz cabos com resistncia mdia superior. Para isso, observam-se 100 cabos fabricados pela nova mquina, que apresentam uma resistncia mdia de 110 kg/cm2. Admita que o novo processo no altera o desvio padro da resistncia ruptura dos cabos. a) Determine um intervalo de confiana a 95% para a resistncia mdia ruptura dos cabos produzidos pela nova mquina. b) Suponha que pretendamos obter um intervalo de confiana com a mesma amplitude do anterior, mas com nvel de confiana de 99%. Quantos cabos deveriam ser observados?
Resoluo

a) X segue N(100; 302) n=100 e logo


X c

x =110

=30

=95%

c: P (c Z c) = 95% D (c) = 95% c = 1,96

;X +c

= 110

1,96 x30 1,96 x30 ;110 = [104,12;115,88] 10 10

Estima-se, com 95% de confiana, que a resistncia mdia ruptura dos cabos produzidos pela nova mquina se situa entre 104,12 kg/cm2 e 115,88 kg/cm2. b) Amplitude = 115,88 104,12 = 11,76 Amplitude = Lim.Sup. - Lim.Inf. = ( X + c =11,76 n Sendo que x =110 =30
Manual Tcnico de Formador 88

) -( X c

) = 2c

Logo 2c

Manual de Estatstica Aplicada

c: P (c Z c) = 99% D (c) = 99% c = 2,576 vem que n = 173 cabos

Exerccio 2

Uma amostra de 20 cigarros analisada para determinar o contedo de nicotina, observando-se um valor mdio de 1,2 mg. Sabendo que o desvio padro do contedo de nicotina de um cigarro 0,2 mg, diga, com 99% de confiana, entre que valores se situa o teor mdio de nicotina de um cigarro.
Resoluo

X segue N(; 0,22) n=20 e logo


X c

x =1,2

=0,2

=99%

c: P (c Z c) = 99% D (c) = 99% c = 2,576

;X +c

= 1,2

2,576 x0,2 20

;1,2

2,576 x0,2 20

= [1,085;1,315]

Estima-se, com 99% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.

Exerccio 3

Admita-se que a altura dos alunos de uma escola segue distribuio Normal com varincia conhecida e igual a 0,051. Admita-se ainda que foi recolhida uma amostra aleatria com dimenso n=25 alunos e calculada a respectiva mdia amostral, tendo-se obtido o valor de 1,70m. Defina um intervalo que, com probabilidade 95%, contenha o valor esperado da altura .
Resoluo

X segue N(; 0,051) n=25 e logo

x =1,70

2=0,051

=95%

c: P (c Z c) = 95% D (c) = 95% c = 1,96

Manual Tcnico de Formador

89

Manual de Estatstica Aplicada

X c

;X +c

= 1,7

1,96 x 0,051 25

;1,2

1,96 x 0,051 25

= [1,611;1,788]

Estima-se, com 95% de confiana, que o teor mdio de nicotina de um cigarro se situa entre 1,085 mg e 1,315 mg.

Exerccio 4

Numa fbrica, procura conhecer-se a incidncia de defeituosos na produo de uma mquina. Para tanto, colhe-se uma amostra de dimenso suficientemente grande (1600 artigos), onde 10% dos artigos so defeituosos. Determine o intervalo de confiana para a referida proporo com 90% de confiana.
Resoluo

n=1600

=10% p

c: P (c Z c) = 90% D (c) = 90% c = 1,645 e logo


c p (1 p ) (1 p ) p p 0,1x0,9 0,1x0,9 +c ;p = 0,1 1,645 ;0,1 1,645 = n n 1600 1600

= [0,0876;0,1123]

Estima-se, com 90% de confiana, que a proporo de artigos defeituosos na produo se situa entre 8,76% e 11,23%.

Exerccio 5

O director fabril de uma empresa industrial que emprega 4000 operrios emitiu um novo conjunto de normas internas de segurana. Passada uma semana, seleccionou aleatoriamente 300 operrios e verificou que apenas 75 deles conheciam suficientemente bem as normas em causa. Construa um intervalo de confiana a 95% para a proporo de operrios que conheciam adequadamente o conjunto das normas uma semana aps a sua emisso.
Resoluo

n=300

Manual Tcnico de Formador

90

Manual de Estatstica Aplicada

= p

75 = 0,25 300

c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo


c p (1 p ) (1 p ) p p 0,25 x0,75 0,25 x0,75 +c ;p = 0,25 1,96 ;0,25 1,96 = n n 300 300

= [0,201;0,299]

Estima-se, com 95% de confiana, que a proporo de operrios que conheciam adequadamente o conjunto das normas se situa entre 20,1% e 29,9%.

Exerccio 6

A Direco de Marketing de uma empresa pretende conhecer a notoriedade da marca de determinado produto. Nesse sentido, efectuou um inqurito junto de 1200 pessoas escolhidas aleatoriamente, verificando que 960 a conheciam. a) b) Estime a proporo de pessoas conhecedoras da marca atravs de um intervalo de confiana a 90%. Se se pretender que a amplitude do intervalo de confiana da alnea anterior no seja superior a 0,034, qual deve ser a dimenso mnima da amostra? c) Sabendo que o intervalo de confiana determinado pela Direco de Marketing foi [0,767; 0,833], calcule o nvel de confiana utilizado
Resoluo

a) n=1200
= p 960 = 0,8 1200

c: P (c Z c) = 90% D (c) = 90% c = 1,645 e logo


c p (1 p ) (1 p ) p p 0,8 x0,2 0,8 x0,2 +c ;p = 0,8 1,645 ;0,8 1,645 = n n 1200 1200

= [0,781;0,819]

Manual Tcnico de Formador

91

Manual de Estatstica Aplicada

Estima-se, com 90% de confiana, que a proporo de indivduos conhecedores da marca se situa entre 78,1% e 81,9%.

+c b) Amp.=Lim.Sup.-Lim.Inf. = ( p
Logo

(1 p ) (1 p ) (1 p ) p p p c )(p ) = 2c n n n

2c

(1 p ) p 0,8 * 0,2 = 2 *1,645 * 0,034 n 1499 n n

+c c) p

(1 p ) p = 0,833 n 0,8 * 0,2 = 0,833 c = 2,86 1200

Logo 0,8 + c

E D(2,86) na tabela N(0,1) vem igual a 99,6%, a que corresponde o nvel de confiana utilizado

Exerccio 7

O gabinete de projectos de uma empresa de material de construo civil pretende estimar a tenso de ruptura do material usado num determinado tipo de tubos. Com base num vasto conjunto de ensaios realizados no passado, estima-se que o desvio - padro da tenso de ruptura do material em causa de 70 psi. Deseja-se definir um intervalo de confiana a 99% para o valor esperado da tenso de ruptura, pretendendo-se que a sua amplitude no exceda 60 psi. Qual o nmero de ensaios necessrio para definir tal intervalo?
Resoluo

n=?

=70

=99%

c: P (c Z c) = 99% D (c) = 99% c = 2,576 Amplitude = 2c

Logo 2c

60 2 * 2,576 *

70
n

60 n 36

Manual Tcnico de Formador

92

Manual de Estatstica Aplicada

Exerccio 8

A empresa SCB controla regularmente a resistncia ruptura dos cabos por si produzidos. Recentemente, foram analisadas as tenses de ruptura de 10 cabos SCB-33R, seleccionados aleatoriamente a partir de um lote de grandes dimenses, tendo sido obtida uma mdia de 4537 kg/cm2. Existe uma norma de 112 kg/cm2 em relao varincia, que respeitada. O director comercial pretende saber qual o intervalo de confiana, a 95%, para o valor esperado da tenso de ruptura dos cabos do lote em causa. Defina esse intervalo.
Resoluo

X segue N(; 112) n=10 e logo


X c

x =4537

=10,58

=95%

c: P (c Z c) = 95% D (c) = 95% c = 1,96

;X +c

= 4537

1,96 x10,58 10

;4537

1,96 x10,58 10

= [4530,5;4543,5]

Estima-se, com 95% de confiana, que o tenso mdia de ruptura dos cabos se situa entre 4530,5 kg/cm2 e 4543,5 kg/cm2.

Exerccio 9

Uma amostra de 50 capacetes de proteco, usados por trabalhadores de uma empresa de construo civil, foram seleccionados aleatoriamente e sujeitos a um teste de impacto, e em 18 foram observados alguns danos. Construa um intervalo de confiana, a 95%, para a verdadeira proporo p de capacetes que sofre danos com este teste. Interprete o resultado obtido.
Resoluo

a) n=50
= p

18 = 0,36 50

c: P (c Z c) = 95% D (c) = 95% c = 1,96 e logo

Manual Tcnico de Formador

93

Manual de Estatstica Aplicada

c p

= [0,22695;0,49305]

(1 p ) (1 p ) p p 0,36 x0,64 0,36 x0,64 +c ;p = 0,36 1,96 ;0,36 1,96 = n n 50 50

Estima-se, com 95% de confiana, que a proporo de capacetes que sofre danos se situa entre 22,7% e 49,3%.

Exerccio 10

Qual deve ser o nmero de habitantes da cidade do Porto a seleccionar aleatoriamente para estudar a proporo de portuenses que usam culos, de modo a garantir que um intervalo de confiana a 95% para essa proporo tenha uma amplitude no superior a 8 pontos percentuais?
Resoluo

n=?

+c Amp.= ( p

(1 p ) (1 p ) (1 p ) p p p c )(p ) = 2c < 0,08 n n n

c: P (c Z c) = 95% D (c) = 95% c = 1,96 Considerando que a proporo amostral a que maximiza a amplitude (pior

(1 p )' = 1 2 p = 0 ), vem dos casos), isto , que a proporo amostral 50% ( p


que:

2c

(1 p ) p 0,5 * 0,5 = 2 * 1,96 * < 0,08 n > 600 n n

Manual Tcnico de Formador

94

Manual de Estatstica Aplicada

3.5. Testes de hipteses


Todos os dias temos de tomar decises respeitantes a determinadas populaes, com base em amostras das mesmas (decises estatsticas). Nesta tomada de decises, til formular hipteses sobre as populaes, hipteses essas que podem ou no ser verdadeiras. A essas hipteses chamamos hipteses estatsticas, as quais geralmente se baseiam em afirmaes sobre as distribuies de probabilidade das populaes ou sobre alguns dos seus parmetros. Uma hiptese pode ento ser definida como uma conjectura acerca de uma ou mais populaes. Desta forma, os testes de hipteses podem considerar-se uma segunda vertente da inferncia estatstica, tendo por objectivo verificar, a partir de dados observados numa amostra, a validade de certas hipteses relativas populao. O resultado do teste corresponde inevitavelmente a uma das duas respostas possveis para cada questo: afirmativa ou negativa. Em ambos os casos corre-se o risco de errar. Uma das caractersticas do teste de hipteses , justamente, a de permitir controlar ou minimizar tal risco. Nos testes de hipteses, e ao contrrio dos intervalos de confiana, em vez de procurar uma estimativa ou um intervalo para um parmetro, admite-se ou avana-se um valor hipottico para o mesmo, utilizando depois a informao da amostra para confirmar ou rejeitar esse mesmo valor. A hiptese a testar denomina-se, pois, de H0 ou de hiptese nula. O objectivo verificar se os factos observados a contradizem, levando a optar pela hiptese alternativa H1. Isto , a estratgia bsica seguida no mtodo de teste de hipteses consiste em tentar suportar a validade H1 de uma vez provada a inverosimilhana de H0.
Exemplo: Registos efectuados durante vrios anos permitiram estabelecer que o nvel de

chuvas numa determinada regio, em milmetros por ano, segue uma lei normal N(600;100). Certos cientistas afirmavam poder fazer aumentar o nvel
mdio das chuvas em 50 mm. O seu processo foi posto prova e anotaram-

se os valores referentes a 9 anos: 510 614 780 512 501 534 603 788 650 Que se pode concluir? Adopte um nvel de significncia de 5%.

Manual Tcnico de Formador

95

Manual de Estatstica Aplicada

Resoluo: Duas hipteses se colocavam: ou o processo proposto pelos cientistas no

produzia qualquer efeito, ou este aumentava de facto o nvel mdio das chuvas em 50 mm. Estas hipteses podem formalizar-se do modo seguinte: H0: =600 mm H1: =650 mm Este um problema clssico de teste de hipteses, em que est em causa aceitar ou rejeitar a hiptese nula, em funo dos resultados de uma amostra. Ao utilizar uma amostra de uma populao, estamos a lidar com leis de probabilidades, logo no possvel de saber se a hiptese nula verdadeira ou falsa, mas apenas medir as probabilidades envolvidas na tomada de deciso. Podem-se definir 2 formas de especificar Ho e H1: (i) hiptese simples contra hiptese simples Ho: = 0 H1: = 1 (ii) hiptese simples contra hiptese composta Ho: = 0 H1: > 0 ou < 0 ou 0 Estes testes designam-se respectivamente de teste unilateral direita, teste unilateral esquerda e teste bilateral Sendo os testes de hipteses, portanto, um processo de inferncia estatstica onde se procuram tomar decises sobre a populao com base numa amostra, natural que envolvam alguma margem de erro e que ocorram em situao de incerteza. Estes erros no podem ser completamente evitados mas, no entanto, pode-se manter pequena a probabilidade de os cometer. Compete ao investigador decidir qual a dose de risco de se enganar em que est disposto a incorrer. Vamos supor uma probabilidade de erro de, por exemplo, 5%. Nesse caso, e avanada a hiptese nula Ho, o investigador s estaria disposto a rejeit-la se o resultado obtido na amostra fizesse parte de um conjunto de resultados improvveis que teriam apenas, por exemplo, 5 chances em 100 de
Manual Tcnico de Formador 96

Manual de Estatstica Aplicada

se produzir. Este tipo de formulao conhecida como postura conservadora. Ou seja, estamos mais propensos a achar que o novo processo no tem qualquer efeito sobre o nvel das chuvas (isto , que tudo se mantm igual) do que investir no novo processo (mudar), arriscando apenas quando houver evidncias da amostra muito fortes a favor do novo. Para que esta deciso possa ser tomada de uma forma controlada, conveniente pois que, partida, se fixe o valor a partir do qual se considera improvvel a validade da hiptese nula. Tal fixao corresponde fixao da regra de deciso do teste. A formalizao desta regra passa pela especificao de uma regio de regio de rejeio. A essa regio, isto , ao conjunto de valores improvveis que conduzem rejeio da hiptese nula d-se o nome de Regio Crtica. Ao limite superior de risco, que na maior parte dos casos de 10%, 5% ou 1%, dse o nome de Nvel de Significncia do teste, sendo este que permite definir a condio de rejeio de Ho. O Nvel de Significncia designa-se de e corresponde, ento, probabilidade de o resultado amostral levar rejeio de Ho, supondo Ho verdadeira, isto , probabilidade de se estar a cometer aquilo a que se convenciona chamar de erro de 1 espcie. Como veremos no exemplo, existem tambm erros de 2 espcie, cuja probabilidade se designa pela letra . Em resumo:
Quadro de deciso em condio de incerteza

Hiptese nula Ho Deciso Aceitar Ho Rejeitar Ho Hiptese Ho ser verdadeira: Deciso correcta (1-) Erro de tipo I Alfa () Hiptese Ho ser falsa Erro de tipo II Beta () Deciso correcta (1-)

Como decidir? Visto que se trata de testar o valor de , a varivel de deciso ser X . Considerando Ho verdadeira vem que
X N (600;

100 9

).

Manual Tcnico de Formador

97

Manual de Estatstica Aplicada

Em princpio, grandes valores de X so improvveis, pelo que se opta pela seguinte regra de deciso: Se X fr demasiado grande, isto , superior a um valor crtico c que tem apenas 5 chances em 100 de ser ultrapassado, opta-se por H1 com probabilidade 5% de se estar a cometer um erro. Se tal no acontecer, conserva-se Ho, por falta de provas suficientes para no o fazer. Logo, sendo P(Rejeitar Ho / Ho) = = 5%, vem que

P ( X > c / = 600) = 0,05 P (

>

c 600 ) = 0,05 100 9

n
c = 600 + 1,645 x 100 = 654,83(3) 3

A regra de deciso , ento, a seguinte:


-

rejeitar H0 em favor de H1, se o valor amostral fr superior a 654,83(3) conservar H0 em detrimento de H1 se fr inferior a 654,83(3)

Isto , a Regio Crtica deste teste, isto , o conjunto de acontecimentos que levam rejeio de H0 corresponde a todos os valores de X >654,83(3).

RA: Regio de Aceitao

RR: Regio Crtica ou de Rejeio

RA=(1-)

RR=
654,83(3)
X

= 600

Os dados recolhidos indicavam X =610,2 mm, pelo que a deciso conservar H0 , isto , considerar que o processo cientfico no produz efeitos.

Manual Tcnico de Formador

98

Manual de Estatstica Aplicada

No entanto, os erros incorridos no se ficam apenas pelos de 1 espcie. Existem tambm erros de 2 espcie. Isto , partida parte-se do princpio que H0 verdadeira e s se rejeitar essa hiptese se ocorrerem acontecimentos pouco provveis. No entanto, possvel alternativamente partir do princpio que H1 que verdadeira, ou seja, considerar que o processo cientfico realmente eficaz no aumento do nvel mdio das chuvas, mas que, infelizmente, o nmero de valores observado no permite observar resultados ou esses resultados foram insuficientes. Supondo ento que H1 verdadeira (=650 mm), ento vem que:
X N (650;

100 9

RA

1-
RR

= 650

A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2 espcie, vem ento igual a: P(Rejeitar H1 / H1)=
P ( X 654,83(3) / = 650) = P ( X

654,83(3) 650 ) = P ( N (0,1) 0,14) = 55,57% 100 9

atravs das probabilidades e que se procura o melhor teste de hipteses, sendo o teste ideal o que minimiza simultaneamente ambos os valores. No entanto, e como e se referem a realidades opostas e variam em sentido contrrio, tal no possvel. O que na maior parte dos casos se faz fixar o (para amostras de dimenso n) e tentar minimizar .

Manual Tcnico de Formador

99

Manual de Estatstica Aplicada

Regio de rejeio e de aceitao da hiptese nula

Unilateral esquerda H1: < 600


RA

Bilateral H1: 600 RA

Unilateral direita H1: > 600


RA

RR

RR /2
1

RR /2
1

RR

Chama-se potncia de um teste probabilidade de rejeitar H0 quando esta falsa. Esta uma deciso certa, no implica erro, e complementar do erro de 2 espcie. Logo, quanto menor o erro de 2 espcie, maior ser o valor da potncia do teste e, logo, maior a sua qualidade (diz-se que o teste mais potente) . Quando H1 uma hiptese composta (>, < ou ), a potncia do teste varivel, dependendo do valor do parmetro que no fixo. Nesse caso falase em funo potncia do teste = 1 - (1)

Resumindo: passos para construo de um teste de hipteses: Passo No 1: Formular as hipteses nula e alternativa Passo No 2: Decidir qual estatstica (estimador) ser usada para julgar a Ho e a varivel de deciso Passo No 3: Definir a forma da Regio Crtica, em funo da hiptese H1 Passo N 4: Fixar o nvel de significncia Passo N 5: Construir a Regio Crtica em funo do nvel de significncia Passo N 6: Clculo (eventual) da potncia do teste Passo N 7: Calcular a estatstica da amostra Passo No 8: Tomar a deciso: rejeio ou no de Ho

Manual Tcnico de Formador

100

Manual de Estatstica Aplicada

(i) Teste de hipteses para a mdia de uma populao normal Exemplo

Suponha que o director de qualidade pretende averiguar se o peso dos pacotes de arroz produzidos corresponde ao valor assinalado na embalagem. Seja X a varivel que representa o peso de um pacote de arroz. Suponha que
X N ( ;0,012 ) e que se conhece a seguinte amostra:

1,02 0,98 0,97 1,01 0,97 1,02 0,99 0,98 1,00 Ser que, para um nvel de significncia de 5% se pode dizer que o peso mdio corresponde ao peso de 1 kg assinalado na embalagem?

Conceitos Populao Amostra Varivel Parmetro Estimador Estimativa

Notao

Definio Todos os pacotes produzidos Os pacotes recolhidos na amostra

Peso de um pacote de arroz Quantidade mdia de arroz por pacote produzido Quantidade mdia de arroz por pacote da amostra Valor da mdia daquela amostra

Hiptese nula Hiptese alternativa Erro de tipo I Alfa () Erro de tipo II Beta ()

Ho: = 1 H1: < 1 Considerar que o peso mdio corresponde ao da embalagem quando inferior Considerar que o arroz contido em cada pacote era inferior ao indicado quando estava de facto de acordo com o valor da embalagem

Resoluo Passo 1 Formular as hipteses: Ho: = 1 H1: < 1 Passo 2 A estatstica a ser utilizada ser a mdia amostral

Manual Tcnico de Formador

101

Manual de Estatstica Aplicada

Passo 3 A regio crtica formada por todos os valores menores ou iguais a c Passo 4 Assumir um nvel de significncia de 5% Passo 5 Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo

P(Rejeitar Ho / Ho) = = 5%, vem que

P ( X < c / = 1) = 0,05 P (

<

n
0,01 = 0,9945 3 Logo, RC = ] ;0,9945] c = 1 1,645 x

c 1 ) = 0,05 0,01 9

Passo 6 Potncia do teste se o verdadeiro valor fr 0,99:

A probabilidade de rejeitar H1 erradamente, isto , de se cometer um erro de 2 espcie, vem ento igual a: P(Rejeitar H1 / H1)=. Logo a potncia do teste ser dada por 1- :
P ( X 0,9945 / = 0,99) = P ( X

0,9945 0,99 ) = P ( N (0,1) 1,35) = 91,15% 0,01 9

Passo 7

Calcular a estatstica X =
Passo 8 Tomar a deciso

1 9

xi = 0,9933

Como o valor da amostra foi 0,9933 e menor que o valor crtico 0,9945, rejeita-se Ho Ou seja, considera-se que o arroz contido em cada pacote era inferior ao indicado. No entanto, h o risco de se mandar parar a produo para reviso do equipamento sem necessidade. Reduzindo a probabilidade de isso ocorrer de 5% para 1%, vem:

Manual Tcnico de Formador

102

Manual de Estatstica Aplicada

=1%
RR: Parar a produo

=5%
RA: Continuar a produo

0,9922 0.9945

Valor da amostra: 0,9933 A nica mudana ser no Valor Crtico, que de 0,9945 para 0,9922. Neste caso, aceitaremos Ho, ou seja, consideraremos que no h qualquer anomalia na produo.

(ii) Teste de hipteses para a proporo de uma populao binomial

Seja (x1, x2, , xn) uma amostra aleatria de uma populao com parmetro p desconhecido, e considere-se que n grande (na prtica, n>100). Vamos supor que se pretende testar o valor terico da percentagem (parmetro p). Fixando-se o nvel de significncia, determina-se a regio crtica. Sendo o estimador a proporo amostral, a varivel de deciso
Z=

p p
p (1 p ) n

N (0;1)

Exemplo

Numa cidade, pretende-se saber se metade da populao favorvel construo de um centro comercial. Faz-se um inqurito a 200 pessoas, e 45% declaram-se favorveis. Estes valores contradizem a hiptese? Conceitos Populao Amostra Notao Definio Os habitantes da cidade Os habitantes inquiridos

Manual Tcnico de Formador

103

Manual de Estatstica Aplicada

Conceitos Parmetro

Notao p

Definio Percentagem ou proporo de habitantes da cidade favorveis construo de um centro comercial Percentagem ou proporo de habitantes da amostra favorveis construo de um centro comercial Valor da proporo daquela amostra

Estimador

Estimativa Hiptese nula Hiptese alternativa Erro de tipo I Alfa () Erro de tipo II Beta ()
Resoluo Passo 1 Formular as hipteses: Ho: p = 0,5 H1: p < 0,5

Ho: p = 0,5 H1: p < 0,5 Considerar que a maioria dos habitantes no favorvel construo do centro comercial quando de facto so Considerar que a maioria dos habitantes favorvel construo do centro comercial quando so contra

Passo 2 A estatstica a ser utilizada ser a proporo amostral, onde o cuidado deve ser trabalhar com grandes amostras. Passo 3 A regio crtica formada por todos os valores menores ou iguais a c Passo 4 Assumir um nvel de significncia de 5% Passo 5 Para =5%, determinar a regio de rejeio e aceitao. Logo, sendo

P(Rejeitar Ho / Ho) = = 5%, vem que

< c / p = 0,5) = 0,05 P ( P( p

p p

p (1 p ) n

<

c 0,5 0,5(1 0,5) 200

) = 0,05

c = 0,5 1,645 x

0,5(1 0,5) = 0,442 200

Logo, RC = ] ;0,442]

Manual Tcnico de Formador

104

Manual de Estatstica Aplicada

Passo 6 Potncia do teste se o verdadeiro valor fr 0,4:

P(Rejeitar H1 / H1)=. Logo a potncia do teste ser dada por 1- :


0,442 / p = 0,4) = P ( P( p p p
p (1 p ) n

0,442 0,4 0,4(1 0,4) 200

) = P ( N (0,1) 1,21) = 88,69%

Passo 7 =0,45 p Passo 8 Como o valor amostral 0,45 maior que o valor crtico 0,442, no se rejeita Ho

RR: No construir o centro comercial RR: Parar a produo

=5%
RA: Continuar a produo

+ Valor amostral: 0,45 0,442 Ou seja, apesar de apenas 45% dos habitantes se terem manifestado a favor 0 da construo do centro comercial, essa margem no suficiente para decidir deixar de o construir.

Manual Tcnico de Formador

105

Manual de Estatstica Aplicada

TESTES DE HIPTESES

Exerccios

Exerccio 1

O peso dos pacotes de farinha de 1 kg, produzidos por uma fbrica, uma varivel normalmente distribuda, com desvio padro 0,01. Da produo de determinado dia retirada uma amostra de 49 pacotes, com peso mdio de 0,998 Kg. Pode-se afirmar, a um nvel de significncia de 1%, que o peso mdio dos pacotes de farinha nesse dia no est de acordo com o peso indicado?
Resoluo

X segue N(; 0,012) n = 49

x = 0,998
= 1%

H0: = 1 H1: < 1 P(Rejeitar Ho/Ho verdadeira) = = 1%


P ( X c / = 1) = 0,01 P ( X c 1 c 1 ) = 0,01 = 2,326 c = 0,997 0,01 0,01

49

49

Como x = 0,998 > c = 0,997, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que o peso mdio no esteja de acordo com o indicado).

Exerccio 2

Numa regio onde existem entre os maiores de 18 anos 50% de fumadores, lanada uma intensa campanha anti-tabaco. Ao fim de trs meses, realiza-se um mini-inqurito junto de 100 cidados com mais de 18 anos, registando-se 45 fumadores. a) Com 1% de significncia, pode concluir-se que a campanha surtiu efeito?
Manual Tcnico de Formador 106

Manual de Estatstica Aplicada

b) Em caso negativo, qual seria a dimenso da amostra a partir da qual aquela percentagem permitiria afirmar que a cmapnha atingiu o fim em vista?
Resoluo

a) n = 100
= 0,45 p
= 1%

H0: p = 0,5 (a campanha no surtiu efeito) H1: p < 0,5 (a campanha surtiu efeito) P(Rejeitar Ho/Ho verdadeira) = = 1%
P ( X c / p = 0,5) = 0,01 P (

p p
p (1 p ) n

c 0,5

0,5 * 0,5 100

) = 0,01

c 0,5

0,5 * 0,5 100

= 2,326 c = 0,384

= 0,45 > c = 0,384, no pertence regio crtica, logo no se rejeita Como p

Ho a um nvel de significncia de 1% (a campanha no surtiu efeito).

b)

P( X 0,45 / p = 0,5) = 0,01 P(

p p 0,45 0,5 ) = 0,01 p(1 p) 0,5 * 0,5 n n

0,45 0,5 = 2,326 n = 541 0,5 * 0,5 n

Exerccio 3

Um fabricante afirma que o tempo mdio de vida de um certo tipo de bateria de 240 horas, com desvio-padro de 20 horas. Uma amostra de 18 baterias forneceu os seguintes valores: 237 242 244 262 225 218 242 248 243 234 236 228 232 230 254 220 232 240
107

Manual Tcnico de Formador

Manual de Estatstica Aplicada

Supondo que o tempo de vida das baterias se distribui normalmente, poder-se- concluir, a 5% de significncia, que as especificaes no esto a ser cumpridas?
Resoluo

X segue N(; 202) n = 18


1 18

x =

xi = 237,05

= 5%

H0: = 240 H1: < 240 P(Rejeitar Ho/Ho verdadeira) = = 1%


P ( X c / = 240) = 0,05 P ( X c 240 c 240 ) = 0,05 = 1,645 c = 232,25 20 20

18

18

Como x = 237,05 > c = 232,25, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (no se pode afirmar que as especificaes no esto a ser cumpridas).

Exerccio 4

Uma empresa de cermica tem, em dada seco, fornos controlados por termstatos para manter a temperatura no interior dos fornos a 600 graus centgrados. A experincia tem demonstrado que a varincia dos valores da temperatura no interior desses fornos de 360. A empresa fornecedora dos fornos comercializa agora um novo tipo de controlador, que anunciado como garantindo que as temperaturas se mantm dentro do limite desejado. Foram registadas 5 medidas de temperatura de fornos regulados para 600, utilizando novos controladores: 620 595 585 602 608 Para 5% de significncia, poder-se- concluir que a temperatura no se afasta significativamente do valor desejado?

Manual Tcnico de Formador

108

Manual de Estatstica Aplicada

Resoluo

X segue N(;360) n=5


1 5

x =

xi = 602

= 5%

H0: = 600 H1: > 600 P(Rejeitar Ho/Ho verdadeira) = = 5%

P( X c / = 600) = 0,05 P(

c 600 360 5

) = 0,95

c 600 = 1,645 c = 613,96 18,97 5

Como x = 602 < c = 613,96, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a temperatura no se afasta significativamente do valor desejado).

Exerccio 5

O peso dos ovos de chocolate produzidos numa fbrica segue distribuio normal com varincia 90,25. a) O fabricante diz que o peso mdio de 160 g. Foi recolhida uma amostra de 100 ovos, cujo peso mdio foi de 158, 437 g. Teste, a um nvel de significncia de 1%, se a afirmao do fabricante pode ser considerada verdadeira, ou se, pelo contrrio, o verdadeiro peso dos ovos ser menor. b) Qual o nvel de significncia a partir do qual a concluso seria diferente?
Resoluo

a) X segue N(; 90,25) n = 100

x = 158,437
= 1%

H0: = 160
Manual Tcnico de Formador 109

Manual de Estatstica Aplicada

H1: < 160 P(Rejeitar Ho/Ho verdadeira) = = 1%


P ( X c / = 160) = 0,01 P ( X c 160 c 1 = 2,326 c = 157,79 9,5

90,25 100

) = 0,01

100

Como x = 158,437 > c = 157,79, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (a afirmao do fabricante pode ser considerada verdadeira). b)
P ( X 158,437 / = 160) = P ( X

158,437 160 90,25 100

) = F (1,645) = = 5%

Exerccio 6

Um jornal semanrio afirma ter atingido, numa regio, a percentagem, at ento nunca atingida por qualquer semanrio, de 60% de leitores que regularmente compram um jornal desse tipo. Efectuando um inqurito junto de 600 leitores, 55% declararam adquirir, por hbito, o semanrio em causa. Adoptando um nvel de significncia de 1%, pronuncie-se quanto projeco que o semanrio reclama.
Resoluo

n = 600 H0: p = 0,6 H1: p < 0,6

= 0,55 p

= 1%

P(Rejeitar Ho/Ho verdadeira) = = 1%


P ( X c / p = 0,6) = 0,01 P (

p p
p (1 p ) n

c 0,6

0,6 * 0,4 600

) = 0,01

c 0,6

0,6 * 0,4 600

= 2,326 c = 0,5535

Manual Tcnico de Formador

110

Manual de Estatstica Aplicada

= 0,55 < c = 0,5535, pertence regio crtica, logo rejeita-se Ho a um Como p

nvel de significncia de 1% (o semanrio no atingiu a projeco que reclama).


Exerccio 7

Um molde de injeco tem produzido peas de um determinado material isolante trmico com uma resistncia compresso com valor esperado de 5,18 kg/cm2 e varincia 0,0625 (kg/cm2)2. As ltimas 12 peas produzidas nesse molde foram recolhidas e ensaiadas, tendo-se obtido para a resistncia mdia compresso o valor de 4,95 kg/cm2. a) Poder-se- afirmar, a um nvel de significncia de 5%, que as peas produzidas recentemente so menos resistentes do que o habitual? b) Qual a potncia do teste efectuado anteriormente, admitindo que o valor esperado da resistncia compresso das peas produzidas recentemente de 4,90 kg/cm2?
Resoluo

a) X segue N(; 0,0625) n = 12

x = 4,95
= 5%

H0: = 5,18 H1: < 5,18 P(Rejeitar Ho/Ho verdadeira) = = 5%


P ( X c / = 5,18) = 0,05 P ( X c 5,18 c 5,18 = 1,645 c = 5,061 0,25

0,0625 12

) = 0,05

12

Como x = 5,18 > c = 5,061, no pertence regio crtica, logo no se rejeita Ho a um nvel de significncia de 1% (as peas produzidas recentemente no so menos resistentes do que o habitual).

Manual Tcnico de Formador

111

Manual de Estatstica Aplicada

b) Potncia = 1-
= (Conservar Ho/H1 verdadeira)
P ( X > 5,061 / = 4,9) = P ( X

>

5,061 4,9 0,0625 12

) = 1 F (0,01) = 1 0,5040 = 49,6%

Exerccio 8

Um jornal desportivo noticiou que o nmero de espectadores de um programa desportivo que apresentado na televiso aos domingos noite est igualmente dividido entre homens e mulheres. De uma amostra aleatria de 400 pessoas que vem regularmente o referido programa, concluiu-se que 240 so homens. Pode-se concluir, para um nvel de significncia de 10%, que a notcia falsa?
Resoluo

n = 400 H0: p = 0,5 H1: p > 0,5

= 0,6 p

= 10%

P(Rejeitar Ho/Ho verdadeira) = = 10%


P ( X c / p = 0,5) = 0,1 P (

p p
p (1 p ) n

c 0,5

0,5 * 0,5 400

) = 0,9

c 0,5

0,5 * 0,5 400

= 1,282 c = 0,53205

= 0,6 > c = 0,53205, pertence regio crtica, logo rejeita-se Ho a um Como p

nvel de significncia de 1% (a notcia falsa).

Manual Tcnico de Formador

112

Manual de Estatstica Aplicada

3.6. Aplicaes estatsticas


Fiabilidade de componentes e sistemas 3.6.1 Conceito de fiabilidade

Define-se fiabilidade como sendo a probabilidade de um sistema (ou componente) desempenhar a funo para a qual foi concebido, nas condies previstas e nos intervalos de tempo em que tal exigido. A anlise da fiabilidade ser, ento, um mtodo de quantificar o que se espera que acontea e pode ser usada para indicar mritos relativos de sistemas, tendo em ateno um pr-definido nvel de fiabilidade. A fiabilidade de um componente pode ser obtida a partir da sua taxa de avarias. Se um sistema fr constitudo por vrios componentes, ento a fiabilidade ser dependente da fiabilidade dos componentes que compem esse mesmo sistema. necessrio, quando se apresentam os resultados de um estudo de fiabilidade saber exp-los, pois os interpretadores podero no ter a noo daquilo que se est a querer transmitir. Assim, dizer que a fiabilidade de um sistema ou componente de 0,998 pode no significar muito; no entanto, se tal facto fr traduzido em que, por ano, o sistema em questo estar fora de servio por avaria num perodo de 9 horas j significa alguma coisa. Como o estudo da fiabilidade se trata de um estudo extremamente importante, pois que muitas vezes esto em jogo vidas humanas, importante desenvolver um estudo de probabilidade relativo ao funcionamento adequado de um componente ou sistema.

3.6.2 Fiabilidade de um sistema

Ao analisar a fiabilidade de um sistema constitudo por vrios componentes, necessrio estudar a fiabilidade desses componentes e a forma como esto ligados (estrutura do sistema e definio do funcionamento do sistema). De seguida, so apresentados 3 casos: (i) as associaes de componentes em

Manual Tcnico de Formador

113

Manual de Estatstica Aplicada

paralelo; (ii) a associao de n unidades idnticas em paralelo em que apenas necessrio o funcionamento de m (m<=n) para o sistema funcionar; (iii) e as associaes em srie.

(i) Associao em paralelo

Consideremos vrios componentes redundantes e independentes:

Uma vez que os componentes so redundantes, basta apenas um para que o sistema funcione. Considerando um sistema composto por apenas 2 componentes, se cada um dos componentes estiver no seu perodo de vida til, a fiabilidade do sistema (Rs) dada por: Rs = P (funcionar pelo menos um componente) = P (funcionarem 1 ou 2 componentes) = 1 P (no funcionar nenhum) = 1 P (no funcionar comp.1 e no funcionar comp.2) = 1 - P (no funcionar comp.1) x P(no funcionar comp.2) pois o funcionamento independente = 1 q1 x q2 onde q1 e q2 so, respectivamente as indisponibilidades (isto , as probabilidades de no funcionamento) das componentes 1 e 2. Se houver n componentes ligadas em paralelo, a fiabilidade do sistema dada por Rs = 1 - q1 x q2 x q3 x x qn = 1 -

q
i

Manual Tcnico de Formador

114

Manual de Estatstica Aplicada

Veja-se que, no caso de sistemas redundantes, a fiabilidade do sistema aumenta medida que aumenta o nmero de componentes ligadas ao sistema (que representam como garantias de funcionamento adicionais).

(ii) Associao em paralelo de componentes no redundantes

Se o sistema no fr redundante, as condies de funcionamento e de avaria para o sistema tm de ser definidos, isto , necessrio saber qual o nmero mnimo de componentes que necessitam de estar em funcionamento para que o sistema sobreviva. Para o efeito, vai considerar-se de novo um sistema composto por quatro componentes em paralelo. Se as componentes forem todas iguais, com probabilidade de funcionamento p e de indisponibilidade q, a probabilidade associada a cada um dos estados possveis (1, 2, 3 ou 4 componentes, no mnimo, a funcionar), a fiabilidade do sistema dada pelo quadro seguinte: N mnimo de componentes necessrias ao funcionamento do sistema 4 3 2 1

Probabilidade de o sistema funcionar p4 p4 + 4p3q 4 p + 4p3q + 6p2q2 p4 + 4p3q + 6p2q2 + 4pq3

Ou seja, a fiabilidade do sistema funcionar pode ser calculada recorrendo lei binomial. Assim, por exemplo, para um n mnimo de 3 componentes necessrias, vem: Rs = P(pelo menos 3 componentes a funcionar) = P(funcionarem as 4) + P (funcionarem 3)
4 4 44 = C4 p q + C 34 p 3 q 43

= p 4 + 4 p3q Por exemplo, se todos os componentes tivessem fiabilidade 0,9 (p=0.9), ento a fiabilidade de um sistema deste tipo seria 94,77%.

Manual Tcnico de Formador

115

Manual de Estatstica Aplicada

(iii) Associao em srie

Quando os componentes se encontram associados em srie, para que o sistema funcione torna-se necessrio que todos os componentes se encontrem em bom estado de funcionamento.

No caso mais vulgar de os componentes serem independentes, a fiabilidade do sistema dada por Rs = p1 x p2 x p3 x ... x pn No caso de todas as componentes serem iguais Rs = pn Facilmente se depreende que a fiabilidade do sistema diminui medida que aumenta o nmero de componentes ligadas em srie. A distribuio exponencial a mais usada em estudos de fiabilidade, j que a probabilidade de um componente sobreviver at ao instante t dada por

e t
A probabilidade de avariar at ao instante t dada por

1 e t
Num sistema com vrias componentes em srie, em que o componente se encontra a funcionar no seu perodo de vida til, a fiabilidade do sistema dada por

Rs = e
(iv) Outros sistemas

n i =1

i t

Quando a estrutura do sistema no puder ser enquadrada em nenhuma das anteriores, tero que ser analisadas tcnicas mais gerais, tais como a rvore
de avarias. O mtodo consiste basicamente em identificar todos os modos

possveis de avaria e control-los. Assim, supondo que se pretende analisar a fiabilidade da iluminao de uma sala com uma lmpada.

Manual Tcnico de Formador

116

Manual de Estatstica Aplicada

Se o objectivo fr calcular a probabilidade de falta de energia (acontecimento secundrio) vem P (avaria) = P (A B) = P (A) + P(B) + P(A)xP(B) Para o acontecimento prioritrio (sala s escuras) vem: P(sala s escuras) = P(falta de energia lmpada estragada) Esta metodologia pode ser aplicada a estudos de fiabilidade de sistemas de proteco e esquemas de comando (fiabilidade de msseis e reactores nucleares, por exemplo).
Sala s escuras

Falta de energia

Lmpada estragada

Avaria na rede

Actuao da proteco

Manual Tcnico de Formador

117

Manual de Estatstica Aplicada

3.7. Aplicaes estatsticas


Controlo Estatstico de Qualidade

do conhecimento geral que nenhum processo de produo executa dois produtos iguais. Os processos industriais so caracterizados por produzirem peas cujas caractersticas variam dentro de certos valores tolerveis. As variaes so inevitveis, podendo ser grandes, pequenas, muito ou pouco dispersas. O conhecimento do tipo, da extenso e da evoluo dessas variaes extremamente importante para podermos garantir que nos possvel produzir produtos que vo cumprir as especificaes, para eles definidas, a um nvel aceitvel. Os testes descritos anteriormente referiam-se em situaes em que o estudo no era cronolgico. simples imaginar situaes onde, pelo contrrio, o processo a analisar deva ser monitorado ao longo do tempo. Situaes deste tipo ocorrem em linhas de fabrico de produtos, estudos de conservao de materiais e mquinas, qualidade de servios. Duma forma geral, entende-se por controle de qualidade a monitorizao de um processo, cujos resultados de natureza quantitativa se devem encontrar dentro de determinados limites. Um processo est sob controle se os resultados esto em conformidade com os limites impostos; caso contrrio, o processo deve ser investigado para que sejam detectadas as causas do desvio. A "qualidade" pode referir-se a um valor fixo, que constitui o objectivo desejado (por exemplo, a conformidade da mdia relativamente a "limites normais"). A avaliao do processo implica, que em certos intervalos de tempo se proceda a uma amostragem. O controlo estatstico de qualidade permite uma interveno nos processos, no sentido de se ajustarem e corrigirem os processos, antes de qualquer alterao no natural passar a fazer efeito de forma contnua. As cartas de controlo so um instrumento poderoso que permite identificar as causas de variao no natural nos processos. Ao definir uma carta de controle para a mdia, necessrio comear por definir a norma para (0) e 2 nveis de controle: os de vigilncia garantida (limites

Manual Tcnico de Formador

118

Manual de Estatstica Aplicada

inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a mdia amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Supe-se que a varivel em estudo segue Distribuio Normal, sendo os LIC e LSC calculados da seguinte forma:
LIC / LSC = 0 +/-

n (metodologia baseada na estimao por intervalos estudada atrs)

Ao definir uma carta de controle para a proporo, por exemplo, de defeituosos, necessrio comear por definir a norma para p (p0) e 2 nveis de controle: os de vigilncia garantida (limites inferior e superior de vigilncia: LIV e LSV) e os de controle (limites inferior e superior de controle: LIC e LSC). Se a proporo amostral cair fora da rea de tolerncia definida pelos LIC e LSC, por que h alguma anomalia e deve haver paragem da produo. Os LIC e LSC calculados da seguinte forma:

Manual Tcnico de Formador

119

Manual de Estatstica Aplicada

(1 p ) p n (metodologia baseada na estimao por intervalos estudada atrs)


LIC / LSC = p0 +/-

As cartas de controlo so instrumentos fceis e simples de aplicar pelos executantes, no sentido de se obter o controlo contnuo do processo. Podem ser traadas nos prprios locais de trabalho, dando informaes preciosas sobre os momentos em que so necessrias aces correctivas. Desde que o processo esteja sob controlo estatstico, as cartas de controlo permitem prever de forma adequada o comportamento do processo, e melhorar os processos, com base na informao disponvel nas cartas, no sentido de reduzir a sua variabilidade. As cartas so elaboradas a partir de medies efectuadas de uma caracterstica do processo (a mdia, por exemplo). Os dados so obtidos de amostras de tamanho constante, geralmente 3 ou 5 unidades, recolhidas consecutivamente em intervalos de tempo constantes. Deve ser elaborado um plano de recolha de dados, que dever ser usado como base para a colheita, registo e marcao dos dados no grfico. As amostras a utilizar devem ser de tamanho racional, isto , devem ser eficazes para o controlo sem acarretar esforo demasiado e desnecessrio na colheita. A interpretao dos limites de controlo a seguinte: se a variabilidade pea a pea do processo permanecesse constante e nos nveis encontrados, seria legtimo concluir que na base de um ponto fora dos limites de controlo estariam causas que importa conhecer e sanear. Um ponto fora do controlo deve merecer uma anlise imediata quanto causa.
Exemplo Uma empresa fabrica e comercializa condutores elctricos cujas condies de

controlo da produo e aceitabilidade a seguir se indicam (relativos resistncia de um componente em ):


-

Caracterstica sob controlo: LIC: 49,8775

Manual Tcnico de Formador

120

Manual de Estatstica Aplicada

LSC: 50,1225 n=16


=0,25

Proceder-se- paragem da produo sempre que os limites de controlo Um condutor considerado no defeituoso se a sua resistncia em

sejam desrespeitados estiver compreendida entre [49,530; 50, 470] Nestas condies, determine: a) b) c) O valor da norma 0 A probabilidade de se proceder a uma paragem indevida da produo A probabilidade de, estando a norma a ser cumprida, se produzir um

artigo defeituoso.

Resoluo

X: resistncia de um componente em
X N ( ; (0,25) 2 )

a)

LIC =
c n

c n

= 49,8775

LSC = +

= 50,1225
c n

Como LIC + LSC = 100 vem que Logo =100/2 = 50

+ +

c n

= 2 = 100

b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(49,8775 X 50,1225 sendo =50) =

Manual Tcnico de Formador

121

Manual de Estatstica Aplicada

1 - P(

49,8775 50 50,1225 50 X )= 0,25 0,25 16 16

1- P(-1,96 X 1,96) = Na tabela da Normal, vem D(1,96) = 0,95 donde 1 0,95 = 5% c) P(produzir um artigo defeituoso, sendo a norma respeitada) =
49,53 50 50,47 50 X )= 0,25 0,25 16 16

1 P(49,53 X 50,47 sendo =50) = 1 - P(

1 - P(-1,88 X 1,88) =

Na tabela da Normal, vem D(1,88) = 0,9399 donde 1 0,9399 = 6,01%

Pode ser mantido um registo das mdias amostrais por meio de uma carta como a representada na figura abaixo, denominada carta de controle de qualidade.

Mdia Amostral (cm) 50,1225

Segunda-feira

Tera-feira

Quarta-feira

Quinta-feira

Sexta-feira

50 49,8775

Manual Tcnico de Formador

122

Manual de Estatstica Aplicada

Cada vez que for calculada uma mdia amostral, ela ser representada por um ponto particular. Enquanto eles carem entre o limite inferior, 49,8775 , e o superior, 50,1225 , o processo est sob controle. Quando um ponto estiver fora desses limites de controle (como ocorreu com a terceira amostra tomada na quinta-feira), h a possibilidade de haver alguma anomalia, o que justifica uma investigao. Os limites de controlo especificados so denominados de limites de confiana. A escolha, em cada caso, depende das circunstncias particulares de cada processo.

Manual Tcnico de Formador

123

Manual de Estatstica Aplicada

3.8. Aplicaes estatsticas


Tratamento estatstico de inquritos 3.8.1 Teste de independncia do qui-quadrado

O teste do

muito eficiente para avaliar a associao existente entre

variveis qualitativas. Trata-se de um teste de hipteses semelhante aos anteriormente estudados, mas que se inclui na categoria dos testes noparamtricos, isto , aqueles que no incidem explicitamente sobre um parmetro de uma ou mais populaes (por exemplo, o valor esperado ou a proporo, como os estudados anteriormente). No entanto, a lgica de formulao das hipteses e de definio de uma regra de deciso equivalente aos testes paramtricos. O princpio bsico deste mtodo noparamtrico comparar as divergncias entre as frequncias observadas e as esperadas. Este teste encontra aplicabilidade no tratamento estatstico de inquritos. De facto, para alm do tratamento frequencista dos inquritos, por vezes interessante aferir da existncia de relaes estatsticas relevantes entre as diversas questes (por exemplo, testar se h alguma coerncia entre quem respondeu opo 1 da pergunta X e opo 2 da pergunta Y). O estudo destas relaes encontra aplicabilidade no campo das anlises de mercado, em que o objectivo proceder sua segmentao. A existncia de associaes entre as questes permite determinada um vector comum entre grupos de inquiridos que responderam de forma semelhante a certo tipo de questes (concluir algo como que os habitantes de uma dada rea foram sempre os que assinalaram determinado tipo de respostas e constituem, por isso, um segmento geogrfico autnomo e com caractersticas prprias de entre o total dos inquiridos). De uma maneira geral, pode dizer-se que dois grupos se comportam de modo semelhante se as diferenas entre as frequncias observadas e as esperadas em cada categoria forem muito pequenas ou prximas de zero.

Manual Tcnico de Formador

124

Manual de Estatstica Aplicada

Exemplo: Um pesquisador deseja verificar se h associao entre trs cursos de uma

universidade e dependncia de drogas. Entrevistou 120 alunos, sendo 25 de Medicina, 35 de Farmcia e 60 de Biologia, perguntando sobre o uso de drogas, admitindo somente duas respostas: sim ou no. Aps o processamento dos dados, chegou-se seguinte tabela de distribuio de frequncias: Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60
120

As tabelas como aquela na qual se apresentam os resultados referentes ao exemplo so habitualmente designadas de tabelas de contingncia. Admitase que os resultados que nela figuram resultam de amostras aleatrias. Tais resultados representam o nmero de observaes includas nas diferentes combinaes das classes nas quais as duas variveis em estudo se exprimem. Mod. 1 Modalidade 1 Modalidade 2 Modalidade n Total onde nij: frequncia observada na clula ij n.j: frequncia marginal observada na modalidade j ni.: frequncia marginal observada na modalidade i n: dimenso da amostra n11 n21 n.1 Mod. 2 n12 n22 n.2 Mod. n nnn n.j Total n1. n2. ni.
n

Manual Tcnico de Formador

125

Manual de Estatstica Aplicada

O objectivo do teste o de verificar se as duas variveis em questo so ou no relacionadas. As hipteses nula e alternativa so ento as seguintes: Ho: As variveis so independentes H1: As variveis no so independentes As frequncias observadas so obtidas directamente dos dados da amostra, enquanto que as frequncias esperadas so calculadas a partir destas, sob o pressuposto de que Ho verdadeira, isto , admitindo a hiptese de independncia. Na prtica, a frequncia esperada calculada pela multiplicao do total da coluna respectiva pelo total da linha a que pertence, dividindo-se o produto pela dimenso total da amostra:
eij = n i . * n. j n

calculado da seguinte forma: =


i j

(nij eij ) 2
eij

Note-se que o numerador faz referncia diferena entre frequncia observada e frequncia esperada, que dever ser calculada para cada clula da tabela. Quando as frequncias observadas so muito prximas das esperadas, o valor do numerador pequeno; no entanto, quando as discrepncias so grandes, o valor do numerador passa a ser grande e, consequentemente, o assume

valores altos. Ou seja, quando h fortes discrepncias entre o que de facto foi observado e o que seria de esperar sob a hiptese de independncia, a varivel de deciso assume um valor elevado e h motivos ou significncia

estatstica para rejeitar Ho.

No teste qui-quadrado compara-se o valor

calculado com o valor crtico

fornecido em uma tabela, considerando o nvel de significncia adoptado e os graus de liberdade GL ou d.f. (obtidos por (nmero de linhas-1)*(nmero de colunas-1)).

Manual Tcnico de Formador

126

Manual de Estatstica Aplicada

Tome-se o caso de GL (d.f.) = 4:

Para

nvel

de

significncia

de

5%,

obtm-se

da

tabela de valores crticos da

(ver pgina seguinte):

Rejeita-se a hiptese nula se tabela.

for maior que o valor crtico fornecido na

Resoluo: Como pode ser observado, entre os 120 alunos includos no estudo h um

nmero igual (60) que afirma usar e no usar drogas. No entanto, a distribuio entre os vrios cursos no ocorre de forma homognea. Medicina Usa drogas No usa drogas Total 10 15 25 Farmcia 20 15 35 Biologia 30 30 60 Total 60 60 120

Os dados so do tipo qualitativo, pois cada aluno entrevistado foi classificado sob uma determinada categoria. Neste caso, pode usar-se o teste do quiquadrado com duas hipteses de trabalho: Ho: No h associao entre tipo de curso e dependncia de drogas H1: H associao entre tipo de curso e dependncia de droga

Manual Tcnico de Formador

127

Manual de Estatstica Aplicada

Se o

obtido fr maior ou igual ao

crtico, Ho dever ser rejeitada.

Para o clculo do

recomendam-se os seguintes passos:


n i . * n. j n

1. Calcular as frequncias esperadas eij =

Por exemplo, se as duas variveis fossem independentes, seria de esperar que o nmero de estudantes de Medicina a admitir usar drogas fosse de:
eij = ni. * n. j n

25 * 60 = 12,5 120

2. As frequncias esperadas devero ser anotadas nas correspondentes clulas: Medicina Usa drogas No usa drogas Total nij eij nij eij 10 12,5 15 12,5 25 Farmcia 20 17,5 15 17,5 35 Biologia 30 30,0 30 30,0 60
120

Total 60 60

3. A seguir aplica-se a frmula

=
i j

(nij eij ) 2
eij

= =1,7

4. Determinam-se os graus de liberdade na tabela Os graus de liberdade da tabela so calculados multiplicando (nmero de linhas-1)*(nmero de colunas-1)= (2-1)*(3-1)=2 GL 5. Por ltimo, compara-se o valor do observado obtido (1,7) com o valor do

crtico, considerando os graus de liberdade (GL) e o nvel de significncia adoptado (ver tabela anexa). Vem que o obsv.=1,7 menor do que o valor obtido a partir da tabela, que

5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho no pode ser rejeitada, concluindo-se que, no grupo estudado, no h associao entre as variveis. Em mdia, a proporo de alunos que usam ou no drogas no varia entre os cursos.

Manual Tcnico de Formador

128

Manual de Estatstica Aplicada

Observao: Caso 20% ou mais das clulas tenham frequncias esperadas menores que 5, ou haja uma ou mais frequncias esperadas com valores menores ou igual a 1, no se deve usar o teste do lgico. . Uma boa alternativa para estes casos o

agrupamento de linhas e colunas adjacentes, desde que tenha algum sentido

3.8.2 Tratamento de inquritos Exemplo

A empresa BrasFruta Lda est a instalar-se em Portugal com um produto inovador, um concentrado de fruta semelhante a um sumo de fruta natural. A inteno vender o produto em cafs, esplanadas e bares que passariam a dispor de uma imitao perfeita de um sumo acabado de fazerva um preo vantajoso. Atravs de um estudo qualitativo com consumidores, conseguiu-se apurar que existia uma grande sensibilidade ao preo. Apesar de haver uma preferncia generalizada por sumos naturais face a refrigerantes, os consumidores mostravam-se cpticos em relao qualidade quando se falav em preos baixos. Entendeu-se ento levantar a seguinte questo: a sensibilidade ao preo afectada pelo poder de compra dos clientes? Numa sondagem efectuada a 1973 clientes potenciais, confrontaram-se os inquiridos com trs alternativas: adquirir sumo natural a preo elevado, adquirir sumo natural a preo baixo ou adquirir refrigerantes. A sondagem revelou que, dos clientes classes A/B/C1, 598 pagariam um preo mais elevado pelo sumo natural, enquanto 212 no estariam dispostos a gastar tanto. Em relao aos 977 clientes das classes C2/D/E, 164 s consumiriam sumo natural se o preo fosse baixo e 285 preferiam refrigerante. Cruzaram-se ento os dados e construiu-se a tabela que se segue:

Manual Tcnico de Formador

129

Manual de Estatstica Aplicada

Preo Elevado A/B/C1 C2/D/E Total 598 528 1126

Preo Baixo 212 164 376

Refrigerante 186 285 471

Total 996 977 1973

As concluses foram retiradas pelo recurso anlise correlacionada atravs do teste do qui-quadrado. Estes testes foram elaborados sobretudo com o intuito de segmentar o mercado. As frequncias foram utilizadas para analisar o mercado como um todo e para interpretar o resultado dos testes de correlao, para os quais se convencionou a adopo de um nvel de significncia de 5%, considerado razovel face aos valores normalmente utilizados. Para o clculo das frequncias esperadas, procedeu-se aplicao de
eij = n i . * n. j n

, de que resultou a seguinte tabela:

Preo Elevado A/B/C1 C2/D/E Total nij eij nij eij 598 568.4 528 557.6 1126

Preo Baixo 212 189.8 164 186.2 376

Refrigerante 186 237.8 285 233.2 471

Total 996 977


1973

Ho: As variveis so independentes H1: As variveis no so independentes

crtico (GL=2; =0,05)=5,991 observado = 31,141

Vem que o

obsv.=31,141 maior do que o valor obtido a partir da tabela,

que 5,991 (cruzamento da linha 2 com a coluna 0,05). Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que, no grupo estudado, no h associao entre as variveis. Em mdia, o poder de compra do consumidor influencia a sensibilidade ao preo.
Manual Tcnico de Formador 130

Manual de Estatstica Aplicada

Sempre que surgir alguma dificuldade em validar os testes, as diferentes alternativas por questo devem ser agregadas (isto , o nmero de classes era reduzido) de modo a diminuir os graus de liberdade associados, mas garantindo a manuteno de menos de 20% de ei<5 ou de nenhum ei<1. Relaes estatisticamente relevantes, mas sem qualquer lgica subjacente ou demasiado bvias, no foram consideradas.

Manual Tcnico de Formador

131

Manual de Estatstica Aplicada

   "!$#%&' ()10 20 3 40 3 5268792@6 A4'BCD( E#FGHIPH(

0.995 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
0.000 0.010 0.072 0.207 0.412 0.676 0.989 1.344 1.735 2.156 2.603 3.074 3.565 4.075 4.601 5.142 5.697 6.265 6.844 7.434 8.034 8.643 9.260 9.886

0.975
0.001 0.051 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908

0.9
0.016 0.211 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865

0.5
0.455 1.386 2.366 3.357 4.351

0.1
2.706 4.605 6.251 7.779

0.05
3.841 5.991 7.815

0.025
5.024 7.378

0.01
6.635

0.005

0.001

7.879 10.827

9.210 10.597 13.815

9.348 11.345 12.838 16.266

9.488 11.143 13.277 14.860 18.466

9.236 11.070 12.832 15.086 16.750 20.515

5.348 10.645 12.592 14.449 16.812 18.548 22.457 6.346 12.017 14.067 16.013 18.475 20.278 24.321 7.344 13.362 15.507 17.535 20.090 21.955 26.124 8.343 14.684 16.919 19.023 21.666 23.589 27.877 9.342 15.987 18.307 20.483 23.209 25.188 29.588

5.578 10.341 17.275 19.675 21.920 24.725 26.757 31.264 6.304 11.340 18.549 21.026 23.337 26.217 28.300 32.909 7.041 12.340 19.812 22.362 24.736 27.688 29.819 34.527 7.790 13.339 21.064 23.685 26.119 29.141 31.319 36.124 8.547 14.339 22.307 24.996 27.488 30.578 32.801 37.698 9.312 15.338 23.542 26.296 28.845 32.000 34.267 39.252

7.564 10.085 16.338 24.769 27.587 30.191 33.409 35.718 40.791 8.231 10.865 17.338 25.989 28.869 31.526 34.805 37.156 42.312 8.907 11.651 18.338 27.204 30.144 32.852 36.191 38.582 43.819 9.591 12.443 19.337 28.412 31.410 34.170 37.566 39.997 45.314 10.283 13.240 20.337 29.615 32.671 35.479 38.932 41.401 46.796 10.982 14.041 21.337 30.813 33.924 36.781 40.289 42.796 48.268 11.689 14.848 22.337 32.007 35.172 38.076 41.638 44.181 49.728 12.401 15.659 23.337 33.196 36.415 39.364 42.980 45.558 51.179

25 10.520 13.120 16.473 24.337 34.382 37.652 40.646 44.314 46.928 52.619 26 11.160 13.844 17.292 25.336 35.563 38.885 41.923 45.642 48.290 54.051 27 11.808 14.573 18.114 26.336 36.741 40.113 43.195 46.963 49.645 55.475 28 12.461 15.308 18.939 27.336 37.916 41.337 44.461 48.278 50.994 56.892 29 13.121 16.047 19.768 28.336 39.087 42.557 45.722 49.588 52.335 58.301 30 13.787 16.791 20.599 29.336 40.256 43.773 46.979 50.892 53.672 59.702

Manual Tcnico de Formador

132

Manual de Estatstica Aplicada

FIABILIDADE

Exerccios

Exerccio 1

Num centro comercial, est instalado um sistema de 10 mquinas para utilizao de carto multibanco. Diz-se que o sistema est em funcionamento se pelo menos uma das mquinas funciona. Suponha que cada mquina funciona independentemente das outras e a probabilidade de funcionamento de cada mquina 85%. Calcule a probabilidade do sistema estar em funcionamento.
Resoluo

P(avaria) = 1-0,85 = 15% P(sistema estar em funcionamento) = 1 P(sistema avariar) = 1 P(nenhuma das mquinas funcionar) = 1 P(maq1 no funcionar e...e maq 10 no funcionar) = 1 0,15*0,15*...*0,15 = 1 (aproximadamente)

2. Quatro componentes de um sistema encontram-se associados de acordo com a figura junta. Esto no seu perodo de vida til e as taxas mdias de avarias so 10-4 avarias/hora (A), 2x10-5 avarias/hora (B e C) e 5x10-5 avarias/hora (D).
B A C D

Calcule a probabilidade do sistema estar em funcionamento aps 5 000 horas.


Resoluo

A: Rs = e D: Rs = e

104 *5000

= e 0,5 = 60,6531% = e 0, 25 = 77,8801%

( 5*105 ) *5000

Manual Tcnico de Formador

133

Manual de Estatstica Aplicada

B e C: Rs = e

( 2*105 ) *5000

= e 0,1 = 90,4837%

P(funcionar 1 ou 2) = 1-P(funcionar nenhuma) = 1 (1-0,904837)2 = 99,0944% Logo, P(sistema estar em funcionamento aps 5 000 horas) = = 0,606531*0,990944*0,778801 = 46,8%

Exerccio 3

Foram ensaiadas durante 3 000 horas, sem que se verificasse qualquer avaria, cinco unidades idnticas de um equipamento que se sabe ter uma curva de sobrevivncia que obedece a uma distribuio exponencial, com um MTBF de 17 500 horas. Calcule a fiabilidade do equipamento.
Resoluo

X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/17500) MTBF = 17500 Y: n de avarias no intervalo [0,3000] horas

Rs = e
Exerccio 4

3000 17500

= e 0,171429 = 84,25%

O tempo de funcionamento sem avarias de uma determinada mquina de produo contnua segue uma lei exponencial negativa com valor esperado igual a 4,5 horas. Imagine que a mquina (re)colocada em funcionamento no instante t=0 horas. a) Qual a probabilidade de no ocorrerem avarias antes do instante t=6 horas?
b) Admitindo que a mquina se encontrava em funcionamento no instante

t=4 horas, qual a probabilidade de no ocorrerem avarias at t=6 horas?


c) Qual a probabilidade de se verificarem 2 avarias durante as primeiras 6

horas de funcionamento da mquina?

Manual Tcnico de Formador

134

Manual de Estatstica Aplicada

Resoluo

a) X: tempo de funcionamento sem avarias da mquina (em horas) (isto , tempo que decorre entre avarias consecutivas (em horas)) X segue Exp(=1/4,5) MTBF = 4,5
6 0 1 4,5 e dx = e 4,5 = 26,4% 4,5 1 6

P(X 6) = 1 P ( X < 6) = 1

Ou considerando Y: n de avarias no intervalo [0,6] horas, como Y segue Po(1/4,5), vem que P(X 6) = P(Y=0) = e-t = e-(1/4,5)t = e-(6/4,5) = 26,4%
6

P( X 6 X 4) P( X 6) e 4,5 b) P(X 6/ X 4) = = = 4 = 64,1% = P( X 2) P( X 4) P( X 4) e 4 ,5


c) Y: n de avarias no intervalo [0,6] horas P(Y=2) =
e

6 4,5

x(6 / 4,5) 2 = 23,4% 2!

Exerccio 5

Sabe-se que um determinado modelo de lmpadas apresenta no perodo de vida til (3625 horas) um MTBF de 12 000 horas. Calcular: a) A probabilidade de falha de uma ou mais lmpadas, num conjunto de 10, no perodo de vida til.
b) Quantas lmpadas, de um conjunto de 1 000, estaro provavelmente em

funcionamento aps 2 000 horas de utilizao.


Resoluo

a) Rs = e

3625 12000

= e 0,302 = 73,9%

Em 10, 1 - P(falhar nenhuma) = 1 - 0,73910 = 1 0,0488 = 95,12% b) Rs = e


2000 12000

= e 0,1667 = 84,6%

Logo, 0,846x1000 lmpadas = 846

Manual Tcnico de Formador

135

Manual de Estatstica Aplicada

Exerccio 6

Num grande centro comercial existem 3 telefones pblicos, colocados estrategicamente a fim de satisfazer adequadamente os utentes. A observao prolongada do funcionamento dos telefones levou a concluir que as probabilidades dos 3 telefones, T1, T2 e T3 se encontrarem avariados so, respectivamente, 0,15, 0,2 e 0,25 e que as avarias so independentes. O grupo de telefones satisfaz minimamente o servio se pelo menos 2 estiverem sem avarias. Qual a probabilidade de pelo menos dois destes telefones estarem sem avarias?
Resoluo

P(pelo menos dois destes telefones estarem sem avarias ) = P(2 ou 3 estarem sem avarias) = 0,095+0,51=60,5% P(2 sem avarias) = 0,15*0,2*0,75+0,85*0,2*0,25+0,15*0,8*0,25=9,5% P(3 sem avarias) = 0,85*0,8*0,75=51%

Exerccio 7

Um sistema constitudo por 5 componentes iguais, sendo 0.05 a probabilidade de um elemento falhar ao longo de qualquer dia da semana. No caso de nenhum elemento avariar o sistema funciona normalmente; se um dos elementos avariar o sistema funciona com probabilidade 0.7; se mais de um elemento avariar o sistema no funciona. Calcule: a) b) a probabilidade do sistema funcionar ao longo do dia. a funo de probabilidade do n de falhas registadas nos seus componentes ao longo de um dia, indicando o valor mdio de tal distribuio.
Resoluo

a) P(sist. funcionar) = P(0 avariar e funcionar) + P(1 avariar e funcionar) = (0,955)* 1 + (5*0,954*0,05)*0,7 = 0,7738 + 0,1425 = 91,63% b) Bi(n=5;p=0,05) Valor mdio=5*0,05=0,25

Manual Tcnico de Formador

136

Manual de Estatstica Aplicada

CONTROLE ESTATSTICO DE QUALIDADE

Exerccios

Exerccio 1

A empresa TRADECHO, SA mantm um diferendo com os seus principais clientes, que afirmam que os produtos produzidos (em srie) por esta empresa no obedecem s normas de qualidade estabelecidas e que so:
-

a norma para o comprimento mdio das peas de 20 cm; a norma para a varincia de 4 e est a ser cumprida; a amplitude do intervalo de controle para a mdia deve ser de 1,96; a dimenso das amostras a extrair de 16

Afirmam os clientes que a probabilidade de parar indevidamente o processo produtivo superior quela que decorre das normas. a) Determine a probabilidade referida. b) Represente a carta de controle para a mdia c) A recolha de 5 amostras forneceu os seguintes resultados para a mdia: 20,05 19,90 20,00 20,30 20,15

Qual a medida a tomar?


Resoluo

X: comprimento das peas em cm


X N ( ; 4)

a) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(20-1,96/2 X 20+1,96/2 sendo =20) = 1 - P(
0,98 0,98 X )= 2 2
16 16

1- P(-1,96 X 1,96) = Na tabela da Normal, vem D(1,96) = 0,95 donde 1 0,95 = 5%


Manual Tcnico de Formador 137

Manual de Estatstica Aplicada

b) e c) Mdia Amostral (cm) 20,98 20

Amostra 1

Amostra 2

Amostra 3

Amostra 4

Amostra 5

20,5

19,90

20

20,3

20,15

19,02

No necessrio parar o processo produtivo (valores dentro dos limites de controlo).


Exerccio 2

Numa empresa procede-se ao exame das condies de produo relativas durao (em horas) das lmpadas fabricadas (produo em srie). Sabe-se que o desvio-padro da durao de uma lmpada de 100 horas. O Departamento de Produo construiu o seguinte intervalo para a durao mdia de uma lmpada, a partir de uma amostra de dimenso 100:
[983,55; 1016,45]

parando-se o processo produtivo se o valor mdio amostral se situar fora deste intervalo. a) Calcule o valor adoptado para a norma (0) b) Determine a probabilidade de se parar indevidamente o processo produtivo.
Resoluo

X: durao das lmpadas em horas


X N ( ; (100) 2 ) c n n

a) LIC = LSC = +

= 983,55

= 1016,45

Manual Tcnico de Formador

138

Manual de Estatstica Aplicada

Como LIC + LSC = 2000 vem que Logo =2000/2 = 1000 h

c n

+ +

c n

= 2 = 2000

b) P (parar indevidamente o processo produtivo) = P( X cair fora dos limites de controlo quando =0) = 1 - P(983,55 X 1016,45 sendo =1000) = 1 - P(
983,55 1000 1016,45 1000 X )= 100 100 100 100

1- P(-1,645 X 1,645) = Na tabela da Normal, vem D(1,645) = 0,9 donde 1 0,9 = 10%
Exerccio 3

O novo Conselho de Administrao da empresa de componentes elctricas Alta Tenso, SA resolveu efectuar um estudo aprofundado sobre o controle estatstico de qualidade das peas produzidas. Assim, definiu com o director de produo os aspectos considerados relevantes no controle da durao mdia das componentes:
-

o limite superior de qualidade (LSC) deve ser de 10,8 milhares de horas a amplitude do intervalo no deve exceder 1,96 milhares de horas a probabilidade de se parar indevidamente a produo de 5%

Sabe-se ainda que o desvio padro da durao de uma componente de 4 mil horas. a) Determine a dimenso da amostra que necessrio recolher para cumprir as condies definidas.
b) Calcule a norma.
Resoluo

X: durao das componentes em milhares de horas


X N ( ; ( 4) 2 )

Manual Tcnico de Formador

139

Manual de Estatstica Aplicada

a) LSC = +

c n

= 10,8

D(c)= 5% logo c= 1,96


2
c n

1,96 logo 2
c n

1,96 * 4
n

1,96 n 64
1,96 * 4 64

b) LSC = +

= 10,8 logo = 10,8 -

= 9,82

Exerccio 4

O director de produo da empresa DISLIX, SA pretende implementar um sistema de controle interno de qualidade de um determinado tipo de geradores fabricados em srie. Para tal, procede verificao da produo de energia elctrica (em kws/hora) tendo e vista a construo de um intervalo de controle para a produo mdia de energia de um gerador que cumpra os seguintes objectivos:
-

Norma de produo para a mdia: 10 A amplitude do intervalo no deve exceder 3,92 A probabilidade de se parar indevidamente a produo no deve exceder 5%

Sabe-se que o desvio padro da produo da energia elctrica de um gerador de 4 kws/hora e que a varivel segue distribuio Normal. a) Determine a dimenso mnima da amostra a utilizar para o controle de produo.
b) Represente a carta de controle para a mdia.
Resoluo

X: energia elctrica produzida em kws/hora


X N ( ; ( 4) 2 )

a) D(c)= 5% logo c= 1,96 2


c n

3,92 logo 2

1,96 * 4
n

3,92 n 16

Manual Tcnico de Formador

140

Manual de Estatstica Aplicada

b) Mdia Amostral (cm) 11,96

Amostra 1

Amostra 2

Amostra 3

Amostra 4

Amostra 5

10 8,04 LIC =
c n c n

= 10

1,96 * 4 16 16

= 8,04 = 11,96

LSC = +

= 10 +

1,96 * 4

Manual Tcnico de Formador

141

Manual de Estatstica Aplicada

TRATAMENTO ESTATSTICO DE INQURITOS


Exerccio 1

Exerccios

Aos exames de primeira poca de determinada disciplina compareceram 105 alunos, dos quais 20 no tinham prestado qualquer prova durante o ano. O nmero de aprovaes foi de 33, das quais 3 foram de alunos que no tinham efectuado provas durante o ano. Diga, com base nestes elementos, se, para um nvel de significncia de 5%, se pode afirmar que existe independncia entre a comparncia (ou no) a provas durante o ano de aprovao (ou no) em exame.
Resoluo

Aprovaes Comparecem Sim No Total

Aprovado 30 3 33

Reprovado 55 17 72

Total 85 20 105

Ho: As variveis so independentes H1: As variveis no so independentes crtico (GL=2; =0,05)=3,84 observado = 3,122 Vem que o obsv.= 3,122 menor do que o valor obtido a partir da tabela.

Logo, a hiptese Ho no ser rejeitada (h independncia).

Exerccio 2

Com o objectivo de testar se existe relao entre a formao do gerente de uma dependncia bancria e a respectiva performance, construiu-se a seguinte tabela de contingncia, relativa a 300 balces de diferentes bancos: Formao Gerente Vol. Negcios Baixo Mdio Elevado

Mdia 44 55 51

Superior 52 43 55

Manual Tcnico de Formador

142

Manual de Estatstica Aplicada

Que conclui, a um nvel de significncia de 1%?


Resoluo

Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Formao Gerente Vol. Negcios Baixo Mdio Elevado crtico (GL=2; =0,01)=9,21 observado = 2,2876 Valor obsv. est. teste = Vem que o
(44 48) 2 (55 53) 2 + ... + = 2,2876 > 9,21 48 53

Mdia 48 49 53

Superior 48 49 53

obsv.= 2,2876 maior do que o valor obtido a partir da tabela,

Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 3

Pretendendo-se analisar o comportamento do volume de divisas ao longo do ano, deu-se particular ateno influncia exercida pelas remessas de emigrantes. Assim, o ano foi dividido em duas pocas: poca de Ponta, compreendendo os meses de vinda de emigrantes (Vero e Natal) e poca Normal (restantes meses). Assim, observou-se o nvel de Disponibilidades Lquidas sobre o Exterior (DLX) para cada ms, tendo-se obtido: Volume DLX Baixo/Mdio 150 20 Elevado 50 80

poca Normal Ponta

A um nvel de significncia de 5%, que pode concluir?

Manual Tcnico de Formador

143

Manual de Estatstica Aplicada

Resoluo

Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Volume DLX poca Normal Ponta Baixo/Mdio 113,33 6,66 Elevado 86,66 43,33

crtico (GL=1; =0,05)=5,991 observado = 85,069

(150 113,33) 2 (80 43,33) 2 Valor obsv. est. teste = + ... + = 85,069 > 3,84 113,33 43,33
Vem que o obsv.= 85,069 maior do que o valor obtido a partir da tabela,

Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 4

Num estudo que pretendia averiguar a existncia de relao entre a procura de moeda e a taxa de juro, procedeu-se recolha peridica de elementos sobre essas variveis, construindo-se a seguinte tabela de contingncia: Taxa juro Proc. Moeda 0-10 10-45 45-70 Reduzida 20 20 250 Mdia 30 400 30 Elevada 200 30 20

Utilizando um nvel de significncia de 5%, que concluso pode tirar?


Resoluo

Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Taxa juro Proc. Moeda 0-10 10-45 45-70 Reduzida 72.5 130.5 87 Mdia 115 207 138 Elevada 62.5 112.5 75

Manual Tcnico de Formador

144

Manual de Estatstica Aplicada

crtico (GL=4; =0,05)=9,49 observado = 1183,7

Vem que o

obsv.= 1183,7 maior do que o valor obtido a partir da tabela,

Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.
Exerccio 5

Um investigador seleccionou trs amostras de estudantes, A, B e C, que fazem parte de um determinado projecto de estudo e aplicou-lhes uma escala de atitudes com o objectivo de conhecer as suas opinies em relao ao projecto. Os resultados de uma amostra de 140 estudantes foram os seguintes: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva

A 30 10

B 30 20

C 10 40

Utilizando um nvel de significncia de 5%, que concluso pode tirar?


Resoluo

Ho: As variveis so independentes H1: As variveis no so independentes Valores esperados: Grupo de Tipo estudantes de atitude Atitude negativa Atitude positiva

A 20 20

B 25 25

C 25 25

crtico (GL=2; =0,05)=3,84 observado = 30 Vem que o obsv.= 30 maior do que o valor obtido a partir da tabela,

Assim sendo, a hiptese Ho ser rejeitada, concluindo-se que h associao entre as variveis.

Manual Tcnico de Formador

145

Manual de Estatstica Aplicada

BIBLIOGRAFIA
Murteira, Bento; Black, George; Estatstica Descritiva, Mc-Graw-Hill Murteira, Bento; Anlise Exploratria de Dados, Mc-Graw-Hill Murteira, Bento; Probabilidades e Estatstica, Vol. I, II, Mc-Graw-Hill Oliveira, Tiago; Probabilidades e Estatstica, Vol. I, II, Mc-Graw-Hill Guimares, Rui C.; Sarsfield Cabral, J. A.; Estatstica, Mc-Graw-Hill Kreyszig, Erwin; Introductory Mathematical Statistics, Wiley Fisz, Marek; Probability Theory and Mathematical Statistics, Wiley Mood, Graybill and Boes; Introduction to the Theory of Statistics, McGraw-Hill Wonanacot, T.H.; Wonnacot; R.J.; Introductory Statistics, Wiley Siegel, A. F.; Practical Business Statistics, 3 ed., Irwin, Boston

Manual Tcnico de Formador

146

Manual de Estatstica Aplicada

ANEXOS ACETATOS

Manual Tcnico de Formador

147

Manual de Estatstica Aplicada

VARIVEL CONTNUA
Exerccio 1 Tabela de frequncias
[0; 1[ [1; 3[ [3; 5[ [5; 15[ [15; 25[ [25; 50]
Total X fi 10% 25% 35% 15% 10% 5% 1 hi 1 2 2 10 10 25 fi/hi 0.1 0.125 0.175 0.015 0.01 0.002 Fi 10% 35% 70% 85% 95% 100% ci 0.5 2 4 10 20 37.5

Histograma
fi/hi 0,2 0,18 0,16 0,14 0,12 0,1 0,08 0,06 0,04 0,02 0 0 10 20 30 40 50 60

Manual Tcnico de Formador

148

Manual de Estatstica Aplicada

Polgono Integral
Fi
1 0,8 0,6 0,4 0,2 0 0 20 40 60 80 100 120

Mediana

Fi
1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 0 20 40 60 80 100 120

Manual Tcnico de Formador

149

Manual de Estatstica Aplicada

CLCULO DOS QUARTIS


Exerccio 1
Fi
1

0,75

0,5

0,25

0 0 Q1 Q2 Q3 10 20 30 40 50

Classe a que pertence Q1: [1; 3[ 0,35 - 0,1 ------------ 3 - 1 0,25 0,1 -------------- Q1 1 Q1 = 1 + ((2x0,15)/0,25) = 2,2 25% das empresas tm res. lquidos inferiores a 2200 u.m. Classe a que pertence Q3: [5; 15[ 0,85 - 0,7 ------------ 15 - 5 0,75 0,7 -------------- Q3 5 Q3 = 1 + ((10x0,05)/0,15) = 8,333(3) 75% das empresas tm res. lquidos inferiores a 8333 u.m.
Manual Tcnico de Formador 150

Manual de Estatstica Aplicada

CLCULO DOS QUARTIS


Exemplo 3
Fi
1

0,75

0,5

0,25

0 0

Q1

1 1,15

Q2 Q3

Classe a que pertence Q1: [0,5; 1[ 0,383 - 0,059 ------------ 1 0,5 0,25 0,059 -------------- Q1 0,5 Q1 = 0,5 + ((0,5x0,191)/0,324) = 0,795 25% das empresas tm rcio inferior a 0,795 Classe a que pertence Q3: [1; 1,5[ 0,765 - 0,383 ------------ 1,5 - 1 0,75 0,383 -------------- Me 1 Me = 1 + ((0,5x0,367)/0,382) = 1,48 75% das empresas tm rcio inferior a 1,48
Manual Tcnico de Formador 151

Manual de Estatstica Aplicada

CLCULO DOS QUARTIS


Exerccio 3
1

Fi

0,75

0,5

0,25

0 80 120 160 200 240 280 320 360

Classe a que pertence Q1: [100; 120[ 0,542 - 0,23 ------------ 120 100 0,25 0,23 -------------- Q1 100 Q1 = 100 + ((20x0,02)/0,312) = 101,28 Classe a que pertence Q2: [100; 120[ 0,542 - 0,23 ------------ 120 100 0,5 0,23 --------------- Q2 100 Q2 = 100 + ((20x0,27)/0,312) = 117,31
50% dos

25% dos funcionrios aufere menos de 101,28 milhares u.m.

funcionrios aufere menos de 117,31 milhares u.m.

Classe a que pertence Q3: [140; 160[ 0,809 - 0,737 ------------ 160 - 140 0,75 0,737 -------------- Q3 140 Me = 140 + ((20x0,013)/0,072) = 143,61
75% dos

funcionrios aufere menos de 143,61 milhares u.m.

Manual Tcnico de Formador

152

Manual de Estatstica Aplicada

RECTA DE REGRESSO
Exerccio 10
x = 1 n
n i =1
n i =1

n i =1

xi = 21,429
2

y =

1 n

n i =1

y i = 6,714

sx
sy

1 = n
1 = n

(xi x )
(yi y )

= 69,9408
= 11,0651

CV x =

sx 69,9408 = = 0,39 x 21,429

<

CV y =

sy y

11,0651 = 0,495 6,714

A disperso das despesas em publicidade superior disperso das vendas.

Recta de Regresso
y = 2,4649x + 4,8782 30

Vendas

20

r=

s xy s xx s yy

= 0,98

10
r= s xy s xx s yy

1 [(10 21,429)(3 11.0651) + ... + (35 21,429)(13 11,0651)] 7 = = 0,98 69,9408 x 11,0651

0 3 8 Desp. Public. 13

Manual Tcnico de Formador

153

Manual de Estatstica Aplicada

ANLISE DE CONCENTRAO
Exemplo: Amostra de 200 empresas de um dado sector industrial, referente aos lucros obtidos em u.m.
Lucros [0; 50[ [50; 100[ [100; 200[ [200; 300[ [300; 500] Total ni 20 60 80 30 10 200
n 1

Lucro total 600 4400 14000 7500 3500 30000

pi (=Fi) 0.1 0.4 0.8 0.95 1

qi 0.02 0.16(6) 0.63(3) 0.883(3) 1

( pi qi)
n 1 i =1

G=

i =1

= pi

0,546(6) = 0,243 2,25

Curva de Lorenz 1 0,8 0,6 0,4 0,2 0 0


Manual Tcnico de Formador

0,2

0,4

0,6

0,8

1
154