Escolar Documentos
Profissional Documentos
Cultura Documentos
Aplicada
Estatstica
Administrao
Administrao
Prof. Marcelo Tavares
Copyright 2007. Todos os direitos desta edio reservados ao Sistema Universidade Aberta do Brasil. Nenhuma parte deste material
poder ser reproduzida, transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito,
do autor.
PRESIDENTE DA REPBLICA
Luiz Incio Lula da Silva
MINISTRO DA EDUCAO
Fernando Haddad
SECRETRIO DE EDUCAO A DISTNCIA
Carlos Eduardo Bielschowsky
DIRETOR DO DEPARTAMENTO DE POLTICAS EM EDUCAO A DISTNCIA DPEAD
Hlio Chaves Filho
SISTEMA UNIVERSIDADE ABERTA DO BRASIL
Celso Costa
COMISSO EDITORIAL DO PROJETO PILOTO UAB/MEC
Marina Isabel Mateus de Almeida (UFPR)
Teresa Cristina Janes Carneiro (UFES)
Antonio Roberto Coelho Serra (UEMA)
Jonilto Costa Sousa (UnB)
Vicente Chiaramonte Pires (UEM)
Ozrio Kunio Matsuda (UEM)
Anderson de Barros Dantas (UFAL)
ORGANIZAO DO CONTEDO
Prof. Marcelo Tavares
PROJETO GRFICO
Annye Cristiny Tessaro
Mariana Lorenzetti
DIAGRAMAO
Annye Cristiny Tessaro
Victor Emmanuel Carlson
REVISO DE PORTUGUS
Renato Tapado
Patrcia Regina da Costa
Sumrio
Introduo.....................................................................................07
UNIDADE 3 Amostragem
Amostragem............................................................................73
Introduo
O cidado comum pensa que a estatstica se resume apenas a
apresentar tabelas de nmeros em colunas esportivas e/ou econmicas
de jornais e revistas, ilustradas com grficos, pilhas de moedas, etc.,
ou quando muito associam a estatstica previso de resultados eleitorais. A estatstica no se limita somente a compilar tabelas de dados e
os ilustrar graficamente. Sir Ronald Fisher (1890-1962), em seus trabalhos, iniciou a estatstica como mtodo cientfico. Desta forma, o
trabalho do estatstico passou a ser o de ajudar a planejar a obteno
de dados, interpretar e analisar os dados obtidos e apresentar os resultados de maneira a facilitar a tomada de decises razoveis.
Didaticamente, podemos dividir a estatstica em duas partes: a
estatstica descritiva e a inferncia estatstica.
A estatstica descritiva preocupa-se com a forma pela qual podemos apresentar um conjunto de dados em tabelas e grficos, e tambm
resumir as informaes contidas nestes dados mediante a utilizao de
medidas estatsticas.
J a inferncia estatstica baseia-se na teoria das probabilidades
para estabelecer concluses sobre todo um grupo (chamado populao), quando se observou apenas uma parte (amostra) representativa
desta populao.
Uma grande quantidade de informaes importantes que auxiliam na tomada de decises est no site do Instituto Brasileiro de Geografia e Estatstica (IBGE). Todo o clculo das estatsticas pode ser
feito por meio de calculadoras cientficas e tambm softwares estatsticos. As planilhas eletrnicas permitem o clculo de diversas estatsticas e confeco de grficos de forma mais rpida e eficiente.
necessrio ter em mente que a estatstica uma ferramenta
para o gestor ou executivo, nas respostas dos porqus de seus problemas que podem ser explicados por uma anlise de dados. Para ela
ser bem usada, necessrio conhecer os seus fundamentos e princpios, e acima de tudo que o gestor ou executivo desenvolva um esprito
Uma sugesto de
referncia
NEUFELD, John L.
Estatstica Aplicada
Administrao usando
Excel. v.1. So Paulo:
Prantice Hall, 2003
crtico e jamais deixe de pensar. Pois fcil mentir usando a estatstica, o difcil falar a verdade sem usar a estatstica.
Atualmente, as empresas tm procurado profissionais como executivos que tenham um nvel de conhecimento de estatstica alto, pois
este conhecimento tem feito uma diferena grande nos processos
decisrios em empresas.
Este livro ser dividido em quatro Unidades:
Unidade 1 Estatstica Descritiva (Descrio de amostras
por meio de distribuies de freqncias, e medidas de posio e disperso);
Unidade 2 Probabilidades (Conceitos bsicos de probabilidades, variveis aleatrias uni e bidimensionais) e Distribuies de Probabilidades (discretas e contnuas);
Unidade 3 Amostragem (probabilstica e no probabilstica),
Distribuies Amostrais (Distribuies t de Student, qui-quadrado e F) e Intervalos de Confiana (mdia, proporo); e
Unidade 4 Processos Decisrios (Testes de Hipteses).
UNIDADE
1
Estatstica
Estatstica descritiva
descritiva
Objetivo
Esta Unidade tem por objetivo fazer com que voc tenha condies
de descrever e apresentar os resultados de um conjunto de observaes
de forma clara, objetiva e passando o mximo de informaes possveis.
Para tal objetivo, sero abordadas as distribuies de freqncias, anlises
grficas, medidas de posio e disperso.
10
Mdulo 4
Estatstica descritiva
11
GLOSSRIO
*Dados Brutos:
dados na forma em
que foram coletados,
sem nenhum tratamento.Fonte:
Lacombe (2004)
Quando voc coleta os dados para uma pesquisa, estas observaes so chamadas de dados brutos. Um exemplo de dados brutos
corresponde ao tempo em minutos que consumidores de uma determinada operadora de telefonia celular utilizariam em um ms (dados simulados pelo autor a partir de um caso real). Os dados foram obtidos em uma
pesquisa de mercado e apresentados na forma em que foram coletados
(Tabela 1), por este motivo so denominados dados brutos*.
Geralmente, este tipo de dado traz pouca ou nenhuma informao ao leitor, sendo necessrio organizar os dados, com o intuito de
aumentar sua capacidade de informao.
GLOSSRIO
*Rol a mais simples organizao
numrica. a ordenao dos dados em
ordem crescente ou
decrescente.
*Amplitude Total
corresponde diferena entre o maior
e o menor valor observado em um conjunto de dados. Notaremos por A.
12
104
122
17
129
25
144
33
183
108
10
142
18
138
26
151
34
138
138
11
106
19
122
27
146
35
115
101
12
201
20
161
28
82
36
179
163
13
169
21
167
29
137
37
142
141
14
120
22
189
30
132
38
111
90
15
210
23
132
31
172
39
140
154
16
98
24
127
32
87
40
136
Tabela 1: Tempo (T) em minutos de uso de telefone celular por consumidores (C) de uma determinada operadora
Mdulo 4
82
111
132
142
167
87
115
136
142
169
90
120
137
144
172
98
122
138
146
179
101
122
138
151
183
104
127
138
154
189
106
129
140
161
201
108
132
141
163
210
Tabela 2: Tempo em minutos de uso de telefone celular por consumidores de uma determinada operadora (dados em rol crescente).
GLOSSRIO
*Classes: Intervalos nos quais os valores da varivel
analisada so agrupados.
13
Deste modo, surge a necessidade de definir a natureza do intervalo de classe, se aberto ou fechado. Portanto, podemos ter exemplo de notao dos diferentes tipos de intervalos: Intervalos abertos*
Este tipo de intervalo
o mais utilizado.
GLOSSRIO
*Intervalos abertos
os limites da classe
(inferior e superior)
no pertencem a ela.
*Intervalos fechados os limites de
classe (superior e
inferior) pertencem
classe em questo.
*Intervalos mistos
um dos limites pertence classe, e o
outro, no.
, para
n 100;
,
para n > 100
14
Vamos, ento, a partir dos dados do exemplo relativo ao tempo de utilizao dos celulares, construir uma distribuio de
freqncia e ao longo deste exerccio identificar conceitos
presentes em uma distribuio de freqncias.
Mdulo 4
c = amplitude de
classe; A = amplitude
total; e k = nmero de
classes.
PM =
onde:
onde:
= 69,2 min
Definindo, ento, o limite inferior da primeira classe, para obtermos as classes da nossa distribuio, basta que somemos a amplitude
do intervalo de classe a cada limite inferior.
Assim, teremos:
69,2 | 94,8 primeira classe
94,8 | 120,4 segunda classe
20,4 | 146,0 terceira classe
146,0 | 171,6 quarta classe
171,6 | 197,2 quinta classe
197,2 | 222,8 sexta classe
15
A freqncia absoluta (fa) corresponde ao numero de observaes que temos em uma determinada classe ou em um
determinado atributo de uma varivel qualitativa e a freqncia relativa (fr) corresponde proporo do nmero de observaes em uma determinada classe em relao ao total
de observaes que temos.
Esta freqncia pode ser expressa em termos porcentuais. Para
isto, basta multiplicar a freqncia relativa obtida por 100.
Classes (mm)
Freqncia
69,2 | 94,8
94,8 | 120,4
120,4 | 146,0
146,0 | 171,6
171,6 | 197,2
197,2 | 222,8
Total
Na tabela, aparece uma nova denominao chamada freqncia. Podem ter freqncias chamadas de freqncia absoluta (fa),
freqncia relativa (fr) e freqncia acumulada (discutida posteriormente).
O clculo da freqncia relativa obtido por meio da seguinte
expresso:
, com fai = freqncia absoluta da classe i.
Apresentando os dados na forma de distribuio de freqncia,
voc consegue sintetizar as informaes contidas neles, alm de facili16
Mdulo 4
tar sua visualizao. Na Tabela apresentada a seguir, temos as freqncias (fa e fr) relacionadas ao tempo de utilizao do aparelho celular.
Classes (mm)
69,2 | 94,8
0,075
94,8 | 120,4
0,200
120,4 | 146,0
16
0,400
146,0 | 171,6
0,175
171,6 | 197,2
0,100
197,2 | 222,8
0,050
Total
40
1,000
GLOSSRIO
*Freqncia Acumulada Freqncia Acumulada
corresponde soma
da freqncia daquela classe s freqncias de todas as
classes abaixo dela.
17
Freq. acumulada
69,2 | 94,8
0,000
94,8 | 120,4
0,075
120,4 | 146,0
11
0,275
146,0 | 171,6
27
0,675
171,6 | 197,2
34
0,850
197,2 | 222,8
38
0,950
Total
40
1,000
Para podermos obter esta freqncia, necessrio que venhamos a pressupor que os tempos de utilizao estejam uniformemente
18
Mdulo 4
distribudos dentro das classes. O clculo baseado nos dados da Tabela 4 e so apresentados a seguir.
19
fa
fr
Masculino
20
0,40
Feminino
30
0,60
Total
50
1,00
Tomando, por exemplo, o caso de uma varivel aleatria discreta (conceito visto em Metodologia de Pesquisa), realizou-se no
SAC (Servio de Atendimento ao Consumidor) de uma empresa um
estudo referente ao nmero de reclamaes (N.R.) atendidas diariamente, durante um certo ms, obtendo os seguintes resultados:
N.R. Dia
20
N.R. Dia
N.R. Dia
N.R. Dia
N.R.
13
19
25
14
20
26
15
21
27
10
16
22
28
11
17
23
29
12
18
24
30
Mdulo 4
Freq. Relativa
0.3
0.17
0.23
0.17
0.07
0.07
Total
30
Para responder a esta pergunta, vamos falar um pouco sobre algumas formas de representao grfica de tabelas de freqncia.
Logicamente, dependendo do tipo de varivel, temos um grfico mais
adequado. Os diferentes tipos de grfico, (histogramas, polgonos de
freqncia, ogivas, grficos de setores, pictogramas e outros) permitem uma melhor visualizao de resultados. Estes grficos podem ser
obtidos utilizando planilhas eletrnicas, como por exemplo, o Excel.
21
GLOSSRIO
*histograma
Histogramas: so
constitudos por um
conjunto de retngulos, com as bases
assentadas sobre um
eixo horizontal, tendo o centro da mesma no ponto mdio
da classe que representa, e cuja altura
proporcional freqncia da classe.
*Polgono de freqncias um grfico de anlise no
qual as freqncias
das classes so localizadas sobre perpendiculares levantadas nos pontos
mdios das classes.
22
Mdulo 4
23
Saiba mais...
Visite o site de como usar a planilha Cal, do pacote
OpenOffice, nas estatsticas descritivas, em: http://www2.ufpa.br/
dicas/open/oo-ind.htm
Vamos, ento, fazer um exerccio para fixar os conhecimentos
adquiridos. (As respostas esto no final do livro.)
24
Mdulo 4
51
50
58
50
44
46
57
42
41
60
58
41
50
54
60
52
46
52
51
Medidas de posio
As medidas de posio ou de tendncia central constituem uma
forma mais sinttica de apresentar os resultados contidos nos dados
observados, pois representam um valor central, em torno do qual os
dados se concentram. As medidas de tendncia central mais empregadas so a mdia, a mediana e a moda.
A mdia aritmtica* a mais usada das trs medidas de posio mencionadas, por ser a mais comum e compreensvel delas, bem
como pela relativa simplicidade do seu clculo, alm de prestar-se bem
ao tratamento algbrico.
Considerando o caso do nmero de reclamaes em um SAC
(ver em distribuies de freqncia), se voc somar todos os valores
do nmero de reclamaes e dividir pelo nmero de dias, voc ter
ento a mdia aritmtica ( ) do nmero de reclamaes.
Ento, o valor obtido ser: = 1,73 reclamaes por dia.
GLOSSRIO
*A mdia aritmtica, ou simplesmente mdia de um conjunto de n observaes, x1, x2,...,xn
definida como:
O somatrio ()
corresponde soma
de todos os valores
obtidos.
25
GLOSSRIO
*Hiptese Tabular
Bsica todas as
observaes contidas numa classe so
consideradas iguais
ao ponto mdio da
classe.
26
Mdulo 4
Outro tipo de mdia corresponde geomtrica (Mg). Ela calculada pela raiz n-sima do produto de um conjunto de n observaes,
x1,x2,...,xn, associadas s freqncias absolutas f1,f2,..., fn, e, respectivamente, dada por:
27
onde:
Li: limite inferior da classe modal;
d1: diferena entre a freqncia da classe modal e a imediatamente anterior;
d2: diferena entre a freqncia da classe modal e a imediatamente posterior; e
c: amplitude da classe modal.
No caso do tempo de uso de aparelhos celulares (ver a tabela no
item distribuio de freqncias), teremos que a classe modal a terceira, pois apresenta maior freqncia. Utilizando a expresso mostrada anteriormente, teremos:
28
Mdulo 4
O smbolo da mediana dado por Md ou . A posio da mediana dada por meio da expresso: E (elemento central) = (n+1) / 2.
Considerando um conjunto de dados com nmero mpar de elementos como (1, 2, 5, 9, 10, 12, 13), a posio da mediana ser dada
por (7 + 1)/2 = 4 posio. Portanto, a partir dos dados ordenados, o
nmero que se encontra na 4 posio o 9, e assim a mediana ser
igual a 9. (Temos trs valores abaixo e trs valores acima ou 50%
acima da mediana, e 50% abaixo)
Caso o nmero de elementos do conjunto de dados for par, como
por exemplo, (1, 2, 6, 8, 9, 12, 11, 13), encontra-se a posio da mediana (( 8 + 1)/2 = 4,5 posio). Como a posio 4,5 est entre a 4 e a
5 posio, calcula-se a mdia entre os valores que ocupam estas posies. O valor encontrado de 8,5 corresponde mediana.
Quando os dados esto agrupados na mediana devemos encontrar a classe mediana.
Se os dados esto agrupados em intervalos de classe, como no
caso do tempo de utilizao do telefone, utilizaremos a seguinte expresso:
29
onde: li: limite inferior da classe mediana; n: nmero total de elementos; fantac: freqncia acumulada anterior classe mediana; fmed: freqncia absoluta da classe mediana e a amplitude da classe mediana.
Portanto, resolvendo o caso do tempo de utilizao dos celulares, teremos que a posio da mediana ser dada por E = 40/2 = 20
elemento, o qual est na terceira classe (120,4 | 146), que corresponde
classe mediana.
30
Mdulo 4
Medidas de disperso
Como foi visto anteriormente, podemos sintetizar um conjunto
de observaes em alguns valores representativos como mdia, mediana, moda e quartis. Em vrias situaes, torna-se necessrio visualizar
como os dados esto dispersos. Tomando como exemplo vrias empresas que apresentem salrios mdios iguais, podemos concluir, ento, que a contribuio social (% do salrio) ser a mesma? Somente
31
O termo amplitude
total foi visto anteriormente na construo
de uma distribuio de
freqncia em classes.
Relembrando, a
diferena entre o
maior e o menor valor
observados.
32
com base no salrio mdio, sim, mas estaramos chegando a uma concluso errada. A variao em termos de faixas salariais pode ser diferente, apesar de apresentarem a mesma mdia. Pensando no que foi
dito anteriormente, considere o valor (em reais) ganho por dia de trs
grupos de empregados (A: 70, 70, 70, 70, 70; B: 50, 60, 70, 80, 90; C:
5, 15, 50, 120, 160).
Podemos verificar que, apesar de apresentarem a mesma mdia
(70), os trs grupos apresentam comportamento diferenciado, pois o
grupo A o mais homogneo, e o grupo C o que apresenta maior
variao de ganho por dia. Portanto, devemos sempre inserir junto a
uma medida de posio uma medida que avalie esta distribuio, ou
seja, a variabilidade de um conjunto de dados. Portanto, quanto maior
a variabilidade, maior ser a disperso das observaes.
Uma primeira medida de disperso que vamos comentar a
amplitude total. No caso dos ganhos dirios, podemos obter os seguintes resultados:
AA = 70 70 = 0
A B = 90 50 = 40
AC = 160 5 = 155
Verificamos, ento, que o grupo C o que apresenta maior variabilidade, e que o grupo A corresponde ao de menor variabilidade.
Deste modo, o grupo C corresponde quele que teve maior variabilidade em torno da mdia.
No caso de dados agrupados, a amplitude total calculada por
meio da diferena entre o ponto mdio da ltima classe e o ponto mdio da primeira classe.
A amplitude total tem a desvantagem de s levar em conta os
dois valores extremos, por isso apenas uma indicao aproximada
da disperso. Outra desvantagem que a amplitude total apresenta
muita variao de uma amostra para outra, mesmo que ambas sejam
extradas da mesma populao.
Portanto, voc deve trabalhar com uma medida que leve em considerao todas as observaes. Desta forma, podemos querer verificar o quanto um conjunto de observaes est mais prximo ou mais
distante de uma medida, que no caso ser a mdia. Ento, voc pode
Mdulo 4
33
s ou . A varincia uma medida que tem pouca utilidade na Estatstica Descritiva, mas ser extremamente importante na Inferncia Estatstica e em combinaes de amostras. Tambm importante frisar
que, na grande maioria das situaes, trabalhamos com amostras, ento devemos utilizar o desvio-padro amostral.
No caso dos ganhos dirios, calculando a varincia de cada um
dos grupos que correspondem a uma amostra, encontramos os seguintes resultados:
sA = 0 reais; sB = 15,81 reais; sC=67,54 reais.
O desvio-padro, quando analisado isoladamente, no d margem a muitas concluses. Por exemplo, para uma distribuio cuja
mdia 300, um desvio-padro de 2 unidades pequeno, mas para
uma distribuio cuja mdia 20, ele j no to pequeno.
Importante!
Condies para se usar o desvio-padro ou varincia para comparar a variabilidade entre grupos:
mesmo nmero de observaes;
mesma unidade; e
mesma mdia.
Alm disso, se quisermos comparar duas ou mais amostras de
valores expressas em unidades diferentes, no poder ser possvel fazer a comparao por meio do desvio-padro, pois ele expresso na
mesma unidade dos dados. Tambm necessrio que os conjuntos de
observaes tenham o mesmo tamanho. Podemos, ento, considerar a
situao na qual se avaliou o custo indireto de fabricao (CIF) de um
produto em reais e o tempo gasto em uma mquina para fabricao
deste produto em segundos.
CIF
Tempo
34
175 reais
5 reais
68 segundos
2 segundos
Mdulo 4
35
reas (m2)
N de lotes
300 | 400
14
400 | 500
46
500 | 600
58
600 | 700
76
700 | 800
68
800 | 900
62
900 | 1000
48
1000 | 1100
22
1100 | 1200
36
Mdulo 4
Saiba mais...
Sobre clculo de mdias e funes em planilhas, visite o site:
http://www.juliobattisti.com.br/tutoriais/celsonunes/
openoffice007.asp
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm
37
UNIDADE
2
Introduo
Introduo aa probabilidades
probabilidades
40
Mdulo 4
Introduo a probabilidades
GLOSSRIO
*Espao amostral
conjunto de possibilidades, ou seja, os
possveis resultados
associados a um experimento aleatrio.
*Experimento aleatrio qualquer processo que venha a
gerar um resultado
incerto ou casual.
ticular resultado, onde r corresponde ao nmero de vezes que um determinado resultado aconteceu.
Nos experimentos ou situaes mencionadas, voc pode notar
que a incerteza sempre est presente, o que quer dizer que, se estes
experimentos forem repetidos em idnticas condies, no se pode
determinar qual o resultado ocorrer.
A incerteza est associada chance de ocorrncia que atribumos ao resultado de interesse.
Consideremos, como exemplo, os funcionrios que trabalham
no setor de marketing de uma determinada empresa. Sabe-se que nes-
41
42
Mdulo 4
2. 0 P(A) 1
3. Regra da soma: dados dois eventos mutuamente exclusivos A e C de ,
P(AC) = P(A) + P(C)
O smbolo corresponde ocorrncia de um evento impossvel, ou seja, que no pode ocorrer no espao amostral considerado.
Acessa e no
cadastra no site
Total
Site 1
39.577
8.672
48.249
Site 2
46.304
7.297
53.601
Total
85.881
15.969
101.850
Um acesso a um dos sites escolhido ao acaso. Podemos considerar, ento, que o nosso espao amostral () corresponder ao conjunto de 101.850 acessos.
H os seguintes eventos de interesse:
S1 = nmero de acessos feitos no site 1.
43
Quando n cresce: fn(A) se aproxima da P(A), por isso foram realizadas n repeties independentes do experimento.
No exemplo anterior, se voc souber que um acesso sorteado do
site 1, qual a probabilidade de que ocorra a efetuao do cadastro?
44
Mdulo 4
Note que:
Portanto, voc pode generalizar para dois eventos A e B quaisquer de um experimento aleatrio. Desta forma, podemos dizer que a
probabilidade condicional de A dado B (nota-se por P (A / B)) definida como:
45
P (A ) = P (A / ) . P (B)
Se dois eventos A e B so independentes, ento P{A / B} = P{A}
ou P{B / A} = P(B).
Deste modo, se A e B forem independentes, voc pode verificar que:
Veja esta outra situao, utilizando os conceitos de probabilidade condicionada e independncia de eventos. Considere a tabela a seguir, representativa da distribuio da renda anual de produtores rurais e duas cooperativas em uma determinada regio.
Cooperativas
Faixa de renda anual (em R$1.000)
Total
15 a 20 (R1)
70
40
110
20 a 25 (R2)
15
15
30
25 a 30 (R3)
10
20
30
30 a 35 (R4)
20
10
30
Total
115
85
200
46
Mdulo 4
47
Resultado
Cura total
24
16
Cura parcial
24
16
Morte
12
48
Mdulo 4
Variveis aleatrias
Voc pode definir uma varivel aleatria como sendo uma funo que associa valores reais aos eventos de um espao amostral, e
que pode ser discreta ou contnua.
Um exemplo de uma varivel aleatria discreta (v.a) consiste
em verificar o nmero de aes que tiveram queda em um determinado dia, em uma carteira composta por cinco aes diferentes. A funo ser dada por:
X= nmero de aes que tiveram queda em um determinado
dia. Define uma varivel aleatria discreta, que pode assumir os valores 0, 1, 2, 3, 4, 5.
49
Vamos considerar agora uma situao na qual se verificou o tempo gasto por um vendedor para convencer um cliente a adquirir um
determinado produto. A funo ser:
Y= tempo gasto por um vendedor para convencer um cliente a
adquirir um determinado produto. Define uma varivel aleatria contnua, que pode assumir infinitos valores.
Se uma varivel aleatria X pode assumir os valores x1, x2,..., xn
com probabilidades respectivamente iguais a p1, p2,..., pn, e
Se a varivel X em questo for discreta, sua distribuio caracterizada por uma funo de probabilidade (P(X=x)), que associa probabilidades no nulas aos possveis valores da varivel aleatria.
Para o exemplo do nmero aes da carteira, as probabilidades
obtidas so mostradas na funo de probabilidade que corresponde
tabela abaixo.
X
P(X=x)
1/10
1/10
2/10
3/10
4/10
5/10
=1,00
Se a varivel X for contnua, somente haver interesse na probabilidade de que a varivel assuma valores dentro de determinados intervalos, sendo sua distribuio de probabilidades caracterizada por
uma funo densidade de probabilidade (f.d.p.), f(x), a qual dever
possuir as seguintes propriedades:
f(x) 0;
50
Mdulo 4
51
graficamente, tem-se:
a) Obtenha o valor de k.
Como f(x) uma fdp:
b) calcular F(1).
F(1) = P(X 1) =
Para o estudo de variveis aleatrias, at este ponto, considerouse que o resultado do experimento em questo seria registrado como
um nico valor x. Todavia, existem casos em que h interesse por dois
resultados simultneos, como por exemplo, observar o peso e altura
52
Mdulo 4
de uma pessoa, o sexo e desempenho no trabalho, etc. Para tanto, fazse necessria a seguinte definio:
Veja a seguinte situao: uma pesquisa foi realizada para verificar a existncia de relao entre a utilizao de um produto (baixa,
mdia ou alta) e o grau de instruo das pessoas (Fundamental, Mdio
e Superior). Como os resultados associam duas variveis, ento temos
uma distribuio de probabilidade de variveis aleatrias
bidimensionais. No resultado encontrado (mostrado a seguir), temos
um quadro chamada de contingncia.
53
Instruo
Utilizao
Fundamental
Mdio
Superior
Total
Alta
100
120
65
285
Mdia
350
100
20
470
Baixa
150
80
15
245
Total
600
300
100
1000
Utilizao
Fundamental
Mdio
Superior
Total
Alta
0.100
0.120
0.065
0.285
Mdia
0.350
0.100
0.020
0.470
Baixa
0.150
0.080
0.015
0.245
Total
0.600
0.300
0.100
1.000
Distribuio
Marginal da
Utilizao.
Distribuio Marginal
do Grau de Instruo.
0,1
0,2
0,3
0,3
0,1
54
Mdulo 4
1/6
1/6
1/6
1/6
1/6
1/6
=1
ou P(X=x) = 1/6
Desta forma, voc pode verificar que esta varivel segue uma
distribuio uniforme discreta, pois a varivel discreta, e todos os possveis resultados da varivel aleatria tm a mesma probabilidade (1/6).
55
Distribuio de Bernoulli
Imagine uma situao na qual s podem ocorrer dois possveis
resultados, sucesso e fracasso. Veja alguns exemplos:
uma venda efetuada ou no em uma ligao de call center;
um cliente pode ser adimplente ou inadimplente;
uma pea produzida por uma cia. pode ser perfeita ou defeituosa; e
um consumidor que entra numa loja pode comprar ou no
comprar um produto.
Associando-se uma varivel aleatria X aos possveis resultados do experimento, de forma que:
X= 1 se o resultado for sucesso,
X= 0 se o resultado for fracasso.
Mdulo 4
Distribuio binomial
Para que uma situao possa se enquadrar em uma distribuio
binomial, deve atender s seguintes condies:
so realizadas n repeties (tentativas) independentes;
cada tentativa uma prova de Bernoulli (s podem ocorrer
dois possveis resultados); e
a probabilidade p de sucesso em cada prova constante.
Se uma situao atende a todas as condies acima, ento a varivel aleatria X = nmero de sucessos obtidos nas n tentativas ter
uma distribuio binomial, com n tentativas e p (probabilidade de sucesso).
Simbolicamente, temos: X ~ B(n,p) com a interpretao dada a
seguir:
A varivel aleatria x tem distribuio binomial com n ensaios e uma probabilidade p de sucesso. (em cada ensaio).
A funo de probabilidade utilizada para clculo de probabilidades, quando a situao se enquadra na distribuio binomial, ser
dada por meio da seguinte expresso:
57
Como na binomial so
n ensaios de Bernoulli
e a distribuio tem
mdia p, a mdia da
binomial ser np.
Raciocnio semelhante
feito para a
varincia.
58
Mdulo 4
produzidas so consideradas defeituosas. As peas so acondicionadas em caixas com cinco unidades cada uma. Considere que cada pea
tem a mesma probabilidade de ser defeituosa (como se houvesse repetio no experimento de retirar uma pea).
a) Qual a probabilidade de haver exatamente trs peas defeituosas numa caixa?
P = 0,1 n = 5
b) Qual a probabilidade de haver duas ou mais peas defeituosas em uma caixa?
c) Qual a probabilidade de uma caixa no apresentar nenhuma pea defeituosa?
d) Supondo que a empresa pague uma multa de R$ 10,00
por caixa que apresente peas defeituosas, qual o valor esperado desta multa em um lote de 1.000 caixas?
P(uma caixa ter pea defeituosa) = 1- P(X=0) = 0,4095
Temos, ento, uma nova varivel aleatria (nmero de caixas
com peas defeituosas), a qual chamaremos de Y em um lote de 1.000
caixas, que segue uma distribuio binomial com n=1.000 e p=0,4095.
E(Y) = np = 1000.0,4095 = 409,5 caixas.
Multa Esperada = 409,5 . R$ 10,00 = R$ 4.095,00
Distribuio de Poisson
Voc pode empregar a distribuio de Poisson em situaes nas
quais no est interessado no nmero de sucessos obtidos em n tentativas, como ocorre no caso da distribuio binomial, entretanto este
nmero de sucessos deve estar dentro de um intervalo contnuo, ou
seja, o nmero de sucessos ocorridos durante um intervalo contnuo, que pode ser um intervalo de tempo, espao, etc. Imagine que
voc queira estudar o nmero de suicdios ocorridos em uma cidade
durante um ano ou o nmero de acidentes automobilsticos ocorridos
numa rodovia em um ms, ou o nmero de defeitos encontrados em
59
60
X~P(3)
Mdulo 4
Uma caracterstica da distribuio de Poisson que as estatsticas da distribuio (mdia e varincia) apresentam o mesmo valor, ou
seja, so iguais a . Ento, teremos:
Mdia = Varincia =
Como o intervalo
desejado uma semana, ou seja, sete dias,
ento, em uma semana
a freqncia mdia de
chamadas ser de sete
dias vezes 3 chamadas/dia.
= 0,03192
61
Exerccio 9: a probabilidade de compra de um aparelho de celular igual a 30%. Observando oito compradores, qual a probabilidade
de quatro deles comprarem este aparelho?
R: P(X = 4) =
= 0,13614
R= 0,40817
b) = 2,8
R=0,76892
c) = 5,6
R=0,97559
62
Mdulo 4
onde e so a mdia e desvio-padro, respectivamente, da distribuio de probabilidade e corresponde a 3,1415 e exp a uma funo
exponencial.
O grfico da distribuio normal, utilizando a funo mostrada
anteriormente, e os conceitos vistos no mdulo de Matemtica, so
dados por:
63
X~N(,)
Como voc pode notar, o clculo de probabilidades via distribuio normal envolve a soluo de integrais que no so nada triviais. Em virtude da grande aplicao da distribuio normal, procurouse tabelar os valores de probabilidade, que seriam obtidos por meio da
64
Mdulo 4
65
Mdulo 4
67
68
Mdulo 4
Exerccio 12: o uso dirio de gua por pessoa em uma determinada cidade normalmente distribudo com mdia igual a 20 litros e
desvio-padro igual a 5 litros.
a) Que percentagem da populao usa entre 20 e 24 litros
por dia?
b) Que percentagem usa entre 16 e 20 litros?
c) Qual a probabilidade de que uma pessoa selecionada ao
acaso use mais do que 28 litros?
Exerccio 13: um consultor verificou que as mdias obtidas em
uma avaliao aps um treinamento tem distribuio normal com uma
mdia igual a 72 e desvio-padro 5. Ele decide atribuir conceitos para
o seu treinamento tal que os melhores 15 % recebem conceito A. Qual
a mdia mnima que o funcionrio submetido ao treinamento precisa
receber para obter um conceito A?
Saiba mais...
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm
69
UNIDADE
3
Amostragem
Amostragem
72
Mdulo 4
Amostragem
A amostragem (processo de retirada de amostras de uma populao) uma das etapas fundamentais na tomada de decises nos diversos nveis gerenciais, pois uma amostragem mal executada, com
certeza, resultar em estatsticas pouco confiveis e em uma tomada
de deciso possivelmente imprecisa.
Esta Unidade tem como objetivo apresentar a voc alguns conceitos e definies essenciais para conduzir convenientemente uma
operao de amostragem, visando principalmente coleta de dados
socioeconmicos.
No so contemplados todos os aspectos referentes da
amostragem, como por exemplo, o aspecto terico das vrias tcnicas
disponveis. Voc ver os aspectos mais importantes da amostragem e
de maior aplicabilidade dentro das vrias reas da Administrao.
Primeiramente, torna-se necessrio definirmos populao e amostra. Se considerarmos todos os atuais clientes de uma empresa da rea
de telefonia, podemos considerar estas pessoas como sendo a populao* que caracteriza os clientes da empresa de telefonia, pois a populao apresenta caractersticas em comum, sendo, neste caso, o fato de
utilizarem esta empresa de telefonia.
Se quisermos utilizar uma parte desta populao, que apresente
as mesmas caractersticas daquela teremos uma amostra, ou seja, uma
poro ou frao da populao que preserva todas as caractersticas
importantes dos elementos que a integram.
Se considerarmos esta populao de clientes, voc pode determinar o tempo mdio em que o cliente fica utilizando no dia o aparelho de telefone fixo (mdia populacional (), que corresponde geralmente a um valor desconhecido, chamado de parmetro*. Como voc
no vai medir toda a populao, podemos obter uma amostra que represente esta populao, e estudando a amostra, voc ter condies
de calcular a mdia amostral (x), que corresponde ao estimador*, e o
resultado obtido (valor numrico) corresponder estimativa.
GLOSSRIO
*Populao o
conjunto de elementos que apresentam
uma ou mais caractersticas em comum.
*Parmetro um
valor desconhecido
associado a uma caracterstica da populao.
*Estimador uma
funo (frmula)
que permite estimar
o valor de um
parmetro (estimativa), baseando-se
nas observaes de
uma amostra.
73
A amostragem o estudo das relaes existentes entre a amostra, a populao de onde ela foi extrada e a forma como ocorre esta
extrao. til na avaliao de grandezas desconhecidas da populao, freqentemente denominadas parmetros, com base no conhecimento de grandezas correspondentes das amostras, geralmente chamadas estimativas ou estatsticas (Teoria da Estimao). Tambm
auxilia na verificao de diferenas observadas entre duas ou mais
amostras (tratamentos), para voc saber se estas diferenas so devidas a uma variao casual ou se so verdadeiramente relacionadas aos
efeitos de tratamentos (Teoria da Deciso).
Portanto, a amostragem tem por objetivo principal determinar
meios e mtodos para estudar as populaes atravs de amostras. Observe que, quando obtemos informaes a partir das amostras e tentamos atingir as populaes, estamos realizando uma inferncia.
Em resumo, podemos dizer que amostra um subconjunto da
populao, necessariamente finito, pois todos os seus elementos sero
examinados para efeito da realizao do estudo estatstico desejado.
Se considerarmos, nesta populao de clientes, o tempo de utilizao
diria do telefone fixo, teremos uma varivel aleatria, cuja mdia
populacional corresponde ao parmetro mdia do tempo de utilizao diria do telefone fixo de todos os clientes atuais da empresa telefnica. Em geral, a populao muito grande, e a mdia populacional
estimada por meio de uma amostra retirada desta populao, pelo
clculo da mdia amostral x, que corresponde ao estimador, e o resultado obtido (valor numrico) corresponder estimativa. O problema
de estimao de parmetros um dos importantes tpicos da estatstica inferencial e ser estudado posteriormente.
A utilizao da amostragem ocorre, geralmente, quando queremos avaliar populaes muito grandes ou infinitas.
As principais vantagens da utilizao do estudo por amostras
representativas (aquelas que mantm as caractersticas da populao
de onde a amostra foi retirada) em relao ao censo (avaliao de
toda a populao) so:
74
Mdulo 4
GLOSSRIO
*Representatividade
corresponde
possibilidade de
manter as mesmas
caractersticas presentes na populao.
75
GLOSSRIO
*Unidades amostrais
correspondem s
unidades selecionadas
na amostragem para
calcular as estatsticas.
76
Mdulo 4
tra. Por exemplo, quando somos obrigados a colher a amostra na parte da populao a que temos acesso.
Voc pode notar que a utilizao de uma amostra probabilstica
melhor para garantir a representatividade da amostra, pois o acaso
ser o nico responsvel por eventuais discrepncias entre populao
e amostra. Estas discrepncias so levadas em considerao nas
inferncias estatsticas.
Os principais esquemas amostrais so apresentados a seguir.
77
Amostragem sistemtica
Em algumas situaes, conveniente retirar da populao os
elementos que vo compor a amostra de forma cclica (em perodos),
por exemplo, quando os elementos da populao se apresentam ordenados. Porm, de fundamental importncia que a varivel de interesse no apresente ciclos de variao coincidente com os ciclos de retirada, pois este fato tornar a amostragem no aleatria. Esta tcnica
de amostragem se chama amostragem sistemtica. Para podermos entender melhor, vamos imaginar que voc queira retirar uma amostra
de currculos apresentados para um processo seletivo, e a varivel de
interesse corresponde idade dos candidatos. Pode ocorrer que pessoas de uma determinada faixa etria deixem para entregar o currculo
no ltimo dia. Ento, se pegssemos os currculos de forma aleatria,
poderamos estar subestimando ou superestimando a idade mdia.
Nesta situao foram recebidos 500 currculos ordenados por ordem
alfabtica. Deseja-se amostrar 50 currculos para estimar a idade mdia dos candidatos. Ser utilizada a tcnica de amostragem sistemtica, supondo que as idades estejam aleatoriamente distribudas na populao, ou seja, sem qualquer ciclo de repetio.
Primeiramente, deve-se enumerar a populao de 1 a 500 e calcular uma constante (K) que servir como fator de ciclo para retirada dos
currculos amostrados. Ento, podemos dividir os 500 currculos pelo tamanho da amostra (50) que se deseja trabalhar. Teremos uma constante
igual a 10, e os elementos sero amostrados a cada dez elementos. Generalizando, ento, teremos que a constante (K) ser dado por K= N/n, onde
N o tamanho da populao, e n, o tamanho da amostra.
Aps a definio do valor de K, sorteia-se o ponto inicial da
amostragem, ou seja, um dos elementos do primeiro intervalo constitudo pelos elementos populacionais numerados de 1 at 10. Escolhese o seguinte, que ser o elemento de ordem (i + K); e assim por diante, sempre somando-se K ordem do elemento anterior, at completar
a escolha dos n elementos que vo compor a amostra. Um esquema
apresentado a seguir.
78
Mdulo 4
Para fixar os conceitos de amostragem sistemtica, faa um esquema de amostragem para saber a opinio dos usurios de um banco
em relao ao tempo de atendimento.
O banco possui uma listagem de 33.400 clientes em uma determinada cidade. A pesquisa ser feita por telefone, utilizando uma estrutura de call center. Deseja-se trabalhar com
uma amostra de 300 clientes. Como seria organizada a
amostragem sistemtica?
Amostragem Estratificada
Quando a varivel de interesse apresenta uma heterogeneidade
na populao e esta heterogeneidade permite a identificao de grupos homogneos, voc pode dividir a populao em grupos (estratos)
e fazer uma amostragem dentro de cada estrato, garantindo, assim, a
representatividade de cada estrato na amostra.
Podemos verificar que pesquisas eleitorais apresentam uma grande heterogeneidade em relao inteno de votos, quando consideramos, por exemplo, a faixa salarial ou o nvel de escolaridade. Ento,
se fizssemos uma amostragem aleatria simples, poderamos incluir
na amostra uma maior quantidade de elementos de um grupo, e, proporcionalmente, este grupo pequeno em relao populao. Desta
forma, no teramos uma amostra representativa da populao a ser
estudada. Ento, podemos dividir a populao em grupos (estratos)
que so homogneos para a caracterstica que estamos avaliando, ou
seja, neste caso, a inteno de votos.
79
80
Mdulo 4
Pases desenvolvidos
N1 = 700
Pases em desenvolvimento
N2 = 420
N3 = 270
Saiba mais...
Sobre a Pesquisa Nacional por Amostra de Domiclios
(PNAD), consulte o site www.ibge.com.br.
82
Mdulo 4
Amostragem No Probabilstica
Quando trabalhamos com a amostragem no probabilstica, no
conhecemos a priori a probabilidade que um elemento da populao
tem de pertencer amostra. Neste caso, no possvel calcular o erro
decorrente da generalizao dos resultados das anlises estatsticas da
amostra para a populao de onde a amostra foi retirada.
Utilizamos, geralmente, a amostragem no probabilstica por simplicidade ou por impossibilidade de se obter uma amostra probabilstica,
como seria desejvel.
Os principais tipos de amostragem no probabilstica que temos
so amostragem sem norma ou a esmo, intencional e por cotas.
Amostragem a esmo
Imagine uma caixa com 1.000 parafusos. A enumerao destes
parafusos ficaria muito difcil, e a amostragem aleatria simples se torna invivel. Ento, em situaes deste tipo, supondo que a populao
de parafusos seja homognea, escolhemos a esmo a quantidade relativa ao tamanho da amostra. Quanto mais homognea for a populao,
mais podemos supor a equivalncia com uma AAS.
Desta forma, os parafusos sero escolhidos para compor a amostra de um determinado tamanho sem nenhuma norma ou a esmo. Da
vem o nome deste tipo de amostragem.
Amostragem intencional
A amostragem intencional corresponde quela em que o
amostrador deliberadamente escolhe certos elementos para pertencer
amostra, por julgar tais elementos bem representativos da populao. Um exemplo deste tipo de amostragem corresponde situao
em que se deseja saber a aceitao em relao a uma nova marca de
whisky a ser inserida no mercado de uma cidade. Somente entraro
para compor a amostra pessoas que faam uso da bebida e que tenham
83
Distribuies amostrais
Com as distribuies amostrais, voc pode inferir propriedades
de um agregado maior (a populao) a partir de um conjunto menor (a
amostra), ou seja, inferir sobre parmetros populacionais, dispondo
apenas de estatsticas amostrais.
Portanto, torna-se necessrio um estudo detalhado das distribuies amostrais, que so base para intervalos de confiana e testes de
hipteses.
Portanto, para que voc tenha condies de fazer afirmaes sobre
um determinado parmetro populacional (ex: ), baseadas na estimativa x, obtido a partir dos dados amostrais, necessrio conhecer a relao existente entre x e , isto , o comportamento de x, quando se
extraem todas as amostras possveis da populao, ou seja, sua distribuio amostral.
Para obtermos a distribuio amostral de um estimador, necessrio conhecer o processo pelo qual as amostras foram retiradas, isto
, se amostras foram retiradas com reposio ou sem reposio.
84
Mdulo 4
Portanto, a partir do comportamento da estatstica amostral, podese aplicar um teorema muito conhecido na estatstica como Teorema
do Limite Central. Este teorema prope que, se retirarmos todas as
possveis amostras de tamanho n de uma populao independente de
sua distribuio, e verificarmos como as estatsticas amostrais obtidas
se distribuem, teremos uma distribuio aproximadamente normal, com
(mdia das mdias amostrais igual mdia populacional)
e varincia das mdias
igual varincia da populao dividida pelo tamanho da amostra), se a amostragem for realizada com reposio, ou
, se a amostragem for realizada sem reposio em
uma populao finita (
o da varivel em questo.
Portanto, considerando a distribuio
amostral de mdias, quando se conhece a
varincia ou a amostra grande (n > 30),
utilizamos a estatstica z da distribuio normal vista anteriormente, independente da distribuio da populao. Ento, por meio do
teorema do limite central, a estatstica ser
dada por:
). Compare com
(expresso semelhante a Z)
85
Corresponde ao
divisor do clculo da
varincia amostral, ou
seja, n - 1. Nmero de
variveis na amostra
que variam livremente,
na definio da Estatstica.
86
Mdulo 4
87
No esquema a seguir, temos como feita a utilizao da distribuio de qui-quadrado com g graus de liberdade.
Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt
88
Mdulo 4
Fonte: www.dpi.inpe.br/~camilo/estatistica/06estimao.ppt
Estimao
Um dos principais objetivos da estatstica inferencial consiste
em estimar os valores de parmetros populacionais desconhecidos (estimao de parmetros) utilizando dados amostrais. Ento, qualquer
caracterstica de uma populao pode ser estimada a partir de uma
amostra aleatria, desde que esta amostra represente bem a populao. Os parmetros populacionais mais comuns a serem estimados so
a mdia, o desvio-padro e a proporo. A estatstica inferencial apresenta uma relevncia alta, j que na maioria das decises que um gestor
ou pesquisador deve tomar, esto associadas utilizao de dados
amostrais. Consiste em tirar concluses de uma populao a partir de
amostra representativa dela, tendo uma grande importncia em muitas
reas do conhecimento.
90
Mdulo 4
A partir de uma amostra de 800 clientes (escolhidos aleatoriamente entre todos os clientes que abasteceram na primeira quinzena
de um determinado ms) de um posto de gasolina que possuem carros
populares, verificou-se que o consumo mdio de gasolina foi de R$
200,00 por quinzena.
Esta uma estimativa que chamamos de pontual, ou seja, inferimos sobre a populao, considerando apenas o valor da estimativa.
Essas estimativas por ponto no nos do uma idia sobre confiana e
as margens de erro que deveriam ser aplicadas ao resultado. Tudo que
ns sabemos, por exemplo, que o consumo mdio de gasolina foi
estimado como R$ 200,00 por quinzena, independente do tamanho da
amostra e da variabilidade inerente dos dados. Se fosse usado um tamanho grande de amostra e houvesse pouca variabilidade, teramos
grandes razes para acreditar no resultado. Mas no sabemos nada, se
tivermos apenas uma estimativa por ponto. No entanto, podemos estimar ou fazer inferncias sobre os valores da populao usando uma
segunda abordagem, chamada estimativas por intervalos ou intervalos de confiana, que do o intervalo dentro do qual se espera que
esteja o valor da populao, com uma dada probabilidade ou um nvel
de confiana. Neste caso, poderamos inferir, por exemplo, que o consumo de carros populares que abastecem no posto de gasolina est no
intervalo de R$ 180,00 a R$ 220,00, e ainda afirmamos isto com, por
exemplo, uma certeza de 95%.
91
92
Mdulo 4
Ento, a partir de informaes de amostras, devemos calcular os limites de um intervalo, valores crticos, que em
(1-)% dos casos inclua o valor do parmetro a estimar e
em % dos casos no inclua o valor do parmetro, como
pode ser visto na Figura.
93
Voc pode observar que a rea total sob a curva normal unitria. Se a rea central 1 -, o ponto -z representa o valor de Z, que
deixa sua esquerda a rea /2, e o ponto z representa o valor de Z,
que deixa sua direita a rea /2.
Vamos ento aprender como construir alguns intervalos de
confiana.
Vamos imaginar a seguinte situao: o Departamento de Recursos Humanos de uma grande empresa informa que o tempo de execuo de tarefas que envolvem participao manual varia de tarefa
para tarefa, mas que o desvio-padro permanece aproximadamente
constante, em 3 minutos. Uma nova tarefa est sendo implantada na
empresa. Uma amostra aleatria do tempo de execuo de 50 destas
novas tarefas forneceu o valor mdio de 15 minutos. Determine um
intervalo de confiana de 95% para o tempo mdio de execuo desta
nova tarefa.
Primeiramente, voc precisa identificar que o desvio-padro
populacional conhecido, e tambm a amostra considerada grande (n
> 30). Ento, a construo do intervalo de confiana ser feita utilizando a mdia amostral, que aproximadamente normal. Utilizaremos para
a obteno dos limites de confiana a curva normal padro Z.
Como os limites so dados por meio da estatstica calculada a
partir dos dados amostrais e da margem de erro (fornecida pela estatstica da distribuio multiplicada pelo desvio-padro da distribuio
amostral), teremos, nesta situao, os limites calculados por meio da
seguinte expresso:
94
Mdulo 4
Interpretao do resultado: em cada grupo de 100 amostras retiradas de 50 clientes, espera-se que em 95 delas a mdia
esteja dentro do intervalo de 14,168 a 15,831.
amostra.
95
Uma regra prtica para uso da correo dada por meio da relao entre o tamanho da amostra e o tamanho da populao. Ento,
se
Esta correo, quando necessria, deve ser utilizada para qualquer distribuio amostral.
Resolva agora o exerccio proposto a seguir.
Exerccio 5: considere, por exemplo, que as despesas mensais
com alimentao das 1.000 cabeas de gado de uma fazenda so normalmente distribudas com desvio-padro de US$ 3,00. Uma amostra
de cem bois revelou uma despesa mdia mensal de US$ 27,00. Determine o intervalo de confiana de 90% para a despesa mdia com alimentao dos bois desta fazenda.
Desenvolvendo a expresso do erro mostrada anteriormente, teremos o tamanho de amostra para estimao da mdia populacional,
quando o desvio-padro populacional conhecido, como mostrado
a seguir:
96
Mdulo 4
Todas as demais consideraes apresentadas anteriormente permanecem, bem como a interpretao do intervalo de confiana.
Considere que, para uma dada semana, foi tomada uma amostra
aleatria de 28 empregados horistas selecionados de um grande nmero de funcionrios de uma fbrica, a qual apresentou um salrio
mdio de R$ 180,00 com um desvio-padro de R$ 14,00. Estimar o
salrio mdio para todos os empregados horistas da fbrica, de tal
maneira que se tenha uma confiana de 95% de que o intervalo estimado inclua a mdia da populao.
Calculando na nossa situao, teremos:
1- = 0,95 = 0,05 /2 = 0,025
Olhando na tabela de t, voc encontrar t/2 = 2,052 ( com 27
graus de liberdade)
97
dia p e desvio-padro
na amostra e consideramos
;e
c) tamanho da amostra:
Mdulo 4
Saiba mais...
Mais exerccios referentes ao assunto esto no site: http://
www.famat.ufu.br/prof/marcelo/exercicios.htm
99
UNIDADE
4
Testes
Testes de
de Hipteses
Hipteses
102
Mdulo 4
Testes de Hipteses
Ento, voc pode definir as hipteses a serem testadas, retirar as amostras das populaes a serem estudadas, calcular
as estatsticas delas e, por fim, determinar o grau de aceitao de hipteses baseadas na teoria de deciso, ou seja, se
uma determinada hiptese ser validada ou no.
103
104
Mdulo 4
A hiptese alternativa
s pode ser maior,
pois o fornecedor
garante que no
haver mais de 6%.
105
106
Mdulo 4
107
Uma observao importante: quando trabalhamos com amostras grandes, ou seja, n > 30, a distribuio de Z e t de Student
apresentam comportamentos prximos e valores da estatstica prximos tambm.
108
Mdulo 4
Resposta no final do
livro.
109
Como estamos utilizando um teste unilateral direita (questes didticas), ento, no clculo da estatstica de F, teremos
a maior varincia dividida pela menor varincia.
A maior varincia amostral encontrada ser chamada de S12 (proveniente de uma amostra de tamanho n1), e a menor varincia amostral
ser chamada S22 (proveniente de amostra de tamanho n2).
Vamos supor que tivssemos duas amostras provenientes de duas
populaes. Desejamos saber se as varincias das populaes so estatisticamente iguais ou uma maior do que a outra. Considere uma
significncia de 2,5%. Os resultados amostrais so apresentados a seguir:
S12 = 0,5184 com n1 = 14
S22 = 0,2025 com n2 = 21
A estatstica ser dada por:
Ento, a varivel de teste do teste F ser:
110
Mdulo 4
H1
1 2 < d0
1 2 = d0
1 2 > d0
1 2 d0
112
Mdulo 4
OBS: se trabalharmos com amostras grandes poderemos substituir as varincias populacionais pelas
varincias amostrais.
1.160
1.140
Desvio-padro
90
80
tamanho amostra
100
100
Mdia
113
2 situao: amostras independentes e pequenas, mas que apresentam varincias populacionais estatisticamente iguais.
Como as amostras com que estamos trabalhando so pequenas,
e as varincias populacionais, desconhecidas, ento, voc deve trabalhar com a distribuio t de Student.
Aqui consideraremos que as varincias populacionais so estatisticamente iguais, pois esta situao influenciar nos clculos e, conseqentemente, no processo decisrio. Para saber se as varincias podem ser consideradas iguais, deve-se fazer um teste da razo de duas
varincias (teste F) mostrado anteriormente.
A estatstica do teste ser dada por:
Aqui aparece um termo novo (Sp). Ele corresponde ao desviopadro ponderado pelos graus de liberdade, ou seja, calculamos um
novo desvio-padro, no qual o fator de ponderao corresponde ao
grau de liberdade de cada amostra. Veja a seguir:
114
Mdulo 4
Mtodo
Convencional
Programado
Mdia
85
81
Desvio-padro
115
mos a estatstica do teste a partir da distribuio t de Student. A estatstica-teste ser dada por:
Outra diferena esta no clculo do nmero de graus de liberdade, pois nesta situao utilizaremos uma aproximao que dada pela
expresso a seguir:
Semcertificao ambiental
Mdia
24,0
13,3
Desvio-padro
1,7
2,7
21
116
Mdulo 4
e
Veja que estas frmulas so iguais s de clculo da mdia e desvio-padro apresentados na Unidade 1. Neste caso, no lugar da varivel x, so utilizados os valores de di (diferenas).
Com estes valores, a estatstica teste ser dada por:
117
Antes
6,6
6,5
9,0
10,3
11,3
8,1
6,3
11,6
Depois
6,8
2,4
7,4
8,5
8,1
6,1
3,4
2,0
118
Mdulo 4
119
Sexo
Funo
Ruim
Mdio
Bom
Total
Masculino
157
27
74
258
Feminino
206
10
216
Total
363
27
84
474
120
Mdulo 4
sejam independentes. Em funo desta definio, a freqncia esperada (fe) ser obtida por:
Presena de lcool
Ausncia de lcool
Tomaram
32
No tomaram
16
40
121
Teste Droga
56 . 24
= 14
96
Presena de lcool
Ausncia de lcool
Tomaram
8 (10)
32 (30)
40
No tomaram
16 (14)
40 (42)
56
24
72
96
v = (2-1) . (2-1) = 1 gl
= 0,05 Qui-quadrado tabelado = 3,8415
Como o valor calculado (0,914) foi menor do que o tabelado, ento o calculado caiu na regio de aceitao de Ho.
Portanto, no temos indcios para rejeitar a hiptese Ho, ou
seja, o uso da droga no levou a uma inibio da absoro
de lcool.
Anlise de varincia
A anlise de varincia um teste de hiptese utilizado para a
comparao de mais de duas populaes. Imagine que voc queira
comparar o grau de endividamento de empresas de trs setores (indstria, comrcio e prestao de servios). Para a comparao, necessrio que voc tenha repeties, pois elas que mediro a variao do
acaso. Ento, voc deve selecionar uma amostra de dez empresas de
cada setor (repeties).
Para realizar uma anlise de varincia, dividimos a variao total de um conjunto de tratamentos a serem comparados com as suas
122
Mdulo 4
123
124
Mdulo 4
G. L. (grau de liberdade)
Tratamento (Entre)
Resduo (Dentro)
Total
Ento, voc precisa testar se a varincia do fator (ENTRE) difere da varincia do acaso (DENTRO). A distribuio amostral que voc
estudou na Unidade 3, que compara duas varincias, a distribuio
F ou da razo de duas varincias.
Portanto, voc pode utilizar o teste de F para verificar a validade
da hiptese Ho descrita anteriormente. O teste apresentado a seguir:
125
graus de liberdade de tratamentos e de resduos. Se Fcalc > Ftab, temos que o experimento foi significativo, ou seja, indica que existe
uma probabilidade superior a 1 de que pelo menos um dos tratamentos difere dos demais.
O quadro da anlise de varincia pode ser resumido da seguinte
forma:
Fonte de Variao
G. L.
S. Q.
Q. M.
Fcalc
F (v1,v2)
t-1
SQTrat
QMTrat
F calculado
F tabela
Tratamento
Resduo
t(r-1)
Total
tr-1
SQResduo QMResduo
SQTotal
G. L. = graus de liberdade
Vamos, ento, fazer um exemplo para entender melhor esta anlise: com o objetivo de comparar um determinado ndice inflacionrio
em trs regies metropolitanas em um perodo de cinco meses, voc
obteve os resultados apresentados a seguir. Verifique, por meio de uma
anlise de varincia, se as mdias so estatisticamente iguais ou no.
Regies Metropolitanas
Meses
R1
R2
R3
1,60
1,20
2,00
2,00
1,10
1,80
2,20
1,20
1,40
1,70
1,30
1,60
1,80
1,00
1,90
Total
5,30
5,80
8,70
126
Mdulo 4
FV
GL
SQ
QM
Fcal
Significncia
Entre
1,401
0,701
1.,2943
0,0006
Dentro
12
0,516
0,043
Total
14
1,9173
127
Saiba mais...
Mais exerccios referentes ao assunto esto no site:
http://www.famat.ufu.br/prof/marcelo/exercicios.htm
Classes
38,5 | 43,5
43,5 | 48,5
48,5 | 53,5
53,5 | 58,5
58,5 | 63,5
Total
20
Classes
abaixo de 43,5
abaixo de 48,5
abaixo de 53,5
14
abaixo de 58,5
18
abaixo de 63,5
20
Classes
128
Freqncias absolutas
acima de 38,5
20
acima de 43,5
17
acima de 48,5
13
acima de 53,5
acima de 58,5
Mdulo 4
b)
variao de freqncias
5 ------------------------------------------------ 7
1,5 --------------------------------------------- x
Unidade 2
Exerccio 1:
R: 1 (1/3 * 1/5 * 3/10) = 0,98
Exerccio 2:
a) R: 0,125; b) R: 0,0694; c) R: 0,1388
129
Exerccio 3:
a1) R: 60/100; a2) R: 40/100; a3) R: 24/100; a4) R: 76/100
Exerccio 4:
R: 0,05/0,25 = 0,2
Exerccio 5:
a) R: 0,4; b) R:0,9; c) R:0,6;
d) R:
1
0
2
0,1
0,3
0,6
0,9
= 0,03192
Exerccio 8:
Distribuio binomial com n = 4 e p =
a) R: P(x=2) . 2.000 = 0,3750 . 2.000 = 750 famlias
b) R: [P(1) + P(2)] . 2.000 = (0,25 + 0,375) . 2.000 = 1.250 famlias
c) R: P(0) . 2.000 = 0,0625 . 2.000 = 125 famlias
Exerccio 9:
R: P(X = 4) =
= 0,13614
Exerccio 10:
R: 1 [P(0) + P(1)], onde a distribuio de probabilidade uma
Poisson com parmetro lambda.
a) = 1,4
R = 0,40817
b) = 2,8
R = 0,76892
c) = 5,6
R = 0,97559
130
Mdulo 4
Exerccio 11:
Para X = 2200
Para X = 1700
Exerccio 12:
a) X = 20 Z = 0
X = 24
P(20 < X < 24) = P(0 < Z < 0,8) = 0,2881 (28,81 %).
b) X = 16
X = 20 Z = 0
P(16 < X < 20) = P (-0,8 < Z < 0) = P(0 < Z < 0,8) = 0,2881 = 28,81
c) X = 28 Z = (28 - 20 )/ 5 = 1,6
P( X > 28) = P (Z > 1,6) = 0,5 0,4452 = 0,0548
Exerccio 13:
seja X a mnima mdia.
O Z correspondente 1,04 (aproximadamente)
Unidade 3
Exerccio 1:
n1 = 101; n2 = 60; n3 = 39
Exerccio 2:
a) a = 2,160; b) a = 1,708; c) a = 1,725
Exerccio 3:
a) a = 34,4789; b) a = 10,2829; c) a = 7,2609
Exerccio 4:
a) a = 2,092; b) a = 2,092; c) a = 2,075
131
Unidade 4
Exerccio 1:
(Sugesto: siga os passos para realizar um teste de hiptese.)
Como o valor calculado foi maior que o tabelado (1,64), ele caiu
na regio de rejeio de Ho.
Exerccio 2:
132
Mdulo 4
REFERNCIAS
ARANGO, H. G. Bioestatstica Terica e Computacional.
Rio de Janeiro: Guanabara Koogan, 2001
BARBETTA, P. A. Estatstica Aplicada s Cincias Sociais.
4 ed. Florianpolis: Ed. da UFSC, 2002.
BEIGUELMAN, B. Curso Prtico de Bioestatstica. Ribeiro Preto:
Revista Brasileira de Gentica, 1996.
BRAULE, Ricardo. Estatstica Aplicada com Excel: para cursos de
Administrao e Economia. Rio de Janeiro: Campus, 2001.
BUSSAB, W. O.; MORETTIN, P. Estatstica Bsica. So Paulo:
Atual, 2002.
COSTA NETO, P. L. de O. Estatstica. So Paulo: Edgard Blcher,
2002.
DOWNING, D.; CLARK, J. Estatstica Aplicada. So Paulo:
Saraiva, 2000.
FONSECA, Jairo Simon da; MARTINS, Gilberto de Andrade. Curso
de Estatstica. Rio de Janeiro: LTC, 1982.
FREUD, J. E.; SIMON, G. A. Estatstica aplicada. Bookman, 2000,
403 p.
LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. Estatstica:
teoria e aplicaes (usando o Microsoft Excel em portugus). LTC,
2000, 812 p.
MORETTIN, L. G. Estatstica Bsica: Probabilidade. V. 1. So
Paulo: Makron Books, 1999.
________. Estatstica Bsica: Inferncia. V. 2. So Paulo: Makron
Books, 1999.
SOARES, J. F.; FARIAS, A. A.; CESAR, C. C. Introduo
Estatstica. Rio de Janeiro: LTC, 1991.
SPIEGEL, M. Probabilidade e Estatstica. Mc Graw Hill. 1993.
133
134
Mdulo 4
Anexos
135
136
de probabilidade
Mdulo 4
137
138
Mdulo 4
139
140
Mdulo 4
141
142