Você está na página 1de 89

FORMAÇÃO GREEN BELT

Conteúdo Programático
1. Conceitos básicos de estatística:
 Amostragem;
 Estimação de parâmetros;
2. Estatística Descritiva (Distribuição de Freqüência)
 Análise de uma distribuição de freqüência;
 Histograma;
3. Medidas de tendência central e de dispersão:
 Média, Moda, Mediana;
 Desvio padrão. Variância e Coeficiente de Variação
4. Calculo de Probabilidade.
5. Distribuições probabilísticas
Binomial, Poisson e Normal
6. Estimativas intervalares.
7. Correlação e Regressão.
2
Referências

BIBLIOGRAFIA

STEVENSON, W.J.” Estatística Aplicada a Administração” , Ed, Harbra.


BUSSAB, W.O e MORETTIN, P.A “Estatística Básica”, Atual Editora.
TOLEDO, GERALDO LUCIANO. “Estatística Básica” Ed. Atlas.
SILVA, ERMES MEDEIROS. “Estatística para Administração” Ed. Atlas.
FREUND, JD e SIMON, G.A “Estatística aplicada”, Ed. Bookman.
CRESPO, ANTÔNIO ARNOT. “Estatística Fácil” Ed. Saraiva.

3
Introdução

Para alguns estudiosos a estatística é


uma arte; para outros, a estatística é
a simples aplicação do bom senso.

Em qualquer caso, a estatística ajuda


a tomar decisões com base em
informações populacionais.

4
Introdução
Nem sempre é possível compreender o significado
dos dados disponíveis por simples inspeção de seus
valores numéricos. Entretanto, o sucesso da decisão
dependerá da habilidade em compreender as
informações contidas nesses dados. Portanto,
necessitamos de métodos que permitem extrair dos
dados as informações necessárias para
compreender o que representam.

5
Conceito de Estatística
Parte da matemática em que se investigam:
 Os processos de obtenção, organização,
análise dos dados e divulgação sobre uma
população qualquer (Descritiva).
 Métodos de tirar conclusões ou predições
com base nesses dados (Indutiva).

6
Amostragem
É a escolha de alguns elementos de um conjunto maior
chamado população (uma técnica).
O elemento fundamental da estatística é a estimativa para
fazer previsões. Por exemplo:
 O candidato X deve ganhar a eleição com margem de 3% a 4%;
 De 1000 a 2000 peças sairão da fábrica fora da especificação;
 A inflação do mês que vem deve chegar a 0,9%.
A estimativa está associada a uma pesquisa ou a uma
verificação de características, realizada não sobre todos os
elementos da população, mas sobre uma parte dela, chamada
amostra.

7
O Processo de Estimação
 Escolhe-se a amostra
 Organiza-se uma característica que se quer
estudar (Ex.: altura de pessoas, os gastos com
medicamentos etc).
 A partir dos resultados obtidos na amostra, o
pesquisador pode estendê-los para toda a
população, estabelecendo margens de erro e
acerto para as previsões.

8
Tipos de Amostragem

Para que os resultados de uma amostra sejam


estendidos para toda a população, ela deve ser
representativa, isto é, todos os elementos da
população tiveram chances iguais de seleção.
Ou, a probabilidade de um determinado
elemento ser escolhido é a mesma para todos
os outros.
9
Tipos de Amostragem
Amostragem Casual ou Aleatória Simples
 Este tipo de amostragem é equivalente a um sorteio
lotérico.
 Na prática, a amostragem casual ou aleatória
simples pode ser realizada numerando-se a
população de 1 a n e sorteando-se, a seguir, por meio
de um dispositivo aleatório qualquer, k números
dessa seqüência, os quais corresponderão aos
elementos pertencentes à amostra.

10
Tipos de Amostragem
 Vamos obter uma amostra representativa para a
pesquisa da estatura de noventa funcionários de uma
empresa:
Numeramos os funcionários de 01 a 90
 Escreveremos os números, de 01 a 90, em pedaços
iguais de um mesmo papel, colocando-os dentro de uma
caixa.
 Agitamos a caixa para misturar bem os pedaços de
papel e retiramos, um a um, nove números que
formarão a amostra. Neste caso 10% da população.

11
Tipos de Amostragem
 Quando o número de elementos da amostra é grande, esse tipo de
sorteio torna-se muito trabalhoso.
 A fim de facilita-lo foi elaborado uma tabela de números aleatórios,
construída de modo que os dez algarismos (0 a 9) são distribuídos ao
acaso nas linhas e colunas (ver anexo).

 Assim, utilizando a 18ª linha retiramos os valores:


61 02 01 81 73 92 60 66 73 58 53 34
61 02 01 81 73 60 66 58 53 Amostra

Medindo as alturas dos funcionários correspondentes aos números


sorteados, obteremos uma amostra das estaturas dos noventa
funcionários.

12
Tipos de Amostragem
Amostragem por Conglomerados
 A população é dividida em diferentes conglomerados
(conjuntos, aglomerados).
 Extrai-se uma amostra apenas dos conglomerados
selecionados e não de toda a população. O ideal é que cada
conglomerado represente tanto quanto possível o total da
população. Seleção geográfica.
 São escolhidas aleatoriamente algumas regiões e em seguida
algumas sub-regiões e finalmente alguns lares por exemplo.
 Este processo assegura que as pessoas da amostra vivam em
conglomerados, possibilitando ao pesquisador entrevistar
apenas poucas pessoas.
13
Tipos de Amostragem
Amostragem Estratificada
 Se a população pode ser dividida em subgrupos que consistem
todos eles em indivíduos todos semelhantes entre si, pode-se
obter uma amostra representativa entrevistando-se uma
amostra aleatória de pessoas em cada grupo. Este processo
pode gerar amostras bastante precisas, mas só é viável
quando a população pode ser dividida em grupos homogêneos.

14
Tipos de Amostragem
Amostragem por Conveniência
 Não geram amostras puramente aleatórias, muitas vezes
aplica-se incorretamente a análise estatística a estas
amostras como se fossem amostras puramente aleatórias.

Exemplo:
Se colocarmos uma mesa na entrada de um shopping center e
pedirmos a cada passante que se detenha um momento e
preencha um formulário de pesquisa, é pouco provável que
consigamos uma amostra realmente aleatória da população, é
impossível fazer inferências estatísticas válidas sobre a
população como um todo, a partir das pesquisas.

15
Métodos de Amostragem
Validade: os métodos de amostragem só são válidos se a
amostra for puramente aleatória.
Exemplo:
1. Pesquisa eleitoral  amostragem: nomes em uma lista
telefônica  resultados errados pois só são pesquisados
eleitores que possuem linha telefônica.

Atenção
 Se a amostra não é extraída aleatoriamente não há maneira de se
prever o quanto se afastará da realidade.
 O melhor é utilizar uma amostra puramente aleatória.
 Há razões práticas que muitas vezes impossibilitam...
16
Exemplo
Considere uma pesquisa de opinião pública em
todo o país
 Não se pode selecionar amostras colocando o
nome de todas as pessoas do país em um saco e
sorteando.
1º Não existe tal lista de nomes.
2º Mesmo se houvesse seria dispendioso
entrevistar 3000 pessoas (p.ex.:) selecionadas
aleatoriamente e dispersas por todo o país.

17
Estrutura de Pesquisa
Estabelecido o critério de amostragem, o trabalho passa a ser
responder às seguintes perguntas:
 Quais são os dados importantes a serem levantados? (nome,
profissão, faixa etária, time de futebol, o que mais?)
 Como recolher os dados necessários? (pesquisa de campo, por
correspondência, por telefone)
 Onde registrar os dados obtidos? (em questionário, em fita)
 O que fazer com a tabulação obtida? (como analisar, com o que
comparar os resultados obtidos?)

Para tais perguntas é difícil distinguir a resposta certa da errada,


deve-se procurar a melhor maneira para que os resultados possam
ser apresentados com clareza facilitando análises posteriores.
18
Estimação de Parâmetros
Objetivo final de uma amostragem: fazer uma certa
estimativa sobre a população de onde a amostra foi
retirada

Por exemplo suponha que você está gerenciando uma


pizzaria e que tem o controle das vendas para diversos
tipos de pizza. Suponha que você observou os seguintes
valores de vendas diárias de pizzas do tipo calabresa
durante o período de 9 dias.

Vendas : 40, 56, 38, 38, 63, 59, 52, 49, 46.

19
Distribuição de Frequência
Suponhamos termos feitos uma coleta de dados relativos às
estaturas de quarenta funcionários da coelba, resultando a
seguinte tabela de dados de valores:

Estatura de 40 funcionários da Coelba


166 160 160 150 162 160 165 167 164 160
162 161 168 163 156 173 160 155 164 168
Tabela Primitiva
155 152 163 160 155 155 169 151 170 164
154 161 156 172 153 157 156 158 158 161

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
Rol
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

20
Distribuição de Frequência

Observe que apenas com o Rol podemos responder as perguntas:

a) A menor estatura é de 150 cm e a maior de 173 cm;


b) A amplitude de variação é de 23 cm (173-150);
c) Há uma concentração em torno dos valores 160 e 165 cm: e
d) Há poucos valores abaixo de 155 cm e acima de 170 cm.

São dados que podem ajudar na tomada de alguma decisão.

21
Distribuição de Freqüência
Construção da tabela de distribuição de Freqüência

Número de Classes (i) = 1 + 3,3 Log n = 6


Amplitude Amostral (AA)= 173 – 150 = 23
Intervalo de Classe (h) = AA / i = 4

Quando os dados estão organizados em uma distribuição de


freqüência, são denominados dados agrupados.

22
Distribuição de Frequência
Distribuição Completa

E
STATU
RAS
i f
i x
i f
ri F
i F
ri
(
cm)
1 1
50|154 4 1
52 0
,
100 4 0
,
100
2 1
54|158 9 1
56 0
,
225 1
3 0
,
325
3 1
58|162 1
1 1
60 0
,
275 2
4 0
,
600
4 1
62|166 8 1
64 0
,
200 3
2 0
,
800
5 1
66|170 5 1
68 0
,
125 3
7 0
,
925
6 1
70|174 3 1
72 0
,
075 4
0 1
,
000


=40 
=1,
000

f = Freqüência relativa simples


X = Ponto média da classe
fr = freqüência relativa simples
F = freqüência acumulada
Fr = Freqüência acumulada relativa
23
Distribuição de Frequência

Responda as questões:

1. Quantos funcionários têm estatura entre 154cm,


inclusive, e 158cm?
2. Qual a porcentagem de funcionários cujas
estaturas são inferiores a 162cm?
3. Quantos alunos têm estatura abaixo de 170?

24
Medidas de Tendência Central
Média aritmética
Dados brutos : 40, 56, 38, 38, 63, 59, 52, 49, 46.
A média de todos esses elementos é calculada somando
todos os números e dividindo pela quantidade de números.
números

40  56  38  38  63  59  52  49  46 441
  49
9 9
Portanto em média foram vendidas 49 pizzas de calabresa
por dia.
Generalizando a média pode ser calculada por: xi
x
n
25
Medidas de Tendência Central
Mediana
A mediana é o ponto ou elemento ao meio do caminho
dos dados,
dados isto é, metade dos números está acima dela e
metade está abaixo. A lista de números deve estar ordenada.
Lista de valores de venda de pizzas de calabresa em
ordem crescente: 38, 38, 40, 46, 49, 52, 56, 59, 63.
A mediana é 49, quatro valores são maiores que 49 e
quatro são menores.
Para um número ímpar procura-se o valor entre os dois do centro.

26
Medidas de Tendência Central
Mediana (cont.)
Suponha que a lista abaixo representa a venda
diária de pizzas de cogumelo:
41, 41, 46, 47, 48, 49, 52, 53.
A mediana é o valor que está exatamente entre
os dois números mais próximos do meio.
A média e a mediana são chamadas medidas de
tendência central da distribuição.
27
Medidas de Tendência Central
Média x Mediana
Suponha que os valores abaixo representem vendas de pizzas tipo
bacon/abacaxi por um período de 9 dias:
36, 35, 37, 29, 39, 36, 340, 35, 36.
Observe que, um certo dia, uma caravana de pessoas amantes de pizza
bacon/abacaxi chegou ao estabelecimento e as vendas foram muito maiores.
Calculando a média tem-se: 623/9 = 69,22 pizzas.
Mas nenhum dos valores está próximo de 69,22.
A lista ordenada (rol) fica: 29, 35, 35, 36, 36, 36, 37, 39, 340
Verificamos que a mediana é 36. O valor da mediana representa
muito melhor o provável número de vendas em determinado dia.
Se existem valores extremos a mediana é mais representativa
28
Medidas de Tendência Central

Quando uma distribuição de números NÃO tem valores


extremamente altos ou baixos, ela é razoavelmente
simétrica  os valores da média e da mediana são
muito próximos.

Vamos pensar um pouco.

Como você procederia ao calcular o salário médio da em


presa? Usaria média ou mediana? Por quê?

29
Medidas de Tendência Central
Moda
A moda é o valor que ocorre com maior frequência.
frequência Se há mais de um valor nessas condições,
todos eles são chamados modas.
 Vendas de pizzas de calabresa:
63, 59, 56, 52, 49, 46, 40, 38, 38.
O valor da moda é 38, por que o número 38 ocorre duas vezes.
 Vendas de pizza tipo bacon/abacaxi:
29, 35, 35, 36, 36, 36, 37, 39, 340
A moda é 36, que ocorre três vezes.
 Vendas de pizzas de cogumelo:
53, 52, 49, 48, 47, 46, 44, 41.
Não há moda. amodal

30
Média - Mediana - Moda

CURVAS

31
Média μx
É o centro de gravidade da distribuição,
distribuição é um
parâmetro de localização.

fdp(x)

μ1 μ2 μ3 μ4 X

32
Resumo

Em muitos casos práticos as distribuições são


razoavelmente simétricas com maioria dos valores
concentrada próximo do meio, assim sendo, média,
moda e mediana estão todas muito próximas umas
das outras.

Uma distribuição pode ter mais de uma moda nesse


caso dela é chamada bimodal ou plurimodal.

33
Medidas de Tendência Central
 Como calcular as medidas de tendência central média,
mediana e moda, considerando uma distribuição por
classe de valores?
D1
Mo  lmo  xh
 xi . f i D1  D2
x 
 fi Mo 
lL
(da classe de maior frequencia)
2
 fi D ff
 Fant 1 ant
Md  lmd  2 xh D ff
f md 2 post

Faça isso com as estaturas dos funcionários da Coelba.

34
Medidas de Dispersão
O termo dispersão indica o grau de afastamento de
um conjunto de números em relação à sua média.
média

Situação 1: são vendidas 200 pizzas todos os dias.


Situação 2: são vendidas 400 pizzas na metade dos dias e
nenhuma pizza na outra metade.

Média 1 = 200 pizzas


Média 2 = 200 pizzas

Na situação 2 a dispersão é muito maior.

35
Medidas de Dispersão
Amplitude
É a forma mais simples de se medir a dispersão, é a diferença
entre o maior e o menor valor.
valor
Vendas de pizzas de calabresa:
63, 59, 56, 52, 49, 46, 40, 38, 38.
Amplitude = 63-38 = 25.
A amplitude nem sempre é uma boa medida para a dispersão de
toda a distribuição.
 Lista a: 500 250 250 250 250 0
 Lista b: 500 490 480 20 10 0
As amplitudes são 500, mas a dispersão geral em relação à lista b
é muito maior que a dispersão geral em relação à lista a.
36
Medidas de Dispersão
Desvio médio absoluto (Dm)
O desvio médio absoluto leva em conta todos os números da
relação, observando a distância de cada número à média
aritmética do conjunto.
conjunto
Vendas de pizzas tipo calabresa Distância da média
40 | 40 - 49 | = 9
56 | 56 - 49 | = 7
 xi  x
38
38
| 38 - 49 | = 11
| 38 - 49 | = 11
Dm 
63 | 63 - 49 | = 14 n
59 | 59 - 49 | = 10
52 | 52 - 49 | = 3
49 | 49 - 49 | = 0
46 | 46 - 49 | = 3

9  7  11  11  14  10  3  0  3 68
Dm    7,556
9 9
37
Medidas de Dispersão
Variância (Var = S² = σ²)
A função módulo usada no desvio médio absoluto em certos casos é
inconveniente.
Para muitos propósitos, é interessante elevar ao quadrado cada
desvio e tomar a média de todos esses quadrados, essa grandeza
é chamada variância. Acompanhe a tabela abaixo.
Vendas de pizzas tipo calabresa Distância da média 2
40 ( 40 - 49 ) ² = 81 n 2
56
38
( 56 - 49 ) ² = 49
( 38 - 49 ) ² = 121
 x  x 
i

38 ( 38 - 49 ) ² = 121 Var ( x)   2  i 1

63 ( 63 - 49 ) ² = 196 n
59 ( 59 - 49 ) ² = 100
52 ( 52 - 49 ) ² = 9
686
49 ( 49 - 49 ) ² = 0 Var ( x)   76,222
46 ( 46 - 49 ) ² = 9 9
TOTAL 686
38
Medidas de Dispersão
Desvio Padrão (S = σ)
O desvio padrão é a raiz quadrada da variância.
variância
Desvantagem da variância: o seu valor numérico é difícil de
interpretar, a variância tem como unidade o quadrado da
unidade de medida de x, no caso 76,222 pizzas².

n 2

 x  x 
i
S   i 1
n

S    76,222  8,731 pizzas

39
Teorema de Tchebichev
Considere a lista de vendas de pizza

38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63
38

k  17,4 x  49 k  17,4
k 2 k 2

Em uma lista qualquer de números, ao menos 75% dos seus


elementos estarão a dois desvios padrão da média. No exemplo
tem-se 100% das vendas neste intervalo.
1
Proporção dentro do intervalo k  1  2  0,75
k
40
Medidas de Dispersão
Coeficiente de variação (CV)
O coeficiente de variação mede o quanto o desvio padrão é
maior que a média.
É uma medida adimensional o que facilita comparações
independendo das dimensões envolvidas.

(desvio padrão) 
CV   Medida de Dispersão Relativa
(média ) x
CV baixo <15%
CV Médio entre 15 e 30%

8,731
CV    0,178  17,8% CV alto > 30%
x 49

41
Variância σx2 e Desvio padrão σx

Mostram o quanto a distribuição está dispersa em


torno da média.
média Quanto maior a variância ou o desvio
padrão, mais alongado é o formato da curva.

fdp(x)

σ1 σ2 σ3 σ4 X

42
Resumo
Medidas de dispersão populacionais e amostrais.
n 2

2
 x  x 
i
n 2
Variância populacional  σ  i 1

n  x  x 
i
Variância amostral  S2  i 1

n 1
n 2

 x  x  i
Desvio padrão populacional  σ i 1

n n 2

 x  x 
i
Desvio padrão amostral  S i 1

n 1
43
Resumo

 Como calcular o desvio padrão considerando uma


distribuição de classe de valores?

2 2
 f i .xi   f i .xi 
s  
n  n 

Faça isso com as estaturas dos funcionários da Coelba

44
H iHistograma
s to g ra m a
U m h is t o g r a m a é u m g r á f ic o d e c o lu n a s j u s t a p o s t a s , c u j a s b a s e s
s e lo c a liz a m s o b r e o e ix o h o r iz o n t a l d e m o d o q u e o s p o n t o s m é d io
c o in c id a m c o m o s p o n t o s m é d io s d o s in t e r v a lo s d e c la s s e .
f
12

0
150 158 166 174 C la s s e s

E staturas
45
Experimento e Espaço Amostral

Experimento - procedimento claramente definido que


conduz a um resultado. A realização de um experimento
é chamada tentativa,
tentativa e cada tentativa tem o seu
resultado.
Experimentos aleatórios - experimentos onde não é
possível prever o resultado, embora sejam conhecidos
todos os resultados possíveis.
Espaço amostral “S” - conjunto de todos os
resultados possíveis de um experimento aleatório.

46
População - Amostra - Evento
População - todo o conjunto de seres em estudo.
Amostra - parte da população a ser analisada.
Evento - subconjunto do espaço amostral tal que todos
os elementos a este pertencente satisfaçam a uma
regra comum.
Especificação de um evento - pela regra que os
elementos satisfazem ou pela enumeração de todos os
seus elementos.
Exemplo (com base no dado)
Espaço amostral: S={1, 2, 3, 4, 5, 6}
Evento: A={Número mostrado menor que quatro} ou A={1, 2, 3}
47
Exemplos
Experimento - Espaço Amostral - Eventos
Lançar um dado e ver o número mostrado
S={1,2,3,4,5,6}
A={nº menor que 4}=
4}={1,2,3}
Lançar duas moedas e observar as faces
S={CaCa,CaCo,CoCa,CoCo}
B={no
B={n o
mínimo
mínimo uma
uma cara}=
cara}={CaCa,CaCo,CoCa}
Lançar duas moedas e contar o número de caras
S={0, 1, 2}
C={nenhuma}={0}
C={nenhuma}=
48
Tipos de Eventos

Eventos independentes - a ocorrência de um evento


não afeta a chance de ocorrência de outro.
Ex.: Lançamentos de dados ou moedas honestos
(quaisquer que tenham sido os resultados anteriores,
estes não afetarão o próximo).
Eventos dependentes - a ocorrência de um evento
afeta a do outro. Ex.: Retirada (sem reposição) de uma
carta de ouros de um baralho.

49
Probabilidade
Probabilidade de um evento P(A) – número entre 0
e 1 que indica a chance de ocorrência de um evento
quando o experimento a este associado é executado.
P(A) = 0 → Evento que não pode ocorrer.
P(A) = 1 → Evento certo de ocorrer
P({moeda mostra cara})=0,5
P({dado mostra “5”})= 1/6

Note que: 0≤P(Evento qualquer)≤1, P(S)=1 e P(∅)=0

50
Definições de Probabilidade
1 - Se um experimento pode ocorrer de N maneiras e se
o evento “A” pode ocorrer em “n” destes testes
então a probabilidade de “A” ocorrer é: P(A) = n / N.
Probabilidade calculada pelo método de análise de
experimento (dado, moeda...).
2 - Se um evento com atributo “A” ocorre n vezes em N
experimentos, então para valores grandes de N, P(A) se
aproxima de n / N. Probabilidade calculada pelo método
de frequência relativa (confiabilidade e CQ)
P(A)= lim N → ∞ (n / N)
51
Variáveis Aleatórias
Variável aleatória - É uma variável que assume um
valor aleatório. O próximo valor não pode ser previsível
com certeza.
Exemplos:
a) Núm. mostrado por um dado arremessado.
b) Núm. de coroas (H) quando uma moeda é arremessada 3 vezes.
c) O peso de um recém nascido num hospital.
d) A altura de um adulto.
e) Núm de arremessos necessários para uma moeda dar 3 caras
(T) consecutivas.
52
Tipos de Variáveis Aleatórias

Discreta - É uma variável que assume um número


contável de valores. Exemplos a); b); e)
Muitas vezes associadas a valores inteiros

Contínua - É uma variável que pode assumir um número


infinito de valores. Exemplos c); d)
A quantidade de valores é incontável; está associada
muitas vezes a valores reais

53
Distribuições de Probabilidade
Distribuições são modelos matemáticos para
descrever o comportamento de variáveis aleatórias.
Tais modelos são usados em controle de qualidade e
confiabilidade. Serão vistas as seguintes
distribuições:
1 - Binomial (discreta)
2 - Poisson (discreta)
3 - Normal (contínua)

54
Distribuições Binomial
Diz-se que a variável X tem distribuição binomial com
parâmetros n e p se a função massa de probabilidade é :

 n x
px    . p 1  p  , x  0,1,..., n
n x

 x
Parâmetros
 n n! “n” e “p”
Onde :   
 x  x!n  x !
X ~ B(n,p)

55
Medidas Características
Para a variável aleatória X ~ B( n , p) tem-se:

Média μx = n.p
(número de tentativas x probabilidade de sucesso)

Variância σx2 = n.p.(1-p)

Desvio Padrão σx = ( n.p.(1-p) )1/2

56
Exemplos de Variáveis Aleatórias Binomiais

1. X: Número de caras quando uma moeda honesta é lançada 10


vezes:
X ~ B(10 , 1/2)
2. Y: Número de cestas feitas por um jogador de basquete em 12
arremessos se sua média é 0.4 (cestas/arremesso):
Y ~ B(12, 0.4)
3. W: Número de produtos defeituosos em uma amostra de 20
unidades retirada de um grande lote que contém 2% de
defeituosos:
W ~ B(20, 0.02)

57
Exercícios

1. Uma amostra de 12 parafusos é retirada de uma


linha de produção e inspecionada. Sabe-se se que o
processo produz 2% de defeituosos. Qual a
probabilidade da amostra ter exatamente um
defeituoso? Qual a probabilidade de não existir
mais de um defeituoso?
2. Com base no exercício acima, qual a média,
variância e o desvio padrão do número de
defeituosos?

58
Distribuição de Poisson
Diz-se que a variável aleatória X segue a
distribuição de Poisson se a sua fmp é :

e   x Parâmetro :
p( x)  , x  0,1,2...
x! " "
x! x.( x  1)( x  2)..1 X ~ Po( )

Média : Variância : Desvio Padrão :


x   x 2
x 
1
2

59
Distribuição de Poisson
Aplicações
Esta distribuição é um bom modelo para descrever o
comportamento das variáveis aleatórias nos seguintes exemplos:

1. Número de nós por folha de madeira tratada;


2. Número de imperfeições por peça de tecido;
3. Número de acidentes por mês numa fábrica;
4. Número de chamadas que chegam a uma central telefônica em
um intervalo de tempo “t”;
5. Número de glóbulos sangüíneos visíveis ao microscópio num
campo visível de área “A”.

60
Requisitos de um Processo Poisson
1. Os números de eventos durante intervalos são sobre
postos de tempo ou área (ou outra grandeza) constituem
variáveis aleatórias independentes;
2. A distribuição do número de eventos durante um intervalo
(tempo ou espaço) depende apenas do comprimento do
intervalo e não de seus pontos extremos;
3. Para pequenos intervalos, a probabilidade de ocorrência de
um evento é diretamente proporcional ao comprimento do
intervalo;
4. A probabilidade de ocorrência de dois ou mais eventos
para intervalos infinitesimais é desprezível;
5. A condição inicial do processo é que o evento não ocorreu.
No instante zero de tempo o evento ainda não ocorreu.
61
Exercício

1. Um digitador faz uma média de 3 erros


por página. Qual a probabilidade de que
ele digite uma página com menos de 2
erros?
2. Qual a média, variância e desvio padrão
desta variável de Poisson?

62
Distribuição Normal
Das distribuições de variável aleatória
contínua, uma das mais empregadas é a
distribuição normal.

Propriedades:
x
1ª) A variável aleatória pode assumir todo e qualquer valor real.
2ª) O gráfico é uma curva em forma de sino, simétrica em torno da média (curva de Gauss).
3ª) A área total limitada pela curva é igual a 1.
4ª) A curva é assintótica em relação ao eixo das abscissas.
5ª) Como a curva é simétrica em torno da média: p ( X  x )  P ( X  x )  0,5

63
Distribuição Normal
OBS: Quando temos em mãos uma variável aleatória com
distribuição normal, nosso principal interesse é obter a
probabilidade de essa variável aleatória assumir um valor em
um determinado intervalo.
Ex.: Seja X a variável aleatória que representa os diâmetros
dos parafusos produzidos por uma certa máquina. Vamos
supor que essa variável tenha distribuição normal com média
2cm e desvio padrão de 0,04cm.
Qual a probabilidade de um parafuso ter diâmetro entre 2 e
2,05cm?
Ou p (2  X  2,05)

64
Distribuição Normal
Para se trabalhar com a distribuição normal,
podemos facilitar os cálculos transformando os
valores reais em valores reduzidos.
xx
z
s
Obs.: As tabelas para uso da distribuição normal reduzida são construídas
considerando a média igual a zero e o desvio padrão igual a 1

Logo, no nosso exemplo temos:


p (2  X  2,05)  p (0  Z  1,25)  0,3944
39,44%
Que é a probabilidade de encontrarmos um parafuso com diâmetro
entre 2 e 2,05.
65
Distribuição Normal
Exercício:
A duração de um certo componente eletrônico tem
média de 850 dias e desvio padrão de 40 dias. Sabendo
que a duração é normalmente distribuída, calcule a
probabilidade desses componentes durar:

a) Entre 700 e 1000 dias;


b) Mais de 800 dias;
c) Menos de 750 dias.

66
Estimativa Intervalar
Estimação consiste na utilização de informações
amostrais para estimar parâmetros populacionais.

Podemos fazer estimativas utilizando apenas um número:


Estimativa Pontual
Podemos fazer estimativas utilizando um intervalo de números:
Estimativa Intervalar

Estimadore s Parâmetros
x , s 2 , s, p̂ ,  2 ,  , p

67
Estimativa Intervalar
Intervalo de Confiança
É o intervalo centrado numa estimativa pontual que
deverá conter o valor do parâmetro com determinada
probabilidade.

Estimativa para Média Estimativa para Proporção


 pˆ qˆ
x  z / 2 pˆ  Z / 2
n n
n
fator de correção se  5%
N
N n
N 1
68
Estimativa Intervalar
Exemplo:
Sabe-se que as despesas mensais com alimentação dos 1000
funcionários de uma empresa são normalmente distribuídas com
desvio padrão de R$ 3,00.
Uma amostra de 100 funcionários revelou uma despesa média
mensal de R$ 50,00.
Determine um intervalo de confiança de 90% para a despesa média
com alimentação desta empresa.
 n
x  z / 2 fator de correção se  5%
N
n
N n
N 1

69
Estimativa Intervalar
Solução:

N  1000
 3
n  100  
90%
x  50 2 2
1    90% - Z Z
z / 2  1,64 (tabelado)
Utilizando a fórmula e o fator de correção,
Observar que foi utilizada a podemos ter 90% de confiança que o consumo
distribuição normal por temos o valor médio está entre R$ 49,53 e R$ 50,47 com
do desvio populacional e o tamanho da
amostra ser acima de 30. um erro máximo de R$ 0,47
Caso contrário deveríamos utilizar a
distribuição de Student. p (49,53    50,47)  0,90

70
Estimativa Intervalar
Uma pesquisa efetuada com 300 habitantes de uma cidade
revelou que 128 consideravam a energia elétrica o principal
problema da cidade.
Determine um intervalo de confiança de 95% para a proporção
dos habitantes que consideram a energia elétrica o principal
problema.

n  300 pˆ qˆ
pˆ  Z / 2
n
128
pˆ   0,4267 Podemos ter 95% de confiança que a
300 proporção de habitantes que considera
a energia elétrica o principal problema
1    0,95 está entre 37,07% e 48,27%

Z / 2  1,96 (tabelado) P(0,3707 < p < 0,4827)=0,95

71
Correlação
Freqüentemente procura-se verificar a relação entre duas
ou mais variáveis aleatórias. Ex.: relação entre vendas de
empresas e gastos promocionais, relação entre a demanda
de determinado produto e o seu preço ou mesmo relação
entre tempo de uso de um pneu e sua propensão em falhar.
A correlação pode ser forte, fraca ou nula. Os limites
destas faixas não são claramente definidos e podem variar
dependendo do fenômeno estudado.
Correlação linear simples - mede a relação entre as
variáveis X e Y por meio da disposição de pontos (X,Y) em
torno de uma reta.

72
Correlação

Correlação linear simples - mede a relação entre as


variáveis X e Y por meio da disposição de pontos (X,Y) em
torno de uma reta.

 X  Y 
 X .Y  n
rXY 
 1  rXY  1

 X 
2
 X 2
 
. Y 
2
 Y 2


 n   n 

73
Correlação
Y 0  rXY  1 Y rXY  1

X X Y rXY  0
Correlação linear Correlação linear
positiva perfeita positiva

Y  1  rXY  0 Y rXY  1
X
Correlação linear
positiva

X X
Correlação linear Correlação linear
negativa perfeita negativa

74
Exercício
Calcule o coeficiente de correlação linear entre as variáveis X e Y.

i X Y
1 2 10
2 4 8
3 6 6
 X  Y 
4 8 10  X .Y  n
5 10 12 rXY 

 X 
2
 X 2
 
. Y 
2
 Y 2


 n  n 
 

75
Resposta
Cálculo do coeficiente de correlação linear entre as variáveis X e Y.
i X Y X.Y X2 Y2
1 2 10 20 4 100
2 4 8 32 16 64
3 6 6 36 36 36
4 8 10 80 64 100
5 10 12 120 100 144

Σ 30 46 288 220 444

 X  Y  30  46
 X .Y  n
288 
5
rXY    0,048
  X
 X 2  
2
  Y
. Y 2  
2



 220 
220  
. 444 
444 
n n 5   5 
   
76
No Excel
Calcule o coeficiente de correlação linear entre as variáveis X e Y.

i X Y
1 2 10
2 4 8
3 6 6
 X  Y 
4 8 10  X .Y  n
5 10 12 rXY 

 X 
2
 X 2
 
. Y 
2
 Y 2


 n  n 
 

77
Análise de Regressão Linear Simples

Um problema freqüente em estatística consiste investigar


questões como estas:
a) Há alguma relação entre duas grandezas?

b) As variações em uma das grandezas acarretam variações da outra?

c) É possível usar uma das variáveis para predizer o valor da outra?

O objetivo da análise de regressão simples é aproximar por uma


linha reta um determinado conjunto de pontos.
pontos Em muitos casos,
não é possível traçar uma reta que passe por todos os pontos mas
pode-se traçar uma reta que passe perto da maioria deles (reta
ajustada). Esta reta é chamada de reta de regressão linear.
78
Análise de Regressão Linear Simples
 A análise de regressão tem o objetivo de descrever por meio
de um modelo matemático, a relação entre duas variáveis a
partir de n observações Y=f(X).
 Na realidade esta relação não ocorre sempre, ocorrendo:
“Y=f(X)+e” onde “e” significa todas as influências sobre Y não
devidas a X.
 O processo de ajustamento determina os parâmetros da
equação de uma reta que melhor se ajusta aos pares de
valores XY.
Y

Yˆ  a  bX

X 79
Método dos Mínimos Quadrados
Y

Yˆ  a  bX
X

A reta ajustada é representada pela função acima. Os


valores “a” e “b” são determinados de tal forma que é
mínima a soma dos quadrados das diferenças entre os
valores observados de Y e os obtidos a partir da reta
ajustada, para os mesmos valores de X. A reta também é
chamada de reta de mínimos quadrados.
quadrados
80
Método dos Mínimos Quadrados
Y

a
n.  xy   x.  y
b
Y  b  X
n.  x 2  ( x) 2 n n

Yˆ  aX  b
81
Coeficiente de Determinação R²
R2 - indica a qualidade
  X .Y  
  X  Y  2
do ajustamento. Quanto
 n  mais próximo de 1,
R 2  rXY
2
  

 X 
2
 X 2
 
. Y 
2
 Y 2


melhor a qualidade.

 n 

n 
 0  R 2
1 
R2  1

R2  1
Ajustamento linear perfeito

Um CD de 0,98 (98%) significa que 98% das variações


de Y são explicadas por X através da função ajustada e
2% são atribuídas a causas aleatórias

82
Exemplos de R²
R 2  0,99 R 2  0,90 R 2  0,75

R 2  0,50 R 2  0,25 R2  0

83
Exemplo de Regressão Linear
Ajuste a função aos pares XY e calcule R².

i X Y
Yˆ  a  bX 1 1 4
X 2 2 6
3 7 12
4 8 15

84
Exemplo de Regressão Linear
Solução:
i X Y X.Y X2 Y2
1 1 4 4 1 16
2 2 6 12 4 36
3 7 12 84 49 144
4 8 15 120 64 225

Y
Σ 220 118 421

a 0,982325
b 1,445946
Yˆ  a  bX
R2 0,982325
X

85
Cuidados Sobre Predição de Valores de Y

As equações de regressão são estimadas com base


utilizando-se dados passados (fruto de observações).
Elas não poderão predizer dados futuros se as
relações entre x e y se modificarem.

86
Cuidados Sobre Predição de Valores de Y

Algumas vezes procuram-se predições de valores y


para valores de x fora do intervalo de valores de x
observados anteriormente. Estas predições,
também conhecidas como extrapolações são muito
menos confiáveis que predições baseadas em
valores de variável independente contidos no
intervalo de valores previamente observados.

87
Cuidados Sobre Predição de Valores de Y

O simples fato de existir uma forte associação


entre duas variáveis não significa que haja entre
elas uma relação de causa e efeito. A relação pode
ser casual ou pode haver uma terceira variável
afetando a(s) variável(is) independente(s) e a
variável dependente simultaneamente.

88
SENAI DENDEZEIROS

Você também pode gostar