Você está na página 1de 5

ESTATÍSTICA II

(UNISUL - CE - Prof. Gabriel Oscar Cremona Parma)

Probabilidade Clássica  Características da Curva Normal:


 curva em forma de sino, unimodal
  o pt de frequência máx, pico, é = Mo, Me e x
 tem dois pts de inflexão (PI) (muda de curvatura)
 PI se encontram à distância S (desvio padrão) de x
Sucesso (p):  é simétrica em relação à média
 é assíntota
Fracasso (q): P(A)=P(B)=1-P(A) q=1-p .
 a área entre a curva e abscissas é = 1 ou 100%

Se A e B são mutuamente exclusivos:  Áreas Notáveis na Curva Normal:


 P(AUB) = P(A) + P(B)  de -3σ a +3σ 99,74%
 de -2σ a 2σ 95,44%
Se A e B não são mutuamente exclusivos:
 de -σ a +σ 68,26%
 P(AUB) = P(A) + P(B) – P(A∩B)
 de μ a +σ 34,13%
 de +σ a +2σ 13,59%
 de +2σ a +3σ 2,15%
Frequência Relativa

 Distribuição Normal Padronizada


 frequência relativa → probabilidade estimada
 Zi: variável padronizada
 obtida segundo a fórmula de transformação de xi:
Tipos de Variáveis
f Zi
 1) Variáveis Aleatórias Discretas
 conjunto finito de valores, e.g. contagens (faces de um dado)
 2) Variáveis Aleatórias Contínuas
 conjunto infinito de valores, e.g. medidas (peso, tempo, etc.)

-σ +σ x
μ
Variáveis Aleatórias Discretas
Z1= -1
 Distribuição DISCRETA de Probabilidade: Z2=+1
 não atribui probabilidade para intervalos
 atribui probabilidade a valor específico/distinto da variável
 principal distribuição discreta: BINOMIAL
 condições para q haja distribuição binomial: -1 0 +1 Z
 experimento for repetido n vezes independente
 cada repetição admite só p ou q, sendo p+q=1
 a ordem não importa População ou Amostra?
k (n-k)
 P(x=k) = Cn,k . p . q  População Amostra
k (n-k) N n
P(x=k) =( ).p .q
σ vs S
onde: n é o nº de tentativas, repetições do experimento μ x
k é o nº de sucessos desejados e
P(x=k) a probabilidade de k sucessos
p a probabilidade de sucesso
q a probabilidade de fracasso Cálculo do Intervalo de Confiança
macete: C9,2 =
 Nível de Confiança (NC)
 é a probabilidade, a área, dentro de um dado intervalo
 expressa a Região de Não Rejeição no teste de hipótese
Variáveis Aleatórias Contínuas
 Grau de Significância (α - alpha)
 Distribuição CONTÍNUA de Probabilidade
 α = 1 – NC
 atribui probabilidades a intervalos de valores
 não atribui probabilidade p/ um valor específico da variável  é apenas uma outra forma de expressar o NC
 expressa a Região Crítica no teste de hipótese
 principal distribuição discreta: NORMAL
 utiliza a tabela de Distribuição Normal Padronizada
 Intervalo de Confiança (IC)
 é o intervalo de valores de Zi que contém o parâmetro
f estudado, com dado o NC
 é limitado por -ZVC e +ZVC

 Intervalo de Confiança de Variável


 Aleatória Discreta > intervalo de proporção (percentual)
 Aleatória Contínua > intervalo de média
x
x (μ)= Me = Mo

Resumo de Estatística II - UNISUL - Ciências Econômicas 1


 Dado o NC, encontrar o IC?
 encontrar na tabela a área correspondente e ver qual o b) da proporção populacional:
valor crítico de Z (ZVC)
 o intervalo de confiança para Z será:  e = ZVC . . FC –e<p< +e
 -ZVC < ICZ < +ZVC

I. IC para a MÉDIA Populacional (μ) Cálculo do Tamanho da Amostra


 a.k.a. Cálculo da Estimativa da Média Populacional
 i.e. para uma variável aleatória contínua I. Quando não se conhece N e o Erro Tolerável
1º. Cálculo do Erro Amostral (e): 1º. calcula-se:
NB: o erro tolerável (E) é o mesmo que
 aka Eamp (erro amostral máximo provável ou tolerável):  n0 = o erro amostral máxima provável (e)!

se n > 30: e = ZVC . 2º. considera-se n0 como um valor aproximado

se n ≤ 30: e = ZVC .
II. Quando se conhece N e o Erro Tolerável
2º. Cálculo do IC: NB: Se n ≤ 30 e se não sabemos
o desvio padrão populacional
1º. encontra-se n0 a partir do erro tolerável
 x–e<μ<x+e (σ); empregamos  n0 =
t-Student e “S”
2º. encontra-se n a partir de n0 e de N
NB1: o problema dará o
NC q permitirá o cálculo NB2: “n” refere-se ao  n=
de ZVC e tbm dará a μ!!! tamanho da amostra

III. Quando se tem mais informações sobre a população


II. IC para a PROPORÇÃO Populacional 1º. Estimativa de média populacional
 a.k.a. Cálculo da Estimativa da Proporção Populacional
 i.e. para uma variável aleatória discreta (binomial) a. Para Amostragem COM Reposição:
 i.e. população infinita
1º. Cálculo do Erro Amostral (e):
 n= 2

 e = ZVC .
b. Para Amostragem SEM Reposição e com FC:
2º. Cálculo do IC:  i.e. população finita
 –e<p< +e
 n=
 onde e são as proporções amostrais de sucesso e fracasso
 p e q são as proporções populacionais
2º. Estimativa de proporção populacional

III. IC para a AMOSTRAS PEQUENAS t-Student a. Para Amostragem COM Reposição:


 i.e. empregando-se t-Student  i.e. população infinita
 i.e. [n ≤ 0] e [σ é desconhecido]
 n=
1º. Cálculo do t de Student:
 da tabela, top line, entra-se com a área, segundo o NC b. Para Amostragem SEM Reposição e com FC:
 left column, entra-se c/ o grau de liberdade (gl=n-1),
 i.e. população finita
sendo “n” o tamanho da amostra
 do cruzamento entre a coluna da área e a linha do gl,  n=
temos t crítico (tVC)

2º. Cálculo do Erro Amostral (e):


Teste de Hipóteses
 e = tVC .
 Hipóteses
3º. Cálculo do IC:  Hipótese Nula: H0 (e.g.: μ = μ0; ou p = p0)
 x–e<μ<x+e  Hipótese Alternativa: HA (e.g.: μ > μ0; p < p0; etc.)

IV. IC para População Pequena SEM Reposição


A C
B
1º. se o n for maior 5% maior que N
 i.e. n > 0,05 . N ou . > 0,05 .

-Zvc +Zvc Z
0

2º. utiliza-se o Fator de Correção (FC)  Testes de Significância


 FC =  Bilateral:
H0: parâmetro = b
3º. sendo o Erro Amostral (e): HA: parâmetro ≠ b
a) da média populacional: Região de não Rejeição: entre –ZVC e +ZVC: (A)
 e = ZVC . . FC x–e<μ<x+e Região Crítica: (B) e (C)

Resumo de Estatística II - UNISUL - Ciências Econômicas 2


 Unilateral à Esquerda: 1. Erro do Tipo I: rejeitar H0 sendo H0 válida
H0: parâmetro = b H0: μ = μ0 VERDADEIRA
HA: parâmetro < b HA: μ ≠ μA FALSA
Região crítica: à esquerda de –ZVC (B) Região de ñ Rejeição: (A) (–ZVC < NC < +ZVC) → (1 – α)
Região Crítica: (B) e (C) → (α + α)
 Unilateral à Direita:
H0: parâmetro = b  NC = 1 – α
 RC = (α / 2)%
HA: parâmetro > b  P(I) = α / 2 + α / 2 = α
Região crítica: à direita de +ZVC (C)  logo: a probabilidade de cometermos Erro do Tipo I é
igual ao Grau de Significância em %
 em contrapartida a probabilidade de não cometer o
Erro do Tipo I será igual ao Nível de Confiança
1. Teste de Hipóteses para MÉDIAS Populacionais
1º. Identificar H0, HA e a região crítica 2. Erro do Tipo II: aceitar H0 sendo H0 falsa
2º. Identificar o NC ou α e ZVC H0: μ = μ0 FALSA
3º. Calcular Zcalc HA: μ = μA VERDADEIRA NB: μ0 e μA são dados!
Zcalc = onde, σx =
1º. Na tabela de Distribuição Normal Padronizada, a partir
4º. Verificar se Zcalc está fora da Região Crítica de NC ou α, encontrar ZVC1 (à direita, i.e. “–“) e ZVC2 (à
esquerda, i.e. “+”) para H0
5º. Aceitar se estiver fora
2º. Determinar x1 e x2 para cada Zvc de H0:
NOTE BEM: x1 = μ0 + σx . (ZVC1)
Grau de Significância (α) e Nível de Confiança (NC)  e onde σx =
1) NC expressa a Região de Não Rejeição no teste de hipótese;
2) “α” expressa a Região Crítica no teste de hipótese; x2 = μ0 + σx . (ZVC2)
α = 1 – NC
3º. Transformar x1 e x2 em ZVC1 (“–“) e ZVC2 (“+”) para HA:
ZVC1 =
 onde σx está calculado no passo acima
2. Teste de Hipóteses para PROPORÇÕES Populacionais ZVC2 =
1º. Identificar H0, HA e a região crítica
4º. Com esses ZVC1’ e ZVC2’ para HA, determinar as áreas
2º. Identificar o NC ou α e ZVC para ZVC1 e ZVC2
3º. Calcular , onde é dado ou calculado por , sendo k 5º. A probabilidade de erro do tipo I – i.e. de aceitar uma
o número informado de eventos que queremos verificar hipótese nula (H0) falsa é:
4º. Calcular Zcalc  P(II) = β = (ÁreaZvc1’ – ÁreaZvc2’)

Zcalc = onde, = 6º. O Poder do Teste (ou Força do Teste) – i.e. a


possibilidade de rejeitar uma hipótese nula (HA) falsa –
5º. Verificar se Zcalc está fora da Região Crítica é dado por:
6º. Aceitar se estiver fora  P(μA) = 1 – β

α/2 α/2
3. Teste de Hipóteses p/ n ≤ 30 e σ desconhecido: s-Student 1 -- α

1º. Verificar se n ≤ 30 e se σ é desconhecido -Zvc 0 +Zvc Z0

2º. Identificar H0, HA e a região crítica


3º. Identificar o NC ou α e tVC α/2 α/2
1 -- α
4º. Calcular tcalc
-x1
tcalc = onde, Sx = μ0 +x1 X0

5º. Verificar se tcalc está fora da Região Crítica


β
6º. Aceitar se estiver fora

NOTE BEM -x1 +x1 μA XA


Se n > 30:
Usar a distribuição normal (Caso 1 acima) e o desvio padrão
pode ser o da amostra (S)!

-Zvc +Zvc 0 ZA

Erros de Decisão
 Erro do Tipo I: rejeitar H0 sendo H0 válida 1–β
Erro do Tipo II: aceitar H0 sendo H0 falsa
Resumo de Estatística II - UNISUL - Ciências Econômicas 3
Coeficiente de Correlação Linear de Pearson (rxy) Análise de Regressão

 Correlação Linear  Traçado de uma RETA IMAGINÁRIA que visualiza a média


 estudo da relação entre duas variáveis quantitativas das amostras a fim de minimizar os erros probabilísticos.
 indica a intensidade e a proporcionalidade dessa relação  Previsão que só tem significado se a correlação tiver
força, i.e. quando “r” for igual ou próximo a “-1” ou a “+1”,
i.e. pela proximidade dos pares do diagrama de
dispersão à reta imaginária
Produção x Emprego - Pares (x,y)
 oferece uma ESTIMATIVA corrigida!
14

12
 Método dos Mínimos Quadrados
10
 Função da reta de regressão:
Produção

8
 NB: é Y estimado!
6
sendo:
4

2

0
0 2 4 6 8 10 12 14 16 
Emprego
 “a”: coeficiente angular da reta:
Reta Imaginária
se “a” > 0 regressão crescente, positiva
se “a” < 0 regressão decrescente, negativa

 “b” o ponto de intersecção da reta com o eixo “y”


 rxy =

Análise de Série Temportais


2 2
x y x.y x y
 Exemplo:

15
10
Série 3
5
Série 2
0
Série 1
∑x= ∑y=
2 2 2 2
(∑x) = (∑y) = ∑(x.y)= ∑x = ∑y =
(∑x).( ∑y)=

Valor de “r” Correlação  Elementos de Análise:


 Tendência Secular (T)
“r” próximo de “0” pouco significativa  Variações Sazonais (Saz)
 Variações Cíclicas (C)
“r” = zero não há  Variações Aleatórias (I)

 Modelos Utilizados:
“r” próximo de -1 negativa
 Aditivo
 Y = T + SAZ + C + I
“r” = -1 negativa perfeita
 Multiplicativo
 Y = T x SAZ x C x I
“r” próximo de +1 positiva

1. Estudo da Tendência (T)


“r” = +1 positiva perfeita  a regressão linear (método dos mínimos quadrados (mmq)
 o método das médias móveis

Resumo de Estatística II - UNISUL - Ciências Econômicas 4


 Método das Médias Móveis (mm)

 ; ; ; ...

t Yi mm
1 8 --- ---
2 9 (8+9+7)/3 8
3 7 (9+7+8)/3 8
4 8 (7+8+10)/3 8,33
5 10 (8+10+11)/3 9,67
6 11 (10+11+12)/3 11
7 12 (11+12+11)/3 11,33
8 11 (12+11+9)/3 10,76
9 9 (11+9+8)/3 9,33
10 8 (9+8+7)/3 8
11 7 --- ---

Média Móveis (k=3)

15

10
Variável

y
5
mm
0
0 5 10 15
Tempo

 Que k escolher para o cálculo de mm?


 dados mensais: k = 12
 dados bimestrais: k= 6
 dados trimestrais: k= 4
 dados quadrimestrais: k = 3
 dados semestrais: k= 2

2. Estudo das Variações Sazonais (Saz)


 método da porcentagem da tendência
 pela reta de regressão (pp. 213 a 218); ou
 pela curva mm (pp. 219 a 224)
 método da diferença da tendência (pp. 225 a 230)

 Passos, pp. 213 a 218, pela reta de regressão:


1º. ajustar a séria a reta de regressão ao à curva de mm
i.e. (ver acima as fórmulas)
2º. determinar valores de Yi pela estimado pela reta ou mm
3º. para cada período (t), calcular
4º. calcular média aritmética simples
5º. testar índices
6º. eliminar fator sazonal

3. Estudo das Variações Cíclicas (C)


 pp. 231 a 236

3. Estudo das Variações Aleatórias (C)


 aka Suavização / Regularização Exponencial pp. 236 a 238

Exercícios de Revisão:
 pp. 239 a 240 + 314 a 319 >>> tendência mm par
 pp. 241 + 319 a 325 >>> índices sazonais
 pp. 241 a 242 + 326 a 329 >>> regularização exponencial

Resumo de Estatística II - UNISUL - Ciências Econômicas 5