Você está na página 1de 10

Estatística A - Resumo

Centro de Ciências Naturais e Exatas


Universidade Federal de Santa Maria
Lucas Bogaz De Angelo

Santa Maria, RS
2022

• DISTRIBUIÇÃO DE • MEDIDAS SEPARATRIZES


FREQUÊNCIAS
i ( n + 1)
Ps =
Quantidade de Linhas (Intervalos ou S
Classes) na Tabela Onde i é a quantidade de divisões (quar-
tis, decis, percentis), e S é a quantidade de
Fórmula da Raiz
partes obtidas.

√ BoxPlot
k = | n |, se n ≤ 50

LI, Q1, Q2, Q3, LS


Fórmula de Sturges

LI = Máx{ X(1) ; Q1 − 1, 5 · ( Q3 − Q1 )}
LS = Min{ Q3 + 1, 5 · ( Q3 − Q1 ); X(n) }
k = 1 + 3, 3 log(n), se n > 30
• MEDIDAS DE DISPERSÃO
Amplitude de cada Classe
Desvio Médio

H Amplitude Total
h= =
k Nº de Classes ∑in=1 | xi − x |
d=
n

As Classes (ou Linhas) devem ser repre-


Variância
sentadas por um intervalo fechado aberto,
ou seja, iniciam incluindo o número de Variância Populacional
contagem, e finalizam no anterior ao da
próxima linha. Sua representação se dá
∑in=1 ( xi − µ)2
através do símbolo ⊢. σ2 =
n
2

Variância Amostral Esperança de uma V.A.D

2 ∑in=1 ( xi − x )2 ∞
S =
n−1 E( x ) = ∑ xi · P ( xi )
i =1

Variância com soma de quadrados


Variância de uma V.A.D

(∑in=1 xi )2
∑n [ x2 ] −
S 2 = i =1 i n
n−1
V ( x ) = E( x2 ) − [ E( x )]2
Desvio Padrão

Onde E( x2 ) = ∑ xi2 · P(xi )
i =1


Populacional → σ = + σ2
Desvio Padrão

Amostral → S = + S2
q
Coeficiente de Variação DP( x ) = + V (x)

σ
Populacional → CV = Variável Aleatória Contínua (V.A.C.)
µ
S
Amostral → CV = Função densidade de probabilidade
x

• PROBABILIDADE E VARIÁVEIS I) f (x) ≥ 0 ∀X∈R


ALEATÓRIAS Z ∞
I I) f ( x ) dx = 1
−∞
Variável Aleatória Discreta (V.A.D.)
Z b
Função de probabilidade I I I) f ( x ) dx = P( a ≤ x ≤ b)
a

Esperança de uma V.A.C


I) 0 ≤ P( x ) ≤ 1

n Z ∞
I I) ∑ P ( xi ) = 1 E( x ) = x · f ( x ) dx
i =1 −∞
3

Variância de uma V.A.C Distribuição de Poisson - (V.A.D)

V ( x ) = E( x2 ) − [ E( x )]2
λ x · e− λ
P( X = x ) =
Z ∞ x!
2
Onde E( x ) = x2 · f ( x ) dx
−∞
Em que λ = taxa média de sucesso
• DISTRIBUIÇÕES DE PROBABILI- x = 0, 1, 2, ..., . 0≤p≤1
DADE
E( X ) = λ (Esperança)
Distribuição de Bernoulli - (V.A.D)

V (X) = λ (Variância)

P ( X = x ) = p x · (1 − p )1− x HP Prime: Poisson(µ,k)


- µ = ocorrências previstas
Em que x = 0, 1 0≤p≤1 - probabilidade de k ocorrências.

E( X ) = p (Esperança)
Aprox Binomial p/ Poisson

V ( X ) = p · (1 − p ) (Variância)

Distribuição Binomial - (V.A.D) Se n → ∞ p → 0,

Na prática n ≥ 30 p ≤ 0, 1
 
n
P( X = x ) = · p x · (1 − p ) n − x λ = n·p
x

Em que x = 0, 1, 2, ..., n. 0≤p≤1 Distribuição de probabilidade normal


(gaussiana) - (V.A.C)
 
n n!
= Cn,x =
x x! · (n − x )!
2 !
x−µ
  
E( X ) = n · p (Esperança) 1 1
f (x) = √ · exp −
2πσ 2 σ

V ( X ) = n · p · (1 − p ) (Variância)
x, µ ∈ R eσ>0
HP Prime: Binomial(n,p,k)
- n ensaios E( x ) = µ (Esperança)
- p = probabilidade de sucesso
- probabilidade de k sucessos. V ( X ) = σ2 (Variância)
4

Propriedades Aprox Binomial p/ Normal

I) f (x) ≥ 0 E( x ) = n · p → µ
Z ∞
I I) f ( x ) dx = 1 V ( x ) = n · p · (1 − p ) → σ 2
−∞
x−µ x − (n · p)
z= =p
Aproximação de probabilidades por tabela σ n · p · (1 − p )

Somente se n → ∞ e p → 0, 5. É bom
estabelecer um fator de correção, dado por
P( a < x < b) =

b 2 ! P( x1 − 0, 5 ≤ x ≤ x2 + 0, 5)
x−µ
Z 
1 1
√ · exp − dx
a 2πσ 2 σ
Aprox Poisson p/ Normal

Como calcular a integral da função é ana-


liticamente impossível, utiliza-se uma ta-
bela para encontrar os valores de probabi- E( x ) = λ
lidade na maioria dos casos. Transforma-
se x → z em que µ = 0 e σ = 1. Logo V (x) = λ

x−λ
z= √
x−µ λ
z=
σ

Analisa-se então através da tabela já co- • AMOSTRAGEM **INCOMPLETO**


nhecida (Figura 2).
Amostragem aleatória simples

a−µ b−µ
 
P( a < x < b) → P <z< → Gerar um número para cada ele-
σ σ
mento

A função densidade de probabilidade de z


Amostragem aleatória sistemática
é

Amostragem estratificada
1 1 2
φ(z) = √ e− 2 z

para −∞ < z < +∞.


5

• ANÁLISE DE REGRESSÃO E COR-


RELAÇÃO (∑in=1 xi )·(∑in=1 yi )
∑in=1 xi yi − n
β̂ 1 =
( ∑ n
x )2
∑in=1 xi2 − i=n1 i
Coeficiente de Correlação
β̂ 0 = ȳ − β̂ 1 x̄

(∑in=1 xi )(∑in=1 yi ) Teste de Hipótese para β 1


∑in=1 xi yi −
r= q q n
(∑in=1 xi )2 (∑in=1 yi )2
∑in=1 xi2 − ∑in=1 y2i −

n n H0 : β 1 = 0
– Hipóteses
H1 : β 1 ̸= 0
– Nível de Significância = 5%
– Tabela 4, Linha = φreg = 1, Coluna
= φerr = n − 2

QMregressão
Teste de Hipótese para o coeficiente de Fcalc =
QMerro
correlação linear

Podemos testar com t de student ou distri-


Do ponto de vista populacional, a correção
buição F. Nesse caso, utilizaremos a dis-
linear entre x e y é dada por ρ (rho).
tribuição F.

H0 : ρ = 0
1º) Hipóteses
H1 : ρ ̸= 0
n n
(∑in=1 yi )2
2º) Teste de Significância SQtotal = ∑ (yi − ȳ)2 = ∑ y2i − n
i =1 i =1
Geralmente α = 5% φ = n − 2
n
3º) Estatística de Teste
SQregressão = ∑ (yi − ŷi )2 =
i =1
" #
n
(∑in=1 xi ) · (∑in=1 yi )
β̂ 1 · ∑ xi yi −
s
( n − 2)
tcalc = r · i =1
n
1 − r2
SQerro = SQtotal − SQregressão
4º) Conclusão
Se sim, sim. Se não, não.

SQtotal
Estimando o modelo de regressão linear QMtotal =
n−1

QMregressão = SQregressão

ŷ = β̂ 0 + β̂ 1 x SQerro
QMerro =
n−2
6

Coeficiente de determinação

SQregressão
R2 =
SQtotal
7

• ANEXOS

Figura 1: Distribuição normal padrão


8

Figura 2: Distribuição Qui-quadrado


9

Figura 3: Distribuição T de student


10

• EXERCÍCIOS

10 Legenda 1 Teste

5 3
2 2
1 1 1 1 1 1 1 1 1

1830 1940 1977 1980 1984 1987 1988 1990 1993 1997 2002 2006

Freq Absol
14
13
12
11
10
9
8
7
6
5
4
3
2
1

5 10 15 20 25 30 35 40 45 50 Tempo (h)

Figura 4: Tempos de secagem (em horas) de amostras do material x. Santa Maria, RS. 2022.

Você também pode gostar