Você está na página 1de 9

Estatstica

Conceitos bsicos
Populao constutuida por todos os elementos que so passveis de ser analisados
de tamanho N

Amostragem Subconjunto da populao que efectivamente analisado com um dado
tamanho n

Amostra aleatria Amostra onde cada elemento da populao tm hipteses iguais de
ser escolhido para a amostra.

Estatstica descritiva Inclui grficos e procedimentos numricos que permitem
sumarizar e processar dados por forma a transform-los em informao.

Inferncia Estatstica fornece as bases para prevr, estimar e permite transformar
informao em conhecimento

Estatstica Descritiva

Classificao de variveis
As variveis podem ser numricas ou por categorias.
No caso das numricas existem variveis discretas e continuas.

Distribuio de frequncias
Tabela que tm na coluna esquerda intervalos e na coluna direita a frequncia ou
nmero de observaes. Os intervalos so habitualmente do mesmo tamanho,
abrangerem todo o intervalo e no serem sobrepostos

Tamanho da amostra vs. nmero de classes intervalos:
At 50 5 a 6
50 a 100 6 a 8
> 100 8 a 10

Distribuio cumulativa de frequncia Mostra na coluna da direita o nmero total
de observaes cujo valores so menores do que o limite superior do intervalo.
Distribuio cumulativa da frequncia Mostra na coluna da direita o valor em
percentagens acumuladas

Histograma um grfico que consiste em barras verticais mostrando a frequncia.
Ogiva uma linha onde so mostrados a percentagem relativa acumulada e que pode
estar sobreposta ogiva.

Caule e Folha Diagrama alternativo ao histograma que permite manter informao
sobre as observaes individuais. Os nmeros inicias so mantidos na coluna da
esquerda e os restantes nmeros surgem na coluna da direita

Diagrama de pareto um grfico de barras que mostra as causas principais
mostrando esquerda as ocorrncias mais frequentes.

Grficos de linha - Pode mostrar a evoluo de valores no tempo

Medidas de tendncia central

Estatstica uma medida descritiva calculado a partir de uma amostra
Parmetro uma medida descrtiva calculada a partir da populao

Mdia aritmtica


n
x x x
n
X
X
n
n
i
i
+ + +
= =

=
...
1 1 1


Mdia da populao


N
x x x
N
X
n
N
i
i
+ + +
= =

=
...
1 1 1


Mediana A mediana o valor para o qual 50% das observaes so inferiores e 50%
das observaes so superiores. No caso da amostra conter um nmero par de
observaes a mediana a mdia das 2 observaes do meio.

Moda A moda se existir a observao mais frequente.

Forma da distribuio
Simetria A forma de uma distribuio simtrica se as observaes forem
balanceadas ou distibuidas de forma uniforme volta da mdia.

Enviesamento - Uma distribuio enviadas se as observaes esto distribuidas de
forma no simtrica. Um enviesamento positivo corresponde a a uma distribuio onde
existem mais observaes esquerda da mdia

Mdia geomtrica

n
n g
x x x X * ... * *
1 1
=

usada em especial para calcular mdias de crescimentos



Medidas de variabilidade

Intervalo de variao - Diferena entre a observao maior e a observao menor

Varincia simples a soma das diferenas quadradas entre cada observao e a
mdia simples dividida pelo tamanho da amostra menos 1

1
) (
1
2
2

+
=

=
n
X x
s
n
i
i


Varincia da populao

N
x
N
i
i
=
+
=
1
2
2
) (


Desvio padro simples a raz quadrada positiva da varincia

1
) (
1
2
2

+
= =

=
n
X x
s s
n
i
i


Desvio padro da populao

N
x
N
i
i
=
+
= =
1
2
2
) (


Regra Emprica

Numa distribuio normal cerca de 68% das observaes esto a desvio padro da
mdia, 95% esto a dois desvios padres da mdia e quase todas as observaes esto a
3 desvios padres da mdia.

Coeficiente da Variao - uma medida da disperso relativa que exprime o desvio
padro como uma percentagem da mdia.

Coeficiente de variao simples
% 100 x
X
s
CV = , se 0 > X

Coeficiente de variao da populao:
% 100 x CV

= , se >0


Percentis e quartis

Os percentis dividem as observaes em centsimos e os quartis em quartos.

4
) 1 (
1
+
=
n
Q e
4
) 1 ( 3
3
+
=
n
Q

Intervalo interquartil - Diferena entre o terceiro e o primeiro quartil

Box and Whisker Grfico no qual so mostrados os valores de 5 medidas contendo:
Uma caixa interna que vai do 1 ao 3 quartil. Uma linha que desenhada na caixa
correspondendo mediana.
Os bigodes so as linhas 1 quartil ao mnimo e do 3 quartil ao mximo.

Descrio sumria de relaes entre variveis
Scatter Plot Permite mostrar os valores por cada par de variveis

Covarincia simples
1
) )( (
) , (
1
,


= =

=
n
Y y X x
S y x Cov
n
i
i i
y x


Coeficiente de correlao simples
y x
y x
s s
y x Cov
r
) , (
,
=
Relaes lineares
X Y
1 0
+ =

Probabilidades
Experincia aleatria um processo que pode levar a dois ou mais resultados com
incerteza sobre qual o resultado que ir ocorrer.
Espao da amostra Conjunto de resultados possveis da experincia

Evento Sub conjunto de resultados possveis
Eventos mutuamente exclusivos So eventos onde a ocorrncia de um implica que o
outro no ocorre
Eventos colectivamente exaustivos So eventos que no seu conjunto abarcam todo o
espao de resultados.
Eventos complementares So os eventos dentro dum espao de amostra que no
pertencem ao evento do qual so complementares

Definio clssica de probabilidade - a proporo de vezes que um evento ocorrer
assumindo que a possibilidade de ocorrer qualquer resultado igual.
N
N
A P
A
= ) (

Nmero de combinaes x itens tomados k de cada vez
)! ( !
!
x n x
n
C
n
x

=

Nmero de permutaes x itens tomados de n
)! (
!
x n
n
P
n
x

=

Nmero de ordenaes possveis x!

Definio subjectiva de probabilidade o grau em que um individuo acredita que
um evento posso ocorrer.

Postulados das probabilidades
1 ) ( 0 A P

=
i
i
O P A P ) ( ) (
P(S) =1

Regras das probabilidades
Complementaridade :

) ( 1 ) ( A P A P =

Adico:

) ( ) ( ) ( ) ( B A P B P A P B A P + =

Condicionada:

) (
) (
) (
) (
) | (
A P
A B P
B P
B A P
B A P

=

=

Independncia estatstica:

) ( ) ( ) ( B P A P B A P =

Probabilidades conjuntas probabilidade de dois eventos acontecerem em simultneo
Probabilidades marginais probabilidade de um evento ocorrer dado que ocorre outro

Teorema de Bayes
) (
) ( ) | (
) | (
B P
A P A B P
B A P =

Variveis discretas aleatrias e distribuies de
probabilidades

Uma varivel aleatria uma varivel que assume um valor numrico determinado por
uma experincia aleatria.

Uma varivel aleatria discreta se s pode assumir uma quantidade numervel de
valores.
Uma varivel aleatria continua se pode assumir qualquer valor dentro de um
intervalo.

Funo de distribuio de probabilidade
P(x)=P(X=x)

Propriedades

x
x P
x P
1 ) (
0 ) (


Funo de probabilidade acumulada
) ( ) (
0 0
x X P x F =

0
) ( ) (
0 ) (
0
0
x x
x P x F
x F


Valor esperado

=
x
x xP x E ) ( ) (
Varincia
[ ]

= =
x
x x x
x P x X E ) ( ) ( ) (
2 2 2

O desvio padro a raz quadrada positiva da varincia

Propriedade de funes lineares de uma varivel aleatria
x Y
b a bX a E + = + = ) (
2 2 2
) (
x Y
b bX a Var = + =
x Y
b =

Mdia e varincia normalizada
x
x
X
Z


=
E(Z)=0
Var(Z)=1

Distribuio de Bernoulli
) 1 (
) (
2

=
=
x
X E


Distribuio binomial
) 1 (
) (
2

=
=
n
n X E
x


Distribuio hiper geomtrica Probabilidade de tirar n objectos de N onde S a
probabilidade de sucesso
N
n
S N
x n
S
x
C
C C
x P

= ) (

Distribuio de Poisson
1. Assume-se que a probabilidade de ocorrncia igual em diversos intervalos
2. No pode haver mais que uma ocorrncia em cada subintervalo
3. As ocorrncias so independentes

,... 2 , 1 , 0 ,
!
) ( = =

x para
x
e
x P
x




=
=
2
x
x


Soma de variveis aleatrias
) , cov( 2 ) (
) (
) (
2 2
Y X Y X Var
Y X E
Y X E
y x
y x
y x
+ + = +
=
+ = +





Variveis aleatrias continuas e distribuies de
probabilidade

x) P(X F(x) =

P(a<X<b)=F(b)-F(a)

Funo de densidade de probabilidade

0
) ( ) (
0 ) (
0
x
x
m
dx x f x F
x f

1 ) ( =

dx x f

Distribuio normal
2
2
2
) (
2
2
1
) (


=
x
e x f

Propriedades da distribuio normal

) , ( ~
) (
) (
2
2

N X
X Var
X E
=
=


< <

= < <

a
F
b
F
b
Z
a
P b X a P ) (

Aproximao de uma distribuio binomial a uma distribuio normal
Se 9 ) 1 ( > n ento :

< <

=
) 1 ( ) 1 (
) (

n
n b
Z
n
n a
P b X a P

Se 9 ) 1 ( 5 < < n ento :


< <


=
) 1 (
5 . 0
) 1 (
5 . 0
) (

n
n b
Z
n
n a
P b X a P

Distribuio exponencial
t
e t f


= ) (
t
e t F

=1 ) ( , / 1 ) ( = t E ,
2 2
/ 1 =

Você também pode gostar