Você está na página 1de 79

Professor: Joo Maria Filgueira, MSc

(joao.filgueira@ifrn.edu.br)
Probabilidade Estatstica

Plano de Ensino
Objetivo

Contedo

Metodologia

Avaliao

BIbliografia
Mtodo Estatstico
A Cincia Estatstica


Termos Estatsticos relevantes


Fases do Trabalho Estatstico


Exemplo para discusso


A Cincia Estatstica
Estatstica tem sua origem em Dados
Estatais - Governamentais

A partir do sculo XVI surgem
anlises de nascimentos, de bitos,
de matrimnios, riquezas

No sculo XVIII surge, dessas
anlises, a Cincia Estatstica

Dimenses: Descritiva, Probabilstica,
Inferencial


Termos Estatsticos relevantes
Populao: universo a ser estudado

Amostra: subconjunto da Populao

Variveis: Qualitativas, Quantitativas

Variveis Quantitativas: Discretas e
Contnuas

Dados Estatsticos: valores das Variveis


Fases do Trabalho Estatstico
2 - Planejamento
Software
Estatstico
3 Coleta de dados
5 Anlise de dados
1 Definio do
Problema
6 Apresentao
de resultados
4 Organizao
de dados
Lista de
Referncias
Base de
Dados
Exemplo para discusso
Estudo para avaliar a Evaso
Escolar em seu Municpio.

Como Planejar esse Estudo?

Quais as fases desse Trabalho
Estatstico?

Quais as principais variveis? E os
principais desafios?


Estatstica Descritiva
Distribuio de frequncias

Medidas de posio

Medidas de variabilidade

Medidas Separatrizes

Assimetria

Apresentao grfica
Distribuio de Frequncia
Rol: conjunto ordenado dos dados

Amplitude Total: AT = MAIOR - MENOR

Classes:

Onde n a quantidade de dados

Amplitude de classe: a = AT / c

Frequncia: ocorrncia do Rol nas classes

>
<=
. 25 n dados de nmero o se , n
25; n dados de nmero o se 5,
Distribuio Frequncia
Exemplo

Considere os dados a seguir referentes a tempo de
processamento de uma rotina computacional,
implementada por diferentes Programadores. Obtenha
a distribuio de frequncia. Comente o resultado.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Mdia
Valor mdio dos dados

Dados no agrupados:

Onde X o conjunto valores; n a quantidade de dados.

Dados agrupados:

Onde X o ponto mdio; f a frequncia da classe;

=
f
X f
X
) * (
n
X
X

=
Mediana
Valor central dos dados

Dados no agrupados:
, quando n for mpar

, quando n for par

Onde x
(n+1)/2
representa o valor da posio (n+1)/2
x
n/2
representa o valor da posio n/2
x
(n/2+1)
representa o valor da posio (n/2+1)

)/2 X (X X
X X
1) (n/2 n/2
1 n
+
+
+ =
=
~
~
2 / ) (
Mediana
Valor central dos dados
Dados agrupados:



preciso obter a primeira classe com 50% dos dados. Esta
a classe mediana.

Onde L o limite inferior da classe mediana;
Sant a soma das frequncias anteriores;
f a frequncia da classe mediana;
a a amplitude de classe.
a *
f
Sant
2
f
L X
|
|
|
|
|
.
|

\
|

|
|
.
|

\
|
+ =

~
Moda
Valor de maior frequncia

Dados agrupados:



preciso obter a classe com maior frequncia.

Onde L o limite inferior da classe;
Da = maior frequncia - anterior;
Dp = maior frequncia - posterior;
a a amplitude de classe.
a *
Dp Da
Da
L X
|
|
.
|

\
|
+
+ =

Medidas de posio
Exemplo

Considere a distribuio de frequncia obtida
anteriormente com os dados a seguir. Obtenha mdia,
moda e mediana. Comente o resultado.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Varincia
X

=
1 ) (
) ( *
2
2
f
X X f
S
1
) (
2
2

=

n
X X
S
Variao dos dados em relao mdia

Dados no agrupados:

Onde X o conjunto valores; n nmero de dados; a mdia.

Dados agrupados:

Onde X o ponto mdio; f a frequncia da classe; mdia.

X
Desvio padro
Variao dos dados em relao mdia



Onde S
2
a varincia


2
S S =
Coeficiente de variao
Variao dos dados em relao mdia




Onde:
S o Desvio padro
e a Mdia

Quanto menor Cv, melhor a
representatividade da mdia X.


100 *
X
S
Cv
|
.
|

\
|
=
X
Medidas de variao
Exemplo

Considere a distribuio de frequncia obtida
anteriormente com os dados a seguir, bem como a
mdia, moda e mediana. Obtenha varincia, desvio
padro e coeficiente de variao. Comente o resultado.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Medidas Separatrizes
Organizam os dados em grupos
percentualmente iguais
Quartis 25% Q
1
25% Q
2
25% Q
3
25%


Decis 10% D
1
10% D
2
...... 10% D
8
10% D
9
10%



Percentis 1% P
1
1% P
2
...... 1% P
98
1% P
99
1%

a *
f
Sant
4
f
* i
L Q
i
|
|
|
|
|
.
|

\
|

|
|
.
|

\
|
+ =

a *
f
Sant
10
f
* i
L D
i
|
|
|
|
|
.
|

\
|

|
|
.
|

\
|
+ =

a *
f
Sant
100
f
* i
L P
i
|
|
|
|
|
.
|

\
|

|
|
.
|

\
|
+ =

Medidas Separatrizes
Exemplo

Considere a distribuio de frequncia obtida
anteriormente com os dados a seguir. Obtenha o valor
abaixo do qual h 75% dos dados, e o valor abaixo do
qual h 10% dos dados . Comente os resultados.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Assimetria
Quantifica o deslocamento/afastamento da
distribuio em relao a medidas centrais




a Mdia
a Moda
S o Desvio padro

( )
S
X X
Ass

=
X
X

Assimetria
Situaes que a literatura apresenta

Ass > 0


Ass < 0



Ass = 0

Assimetria
Exemplo

Considere a distribuio de frequncia obtida
anteriormente com os dados a seguir, bem como a
mdia, moda e desvio padro. Obtenha a Assimetria.
Comente o resultado.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Apresentao grfica

Histograma

Grfico de barra de classes e porcentagens

Polgono de frequncia

Grfico de linha de pontos mdios e porcentagens


Apresentao grfica
Exemplo

Considere a distribuio de frequncia obtida
anteriormente com os dados a seguir. Obtenha
histograma e polgono de frequncia. Comente o
resultado.

Tempo de processamento (s)

18 18 17 16 19 19 17 18 20 20 22 25 23 22 21
21 19 17 18 16 15 20


Diagrama de Pareto
Grfico de barra, por ordem de ocorrncia

Frequncia em ordem decrescente

Frequencia acumulada direita


Diagrama em setores

Grfico em forma de crculo: partes em um total

Recomenda-se um mximo de 7 partes



R e c e i t a d o M u n i c p i o X ( 1 9 7 5 - 1 9 7 7 )
2 5 % 3 3 , 3 %
4 1 , 7 %
1976 1977 1975
Probabilidade
Significado
Axiomas de Probabilidade
Probabilidade condicional
Distribuio de Probabilidade
Valor Esperado
Varincia
Distribuies Discretas
Distribuies Contnuas
Significado
Experimento aleatrio

Espao amostral - S

Eventos - E

Probabilidade Clssica P(E) = n(E)/n(S)
Axiomas
(1) Se um Evento vazio (evento
impossvel), ento P()=0

(2) Se Ac o complemento do
evento A, ento P(Ac) = 1 P(A)

(3) Se A e B so dois eventos
quaisquer, ento:
P(A B) = P (A) + P (B) P (A B)

Exemplo
Em um lanamento de um dado, qual
probabilidade de se obter a FACE 4?

Experimento lanar um dado
Espao amostral S={1,2,3,4,5,6}
Evento FACE 4; E = {4}
P(E) = 1/6


Exemplo
Em um grupo de alunos do Curso de Anlise
de Sistemas, h 10 alunos que pagam
Estatstica, 5 que pagam Programao e 3
que pagam essas duas Disciplinas. Um aluno
foi selecionado, qual probabilidade dele
pagar Estatstica ou Programao?
Probabilidade condicional
Para dois eventos E
1
e E
2
, a
Probabilidade de E
2
ocorrer, sabendo
que

E
1
j havia ocorrido dada por:

P(E
2
/E
1
) = P(E
1
E
2
)/ P(E
1
), onde:

P(E
1
) probabilidade de E
1
ocorrer (s,
sem E
2
)

P (E
1
E
2
) a probabilidade dos dois
ocorrerem juntos.
Exemplo
Em um lote de lmpadas, h 8 boas, 2 com pequenos
defeitos e 2 com grandes defeitos. Desse lote,so retiradas
2 lmpadas, uma aps a outra sem reposio. Qual a
probabilidade de que ambas sejam defeituosas?
Sabe-se que P(E
2
/E
1
) = P(E
1
E
2
)/ P(E
1
) , logo tem-se:
P(E
1
E
2
)= P(E
1
)* P(E
2
/E
1
)
P(E
1
E
2
)= (4/12)* P(E
2
/E
1
)
P(E
1
E
2
)= (4/12)* (3/11)
P(E
1
E
2
)= (4*3)/(12*11)
P(E
1
E
2
)= 12/132 = 0,0909
Distribuio de Probabilidade
Varivel aleatria

Valores possveis para Varivel

Probabilidade de cada valor

Soma das Probabilidades igual a 1
Exemplo
Em um lanamento de um dado, construa a
Distribuio de Probabilidade da face
obtida em cada lanamento.
Experimento lanar um dado
Valores possveis S={1,2,3,4,5,6}
P(1) = 1/6, P(2) = 1/6, P(3) = 1/6,
P(4) = 1/6, P(5) = 1/6, P(6) = 1/6

X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Valor Esperado
o valor esperado para o
experimento. Por exemplo, quando
lana-se um dado, espera-se que
ocorra a face ...



X a varivel em questo
x cada valor que X pode assumir
p(x) cada probabilidade de x

= ) ( ) ( x p x X E
Exemplo
Em um lanamento de um dado, a partir da
Distribuio de Probabilidade da face
obtida em cada lanamento, obter o Valor
Esperado.


E(X) = 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6
E(X) = (1+2+3+4+5+6)/6 = 21/6 = 3,5

Portanto ao lanar-se um dado espera-se que ocorra as faces 3 e 4.
X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Varincia
= ) ( ) (
2 2
x p x X E
uma medida de disperso.

V(X) = E(X
2
) [E(X)]
2
, onde:






X a varivel em questo
x cada valor que X pode
assumir
p(x) cada probabilidade de x

= ) ( ) ( x p x X E
Exemplo
Em um lanamento de um dado, a partir da
Distribuio de Probabilidade da face
obtida em cada lanamento, obter a
Varincia.


E(X
2
) = 1
2
*1/6+2
2
*1/6+3
2
*1/6+4
2
*1/6+5
2
*1/6+6
2
*1/6
E(X
2
) = (1+4+9+16+25+36)/6 = 91/6 = 15,17
E(X) = 3,5
V(X) = 15,17 (3,5)
2
= 2,92
X 1 2 3 4 5 6 SOMA
P(X) 1/6 1/6 1/6 1/6 1/6 1/6 6/6=1
Distribuies discretas
Varivel aleatria discreta assume valores inteiros,
geralmente tipo 0,1,2, ..., n>=0

X - gols em uma partida de futebol
X - votos de determinado candidato
X - lmpadas queimadas em uma indstria
X - clientes em dbito com determinada empresa

Uma varivel aleatria caracterizada pelo valor
esperado E(X) e varincia V(X), e possui
determinada distribuio de probabilidade
Distribuies Binomial
Varivel aleatria discreta que pode assumir apenas
dois valores, um de sucesso ou outro de fracasso,
tipo 0,1.
X alunos aprovados;X acertos em uma prova





n repeties do experimento
p probabilidade de sucesso
q probabilidade de fracasso, q=1-p
x valor de ocorrncia de sucesso
E(X) = n*p ; V(X) = n*p*q

x n x
q p
x
n
x X P

|
|
.
|

\
|
= = ) (
)! ( !
!
x n x
n
x
n

=
|
|
.
|

\
|
Exemplo
Em oito lanamentos de uma moeda, qual
a probabilidade de se obter 3 caras?
Calcular o Valor Esperado e a Varincia?
X-nmero de caras em lanamentos da moeda
X~B(n,x,p)
n=8 repeties, x=3 caras, p= probabilidade de cara (sucesso)
X~B(8,3,1/2)
P(X=3) = C
8,3
*(1/2)
3
*(1-1/2)
8-3
P(X=3) = 56*0,125*0,03125 = 0,21875
E(X) = n*p = 8*(1/2) = 4 caras
V(X) = n*p*q = 8*(1/2)*(1-1/2)=8*(1/2)*(1/2) = 2


Distribuies Poisson
Varivel aleatria discreta que pode assumir valores
de sucesso em determinado intervalo. Este intervalo
pode ser de tempo, de rea, de volume.
X veculos que passam em uma rua por hora
X erros ortogrficos em uma pgina de texto




t taxa histrica de sucesso
x valor de ocorrncia de sucesso
E(X) = t; V(X) = t

!
.
) (
x
t e
x X P
x t
= =
Exemplo
Qual a probabilidade de se obter 1 chamada em
90 minutos, em um telefone que recebe em
mdia 2 chamadas por hora?
X-nmero de chamadas telefnica por hora
X~P(x,t)
x=1 chamada,
t: 2 chamadas em 60 minutos
t chamadas em 90 minutos
t = 2*90/60 = 3
X~P(1,3)


149361 , 0
1
3 * 049787 , 0
! 1
3 .
) 1 (
1 3
= = = =

e
X P
Distribuies contnuas
Varivel aleatria contnua assume valores reais,
no determinados.

X altura de alunos
X valor de compras de clientes
X tempo de vida de lmpadas
X pesos de componentes eletrnicos

Uma varivel aleatria caracterizada pelo valor
esperado E(X) e varincia V(X), e possui
determinada distribuio de probabilidade. H vrias
distribuies contnuas, vamos abordar a principal
delas, que a Distribuio Normal.
Distribuies Normal
Varivel aleatria contnua, simtrica em torno da
mdia: com alta frequncia em torno da mdia,
com pequena frequncia de valores altos e
com pequena frequncia de valores baixos.








E(X) = ; V(X) = o
2

( )
s s
(
(


= x
x
x f ,
2
exp
2
1
) (
2
2
o

t o
Distribuies Normal
Como possvel observar preciso integrar a funo
f(x) da Distribuio Normal, para poder obter o valor
da probabilidade desejada. E isto bastante difcil. O
que fazer ento? Gauss, que criou a Normal, props a
seguinte Transformao Linear



Essa varivel Z tem distribuio Normal com Mdia 0
e varincia 1. E, na maioria das vezes, -4<z<4, que
um intervalo bastante controlado.
o

=
X
Z
Distribuies Normal
Assim, se X~( ; o ) ento Z~( 0 ; 1 ). H vrias
tabelas Z que permitem calcular probabilidades entre
intervalos de valores de z.

Por exemplo, possvel calcular a probabilidade
P(-1,45 < Z < 2,33), utilizando-se dessas tabelas Z.

Para utilizar essas tabelas Z, preciso inicialmente
realizar a transformao


e utilizar as tabelas Z existentes.






o

=
X
Z
Exemplo
Sabe-se que as notas de Informtica seguem uma
distribuio normal, X~( =6,55; o=2,01). Calcule a
probabilidade de um aluno obter nota entre 5,0 e 7,5.
P(5,0 < X < 7,5)=? Deve-se aplicar a transformao Z.


P [ (5,0-6,55)/2,01 <(X-6,55)/2,01< (7,5-6,55)/2,01 ]
P [ -0,77 <Z< 0,47 ]

Agora s aplicar uma tabela Z.
o

=
X
Z
Anlise de Correlao
Significado

Diagrama de Disperso

Correlao Linear

Grau de explicao
Significado
Relao entre variveis: duas

Existncia de associao entre elas

Quantificao da associao

Predio de uma varivel, em funo
da outra

Grfico dos valores das variveis
Diagrama de disperso
Grfico de pontos, tipo (X, Y)

Varivel independente - X

Varivel dependente - Y




Situaes Possveis









Ausncia associao
linear
Associao linear
positiva
Associao linear
negativa
Correlao Linear
Anlise do relacionamento entre duas
variveis

Sinal do grau de relacionamento linear



Coeficiente de Correlao
Linear
Equao



Onde n a quantidade de pares (X,Y)
Valores do coeficiente: 1 s r s +1





r =
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
n.E(y
2
) - (Ey)
2
r =
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
n.E(y
2
) - (Ey)
2
r =
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
n.E(y
2
) - (Ey)
2
r =
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
n.E(y
2
) - (Ey)
2
r =
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
n.E(y
2
) - (Ey)
2
Valores Anlise
0,00 a 0,19 Correlao bem fraca
0,20 a 0,39 Correlao fraca
0,40 a 0,69 Correlao moderada
0,70 a 0,89 Correlao forte
0,90 a 1,00 Correlao muito forte
Valores possveis
r = 0,4 r = 0,7 r = 1,0
r = -0,3
r = -0,6 r = -0,9
Exemplo
Construa diagrama de disperso e obtenha
Coeficiente de Correlao Linear
Y = valor do faturamento (R$)
X = horas de Programao


DADOS:
MS FATURAMENTO HORAS
1 2001 804
2 2048 829
3 1998 797
4 2030 815
5 1992 805
6 2013 811

Grau de explicao
Variao explicada pela Correlao

Quanto maior a explicao, melhor a
Correlao

a explicao que d qualidade a
Correlao


Quando a explicao baixa, outros
fatores afetam a Correlao

Equao da Explicao
E = r
2
*100
Onde r o Coeficiente de Correlao Linear

Situaes

r = 0,9 => 81% da variao explicada

r = 0,7 => 49% da variao explicada

Exerccios
Obtenha dados reais, de sua rea
funcional, para fazer uma anlise de
Correlao Linear.

Comente os resultados, do ponto de vista
prtico.

Anlise de Regresso
Significado

Modelo de Regresso

Parmetros de Regresso

Erro padro de estimativa
Significado
Descrever funcionalmente a relao entre
X e Y: y = f(x)

Obter uma funo que fornea pequenos
desvios entre valores reais e os por ela
gerados

O grau de explicao, previamente obtido,
precisa ser alto

Aplicao prtica
Predizer o valor de uma varivel, a partir
de um valor de outra varivel

As variveis no precisam ter as mesmas
unidades de medidas

No caso de duas variveis, a funo
afim, y = a + bx.
Quando a funo uma reta

Considere os pares (10, 50) e (14, 40). Qual
reta passa entre eles?









35
40
45
50
55
10 11 12 13 14 15
Equao de uma reta: y = a + bx
35
40
45
50
55
10 11 12 13 14 15
Inclinao da reta: b = (40 50) / (14 - 10) = -2,5

Intercepto: a = 50 (-2,5)*10 = 75

y = 75 -2,5x
Modelo de Regresso
Funo: y = a + bx
Desvio
Viso analtica

Modelo de Regresso
Regresso Linear: y = a + bx

Onde: a o valor do intercepto da reta com o eixo Y;

b o valor da inclinao da reta.

Consideraes Matemticas: para y = a + bx

(i) y = n.a - b x , e

(ii) xy = a x - b x ,

onde n o nmero de pares (X,Y)
Parmetros da Regresso
Finalmente, com o mtodo de desvios mnimos
quadrados, e as duas equaes (i) e (ii), tem-se







a mdia de Y; mdia de X

n nmero de pares (X,Y).
n.E(x.y) - (Ex).(Ey)
n.E(x
2
) - (Ex)
2
b =
X b Y a * =
n
y
Y

=
n
x
X

=
Calculando previses
Pode-se calcular valores
previstos para Y a partir de um
valor de X.

O mesmo vale para valores de X
a partir de valores de Y.

Para isto, basta substituir o valor
conhecido na reta e obter o valor
desejado
Calculando previses
A soma das previses de Y para
cada valor original de X, igual
soma dos valores originais de Y:

y
p
= y

Isto prova a consistncia do
modelo de regresso, caso o
grau de explicao seja aceitvel.

Exemplo
Obtenha a reta de regresso e calcule quantas
horas precisariam ser programadas para
obter-se um faturamento de R$ 1500
Y = valor do faturamento (R$)
X = horas de Programao


DADOS:
MS FATURAMENTO HORAS
1 2001 804
2 2048 829
3 1998 797
4 2030 815
5 1992 805
6 2013 811

Erro padro de estimativa

Como foi verificado h desvios, embora mnimos,
na regresso.

Logo, tambm haver nos valores previstos,
calculados a partir da reta de regresso.

preciso, portanto, quantificar esse erro de
previso.


Erro padro de estimativa
A equao que quantifica o erro padro :



Onde: Y
p
so os valores previstos de Y para cada
valor original de X;

Y so os valores originais da varivel Y;

n o nmero de pares (X,Y).

Cada previso estar sujeita a este erro, para mais
ou para menos.
( )
2
2

=

n
Yp Y
Se
Exerccios
Obtenha dados reais, de sua rea
funcional, para fazer uma anlise de
Regresso Linear.

Comente os resultados, do ponto de vista
prtico.

Transformaes Lineares

Quando a relao entre (X,Y) no linear,
possvel aplicar uma transformao nos valores de
X, de Y, ou de ambos

preciso marcar um diagrama de disperso,
avaliar qual transformao aplicar, aplic-la e
realizar a anlise de regresso

Para realizar alguma previso preciso aplicar o
inverso da transformao, para manter a
consistncia dos valores


Transformaes Lineares

Uma das tranformaes muito aplicadas a funo
LOGARTMICA: y = ax
b


Ou seja, log (y) = log ( ax
b
), mas

log (ax
b
) = log (a) + log (x
b
), e log (x
b
) = b log (x)

Portanto, a funo ser: log (y) = log (a) + b log (x)



Transformaes Lineares

Outras tranformaes aplicadas so:

a funo POTNCIA

e a funo EXPONENCIAL

Os procedimentos so os mesmos da funo
LOGARTMICA: transforma os dados, realiza a
anlise; e inverte a transformao para calcular
previses.

Você também pode gostar