Você está na página 1de 55

26/08/2014

1
Prof. Ceclia Menon
ESTATSTICA APLICADA
2
Tpicos abordados:
Conceitos Fundamentais.
Estatstica Descritiva: Medidas de Tendncias
Central, Disperso e Posio, para dados
agrupados e no agrupados .
Distribuies Discretas de Probabilidades:
Distribuies Binomial e Poisson.
Distribuio Contnua de Probabilidades:
Distribuio Normal.
Estimao: Intervalos de Confiana para Mdia e
Proporo.
Correlao e Regresso Linear Simples.
26/08/2014
2
3
CONCEITOS
FUNDAMENTAIS
4
A ESTATSTICA uma parte da Matemtica Aplicada que fornece
mtodos para coleta, organizao, descrio, anlise e interpretao
de dados e a utilizao dos mesmos na tomada de decises.
Crespo. 2001.
ESTATSTICA uma coleo de mtodos e ferramentas para
planejar experimentos, obter, organizar e resumir dados, analisar e
interpretar estes dados e deles extrair informaes para tomada de
deciso.
A ESTATSTICA compreende trs grandes reas:
1. DESCRITIVA Coleta, descrio e explorao dos dados.
2. PROBABILIDADE Situaes relacionadas ao acaso.
3. INFERNCIA Anlise e interpretao de amostras.
26/08/2014
3
5
DADOS - Classificao
1. Quantitativos - Consistem em nmeros que representam
contagens ou medidas.
Contnuos
Discretos
2. Qualitativos - Distinguem-se por alguma caracterstica no-
numrica.
DADOS x INFORMAES
Informaes so dados tratados estatisticamente.
6
Coleo completa de todos
os elementos a serem
estudados em um sistema
determinado.
Subconjunto de
elementos extrados de
uma populao.
Populao
Amostra
PLANO DE
AMOSTRAGEM
AMOSTRAGEM
Estudo atravs do exame de uma amostra.
POPULAO E AMOSTRA
TCNICAS DE
AMOSTRAGEM
26/08/2014
4
7
Ao analisarmos um conjunto de dados, devemos determinar se
temos uma amostra ou uma populao. Essa determinao
afetar no somente os mtodos utilizados, mas tambm as
concluses, pois se estamos trabalhando com uma amostra os
resultados encontrados so estimativas de uma populao.
Nem sempre possvel compreender o significado contido em uma
amostra por simples inspeo visual dos dados coletados. Entretanto,
entendemos que o sucesso de uma deciso depender da habilidade
em compreender as informaes contidas nesses dados utilizando
processos estatsticos.
Amostra composta por elementos da populao, sendo que estes
elementos so escolhidos com igual possibilidade.
AMOSTRA ALEATRIA
8
AMOSTRAGEM PROBABILSTICA uma amostragem onde
se conhece a probabilidade de todas as combinaes
amostrais possveis, podendo-se determinar a variabilidade
amostral. Nestas condies, a amostragem objetiva,
podendo-se obter uma estimativa do erro amostral.
VARIABILIDADE AMOSTRAL a tendncia da estatstica
amostral variar em relao ao verdadeiro valor do parmetro.
A variabilidade amostral diminui com o aumento da amostra.
INFERNCIA ESTATSTICA a formulao de julgamento
sobre a populao, aps examinar uma amostra.
26/08/2014
5
9
T

C
N
I
C
A
S

D
E
A
M
O
S
T
R
A
G
E
M
Amostragem aleatria simples
Com ou sem reposio
Amostragem estratificada
Amostragem sistemtica
Amostragem por agrupamentos (ou conglomerado)
Amostragem intencional
Amostragem por cotas
Pode-se fazer
INFERNCIA
Inferncia ?
COMPOSIO DA AMOSTRA
MTODOS PROBABILSTICOS MTODOS NO PROBABILSTICOS
INFERNCIAS OU INDUES
SOBRE A POPULAO
MTODOS
PROBABILSTICOS
MTODOS
NO PROBABILSTICOS
AMOSTRAGEM
10
TCNICAS DE AMOSTRAGEM
457-6754
543-8976
343-9870
542-6439
764-6523
765-985
432-1211
457-6754
543-8976
543-7654
543-8788
976-0000
933-2222
121-4537
Amostragem Aleatria Amostragem Aleatria
Cada elemento da populao tem a mesma
chance de ser escolhido. Em geral utilizam-
se computadores para gerar nmeros de
telefone aleatrio.
Amostragem Estratificada Amostragem Estratificada
Classificar a populao em, ao menos,
dois estratos e extrair uma amostra de
cada um.
26/08/2014
6
11
Amostragem Sistemtica Amostragem Sistemtica
Escolher cada elemento de ordem K.
Amostragem por agrupamento Amostragem por agrupamento
Dividir em sees a rea populacional, selecionar
aleatoriamente algumas dessas sees e tomar
todos os elementos das mesmas.
TCNICAS DE AMOSTRAGEM
12
ERRO AMOSTRAL
a diferena entre o resultado obtido de uma amostra e o resultado de uma
populacional. Resulta de flutuaes amostrais aleatrias.
Ocorre quando os dados amostrais so coletados ou analisados
incorretamente, devido a escolha de amostras no-aleatrias, tendenciosas,
uso de instrumentos defeituosos, etc.
Ocorre quando os efeitos de variveis no consideradas interferem nas
variveis consideradas.
CONFUNDIMENTO
ERRO NO-AMOSTRAL
Dados coletados de forma descuidada podem ser to inteis que
nenhum processo estatstico consegue salv-los.
26/08/2014
7
13
PARMETRO E ESTATSTICA
Parmetro
Medida numrica que descreve uma caracterstica
de uma populao.
Estatstica
Medida numrica que descreve uma caracterstica
de uma amostra.
FERRAMENTAS
ESTATSTICAS
PARMETRO
(POPULAO)
ESTATSTICA
(AMOSTRA)
MDIA x
PROPORO p p
DESVIO-PADRO s
N ELEMENTOS N n
14
MEDIDAS
DE
TENDNCIA CENTRAL
DADOS NO
AGRUPADOS
26/08/2014
8
15
Mdia Aritmtica.
Mdia Ponderada.
Mediana.
Moda.
Ponto Mdio.
MEDIDAS DE TENDNCIA CENTRAL
So utilizadas quando se deseja obter um valor de referncia.
Temos as seguintes ferramentas:
16
MDIA ARITMTICA
A Mdia Aritmtica de um conjunto de dados o valor obtido
somando todos os valores deste conjunto e dividindo-os pela
quantidade total de valores.
N tamanho da populao
n tamanho da amostra
x
j
valor observado
Amostra Populao
n
x
x
i

=
N
x
i

=
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
9
17
MDIA PONDERADA
A Mdia Ponderada de um conjunto de dados o valor obtido
somando o produto de todos os valores deste conjunto pelos
seus respectivos pesos e dividindo-os pelo somatrio destes
pesos.
f
i
peso ou freqncia
n tamanho da amostra
x
j
valor observado
N tamanho da populao
Amostra Populao
( )
n
f x
MP
i j
.
=
( )
N
f x
MP
i j
.
=
MEDIDAS DE TENDNCIA CENTRAL
18
MEDIANA (Md)
A Mediana de um conjunto de dados o valor do meio desse
conjunto, quando estes valores esto dispostos em ordem
crescente ou decrescente. Ou seja, divide o conjunto em duas
partes iguais.
Em resumo:
Nmero valores do conjunto MPAR valor do meio.
Nmero valores do conjunto PAR mdia dos dois valores do meio.
Md (X) =
n + 1
2
( )
x
n
2
)
x
n + 1
2
( )
x
(
+
se n mpar
se n par
sendo n o tamanho da amostra
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
10
19
MODA (Mo)
A Moda de um conjunto de dados o valor que ocorre com
maior freqncia.
Conjunto Modal apenas uma moda.
Conjunto Bimodalquando dois valores ocorrem com maior
freqncia.
Conjunto Multimodal quando mais de dois valores ocorrem com maior
freqncia.
Conjunto Amodal quando no existir moda.
A moda tem um papel destacado nos estudos onde os
dados so nominais.
MEDIDAS DE TENDNCIA CENTRAL
20
PONTO MDIO
Ponto Mdio o valor que est a meio caminho entre o maior
valor e o menor valor.
PM =
Maior valor + Menor valor
2
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
11
21
MEDIDAS
DE
DISPERSO
DADOS NO
AGRUPADOS
22
So utilizadas para avaliar o grau de variabilidade dos valores
em torno de uma medida de referncia.
Temos as seguintes ferramentas:
Amplitude.
Desvio Mdio Absoluto.
Desvio-padro.
Varincia.
MEDIDAS DE DISPERSO
26/08/2014
12
23
DESVIO MDIO ABSOLUTO (DMA)
a mdia do somatrio, em mdulo, dos desvios dos valores a
contar de uma medida de referncia, a mdia, em um conjunto
de dados.
Amostra Populao
| |
n
x x
DMA
i

=
| |
N
x
DMA
i

=
mdia populacional
x mdia amostral
n tamanho da amostra
x
i
valor observado
N tamanho da populao
MEDIDAS DE DISPERSO
24
AMOSTRA POPULAO
( )
2

=

N
x

i
( )
1
2

=

n
x x
S
i


DESVIO-PADRO
Determina a variabilidade dos valores em relao a uma medida
de referncia, a mdia, e calculado por meio da raiz quadrada
da varincia. a medida mais usada na comparao da
disperso entre conjuntos de dados.
MEDIDAS DE DISPERSO
26/08/2014
13
25
VARINCIA
Medida que relaciona a soma dos quadrados de todos os
desvios dos valores a contar de uma medida de referncia, a
mdia, em um conjunto de dados, em funo da quantidade de
observaes avaliadas.
AMOSTRA
( )
1
2
2

n
x x
S
i
POPULAO
( )
2
2

=

N
x

i
MEDIDAS DE DISPERSO
26
MEDIDAS
DE
POSIO
DADOS NO
AGRUPADOS
26/08/2014
14
27
Escore.
Percentil.
Decil.
Quartil.
MEDIDAS DE POSIO
Possibilita localizar o ponto (ou intervalo) de maior
concentrao de valores de uma distribuio de dados. Muito
utilizada para comparar conjunto de dados diferentes.
Temos as seguintes ferramentas:
28
ESCORES Z
Compara valores atravs de sua padronizao.
O escore padronizado o nmero de desvios-padro pelo qual
um valor x dista da mdia (para mais ou para menos).
Amostra
s
z =
x - x
Populao

Z =
x -
mdia populacional
x mdia amostral
S desvio-padro amostral
desvio-padro populacional
MEDIDAS DE POSIO
26/08/2014
15
29
PERCENTIL (Pi) dados no tabelados
Divide as observaes, dispostas em ordem crescente, em
cempartes iguais.
1% 1% 1% 1% 1% 1% 1% 1% 1%
P1 P2 P3 P4 P97 P98 P99
Percentil x =
N valores inferiores a x
N total de valores
100
L =
K
100
n
Onde: L indicador da posio do valor
n n de valores do conjunto de dados
K percentil a ser definido
MEDIDAS DE POSIO
30
DECIL (Di) dados no tabelados
Divide as observaes, dispostas em ordem crescente, em
dezpartes iguais.
10% 10% 10% 10% 10% 10% 10% 10% 10% 10%
D
1
D2 D
3 D4
D
5
D6 D
7 D
8
D
9
O Decil pode ser determinado utilizando o percentil, fazendo-se a relao
de proporcionalidade.
MEDIDAS DE POSIO
26/08/2014
16
31
QUARTIL (Qi) dados no tabelados
Divide as observaes, dispostas em ordem crescente, em
quatro partes iguais.
Q3 Q2 Q1
MEDIANA
25%
25%
50% 50%
75%
75%
O Quartil pode ser determinado utilizando o percentil, fazendo-se a relao
de proporcionalidade.
MEDIDAS DE POSIO
32
MEDIDAS DESCRITIVAS - Exemplo
Para resumir o exposto sobre medidas descritivas para dados no-agrupados,
suponhamos que os dados (amostra) abaixo, em minutos, representem o
tempo de espera para atendimento de clientes de um Call Center, coletados
aleatoriamente:
5,0 3,0 2,0 4,0 5,0 3,0 2,5 4,0 4,5 3,0 2,0
Uma anlise descritiva deve contemplar ferramentas de tendncia central,
disperso e posio.
Para este estudo, necessrio colocar os valores em ordem crescente:
2,0 2,0 2,5 3,0 3,0 3,0 4,0 4,0 4,5 5,0 5,0
Extremo
inferior
Moda. Valor que
mais se repete
Mediana. Valor
localizado
fisicamente no
meio.
Extremo
superior.
26/08/2014
17
33
2,0 2,0 2,5 3,0 3,0 3,0 4,0 4,0 4,5 5,0 5,0
Extremo
inferior
Moda. Valor que
mais se repete
Mediana. Valor
localizado
fisicamente no
meio.
Extremo
superior.
n
x
x
i

=
= (38,0 / 11) = 3,45 minutos
Quantidade de
valores
( )
1
2

=

n
x x
S
i

= (12,2/11-1)
1/2
= 1,11 segundos
Mdia:
Desvio-padro:
MEDIDAS DESCRITIVAS - Exemplo
34
DISTRIBUIO DE FREQUNCIA
um agrupamento de dados em classe, exibindo o nmero ou
porcentagem de observaes das mesmas. Pode ser
apresentada na forma tabular ou grfica.
Elementos de uma distribuio de freqncia:
Amplitude Total.
Nmero de Classes.
Amplitude de Classe.
Ponto Mdio da Classe.
Limites superior e inferior de classe.
26/08/2014
18
35
Em uma amostra com 30 funcionrios de uma empresa, foi avaliado o
tempo de concluso, em segundos, de uma tarefa especfica. Estes tempos
foram coletados aleatoriamente e anotados na tabela abaixo.
30,0
30
26,5 29 34,1 28
32,1 27 38,6 26 33,5 25
20,0 24 28,5 23 35,0 22
15,0 21 28,0
20
29,8 19
24,2 18 25,0 17 27,1 16
38,1 15 32,9
14
31,4 13
17,3 12 17,7 11 26,0 10
35,2 9 28,8 8 43,0 7
24,3 6 20,0 5 33,6 4
40,3 3 30,0 2 20,0 1
OBS. OBS. TEMPO
CONCLUSO
OBS. TEMPO
CONCLUSO
TEMPO
CONCLUSO
DISTRIBUIO DE FREQUNCIA
36
TABELA DE FREQNCIAABSOLUTA
TEMPO FREQNCIA ABSOLUTA
15 a < 20 3
20 a < 25 5
25 a < 30 8
30 a < 35 8
35 a menor que 40 4
40 45 2

DISTRIBUIO DE FREQUNCIA
26/08/2014
19
37
TABELA DE FREQNCIA RELATIVA
Freqncia Relativa = Freqncia de Classe
Freqncia Total
TEMPO FREQNCIA RELATIVA
15 a < 20 0,100
20 a < 25 0,167
25 a < 30 0,267
30 a < 35 0,267
35 a menor que 40 0,133
40 45 0,067

DISTRIBUIO DE FREQUNCIA
38
TABELA DE FREQUNCIAACUMULADA
a soma das freqncias daquela classe e de todas as classes
que a antecedem.
TEMPO FREQNCIA ACUMULADA
< 20 3
Menor que 25 8
Menor que 30 16
Menos de 35 24
Menos de 40 28
Menos de 45 30
DISTRIBUIO DE FREQUNCIA
26/08/2014
20
39
HISTOGRAMA DE FREQUNCIA
Consiste em um grfico com uma escala horizontal para os
valores (dados) a serem representados em classes, e uma
escala vertical para as freqncias e barras representativas
destas freqncias.
Os Histogramas de freqncia podem ser:
Freqncia absoluta;
Freqncia Relativa;
Freqncia acumulada.
DISTRIBUIO DE FREQUNCIA
40
HISTOGRAMA DE FREQNCIA ABSOLUTA
5
10
15
F
R
E
Q
U

N
C
I
A

A
B
S
O
L
U
T
A
15 20 25 30 35 40 45
CLASSES (TEMPO)
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
Histograma
0
2
4
6
8
10
19,999 24,999 29,999 34,999 39,999 Mais
Tempo (min.) de concluso da tarefa
F
r
e
q

n
c
i
a

A
b
s
o
l
u
t
a
No Excel:
Curva de freqncia absoluta
DISTRIBUIO DE FREQUNCIA
26/08/2014
21
41
HISTOGRAMA DE FREQNCIA RELATIVA
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
U

N
C
I
A

R
E
L
A
T
I
V
A
15 20 25 30 35 40 45
CLASSES (TEMPO)
0,30
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
Curva de freqncia relativa
DISTRIBUIO DE FREQUNCIA
42
HISTOGRAMA DE FREQNCIA ACUMULADA
10
20
30
F
R
E
Q
U

N
C
I
A

A
C
U
M
U
L
A
D
A
15 20 25 30 35 40 45
CLASSES (TEMPO)
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
Curva de freqncia acumulada
DISTRIBUIO DE FREQUNCIA
26/08/2014
22
43
MEDIDAS
DE
TENDNCIA CENTRAL
DADOS
AGRUPADOS
44
Mdia Ponderada.
Mediana.
Moda.
MEDIDAS DE TENDNCIA CENTRAL
So utilizadas quando se deseja obter um valor de referncia.
Temos as seguintes ferramentas:
26/08/2014
23
45
MDIA PONDERADA
A Mdia Ponderada de um conjunto de dados o valor obtido
somando-se o produto de todos os valores deste conjunto
(ponto mdia de classe) pelos seus respectivos pesos
(freqncia absoluta) e dividindo-os pela quantidade total de
valores.
Amostra Populao
( )
N
f x

i j
.
=
( )
n
f x
x
i j
.
=
f
i
freqncia absoluta
n tamanho da amostra
x
j
valor observado
N tamanho da populao
MEDIDAS DE TENDNCIA CENTRAL
46
( )
n
f x
x
i j
.
=
=
880,0
30
=
29,33 segundos
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
MDIA PONDERADA
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
24
47
MEDIANA (Md)
Localizada a classe mediana, calculamos o valor da mediana
utilizando o histograma de freqncia relativa e argumentos
geomtricos:
Classe Mediana: Classe que contempla o valor relativo de 50%, a contar da
esquerda para a direita.
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27% 27%
13%
7%
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
MEDIDAS DE TENDNCIA CENTRAL
48
MEDIANA (Md)
A Classe Mediana do histograma acima a 25 a 30 (terceira classe), pois
somando-se as classes da esquerda para a direita, temos na terceira classe o valor
relativo de 54%. Para encontrar a mediana, precisamos encontrar, no eixo das
classes, o valor na classe mediana que somado s classes anteriores corresponde
exatamente ao valor relativo de 50%.
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27% 27%
13%
7%
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
25
49
MEDIANA (Md)
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27% 27%
13%
7%
30 - 25
27 %
Md - 25
23 %
=
10% + 17% + 23% = 50%
Md
23% Classe
mediana
Md = 29,3 segundos
MEDIDAS DE TENDNCIA CENTRAL
50
MODA (Mo)
A Moda de um conjunto de dados agrupados o ponto mdio
da classe de maior freqncia (classe modal).
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27%
27%
13%
7%
Classes de maior freqncia:
25 a < 30 PM = 27,5
30 a < 35 PM = 32,5
Mo = (27,5 + 32,5)/2 Mo = 30,0 seg.
Exemplo do teste para o tempo de concluso de uma tarefa
(slide 40).
MEDIDAS DE TENDNCIA CENTRAL
26/08/2014
26
51
MEDIDAS
DE
DISPERSO
DADOS
AGRUPADOS
52
So utilizadas para avaliar o grau de variabilidade dos valores
em torno de uma medida de referncia.
Temos as seguintes ferramentas:
Desvio-padro.
Varincia.
MEDIDAS DE DISPERSO
26/08/2014
27
53
AMOSTRA POPULAO
( ) [ ]
.
2

=

N
x f
i i ( ) [ ]
1
.
2

=

n
x x f
S
i i


DESVIO-PADRO
Determina a variabilidade dos valores em relao a uma medida de
referncia, a mdia ponderada, e calculado por meio da raiz
quadrada da varincia. a medida mais usada na comparao da
disperso entre conjuntos de dados.
MEDIDAS DE DISPERSO
54
VARINCIA
Medida que relaciona a soma dos quadrados de todos os
desvios dos valores (ponto mdio de classe) a contar de uma
medida de referncia, a mdia ponderada, em um conjunto de
dados, em funo da freqncia absoluta de cada classe e da
quantidade de observaes avaliadas.
AMOSTRA POPULAO
( ) [ ]
.
2
2

=

N
x f
i i ( ) [ ]
1
.
2
2

n
x x f
S
i i


MEDIDAS DE DISPERSO
26/08/2014
28
55
DESVIO-PADRO
( ) [ ]
1
.
2

=

n
x x f
S
i i

=
30
1374,2

= 6,88 segundos
Exemplo do teste para o tempo de concluso de uma tarefa (slide 40).
Mdia = 29,33 segundos
MEDIDAS DE DISPERSO
56
MEDIDAS
DE
POSIO
DADOS
AGRUPADOS
26/08/2014
29
57
Percentil.
Decil.
Quartil.
Assimetria.
MEDIDAS DE POSIO
Possibilita localizar o ponto (ou intervalo) de maior
concentrao de valores de uma distribuio. Muito utilizada
para comparar conjunto de dados diferentes.
Temos as seguintes ferramentas:
58
Percentil (Pi)
Localizada a classe percentil, calculamos o valor do percentil
utilizando o histograma de freqncia relativa e argumentos
geomtricos.
Classe Percentil: Classe que contempla o valor relativo do percentil, variando
de 1% em 1%, a contar da esquerda para a direita.
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27%
27%
13%
7%
Exemplo do teste para o tempo de concluso de uma tarefa
(slide 40).
MEDIDAS DE POSIO
26/08/2014
30
59
Percentil (Pi)
Como exemplo, para o clculo do Percentil 25 (25%), a Classe Percentil do
histograma acima a 20 a 25 (segunda classe), pois somando-se as classes da
esquerda para a direita, temos na segunda classe o valor relativo de 27%. Para
encontrar o P25, precisamos encontrar, no eixo das classes, o valor na classe
percentil que somado s classes anteriores corresponde exatamente ao valor relativo
de 25%.
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27% 27%
13%
7%
MEDIDAS DE POSIO
60
Percentil (Pi)
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
10%
17%
27% 27%
13%
7%
25 - 20
17 %
P25 - 20
15 %
=
10% + 15% = 25%
P25
15%
Classe
percentil
P25 = 24,41 segundos
MEDIDAS DE POSIO
26/08/2014
31
61
Decil (Di)
Localizada a classe decil, calculamos o valor do decil utilizando
o histograma de freqncia relativa e argumentos geomtricos,
como demonstrado no clculo do percentil, para a proporo do
decil, fazendo relao ao percentil equivalente.
Classe Decil: Classe que contempla o valor relativo do decil, variando de 10%
em 10%, a contar da esquerda para a direita.
MEDIDAS DE POSIO
62
Quartil(Qi)
Localizada a classe quartil, calculamos o valor do quartil
utilizando o histograma de freqncia relativa e argumentos
geomtricos, como demonstrado no clculo do percentil, para a
proporo do quartil, fazendo relao ao percentil equivalente.
Classe Quartil: Classe que contempla o valor relativo do quartil, variando de
25% em 25%, a contar da esquerda para a direita.
MEDIDAS DE POSIO
26/08/2014
32
63
Denomina-se assimetria o grau de afastamento de uma
distribuio de freqncia da unidade de simetria.
Md Mo x = =
Simtrica
Em uma distribuio simtrica, tem-se igualdade dos valores da
mdia, mediana e moda.
ASSIMETRIA
As medidas de Posio referem-se forma da curva de uma
distribuio de freqncia, mais especificamente da curva de
freqncia do histograma.
64
Assimetria direita (ou positiva)
x Md Mo < <
x
Md Mo
Assimetria esquerda (ou negativa)
Mo Md x < <
Mo Md x
ASSIMETRIA
26/08/2014
33
65
Para medir a assimetria utiliza-se os seguintes coeficientes:
1 Coeficiente de Pearson
S
Mo x
AS

=
2 Coeficiente de Pearson
1 3
3 1
2
Q Q
Md Q Q
AS

+
=
AS = 0, diz-se que a distribuio simtrica
AS > 0, diz-se que a distribuio assimtrica positiva ( direita)
AS < 0, diz-se que a distribuio assimtrica negativa ( esquerda)
(n-1).(n-2)
x
i
- x
s

n
( )
3
AS =
No excel:
ASSIMETRIA
66
1 3
3 1
2
Q Q
Md Q Q
AS

+
=
24,4 + 33,9 -2 . 29,3
33,9 24,4
= = - 0,03 ligeiramente
assimtrica esquerda
Exemplo do teste para o tempo de concluso de uma tarefa
(slide 40).
0,05
0,10
0,20
0,15
0,25
F
R
E
Q
.

R
E
L
.
15 20 25 30 35 40 45
TEMPO (segundos)
0,30
ASSIMETRIA
26/08/2014
34
67
X
i
q
1
q
2
q
3
x
(n)
Md
q
2
x
i
x
(n)
q
2
q
2
q
1
q
3
q
2
q
1
x
i
x
(n)
q
3
Md q
1
q
3
- Md
Condies para simetria:
ASSIMETRIA
68
PROBABILIDADE
26/08/2014
35
69
VARIVEL
Uma caracterstica que pode ser observada (ou mensurada) nos elementos
da populao ou amostra, devendo ter um e apenas um resultado para
cada observao.
VARIVEL ALEATRIA
Varivel com valores numricos, cujo valor determinado ao
acaso. Pode ser discreta ou contnua.
1. Quantitativa
Contnua
Discreta
2. Qualitativa
70
EVENTO
um resultado possvel de um experimento. Qualquer
situao que nos interessa.
PROBABILIDADES
O resultado 6 no lanamento de um dado.
As probabilidades so utilizadas para exprimir a
possibilidadede ocorrncia de um determinado evento.
Um EVENTO SIMPLES um resultado que no comporta mais
nenhuma decomposio.
No lanamento de dois dados, o evento 6, que no um evento
simples, pode ser decompostos nos eventos simples 3-3, 4-2 e 5-1.
26/08/2014
36
71
Espao Amostral o conjunto de todos os resultados possveis
de um experimento.
No arremesso de um dado, o espao amostral consiste nos
eventos 1, 2, 3, 4, 5, e 6.
No lanamento de uma moeda, o espao amostral consiste
nos eventos cara e coroa.
ESPAO AMOSTRAL
Se a ocorrncia ou no-ocorrncia de um no influencia a
ocorrncia do(s) outro(s).
EVENTOS INDEPENDENTES
Lanamento de dois dados ou mais dados, moedas etc.
72
EVENTOS MUTUAMENTE EXCLUDENTES
No possuem elementos em comum ou no podem ocorrer
simultaneamente.
As faces de um dado, os lados de uma moeda.
O complemento de um evento A, denotado por A (A), consiste
em todos os resultados em que o evento A no ocorre.
No lanamento de uma moeda, o complemento do evento
cara o evento coroa.
COMPLEMENTO DE UM EVENTO
26/08/2014
37
73
CLCULO DAS PROBABILIDADE
MTODO CLSSICO
MTODO SUBJETIVO
MTODO DA FREQUNCIA RELATIVA (EMPRICO)
N DE MANEIRAS COMO A PODE OCORRER
N TOTAL DE RESULTADOS POSSVEIS
P (A) =
N DE OCORRNCIAS DE A
N TOTAL DE REPETIES DO EXPERIMENTO
P (A) =
AVALIAO PESSOAL DO GRAU DE VIABILIDADE DE UM EVENTO.
74
A probabilidade de no-ocorrncia de um evento A:
1,00 - P(A) = P(A)
A probabilidade de qualquer evento A ocorrer:
P(qualquer evento A) = P(A)
0,00 P(A) 1,00
26/08/2014
38
75
DISTRIBUIES
DE
PROBABILIDADE
DISCRETA
76
DISTRIBUIES DE PROBABILIDADE
Uma Distribuio de Probabilidades uma distribuio de
freqncias relativas para os resultados de um espao
amostral. Mostra a proporo das vezes em que a varivel
aleatria tende a assumir cada um dos diversos resultados.
Condies para uma distribuio de probabilidades:
P(x) = 1, onde x toma todos valores possveis.
0 P(x) 1, para todo x.
1 2
1/10
P(x)
5 3 4 6
F
r
e
q

n
c
i
a

R
e
l
a
t
i
v
a
5/10
v. a. d.
26/08/2014
39
77
DISTRIBUIO BINOMIAL
Um experimento binomial um experimento que satisfaz as
seguintes condies:
O experimento deve comportar um nmero fixo de provas n;
As provas devem ser aleatrias e independentes
(amostragem com reposio);
Cada prova deve ter todos os resultados classificados em
duas categorias, SIM (sucesso) e NO (falha), que so
excludentes;
As probabilidades devem permanecer constantes para cada
prova.
Obs.: As condies acima descrevem um processo de amostragem
conhecido como processo de Bernoulli.
78
P(x) = .p
x
.(1 p)
(n-x)
n
x
n nmero de provas;
x nmero de SIM;
p probabilidade de Sim para cada prova;
q = (1 p) probabilidade de NO para cada prova.
Onde:
n
x
n!
x!(n x)!
=
Mdia = Valor Esperado = E(x) = n.p
Desvio-padro = (n.p.(1-p))
(1/2)
DISTRIBUIO BINOMIAL
26/08/2014
40
79
Um levantamento realizado na regio sudeste mostra que 3% dos telefones
celulares vendidos pela empresa Z&B apresentam algum tipo de defeito. Com base
nesta informao, caso a empresa Z&B venda em um dia qualquer 20 destes
telefones, qual a probabilidade de ter exatamente 1 telefone com defeito?
P(x) = .p
x
.(1 p)
(n-x)
n
x
p(sim) = 0,03 (prob. de defeito)
n = 20 celulares
x = 1 (exatamente 1 defeito)
P(1) = .0,03
1
.[1 0,03]
(20-1)
20
1
P(1) = 20 . 0,03
1
. [0,97]
(19)
P(1) = 0,3364 ou 33, 64%
A probabilidade, em uma amostra
com 20 celulares, sendo a
probabilidade individual de defeito
igual 0,03, de ter exatamente 1
celular com defeito, de 33,64%.
DISTRIBUIO BINOMIAL Exemplo
80
DISTRIBUIO DE POISSON
uma distribuio aplicvel a ocorrncias de um evento em um
intervalo especificado. A varivel aleatria x o nmero de
ocorrncia do evento em um intervalo que pode ser de tempo,
distncia, rea, volume, ou outra unidade anloga.
A distribuio de Poisson pressupe:
A varivel aleatria x seja o nmero de ocorrncia de um
evento em um intervalo;
As ocorrncias sejam aleatrias e independentes;
As ocorrncias sejam distribudas uniformemente sobre o
intervalo considerado.
26/08/2014
41
81
P(x) =
x nmero de ocorrncias dentro de um intervalo especificado
(anlise estacionria);
nmero mdio de ocorrncia no intervalo considerado.
taxa mdia (valor por unidade) x nmero de unidades.
Onde:
Mdia = Valor Esperado = E(x) =
Desvio-padro = ()
1/2
[e
-
.()
x
]
x!
DISTRIBUIO DE POISSON
82
O Call-Center de uma empresa recebe, em mdia, 5 ligaes por minuto.
Considerando as ligaes independentes e aleatrias, qual a
probabilidade de que sejam recebidas exatamente 10 ligaes em um
perodo de 2 minutos?
P(x) =
[e
-
.()
x
]
x!
X = 10 (nmero de ligaes no intervalo de 2 min.)
= 5 ligaes / min . 2 min = 10
P(10) =
[e
-10
.(10)
10
]
10!
P(10) = 0,1251 0u 12,51%
A probabilidade de receber
exatamente 10 ligaes em um
perodo de 2 minutos, sendo que a
mdia de ligaes por minuto de 5
ligaes, de 12,51%.
DISTRIBUIO DE POISSON - Exemplo
26/08/2014
42
83
DISTRIBUIES
DE
PROBABILIDADE
CONTNUA
84
DISTRIBUIO CONTNUA - tempo de atendimento.
1
2 3
0,2
P(x)
Minutos 5
O tempo de atendimento varia entre 0 e 5 minutos, conforme distribuio
uniforme acima. Qual a probabilidade deste atendimento variar de 1 a 3
minutos?
P(1< X <3) = 2 x 0,2 = 0,4 40%
Condies para uma distribuio de probabilidades:
P(x) = 1, onde x toma todos valores possveis.
0 P(x) 1, para todo x.
26/08/2014
43
85
DISTRIBUIO NORMAL
Uma varivel aleatria contnua tem distribuio normal se
essa distribuio simtrica e apresenta a forma de um sino
abaixo.
+ +2 +3 -3 -2 -
68%
95,5%
99,7%

P(X) =
1
(2)
1/2
- [(X - )
2
/ 2
2
]
86
A distribuio Normal pressupe:
Completamente especificada pela mdia e desvio-padro;
Diferentes combinaes de mdia e desvio-padro originam
curvas distintas;
A rea total sob qualquer curva representa 100% da
probabilidade da varivel;
A curva simtrica em relao mdia e prolonga-se para ;
A probabilidade de predizer um valor especfico zero;
A probabilidade de uma varivel aleatria tomar um valor entre
dois pontos quaisquer igual a rea sob a curva entre estes
pontos.
DISTRIBUIO NORMAL
26/08/2014
44
87
uma distribuio normal de probabilidades que tem mdia 0
(zero) e desvio-padro igual a 1.
Onde:
Z varivel normal padronizada;
x varivel normal.
Z (escore) =
(x mdia)
Desvio-padro
DISTRIBUIO NORMAL PADRONIZADA
88

100 80 70 90 110 120 130


0 +1 +2
+3
-1 -2 -3
Escala
efetiva
Escala
padronizada
= 100 minutos de durao
= 10 minutos de durao (variabilidade)
Z =
(x )

DISTRIBUIO NORMAL PADRONIZADA Exemplo


26/08/2014
45
89
Uma determinada bateria de celular, quando utilizada em condies
normais, apresenta uma vida til mdia de 30.000 horas de durao com
desvio-padro de 500 horas. Supondo que a vida til desta bateria seja
representada por uma distribuio normal, qual a probabilidade de uma
bateria (escolhida ao acaso) apresentar vida til inferior a 28.500 horas?
= 30.000 h.
= 500 h.
Z =
(28.500 30.000)
500
P(x< 28.500) = -3,00
Pela tabela normal, para z = -3,00,
temos p = 0,4987.
P(x< 28.500) = 0,5 0,4987 =
= 0,0013
30.000 28.500
0
3,00
x
z
P= 0,0013
A probabilidade da vida til
de uma bateria, com mdia
de 30.000 horas e desvio-
padro de 500 horas, ser
inferior a 28.500 horas,
de 13%
DISTRIBUIO NORMAL PADRONIZADA Exemplo
ESTIMAO
DE
PARMETROS
90
26/08/2014
46
ESTIMAO
o processo que consiste em utilizar dados amostrais para
ESTIMAR parmetros populacionais desconhecidos.
AMOSTRA
DADOS
OBSERVADOS
POPULAO
UNIVERSO DE
ESTUDO
PARMETRO
(POPULAO)
ESTATSTICA
(AMOSTRA)
MDIA
x
PROPORO
p p
DESVIO-PADRO
s
N ELEMENTOS
N n
91
Estimativa pontual um valor (ou ponto) nico utilizado
para aproximar um parmetro
populacional.
x
p p
S
Estimativa intervalar um intervalo (ou amplitude) de
valores (intervalo de confiana), que
tem probabilidade de conter o
verdadeiro valor da populao.
ESTIMAO
92
26/08/2014
47
ESTIMAO DA MDIA
= x z (/n
1/2
) Intervalo de confiana
Para:
n 30
conhecido
Obs.1: Se for desconhecido (conhece-se S da amostra) e n 30,
substitumos por S na frmula acima e, considerando que a distribuio da
populao normal, utilizar a distribuio normal para calcular o intervalo de
confiana.
e = z (/n
1/2
) Margem de erro
n = [z(/e)]
2
Tamanho da amostra
DISTRIBUIO
NORMAL
ESTIMAO
93
Para:
n < 30
desconhecido
= x t (s/n
1/2
) Intervalo de confiana
(n 1) grau de liberdade (GL)
DISTRIBUIO
t STUDENT
ESTIMAO DA MDIA
ESTIMAO
94
Obs.1: Se n< 30 e conhecido, por garantia, tambm utilizar a distribuio
t de student.
26/08/2014
48
Se o tamanho da amostra maior que 5% da populao, ou
seja, n > 0,05N, utilizar o fator de correo:
= x z (/n
1/2
).[(N-n) /(N-1)]
1/2
= x t (s/n
1/2
).[(N-n) /(N-1)]
1/2
NC = 95%
Z = 0
-Z = -1,96
Z = 1,96
0,4750 0,4750
/2 = 0,025
/2 = 0,025
ESTIMAO DA MDIA
ESTIMAO
95
p = p z [p.(1-p)/n]
1/2
Intervalo de confiana
e = z [p.(1-p)/n]
1/2
Margem de erro
n = [(z
2
)p.(1-p)]/e
2
Tamanho da amostra
Se o tamanho da amostra maior que 5% da populao,
n>0,05N, utilizar o fator de correo:
p = p z [p(1-p)/n]
1/2
.[(N-n) /(N-1)]
1/2
ESTIMAO DA PROPORO
ESTIMAO
96
26/08/2014
49
97
CORRELAO E
REGRESSO LINEAR
SIMPLES
98
Determina a fora do relacionamento entre duas variveis
emparelhadas, indicando at que ponto os valores de
uma varivel esto relacionados com o da outra.
Coeficiente de correlao linear r mede o grau de
relacionamento linear entre valores emparelhados x e y em uma
amostra.
[nxy (x).(y)]
r =
{[n(x
2
) (x)
2
]
1/2
. [n(y
2
) (y)
2
]
1/2
}
O coeficiente r varia de -1 r 1, onde:
Valores prximos de 1 ou -1 indicam forte correlao;
Valores prximos de 0 indicam maior disperso.
CORRELAO
26/08/2014
50
99
Coeficiente de correlao linear r pressupe:
A amostra dos dados emparelhados x e y so aleatrios;
Os pares dos dados x e y tm uma distribuio normal
bivariada.
Forte
correlao
Positiva
r 0,9
Correlao
Positiva
perfeita
r 1
CORRELAO
100
Correlao
negativa
perfeita
r -1
Forte
correlao
negativa
r -0,8
Pouca
correlao
positiva
r 0,2
CORRELAO
26/08/2014
51
101
Pouca
correlao
negativa
r -0,2
Correlao no-linear
CORRELAO
102
A Regresso compreende a anlise de dados amostrais
para saber como duas ou mais variveis esto
relacionadas entre si, fornecendo uma equao que
descreve o relacionamento em termos matemticos.
A Regresso Linear descreve a relao linear entre duas ou
mais variveis determinando uma equao de reta.
A finalidade de uma equao de regresso controlar, estimar,
explicar ou predizer valores futuros das variveis, com base em
valores conhecidos.
REGRESSO
26/08/2014
52
103
REGRESSO LINEAR SIMPLES 1 VARIVEL EXPLICATIVA
REGRESSO LINEAR MLTIPLA MAIS DE 1 VARIVEL EXPLICATIVA
EQUAO DE REGRESSO
y = b
0
+ b
1
x
y varivel explicada, dependente ou resposta.
x varivel explicativa, independente ou preditora.
y = b
0
+ b
1
x
1
+ b
2
x
2
+ .... + b
n
x
n
y varivel explicada, dependente ou resposta.
x varivel explicativa, independente ou preditora.
REGRESSO
104
O Mtodo dos Mnimos Quadrados (MMQ) usado para ajustar
uma linha reta a um conjunto de pontos. O MMQ pressupe:
A soma dos desvios verticais em relao reta zero;
A soma dos quadrados destes desvios mnima.
Determinao da Equao de Regresso Linear Simples
y = b
0
+ b
1
x b
1
coeficiente angular
b
0
intercepto y ( quando x = 0)
[n(xy) (x).(y)]
[n(x
2
) (x)
2
]
b
1
= b
0
=
[(y) (b
1
x)]
n
REGRESSO
26/08/2014
53
105
Parmetro para Avaliao da Reta de Regresso Linear
O coeficiente de determinao ou explicao, R
2
, mede a
parcela da variao de Y explicada pela variao de X.
Portanto, 0<R
2
<1.
R
2
= (Coeficiente de correlao)
2
= r
2
REGRESSO
106
Regresso Linear Simples - Exemplo
Ms Perodo (x) Vendas (y)
Jan 1 1362
Fev 2 1623
Mar 3 2117
Abr 4 2253
Mai 5 2910
Jun 6 3125
Jul 7 3262
Ago 8 4026
Set 9 3971
Out 10 4618
Nov 11 4836
Dez 12 4901
Jan 13 5052
Fev 14 6606
Mar 15 6085
Abr 16 6536
Mai 17 7540
Jun 18 6675
Jul 19 7688
Ago 20 7698
Os dados ao lado refletem as vendas
(R$x1.000,00) de um determinado
produto, em um mercado especfico, de
janeiro a agosto do ano seguinte. Estas
vendas parecem aumentar em um
padro linear no decorrer do tempo. O
objetivo de estudar estas vendas obter
um modelo para fazer uma previso da
seqncia das vendas. Qual o provvel
valor das vendas em setembro futuro?
26/08/2014
54
107
Regresso Linear Simples - Exemplo
Utilizando o software Excel, ferramenta anlise de dados / regresso, obtemos as
informaes abaixo:
O coeficiente r varia de -1 r 1.
Como o valor encontrado 0,9885,
prximo de 1, indica forte correlao
entre as variveis ms e vendas.
O coeficiente de determinao ou
explicao R
2
varia de 0<R
2
<1. Mede a
parcela da variao de Y explicada pela
variao de X, indicando:
97,71% da variao da varivel vendas
funo da variao da varivel
perodo. Sendo 2,29% devido outras
variveis no consideradas.
y = b
1
x + b
0
vendas = 344,86 . ms + 1023,18
108
Regresso Linear Simples - Exemplo
Utilizando a equao de previso, substituindo a varivel ms por 21 (setembro), o
provvel valor da venda ser:
vendas = 1023,18 + 344,86 . 21 = 8.265,24 R$ 8.265.240,00
26/08/2014
55
109
ANDERSON, David R. SWEENEY, Dennis J.
WILLIANS, Thomas A. Estatstica Aplicada
Administrao e Economia. So Paulo: Pioneira
Thomson Learning, 2005.
BUSSAB, Wilton de O. MORETTIN, Pedro A.
Estatstica Bsica. So Paulo: Saraiva, 2007.
STEVENSON,WilliamJ. Estatstica Aplicada
Administrao. So Paulo: Harbra Ltda, 2000.
BIBLIOGRAFIA
Agradecimentos :
Prof. Richard Barros

Você também pode gostar