Escolar Documentos
Profissional Documentos
Cultura Documentos
n
c
i
a
s
a
b
s
o
l
u
t
a
s
Fonte: Tabela 1.1
GRFICO DE PIZZA
O grfico de pizza deve ser usado preferencialmente para apresentar variveis com no
mximo 4 eventos.
9
Maximiliano Domingos Xavier
Alunos de Estatstica - UFRN 2007
42%
58%
FEMININO MASCULINO
Fonte: Base de Dados Alunos de Estatstica UFRN 2007.
3.1 - Distribuio de Freqncias Utilizando Classes
Fica complicado fazer tabela de freqncia de variveis contnuas, principalmente quando
o nmero de elementos muito grande.
No h regra exata para determinarmos o nmero de classes para anlise de uma varivel.
Apenas orientaes prticas para o analista.
Sero necessrias algumas tentativas, como tambm, estamos sujeitos a cometer erros.
Os valores da varivel so transformados numa nova varivel cujos mesmos esto
compreendidos entre os limites dos intervalos das classes.
3.1.1 - Clculo para o tamanho dos intervalos
N = Tamanho da amostra
K (Nmero de classes)
K = n Obs. Arredonda para o mais prximo
Intervalo de Variao (Diferena do Max pelo Min)
IV = Max Min
Amplitude = IV/K
10
Maximiliano Domingos Xavier
Alunos de Estatstica
0%
10%
20%
30%
40%
50%
60%
70%
18-23 23-28 28-33 33-38 38-43 43-48 48-53
Idade
%
Fonte: Base de Dados Alunos de Estatstica UFRN 2007.
4 GRFICO DE PARETO
Para que serve o Grfico de Pareto?
O grfico de Pareto deve ser utilizado sempre que temos que estabelecer prioridades a
partir de um nmero variado de informaes e dados. Ajuda a dirigir nossa ateno e esforos para
problemas verdadeiramente importantes, aumentando nossas chances de obteno de bons
resultados.
Utilizaremos a tabela abaixo para demonstrar o grfico de pareto
Causas de no realizao de um gol
Eventos Frequncia
A Passe errado 52
B Chute errado a gol 26
C Falta sofrida 10
D Impedimento 06
E Erro do juiz 02
F Queda do Jogador 01
G Defesa do goleiro 01
Total 98
Tabela 1.2
11
Maximiliano Domingos Xavier
Fonte: Tabela 1.2
Assim, considerando o processo de melhoria da qualidade, o grfico de Pareto utilizado
nas seguintes situaes:
Na seleo de problemas que sero como projetos de melhoria de qualidade;
Na identificao das causas fundamentais de problema;
Na comparao entre o antes e o depois de uma ao corretiva.
5 MEDIDAS DE ORDENAMENTO
Com as tabelas de freqncias e os mtodos grficos organizamos e comeamos a anlise
dos valores de uma varivel. Agora iniciamos os mtodos numricos para resumir e analisar os
valores de uma varivel, seja uma amostra ou a prpria populao.
Em algumas situaes o interesse est em conhecer a posio de um determinado valor em
relao ao grupo de valores. Por exemplo, qual a posio de um retorno de 15% ao ano com
relao s rentabilidades anuais das aplicaes do mercado financeiro? Quantos retornos do
mercado financeiro so maiores que 15 %.
5.1 - Percentil
Um percentil uma medida da posio relativa de uma unidade obsservacional em relao a todas
as outras. O p-simo porcentil tem no mnimo p% dos valores abaixo daquele ponto e no mnimo
(100 - p)% dos valores acima.
Por exemplo,
se uma altura de 1,80m o 90o. percentil de uma turma de estudantes, ento 90% da turma
tem alturas menores que 1,80m e 10% tm altura superior a 1,80m.
12
Maximiliano Domingos Xavier
se o peso de uma pessoa de 75kg o 40o. percentil de um conjunto de empregados. ento
40% dos empregados pesam menos que 75kg e 60% pesam mais.
No Excel a funo estatstica PERCENTIL d o valor que divide a matriz em duas partes,
uma menor que o argumento k e a outra maior que k. O argumento k um valor entre 0 e 1
correspondendo respectivamente a 0% e 100% do nmero de valores da matriz.
Alguns percentis da varivel idade da Base de Dados Alunos Estatstica - UFRN 2007.
Formula: =PERCENTIL(Matriz; k)
Percentil 10 = 19
Percentil 20 = 20
Percentil 50 = 22
Percentil 82 = 26
Percentil 94 = 38
5.2 - Quartil
Os percentis dividem o intervalo de variao dos valores da varivel em cem partes iguais.
Dividindo os valores ordenados da varivel em quatro quartos iguais se obtm trs quartis
denominados: primeiro quartil, segundo quartil e terceiro quartil. Numa varivel com n valores
ordenados de forma crescente:
O primeiro quartil Q1 um valor tal que 25% dos valores da varivel so menores e os
restantes 75% so maiores.
O segundo quartil Q2 um valor tal que 50% dos valores da varivel so menores e os
restantes 50% so maiores.
O terceiro quartil Q3 um valor tal que 75% dos valores da varivel so menores e os
restantes 25% so maiores.
Quartis da varivel idade da Base de Dados Alunos Estatstica - UFRN 2007.
Formula: =QUARTIL(Matriz; quarto)
Quartil 1 (25%) = 20
Quartil 2 (50%) = 22
Quartil 3 (75%) = 22
6 - MEDIDAS DE TENDNCIA CENTRAL
As medidas de tendncia central nos do uma noo sobre qual valor representa o centro de
uma distribuio ordenada (rol), ou simplesmente um valor que melhor represente essa distribuio
13
Maximiliano Domingos Xavier
6.1 Mediana
A mediana o valor localizado na posio central de uma distribuio de frequncia
ordenada. Sofre pouca influncia pelas caudas da distribuio.
Calculando a Mediana
31 38 19 27 24 42 32 18 43 15 39
Ordena-se os valores
15 18 19 24 27 31 32 38 39 42 43
Mediana = 31
Obs: Se a quantidade de valores n for um nmero par, a Md no ser um valor da varivel. A Md
ser o resultado da soma dos dois valores centrais dividido por 2.
6.2 Moda
A moda o valor da varivel que mais se repete. Sofre pouca influncia pelas caudas da
distribuio.
Moda o valor da varivel que mais se repete, ou seja, que tem maior freqncia em uma
varivel.
15 38 42 27 24 42 32 18 43 15 42
Moda = 42
6.3 Mdia
Valor que representa uma distribuio. a medida de posio mais usada. Sofre forte
influncia pelas caudas da distribuio.
Mdia da populao o resultado de dividir a soma dos valores X1,X2,...,XN, da varivel
X pela quantidade de valores N.
No Excel: =MDIA(nm1;nm2;...;nmN)
No Excel: =MODO(nm1;nm2;...;nmN)
No Excel: =MED(nm1;nm2;...;nmN)
14
Maximiliano Domingos Xavier
7 - MEDIDAS DE DISPERSO
Para identificar uma varivel de forma completa deve-se adicionar uma medida numrica
que mostre a variabilidade ou disperso de seus valores. O conhecimento da disperso dos valores
uma medida chave na anlise estatstica de uma varivel.
7.1 Varincia
A varincia de uma varivel aleatria uma medida da sua disperso estatstica, indicando quo
longe em geral os seus valores se encontram do valor esperado.
Varincia da populao e varincia da amostra
A varincia de uma populao yi onde i = 1, 2, ...., N dada por
Quando estimando a varincia da populao usando n amostras aleatrias xi onde i = 1, 2, ..., n, a
frmula seguinte um estimador no enviesado:
7.2 Desvio Padro
O Desvio Padro a raiz quadrada da sua varincia. Dessa maneira:
O desvio padro considerado como populao :
O desvio padro considerado como amostra :
No Excel: =DESVPAD(nm1;nm2;...;nmN)
No Excel: =DESVPADP(nm1;nm2;...;nmN)
No Excel: =VAR(nm1;nm2;...;nmN)
No Excel: =VARP(nm1;nm2;...;nmN)
15
Maximiliano Domingos Xavier
7.3 Coeficiente de Variao
O coeficiente de variao CV o resultado de dividir o desvio padro pela sua mdia. A
medida relativa CV permite a comparao de distribuies, pois seu resultado o desvio padro
por unidade de mdia. Comparando duas variveis, a varivel que tiver menor CV tem menor
disperso ou variabilidade.
8 INCLINAO DE UMA DISTRIBUIO
O coeficiente de inclinao o resultado de comparar a distribuio de frequncias dos
valores de uma varivel com uma distribuio normal.
O resultado da funo DISTORO deve ser interpretado da seguinte forma:
Se o coeficiente de inclinao for igual a zero, a distribuio de frequncias ser simtrica.
Se o coeficiente de inclinao for negativo, a distribuio de frequncias ter inclinao
esquerda ou negativa.
Se o coeficiente de inclinao for positivo, a distribuio de frequncias ter inclinao direita
ou positiva.
9 CURTOSE DE UMA DISTRIBUIO
Se duas distribuies de frequncias tm a mesma disperso e inclinao no ser suficiente
para supor que as duas tenham a mesma forma, caracterstica denominada curtose.
A curtose medida pelo coeficiente de curtose que compara a distribuio de frequncias
de amostras com a distribuio normal.
O resultado desta funo deve ser interpretado da seguinte forma:
Se o coeficiente de curtose for igual a zero, ento a distribuio de frequncias ser a prpria
distribuio normal.
Se o coeficiente de curtose for negativo, ento a distribuio ser achatada, plana.
Se o coeficiente de curtose for positivo, a distribuio ser concentrada ao redor da mdia,
distribuio com pico.
No Excel: = CURT(nm1;nm2;...;nm30)
No Excel: =DISTORO(nm1;nm2;...;nm30)
16
Maximiliano Domingos Xavier
10 - FERRAMENTA DE ANLISE ESTATSTICA DESCRITIVA
No menu Ferramentas escolhemos Anlise de Dados e recebemos a caixa de dilogo com
todas as ferramentas de anlise disponveis. Depois de escolher Estatstica Descritiva e pressionar
o boto Ok o Excel apresenta a caixa de dilogo Estatstica descritiva.
Para utilizar a ferramenta de anlise Estatstica Descritiva utilizaremos a Varivel Idade
da planilha Base de Dados Alunos de Estatstica UFRN 2007.
17
Maximiliano Domingos Xavier
11 - BOXPLOT
11.1 Criando o boxplot no Excel
1. O primeiro passo gerar as estatsticas para o conjunto de dados conforme descrito
abaixo, e na mesma seqncia.
Dados 1 Dados 2
1 Quartil 155 170
Mnimo 149 155
Mediana 160 173,5
Mximo 173 181
3 Quartil 165 175,75
2. Selecione toda a informao, incluindo os rtulos de dados e depois selecione Inserir > Grfico
e escolha Linha. Selecione o sub-tipo linha com marcadores exibidos a cada valor de dado.
Clique em avanar, e selecione sries em: linhas e depois click em concluir.
3. Agora sero executados comando sobre o
grfico. Clique com o boto direito do mouse sobre
uma das linhas do grfico. Selecione formatar
srie de dados, v para opes e selecione
linhas de mximo/mnimo e barras
superiores/inferiores. A largura do
espaamento poder variar entre diversos valores,
pois isso no importa para o Boxplot. O resultado
dever ser algo do tipo:
4. As linhas sero removidas uma a uma, inicialmente clicando com o boto direito do mouse
sobre a linha. Selecionar formatar srie de dados em padres observar o campo linha e
marcar sobre nenhuma, da mesma forma para o campo marcador, deixando apenas o marcador
para a linha da mediana. Isso deve ser feito para todas as linhas. Em seguida, clique com o boto
direito sobre a rea do grfico, selecione opes de grfico, na guia linhas de grade desmarque
todas as opes de linha e na guia legenda desmarque a opo mostrar legenda. O resultado
final ser como est abaixo.
140
145
150
155
160
165
170
175
180
185
F M
140
145
150
155
160
165
170
175
180
185
F M
1 Quartil
Mnimo
Mediana
Mximo
3 Quartil
18
Maximiliano Domingos Xavier
11.2 Exerccio:
Para utilizar o boxplot utilizaremos as variveis Sexo e Altura da planilha Base de Dados
Alunos de Estatstica UFRN 2007.
12 - ANLISE DE CORRELAO E REGRESSO LINEAR
O Coeficiente de Correlao R uma medida do grau de associao linear entre duas
variveis.
O Coeficiente de Determinao R uma medida do poder explicativo do modelo
utilizado.
12.1 Resumo dos valores do Coeficiente de Correlao
A seguir apresentaremos o significado dos valores possveis do coeficiente de correlao
limitados no intervalo -1 e +1.
r=+1 Correlao positiva perfeita. Os pares de valores das duas variveis esto numa mesma
reta com declividade positiva. Neste caso, pode-se ver a perfeita relao linear entre as variveis.
r prximo de +1 Forte correlao positiva. A maioria dos pares de valores est prxima de
uma reta com declividade positiva.
r prximo de +0 Fraca correlao positiva. Os pares de valores formam uma nuvem com
ligeira tendncia de declividade positiva.
19
Maximiliano Domingos Xavier
r=0 No h relao. Os pares de valores formam uma nuvem de pontos sem nenhuma
tendncia.
r prximo de -0 Fraca correlao negativa. Os pares de valores formam uma nuvem com
ligeira tendncia de declividade negativa.
r prximo de -1 Forte correlao negativa. A maioria dos pares est prxima de uma reta com
declividade negativa.
r=-1 Correlao negativa perfeita. Os pares de valores das duas variveis esto numa mesma
reta com declividade negativa. Neste caso, mais uma vez, pode-se ver a perfeita relao linear
entre as observaes.
Exemplo: Anlise de correlao entre Peso e Altura
Exemplo com a base de dados Alunos de Estatstica da UFRN Ano 2007.
Exibindo Grfico de Disperso com a Linha de Tendncia
No Excel: =CORREL(matriz1;matriz 2)
20
Maximiliano Domingos Xavier
UNIDADE III
APLICAES
1 Criando um grfico dinmico para acompanhamento de processos.
21
Maximiliano Domingos Xavier
2 Transformando uma planilha comum em um Banco de Dados.
Relatrio de Anomalias - Planilha
Relatrio de Anomalias Banco de Dados
22
Maximiliano Domingos Xavier
3 - Montando uma rvore de Anlises para definir qual o caminho indicativo
que dever ser seguido na hora de detalhar os nveis da informao.
RVORE DE ANLISES
Grficos seguindo a ordem da rvore
Eficincia por Unidade
91,9%
91,2%
44,2%
55,8%
90,8%
91,0%
91,2%
91,4%
91,6%
91,8%
92,0%
Tecelagem 1 Tecelagem 2
%
E
f
i
c
i
n
c
i
a
0,0%
10,0%
20,0%
30,0%
40,0%
50,0%
60,0%
%
P
r
o
d
u
o
Eficincia da "Tecelagem 2" por tecnologia
90,7%
91,5%
91,4%
91,1%
89,5%
90,0%
90,5%
91,0%
91,5%
92,0%
L5200 ZAX
%
E
f
ic
i
n
c
ia
90,9%
91,0%
91,0%
91,1%
91,1%
91,2%
91,2%
91,3%
91,3%
91,4%
91,4%
91,5%
%
M
e
t
a
Eficincia da "Tecelagem 2 - L5200" por Artigo
90,3%
92,7%
91,4%
92,1%
89,0%
89,5%
90,0%
90,5%
91,0%
91,5%
92,0%
92,5%
93,0%
RIOLEEN RIOLEEN-157
%
E
f
i
c
i
n
c
i
a
88,0%
88,5%
89,0%
89,5%
90,0%
90,5%
91,0%
91,5%
92,0%
92,5%
%
M
e
t
a
Eficincia por Grupo/Turno "L5200"
92,9% 92,8%
92,4% 92,2% 92,2%
91,8%
91,6% 91,4%
91,0% 91,0%
90,7% 90,6%
90,1%
87,7%
86,9%
82,0%
84,0%
86,0%
88,0%
90,0%
92,0%
94,0%
4C 3A 5B 4B 2C 2B 5C 4A 2A 3C 3B 5A 1C 1B 1A
Acima da Meta Tolerncia Abaixo da Meta Meta
23
Maximiliano Domingos Xavier
REFERNCIAS BIBLIOGRFICAS
LAPPONI, Juan Carlos. Estatstica Usando Excel. Quarta Edio. Elsevier. Editora Campus.
statstica Usando Excel ensina Estatstica e explica como aplicar os conceitos e analisar
resultados por meio de exemplos resolvidos com os procedimentos tradicionais de clculo e
o Excel. Essa integrao torna o aprendizado de Estatstica eficaz e mostra que h diversos
caminhos para alcanar o mesmo resultado, incluindo a superposio de recursos do Excel.
LAPPONI, Juan Carlos.
E