Você está na página 1de 39

Universidade Federal do Par

Instituto de Tecnologia

Estatstica Aplicada I

Universidade Federal do Par


Instituto de Tecnologia

Captulo I

Estatstica Descritiva

Prof. Dr. Jorge Tefilo de Barros Lopes

Campus de Tucuru CTUC


Curso de Engenharia Mecnica

Campus de Tucuru CTUC


Curso de Engenharia Mecnica
ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

Introduo

Introduo

Conceitos e definies

Conceitos e definies

Classificao dos dados

Classificao dos dados

Caracterizao e apresentao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Estatsticas amostrais

Outras apresentaes grficas de dados

Outras apresentaes grficas de dados

Regresso linear

Regresso linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

 ESTATSTICA: a disciplina que objetiva estudar os


mtodos cientficos para a coleta, organizao, resumo,
apresentao e anlise de dados, bem como obter
concluses vlidas e tomar decises razoveis baseadas
em tais anlises.
 Tcnicas Estatsticas: So as vrias tcnicas por meio
das quais possvel estudar conjuntos de dados e, a
partir de uma amostra (se necessria), tirar concluses
vlidas para conjuntos maiores (populao).

ESTATSTICA APLICADA I - Estatstica Descritiva

 De uma maneira geral, as tcnicas estatsticas so


utilizadas em trs etapas principais do trabalho de
pesquisa:
1. A coleta de dados, incluindo o planejamento do
trabalho e da pesquisa;
2. A apresentao dos dados coletados; e
3. A anlise dos dados coletados, com a formulao
de concluses e generalizaes.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

1.1 Introduo

Coleta de dados

Apresentao dos dados coletados

- Essa primeira etapa corresponde ao estabelecimento


do mtodo de coleta de dados (questionrio ou teste
ou ensaio de material) e elaborao dos
questionamentos; determinao das variveis que
sero estudadas, de acordo com o interesse do
pesquisador; e o clculo do tamanho da amostra, de
acordo com a natureza da pesquisa, do tempo e do
oramento disponveis.

- A segunda etapa requer tcnicas especficas para a


transformao dos dados numricos em tabelas ou
grficos ( a partir da organizao dos dados
coletados que se poder elaborar a interpretao).
Anlise dos dados coletados
- Essa etapa simultnea anterior, pois durante a
prpria organizao dos dados j possvel ir
percebendo a tendncia geral da pesquisa.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

No sentido de melhor esclarecer o significado da


anlise e interpretao dos dados, deve-se estabelecer
uma distino entre
Estatstica Descritiva

 Estatstica Descritiva: Objetiva sintetizar e representar de


uma forma compreensvel a informao contida num
conjunto de dados.
Como o prprio nome sugere, constitui-se num conjunto
de tcnicas que objetivam descrever, analisar e interpretar
os dados numricos de uma populao ou amostra.
Adquire importncia quando o volume de dados for
significativo.

e
Inferncia Estatstica.

Materializa-se na construo de tabelas e/ou grficos ou


no clculo de medidas que representem convenientemente
a informao contida nos dados.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

 Inferncia Estatstica: Baseada na anlise de um conjunto


limitado de dados (uma amostra), objetiva caracterizar o
todo a partir do qual tais dados foram obtidos (a populao).
Objetivo mais ambicioso que o da estatstica descritiva.
Os mtodos e tcnicas utilizados so mais sofisticados.

Figura 1.1- Diferena entre Estatstica Descritiva e Inferncia


Estatstica (Silva e Carvalho, 2006).
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.1 Introduo

I - Estatstica Descritiva

Figura 1.2- Diferena entre Estatstica Descritiva e Inferncia


Estatstica (Silva e Carvalho, 2006).

Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.2 Conceitos e Definies


 Populao: o conjunto de todos os elementos que contm
uma certa caracterstica que se deseja estudar.
Como comum a todos os elementos, esta caracterstica
varia em quantidade ou qualidade.
Uma populao pode ter dimenso finita ou infinita.
 Amostra: um subconjunto de dados que pertencem
populao. As amostras aleatrias so escolhidas por meio
de processos (tcnicas de amostragem) que garantem que o
subconjunto obtido representativo da populao.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.2 Conceitos e Definies


 Fases do mtodo de anlise estatstica:
No mbito da Estatstica, o mtodo de abordagem dos
problemas pode ser dividido em cinco fases:
1.

Estabelecimento do objetivo da anlise a efetuar (questes a


serem resolvidas) e definio das populaes correspondentes;

2.

Concepo de um procedimento adequado para a seleo de


uma ou mais amostras (escolha das tcnicas de amostragem a
utilizar).

3.

Coleta de dados.

4.

Anlise dos dados (Estatstica Descritiva).

5.

Estabelecimento de inferncias a respeito da populao


(Inferncia Estatstica)

ESTATSTICA APLICADA I - Estatstica Descritiva

1.2 Conceitos e Definies


 Principais motivos para o estudo da amostra:
1. Populao infinita;
2. Custo em termos de tempo ou de dinheiro que um
estudo em toda a populao implicaria;
3. Obteno de informao por meio de testes destrutivos,
no mbito industrial;
4. Impossibilidade de acesso a todos os elementos da
populao.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.2 Conceitos e Definies


 Fases do mtodo de anlise estatstica:
Identificao do problema Objetivo da anlise
Planejamento da experincia Tcnicas de Amostragem
Coleta de dados
Anlise exploratria dos dados Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

Anlise e interpretao dos resultados Inferncia Estatstica


ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

1.3 Classificao dos Dados


 Iniciando o estudo:

Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

No existe uma estratgia nica para iniciar o estudo


descritivo, embora uma primeira recomendao seja
comear por uma explorao visual dos dados
levantados.
Isso necessrio, pois podem ocorrer registros que no
se encaixam no padro geral observado e, dessa forma,
a sua veracidade deve ser averiguada, pois podem tratarse de erros de observao, bem como do prprio registro
ou provenientes de alteraes do fenmeno em estudo.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


 Iniciando o estudo:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


 Iniciando o estudo:

Para se ter uma idia mais concreta sobre os dados


levantados, deve-se recorrer s tabelas e/ou grficos que
podem representar, de maneira sinttica, as informaes
sobre o comportamento de variveis numricas
levantadas.
Embora estas anlises j se encontrem disponveis em
vrios softwares e calculadoras programveis, para uma
melhor interpretao das mesmas conveniente
conhecer as tcnicas utilizadas.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


 Dados brutos: Como primeiro resultado de uma pesquisa, obtm-

se dados brutos, ou seja, um conjunto de nmeros ainda sem


organizao alguma.

 Rol: Os dados brutos so ento ordenados de forma crescente ou

decrescente, com a indicao da freqncia de cada um, dando origem


ao chamado rol.

 Tabulao dos dados: Depois de elaborar o rol preciso

determinar quantas faixas ter a tabela de freqncia. A frmula de


Sturges utilizada para estabelecer o nmero aproximado de classes

k 1 + 3 ,22 log n
onde: n = nmero de elementos da amostra (tamanho da amostra)
k = nmero de classes que a tabela de classes dever contar.
ESTATSTICA APLICADA I - Estatstica Descritiva

Portanto, para se proceder um estudo descritivo, importante:


- Ordenao dos dados fase onde se comea a ter uma idia a
respeito de algumas medidas de posio (mdia, mediana, quartis
etc.);
- Estatsticas amostrais a partir de algumas medidas promove-se
um resumo dos dados levantados, relativamente posio,
disperso e forma;
- Agrupamento dos dados e representao grfica revela a forma
possvel para a populao em estudo e permite escolher a classe
de modelos que deve ser
explorada nas anlises mais
sofisticadas.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


Observaes: - k dever ser no mnimo 3 e no mximo 20;
- Como a varivel k um nmero inteiro, ela
dever ser aproximada para o maior inteiro (por
exemplo, se k 6,4, usa-se k = 7).

 Freqncia de classes: O passo seguinte subdividir os dados

pelas classes ou categorias e determinar o nmero de indivduos


pertencentes a cada uma, resultando nas freqncias de classes.

 Apresentao final dos dados (tabela completa): Com


base em todos os clculos feitos anteriormente, pode-se fazer uma
nova tabela com todas as freqncias, as quais sero estudadas a
posteriori.

 Grficos: A partir da tabela de freqncias, faz-se o desenho


grfico, um recurso de visualizao dos dados constantes na tabela.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


 Os dados que constituem uma amostra podem ser de
quatro tipos, assim distribudos:

1.3 Classificao dos Dados


a) Dados nominais: Quando cada um deles for identificado
pela atribuio de um nome que designa uma classe.
Neste caso, as classes devem ser:

Qualitativos
- Nominal
- Ordinal

a) Exaustivas - qualquer dado pertence a uma das classes;


b) Mutuamente exclusivas - cada dado pertence somente
a uma classe;
c) No ordenveis - no existe nenhum critrio relevante
que permita estabelecer preferncia por qualquer
classe em relao s restantes.

Quantitativos
- Intervalar
- Absoluto
ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


b) Dados ordinais: So semelhantes aos dados nominais;
contudo, nessa escala existe a possibilidade de se
estabelecer uma ordenao dos dados nas classes,
segundo algum critrio relevante.
- Exemplo: Classificao de conceitos de avaliao na
disciplina em insuficiente, regular, bom e excelente.

Exemplo: Classificao das pessoas pela cor do cabelo


(preto, castanho, louro etc.).
ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


c) Dados intervalares: No caso da escala intervalar, os
dados so diferenciados e ordenados por nmeros
expressos em uma ordem cuja origem arbitrria.
- Observao: Neste caso, pode-se atribuir um significado
diferena entre esses nmeros, mas no razo entre
eles.
Por exemplo, o registro de temperaturas em C, em determinadas
horas de dias sucessivos. Se em trs dias consecutivos a
temperatura atingir 5C, 10C e 20C, no faz sentido dizer que o
terceiro dia esteve duas vezes mais quente que o segundo, pois se a
temperatura fosse expressa em outra escala, a razo entre os
valores registrados naqueles dias seria diferente.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


d) Dados absolutos: Contrariamente ao que sucede com a
escala intervalar, a escala absoluta tem origem fixa (nesta
escala, o valor zero tem significado).
- Exemplo: Pesos de pessoas expressos em kg.
- Observaes:
Escala intervalar: temperatura de 0C no significa que no haja
temperatura.
Escala absoluta: peso de 0 kg significa que no existe peso.
Em conseqncia ao fato da origem ser fixa, a razo entre os dados
expressos numa escala absoluta passa a ter significado; uma pessoa
com 60 kg tem o dobro do peso de uma com 30 kg.
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


- Observao: Quando se trabalha com dados quantitativos,
necessrio que se faa a distino entre os dados discretos
e os contnuos.
Os dados denominam-se discretos quando so valores de uma
varivel aleatria discreta, que a aquela que assume valores em
pontos da reta real (por exemplo, nmero de pginas em um livro:
1, 2, 3, 4, 5...).
Os dados so contnuos quando so valores de uma varivel
aleatria contnua, que aquela que pode assumir qualquer valor
em certo intervalo da reta real (por exemplo, o peso de
funcionrios de uma fbrica: 60,5 kg; 60,52 kg; ...)
ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados

1.3 Classificao dos Dados

 Arredondamento de dados: O arredondamento de um dado


estatstico deve obedecer as seguintes regras.
1. Arredondamento por falta: Quando o primeiro dgito, aquele situado
mais esquerda entre os que iro ser eliminados, for igual ou menor que
quatro, no dever ser alterado o dgito remanescente (ou seja, fraes de
0,000... a 0,4999... so simplesmente eliminadas, arredondadas para
baixo).
Exemplos: 3, 49 3;

2,43 2,4;

1,734999 1,73

Nmero a arredondar Arredondamento para Nmero arredondado


12,489

Inteiros

12

12,733

Dcimos

12,7

12,992

Centsimos

12,99

2. Arredondamento por excesso: Quando o primeiro dgito aps aquele que


ser arredondado for maior ou igual a cinco seguido por dgitos maiores
que zero, o digito remanescente ser acrescido de uma unidade (ou seja,
fraes maiores de 0,500... at 0,999... so eliminadas, mas o algarismo a
ser arredondado aumenta 1 unidade, arredondadas para cima).
Exemplos: 3,688 3,69; 5,6501 5,7
Nmero a arredondar

Arredondamento para

15,504

Inteiros

16

15,561

Dcimos

15,6

15,578

Centsimos

15,58

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados

Exemplos: 3,5 4; 6,5 6; 5,6500 5,6; 5,700 5,8; 9,475 9,48;


3,325 3,32
Nmero a arredondar Arredondamento para Nmero arredondado
Inteiro
Inteiro
Dcimos
Centsimos

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados

3. Arredondamento de dgitos seguidos do cinco: Quando o dgito


situado mais esquerda dos que sero eliminados for um cinco ou um
cinco seguido somente de zeros, o ltimo dgito remanescente, se for
par, no se alterar, e se for impar ser aumentado de uma unidade (ou
seja, se a frao a ser eliminada exatamente 0,50000..., ento o
algarismo a ser arredondado, s aumentar de 1 unidade caso torne-se
um algarismo par).

215,500
216,500
216,750
216,705

- Observaes:
1. Nunca se deve fazer arredondamentos sucessivos.
Exemplo: 17,3452 17,3 (correto)
17,3452 17,35 17,4 (incorreto)
2. Se for necessrio um novo arredondamento, recomenda-se o retorno
aos dados originais.

216
216
216,8
216,70

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados

 Algarismos significativos

 Algarismos significativos:

Os algarismos significativos de um nmero so os dgitos diferentes de


zero, contados a partir da esquerda at o ltimo dgito diferente de zero
direita, caso no haja vrgula decimal, ou at o ltimo dgito (zero ou no)
caso haja uma vrgula decimal.
Exemplos:
Algarismos
Nmeros
Notao cientfica
significativos
3200
1,55
8,3400
32050
0,032
0,03200

Nmero arredondado

3,2 x 103
1,55 x 100
8,3400 x 100
3,205 x 104
3,2 x 10-2
3,200 x 10-2

2
3
5
4
2
4

ESTATSTICA APLICADA I - Estatstica Descritiva

Todos os dgitos diferentes de zero so significativos.


Exemplos: 7,3; 32 e 210 possuem 2 algarismos significativos.
Os zeros entre dgitos diferentes de zero so significativos
Exemplos: 303 e 1,03 possuem 3 algarismos significativos.
Se existir uma vrgula decimal, todos os zeros direita da vrgula
decimal so significativos
Exemplos: 1,000 e 33,30 possuem 4 algarismos significativos.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


 Algarismos significativos:

1.3 Classificao dos Dados


 Algarismos significativos:

Valores medidos ou calculados: o nmero de algarismos significativos


de uma grandeza medida ou um valor calculado uma indicao da
incerteza, ou seja, quanto mais algarismos significativos, menor a
incerteza no valor.
Exemplo:
O valor de uma grandeza medida com 3 algarismos significativos,
indica que o valor do 3 algarismo tem uma incerteza menor 0,5C.
Caso seja apresentada uma temperatura como 32C (2 significativos),
est indicado que a temperatura est entre 31,5 e 32,5C. Caso ela seja
apresentada como 32,5C (3 significativos), est indicado que a
temperatura est entre 32,45 e 32,55C.

Nmeros inteiros que so resultados experimentais, seguem as regras


anteriores.
Exemplo: a presso em uma caldeira 6 atm, possui 1 algarismo
significativo.
Nmeros inteiros que descrevem o nmero de objetos discretos
possuem preciso mnima.
Exemplo: 5 dias = 5,0000000... dias.
Nmeros inteiros que so parte de uma expresso fsica possuem
preciso infinita.
Exemplo: o 2 na equao do permetro do crculo 2R, possui uma
preciso infinita uma vez que por definio o dimetro 2 vezes o raio.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


- Observaes:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.3 Classificao dos Dados


- Observaes:

Na adio e na subtrao faz-se a operao normalmente e no final


reduz-se o resultado, usando os critrios de arredondamento, para o
nmero de casas decimais da grandeza menos precisa.
Exemplos:
12441 + 57,91 + 1,987 + 0,0031 + 119,20 = 12620,1001 = 12620
12441,2 7856,32 = 4584,88 = 4584,9

Nas operaes de potenciao e radiciao o resultado dever ter o


mesmo nmero de algarismos significativos da base (potenciao) ou
do radicando (radiciao).
Exemplos: (1,52 x 103)2 = 2,31 x 106
(0,75 x 104)1/2 = 0,87 x 102

Na multiplicao e na diviso o resultado dever ter igual nmero de


algarismos (ou um algarismo a mais) que a grandeza com menor
quantidade de algarismos significativos que participa da operao.
Exemplos:
12,46 x 39,83 = 496,2818 = 496,28
803,407 / 13,1 = 61,328 = 61,33
ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Tabela de freqncias:

Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

Devido necessidade das categorias estarem


ordenadas, somente se pode falar de freqncias
acumuladas quando os dados esto em escalas ordinais,
intervalar ou absoluta.
A representao tabular com todos os tipos de
freqncias mostrada a seguir:

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Tabela de freqncias:

1.4 Caracterizao e Apresentao dos Dados


 Tabela de freqncias:

a) Freqncia absoluta (ni): O nmero de dados contidos


numa classe ou categoria qualquer i (i = 1,..., k) de
um conjunto de dados designa-se por freqncia
absoluta da classe ou categoria i.
Denotando-se por ni tal freqncia e admitindo que
as categorias especificadas contm todos os dados,
o nmero total de dados (n) calculado por :
k

n = ni
1= 1

b) Freqncia relativa (fi): O nmero total de dados que


pertencem a uma classe ou categoria qualquer i,
quando expressos como uma proporo do nmero
total de dados, designa-se por freqncia relativa da
classe ou categoria i e dada por
fi =

As freqncias relativas so muitas vezes definidas


em termos percentuais.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Tabela de freqncias:

ni
n

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Tabela de freqncias:

c) Freqncia absoluta acumulada (Ni): Representa para


cada classe ou categoria i, a freqncia absoluta de
dados que pertencem classe ou s classes anteriores.
d) Freqncia relativa acumulada (Fi): Representa para
cada classe categoria i, a freqncia relativa de dados
que pertencem classe ou s classes anteriores.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

Uma vez elaborada a tabela de freqncias, segue-se o


desenho do grfico, um recurso de visualizao dos
dados constantes na tabela.

- Histograma: Este tipo de grfico utilizado para


representar as freqncias absolutas (ni) em relao
sua classe, e assim construdo:

Os tipos de grficos mais comuns so: histograma;


polgono de freqncia, setograma e ogiva de Galton.

1. No eixo das abscissas marcam-se, em escala, as classes dos


dados;
2. No eixo das ordenadas, marcam-se as freqncias das classes;
3. Faz-se a correspondncia entre cada intervalo no eixo das
classes com um valor no eixo das freqncias, formando um
desenho de colunas paralelas.

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos
- Polgono de freqncia: Utilizado para indicar o ponto mdio
ou representante de classe em suas respectivas freqncias
absolutas; normalmente, construdo sobre o histograma, da
seguinte forma:
1.

No eixo das abscissas, coloca-se o ponto mdio de


cada intervalo de classe;

2.

No eixo das ordenadas, permanecem as freqncias


absolutas das classes (ni) ;

3.

Ligam-se os pontos mdios por segmentos de reta;

4.

Para completar o polgono, acrescenta-se um ponto


mdio com freqncia zero em cada uma das
extremidades da escala horizontal.

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos
- Histograma e Polgono de freqncia:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos
- Grfico em setores (Setograma): Tambm conhecido como
grfico de pizza, utilizado para representar valores relativos (%);
construdo da seguinte forma:

- Histograma

1.

Faz-se um crculo;

2.

Cada setor regido pela


frmula:

- Polgono de freqncia:

Setori =

3.

No crculo, distribui-se os
valores das freqncias
percentuais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

360 ni
n

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

- Ogiva de Galton: Este tipo de grfico utilizada para


representar as freqncias acumuladas de uma
distribuio; construdo da seguinte forma:

- Ogiva de Galton:

1. No eixo das abscissas coloca-se as classes dos dados, tal como


no histograma;
2. No eixo das ordenadas, escreve-se uma das freqncias
acumuladas, marcando o ponto com os limites superiores (Li) de
cada classe; inicia-se com a freqncia zero e com limite
inferior da 1 classe.
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

- Grfico linear: o tipo

- Grfico de colunas:

de grfico que apresenta


os dados estatsticos por
meio de uma linha
poligonal. Os pontos da
polgono so obtidos pelas
informaes contidas em
cada linha da tabela, e
marcados
no
plano
utilizando
o
sistema
cartesiano. So utilizados
para representar sries
cronolgicas.

o tipo de grfico que


apresenta
os
dados
estatsticos por meio de
retngulos
(colunas)
dispostas em posies
vertical.
Todos
os
retngulos possuem a
mesma base e a altura
proporcional aos dados.
Podem ser utilizados para
representar qualquer srie
estatstica.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Grficos estatsticos

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Qualitativos:

- Grfico de colunas:

Exemplo: Em uma amostra constituda de 120 peas, constatou-

Este tipo de grfico


semelhante ao de colunas,
onde
os
retngulos
(barras) esto dispostos
horizontalmente.

utilizado para legendas


longas, em todas as sries.

se que 100 no tinham qualquer defeito, 15 tinham defeitos


recuperveis e 5 apresentavam defeitos irrecuperveis. Representar
em uma tabela, e tambm graficamente, as freqncias (absolutas e
relativas) dos dados que constituem essa amostra:
Categoria de peas

Freqncia absoluta
(ni)

Freqncia relativa
(fi)

Sem defeitos
Recuperveis
irrecuperveis

100
15
5

83,3%
12,5%
4,2%

TOTAL

120

100%

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Qualitativos:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:

Grfico em Setores
4,2%
12,5%

Sem defeitos
Recuperveis
irrecuperveis

Exemplo: Em um estudo realizado com o objetivo de


caracterizar o comportamento dos clientes de um
supermercado, analisou-se o nmero de ocupantes por
veculo para 1000 veculos que entraram no
estacionamento do referido supermercado, em um
sbado. Os resultados encontram-se resumidos na
tabela seguinte:

83,3%

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

10

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:
N de ocupantes
por veculo
(xi)

Freqncia
absoluta
(ni)

Freqncia
relativa
(fi)

1
2
3
4
5
6
7

103
147
248
197
152
100
53

10,3%
14,7%
24,8%
19,7%
15,2%
10,0%
5,3%

TOTAL

1000

100%

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:

Freqncia
Freqncia
absoluta acumulada relativa acumulada
(Ni)
(Fi)
103
250
498
695
847
947
1000

Grfico em colunas
300

10,3%
25,0%
49,8%
69,5%
84,7%
94,7%
100,0%

250
200

n i 150
100
50
0

N ocupantes / veculo
ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:

Distribuies agrupadas: Essas distribuies so teis


quando existe um grande nmero de dados relativos a
uma varivel contnua, cujos valores observados so
muito prximos uns dos outros.
- A freqncia de cada classe o nmero de observaes que ela
contm.
- No exemplo anterior, os dados observados correspondem a uma
varivel discreta; para o caso de dados relativos uma varivel
contnua existem algumas diferenas.

Exemplo: O conjunto de dados baixo representa o


peso, em gramas, do contedo de uma srie de 100
garrafas que, no decurso de um teste, saram de uma
linha de enchimento automtico:
302,25; 299,20; 300,24; 297,22; 298,35; 303,76;
298,65; 299,38; 300,36; 299,16; 300,86; 299,83;
302,52; 300,12; 301,81; 297,99; 299,23; 298,73;
303,07; 299,07; 297,83; ... ; 300,80

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


 Dados Quantitativos:
No conjunto de dados mostrado no existe praticamente
repetio de valores; logo, no vantagem se utilizar os
dados agrupados numa tabela de freqncias, pois a
mesma teria tantas linhas quanto o nmero de dados.
No entanto, a tabela de freqncias pode ser construda
se os dados forem agrupados por classes:

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.4 Caracterizao e Apresentao dos Dados


Classes

Freqncia
absoluta
(ni)

Freqncia
relativa (%)
(fi)

Freqncia
absoluta
acumulada
(Ni)

Freqncia
relativa
acumulada (%)
(Fi)

[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[

8
21
28
15
11
10
5
1
1

8
21
28
15
11
10
5
1
1

8
29
57
72
83
93
98
99
100

8
29
57
72
83
93
98
99
100

TOTAL

100

100%
ESTATSTICA APLICADA I - Estatstica Descritiva

11

1.4 Caracterizao e Apresentao dos Dados

I - Estatstica Descritiva

 Dados Quantitativos:


Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

Histograma
30
25
20
f i 15
10
5
0

[297,00 ;
298,00[

[298,00 ;
299,00[

[299,00 ;
300,00[

[300.00 ;
301,00[

[301,00 ;
302,00[

[302,00 ;
303,00[

[303,00 ;
304,00[

[304,00 ;
305,00[

[305,00 ;
306,00[

Peso (kg)
ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


 Nas sees anteriores foi visto a sintetizao de dos dados
sob a forma de tabelas, grficos e distribuio de
freqncias.
 O clculo de estatsticas amostrais uma forma mais
sinttica de descrever um conjunto de dados, ou seja,
possibilita representar um conjunto de dados relativos
observao de determinado fenmeno de forma reduzida.
 As estatsticas amostrais so calculadas com base nos
dados, a partir das quais possvel descrever globalmente
o conjunto de valores que os referidos dados tomam.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


 As estatsticas amostrais ou medidas estatsticas so
divididas em trs grupos:
a) Medidas de posio ou de tendncia central:
Mdia aritmtica, mdia geomtrica, mdia harmnica,
mediana, quartis, decis, percentis e moda.
b) Medidas de disperso:
Amplitude total, desvio mdio, varincia, desvio
padro, amplitude interquartlica e coeficiente de
variao.
c) Medidas de forma:
Medidas de assimetria e medidas de curtose.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

Essas medidas nos orientam quanto posio da


distribuio no eixo x (eixo dos nmeros reais);
Possibilitam comparaes de sries de dados entre si
pelo confronto desses nmeros.
So chamadas de medidas de tendncia central, pelo
fato de representarem os fenmenos pelos seus valores
mdios, em torno dos quais tendem a concentrar-se os
dados.
ESTATSTICA APLICADA I - Estatstica Descritiva

a.1) Mdia aritmtica:


Para um conjunto de n dados de xi (i = 1,2,..., n) a
mdia aritmtica simples ou mdia amostral,
representada por x definida pela expresso:
n

x
x=

i =1

(dados no agrupados)

n
ESTATSTICA APLICADA I - Estatstica Descritiva

12

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:
a.1) Mdia aritmtica:

a.1) Mdia aritmtica:


Exemplo: Determinar a mdia aritmtica simples (mdia
aritmtica amostral) dos dados mostrados abaixo:
2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4
n

x
x=

Quando os dados estiverem agrupados numa


distribuio de freqncia usa-se a mdia aritmtica
dos valores xi ponderadas pelas respectivas
freqncias absolutas ni, assim:

i =1

n
2 + 1+ 3+ 3+ 2 + 3+7 + 5 + 5 + 2+ 1+ 3+ 1+ 1+ 4
x=

15
x = 2 ,87

n x
i

x=

(dados agrupados)

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

i=1

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.1) Mdia aritmtica:

a.1) Mdia aritmtica:

Exemplo (dados agrupados): Determinar a mdia


aritmtica simples (mdia aritmtica amostral) da
distribuio dada abaixo:

Exemplo (dados agrupados):


n

x i ni
xi

ni

x=

i =1

n
x = 2 ,87

( 1 4 ) + ... + ( 7 1 ) 43
=
15
15

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio

xi

ni

xini

1
2
3
4
5
7

4
3
4
1
2
1

4
6
12
4
10
7

15

43

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

a.1) Mdia aritmtica:

a.1) Mdia aritmtica:

No caso da varivel ser contnua, visto que se


perdeu os valores concretos do conjunto (ficaram
afetos a uma determinada classe) no se pode
calcular a mdia amostral diretamente dos valores
dos dados.

Deste modo, cada classe vai ser atribudo um representante


(xi), e a mdia amostral ser calculada por meio desses
representantes:
k

n x
i

x=

i=1

(dados agrupados em classes)

onde k o nmero de classes do agrupamento, ni a


freqncia absoluta da classe i e xi o ponto mdio da classe
i, o qual considerado como elemento representativo da
classe.
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

13

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.1) Mdia aritmtica:

a.1) Mdia aritmtica:

Exemplo (dados agrupados em classes):


Determinar a mdia da distribuio a seguir, a
qual representa o peso, em gramas, do contedo
de uma srie de 100 garrafas que, no decurso de
um teste, saram de uma linha de enchimento
automtico (exemplo anterior):

Exemplo (dados agrupados em classes):


Classes

ni

xi

xini

[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[

8
21
28
15
11
10
5
1
1

297,5
298,5
299,5
300.5
301,5
302,5
303,5
304,5
305,5

2380,0
6268,5
8386,0
4507,5
3316,5
3025,0
1517,5
304,5
305,5

100

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

n x
i

x=

i=1

n
30011,0
x=
100
x = 300 ,11

30011,0
ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.1) Mdia aritmtica (Ponderada)

a.1) Mdia aritmtica (Ponderada)

s vezes, associam-se os nmeros x1, x2, ..., xk a certos


fatores de ponderao ou pesos w1, w2, ... , wk que
dependem do significado ou importncia atribuda aos
mesmos. Nesse caso

Exemplo: Em um curso, a avaliao final tem peso 3 e as


parciais peso 1; a nota mdia de um estudante que obtenha
nota 8,5 na avaliao final e 7,0 e 9,0 nas provas parciais,
ser:

w x
w
i

x=

i =1

w1 x 1 + w 2 x 2 + ... + w k x k
w1 + w 2 + ... + w k

denominada de mdia aritmtica ponderada.

w x
i

x=

i =1
3

( 1 7 ,0 ) + ( 1 9 ,0 ) + ( 3 8 ,5 ) 41 ,5
=
= 8 ,3
1+ 1+ 3
5

i =1

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.2) Mdia geomtrica: A mdia geomtrica G (ou xG ) de


um conjunto de n nmeros x1, x2, ..., xn a raiz de
ordem n do produto desses nmeros:

G = n x1 x 2 ... x n
- Exemplo: A mdia geomtrica dos nmeros 2, 4 e 8:
3

a.2) Mdia geomtrica (dados agrupados): Se os elementos


x1, x2, ..., xn ocorrem com as freqncias n1, n2,..., nk,
sendo n1+n2+...+nk = n a freqncia total, a mdia
geomtrica G desses elementos ser deduzida como:

G = n x1 x1 ...x1 x 2 x 2 ...x 2 x k x k x k = n x1n1 x 2n2 ... xknk


n1 vezes

n2 vezes

nk vezes

G = 2 4 8 = 64 = 4
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

14

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.3) Mdia harmnica: A mdia harmnica H (ou x H ) de


um conjunto de n elementos x1, x2, ..., xn a
recproca da mdia aritmtica da recproca dos
elementos:
H=

1
=
1 n 1

n j =1 x j

a.4) Mediana: Para os dados colocados em ordem crescente,


x ) o valor que divide a amostra,
mediana (md, Me ou ~
ou populao, em duas partes iguais. Assim:

x
j =1

0%

50%

- Exemplo: A mdia harmnica dos nmeros 2, 4 e 8:


H=

n
n

x
j =1

3
3
= = 3 ,43
1 1 1 7
+ +
2 4 8 8

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.4) Mediana (varivel discreta):

a.4) Mediana (varivel discreta):

Considerando que os dados que integram a


amostra so colocados em ordem crescente,
formando um vetor (x1, x2, ..., xn) - amostra
ordenada -, a mediana amostral definida como
segue:
x~ = x n+ 1
n mpar

x n + x n+ 2
~
2
x= 2

n par

Exemplo: Para as distribuies abaixo, determinar as


respectivas medianas:
8, 5, 15,11, 4, 1, 7, 2, 9

8, 5, 15,11, 4, 1, 7, 2, 9, 3

Ordenando:

Ordenando:

1, 2, 4, 5, 7, 8, 9, 11,15

1, 2, 3, 4, 5, 7, 8, 9, 11,15

Como n mpar, ento:

Como n par, ento:

x~ = x n+ 1 = x5 = 7

x~ =

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

Exemplo: Para a distribuio abaixo, determinar a mediana:


ni

Ni

1
3
5
2

1
4
9
11

11

x5 + x6 5 + 7
=
=6
2
2

ESTATSTICA APLICADA I - Estatstica Descritiva

a) Medidas de posio:

a.4) Mediana (varivel discreta, tabela de distribuio de


freqncia):

1
2
3
4

x n + x n+ 2

1.5 Estatsticas Amostrais

a) Medidas de posio:

xi

100%

x~

n = 11 (mpar), logo ~
x ser o
elemento de ordem (n+1)/2, ou
seja, (11+1)/2 = 6 elemento.
contm o 6
elemento

Da
coluna
da
freqncia
acumulada crescente, encontra-se
o valor xi correspondente classe
que contm a ordem calculada,
assim: ~
x = 3.

ESTATSTICA APLICADA I - Estatstica Descritiva

a.4) Mediana (varivel discreta, tabela de distribuio de


freqncia):
Exemplo: Para a distribuio abaixo, determinar a mediana:
n = 42, par, logo ~
x ser a mdia
xi
ni
Ni
entre os elemento de ordem n/2 e
82
85
87
89
90

9
12
11
6
4

42

9
21
32
38
42

21
22

(n/2)+1, ou seja, 21 e 22
elementos.
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 85
e 87, assim:
85 + 87
x~ =
= 86
2
ESTATSTICA APLICADA I - Estatstica Descritiva

15

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.4) Mediana (varivel discreta, tabela de distribuio de


freqncia):
Exemplo: Para a distribuio abaixo, determinar a mediana:
n = 42, par, logo ~
x ser a mdia
xi
ni
Ni
entre os elemento de ordem n/2 e
82
85
87
89
90

5
10
15
8
4

42

5
15
30
38
42

(n/2)+1, ou seja, 21 e 22
elementos.
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 87
e 87, assim:

21 e 22

87 + 87
~
x=
= 87
2

a.4) Mediana (varivel contnua, tabela de distribuio de


freqncia):
Para variveis contnuas, identifica-se a classe que contm a
mediana (n/2), denominada classe Md (como a varivel
contnua, no interessa se n par ou mpar); o valor
aproximado para a mediana ser calculado pela equao:
n

N Md 1 a Md
0 ,5 FMd 1
2

x~ = l Md +
a Md
= l Md +
n Md
f Md

onde: NMd-1 a freqncia absoluta acumulada da classe antes da classe


mediana, n a dimenso da amostra e lMd , aMd e nMd so, respectivamente,
o limite inferior, a amplitude e a freqncia absoluta da classe mediana.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.4) Mediana (varivel contnua, tabela de distribuio de


freqncia):
Exemplo: Dada a distribuio amostral, calcular a mediana:

a.4) Mediana (varivel contnua, tabela de distribuio de


freqncia):
Exemplo:

Classes

ni

Ni

1 Passo: Calcula-se n/2; como n=58, ento 58/2=29.

35
45
55
65
75
85

5
12
18
14
6
3

5
17
35
49
55
58

2 Passo: Identifica-se a classe Md pela Ni (classe Md=3).

45
55
65
75
85
95

classe Md

3 Passo: Aplica-se a frmula:


Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:

n
58

N i 1 ai
17 10
2
= 55 + 2
= 61 ,67
x~ = l i +
ni
18

58

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.5) Quartis:

a.5) Quartis:

Como j visto anteriormente, a mediana a


medida de posio que divide um conjunto de
dados em duas partes iguais;
Os quartis dividem um conjunto de dados em
quatro partes iguais, assim:
50%

25%
Q1

75%
Q2

Q3

ESTATSTICA APLICADA I - Estatstica Descritiva

50%

25%
Q1

75%
Q2

Q3

Q1 = 1 quartil, deixa 25% dos elementos;


Q2 = 2 quartil, coincide com a mediana, deixa 50% dos
elementos;
Q3 = 3 quartil, deixa 75% dos elementos.
ESTATSTICA APLICADA I - Estatstica Descritiva

16

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.5) Quartis:

a.5) Quartis:

A determinao de Qk (k = 1, 2 e 3) para variveis discretas


segue a frmula:

n +1
Qk = k

A determinao de Qk (k = 1, 2 e 3), para o caso


de variveis contnuas, segue os passos:
- 1 Passo: Calcula-se a ordem kn/4;

Exemplo: Determine o 1 e o 3 quartis da srie 185, 196, 207,


305, 574, 597, 612. E da srie 185, 196, 207, 305, 574, 597 ?

- 2 Passo: Identifica-se a classe Qk pela freqncia acumulada N;


- Aplica-se a frmula:

7 +1
7 + 1
Q1 = 1
Q = 3
= 2 elemento 196
= 6 elemento 597
4
4
6 + 1

6
+
1

= 5,25 elemento 579 ,8


Q1 = 1
= 1,75 elemento 193,3 Q = 3
4
4

kn

N Qk 1

4
a
Q k = l Qk +
Qk
nQ k

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio

a) Medidas de posio:

a.5) Quartis:

a.5) Quartis:

Exemplo: Dada a distribuio amostral, determinar Q1 e Q3:


Classes

ni

Ni

35
45
55
65
75
85

5
12
18
14
6
3

5
17
35
49
55
58

45
55
65
75
85
95

Exemplo: Para Q1.


1 Passo: Calcula-se n/4; como n=58, ento 58/4=14,5.
2 Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2).

classe Q1

classe Q3

58

3 Passo: Aplica-se a frmula:


Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:
1n

N Q1 1

(14 ,5 5 )
4

Q1 = l Q1 +
a Q1 = 45 +
10 = 52 ,92
nQ1
12

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

a.5) Quartis:

a.5) Quartis:

Exemplo: Para Q3.


1 Passo: Calcula-se 3n/4; como n = 58, ento 58/4 = 43,5.

Exemplo: Diante desses resultados, pode-se afirmar que,


nesta distribuio, tem-se:

2 Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4).


3 Passo: Aplica-se a frmula:
Neste caso lQ3 = 65, n = 58, NQ1-1 = 35, aQ1 = 10, nQ1 = 14; logo:
3n

N Q3 1

4
a = 65 + (43 ,5 35 ) 10 = 71 ,07
Q 3 = l Q3 +
Q3
nQ 3
14
ESTATSTICA APLICADA I - Estatstica Descritiva

25%
35

52,92

25%
61,67

25%

25%
71,07

95

ou seja: O valor de 52,92 deixa 25% dos elementos;


O valor de 61,67 deixa 50% dos elementos;
O valor de 71,07 deixa 75% dos elementos.
ESTATSTICA APLICADA I - Estatstica Descritiva

17

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.6) Decis:

a.6) Decis:

Os decis dividem um conjunto de dados em dez


partes iguais, assim:
10% 20% 30% 40% 50% 60% 70% 80% 90%

D1

D2

D3

D4

D5

D6

D7

D8

D9

D1 = 1 decil, deixa 10% dos elementos da srie;


D2 = 2 decil, deixa 12% dos elementos da srie;
D5 = 5 decil, coincide com a mediana, deixa 50% dos
elementos da srie;
D6 = 6 decil, deixa 60% dos elementos da srie;
D7 = 7 decil, deixa 70% dos elementos da srie;
D8 = 8 decil, deixa 80% dos elementos da srie;
D9 = 9 decil, deixa 90% dos elementos da srie.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.6) Decis (variveis discretas):

a.6) Decis:

A determinao de Dk (k = 1, 2, ..., 9) para variveis


discretas segue a frmula:

n +1
Dk = k

10

A determinao de Dk (k = 1, 2, ..., 9), para o caso


de variveis contnuas, segue os passos:
- 1 Passo: Calcula-se a ordem kn/10;

Exemplo: Determine o 5 e o 6 decis da srie 185, 196, 207,


305, 574, 597, 612.

- 2 Passo: Identifica-se a classe Dk pela freqncia acumulada N;


- Aplica-se a frmula:
kn

N Dk 1

10
a
D k = l Dk +
Dk
n Dk

7 +1
D1 = 5
= 4 elemento 305
10
7 +1
D6 = 6
= 4 ,8 elemento 520 ,2
10
ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.7) Percentis:

a.7) Percentis:

Os percentis dividem um conjunto de dados em


cem partes iguais, assim:
1%

P1

ESTATSTICA APLICADA I - Estatstica Descritiva

2% 3% . . . 50% . . . 97%

P2

P3

P50

98% 99%

P97

P98

P99

P1 = 1 percentil, deixa 1% dos elementos;


P2 = 2 percentil, deixa 2% dos elementos.
P50 = 50 percentil, coincide com a mediana, deixa 50% dos
elementos;
P99 = 99 percentil, deixa 99% dos elementos.

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

18

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.7) Percentis:

a.7) Percentis:

A determinao de Pk (k = 1, 2, ..., 99), para o


caso de variveis contnuas, segue os passos:

A determinao de Pk (k = 1, 2, ..., 99), para variveis


discretas segue a frmula:

n +1
Pk = k

100

- 1 Passo: Calcula-se a ordem kn/100;


- 2 Passo: Identifica-se a classe Pk pela freqncia acumulada N;
- Aplica-se a frmula:

Exemplo: Determine o 50 e o 60 percentis da srie 185, 196,


207, 305, 574, 597, 612.

kn

N Pk 1

100
a
Pk = l Pk +
Pk
n Pk

7 +1
P50 = 50
= 4 elemento 305
100
7 + 1
D6 = 60
= 4 ,8 elemento 520 ,2
100

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.7) Exemplo (decil e percentil): Determinar o 4 decil e o 72

a.7) Exemplo (decil e percentil): Determinar o 4 decil e o 72

percentil da seguinte distribuio:


Classes

ni

Ni

35
45
55
65
75
85

5
12
18
14
6
3

5
17
35
49
55
58

45
55
65
75
85
95

percentil da seguinte distribuio:


Clculo de D4

1 Passo:
classe D4

2 Passo:

kn 4 58
= 23 ,2 o
=
10
10
l D4 = 55 ; N D4 1 = 17 ; n = 58 ;
a D4 = 10 ; nD4 = 18

classe P72

3 Passo:

58

4 58

17

10
10 = 55 ,34
D4 = 55 +
18

Classes

ni

Ni

35
45
55
65
75
85

5
12
18
14
6
3

5
17
35
49
55
58

45
55
65
75
85
95

a) Medidas de posio:

1 Passo:
classe D4

2 Passo:

classe P72

kn 72 58
= 41 ,8 o
=
100
100
l P72 = 65 ; N P72 1 = 35 ; n = 58 ;
a P72 = 10 ; nP72 = 14

3 Passo:

58

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

Clculo de P72

72 58

35

100
10 = 69 ,82
P72 = 65 +
14

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


a) Medidas de posio:

a.7) Exemplo (decil e percentil).


Portanto, na distribuio analisada, tem-se que:
- O valor 55,34 indica que 40% dos elementos da
distribuio esto abaixo dele e os outros 60%
acima.
- O valor 69,82 indica que 72% dos elementos da
distribuio esto abaixo dele e os outros 28%
acima.
ESTATSTICA APLICADA I - Estatstica Descritiva

a.8) Moda
Moda (Mo) a medida que indica o valor ou a gama
de valores nos quais a concentrao dos dados
amostrais mxima.
- Para variveis discretas, a moda o valor dos dados
que ocorre com maior freqncia;
- Para variveis contnuas, a classe modal o intervalo
de classe com maior freqncia.
ESTATSTICA APLICADA I - Estatstica Descritiva

19

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.8) Moda

a.8) Moda

Assim, da representao grfica dos dados, obtm-se


imediatamente o valor que representa a moda ou a
classe modal.

Esta medida especialmente til para reduzir a


informao de um conjunto de dados qualitativos,
apresentados sob a forma de nomes ou categorias,
para os quais no se pode calcular a mdia e por
vezes a mediana (se no forem susceptveis de
ordenao).

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.8) Moda (distribuies simples)

a.8) Moda (dados agrupados)

Para distribuies simples (sem agrupamento em


classes), a identificao da moda facilitada pela
simples observao do elemento que apresenta maior
freqncia.

Para dados agrupados em classe, existem diversas


frmulas para o clculo da moda:
- Frmula de Czuber: Aps a identificao da classe modal,
aplica-se a frmula abaixo, onde

- Exemplo: Para a distribuio abaixo Mo = 248.


xi

243

ni

245

248

251

307

17

23

20

M o = li +

1
1 + 2

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a.8) Moda (dados agrupados)

a.8) Moda (dados agrupados)

- Exemplo: Determinar a moda para a distribuio:


ni

35
45
55
65
75
85

5
12
18
14
6
3

45
55
65
75
85
95

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

Classes

ai

l = limite inferior da classe modal;


1= diferena entre a freqncia absoluta da
classe modal e a imediatamente anterior;
2 = diferena entre a freqncia absoluta da
classe modal e a imediatamente posterior;
ai = amplitude da classe modal.

- A classe com maior frequncia absoluta


[55, 65[; logo, ela a classe modal.
- Aplicando a frmula de Czuber, tem-se:
Mo = li +

- Densidades de classes: Quando as amplitudes das


classes so diferentes, deve-se calcular as densidades
de classes para identificar a classe modal, as quais so
obtidas por meio da relao ni/ai.

1
ai
1 + 2

M o = 55 +

18 12
10
( 18 12 ) + ( 18 14 )

M o = 61
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

20

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

a.8) Moda (dados agrupados)

a.8) Moda (dados agrupados)

- Exemplo: Determinar a moda para a distribuio:


Salrios (US$)
80
180
250
300
Mo = li +

180
250
300
500

ni

ai

ni/ai

70
140
140
60

100
70
50
200

0,7
2,0
2,8
0,3

- Frmula de Pearson: Fornece uma boa aproximao


quando a distribuio apresenta razovel simetria em
relao mdia. dada pela relao:
Mo 3~
x 2x

classe modal

1
2 ,8 2 ,0
a i = 250 +
50 = 262 ,12
( 2 ,8 2 ,0 ) + ( 2 ,8 0 ,3 )
1 + 2

ou seja, a moda aproximadamente igual a diferena


entre o triplo da mediana e o dobro da mdia

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

 Observaes:

 Observaes:
1. Mdia versus Mediana:

1. Mdia versus Mediana:


 Diferena entre estas duas medidas fica mais clara quando se
considera o exemplo das notas obtidas por um aluno como
sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode
ser comprovado, a mdia aritmtica e a mediana so iguais a 14.

 A mdia, ao contrrio da mediana, uma medida de posio


muito pouco resistente, isto , ela muito influenciada por
valores muito grandes ou muito pequenos, mesmo que estes
valores surjam em pequeno nmero na amostra.

 Se esse aluno elevar a nota mais baixa, passando de 10 para 14,


a mediana ainda ser o mesmo valor, mas o valor da mdia
sofrer um aumento, passando para 14,4.

 Estes valores so os responsveis pela m utilizao da mdia


em muitas situaes em que teria mais significado utilizar a
mediana.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

a) Medidas de posio:

a) Medidas de posio:

 Observaes:

 Observaes:

1. Mdia versus Mediana:

1. Mdia versus Mediana:

 Entretanto, a preferncia de uma ou de outra depender do


contexto em que forem utilizadas: se a distribuio simtrica
essas medidas coincidem; caso contrrio, observar que a mediana
no to sensvel quanto a mdia, s observaes que so muito
maiores ou muito menores do que as restantes; alm disso, a
mdia reflete o valor de todas as observaes.

ESTATSTICA APLICADA I - Estatstica Descritiva

 Representao das distribuies dos dados na forma de uma


curva de freqncia:

ESTATSTICA APLICADA I - Estatstica Descritiva

21

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

a) Medidas de posio:

b) Medidas de disperso

 Observaes:
2. Relao entre as mdias aritmtica, geomtrica e harmnica:
 A mdia geomtrica de um conjunto de nmeros positivos
menor ou igual sua mdia aritmtica, mas maior ou igual
sua mdia harmnica:

H G x
 O sinal de igualdade somente vlido quanto todos os nmeros
do conjunto de dados so idnticos.

So medidas estatsticas utilizadas para avaliar o grau de


variabilidade ou disperso, dos valores em torno da
mdia.
Servem para medir a representatividade da mdia
- Exemplo: Sejam as sries 20, 20, 20 e 15, 10, 20, 25, 30,
como pode ser calculado, ambas possuem mdia aritmtica
igual a 20; entretanto, na primeira no existe disperso,
enquanto a segunda apresenta disperso em torno da mdia 20;
portanto, a mdia muito mais representativa para a segunda
srie.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.1) Amplitude total (ou amplitude amostral): definida


como sendo a diferena entre o maior e o menor dos
valores da srie, ou seja:

b.2) Desvio mdio: O desvio mdio de um conjunto de n


nmeros x1, x2 , ... , xn definido por:
n

R = x mx x min

DM =

i=1

i =1

x
=

x x
n

- Exemplo: Para a srie 10, 12, 15, 24, 25, 30, 36


onde

R = 36 10 = 26

- Observao: uma medida de disperso muito limitada, pois


depende apenas dos valores externos, o que a torna instvel, no
sendo afetada pela disperso dos valores internos.

x = mdia aritmtica dos nmeros;


x i x = valor absoluto do desvio de cada nmero
em relao mdia aritmtica.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.2) Desvio mdio (dados agrupados): Se x1, x2 , ... , xn


ocorrerem com as freqncias n1, n2, ... , nn,
respectivamente, o desvio mdio poder ser indicado
da seguinte forma:
n

n
DM =

i=1

ESTATSTICA APLICADA I - Estatstica Descritiva

di
=

xi x

i =1

x x
n

ESTATSTICA APLICADA I - Estatstica Descritiva

b.3) Varincia: A varincia de um conjunto de dados


definida como o quadrado do desvio padro, evitandose com isso que di=0.
- Quando necessrio distinguir entre o desvio
padro de uma populao e o de uma amostra
dela extrada, adota-se frequentemente o smbolo
para o primeiro e s para o ltimo.

ESTATSTICA APLICADA I - Estatstica Descritiva

22

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.3) Varincia:

b.3) Varincia:

- Para o caso da varincia populacional so


adotadas as seguintes frmulas:

- Para o caso da varincia amostral so adotadas


as seguintes frmulas:
n

( x
2 =

X )2

i =1

( x X )

(dados no agrupados)

( x
s2 =

n ( x
i

2 =

x )2

( x x )

n1

i=1

(dados no agrupados)

n1

X)

i =1

n ( x X )

(dados agrupados)

n ( x
i

s2 =

X = mdia populacional; N = tamanho da populao.

x)

i=1

n1

n ( x x )

n1

b) Medidas de disperso

b.3) Varincia:
Frmulas prticas para os clculos das varincias:

s2 =

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b) Medidas de disperso

1
ni x i2
N

( n x )

1
ni x i2
n1

( n x )

2 =

(dados agrupados)

x = mdia populacional; n = tamanho da populao.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b.4) Desvio padro: Uma vez que a varincia envolve a


soma de quadrados, a unidade em que se exprime no
a mesma que a dos dados. Assim, para se conseguir
uma medida da variabilidade ou disperso com as
mesmas unidades que os dados, toma-se a raiz
quadrada da varincia e obtm-se o desvio padro.

= 2

s= s

(desvio padro populacional)

(desvio padro amostral)

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.4) Desvio padro:

b.4) Desvio padro:

O desvio padro uma medida que s pode assumir valores


no negativos e quanto maior for, maior ser a disperso
dos dados.
Algumas propriedades do desvio padro, que resultam
imediatamente da definio, so:
- o desvio padro sempre no negativo e ser tanto maior,
quanta mais variabilidade houver entre os dados;
- se s= 0, ento no existe variabilidade, isto , os dados so
todos iguais.
ESTATSTICA APLICADA I - Estatstica Descritiva

Exemplo: Calcular o desvio mdio, a varincia e o desvio


padro da seguinte distribuio amostral:
xi

11

xi

ni

nixi

ni

5
7
8
9
11

2
3
5
4
2

10
21
40
36
22

16

129

- Mdia aritmtica:
k

n x
i

x=

i =1

n x

i =1

16

129
= 8 ,06
16

ESTATSTICA APLICADA I - Estatstica Descritiva

23

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.4) Desvio padro:

b.4) Desvio padro:

Exemplo: Calcular o desvio mdio, a varincia e o desvio


padro da seguinte distribuio amostral:

Exemplo: Calcular o desvio mdio, a varincia e o desvio


padro da seguinte distribuio amostral:
- Varincia:

- Desvio mdio:
DM =

x x
n

19 ,24
= 1 ,2
16

xi

ni

nixi

|xi-x| = |di|

ni|di|

5
7
8
9
11

2
3
5
4
2

10
21
40
36
22

|5 8,06| = 3,06
|7 8,06| = 1,06
|8 8,06| = 0,06
|9 8,06| = 0,94
|11 8,06| = 2,94

6,12
3,18
0,30
3,76
5,88

16 129

19,24

- Desvio padro:
s = s 2 = 2 ,86 = 1,69

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


b) Medidas de disperso

2
nx
1
ni x i2 i i =
n1
n

1
( 129 ) 2
s2 =
1
.
083

=
2
,86

16 1
16

s2 =

xi

ni

nixi

ni2xi

5
7
8
9
11

2
3
5
4
2

10
21
40
36
22

50
147
320
324
242

16 129 1.083

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


b) Medidas de disperso

b.5) Amplitude interquartlica:


A medida anterior tem a grande desvantagem de
ser muito sensvel existncia, na amostra, de
uma observao muito grande ou muito pequena.
Por esse motivo, define-se uma outra medida, a
amplitude interquartlica.

b.5) Amplitude interquartlica:


Esta medida , de certa forma, uma soluo de
compromisso, pois no afetada, de um modo
geral, pela existncia de um pequeno nmero de
valores demasiadamente grandes ou pequenos.
definida como sendo a diferena entre o 3 e 1
quartis; assim:
DQ = Q3 Q1

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


b) Medidas de disperso

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


b) Medidas de disperso

b.5) Amplitude interquartlica:


Da definio de amplitude interquartlica, pode-se concluir
que 50% dos elementos do meio da amostra esto contidos
num intervalo com aquela amplitude. Esta medida no
negativa e ser tanto maior quanto maior for a variabilidade
nos dados.
Ao contrrio do que acontece com o desvio padro, uma
amplitude interquartlica nula no significa necessariamente,
que os dados no apresentem variabilidade.
ESTATSTICA APLICADA I - Estatstica Descritiva

b.5) Amplitude interquartlica:


Alguns autores preferem calcular uma medida
prxima da referida: a amplitude semiinterquartlica (ASI).

ASI =

Q3 Q1
2

ESTATSTICA APLICADA I - Estatstica Descritiva

24

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

b) Medidas de disperso

b) Medidas de disperso

b.6) Coeficiente de variao:

b.6) Coeficiente de variao:

A variao ou disperso real, determinada a partir


do desvio padro, ou qualquer outra medida de
disperso, denominada disperso absoluta;
entretanto, uma variao ou disperso, na medida
de uma determinada distncia, inteiramente
diferente quanto ao efeito, da mesma variao em
uma distncia menor.

A medida desse efeito proporcionada pela


disperso relativa, definida por:
Disperso relativa =

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b) Medidas de disperso

b.6) Coeficiente de variao:

b.6) Coeficiente de variao:

Se a disperso absoluta o desvio padro e a


mdia a aritmtica, a disperso relativa
denominada coeficiente de variao ou de
disperso, dado por:

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

b) Medidas de disperso

CV =

Disperso absoluta
Mdia

100

ou

CV =

s
100
x

coeficiente de variao uma medida relativa de disperso,


til para a comparao em termos relativos do grau de
concentrao em torno da mdia de sries distintas.

Exemplo: Em uma empresa, o salrio mdio dos homens


de $4.000,00, com desvio padro de $1.500,00, e o das
mulheres em mdia de $3.000,00, com desvio padro de
$1.200,00. Ento:
Para os homens:
Para as mulheres:

b) Medidas de disperso

100 =

Desses valores conclui-se, portanto, que o salrio das


mulheres apresentam maior disperso que os dos homens

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

1500
100 = 37 ,5%
4000
1200

CV = 100 =
100 = 40 ,0%
X
3000

CV =

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais


c) Medidas de forma

b.6) Coeficiente de variao:


Diz-se que a distribuio possui baixa, mdia ou alta
variabilidade (disperso) conforme os seguintes valores:
Baixa disperso: CV 10%
Mdia disperso: 10% < CV < 20%
Alta disperso:
CV 20%

c.1) Medidas de assimetria:


Denomina-se assimetria o grau de desvio ou
afastamento da simetria de uma distribuio.
Uma distribuio de freqncia pode simtrica,
assimtrica positiva ou assimtrica negativa.

Alguns analistas consideram valores diferentes:


Baixa disperso: CV 15%
Mdia disperso: 15% < CV < 30%
Alta disperso:
CV 30%
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

25

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

c) Medidas de forma

c) Medidas de forma

c.1) Medidas de assimetria:

c.1) Medidas de assimetria:

Uma distribuio simtrica apresenta a igualdade entre as trs


medidas de posio, mdia aritmtica, mediana e modo, ou:

M o = x~ = x

Existem vrias frmulas para o clculo do coeficiente de


assimetria, dentre elas duas so bastante utilizadas:
- 1 Coeficiente de Pearson:

Em uma distribuio assimtrica positiva, ou assimtrica


direita, tem-se que:

Mo < ~
x<x

Em uma distribuio assimtrica negativa, ou assimtrica


esquerda, tem-se que:

x<~
x < Mo

- 2 Coeficiente de Pearson:

ou

AS =

x Mo
s

Q1 + Q3 2 ~
x
Q 3 Q1

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

c) Medidas de forma

c) Medidas de forma

c.1) Medidas de assimetria:

c.1) Medidas de assimetria:

Exemplo: Identificar o grau de assimetria da


distribuio:

Exemplo:
Classes

Salrios ($1.000,00)

30 50

50 100

100 150

Empregados

60

50

30

xi

30 50 40
50 100 75
100 150 125

ni

nixi

80
50
30

3200
3750
3750

160 10.700

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

nixi2

ni/ai

128.000 80/20 = 4
281.250 50/50 = 1
468.750 30/50 = 0,6

Ni
80
130
160

878.000

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

c) Medidas de forma

c) Medidas de forma

c.1) Medidas de assimetria:

c.2) Medidas de curtose:

Exemplo:
10.700
x=
= 66 ,875
160
1
( 10.700 )2
2
s =
878.000
= 1021,62
159
160

4
M o = 30 +
20 = 41 ,429
4+3
1
( 10.700 )2
2
s =
878.000
= 1021,62
159
160

s = 31 ,96

AS =

x Mo

Se AS = 0, a distribuio simtrica
AS > 0, a distribuio assimtrica positiva
AS < 0. a distribuio assimtrica negativa.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

AS =

( 40 0 )
Q1 = 30 +
20 = 40
80
Q 3 = 50 +

( 120 80 )
50 = 90
50

( 80 0 )
~
x = 30 +
20 = 50
80
x M o 66 ,85 41 ,429
AS =
=
= 0 ,796
s
31 ,96
Q + Q 3 2 x~ 40 + 90 2
AS = 1
=
= 0 ,6
Q3 Q1
90 40

Denomina-se curtose o grau de achatamento de


uma distribuio.
Uma distribuio de freqncia pode ser:
- Mesocrtica: quando sua forma nem achatada e
nem delgada;
- Leptocrtica: quando apresenta a forma delgada;
- Platicrdica: quando apresenta a forma achatada.

- Como AS > 0, ento a distribuio assimtrica positiva.


ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

26

1.5 Estatsticas Amostrais

1.5 Estatsticas Amostrais

c) Medidas de forma

c) Medidas de forma
c.2) Medidas de curtose:

c.2) Medidas de curtose:

Para medir o o grau de curtose utiliza-se o coeficiente:

K=

Q 3 Q1
2( P90 P10 )

onde Q3 = 3 quartil; P90 = 90 percentil;


Q1 = 1 quartil; P10 = 10 percentil.
Se K = 0,263 a curva correspondente distribuio
mesocrtica;
K > 0,263 a curva platicrdica;
K < 0,263 a curva leptocrdica.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.5 Estatsticas Amostrais

ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

c) Medidas de forma


Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

c.2) Medidas de curtose:


Exemplo: Para a mesma distribuio do exemplo da assimetria,
calcula-se ainda P10 e P90; logo:
( 16 0 )
P10 = 30 +
20 = 34
80
( 144 130 )
P90 = 100 +
50 = 104 ,375
160
Q 3 Q1
90 40
K=
=
= 0 ,355
2( P90 P10 ) 2( 104 ,375 34 )

- Como K > 0,273, ento a distribuio do tipo platicrtica.


ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados

Alm dos diagramas j estudados, existem outras formas bastante


utilizadas internacionalmente para apresentar os dados amostrais. Um
bom modo de obter uma apresentao visual eficiente de um conjunto de
dados pode ser conseguido por meio de trs tipos de grficos: diagramas
de pontos, diagramas de ramo e folhas e diagramas de caixa.
O diagrama de pontos uma apresentao til de dados, no caso de
amostras pequenas (at cerca de 20 observaes). Entretanto, quando o
nmero de observaes for moderadamente alto, o diagrama de ramo e
folhas e o diagrama de caixa podem ser mais teis.
Questes como quantidades de dados abaixo de certo valor, tendncia
central (mdia ou mediana), disperso (desvio-padro), possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e o
desvio da simetria, no so fceis de responder, pois existem muitas
observaes, e a construo de um diagrama de pontos, usando esses
dados, seria relativamente ineficiente .
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de pontos
Um diagrama de pontos um grfico estatstico que consiste em
grupos de pontos de dados traados em uma escala simples.
So utilizados para dados contnuos, quantitativos e univariados, e
so muito teis para exibir um pequeno conjunto de dados.
Esse tipo de grfico permite uma fcil visualizao de duas
caractersticas dos dados: a posio (meio) e a disperso
(espalhamento ou variabilidade)

ESTATSTICA APLICADA I - Estatstica Descritiva

27

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de pontos

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de pontos

Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro est


projetando um conector de nilon para ser usado em aplicao
automotiva. Ele considera estabelecer como especificao do projeto
uma espessura de 3/32 pol., mas est inseguro. Oito unidades do
prottipo so produzidas e suas foras de remoo so medidas,
resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3;
13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses
dados.

12

13
14
Fora de remoo

Exemplo 02: O engenheiro do exemplo anterior decide considerar


um projeto alternativo com uma espessura maior da parede do
conector, 1/8 pol. Oito prottipos desse projeto so construdos,
sendo as medidas observadas da fora de remoo, resultando nos
seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e
13,1. Construa um diagrama de pontos para esses dados,
sobrepondo-o ao anterior para uma melhor anlise da influncia da
espessura da parede na fora de remoo.

15

12

14
13,0 13,4
Fora de remoo

3/32 pol.
1/8 pol.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas

Esta forma de apresentao de dados tem sido freqentemente


utilizada em trabalhos tcnicos do mundo inteiro.
Para construir o diagrama de ramo e folhas, dividimos o elemento
amostral em duas partes: um ramo (stem), consistindo em um ou
mais dgitos iniciais, e uma folha (leaf), consistindo nos dgitos
restantes.
Exemplo: O dado 458 dividido em duas partes, a primeira parte 45,
e a segunda parte 8.
Geralmente, escolhe-se relativamente poucos ramos em comparao
ao nmero de observaes (5 a 20 itens).

Exemplo (Montgomery, 2004, p.16): Considere o


conjunto de dados abaixo, relativos resistncia a
compresso de uma liga de alumnio.
105
245
207
218
160

221
228
180
157
175

183
174
190
101
149

186
199
193
171
87

121
181
194
165
160

181 180
158 176
133 156
172 158
237 150

143
110
123
169
135

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas (dados brutos)
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

Folha
6
7
7
5
5
1
4
2
4
3
8
0
9
7
8
1
7
5

1
8
0
1
9
7
0
5
3
6
1

0
3
3
5
1
7
4
6
0
0

8 9

5
8
3
3
4
1
9
8

3
3
4
0
1
4
3

5
1
0
5
6
1
4

6
8
0
2
0

9
8 6 8 0 8
8 7 9
1 0 6

154
131
178
151
201

153 174
154 115
76 167
142 163
200 176

120
160
184
145
150

168
208
135
171
170

167
158
229
148
118

141
133
146
158
149

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas (dados ordenados)

Frequncia

Ramo

1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1

7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

ESTATSTICA APLICADA I - Estatstica Descritiva

97
163
134
199
196

O diagrama de ramo e folhas resultante apresentado a


seguir:

ESTATSTICA APLICADA I - Estatstica Descritiva

Ramo

15

Folha
6
7
7
1
0
0
1
1
0
0
0
0
0
0
8
1
7
5

5
5
1
3
2
0
0
1
0
3
1

8
3
3
3
1
0
1
1
4
7

8 9

4
5
3
3
2
1
6
8

5
6
4
3
4
3
9

5
8
4
5
4
4
9

9
6
7
5
6

9
7 8 8 8 8
7 8 9
6 6 8

Frequncia
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1

ESTATSTICA APLICADA I - Estatstica Descritiva

28

1.6 Outras Apresentaes Grficas de Dados

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas

 Diagrama de ramo e folhas


Em alguns casos pode ser desejvel construir mais intervalos ou
ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em
dois ou mais novos ramos, conforme mostrado abaixo:
Ramo
14L
14U
15L
15U

Folha
1
6
0
6

2
8
0
7

3
9
1
8

Ramo

5
9
3 4 4
8 8 8

14z
14t
14f
14s
14e
15z
15t
15f
15s
15e

Ramo

1
2
3
5
8
11
17
25
37
(10)
33
23
16
10
6
5
2
1

7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24

N = 80
Min = 76
Max = 245
Mdia = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00
S2 = 33,77

Folha
1
2
3
5
0
1
4
6
8

Freqncia acumulada

0
3
4
7 8
8 8

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas

1567
1883
1203
1270
1015
845
1674
1016
1102
1605
706
2215
785
885

5
5
1
3
2
0
0
1
0
3
1

8
3
3
3
1
0
1
1
4
7

4
5
3
3
2
1
6
8

5
6
4
3
4
3
9

5
8
4
5
4
4
9

9
6
7
5
6

9
7 8 8 8 8
7 8 9
6 6 8

8 9

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de ramo e folhas

Exerccio (Montgomery, 2004, p.17): Os seguintes dados so os


nmeros de ciclos at a falha, de corpos de prova de alumnio,
sujeitos a uma tenso alternada repetida, de 21.000 psi e 18 ciclos
por segundo:
1115
1310
1540
1502
1258
1315
1085
798
1020
865
2130
1421
1109
1481

Folha
6
7
7
1
0
0
1
1
0
0
0
0
0
0
8
1
7
5

1223
375
2265
1910
1018
1452
1890
2100
1594
2023
1315
1269
1260
1888

1782
1522
1792
1000
1820
1940
1120
910
1730
1102
1578
758
1416
1560

1055
1764
1330
1608
1535
1781
1750
1501
1238
990
1468
1512
1750
1642

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de caixa (box plot)

(a) Construa um diagrama de ramo e folhas para esses dados. (b)


Voc acha que o corpo de prova sobreviver alm de 2.000
ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.

a)

Profundidade

Ramo

1
5
8
10
17
22
29
33
(5)
32
22
18
11
7
5
4
2

3
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22

Folha
75
06
45
10
00
02
03
10
16
01
05
30
20
10
23
00
15

58
65
90
15
02
23
15
21
02
08
50
83
40

85 98
85
16
09
38
15
52
12
42
50
88

18
15
58
30
68
22
74
64
90

20 55 85
20
60 69 70
81
35 40 60 67 78 94
81 82 92

b) No. A probabilidade
muito pequena.
c) M = 1436,5
Q1 = 1097,8
Q3 = 1735

30
65

ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados


 Diagrama de caixa (box plot)

Uma outra forma grfica de apresentar os dados o chamado


diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and
whiskers), que permite descrever simultaneamente vrios fatores
importantes de uma srie de dados, tais como a tendncia central
(mdia ou mediana), a disperso (desvio-padro), a possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e
o desvio da simetria.

A caixa inclui a amplitude interquartil, com o canto esquerdo (ou


inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no
terceiro quartil, Q3. Portanto, o comprimento da caixa igual a
amplitude interquartil , DQ = Q3 - Q1.

Um diagrama de caixa apresenta trs quartis, em uma caixa


retangular, alinhados tanto horizontal como verticalmente;
opcionalmente, pode apresentar a mdia.

Uma linha (whisker) estende-se de cada extremidade da caixa.

ESTATSTICA APLICADA I - Estatstica Descritiva

Uma linha desenhada atravs da caixa, no segundo quartil (que o


percentil 50 ou a mediana), Q2. A mdia, como j dito, opcional.

A linha inferior (ou esquerda) comea no primeiro quartil indo at o


menor valor do conjunto de pontos dentro das amplitudes
interquartis de 1,5, a partir do primeiro quartil.
ESTATSTICA APLICADA I - Estatstica Descritiva

29

1.6 Outras Apresentaes Grficas de Dados

1.6 Outras Apresentaes Grficas de Dados

 Diagrama de caixa (box plot)

 Diagrama de caixa (box plot)

A linha superior (ou direita) comea no terceiro quartil indo at o


maior do conjunto de pontos dentro das amplitudes interquartis de
1,5, a partir do terceiro quartil.
Dados mais afastados dos que as linhas so plotados como pontos
individuais. Um ponto alm da linha, porm a menos de 3
amplitudes interquartis a partir da extremidade da caixa, chamado
de dispersos (outliers).
Um ponto a mais de 3 amplitudes interquartis a partir da
extremidade da caixa chamado de um outlier extremo.
Ocasionalmente, smbolos diferentes (crculos abertos e fechados,
por exemplo) so usados para identificar os dois tipos de outlier.
ESTATSTICA APLICADA I - Estatstica Descritiva

1.6 Outras Apresentaes Grficas de Dados

ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

 Diagrama de caixa (box plot)


Exerccio: Represente o diagrama de caixa para os dados da
resistncia compresso do alumnio mostrados no exerccio
anterior.
N = 80
Min = 76
Max = 245
Mdia = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00

Introduo

Conceitos e definies

Classificao dos dados

Caracterizao e apresentao dos dados

Estatsticas amostrais

Outras apresentaes grficas de dados

Regresso linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Relao entre duas variveis


Em inmeras ocasies o estudo descritivo no se resume
ao estudo de apenas uma varivel; para se ter uma viso
global do problema em estudo, muitas vezes necessrio
a observao de duas ou mais variveis.
Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passase a ter dados bivariados (xi, yi), i = 1, 2, ..., n.
Um dos objetivos desse estudo a relao existente entre
as variveis do par.

ESTATSTICA APLICADA I - Estatstica Descritiva

 Correlao linear
Para se ter uma idia de como as duas variveis se
relacionam comum representar graficamente esta
relao por meio de um diagrama de disperso. Esta
representao consiste na marcao das observaes em
um sistema de eixos cartesianos.
Se as variveis fornecem um diagrama de disperso em
que os pontos se colocam ao redor de uma reta crescente
ou decrescente, diz-se que essas variveis esto
linearmente correlacionadas.
ESTATSTICA APLICADA I - Estatstica Descritiva

30

1.7 Regresso Linear

1.7 Regresso Linear

 Correlao linear

 Correlao linear

Quanto menor a disperso dos pontos em torno da reta,


mais forte ser a correlao.

A correlao linear ser positiva ou negativa caso a


tendncia da reta seja crescente ou decrescente.
Se nenhuma tendncia positiva ou negativa pode ser
detectada, a explicao possvel para os valores da
segunda varivel sua mdia. Nesse caso, o eixo da
disperso ser horizontal, contendo a mdia da segunda
varivel, e diz-se que as variveis no so linearmente
correlacionadas.

x
Correlao linear forte

Correlao linear fraca

(positiva)

(negativa)

(positiva)

ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Correlao linear

 Correlao linear

Correlao linear forte

Exemplo: A tabela abaixo mostra os dados da temperatura do gs


combustvel (F) e da respectiva taxa de calor (Btu/kwh) para uma
turbina de combusto, para ser usada em refrigerao, construa o
diagrama de disperso para esses dados.

x
Variveis no
correlacionadas

x
Variveis no
correlacionadas
linearmente

x
Variveis no
correlacionadas
linearmente

100

125

150

175

200

225

250

275

99,1

98,8

98,5

98,5

98,5

98,2

98,0

97,8

300

325

350

375

400

425

450

500

97,8

97,8

97,6

97,5

97,3

97,0

96,8

96,7

Desse diagrama pode-se extrair que talvez exista uma correlao


linear entre as variveis; esta relao pode ser traduzida por meio
de uma reta.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Coeficiente de correlao linear


A determinao da correlao entre duas variveis por
meio de uma inspeo nos pares anotados ou no
diagrama de disperso correspondente pouco precisa e
subjetiva.
Essa dificuldade pode ser contornada pelo uso de uma
medida que caracterize a correlao linear e seja
independente do observador que esteja examinando os
dados.

 Coeficiente de correlao linear


Karl Pearson props o chamado coeficiente de
correlao linear, o qual dado pela relao:
r=

Cov ( x , y )
s x2 s 2y

onde: Cov (x,y) a covarincia das variveis x e y, e seu


clculo dado por
Cov ( x , y ) =

( x x ) ( y y )
n1

e sx2 e sy2 so as varincias da variveis x e y.


ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

31

1.7 Regresso Linear

1.7 Regresso Linear

 Coeficiente de correlao linear

 Coeficiente de correlao linear

Fazendo-se as devidas substituies e simplificaes,


obtm-se o coeficiente de correlao de forma mais
simples:
s

r=

onde:

xy

r = 0, indica que os pontos no esto correlacionados,


nem apresentam tendncia crescente ou decrescente.

s xx s yy

( y )

r = 1, indica correlao linear positiva perfeita; os pontos


(x,y) esto sobre uma reta com coeficiente angular
positivo.

s yy = y 2

1 r 1

( x )

s xx = x 2

s xy = xy

r = -1, indica correlao linear negativa perfeita; os


pontos (x,y) esto sobre uma reta com coeficiente angular
negativo.

x y
n

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Coeficiente de correlao linear

 Coeficiente de correlao linear

Nos casos em que os pontos do diagrama de disperso esto em uma


reta vertical ou horizontal, o quociente que calcula o coeficiente de
correlao no est definido, pois apresenta numerador e
denominador nulos. Nesse caso, o coeficiente de correlao ser
considerado nulo.
y
y

A correlao entre duas variveis pretende captar o fato


dessas variveis apresentarem a mesma tendncia ao
crescimento, ou tendncias contrrias.
O fato de duas variveis evolurem no mesmo sentido ou
em sentidos opostos fornece uma idia do que se pode
esperar sobre um valor desconhecido da varivel y para
um particular valor de x.

r = 0, Cov (x,y) = 0, sy2 = 0

r = 0, pois Cov (x,y) = 0, sx2 = 0


ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Coeficiente de correlao linear

 Coeficiente de correlao linear

Se as variveis x e y so positivamente correlacionadas, e se procura


estimar o valor de y1 para certo valor x1 menor que a mdia x, devese esperar o valor correspondente y1 menor que a mdia y ; para um
valor x2 maior que a mdia x , deve-se esperar um valor y2 maior que
a mdia y, acompanhando a tendncia do eixo crescente dos pontos.
y
y2
y

y1
x1

ESTATSTICA APLICADA I - Estatstica Descritiva

x x2

ESTATSTICA APLICADA I - Estatstica Descritiva

Os problemas que envolvem estimativas de valores desconhecidos a


partir de valores histricos so chamados problemas de previso ou
predio.
O conhecimento da correlao entre duas variveis, embora possa
fornecer uma pista para a previso de um valor desconhecido de uma
delas, nada informa a respeito da qualidade dessa previso, ou seja,
no se pode, em geral, com base apenas no conhecimento da
correlao, transformar a incerteza da previso em risco (isto s pe
possvel quando a correlao perfeita).
Entretanto, o fato de duas variveis serem correlacionadas levanta a
possibilidade de uma relao causal entre elas, o que importante
em problemas de previso.
ESTATSTICA APLICADA I - Estatstica Descritiva

32

1.7 Regresso Linear

1.7 Regresso Linear

 Regresso linear simples

 Regresso linear simples Modelo terico

Como visto anteriormente, uma previso construda


baseada nas informaes obtidas da correlao nada diz a
respeito da confiabilidade do valor previsto.
Um mtodo de previso que permite a avaliao em
termos de confiabilidade a regresso linear, pois,
satisfeitas determinadas condies, ela proporciona a
transformao da incerteza em risco

Quando se verifica, quer por meio do grfico de


disperso, quer pelo coeficiente de correlao linear, uma
correlao forte entre duas variveis, a relao entre
essas variveis pode ser descrita por meio de uma reta de
regresso (a reta que melhor se ajusta aos dados).
Essa reta serve de modelo matemtico para expressar a
relao linear entre duas variveis.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Regresso linear simples Modelo terico


Considere o relacionamento de duas variveis x e y com
as seguintes caractersticas:
x: a varivel cujos valores so controlados e, portanto,
determinados; ela conhecida por varivel independente ou
varivel de deciso;
y: varivel aleatria; a varivel que se quer prever; seu valor
depende do valor atribudo a x, embora para cada valor de x se
possa ter vrios valores de y, devido a sua caracterstica aleatria
(varivel dependente de x).

 Regresso linear simples Modelo terico


O modelo terico define a verdadeira reta de regresso, cuja
equao pode ser escrita como:

y = + x
O valor de y dado por:

y = y+U

ou

y = + x+U

onde:
y a parte funcional de y (a parte do valor de y explicada pelo
valor de x);
U a parte aleatria de y, a qual introduzida no valor de y por
fatores imponderveis.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Regresso linear simples Modelo terico


Nessas condies, dado um valor para x, a previso ou expectativa
para o correspondente valor de y :

y = + x
Entretanto, dificilmente se conhece a populao dos valores de y
para cada valor da varivel controlada x. O que se conhece,
geralmente, so alguns valores dos pares (x,y), ou seja, apenas uma
amostra dessas variveis.

 Mtodo dos mnimos quadrados


Um dos mtodos mais utilizados para ajustar uma reta a um conjunto
de dados o Mtodo dos Mnimos Quadrados (MMQ), o qual
consiste em determinar a reta que minimiza a soma dos quadrados
dos desvios (os chamados erros ou resduos) entre os verdadeiros
valores de y e os valores estimados a partir da reta de regresso que
se pretende ajustar, .
^= a + bx

Portanto, com base nos dados amostrais, deve-se pensar como


estimar os valores de e , o que pode ser ser feito de forma
eficiente por meio do mtodo dos mnimos quadrados.
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

33

1.7 Regresso Linear

1.7 Regresso Linear

 Mtodo dos mnimos quadrados

 Mtodo dos mnimos quadrados

Adota-se o quadrado das diferenas, pois como os pontos


se situam acima e abaixo da reta estimada, as diferenas
podem ser positivas ou negativas, e na soma podem
anular-se, no refletindo o ajustamento.
Sendo nmeros positivos, esses quadrados refletem a
qualidade do ajuste atravs de sua soma.

O modelo de regresso linear a reta de regresso


i = a + bxi + i
onde
o estimador de y;
a e b os estimadores de e .
A reta estimada obtida de tal modo que a soma dos quadrados dos
desvios ou resduos (i = yi ) seja mnima, ou seja,
min i2 = min ( y i y i ) 2 = min [ y i ( a + bx i )] 2

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Mtodo dos mnimos quadrados

 Coeficiente de explicao

Como tal, para estimar os parmetros do modelo, necessrio que as


primeiras derivadas em relao a a e a b sejam nulas, e as segundas
sejam maiores ou iguais a zero, assim:

2
a ( y i a bx i ) = 0


( y i a bx i ) 2 = 0
b

As estimativas dos mnimos quadrados para os parmetros e so:


a=

y bx = ybx
n

ESTATSTICA APLICADA I - Estatstica Descritiva

b=

x y
xy n
s
=
( x ) s
x

n
2

xy

Calculada a estimativa de mnimos quadrados para uma


amostra dada, deve-se verificar a qualidade do ajuste
dessa reta aos dados histricos.
Uma forma de medir a qualidade do ajuste verificar
qual a porcentagem da variao dos valores de y em
relao sua mdia pode ser explicada pela regresso de
y sobre x, o que dar origem ao coeficiente de explicao
R2.

xx

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Coeficiente de explicao

 Coeficiente de explicao

Do grfico abaixo, onde = a + bx a regresso de y sobre x,


observa-se que o valor de yi correspondente a um valor xi pode ser
composto de duas partes: a parte explicada pela mdia e a parte no
explicada pela mdia.
y
yi

= a + bx

yi y = parte do valor de y no explicada pela mdia


y y = parte do valor de y explicada pela regresso

}
xi

ESTATSTICA APLICADA I - Estatstica Descritiva

y = parte do valor de y explicada pela mdia

Interessa avaliar que porcentagem da parte no explicada pela


mdia, y i y , pode ser explicada pela regresso de y sobre x, isto ,
por y y .
No mtodo dos mnimos quadrados, ao invs de somar essas
diferenas, soma-se o quadrado delas para evitar que valores
positivos e negativos se anulem.
Designando:
VT = variao total, soma dos quadrados das variaes de y em
relao sua mdia.
2
VT = ( y y )
= (

VE = variao explicada, a soma dos quadrados das variaes em


2
relao mdia.
VE = ( y y )
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

34

1.7 Regresso Linear

1.7 Regresso Linear

 Coeficiente de explicao

 Mtodo dos mnimos quadrados

O coeficiente de explicao
pode ser definido agora como sendo
a porcentagem da variao total representada pela variao
explicada.
R2

R2 =

R2 = b

VE
=
VT

x y
xy n
( y )
y n
2

( y y )
( y y)

Exemplo: No exemplo anterior, observou-se no diagrama


de disperso uma possvel relao linear entre as
variveis.

a) Confirme essa relao por meio do coeficiente de


correlao;

ou

R2 = b

s xy

R2 = r 2

s yy

b) Encontre a reta de regresso pelo mtodo dos


mnimos quadrados.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Mtodo dos mnimos quadrados


i

x2

y2

xy

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

100
125
150
175
200
225
250
275
300
325
350
375
400
425
450
500

99,1
98,8
98,5
98,5
98,5
98,2
98,0
97,8
97,8
97,8
97,6
97,5
97,3
97,0
96,8
96,7

10000
15625
22500
30625
40000
50625
62500
75625
90000
105625
122500
140625
160000
180625
202500
250000

9820,8
9761,4
9702,2
9702,2
9702,2
9643,2
9604,0
9564,8
9564,8
9564,8
9525,8
9506,2
9467,3
9409,0
9370,2
9350,9

9910,0
12350,0
14775,0
17237,5
19700,0
22095,0
24500,0
26895,0
29340,0
31785,0
34160,0
36562,5
38920,0
41225,0
43560,0
48350,0

4625

1565,9

1559375

153259,8

451365,0

ESTATSTICA APLICADA I - Estatstica Descritiva

 Mtodo dos mnimos quadrados

Clculos:
r=

s xy
s xx s yy

Clculos:
=

x y

xy

r=

( x )

( y )

n
4625 1565 ,9
451365
16
r=
( 4625 )2
( 1565 ,9 )2
1559375
153259 ,8
16
16
r = 0 ,99
R 2 = ( 0 ,99 )2 = 0 ,977

- O valor da correlao e do coeficiente de explicao indicam uma


forte correlao linear entre a temperatura do gs combustvel e a
taxa de calor. Pode-se, portanto, estimar, atravs do MMQ os
parmetros a e b e traar a reta de regresso:

x y 451365 4625 1565 ,9


xy n
16
=
= 0 ,0057
(4625)
( x )
1559375
x n
16
y b x = 1565 ,9 ( 0 ,0057 ) 4625 = 99 ,516
a=
b=

16

16

- Sendo assim a reta de regresso : y = a + bx = 99 ,516 0 ,0057 x


ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

Para que se evite erros de previso, a condio inicial para


um estudo de regresso linear entre duas variveis que
essas variveis apresentem uma razovel correlao
linear.
Caso os valores de y para crescentes valores de x variem
de modo aleatrio, sem apresentar qualquer tendncia, o
valor que melhor explica y , geralmente, a sua mdia;
entretanto, em alguns casos, o diagrama de disperso
apresenta uma tendncia no linear, isto , uma curva bem
definida, em torno da qual os pontos parecem agrupar-se.
ESTATSTICA APLICADA I - Estatstica Descritiva

Existe um grupo de funes que apresentam diagramas


ajustveis a muitas dessas tendncias, e que possuem a
qualidade de poder transformar-se em funes lineares
com a aplicao de logaritmos ou por mudana de
varivel.
A forma linear dessas funes transformadas pode ento
ser usada para estimar os parmetros da curva ajustada
quela tendncia, conforme ser estudado a seguir.

ESTATSTICA APLICADA I - Estatstica Descritiva

35

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis
1. Funo potncia:

 Funes linearizveis
y = a.xb, com x 0 e b 0

1. Funo potncia:

Para este caso, a primeira e a segunda derivadas da funo


fornecem a forma da curva.
y

y = a.xb, com x 0 e b 0

Se x = 0, ento y = 0.
Para x > 0, aplicando o logaritmo, tem-se: ln y = ln a + b.ln x
Fazendo Y = ln y, A = ln a e X = ln x, tem-se a forma linear:
Y = A + b.x

0<b<1

b>1
x
Crescente
Concavidade para cima
Contm a origem

x
Crescente
Concavidade para baixo
Contm a origem

O diagrama de disperso de (X = ln x, Y = ln y) e o coeficiente de


correlao correspondente podem indicar a oportunidade e
qualidade do ajuste.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis
2. Funo exponencial:

ESTATSTICA APLICADA I - Estatstica Descritiva

 Funes linearizveis
y = abx, a > 0, b > 0, x 0

Como no caso anterior, as derivadas fornecem a forma das curvas.

2. Funo exponencial:

y = abx, a > 0, b > 0, x 0

Aplicando o logaritmo, tem-se: ln y = ln a + x.ln b


Fazendo Y = ln y, A = ln a e B = ln b, tem-se a forma linear:

Y = A + B.x

a
0<b<1
a

b>1
x
Crescente
Concavidade para cima
x=0y=a

x
Decrescente
Concavidade para cima
x=0y=a

O diagrama de disperso de (x, Y=lny) e o coeficiente de


correlao correspondente podem indicar a oportunidade e
qualidade do ajuste.

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

b
2. Funo hiperblica, tipo I: y = a + , x > 0 , a > 0 , y > 0
x
A primeira e a segunda derivadas fornecem a forma das curvas.
y
b>0

b
, x > 0, a > 0, y > 0
x
Fazendo X = 1/x, obtm-se a forma linear:

3. Funo hiperblica, tipo I:

y= a+

y = a + b.X

y
a

b<0

O diagrama de disperso de (X=1/x, y) e o coeficiente de


correlao correspondente podem indicar a oportunidade e
qualidade do ajuste.

a
x
Decrescente
Concavidade para cima
Assntota em x = 0 e y = a

ESTATSTICA APLICADA I - Estatstica Descritiva

- b/a

Crescente
Concavidade para baixo
Assntota em y = a
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

36

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

4. Funo hiperblica, tipo II:

1
y=
, a > 0, b > 0, x 0
a + bx

As derivadas da funo indicam que a curva decrescente e tem


concavidade voltada para cima, com assntotas em y = 0. Para x
=0, y = 1/a.
y
1/a

4. Funo hiperblica, tipo II:

y=

1
, a > 0, b > 0, x 0
a + bx

Fazendo Y = 1/y, obtm-se:

1
1
=
Y a + bx

ou

Y = a + bx

O diagrama de disperso de (x, Y=1/y) e o coeficiente de


correlao correspondente podem indicar a oportunidade e
qualidade do ajuste.
x
ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis
5. Funo logaritmo:

ESTATSTICA APLICADA I - Estatstica Descritiva

 Funes linearizveis
5. Funo logaritmo:

y = a + b.ln x, x > 0

As derivadas indicam a forma da curva:

Fazendo X = ln x, obtm-se a forma linear:

y = a + bX

b<0

b>0

e- a/b

O diagrama de disperso de (X=ln x, y) e o coeficiente de


correlao correspondente podem indicar a oportunidade e
qualidade do ajuste.

x
e-a/b
Decrescente
Concavidade para cima

Crescente
Concavidade para baixo

y = a + b.ln x, x > 0

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

Exemplo: Um estudo sobre a oferta de mercado de um


produto revelou as quantidades que os produtores
estariam dispostos a oferecer a vrios nveis de preos
x = preo

10,00

10,50

11,00

11,50

12,00

12,50

13,00

13,50

y = oferta
(em 1000 un.)

427

440

447

453

460

465

470

472

ESTATSTICA APLICADA I - Estatstica Descritiva

Exemplo:
a. Construa um diagrama de disperso para os dados da tabela;
b. Calcule o coeficiente de correlao linear das variveis;
c. O diagrama de disperso sugere o uso de alguma forma linearizvel
para ajustar os pontos?
d. Construa o grfico de disperso da forma linear correspondente
funo escolhida em (c);
e. Calcule o coeficiente de correlao dos pares em (d);
f. Comente os resultados obtidos;
g. Calcule a regresso de y sobre x para a funo de maior correlao;
h. Calcule o coeficiente de explicao para a funo escolhida em (g);
i. Calcule a oferta para um preo de 15,00.
ESTATSTICA APLICADA I - Estatstica Descritiva

37

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

Soluo:

Soluo:

a. Diagrama de disperso
y

b. Coeficiente de correlao.

475
470
465
460
455
450
445
440
435
430
425
420
9

9,5

10

10,
5

11

11,
5

12

12,
5

13

13,
5

14

x2

y2

xy

1
2
3
4
5
6
7
8

10,0
10,5
11,0
11,5
12,0
12,5
13,0
13,5

424
440
447
453
460
465
470
472

100,00
110,25
121,00
132,25
144,00
156,25
160,00
182,25

182329
193600
198809
205209
211600
216225
220900
222284

4270,0
4620,0
4917,0
5209,5
5520,0
5812,5
6110,0
6372,0

94,0

3.634

1.115,00

1.652.456

42.831,0

ESTATSTICA APLICADA I x
- Estatstica Descritiva

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis
Soluo:

Soluo:

d. Diagrama de disperso: a forma linear y = a + b.X, com X = ln x.

b. Coeficiente de correlao.
94 3.634
= 131,5
8
( 3.634 ) 2
= 1.652.456
= 1.711 ,5
8

s xy = 42.831
s yy

ESTATSTICA APLICADA I - Estatstica Descritiva

X = ln x

( 94 )
= 10 ,5
8
131,5
= 0 ,98
10 ,5 1.711,5

s xx = 1.115
r=

y = oferta
(em 1000 un.

2,30 2,35 2,40 2,44 2,48 2,53 2,56 2,60


427

440

447

453

460

465

470

472

475

470
465
460
455

c. A forma do diagrama de disperso sugere a curva logaritmica por


suas caractersticas.
y = a + b.ln x

450
445
440
435
430
425
420
2

2,1

2,2

2,3

2,4

2,5

2,6

2,7

2,8

2,9

ln x

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

ESTATSTICA APLICADA I - Estatstica Descritiva

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

Soluo:

Soluo:

e. Coeficiente de correlao.

e. Coeficiente de correlao.

X=ln x

X2

y2

Xy

1
2
3
4
5
6
7
8

2,30
2,35
2,40
2,44
2,48
2,53
2,56
2,60

424
440
447
453
460
465
470
472

5,29
2,52
5,76
5,95
6,15
6,40
6,55
6,77

182.329
193.600
198.809
205.209
211.600
216.225
220.900
222.284

982,1
1.034,0
1.072,8
1.105,5
1.140,8
1.176,45
1.203,2
1.227,2

19,67

3.634

48,45

1.652.456

8.947,57

ESTATSTICA APLICADA I - Estatstica Descritiva

19 ,67 3.634
= 11 ,3453
8
( 3.634 ) 2
= 1.652.456
= 1.711 ,5
8

s xy = 8.947 ,57
s yy

( 19 ,67 ) 2
= 0 ,0771
8
11 ,3453
r=
= 0 ,9879
0 ,0771 1.711 ,5

s xx = 48 ,45

f. A correlao obtida com a curva logartmica maior; portanto, essa


funo ser escolhida para o processo de regresso.

ESTATSTICA APLICADA I - Estatstica Descritiva

38

1.7 Regresso Linear

1.7 Regresso Linear

 Funes linearizveis

 Funes linearizveis

Soluo:

Soluo:

g. Clculo da regresso linear:


b=
a=

s xy
s xx

i. Projeo da oferta para um preo de 15,00:

11 ,3453
= 147 ,1505
0 ,0771

y = 92 ,1907 + 147 ,1505 ln x = 92 ,1907 + 147 ,1505 ln 15 = 490 ,68

y b x = 3.634 147 ,1505 19 ,67 = 921907

n
n
8
y = 92 ,1907 + 147 ,1505. ln x

h. Clculo do R2.

R2 = b

s xy
s yy

= 147 ,1505

A oferta esperada quando o preo for 15,00 de 490,68 mil


unidades.

11 ,3453
= 0 ,976
1.711,5

A regresso de y sobre x explica 97,6% das variaes de y a partir de sua


mdia; os outros 2,4% so atribudos a fatores imponderveis.
ESTATSTICA APLICADA I - Estatstica Descritiva

ESTATSTICA APLICADA I - Estatstica Descritiva

I - Estatstica Descritiva

FIM
ESTATSTICA APLICADA I - Estatstica Descritiva

39

Você também pode gostar