Você está na página 1de 39

Universidade Federal do Pará Universidade Federal do Pará

Instituto de Tecnologia Instituto de Tecnologia

Estatística Aplicada I Capítulo I

Estatística Descritiva
Prof. Dr. Jorge Teófilo de Barros Lopes

Campus de Tucuruí – CTUC Campus de Tucuruí – CTUC


Curso de Engenharia Mecânica Curso de Engenharia Mecânica
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva I - Estatística Descritiva

 Introdução  Introdução
 Conceitos e definições  Conceitos e definições
 Classificação dos dados  Classificação dos dados
 Caracterização e apresentação dos dados  Caracterização e apresentação dos dados
 Estatísticas amostrais  Estatísticas amostrais
 Outras apresentações gráficas de dados  Outras apresentações gráficas de dados
 Regressão linear  Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução 1.1 Introdução

 ESTATÍSTICA: É a disciplina que objetiva estudar os  De uma maneira geral, as técnicas estatísticas são
métodos científicos para a coleta, organização, resumo, utilizadas em três etapas principais do trabalho de
apresentação e análise de dados, bem como obter pesquisa:
conclusões válidas e tomar decisões razoáveis baseadas
em tais análises. 1. A coleta de dados, incluindo o planejamento do
trabalho e da pesquisa;
 Técnicas Estatísticas: São as várias técnicas por meio
das quais é possível estudar conjuntos de dados e, a 2. A apresentação dos dados coletados; e
partir de uma amostra (se necessária), tirar conclusões 3. A análise dos dados coletados, com a formulação
válidas para conjuntos maiores (população). de conclusões e generalizações.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1
1.1 Introdução 1.1 Introdução

Coleta de dados Apresentação dos dados coletados

- Essa primeira etapa corresponde ao estabelecimento - A segunda etapa requer técnicas específicas para a
do método de coleta de dados (questionário ou teste transformação dos dados numéricos em tabelas ou
ou ensaio de material) e elaboração dos gráficos (é a partir da organização dos dados
questionamentos; determinação das variáveis que coletados que se poderá elaborar a interpretação).
serão estudadas, de acordo com o interesse do
pesquisador; e o cálculo do tamanho da amostra, de Análise dos dados coletados
acordo com a natureza da pesquisa, do tempo e do
orçamento disponíveis. - Essa etapa é simultânea à anterior, pois durante a
própria organização dos dados já é possível ir
percebendo a tendência geral da pesquisa.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução 1.1 Introdução

 Estatística Descritiva: Objetiva sintetizar e representar de


• No sentido de melhor esclarecer o significado da uma forma compreensível a informação contida num
análise e interpretação dos dados, deve-se estabelecer conjunto de dados.
uma distinção entre
• Como o próprio nome sugere, constitui-se num conjunto
de técnicas que objetivam descrever, analisar e interpretar
Estatística Descritiva os dados numéricos de uma população ou amostra.
• Adquire importância quando o volume de dados for
e significativo.
• Materializa-se na construção de tabelas e/ou gráficos ou
Inferência Estatística.
no cálculo de medidas que representem convenientemente
a informação contida nos dados.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.1 Introdução 1.1 Introdução

 Inferência Estatística: Baseada na análise de um conjunto


limitado de dados (uma amostra), objetiva caracterizar o
todo a partir do qual tais dados foram obtidos (a população).

• Objetivo mais ambicioso que o da estatística descritiva.

• Os métodos e técnicas utilizados são mais sofisticados.

Figura 1.1- Diferença entre Estatística Descritiva e Inferência


Estatística (Silva e Carvalho, 2006).
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

2
1.1 Introdução I - Estatística Descritiva

 Introdução
 Conceitos e definições
 Classificação dos dados
 Caracterização e apresentação dos dados
 Estatísticas amostrais
 Outras apresentações gráficas de dados
Figura 1.2- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
 Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 1.2 Conceitos e Definições

 População: É o conjunto de todos os elementos que contêm  Principais motivos para o estudo da amostra:
uma certa característica que se deseja estudar.
1. População infinita;
• Como é comum a todos os elementos, esta característica
varia em quantidade ou qualidade. 2. Custo em termos de tempo ou de dinheiro que um
estudo em toda a população implicaria;
• Uma população pode ter dimensão finita ou infinita.
3. Obtenção de informação por meio de testes destrutivos,
 Amostra: É um subconjunto de dados que pertencem à no âmbito industrial;
população. As amostras aleatórias são escolhidas por meio
de processos (técnicas de amostragem) que garantem que o 4. Impossibilidade de acesso a todos os elementos da
subconjunto obtido é representativo da população. população.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.2 Conceitos e Definições 1.2 Conceitos e Definições

 Fases do método de análise estatística:  Fases do método de análise estatística:


• No âmbito da Estatística, o método de abordagem dos Identificação do problema → Objetivo da análise
problemas pode ser dividido em cinco fases:
1. Estabelecimento do objetivo da análise a efetuar (questões a Planejamento da experiência → Técnicas de Amostragem
serem resolvidas) e definição das populações correspondentes;
2. Concepção de um procedimento adequado para a seleção de
Coleta de dados
uma ou mais amostras (escolha das técnicas de amostragem a
utilizar).
3. Coleta de dados. Análise exploratória dos dados → Estatística Descritiva
4. Análise dos dados (Estatística Descritiva).
5. Estabelecimento de inferências a respeito da população Análise e interpretação dos resultados → Inferência Estatística
(Inferência Estatística)
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

3
I - Estatística Descritiva 1.3 Classificação dos Dados

 Iniciando o estudo:
 Introdução
• Não existe uma estratégia única para iniciar o estudo
 Conceitos e definições
descritivo, embora uma primeira recomendação seja
 Classificação dos dados começar por uma exploração visual dos dados
levantados.
 Caracterização e apresentação dos dados
• Isso é necessário, pois podem ocorrer registros que não
 Estatísticas amostrais se encaixam no padrão geral observado e, dessa forma,
a sua veracidade deve ser averiguada, pois podem tratar-
 Outras apresentações gráficas de dados se de erros de observação, bem como do próprio registro
ou provenientes de alterações do fenômeno em estudo.
 Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados

 Iniciando o estudo:  Iniciando o estudo:

• Para se ter uma idéia mais concreta sobre os dados • Portanto, para se proceder um estudo descritivo, é importante:
levantados, deve-se recorrer às tabelas e/ou gráficos que - Ordenação dos dados – fase onde se começa a ter uma idéia a
podem representar, de maneira sintética, as informações respeito de algumas medidas de posição (média, mediana, quartis
sobre o comportamento de variáveis numéricas etc.);
levantadas. - Estatísticas amostrais – a partir de algumas medidas promove-se
um resumo dos dados levantados, relativamente à posição,
• Embora estas análises já se encontrem disponíveis em dispersão e forma;
vários softwares e calculadoras programáveis, para uma - Agrupamento dos dados e representação gráfica – revela a forma
melhor interpretação das mesmas é conveniente possível para a população em estudo e permite escolher a classe
conhecer as técnicas utilizadas. de modelos que deve ser explorada nas análises mais
sofisticadas.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados

 Dados brutos: Como primeiro resultado de uma pesquisa, obtêm- • Observações: - k deverá ser no mínimo 3 e no máximo 20;
se dados brutos, ou seja, um conjunto de números ainda sem - Como a variável k é um número inteiro, ela
organização alguma. deverá ser aproximada para o maior inteiro (por
 Rol: Os dados brutos são então ordenados de forma crescente ou exemplo, se k ≈ 6,4, usa-se k = 7).
decrescente, com a indicação da freqüência de cada um, dando origem  Freqüência de classes: O passo seguinte é subdividir os dados
ao chamado rol.
pelas classes ou categorias e determinar o número de indivíduos
 Tabulação dos dados: Depois de elaborar o rol é preciso pertencentes a cada uma, resultando nas freqüências de classes.
determinar quantas faixas terá a tabela de freqüência. A fórmula de  Apresentação final dos dados (tabela completa): Com
Sturges é utilizada para estabelecer o número aproximado de classes
base em todos os cálculos feitos anteriormente, pode-se fazer uma
nova tabela com todas as freqüências, as quais serão estudadas a
k ≅ 1 + 3 ,22 ⋅ log n posteriori.
onde: n = número de elementos da amostra (tamanho da amostra)  Gráficos: A partir da tabela de freqüências, faz-se o desenho
k = número de classes que a tabela de classes deverá contar. gráfico, um recurso de visualização dos dados constantes na tabela.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

4
1.3 Classificação dos Dados 1.3 Classificação dos Dados

 Os dados que constituem uma amostra podem ser de a) Dados nominais: Quando cada um deles for identificado
quatro tipos, assim distribuídos: pela atribuição de um nome que designa uma classe.
Neste caso, as classes devem ser:
• Qualitativos
- Nominal a) Exaustivas - qualquer dado pertence a uma das classes;
- Ordinal b) Mutuamente exclusivas - cada dado pertence somente
a uma classe;
c) Não ordenáveis - não existe nenhum critério relevante
• Quantitativos que permita estabelecer preferência por qualquer
- Intervalar classe em relação às restantes.
- Absoluto
- Exemplo: Classificação das pessoas pela cor do cabelo
(preto, castanho, louro etc.).
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados

b) Dados ordinais: São semelhantes aos dados nominais; c) Dados intervalares: No caso da escala intervalar, os
contudo, nessa escala existe a possibilidade de se dados são diferenciados e ordenados por números
estabelecer uma ordenação dos dados nas classes, expressos em uma ordem cuja origem é arbitrária.
segundo algum critério relevante.
- Observação: Neste caso, pode-se atribuir um significado
- Exemplo: Classificação de conceitos de avaliação na à diferença entre esses números, mas não à razão entre
disciplina em insuficiente, regular, bom e excelente. eles.
Por exemplo, o registro de temperaturas em ºC, em determinadas
horas de dias sucessivos. Se em três dias consecutivos a
temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o
terceiro dia esteve duas vezes mais quente que o segundo, pois se a
temperatura fosse expressa em outra escala, a razão entre os
valores registrados naqueles dias seria diferente.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados

d) Dados absolutos: Contrariamente ao que sucede com a - Observação: Quando se trabalha com dados quantitativos,
escala intervalar, a escala absoluta tem origem fixa (nesta é necessário que se faça a distinção entre os dados discretos
escala, o valor zero tem significado). e os contínuos.
- Exemplo: Pesos de pessoas expressos em kg. Os dados denominam-se discretos quando são valores de uma
variável aleatória discreta, que é a aquela que assume valores em
- Observações: pontos da reta real (por exemplo, número de páginas em um livro:
1, 2, 3, 4, 5...).
• Escala intervalar: temperatura de 0ºC não significa que não haja
temperatura.
Os dados são contínuos quando são valores de uma variável
• Escala absoluta: peso de 0 kg significa que não existe peso. aleatória contínua, que é aquela que pode assumir qualquer valor
• Em conseqüência ao fato da origem ser fixa, a razão entre os dados em certo intervalo da reta real (por exemplo, o peso de
expressos numa escala absoluta passa a ter significado; uma pessoa funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)
com 60 kg tem o dobro do peso de uma com 30 kg.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

5
1.3 Classificação dos Dados 1.3 Classificação dos Dados

 Arredondamento de dados: O arredondamento de um dado 2. Arredondamento por excesso: Quando o primeiro dígito após aquele que
será arredondado for maior ou igual a cinco seguido por dígitos maiores
estatístico deve obedecer as seguintes regras. que zero, o digito remanescente será acrescido de uma unidade (ou seja,
1. Arredondamento por falta: Quando o primeiro dígito, aquele situado frações maiores de 0,500... até 0,999... são eliminadas, mas o algarismo a
mais à esquerda entre os que irão ser eliminados, for igual ou menor que ser arredondado aumenta 1 unidade, arredondadas para cima).
quatro, não deverá ser alterado o dígito remanescente (ou seja, frações de
Exemplos: 3,688 ≈ 3,69; 5,6501 ≈ 5,7
0,000... a 0,4999... são simplesmente eliminadas, arredondadas para
baixo).
Número a arredondar Arredondamento para Número arredondado
Exemplos: 3, 49 ≈ 3; 2,43 ≈ 2,4; 1,734999 ≈ 1,73
15,504 Inteiros 16
Número a arredondar Arredondamento para Número arredondado 15,561 Décimos 15,6
12,489 Inteiros 12 15,578 Centésimos 15,58
12,733 Décimos 12,7
12,992 Centésimos 12,99
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados


3. Arredondamento de dígitos seguidos do cinco: Quando o dígito
situado mais à esquerda dos que serão eliminados for um cinco ou um - Observações:
cinco seguido somente de zeros, o último dígito remanescente, se for
par, não se alterará, e se for impar será aumentado de uma unidade (ou 1. Nunca se deve fazer arredondamentos sucessivos.
seja, se a fração a ser eliminada é exatamente 0,50000..., então o Exemplo: 17,3452 → 17,3 (correto)
algarismo a ser arredondado, só aumentará de 1 unidade caso torne-se 17,3452 → 17,35 → 17,4 (incorreto)
um algarismo par).
2. Se for necessário um novo arredondamento, recomenda-se o retorno
Exemplos: 3,5 ≈ 4; 6,5 ≈ 6; 5,6500 ≈ 5,6; 5,700 ≈ 5,8; 9,475 ≈ 9,48;
aos dados originais.
3,325 ≈ 3,32
Número a arredondar Arredondamento para Número arredondado
215,500 Inteiro 216
216,500 Inteiro 216
216,750 Décimos 216,8
216,705 Centésimos 216,70
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados


 Algarismos significativos  Algarismos significativos:
Os algarismos significativos de um número são os dígitos diferentes de
zero, contados a partir da esquerda até o último dígito diferente de zero à • Todos os dígitos diferentes de zero são significativos.
direita, caso não haja vírgula decimal, ou até o último dígito (zero ou não) Exemplos: 7,3; 32 e 210 possuem 2 algarismos significativos.
caso haja uma vírgula decimal.
Exemplos: • Os zeros entre dígitos diferentes de zero são significativos
Algarismos Exemplos: 303 e 1,03 possuem 3 algarismos significativos.
Números Notação científica
significativos
3200 3,2 x 103 2 • Se existir uma vírgula decimal, todos os zeros à direita da vírgula
1,55 1,55 x 100 3 decimal são significativos
8,3400 8,3400 x 100 5 Exemplos: 1,000 e 33,30 possuem 4 algarismos significativos.
32050 3,205 x 104 4
0,032 3,2 x 10-2 2
0,03200 3,200 x 10-2 4
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

6
1.3 Classificação dos Dados 1.3 Classificação dos Dados
 Algarismos significativos:  Algarismos significativos:

• Valores medidos ou calculados: o número de algarismos significativos • Números inteiros que são resultados experimentais, seguem as regras
de uma grandeza medida ou um valor calculado é uma indicação da anteriores.
incerteza, ou seja, quanto mais algarismos significativos, menor a Exemplo: a pressão em uma caldeira é 6 atm, possui 1 algarismo
incerteza no valor. significativo.

Exemplo: • Números inteiros que descrevem o número de objetos discretos


O valor de uma grandeza medida com 3 algarismos significativos, possuem precisão mínima.
indica que o valor do 3º algarismo tem uma incerteza menor ± 0,5ºC. Exemplo: 5 dias = 5,0000000... dias.
Caso seja apresentada uma temperatura como 32ºC (2 significativos),
• Números inteiros que são parte de uma expressão física possuem
está indicado que a temperatura está entre 31,5 e 32,5ºC. Caso ela seja
precisão infinita.
apresentada como 32,5ºC (3 significativos), está indicado que a
Exemplo: o 2 na equação do perímetro do círculo 2πR, possui uma
temperatura está entre 32,45 e 32,55ºC.
precisão infinita uma vez que por definição o diâmetro é 2 vezes o raio.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.3 Classificação dos Dados 1.3 Classificação dos Dados

- Observações: - Observações:
• Na adição e na subtração faz-se a operação normalmente e no final • Nas operações de potenciação e radiciação o resultado deverá ter o
reduz-se o resultado, usando os critérios de arredondamento, para o mesmo número de algarismos significativos da base (potenciação) ou
número de casas decimais da grandeza menos precisa. do radicando (radiciação).
Exemplos: Exemplos: (1,52 x 103)2 = 2,31 x 106
12441 + 57,91 + 1,987 + 0,0031 + 119,20 = 12620,1001 = 12620 (0,75 x 104)1/2 = 0,87 x 102
12441,2 − 7856,32 = 4584,88 = 4584,9

• Na multiplicação e na divisão o resultado deverá ter igual número de


algarismos (ou um algarismo a mais) que a grandeza com menor
quantidade de algarismos significativos que participa da operação.
Exemplos:
12,46 x 39,83 = 496,2818 = 496,28
803,407 / 13,1 = 61,328 = 61,33
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva 1.4 Caracterização e Apresentação dos Dados

 Tabela de freqüências:
 Introdução
 Conceitos e definições • Devido à necessidade das categorias estarem
ordenadas, somente se pode falar de freqüências
 Classificação dos dados acumuladas quando os dados estão em escalas ordinais,
intervalar ou absoluta.
 Caracterização e apresentação dos dados
• A representação tabular com todos os tipos de
 Estatísticas amostrais freqüências é mostrada a seguir:
 Outras apresentações gráficas de dados
 Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

7
1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Tabela de freqüências:  Tabela de freqüências:


a) Freqüência absoluta (ni): O número de dados contidos b) Freqüência relativa (fi): O número total de dados que
numa classe ou categoria qualquer i (i = 1,..., k) de pertencem a uma classe ou categoria qualquer i,
um conjunto de dados designa-se por freqüência quando expressos como uma proporção do número
absoluta da classe ou categoria i. total de dados, designa-se por freqüência relativa da
classe ou categoria i e é dada por
• Denotando-se por ni tal freqüência e admitindo que
as categorias especificadas contêm todos os dados, fi =
ni
o número total de dados (n) é calculado por : n
k
n = ∑ ni • As freqüências relativas são muitas vezes definidas
1= 1
em termos percentuais.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Tabela de freqüências:  Tabela de freqüências:

c) Freqüência absoluta acumulada (Ni): Representa para


cada classe ou categoria i, a freqüência absoluta de
dados que pertencem à classe ou às classes anteriores.
d) Freqüência relativa acumulada (Fi): Representa para
cada classe categoria i, a freqüência relativa de dados
que pertencem à classe ou às classes anteriores.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Gráficos estatísticos

• Uma vez elaborada a tabela de freqüências, segue-se o - Histograma: Este tipo de gráfico é utilizado para
desenho do gráfico, um recurso de visualização dos representar as freqüências absolutas (ni) em relação à
dados constantes na tabela. sua classe, e é assim construído:

• Os tipos de gráficos mais comuns são: histograma; 1. No eixo das abscissas marcam-se, em escala, as classes dos
polígono de freqüência, setograma e ogiva de Galton. dados;
2. No eixo das ordenadas, marcam-se as freqüências das classes;
3. Faz-se a correspondência entre cada intervalo no eixo das
classes com um valor no eixo das freqüências, formando um
desenho de colunas paralelas.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

8
1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Gráficos estatísticos


- Polígono de freqüência: Utilizado para indicar o ponto médio
ou representante de classe em suas respectivas freqüências - Histograma e Polígono de freqüência:
absolutas; normalmente, é construído sobre o histograma, da
seguinte forma:
1. No eixo das abscissas, coloca-se o ponto médio de
cada intervalo de classe;
2. No eixo das ordenadas, permanecem as freqüências
absolutas das classes (ni) ;
3. Ligam-se os pontos médios por segmentos de reta;
4. Para completar o polígono, acrescenta-se um ponto
médio com freqüência zero em cada uma das
extremidades da escala horizontal.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Gráficos estatísticos


- Gráfico em setores (Setograma): Também conhecido como
gráfico de pizza, é utilizado para representar valores relativos (%);
é construído da seguinte forma:

- Histograma 1. Faz-se um círculo;


2. Cada setor é regido pela
- Polígono de freqüência: fórmula:
360º ⋅ni
º Setori =
n
3. No círculo, distribui-se os
valores das freqüências
percentuais

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Gráficos estatísticos


- Ogiva de Galton: Este tipo de gráfico é utilizada para - Ogiva de Galton:
representar as freqüências acumuladas de uma
distribuição; é construído da seguinte forma:

1. No eixo das abscissas coloca-se as classes dos dados, tal como


no histograma;

2. No eixo das ordenadas, escreve-se uma das freqüências


acumuladas, marcando o ponto com os limites superiores (Li) de
cada classe; inicia-se com a freqüência zero e com limite
inferior da 1ª classe.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

9
1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Gráficos estatísticos


- Gráfico linear: É o tipo - Gráfico de colunas: É
de gráfico que apresenta o tipo de gráfico que
os dados estatísticos por apresenta os dados
meio de uma linha estatísticos por meio de
poligonal. Os pontos da retângulos (colunas)
polígono são obtidos pelas dispostas em posições
informações contidas em vertical. Todos os
cada linha da tabela, e retângulos possuem a
marcados no plano mesma base e a altura
utilizando o sistema proporcional aos dados.
cartesiano. São utilizados Podem ser utilizados para
para representar séries representar qualquer série
cronológicas. estatística.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Gráficos estatísticos  Dados Qualitativos:


- Gráfico de colunas: • Exemplo: Em uma amostra constituída de 120 peças, constatou-
Este tipo de gráfico é se que 100 não tinham qualquer defeito, 15 tinham defeitos
semelhante ao de colunas, recuperáveis e 5 apresentavam defeitos irrecuperáveis. Representar
onde os retângulos em uma tabela, e também graficamente, as freqüências (absolutas e
(barras) estão dispostos relativas) dos dados que constituem essa amostra:
horizontalmente. É
utilizado para legendas Categoria de peças Freqüência absoluta Freqüência relativa
longas, em todas as séries. (ni) (fi)
Sem defeitos 100 83,3%
Recuperáveis 15 12,5%
irrecuperáveis 5 4,2%
TOTAL 120 100%
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Dados Qualitativos:  Dados Quantitativos:

• Exemplo: Em um estudo realizado com o objetivo de


Gráfico em Setores
caracterizar o comportamento dos clientes de um
4,2% supermercado, analisou-se o número de ocupantes por
12,5%
veículo para 1000 veículos que entraram no
estacionamento do referido supermercado, em um
Sem defeitos
Recuperáveis
sábado. Os resultados encontram-se resumidos na
irrecuperáveis tabela seguinte:

83,3%

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

10
1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Dados Quantitativos:  Dados Quantitativos:


Nº de ocupantes Freqüência Freqüência Freqüência Freqüência
por veículo absoluta relativa absoluta acumulada relativa acumulada Gráfico em colunas
(xi) (ni) (fi) (Ni) (Fi) 300

1 103 10,3% 103 10,3% 250


2 147 14,7% 250 25,0% 200
3 248 24,8% 498 49,8%
n i 150
4 197 19,7% 695 69,5%
100
5 152 15,2% 847 84,7%
6 100 10,0% 947 94,7% 50

7 53 5,3% 1000 100,0% 0


1 2 3 4 5 6 7
TOTAL 1000 100% Nº ocupantes / veículo

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados

 Dados Quantitativos:  Dados Quantitativos:


• Distribuições agrupadas: Essas distribuições são úteis • Exemplo: O conjunto de dados baixo representa o
quando existe um grande número de dados relativos a peso, em gramas, do conteúdo de uma série de 100
uma variável contínua, cujos valores observados são garrafas que, no decurso de um teste, saíram de uma
muito próximos uns dos outros. linha de enchimento automático:
- A freqüência de cada classe é o número de observações que ela
contém. 302,25; 299,20; 300,24; 297,22; 298,35; 303,76;
298,65; 299,38; 300,36; 299,16; 300,86; 299,83;
- No exemplo anterior, os dados observados correspondem a uma 302,52; 300,12; 301,81; 297,99; 299,23; 298,73;
variável discreta; para o caso de dados relativos uma variável 303,07; 299,07; 297,83; ... ; 300,80
contínua existem algumas diferenças.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.4 Caracterização e Apresentação dos Dados 1.4 Caracterização e Apresentação dos Dados
Freqüência Freqüência Freqüência Freqüência
 Dados Quantitativos: Classes absoluta relativa (%) absoluta relativa
(ni) (fi) acumulada acumulada (%)
• No conjunto de dados mostrado não existe praticamente (Ni) (Fi)
repetição de valores; logo, não é vantagem se utilizar os [297,00 ; 298,00[ 8 8 8 8
dados agrupados numa tabela de freqüências, pois a [298,00 ; 299,00[ 21 21 29 29
mesma teria tantas linhas quanto o número de dados. [299,00 ; 300,00[ 28 28 57 57
[300,00 ; 301,00[ 15 15 72 72
[301,00 ; 302,00[ 11 11 83 83
• No entanto, a tabela de freqüências pode ser construída
[302,00 ; 303,00[ 10 10 93 93
se os dados forem agrupados por classes: [303,00 ; 304,00[ 5 5 98 98
[304,00 ; 305,00[ 1 1 99 99
[305,00 ; 306,00[ 1 1 100 100
TOTAL 100 100%

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

11
1.4 Caracterização e Apresentação dos Dados I - Estatística Descritiva

 Dados Quantitativos:
 Introdução
Histograma
 Conceitos e definições
30
25  Classificação dos dados
20
f i 15
 Caracterização e apresentação dos dados
10  Estatísticas amostrais
5
0
[297,00 ; [298,00 ; [299,00 ; [300.00 ; [301,00 ; [302,00 ; [303,00 ; [304,00 ; [305,00 ;
 Outras apresentações gráficas de dados
298,00[ 299,00[ 300,00[ 301,00[ 302,00[ 303,00[ 304,00[ 305,00[ 306,00[

Peso (kg)  Regressão linear


ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais


 As estatísticas amostrais ou medidas estatísticas são
 Nas seções anteriores foi visto a sintetização de dos dados divididas em três grupos:
sob a forma de tabelas, gráficos e distribuição de a) Medidas de posição ou de tendência central:
freqüências.
• Média aritmética, média geométrica, média harmônica,
 O cálculo de estatísticas amostrais é uma forma mais mediana, quartis, decis, percentis e moda.
sintética de descrever um conjunto de dados, ou seja,
possibilita representar um conjunto de dados relativos à b) Medidas de dispersão:
observação de determinado fenômeno de forma reduzida. • Amplitude total, desvio médio, variância, desvio
padrão, amplitude interquartílica e coeficiente de
 As estatísticas amostrais são calculadas com base nos variação.
dados, a partir das quais é possível descrever globalmente
o conjunto de valores que os referidos dados tomam. c) Medidas de forma:
• Medidas de assimetria e medidas de curtose.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.1) Média aritmética:


• Essas medidas nos orientam quanto à posição da
distribuição no eixo x (eixo dos números reais);
• Para um conjunto de n dados de xi (i = 1,2,..., n) a
• Possibilitam comparações de séries de dados entre si média aritmética simples ou média amostral,
pelo confronto desses números. representada por x é definida pela expressão:
• São chamadas de medidas de tendência central, pelo
n
fato de representarem os fenômenos pelos seus valores
médios, em torno dos quais tendem a concentrar-se os
∑x i
x= i =1 (dados não agrupados)
dados. n

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

12
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.1) Média aritmética: a.1) Média aritmética:


• Exemplo: Determinar a média aritmética simples (média • Quando os dados estiverem agrupados numa
aritmética amostral) dos dados mostrados abaixo: distribuição de freqüência usa-se a média aritmética
2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4 dos valores xi ponderadas pelas respectivas
n
freqüências absolutas ni, assim:
∑x
i =1
i
x= ∴ n
n
2 + 1+ 3+ 3+ 2 + 3+7 + 5 + 5 + 2+ 1+ 3+ 1+ 1+ 4
∑n x i i

x= ∴ x= i=1
(dados agrupados)
15 n
x = 2 ,87
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.1) Média aritmética: a.1) Média aritmética:


• Exemplo (dados agrupados): Determinar a média • Exemplo (dados agrupados): xi ni xini
aritmética simples (média aritmética amostral) da
1 4 4
distribuição dada abaixo: n 2 3 6
∑ x i ni
i =1 ( 1 ⋅ 4 ) + ... + ( 7 ⋅ 1 ) 43 3 4 12
x= = =
xi 1 2 3 4 5 7 n 15 15 4 1 4
ni 4 3 4 1 2 1 x = 2 ,87 5 2 10
7 1 7
Σ 15 43

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição a) Medidas de posição:

a.1) Média aritmética: a.1) Média aritmética:


• Deste modo, à cada classe vai ser atribuído um representante
• No caso da variável ser contínua, visto que se
(xi), e a média amostral será calculada por meio desses
perdeu os valores concretos do conjunto (ficaram representantes:
afetos a uma determinada classe) não se pode k
calcular a média amostral diretamente dos valores ∑n x i i
(dados agrupados em classes)
dos dados. x= i=1

n
onde k é o número de classes do agrupamento, ni é a
freqüência absoluta da classe i e xi é o ponto médio da classe
i, o qual é considerado como elemento representativo da
classe.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

13
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.1) Média aritmética: a.1) Média aritmética:


• Exemplo (dados agrupados em classes):
• Exemplo (dados agrupados em classes):
Classes
Determinar a média da distribuição a seguir, a ni xi xini

9
[297,00 ; 298,00[ 8 297,5 2380,0
qual representa o peso, em gramas, do conteúdo [298,00 ; 299,00[ 21 298,5 6268,5 ∑n x i i

de uma série de 100 garrafas que, no decurso de [299,00 ; 300,00[ 28 299,5 8386,0 x= i=1

n
[300,00 ; 301,00[ 15 300.5 4507,5
um teste, saíram de uma linha de enchimento [301,00 ; 302,00[ 11 301,5 3316,5 30011,0
[302,00 ; 303,00[ 10 302,5 3025,0 x=
automático (exemplo anterior): [303,00 ; 304,00[ 5 303,5 1517,5 100
[304,00 ; 305,00[ 1 304,5 304,5 x = 300 ,11
[305,00 ; 306,00[ 1 305,5 305,5
Σ 100 30011,0

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.1) Média aritmética (Ponderada) a.1) Média aritmética (Ponderada)


• Às vezes, associam-se os números x1, x2, ..., xk a certos • Exemplo: Em um curso, a avaliação final tem peso 3 e as
fatores de ponderação ou pesos w1, w2, ... , wk que parciais peso 1; a nota média de um estudante que obtenha
dependem do significado ou importância atribuída aos nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais,
mesmos. Nesse caso será:
k

∑w x i i
w1 x 1 + w 2 x 2 + ... + w k x k
3

∑w x i i
x= i =1
= ( 1 ⋅ 7 ,0 ) + ( 1 ⋅ 9 ,0 ) + ( 3 ⋅ 8 ,5 ) 41 ,5
∑w
i =1
w1 + w 2 + ... + w k x= 3
= = = 8 ,3
i 1+ 1+ 3 5
∑wi =1
i

é denominada de média aritmética ponderada.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.2) Média geométrica: A média geométrica G (ou xG ) de a.2) Média geométrica (dados agrupados): Se os elementos
um conjunto de n números x1, x2, ..., xn é a raiz de x1, x2, ..., xn ocorrem com as freqüências n1, n2,..., nk,
ordem n do produto desses números: sendo n1+n2+...+nk = n a freqüência total, a média
geométrica G desses elementos será deduzida como:
G = n x1 ⋅ x 2 ⋅ ... x n

- Exemplo: A média geométrica dos números 2, 4 e 8: G = n x1 x1 ...x1 x 2 x 2 ...x 2 x k x k x k = n x1n1 ⋅ x 2n2 ... xknk
n1 vezes n2 vezes nk vezes

3 3
G = 2 ⋅ 4 ⋅ 8 = 64 = 4

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

14
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.3) Média harmônica: A média harmônica H (ou x H ) de a.4) Mediana: Para os dados colocados em ordem crescente,
um conjunto de n elementos x1, x2, ..., xn é a mediana (md, Me ou ~x ) é o valor que divide a amostra,
recíproca da média aritmética da recíproca dos ou população, em duas partes iguais. Assim:
elementos:
1 n
H= =
1 n 1 n
1

n j =1 x j
∑x
j =1 0% 50% 100%
j

x~
- Exemplo: A média harmônica dos números 2, 4 e 8:
n 3 3
H= n
= = = 3 ,43
1 1 1 1 7
∑x
j =1
+ +
2 4 8 8
j

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.4) Mediana (variável discreta): a.4) Mediana (variável discreta):

• Considerando que os dados que integram a • Exemplo: Para as distribuições abaixo, determinar as
amostra são colocados em ordem crescente, respectivas medianas:
formando um vetor (x1, x2, ..., xn) - amostra 8, 5, 15,11, 4, 1, 7, 2, 9 8, 5, 15,11, 4, 1, 7, 2, 9, 3
ordenada -, a mediana amostral é definida como
Ordenando: Ordenando:
segue:
 x~ = x n+ 1 n ímpar 1, 2, 4, 5, 7, 8, 9, 11,15 1, 2, 3, 4, 5, 7, 8, 9, 11,15
 Como n é ímpar, então: Como n é par, então:

2

 x n + x n+ 2 x n + x n+ 2
~ x~ = x n+ 1 = x5 = 7
x= 2 2
n par x~ = 2 2 x5 + x6 5 + 7

= = =6
2 2 2 2 2
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.4) Mediana (variável discreta, tabela de distribuição de a.4) Mediana (variável discreta, tabela de distribuição de
freqüência): freqüência):
• Exemplo: Para a distribuição abaixo, determinar a mediana: • Exemplo: Para a distribuição abaixo, determinar a mediana:
n = 42, é par, logo ~
x será a média
xi ni Ni entre os elemento de ordem n/2 e
xi ni Ni n = 11 (ímpar), logo ~
x será o
elemento de ordem (n+1)/2, ou 82 9 9 (n/2)+1, ou seja, 21º e 22º
1 1 1 seja, (11+1)/2 = 6º elemento. 85 12 21 21º
elementos.
2 3 4 Da coluna da freqüência 87 11 32 22º Como no exemplo anterior,
contém o 6º identificam-se os elementos de
3 5 9 elemento acumulada crescente, encontra-se 89 6 38
o valor xi correspondente à classe ordem 21 e 22 pela Ni, ou seja, 85
4 2 11 90 4 42 e 87, assim:
que contém a ordem calculada, 85 + 87
Σ 11 assim: ~x = 3. Σ 42 x~ = = 86
2
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

15
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.4) Mediana (variável discreta, tabela de distribuição de a.4) Mediana (variável contínua, tabela de distribuição de
freqüência): freqüência):
• Exemplo: Para a distribuição abaixo, determinar a mediana: • Para variáveis contínuas, identifica-se a classe que contém a
n = 42, é par, logo ~
mediana (n/2), denominada classe Md (como a variável é
x será a média
xi ni Ni entre os elemento de ordem n/2 e contínua, não interessa se n é par ou ímpar); o valor
82 5 5 (n/2)+1, ou seja, 21º e 22º aproximado para a mediana será calculado pela equação:
85 10 15 elementos.
n 
 − N Md −1  a Md
87 15 30 21º e 22º Como no exemplo anterior, 2  0 ,5 − FMd − 1
x~ = l Md + = l Md + a Md
identificam-se os elementos de n Md f Md
89 8 38 ordem 21 e 22 pela Ni, ou seja, 87
90 4 42 e 87, assim: onde: NMd-1 é a freqüência absoluta acumulada da classe antes da classe
~ 87 + 87 mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente,
Σ 42 x= = 87
2 o limite inferior, a amplitude e a freqüência absoluta da classe mediana.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.4) Mediana (variável contínua, tabela de distribuição de a.4) Mediana (variável contínua, tabela de distribuição de
freqüência): freqüência):
• Exemplo: Dada a distribuição amostral, calcular a mediana: • Exemplo:
Classes ni Ni 1º Passo: Calcula-se n/2; como n=58, então 58/2=29º.
35 45 5 5 2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª).
45 55 12 17
3º Passo: Aplica-se a fórmula:
55 65 18 35 classe Md
Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:
65 75 14 49
75 85 6 55 n   58 
85 95 3 58  − N i − 1  ai  − 17  10
x~ = l i +   = 55 +  2  = 61 ,67
2
Σ 58 ni 18
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.5) Quartis: a.5) Quartis:

• Como já visto anteriormente, a mediana é a 25% 50% 75%


medida de posição que divide um conjunto de Q1 Q2 Q3
dados em duas partes iguais;
• Os quartis dividem um conjunto de dados em Q1 = 1º quartil, deixa 25% dos elementos;
quatro partes iguais, assim:
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos
elementos;
25% 50% 75%
Q1 Q3 = 3º quartil, deixa 75% dos elementos.
Q2 Q3

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

16
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.5) Quartis: a.5) Quartis:

• A determinação de Qk (k = 1, 2 e 3) para variáveis discretas • A determinação de Qk (k = 1, 2 e 3), para o caso


segue a fórmula: de variáveis contínuas, segue os passos:
 n +1
Qk = k  
 4  - 1º Passo: Calcula-se a ordem kn/4;

• Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207, - 2º Passo: Identifica-se a classe Qk pela freqüência acumulada N;
305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ? - Aplica-se a fórmula:
7 +1 7 + 1
Q1 = 1  = 2º elemento → 196 Q = 3  = 6º elemento → 597  kn 
 4   4   − N Qk −1 
Q k = l Qk +   ⋅a
 6 + 1 4
 6 + 1 
Q1 = 1  = 1,75º elemento → 193,3 Q = 3  = 5,25º elemento → 579 ,8 nQ k
Qk
 4   4 
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição a) Medidas de posição:

a.5) Quartis: a.5) Quartis:

• Exemplo: Dada a distribuição amostral, determinar Q1 e Q3: • Exemplo: Para Q1.


Classes ni Ni 1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º.
35 45 5 5 2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).
45 55 12 17 classe Q1
3º Passo: Aplica-se a fórmula:
55 65 18 35 Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:
65 75 14 49 classe Q3

75 85 6 55  1n 
 − N Q1 − 1 
85 95 3 58  4  (14 ,5 − 5 )
Q1 = l Q1 + ⋅ a Q1 = 45 + ⋅ 10 = 52 ,92
Σ 58 nQ1 12

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.5) Quartis: a.5) Quartis:

• Exemplo: Para Q3. • Exemplo: Diante desses resultados, pode-se afirmar que,
nesta distribuição, tem-se:
1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º.
2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).
25% 25% 25% 25%
3º Passo: Aplica-se a fórmula:
35 52,92 61,67 71,07 95
Neste caso lQ3 = 65, n = 58, NQ1-1 = 35, aQ1 = 10, nQ1 = 14; logo:

 3n  ou seja: O valor de 52,92 deixa 25% dos elementos;


 − N Q3 − 1 
Q 3 = l Q3 + 
4  ⋅ a = 65 + (43 ,5 − 35 ) ⋅ 10 = 71 ,07 O valor de 61,67 deixa 50% dos elementos;
Q3
nQ 3 14 O valor de 71,07 deixa 75% dos elementos.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

17
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.6) Decis: a.6) Decis:

• Os decis dividem um conjunto de dados em dez D1 = 1º decil, deixa 10% dos elementos da série;
partes iguais, assim: D2 = 2º decil, deixa 12% dos elementos da série;
D5 = 5º decil, coincide com a mediana, deixa 50% dos
elementos da série;
10% 20% 30% 40% 50% 60% 70% 80% 90%
D6 = 6º decil, deixa 60% dos elementos da série;
D1 D2 D3 D4 D5 D6 D7 D8 D9 D7 = 7º decil, deixa 70% dos elementos da série;
D8 = 8º decil, deixa 80% dos elementos da série;
D9 = 9º decil, deixa 90% dos elementos da série.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.6) Decis (variáveis discretas): a.6) Decis:

• A determinação de Dk (k = 1, 2, ..., 9) para variáveis • A determinação de Dk (k = 1, 2, ..., 9), para o caso


discretas segue a fórmula: de variáveis contínuas, segue os passos:
 n +1
Dk = k   - 1º Passo: Calcula-se a ordem kn/10;
 10 
• Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207, - 2º Passo: Identifica-se a classe Dk pela freqüência acumulada N;
305, 574, 597, 612. - Aplica-se a fórmula:
7 +1  kn 
D1 = 5  = 4º elemento → 305  − N Dk − 1 
D k = l Dk +   ⋅a
 10  10
7 +1 Dk
D6 = 6   = 4 ,8º elemento → 520 ,2 n Dk
 10 
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.7) Percentis: a.7) Percentis:


P1 = 1º percentil, deixa 1% dos elementos;
• Os percentis dividem um conjunto de dados em
P2 = 2º percentil, deixa 2% dos elementos.
cem partes iguais, assim:

1% 2% 3% . . . 50% . . . 97% 98% 99% P50 = 50º percentil, coincide com a mediana, deixa 50% dos
P1 P2 P3 P50 P97 P98 P99 elementos;

P99 = 99º percentil, deixa 99% dos elementos.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

18
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.7) Percentis: a.7) Percentis:

• A determinação de Pk (k = 1, 2, ..., 99), para o • A determinação de Pk (k = 1, 2, ..., 99), para variáveis


caso de variáveis contínuas, segue os passos: discretas segue a fórmula:
 n +1
- 1º Passo: Calcula-se a ordem kn/100; Pk = k  
 100 
- 2º Passo: Identifica-se a classe Pk pela freqüência acumulada N; • Exemplo: Determine o 50º e o 60º percentis da série 185, 196,
- Aplica-se a fórmula: 207, 305, 574, 597, 612.
 kn  7 +1
 − N Pk − 1  P50 = 50  = 4º elemento → 305
Pk = l Pk +   ⋅a
100  100 
Pk 7 + 1
n Pk D6 = 60  = 4 ,8º elemento → 520 ,2
 100 
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º
percentil da seguinte distribuição: percentil da seguinte distribuição:
Cálculo de D4 Cálculo de P72
Classes ni Ni Classes ni Ni

35 45 5 5 1º Passo: kn 4 ⋅ 58
= = 23 ,2 o 35 45 5 5 1º Passo: kn 72 ⋅ 58
10 10 = = 41 ,8 o
100 100
45 55 12 17 45 55 12 17
55 65 18 35 classe D4 2º Passo: l D4 = 55 ; N D4 − 1 = 17 ; n = 58 ; 55 65 18 35 classe D4 2º Passo: l P72 = 65 ; N P72 − 1 = 35 ; n = 58 ;
65 75 14 49 a D4 = 10 ; nD4 = 18 65 75 14 49 classe P72 a P72 = 10 ; nP72 = 14

75 85 6 55 classe P72 75 85 6 55
3º Passo:  4 ⋅ 58  3º Passo:  72 ⋅ 58 
85 95 3 58  − 17  85 95 3 58  − 35 
P72 = 65 +   ⋅ 10 = 69 ,82
100
D4 = 55 +   ⋅ 10 = 55 ,34
10
Σ 58 18 Σ 58 14

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.7) Exemplo (decil e percentil). a.8) Moda

• Portanto, na distribuição analisada, tem-se que: • Moda (Mo) é a medida que indica o valor ou a gama
de valores nos quais a concentração dos dados
- O valor 55,34 indica que 40% dos elementos da amostrais é máxima.
distribuição estão abaixo dele e os outros 60%
acima. - Para variáveis discretas, a moda é o valor dos dados
que ocorre com maior freqüência;
- O valor 69,82 indica que 72% dos elementos da
distribuição estão abaixo dele e os outros 28% - Para variáveis contínuas, a classe modal é o intervalo
acima. de classe com maior freqüência.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

19
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.8) Moda a.8) Moda

• Assim, da representação gráfica dos dados, obtém-se • Esta medida é especialmente útil para reduzir a
imediatamente o valor que representa a moda ou a informação de um conjunto de dados qualitativos,
classe modal. apresentados sob a forma de nomes ou categorias,
para os quais não se pode calcular a média e por
vezes a mediana (se não forem susceptíveis de
ordenação).

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.8) Moda (distribuições simples) a.8) Moda (dados agrupados)

• Para distribuições simples (sem agrupamento em • Para dados agrupados em classe, existem diversas
classes), a identificação da moda é facilitada pela fórmulas para o cálculo da moda:
simples observação do elemento que apresenta maior - Fórmula de Czuber: Após a identificação da classe modal,
freqüência. aplica-se a fórmula abaixo, onde
l = limite inferior da classe modal;
- Exemplo: Para a distribuição abaixo Mo = 248. ∆1= diferença entre a freqüência absoluta da
∆1 classe modal e a imediatamente anterior;
M o = li + ⋅ ai
xi 243 245 248 251 307 ∆1 + ∆ 2 ∆2 = diferença entre a freqüência absoluta da
classe modal e a imediatamente posterior;
ni 7 17 23 20 8
ai = amplitude da classe modal.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.8) Moda (dados agrupados) a.8) Moda (dados agrupados)


- Exemplo: Determinar a moda para a distribuição:
- Densidades de classes: Quando as amplitudes das
- A classe com maior frequência absoluta é classes são diferentes, deve-se calcular as densidades
Classes ni
[55, 65[; logo, ela é a classe modal. de classes para identificar a classe modal, as quais são
35 45 5
- Aplicando a fórmula de Czuber, tem-se: obtidas por meio da relação ni/ai.
45 55 12
∆1
55 65 18 Mo = li + ⋅ ai
∆1 + ∆ 2
65 75 14
18 − 12
75 85 6 M o = 55 + ⋅ 10
( 18 − 12 ) + ( 18 − 14 )
85 95 3
M o = 61
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

20
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

a.8) Moda (dados agrupados) a.8) Moda (dados agrupados)

- Exemplo: Determinar a moda para a distribuição: - Fórmula de Pearson: Fornece uma boa aproximação
Salários (US$) ni ai ni/ai
quando a distribuição apresenta razoável simetria em
80 180 70 100 0,7
relação à média. É dada pela relação:
180 250 140 70 2,0
250 300 140 50 2,8 classe modal Mo ≅ 3~
x − 2x
300 500 60 200 0,3

∆1 2 ,8 − 2 ,0
ou seja, a moda é aproximadamente igual a diferença
Mo = li +
∆1 + ∆ 2
⋅ a i = 250 +
( 2 ,8 − 2 ,0 ) + ( 2 ,8 − 0 ,3 )
⋅ 50 = 262 ,12 entre o triplo da mediana e o dobro da média
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

 Observações:  Observações:

1. Média versus Mediana: 1. Média versus Mediana:


 Diferença entre estas duas medidas fica mais clara quando se  A média, ao contrário da mediana, é uma medida de posição
considera o exemplo das notas obtidas por um aluno como muito pouco resistente, isto é, ela é muito influenciada por
sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode valores muito grandes ou muito pequenos, mesmo que estes
ser comprovado, a média aritmética e a mediana são iguais a 14. valores surjam em pequeno número na amostra.

 Se esse aluno elevar a nota mais baixa, passando de 10 para 14,  Estes valores são os responsáveis pela má utilização da média
a mediana ainda será o mesmo valor, mas o valor da média em muitas situações em que teria mais significado utilizar a
sofrerá um aumento, passando para 14,4. mediana.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: a) Medidas de posição:

 Observações:  Observações:

1. Média versus Mediana: 1. Média versus Mediana:

 Entretanto, a preferência de uma ou de outra dependerá do  Representação das distribuições dos dados na forma de uma
contexto em que forem utilizadas: se a distribuição é simétrica curva de freqüência:
essas medidas coincidem; caso contrário, observar que a mediana
não é tão sensível quanto a média, às observações que são muito
maiores ou muito menores do que as restantes; além disso, a
média reflete o valor de todas as observações.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

21
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

a) Medidas de posição: b) Medidas de dispersão

 Observações: • São medidas estatísticas utilizadas para avaliar o grau de


variabilidade ou dispersão, dos valores em torno da
2. Relação entre as médias aritmética, geométrica e harmônica: média.
 A média geométrica de um conjunto de números positivos é • Servem para medir a representatividade da média
menor ou igual à sua média aritmética, mas é maior ou igual à
sua média harmônica: - Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30,
como pode ser calculado, ambas possuem média aritmética
H ≤G≤ x igual a 20; entretanto, na primeira não existe dispersão,
enquanto a segunda apresenta dispersão em torno da média 20;
 O sinal de igualdade somente é válido quanto todos os números portanto, a média é muito mais representativa para a segunda
do conjunto de dados são idênticos. série.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.1) Amplitude total (ou amplitude amostral): É definida b.2) Desvio médio: O desvio médio de um conjunto de n
como sendo a diferença entre o maior e o menor dos números x1, x2 , ... , xn é definido por:
valores da série, ou seja: n n

R = x máx − x min ∑d
i=1
i ∑x
i =1
i −x
∑ x− x
DM = = =
n n n
- Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36
R = 36 – 10 = 26 onde
x = média aritmética dos números;
- Observação: É uma medida de dispersão muito limitada, pois x i − x = valor absoluto do desvio de cada número
depende apenas dos valores externos, o que a torna instável, não em relação à média aritmética.
sendo afetada pela dispersão dos valores internos.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn b.3) Variância: A variância de um conjunto de dados é
ocorrerem com as freqüências n1, n2, ... , nn, definida como o quadrado do desvio padrão, evitando-
respectivamente, o desvio médio poderá ser indicado se com isso que Σdi=0.
da seguinte forma:
- Quando é necessário distinguir entre o desvio
n n
padrão de uma população e o de uma amostra
∑n
i=1
i di ∑n
i =1
i xi − x
∑n i x− x dela extraída, adota-se frequentemente o símbolo
DM = = =
n n n σ para o primeiro e s para o último.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

22
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.3) Variância: b.3) Variância:

- Para o caso da variância populacional são - Para o caso da variância amostral são adotadas
adotadas as seguintes fórmulas: as seguintes fórmulas:
n n

∑( x − X )2 ∑( x − x )2
∑( x − x )
∑( x − X ) 2 i 2
i
σ2 = i =1
= (dados não agrupados) s2 = i=1
= (dados não agrupados)
N N n−1 n−1
k k

∑n ( x −X) 2

∑n ( x − X ) ∑n ( x −x) 2

∑n ( x − x )
=∑
i i 2 i i 2
σ2 = i =1
=
i
(dados agrupados) s2 = i=1 i
(dados agrupados)
N N n−1 n−1

X = média populacional; N = tamanho da população. x = média populacional; n = tamanho da população.


ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.3) Variância: b.4) Desvio padrão: Uma vez que a variância envolve a
soma de quadrados, a unidade em que se exprime não
• Fórmulas práticas para os cálculos das variâncias: é a mesma que a dos dados. Assim, para se conseguir
uma medida da variabilidade ou dispersão com as
1  (∑ n x ) 2
 mesmas unidades que os dados, toma-se a raiz
σ2 = ∑ ni x i2 − i i

N quadrada da variância e obtém-se o desvio padrão.

N

1  (∑ n x ) 2
 σ = σ2 (desvio padrão populacional)
s2 = ∑ ni x i2 − i i

n−1 n  s= s 2
(desvio padrão amostral)
 

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.4) Desvio padrão: b.4) Desvio padrão:


• Exemplo: Calcular o desvio médio, a variância e o desvio
• O desvio padrão é uma medida que só pode assumir valores
padrão da seguinte distribuição amostral:
não negativos e quanto maior for, maior será a dispersão
dos dados.
xi 5 7 8 9 11 xi ni nixi
• Algumas propriedades do desvio padrão, que resultam ni 2 3 5 4 2 5 2 10
imediatamente da definição, são:
7 3 21
- o desvio padrão é sempre não negativo e será tanto maior, - Média aritmética: 8 5 40
quanta mais variabilidade houver entre os dados; k 5
9 4 36
- se s= 0, então não existe variabilidade, isto é, os dados são ∑n x i i ∑n x i i
129 11 2 22
todos iguais. x= i =1
= i =1
= = 8 ,06
n 16 16 Σ 16 129
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

23
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.4) Desvio padrão: b.4) Desvio padrão:


• Exemplo: Calcular o desvio médio, a variância e o desvio • Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral: padrão da seguinte distribuição amostral:

- Variância:
xi ni nixi |xi-x| = |di| ni|di| xi ni nixi ni2xi
s2 =
1  ( nx 
∑ ni x i2 − ∑ i i  =
)
2

5 2 10 |5 – 8,06| = 3,06 6,12 5 2 10 50


- Desvio médio: n−1

n 
7 3 21 |7 – 8,06| = 1,06 3,18 7 3 21 147
8 5 40 |8 – 8,06| = 0,06 0,30 1  ( 129 ) 2  8 5 40 320
s2 =  1.083 −  = 2 ,86
DM =
∑n i x− x
=
19 ,24
= 1 ,2 9 4 36 |9 – 8,06| = 0,94 3,76 16 − 1  16  9 4 36 324
n 16
11 2 22 |11 – 8,06| = 2,94 5,88 11 2 22 242
- Desvio padrão:
Σ 16 129 19,24 Σ 16 129 1.083
s = s 2 = 2 ,86 = 1,69
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.5) Amplitude interquartílica: b.5) Amplitude interquartílica:

• A medida anterior tem a grande desvantagem de • Esta medida é, de certa forma, uma solução de
ser muito sensível à existência, na amostra, de compromisso, pois não é afetada, de um modo
uma observação muito grande ou muito pequena. geral, pela existência de um pequeno número de
valores demasiadamente grandes ou pequenos. É
• Por esse motivo, define-se uma outra medida, a definida como sendo a diferença entre o 3º e 1º
amplitude interquartílica. quartis; assim:
DQ = Q3 − Q1

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.5) Amplitude interquartílica: b.5) Amplitude interquartílica:

• Da definição de amplitude interquartílica, pode-se concluir • Alguns autores preferem calcular uma medida
que 50% dos elementos do meio da amostra estão contidos próxima da referida: a amplitude semi-
num intervalo com aquela amplitude. Esta medida é não
negativa e será tanto maior quanto maior for a variabilidade
interquartílica (ASI).
nos dados.

• Ao contrário do que acontece com o desvio padrão, uma Q3 − Q1


ASI =
amplitude interquartílica nula não significa necessariamente, 2
que os dados não apresentem variabilidade.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

24
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.6) Coeficiente de variação: b.6) Coeficiente de variação:

• A variação ou dispersão real, determinada a partir • A medida desse efeito é proporcionada pela
do desvio padrão, ou qualquer outra medida de dispersão relativa, definida por:
dispersão, é denominada dispersão absoluta;
entretanto, uma variação ou dispersão, na medida Dispersão absoluta
de uma determinada distância, é inteiramente Dispersão relativa =
Média
diferente quanto ao efeito, da mesma variação em
uma distância menor.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão b) Medidas de dispersão

b.6) Coeficiente de variação: b.6) Coeficiente de variação:

• Exemplo: Em uma empresa, o salário médio dos homens é


• Se a dispersão absoluta é o desvio padrão e a de $4.000,00, com desvio padrão de $1.500,00, e o das
média é a aritmética, a dispersão relativa é mulheres é em média de $3.000,00, com desvio padrão de
denominada coeficiente de variação ou de $1.200,00. Então:
dispersão, dado por: σ 1500
Para os homens: CV = ⋅ 100 =
⋅ 100 = 37 ,5%
σ s X 4000
CV = ⋅ 100 ou CV = ⋅ 100
X x σ 1200
Para as mulheres: CV = ⋅ 100 = ⋅ 100 = 40 ,0%
X 3000
• coeficiente de variação é uma medida relativa de dispersão,
útil para a comparação em termos relativos do grau de • Desses valores conclui-se, portanto, que o salário das
concentração em torno da média de séries distintas. mulheres apresentam maior dispersão que os dos homens
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

b) Medidas de dispersão c) Medidas de forma

b.6) Coeficiente de variação: c.1) Medidas de assimetria:


• Diz-se que a distribuição possui baixa, média ou alta • Denomina-se assimetria o grau de desvio ou
variabilidade (dispersão) conforme os seguintes valores: afastamento da simetria de uma distribuição.
Baixa dispersão: CV ≤ 10% • Uma distribuição de freqüência pode simétrica,
Média dispersão: 10% < CV < 20% assimétrica positiva ou assimétrica negativa.
Alta dispersão: CV ≥ 20%
• Alguns analistas consideram valores diferentes:
Baixa dispersão: CV ≤ 15%
Média dispersão: 15% < CV < 30%
Alta dispersão: CV ≥ 30%
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

25
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

c) Medidas de forma c) Medidas de forma

c.1) Medidas de assimetria: c.1) Medidas de assimetria:


• Uma distribuição simétrica apresenta a igualdade entre as três • Existem várias fórmulas para o cálculo do coeficiente de
medidas de posição, média aritmética, mediana e modo, ou: assimetria, dentre elas duas são bastante utilizadas:
M o = x~ = x - 1º Coeficiente de Pearson: x − Mo x − Mo
AS = ou AS =
σ s
• Em uma distribuição assimétrica positiva, ou assimétrica à
direita, tem-se que: - 2º Coeficiente de Pearson: Q1 + Q3 − 2 ~
x
AS =
Mo < ~
x<x Q 3 − Q1

• Em uma distribuição assimétrica negativa, ou assimétrica à • Se AS = 0, a distribuição é simétrica


esquerda, tem-se que: AS > 0, a distribuição é assimétrica positiva
x<~
x < Mo AS < 0. a distribuição é assimétrica negativa.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

c) Medidas de forma c) Medidas de forma

c.1) Medidas de assimetria: c.1) Medidas de assimetria:


• Exemplo: Identificar o grau de assimetria da • Exemplo:
distribuição:
Classes xi ni nixi nixi2 ni/ai Ni
30 50 40 80 3200 128.000 80/20 = 4 80
Salários ($1.000,00) 30 50 50 100 100 150 50 100 75 50 3750 281.250 50/50 = 1 130
100 150 125 30 3750 468.750 30/50 = 0,6 160
Empregados 60 50 30
Σ 160 10.700 878.000

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

c) Medidas de forma c) Medidas de forma

c.1) Medidas de assimetria: c.2) Medidas de curtose:


• Exemplo: • Denomina-se curtose o grau de achatamento de
10.700 ( 40 − 0 )
uma distribuição.
x= = 66 ,875 Q1 = 30 + ⋅ 20 = 40
160 80
2
s =
1  ( 10.700 )2  ( 120 − 80 ) • Uma distribuição de freqüência pode ser:
878.000 −  = 1021,62 Q 3 = 50 + ⋅ 50 = 90
159  160  50

M o = 30 +
4
⋅ 20 = 41 ,429 ~
x = 30 +
( 80 − 0 )
⋅ 20 = 50
- Mesocúrtica: quando sua forma nem é achatada e
2 1 
4+3
( 10.700 )2 
80
x − M o 66 ,85 − 41 ,429
nem delgada;
s = 878.000 −  = 1021,62 AS = = = 0 ,796
159  160  s 31 ,96
Q + Q 3 − 2 x~ 40 + 90 − 2
- Leptocúrtica: quando apresenta a forma delgada;
s = 31 ,96 AS = 1 = = 0 ,6
Q3 − Q1 90 − 40 - Platicúrdica: quando apresenta a forma achatada.
- Como AS > 0, então a distribuição é assimétrica positiva.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

26
1.5 Estatísticas Amostrais 1.5 Estatísticas Amostrais

c) Medidas de forma c) Medidas de forma

c.2) Medidas de curtose: c.2) Medidas de curtose:


• Para medir o o grau de curtose utiliza-se o coeficiente:
Q 3 − Q1
K=
2( P90 − P10 )
onde Q3 = 3º quartil; P90 = 90º percentil;
Q1 = 1º quartil; P10 = 10º percentil.

• Se K = 0,263 – a curva correspondente à distribuição é


mesocúrtica;
K > 0,263 – a curva é platicúrdica;
K < 0,263 – a curva é leptocúrdica.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.5 Estatísticas Amostrais I - Estatística Descritiva

c) Medidas de forma
 Introdução
c.2) Medidas de curtose:
 Conceitos e definições
• Exemplo: Para a mesma distribuição do exemplo da assimetria,
calcula-se ainda P10 e P90; logo:  Classificação dos dados
P10 = 30 +
( 16 − 0 )
80
⋅ 20 = 34  Caracterização e apresentação dos dados
( 144 − 130 )
P90 = 100 +
160
⋅ 50 = 104 ,375  Estatísticas amostrais
Q 3 − Q1 90 − 40
K= =
2( P90 − P10 ) 2( 104 ,375 − 34 )
= 0 ,355
 Outras apresentações gráficas de dados
- Como K > 0,273, então a distribuição é do tipo platicúrtica.  Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

• Além dos diagramas já estudados, existem outras formas bastante  Diagrama de pontos
utilizadas internacionalmente para apresentar os dados amostrais. Um
bom modo de obter uma apresentação visual eficiente de um conjunto de • Um diagrama de pontos é um gráfico estatístico que consiste em
dados pode ser conseguido por meio de três tipos de gráficos: diagramas grupos de pontos de dados traçados em uma escala simples.
de pontos, diagramas de ramo e folhas e diagramas de caixa.
• O diagrama de pontos é uma apresentação útil de dados, no caso de • São utilizados para dados contínuos, quantitativos e univariados, e
amostras pequenas (até cerca de 20 observações). Entretanto, quando o são muito úteis para exibir um pequeno conjunto de dados.
número de observações for moderadamente alto, o diagrama de ramo e
folhas e o diagrama de caixa podem ser mais úteis. • Esse tipo de gráfico permite uma fácil visualização de duas
• Questões como quantidades de dados abaixo de certo valor, tendência características dos dados: a posição (meio) e a dispersão
central (média ou mediana), dispersão (desvio-padrão), possibilidade de (espalhamento ou variabilidade)
detectar outliers (pontos bastante diferentes do conjunto de dados) e o
desvio da simetria, não são fáceis de responder, pois existem muitas
observações, e a construção de um diagrama de pontos, usando esses
dados, seria relativamente ineficiente .
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

27
1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de pontos  Diagrama de pontos


• Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está • Exemplo 02: O engenheiro do exemplo anterior decide considerar
projetando um conector de náilon para ser usado em aplicação um projeto alternativo com uma espessura maior da parede do
automotiva. Ele considera estabelecer como especificação do projeto conector, 1/8 pol. Oito protótipos desse projeto são construídos,
uma espessura de 3/32 pol., mas está inseguro. Oito unidades do sendo as medidas observadas da força de remoção, resultando nos
protótipo são produzidas e suas forças de remoção são medidas, seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e
resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3; 13,1. Construa um diagrama de pontos para esses dados,
13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses sobrepondo-o ao anterior para uma melhor análise da influência da
dados. espessura da parede na força de remoção.

12 13 14 15 12 14 15
Força de remoção 3/32 pol. 13,0 13,4
1/8 pol. Força de remoção
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de ramo e folhas  Diagrama de ramo e folhas


• Esta forma de apresentação de dados tem sido freqüentemente • Exemplo (Montgomery, 2004, p.16): Considere o
utilizada em trabalhos técnicos do mundo inteiro. conjunto de dados abaixo, relativos à resistência a
• Para construir o diagrama de ramo e folhas, dividimos o elemento
compressão de uma liga de alumínio.
amostral em duas partes: um ramo (stem), consistindo em um ou
105 221 183 186 121 181 180 143 97 154 153 174 120 168 167 141
mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos
245 228 174 199 181 158 176 110 163 131 154 115 160 208 158 133
restantes. 207 180 190 193 194 133 156 123 134 178 76 167 184 135 229 146
Exemplo: O dado 458 é dividido em duas partes, a primeira parte 45, 218 157 101 171 165 172 158 169 199 151 142 163 145 171 148 158
e a segunda parte 8. 160 175 149 87 160 237 150 135 196 201 200 176 150 170 118 149

• Geralmente, escolhe-se relativamente poucos ramos em comparação O diagrama de ramo e folhas resultante é apresentado a
ao número de observações (5 a 20 itens). seguir:
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de ramo e folhas (dados brutos)  Diagrama de ramo e folhas (dados ordenados)
Ramo Folha Frequência Ramo Folha Frequência
7 6 1 7 6 1
8 7 1 8 7 1
9 7 1 9 7 1
10 5 1 2 10 1 5 2
11 5 8 0 3 11 0 5 8 3
12 1 0 3 3 12 0 1 3 3
13 4 1 3 5 3 5 6 13 1 3 3 4 5 5 6
14 2 9 5 8 3 1 6 9 8 14 1 2 3 5 6 8 9 9 8
15 4 7 1 3 4 0 8 8 6 8 0 8 12 15 0 0 1 3 4 4 6 7 8 8 8 8 12
16 3 0 7 3 0 5 0 8 7 9 10 16 0 0 0 3 3 5 7 7 8 9 10
17 8 5 4 4 1 6 2 1 0 6 10 17 0 1 1 2 4 4 5 6 6 8 10
18 0 3 6 1 4 1 0 7 18 0 0 1 1 3 4 6 7
19 9 6 0 9 3 4 6 19 0 3 4 6 9 9 6
20 7 1 0 8 4 20 0 1 7 8 4
21 8 1 21 8 1
22 1 8 9 3 22 1 8 9 3
23 7 1 23 7 1
24 5 1 24 5 1

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

28
1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de ramo e folhas  Diagrama de ramo e folhas

• Em alguns casos pode ser desejável construir mais intervalos ou Freqüência acumulada Ramo Folha
ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em 1 7 6
2 8 7
dois ou mais novos ramos, conforme mostrado abaixo: 3 9 7
5 10 1 5
N = 80 8 11 0 5 8
Min = 76 11 12 0 1 3
Ramo Folha Ramo Folha 17 13 1 3 3 4 5 5
Max = 245
25 14 1 2 3 5 6 8 9 9
14L 1 2 3 5 14z 1 Média = 162,7 37 15 0 0 1 3 4 4 6 7 8 8 8 8
14U 6 8 9 9 14t 2
15L 0 0 1 3 4 4 14f 3
Mediana = 161,5 (10) 16 0 0 0 3 3 5 7 7 8 9
33 17 0 1 1 2 4 4 5 6 6 8
15U 6 7 8 8 8 8 14s 5 Q1 = 143,50 23 18 0 0 1 1 3 4 6
14e Q3 = 181,00 16 19 0 3 4 6 9 9
15z 0 0 10 20 0 1 7 8
15t 1 3 S2 = 33,77
6 21 8
15f 4 4 5 22 1 8 9
15s 6 7 8 2 23 7
15e 8 8 8 1 24 5
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de ramo e folhas  Diagrama de ramo e folhas


• (a) Construa um diagrama de ramo e folhas para esses dados. (b)
• Exercício (Montgomery, 2004, p.17): Os seguintes dados são os
Você acha que o corpo de prova “sobreviverá” além de 2.000
números de ciclos até a falha, de corpos de prova de alumínio,
ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.
sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos
por segundo: Profundidade Ramo Folha
1 3 75
1115 1567 1223 1782 1055 5 7 06 58 85 98
1310 1883 375 1522 1764 8 8 45 65 85
10 9 10 90
1540 1203 2265 1792 1330 a) 17 10 00 15 16 18 20 55 85
b) Não. A probabilidade
1502 1270 1910 1000 1608 22 11 02 02 09 15 20 é muito pequena.
1258 1015 1018 1820 1535 29 12 03 23 38 58 60 69 70
1315 845 1452 1940 1781 33 13 10 15 15 30 c) M = 1436,5
(5) 14 16 21 52 68 81
1085 1674 1890 1120 1750
32 15 01 02 12 22 35 40 60 67 78 94
Q1 = 1097,8
798 1016 2100 910 1501
1020 1102 1594 1730 1238
22 16 05 08 42 74 Q3 = 1735
18 17 30 50 50 64 81 82 92
865 1605 2023 1102 990 11 18 20 83 88 90
2130 706 1315 1578 1468 7 19 10 40
1421 2215 1269 758 1512 5 20 23
1109 785 1260 1416 1750 4 21 00 30
2 22 15 65
1481 885 1888 1560 1642
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de caixa (box plot)  Diagrama de caixa (box plot)


• Uma outra forma gráfica de apresentar os dados é o chamado • A caixa inclui a amplitude interquartil, com o canto esquerdo (ou
diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no
whiskers), que permite descrever simultaneamente vários fatores terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a
importantes de uma série de dados, tais como a tendência central amplitude interquartil , DQ = Q3 - Q1.
(média ou mediana), a dispersão (desvio-padrão), a possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e • Uma linha é desenhada através da caixa, no segundo quartil (que é o
o desvio da simetria. percentil 50 ou a mediana), Q2. A média, como já dito, é opcional.

• Um diagrama de caixa apresenta três quartis, em uma caixa • Uma linha (whisker) estende-se de cada extremidade da caixa.
retangular, alinhados tanto horizontal como verticalmente;
opcionalmente, pode apresentar a média. • A linha inferior (ou esquerda) começa no primeiro quartil indo até o
menor valor do conjunto de pontos dentro das amplitudes
interquartis de 1,5, a partir do primeiro quartil.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

29
1.6 Outras Apresentações Gráficas de Dados 1.6 Outras Apresentações Gráficas de Dados

 Diagrama de caixa (box plot)  Diagrama de caixa (box plot)


• A linha superior (ou direita) começa no terceiro quartil indo até o
maior do conjunto de pontos dentro das amplitudes interquartis de
1,5, a partir do terceiro quartil.

• Dados mais afastados dos que as linhas são plotados como pontos
individuais. Um ponto além da linha, porém a menos de 3
amplitudes interquartis a partir da extremidade da caixa, é chamado
de dispersos (outliers).

• Um ponto a mais de 3 amplitudes interquartis a partir da


extremidade da caixa é chamado de um outlier extremo.
Ocasionalmente, símbolos diferentes (círculos abertos e fechados,
por exemplo) são usados para identificar os dois tipos de outlier.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.6 Outras Apresentações Gráficas de Dados I - Estatística Descritiva

 Diagrama de caixa (box plot)


 Introdução
• Exercício: Represente o diagrama de caixa para os dados da
resistência à compressão do alumínio mostrados no exercício  Conceitos e definições
anterior.
 Classificação dos dados
N = 80
Min = 76
Max = 245  Caracterização e apresentação dos dados
Média = 162,7
Mediana = 161,5
Q1 = 143,50
 Estatísticas amostrais
Q3 = 181,00
 Outras apresentações gráficas de dados
 Regressão linear
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Relação entre duas variáveis  Correlação linear

• Em inúmeras ocasiões o estudo descritivo não se resume • Para se ter uma idéia de como as duas variáveis se
ao estudo de apenas uma variável; para se ter uma visão relacionam é comum representar graficamente esta
global do problema em estudo, muitas vezes é necessário relação por meio de um diagrama de dispersão. Esta
a observação de duas ou mais variáveis. representação consiste na marcação das observações em
um sistema de eixos cartesianos.
• Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passa-
se a ter dados bivariados (xi, yi), i = 1, 2, ..., n. • Se as variáveis fornecem um diagrama de dispersão em
que os pontos se colocam ao redor de uma reta crescente
• Um dos objetivos desse estudo é a relação existente entre
ou decrescente, diz-se que essas variáveis estão
as variáveis do par.
linearmente correlacionadas.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

30
1.7 Regressão Linear 1.7 Regressão Linear

 Correlação linear  Correlação linear

• Quanto menor a dispersão dos pontos em torno da reta,


y y y
mais forte será a correlação.
• A correlação linear será positiva ou negativa caso a
tendência da reta seja crescente ou decrescente.
• Se nenhuma tendência positiva ou negativa pode ser x x x
detectada, a explicação possível para os valores da Correlação linear forte Correlação linear forte Correlação linear fraca
segunda variável é sua média. Nesse caso, o eixo da (positiva) (negativa) (positiva)
dispersão será horizontal, contendo a média da segunda
variável, e diz-se que as variáveis não são linearmente
correlacionadas.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Correlação linear  Correlação linear


• Exemplo: A tabela abaixo mostra os dados da temperatura do gás
y y combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma
y
turbina de combustão, para ser usada em refrigeração, construa o
diagrama de dispersão para esses dados.
y
x 100 125 150 175 200 225 250 275
y 99,1 98,8 98,5 98,5 98,5 98,2 98,0 97,8
x x x
Variáveis não Variáveis não Variáveis não x 300 325 350 375 400 425 450 500

correlacionadas correlacionadas correlacionadas y 97,8 97,8 97,6 97,5 97,3 97,0 96,8 96,7

linearmente linearmente
• Desse diagrama pode-se extrair que talvez exista uma correlação
linear entre as variáveis; esta relação pode ser traduzida por meio
de uma reta.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de correlação linear  Coeficiente de correlação linear

• A determinação da correlação entre duas variáveis por • Karl Pearson propôs o chamado coeficiente de
meio de uma inspeção nos pares anotados ou no correlação linear, o qual é dado pela relação:
diagrama de dispersão correspondente é pouco precisa e Cov ( x , y )
subjetiva. r=
s x2 ⋅ s 2y
• Essa dificuldade pode ser contornada pelo uso de uma
medida que caracterize a correlação linear e seja onde: Cov (x,y) é a covariância das variáveis x e y, e seu
independente do observador que esteja examinando os cálculo é dado por
dados. Cov ( x , y ) =
∑ ( x − x )⋅ ( y − y )
n−1
e sx2 e sy2 são as variâncias da variáveis x e y.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

31
1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de correlação linear  Coeficiente de correlação linear

• Fazendo-se as devidas substituições e simplificações, • r = -1, indica correlação linear negativa perfeita; os
obtém-se o coeficiente de correlação de forma mais pontos (x,y) estão sobre uma reta com coeficiente angular
simples: s negativo.
xy
r= • r = 0, indica que os pontos não estão correlacionados,
s xx ⋅ s yy
onde: nem apresentam tendência crescente ou decrescente.

s yy = ∑ y 2 −
(∑ y ) 2
• r = 1, indica correlação linear positiva perfeita; os pontos
−1≤ r ≤ 1 (x,y) estão sobre uma reta com coeficiente angular
n
positivo.
s xx = ∑ x 2 −
(∑ x ) 2

s xy = ∑ xy −
∑ x⋅∑ y
n n
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de correlação linear  Coeficiente de correlação linear


• Nos casos em que os pontos do diagrama de dispersão estão em uma • A correlação entre duas variáveis pretende captar o fato
reta vertical ou horizontal, o quociente que calcula o coeficiente de dessas variáveis apresentarem a mesma tendência ao
correlação não está definido, pois apresenta numerador e
denominador nulos. Nesse caso, o coeficiente de correlação será
crescimento, ou tendências contrárias.
considerado nulo.
y y • O fato de duas variáveis evoluírem no mesmo sentido ou
em sentidos opostos fornece uma idéia do que se pode
esperar sobre um valor desconhecido da variável y para
um particular valor de x.
x x
r = 0, Cov (x,y) = 0, sy2 = 0 r = 0, pois Cov (x,y) = 0, sx2 = 0
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de correlação linear  Coeficiente de correlação linear


• Se as variáveis x e y são positivamente correlacionadas, e se procura • Os problemas que envolvem estimativas de valores desconhecidos a
estimar o valor de y1 para certo valor x1 menor que a média x, deve- partir de valores históricos são chamados problemas de previsão ou
se esperar o valor correspondente y1 menor que a média y ; para um predição.
valor x2 maior que a média x , deve-se esperar um valor y2 maior que
• O conhecimento da correlação entre duas variáveis, embora possa
a média y, acompanhando a tendência do eixo crescente dos pontos.
fornecer uma pista para a previsão de um valor desconhecido de uma
delas, nada informa a respeito da qualidade dessa previsão, ou seja,
y não se pode, em geral, com base apenas no conhecimento da
y2 correlação, transformar a incerteza da previsão em risco (isto só pe
y possível quando a correlação é perfeita).

y1 • Entretanto, o fato de duas variáveis serem correlacionadas levanta a


x possibilidade de uma relação causal entre elas, o que é importante
x1 x x2 em problemas de previsão.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

32
1.7 Regressão Linear 1.7 Regressão Linear

 Regressão linear simples  Regressão linear simples – Modelo teórico

• Como visto anteriormente, uma previsão construída • Quando se verifica, quer por meio do gráfico de
baseada nas informações obtidas da correlação nada diz a dispersão, quer pelo coeficiente de correlação linear, uma
respeito da confiabilidade do valor previsto. correlação forte entre duas variáveis, a relação entre
essas variáveis pode ser descrita por meio de uma reta de
• Um método de previsão que permite a avaliação em regressão (a reta que melhor se ajusta aos dados).
termos de confiabilidade é a regressão linear, pois,
• Essa reta serve de modelo matemático para expressar a
satisfeitas determinadas condições, ela proporciona a
relação linear entre duas variáveis.
transformação da incerteza em risco

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Regressão linear simples – Modelo teórico  Regressão linear simples – Modelo teórico

• Considere o relacionamento de duas variáveis x e y com • O modelo teórico define a verdadeira reta de regressão, cuja
as seguintes características: equação pode ser escrita como:
y =α +β x
x: é a variável cujos valores são controlados e, portanto,
determinados; ela é conhecida por variável independente ou O valor de y é dado por:
variável de decisão;
y = y+U ou y =α + β x+U
y: variável aleatória; é a variável que se quer prever; seu valor
depende do valor atribuído a x, embora para cada valor de x se onde:
possa ter vários valores de y, devido a sua característica aleatória y é a parte funcional de y (a parte do valor de y explicada pelo
(variável dependente de x). valor de x);
U é a parte aleatória de y, a qual é introduzida no valor de y por
fatores imponderáveis.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Regressão linear simples – Modelo teórico  Método dos mínimos quadrados


• Nessas condições, dado um valor para x, a previsão ou expectativa • Um dos métodos mais utilizados para ajustar uma reta a um conjunto
para o correspondente valor de y é: de dados é o Método dos Mínimos Quadrados (MMQ), o qual
consiste em determinar a reta que minimiza a soma dos quadrados
y =α +β x dos desvios (os chamados erros ou resíduos) entre os verdadeiros
valores de y e os valores estimados a partir da reta de regressão que
• Entretanto, dificilmente se conhece a população dos valores de y
se pretende ajustar, ŷ.
para cada valor da variável controlada x. O que se conhece,
geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma ŷ^= a + bx
amostra dessas variáveis.
• Portanto, com base nos dados amostrais, deve-se pensar como
estimar os valores de α e β, o que pode ser ser feito de forma
eficiente por meio do método dos mínimos quadrados.

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

33
1.7 Regressão Linear 1.7 Regressão Linear

 Método dos mínimos quadrados  Método dos mínimos quadrados

• Adota-se o quadrado das diferenças, pois como os pontos • O modelo de regressão linear é a reta de regressão
se situam acima e abaixo da reta estimada, as diferenças
podem ser positivas ou negativas, e na soma podem ŷi = a + bxi + εi
anular-se, não refletindo o ajustamento. onde
ŷ é o estimador de y;
• Sendo números positivos, esses quadrados refletem a a e b os estimadores de α e β.
qualidade do ajuste através de sua soma.
• A reta estimada é obtida de tal modo que a soma dos quadrados dos
desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,

min ∑ ε i2 = min ∑ ( y i − ŷ i ) 2 = min ∑ [ y i − ( a + bx i )] 2


ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Método dos mínimos quadrados  Coeficiente de explicação


• Como tal, para estimar os parâmetros do modelo, é necessário que as • Calculada a estimativa de mínimos quadrados para uma
primeiras derivadas em relação a a e a b sejam nulas, e as segundas amostra dada, deve-se verificar a qualidade do ajuste
sejam maiores ou iguais a zero, assim:
dessa reta aos dados históricos.
 ∂
 ∂ a ∑ ( y i − a − bx i ) = 0
2



 ∂
• Uma forma de medir a qualidade do ajuste é verificar
∑ ( y i − a − bx i ) 2 = 0 qual a porcentagem da variação dos valores de y em
 ∂ b

As estimativas dos mínimos quadrados para os parâmetros α e β são: relação à sua média pode ser explicada pela regressão de
∑x⋅∑ y y sobre x, o que dará origem ao coeficiente de explicação
∑ y −b∑x = y−bx ∑ xy − n s xy R2.
a= , b= =
n n (∑ x ) s
2
xx
∑ x 2

n
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de explicação  Coeficiente de explicação


• Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x, • Interessa avaliar que porcentagem da parte não explicada pela
observa-se que o valor de yi correspondente a um valor xi pode ser média, y i − y , pode ser explicada pela regressão de y sobre x, isto é,
composto de duas partes: a parte explicada pela média e a parte não por ŷ − y .
explicada pela média. • No método dos mínimos quadrados, ao invés de somar essas
y ŷ = a + bx diferenças, soma-se o quadrado delas para evitar que valores
yi positivos e negativos se anulem.
ŷ
y
} }
yi − ŷ = parte do valor de y não explicada pela média
ŷ − y = parte do valor de y explicada pela regressão
• Designando:
VT = variação total, soma dos quadrados das variações de y em
} y = parte do valor de y explicada pela média relação à sua média.
= ∑(
VT = ( y − y )
2
i − )
xi x VE = variação explicada, a soma dos quadrados das variações em
relação à média. VE = ∑ ( ŷ − y )
2

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

34
1.7 Regressão Linear 1.7 Regressão Linear

 Coeficiente de explicação  Método dos mínimos quadrados


• O coeficiente de explicação pode ser definido agora como sendo
R2 • Exemplo: No exemplo anterior, observou-se no diagrama
a porcentagem da variação total representada pela variação de dispersão uma possível relação linear entre as
explicada.
variáveis.
∑ ( ŷ − y )
2
VE
R2 = =
VT ∑ ( y − y)
i
2 a) Confirme essa relação por meio do coeficiente de
correlação;
b) Encontre a reta de regressão pelo método dos
∑ x⋅∑ y
∑ xy − n s xy mínimos quadrados.
R2 = b ⋅ ou R2 = b ⋅ R2 = r 2
(∑ y ) 2
s yy
∑y − n
2

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Método dos mínimos quadrados  Método dos mínimos quadrados


i x y x2 y2 xy • Cálculos:
1 100 99,1 10000 9820,8 9910,0 s xy
• Cálculos:
2 125 98,8 15625 9761,4 12350,0 r= =
3 150 98,5 22500 9702,2 14775,0
s xx ⋅ s yy - O valor da correlação e do coeficiente de explicação indicam uma
∑ x⋅∑ y forte correlação linear entre a temperatura do gás combustível e a
∑ xy − ∑
4 175 98,5 30625 9702,2 17237,5
5 200 98,5 40000 9702,2 19700,0
r= n taxa de calor. Pode-se, portanto, estimar, através do MMQ os
6 225 98,2 50625 9643,2 22095,0
7 250 98,0 62500 9604,0 24500,0 (∑ x )2
(∑ y )
2
parâmetros a e b e traçar a reta de regressão:
8 275 97,8 75625 9564,8 26895,0 ∑x 2
− ⋅ ∑y 2

n n
∑ x ⋅ ∑ y 451365 − 4625 ⋅ 1565 ,9
9
10
300
325
97,8
97,8
90000
105625
9564,8
9564,8
29340,0
31785,0 451365 −
4625 ⋅ 1565 ,9 ∑ xy − n 16
16 b= = = −0 ,0057
11 350 97,6 122500 9525,8 34160,0 r= (∑ x )2
(4625) 2

12 375 97,5 140625 9506,2 36562,5 1559375 −


( 4625 )2
⋅ 153259 ,8 −
( 1565 ,9 )2 ∑x − n2 1559375 −
16
13 400 97,3 160000 9467,3 38920,0 16 16
14 425 97,0 180625 9409,0 41225,0 r = − 0 ,99 a=
∑ y − b ⋅ ∑ x = 1565 ,9 − ( −0 ,0057 ) ⋅ 4625 = 99 ,516
15 450 96,8 202500 9370,2 43560,0 n n 16 16
R 2 = ( − 0 ,99 )2 = 0 ,977
16 500 96,7 250000 9350,9 48350,0
Σ 4625 1565,9 1559375 153259,8 451365,0 - Sendo assim a reta de regressão é: ŷ = a + bx = 99 ,516 − 0 ,0057 x
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

• Para que se evite erros de previsão, a condição inicial para • Existe um grupo de funções que apresentam diagramas
um estudo de regressão linear entre duas variáveis é que ajustáveis a muitas dessas tendências, e que possuem a
essas variáveis apresentem uma razoável correlação qualidade de poder transformar-se em funções lineares
linear. com a aplicação de logaritmos ou por mudança de
variável.
• Caso os valores de y para crescentes valores de x variem
de modo aleatório, sem apresentar qualquer tendência, o • A forma linear dessas funções transformadas pode então
valor que melhor explica y é, geralmente, a sua média; ser usada para estimar os parâmetros da curva ajustada
entretanto, em alguns casos, o diagrama de dispersão àquela tendência, conforme será estudado a seguir.
apresenta uma tendência não linear, isto é, uma curva bem
definida, em torno da qual os pontos parecem agrupar-se.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

35
1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0 1. Função potência: y = a.xb, com x ≥ 0 e b ≥ 0


• Para este caso, a primeira e a segunda derivadas da função • Se x = 0, então y = 0.
fornecem a forma da curva. • Para x > 0, aplicando o logaritmo, tem-se: ln y = ln a + b.ln x
y y
• Fazendo Y = ln y, A = ln a e X = ln x, tem-se a forma linear:

Y = A + b.x

b>1 0<b<1 O diagrama de dispersão de (X = ln x, Y = ln y) e o coeficiente de


x x correlação correspondente podem indicar a oportunidade e
Crescente Crescente
Concavidade para cima Concavidade para baixo qualidade do ajuste.
Contém a origem Contém a origem
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0 2. Função exponencial: y = abx, a > 0, b > 0, x ≥ 0
• Como no caso anterior, as derivadas fornecem a forma das curvas. • Aplicando o logaritmo, tem-se: ln y = ln a + x.ln b
• Fazendo Y = ln y, A = ln a e B = ln b, tem-se a forma linear:
y y
Y = A + B.x
a
0<b<1
O diagrama de dispersão de (x, Y=lny) e o coeficiente de
a b>1 correlação correspondente podem indicar a oportunidade e
x x qualidade do ajuste.
Crescente Decrescente
Concavidade para cima Concavidade para cima
x=0→y=a x=0→y=a
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis


b b
2. Função hiperbólica, tipo I: y = a + , x > 0 , a > 0 , y > 0 3. Função hiperbólica, tipo I: y= a+ , x > 0, a > 0, y > 0
x x
• A primeira e a segunda derivadas fornecem a forma das curvas. • Fazendo X = 1/x, obtém-se a forma linear:

y y y = a + b.X
a b<0
b>0 O diagrama de dispersão de (X=1/x, y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
a qualidade do ajuste.
- b/a x
x
Decrescente Crescente
Concavidade para cima Concavidade para baixo
Assíntota em x = 0 e y = a Assíntota em y = a
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

36
1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis


1 1
4. Função hiperbólica, tipo II: y= , a > 0, b > 0, x ≥ 0 4. Função hiperbólica, tipo II: y= , a > 0, b > 0, x ≥ 0
a + bx a + bx
• As derivadas da função indicam que a curva é decrescente e tem • Fazendo Y = 1/y, obtém-se:
concavidade voltada para cima, com assíntotas em y = 0. Para x
=0, y = 1/a. 1 1
= ou Y = a + bx
Y a + bx
y
1/a
O diagrama de dispersão de (x, Y=1/y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
x

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

5. Função logaritmo: y = a + b.ln x, x > 0 5. Função logaritmo: y = a + b.ln x, x > 0


• As derivadas indicam a forma da curva: • Fazendo X = ln x, obtém-se a forma linear:

y y y = a + bX
b>0 b<0

O diagrama de dispersão de (X=ln x, y) e o coeficiente de


correlação correspondente podem indicar a oportunidade e
e- a/b x
e-a/b x qualidade do ajuste.
Crescente Decrescente
Concavidade para baixo Concavidade para cima

ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

• Exemplo: Um estudo sobre a oferta de mercado de um • Exemplo:


produto revelou as quantidades que os produtores a. Construa um diagrama de dispersão para os dados da tabela;
estariam dispostos a oferecer a vários níveis de preços b. Calcule o coeficiente de correlação linear das variáveis;
c. O diagrama de dispersão sugere o uso de alguma forma linearizável
para ajustar os pontos?
x = preço 10,00 10,50 11,00 11,50 12,00 12,50 13,00 13,50
d. Construa o gráfico de dispersão da forma linear correspondente à
y = oferta 427 440 447 453 460 465 470 472 função escolhida em (c);
(em 1000 un.) e. Calcule o coeficiente de correlação dos pares em (d);
f. Comente os resultados obtidos;
g. Calcule a regressão de y sobre x para a função de maior correlação;
h. Calcule o coeficiente de explicação para a função escolhida em (g);
i. Calcule a oferta para um preço de 15,00.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

37
1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

• Solução: • Solução:
a. Diagrama de dispersão b. Coeficiente de correlação.
n x y x2 y2 xy

y
475 1 10,0 424 100,00 182329 4270,0
470
465 2 10,5 440 110,25 193600 4620,0
460
3 11,0 447 121,00 198809 4917,0
455
450 4 11,5 453 132,25 205209 5209,5
445
5 12,0 460 144,00 211600 5520,0
440
435 6 12,5 465 156,25 216225 5812,5
430 7 13,0 470 160,00 220900 6110,0
425
420 8 13,5 472 182,25 222284 6372,0
9 9,5 10 10, 11 11, 12 12, 13 13, 14
5 5 5 5
Σ 94,0 3.634 1.115,00 1.652.456 42.831,0
ESTATÍSTICA APLICADA I x
- Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

• Solução: • Solução:
d. Diagrama de dispersão: a forma linear é y = a + b.X, com X = ln x.
b. Coeficiente de correlação.
2
X = ln x 2,30 2,35 2,40 2,44 2,48 2,53 2,56 2,60
94 ⋅ 3.634 ( 94 )
s xy = 42.831 − = 131,5 s xx = 1.115 − = 10 ,5 y = oferta 427 440 447 453 460 465 470 472
8 8
(em 1000 un.
( 3.634 ) 2 131,5
s yy = 1.652.456 − = 1.711 ,5 r= = 0 ,98 y
475
470
8 10 ,5 ⋅ 1.711,5 465
460
455

c. A forma do diagrama de dispersão sugere a curva logaritmica por 450


445

suas características. 440


435

y = a + b.ln x 430
425
420
2 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3

ln x
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis

• Solução: • Solução:
e. Coeficiente de correlação. e. Coeficiente de correlação.
n X=ln x y X2 y2 Xy
19 ,67 ⋅ 3.634 ( 19 ,67 ) 2
1 2,30 424 5,29 182.329 982,1 s xy = 8.947 ,57 − = 11 ,3453 s xx = 48 ,45 − = 0 ,0771
8 8
2 2,35 440 2,52 193.600 1.034,0 ( 3.634 ) 2 11 ,3453
3 2,40 447 5,76 198.809 1.072,8 s yy = 1.652.456 − = 1.711 ,5 r= = 0 ,9879
8 0 ,0771 ⋅ 1.711 ,5
4 2,44 453 5,95 205.209 1.105,5
5 2,48 460 6,15 211.600 1.140,8
6 2,53 465 6,40 216.225 1.176,45 f. A correlação obtida com a curva logarítmica é maior; portanto, essa
7 2,56 470 6,55 220.900 1.203,2 função será escolhida para o processo de regressão.
8 2,60 472 6,77 222.284 1.227,2
Σ 19,67 3.634 48,45 1.652.456 8.947,57
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

38
1.7 Regressão Linear 1.7 Regressão Linear

 Funções linearizáveis  Funções linearizáveis


• Solução: • Solução:
g. Cálculo da regressão linear: i. Projeção da oferta para um preço de 15,00:
s xy 11 ,3453
b= = = 147 ,1505
s xx 0 ,0771 y = 92 ,1907 + 147 ,1505 ⋅ ln x = 92 ,1907 + 147 ,1505 ⋅ ln 15 = 490 ,68

a=
∑ y − b ⋅ ∑ x = 3.634 − 147 ,1505 ⋅ 19 ,67 = 921907
n n 8 8 A oferta esperada quando o preço for 15,00 é de 490,68 mil
y = 92 ,1907 + 147 ,1505. ln x
unidades.
h. Cálculo do R2. s xy 11 ,3453
R2 = b ⋅ = 147 ,1505 ⋅ = 0 ,976
s yy 1.711,5

A regressão de y sobre x explica 97,6% das variações de y a partir de sua


média; os outros 2,4% são atribuídos a fatores imponderáveis.
ESTATÍSTICA APLICADA I - Estatística Descritiva ESTATÍSTICA APLICADA I - Estatística Descritiva

I - Estatística Descritiva

FIM

ESTATÍSTICA APLICADA I - Estatística Descritiva

39

Você também pode gostar