Você está na página 1de 102

1

UNIVERSIDADE ESTADUAL DO CENTRO-OESTE

Campus Universitário de Irati PR

2
ESTATÍSTICA
Ementa: Dados, variáveis, população e amostra. Descrição de amostra com
tabelas e gráficos. Medidas de tendência central. Medidas de dispersão.
Probabilidade. Correlação. Variáveis aleatórias e distribuições discretas.
Distribuições contínuas. Estimação. Testes de hipóteses. Regressão linear.
Principais funções e suas aplicações à Contabilidade.

Objetivos da disciplina: Proporcionar aos alunos de Ciências Contábeis o


conhecimento de métodos estatísticos para a busca de soluções apropriadas
e tomada de decisões.

BIBLIOGRAFIA:
BAZONI, Reinaldo, SAKATE, Maria Massae. Análise de custos,
contabilidade internacional e estatística aplicada. Disponível em:
http://pt.scribd.com/doc/69061580/Analise-de-Custos-Contabilidade-
Internacional-e-a-Aplicada
BUSSAB, Wilton & MORETTIN, Pedro. Estatística Básica. Atual.
CRESPO, Antonio Arnot. Estatística fácil. Saraiva. 1984.
FONSECA, Jairo Simon et alii. Curso de Estatística. 5ª ed. Atlas. São
Paulo, 1994.
KAZMIER, Leonard J. Estatística Aplicada a Economia e Administração.
Tradução: Carlos Augusto Crusius. São Paulo: McGraw-Hill, 1982.
LAPPONI, Juan Carlos. Estatística usando o Excel 5 e 7. São Paulo,
Lapponi Treinamentos e Editora, 1997.
MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo:
Atlas, 2002.
MORETTIN, L. Gonzaga. Estatística Básica – Inferência. São Paulo:
Makron Books.
PEREIRA, Paulo Henrique. Noções de estatística. Campinas, SP: Papirus, 2004.
SILVA, Ermes Medeiros et alli. Estatística para os Cursos de: Economia,
Administração e Ciências Contábeis. São Paulo. Editora Atlas, 1995.
TIBONI, Conceição Gentil Rebelo. Estatística Básica para o Curso de
Turismo. São Paulo: Atlas, 2003.
TOLEDO, Geraldo Luciano. Estatística básica. Atlas. 1988.
WONNACOTT, Ronald & WONNACOTT, Thomas. Fundamentos de
Estatística. LTC.

ESTATÍSTICA

INTRODUÇÃO:
A Estatística é uma ciência que propicia métodos para análise e
avaliação de situações que requerem planejamento ou tomada de decisões. É
utilizada por diversas áreas, como: turismo, economia, medicina, psicologia,
fonoaudiologia, biologia, administração, ciências contábeis, etc....
Na área de ciências sociais aplicadas, em especial em um curso de
Ciências Contábeis, a Estatística é fundamental uma vez que propicia
conhecimentos de técnicas que permitem transformar dados em
informações para tomada de decisões. Para os cursos de pós-graduação
(especializações, mestrados e doutorados) a estatística é imprescindível
para a
correta interpretação dos dados levantados e das análises para os
trabalhos de
monografia, dissertação ou tese.
O uso do instrumental matemático e estatístico torna possível a
resolução de grande variedade de problemas, levando a contabilidade mais
próxima da sua objetividade. Por meio de pesquisas de opinião e formação
de bancos de dados a empresa pode traçar com maior precisão a estratégia a
ser adotada no empreendimento, a escolha das técnicas de verificação e
avaliação da qualidade e quantidade do produto, bem como a expectativa de
lucros ou perdas.

- Histórico:
ANTIGUIDADE: os povos faziam registros de dados que consideravam
importantes, como nº de habitantes, de nascimentos, de óbitos, faziam
avaliações de bens, estimativas das riquezas, cadastramento de propriedades
para cobrança de impostos, no entanto, ainda não faziam análises e
interpretações de tais dados.
SEC. XVI: começaram a fazer as primeiras análises sistemáticas de dados,
originando-se as primeiras tabelas.
SEC. XVIII: As tabelas ficam mais completas, surgem as primeiras
representações gráficas e os cálculos de probabilidades. A estatística
deixa
de ser uma simples tabulação de dados numéricos para se tornar “o conjunto
de métodos utilizados para concluir sobre um todo (população), partindo da
observação de partes dessa população (amostra)".
3

- Definição:
Estatística é uma parte da matemática aplicada que fornece métodos
para coleta, organização, descrição, análise e interpretação de informações
(dados) a respeito de um fenômeno em estudo. Divide-se em :

Estatística
¹
´
¦
÷ ÷
÷ ÷
dados dos ção interpreta e análise da trata l Inferencia ou
dados. dos descrição e o organizaçã coleta, da apenas
Indutiva
trata Descritiva

A coleta, a organização, a descrição dos dados, o cálculo e a


interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA,
enquanto a análise e a interpretação dos dados ficam a cargo da
ESTATÍSTICA INDUTIVA ou INFERENCIAL.

- As seis fases do Trabalho Estatístico:


1º) DEFINIÇÃO DO PROBLEMA:
Saber exatamente aquilo que se pretende estudar é o mesmo que
definir corretamente o problema. EX: a audiência de determinado programa
de TV, a relação entre o preço dos alimentos e os salários, ofertas
de
trabalho, evolução do consumo de um produto, etc...

2º) PLANEJAMENTO:
Como levantar informações? Que dados deverão ser obtidos? Qual
levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma
de atividades? Os custos envolvidos? etc.

3º) COLETA DE DADOS:


A fase de coleta é de grande importância, portanto, é necessário se
manter alguns cuidados para que se possa garantir a fidedignidade dos
resultados. A coleta de dados pode ser feita por meio de: observações,
entrevistas e história de vida, pesquisa bibliográfica, questionários,
observação empírica, entre outros. É importante ressaltar que, existem
diversos procedimentos utilizados para este fim, no entanto, cabe ao
pesquisador decidir qual o procedimento mais adequado ao tipo de pesquisa
realizada.

4º) APURAÇÃO DOS DADOS:


É o momento de procurar possíveis falhas e imperfeições e resumir
os dados através de sua contagem e agrupamento. É a condensação e
tabulação de dados.

5º) APRESENTAÇÃO DOS DADOS:


Há duas formas de apresentação, que não se excluem mutuamente:
tabular e gráfica. A apresentação tabular, é uma apresentação numérica dos
dados em linhas e colunas distribuídas de modo ordenado, segundo regras
práticas fixadas pelo Conselho Nacional de Estatística. A apresentação
gráfica dos dados numéricos constitui uma apresentação geométrica
permitindo uma visão rápida e clara do fenômeno.

6º) ANÁLISE DOS DADOS:


A última fase do trabalho estatístico é a mais importante e delicada.
Trata-se de tirar conclusões sobre o todo (população) a partir de
informações fornecidas por parte representativa do todo (amostra). Está
ligada essencialmente ao cálculo de medidas e coeficientes, cuja
finalidade
principal é descrever o fenômeno (estatística descritiva) e a
interpretação
dos dados (estatística indutiva).

EX: Suponha que se deseja estudar o nº de irmãos dos estudantes da UNICENTRO.


Problema: nº de irmãos dos estudantes da UNICENTRO
Planejamento: censitário: todos os alunos da UNICENTRO
Amostragem: uma parte desses alunos.
Coleta de dados: entrevista ou questionário aplicado aos alunos
Apuração de dados: agrupamento dos dados coletados e crítica dos dados obtidos
Apresentação dos dados: elaboração de tabelas e gráficos
Análise dos dados: cálculo da média de irmãos, do erro padrão, aplicação de
testes e das conclusões.
4
Estatística Descritiva

1) Conceitos iniciais (população, amostra, dados e variáveis)


- População: é o conjunto de todos os elementos que têm, em
comum, uma ou mais determinadas características. Podem ser
pessoas, objetos, itens, etc...
EX: alunos da UNICENTRO, alunos do curso de Ciências Contábeis,
supermercados em Prudentópolis, farmácias em Irati, ....
OBS: a) Muitas vezes, o tamanho da população ( N, ) é muito grande, como
é o censo demográfico do Brasil, ou as populações não podem ser medidas
integralmente, como o caso da medição da vida útil das lâmpadas
produzidas, que obrigaria a testar todas as lâmpadas produzidas, não
restando nenhuma para venda. Devido a esses problemas somos obrigados a
selecionar uma parte dessa população (amostra) para estudo.
b) Parâmetro: é a medida numérica que descreve uma característica da
população. EX: μ, σ
2
, σ

- Amostra: é uma parte da população que é selecionada para a


análise.
EX: 10% do total de acadêmicos do curso de Ciências Contábeis
OBS: o pesquisador que trabalha com amostras sempre pretende
fazer inferências, isto é estender os resultados da amostra para toda a
população. Então é muito importante caracterizar bem a amostra. Portanto:
esta deve ser representativa da população, isto é, deve possuir as
mesmas
características básicas da população. Qualquer que seja a amostra, sempre se
corre o risco de chegar a conclusões erradas, mas este risco diminui à
medida que se aumenta a quantidade de elementos a serem examinados. O
tamanho da amostra ( n ) depende do problema em estudo. Amostras muito
pequenas podem produzir uma estimativa pouco representativa da
população; entretanto, grandes amostras demandam muito trabalho e tempo,
elevando significativamente os custos.
É comum denominar de estatística (iniciando com minúscula) a
medida numérica que descreve uma característica da amostra. EX: X, s
2
, s
- Dados: são os fatos e números coletados, analisados e sintetizados
para a apresentação e interpretação; em outras palavras, qualquer
característica que possa ser observada ou medida de alguma maneira.
Podem ser: primários ou secundários
a) Primários, quando as informações são colhidas diretamente pelo
pesquisador ou por seus auxiliares.
b) Secundários, quando os pesquisadores recorrem a relatórios, revistas,
livros ou dados já coletados por instituições especializadas.

OBS:
a) A coleta de dados primários pode ser feita através de: questionários,
entrevistas pessoais, entrevista por telefone, e-mail, deixado em lugares
estratégicos ou por observação.
b) Quanto aos tipos de perguntas, estas podem ser: dicotômicas quando
permitem apenas duas respostas (sim ou não), de múltipla escolha quando
permitem opção de várias possibilidades ou abertas quando é possível
responder de qualquer maneira.
EX de pergunta dicotômica:
Você mora com os seus pais? ( ) sim ( ) não
Você gosta ( ) ou não gosta de matemática ( )?
EX de pergunta de múltipla escolha:
Em que tipo de alojamento você está morando neste ano de estudo?
( ) Alojamento universitário
( ) Casa/apartamento próprio, com os seus pais
( ) Casa/apartamento alugado, com os seus pais
( ) Outro (favor especificar) _______________
Por que escolheu o curso de Ciências Contábeis?
( ) Preferência
( ) Falta de opção
( ) Não decidiu ainda
( ) Outro (favor especificar) _______________

c) As perguntas abertas permitem um número infinito de respostas


divergentes, porém, deve-se tomar cuidado, pois são difíceis de serem
processadas e analisadas. O ideal é não utilizá-las demasiadamente.

d) Para a elaboração de um questionário, deve-se observar que:


5
• Ele deve ser o mais curto possível.
• As questões em si: devem evitar o uso de termos complexos,
devem fazer sentido, não devem ser muito técnicas ou envolver
muitos cálculos, não devem ser muito pessoais ou ofensivas, não
devem sobrecarregar a memória, não devem ser ambíguas.
• As perguntas devem ser colocadas em uma ordem lógica.
• Devem ser dispostas e construídas de forma atraente.
• A maneira como as respostas serão analisadas deve ser
considerada na etapa da elaboração do questionário.
O conjunto de dados é obtido a partir dos elementos da pesquisa,
coletados por meio de uma variável.

- Variável: É uma característica, propriedade ou atributo em relação à


qual os elementos de uma população diferem de algum modo.
EX: estatura, sexo, peso corporal, idade, grupo sanguíneo, cargo, etc...
A
variável pode ser: qualitativa ou quantitativa.
- Variável qualitativa: é aquela que fornece dados de natureza não-
numérica, como cor dos olhos, sexo, grupo sanguíneo, grau de instrução,
região de procedência, estado civil, tipo de transporte que utiliza,
etc...
Uma variável qualitativa pode ser:
 Nominal: quando não existe ordenação, exemplo: sexo, estado
civil, grupo sanguíneo, etc...
 Ordinal: quando obedece a certa ordenação, exemplo, grau de
escolaridade, classe social, etc...
- Variável quantitativa: quando os dados são expressos por números. Por
ex: preço de produtos, consumo mensal, nº de defeitos de produção,
idade, estatura, peso corporal, salário, nº de filhos, etc...
Uma variável quantitativa pode ser: discreta ou contínua.
 Variável quantitativa discreta: quando só pode assumir
valores pertencentes a um conjunto enumerável.
 Variável quantitativa contínua: quando assume qualquer valor
entre dois limites.

EX: O número de alunos da UNICENTRO pode assumir um dos valores do


conjunto {1, 2, .....80,...} mas nunca valores como 2,5 ou 3,78 ou
4,324, etc...
Logo o número de alunos da UNICENTRO é uma variável quantitativa discreta.
Já o peso desses alunos pode ser 72 kg, como 72,5 kg, como 72,54 kg. Então,
peso dos alunos da UNICENTRO é uma variável quantitativa contínua.

EXERCÍCIO:
Sublinhe em cada caso a variável e classifique em qualitativa (nominal
ou
ordinal) ou quantitativa (discreta ou contínua):
a) nº de peças produzidas por uma certa máquina.
b) diâmetro de peças produzidas por certa máquina.
c) salários dos funcionários de uma empresa.
d) duração de vida, de um novo tipo de lâmpadas produzidas.
e) nº de produtos da marca X vendidos em um supermercado
f) comprimento de pregos produzidos por uma máquina.
g) número de artigos defeituosos produzidos.
h) o valor das vendas diárias de uma empresa
i) grau de instrução (escolaridade) dos funcionários da empresa X
j) número de acidentes de trabalho, por mês
k) cargo dos funcionários de uma empresa.
l) nº de internações hospitalares por uma determinada doença.
m) quantidade de ácido acetilsalicílico em comprimidos.
n) sexo de pacientes internados em uma clínica.
o) nº de dentes perdidos ou danificados em crianças de uma escola.
p) nº de crianças nascidas vivas em uma dada região.

2) Arredondamento de dados:
De acordo com a Resolução 886/66 do IBGE, o arredondamento de dados
é feito da seguinte maneira:
A) Quando o 1º algarismo a ser abandonado é 0, 1, 2, 3 ou 4,
fica
inalterado o último algarismo a permanecer. EX: arredonde os números,
deixando-os com uma casa decimal:
53,24 ÷ 53,2 8,62732 ÷ 8,6
B) Quando o 1º algarismo a ser abandonado é 6, 7, 8 ou 9 aumenta-se
de
uma unidade o algarismo a permanecer. EX: arredonde os nos, deixando-os
com uma casa decimal:
42,87 ÷ 42,9 25,08 ÷ 25,1 53,99 ÷
54,0.
C) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
6
- Se ao 5 seguir, em qualquer casa, um algarismo = de zero, aumenta-se
uma unidade ao algarismo a permanecer. EX: arredonde os nos,
deixando-os com uma casa decimal:
2,352 ÷ 2,4 25,6501÷ 25,7
76,2500002 ÷ 76,3
- Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último
algarismo a ser conservado só será aumentado de uma unidade se for
ímpar. EX:
24,75 ÷ 24,8 24,65 ÷ 24,6
24,7500000÷ 24,8 24,65000 ÷ 24,6

EXERCÍCIOS:
1) Arredonde cada um dos números abaixo, deixando-os com apenas uma
casa decimal:
a) 2,38 e) 328,35 i)
89,99
b) 39,85 f) 2,97 j)
23,40
c) 0,351 g) 6,829 k)
48,85002
d) 4,24 h) 5,550 l)
45,09

2) Arredonde cada um dos números abaixo para a unidade mais próxima:


a) 0,03516 e) 0,9099 i)
149,8701
b) 17,50015 f) 9,219 j)
54,06
c) 990,02 g) 309,973413 k) 103,5
d) 990,025 h) 16,24 l)
38,50

3) Técnicas de amostragem:
a sistemátic Amostragem -
ada estratific al proporcion Amostragem -
simples aleatória ou casual Amostragem
¦
¹
¦
´
¦÷

Técnicas de amostragem são procedimentos a serem adotados para


escolher os elementos que compõe uma amostra. Conforme a técnica
utilizada tem-se um tipo de amostra.
- Amostragem casual ou aleatória simples: a amostra compõe-se por
elementos retirados ao acaso da população. Neste caso, todo elemento da
população tem igual probabilidade de ser escolhido para a amostra. Na
prática, lista-se ou numera-se de 1 a N a população a ser analisada e,
posteriormente seleciona-se a amostra mediante sorteio.
Para evitar o desconforto de escrever os números em pedaços de
papel (todos iguais) e dobrá-los (todos iguais), colocá-los em uma urna
e
retirá-los um a um, pode-se utilizar tabelas já existente para esse fim,
chamadas tabelas de números aleatórios (Tabela 1 - anexo).
As tabelas foram elaboradas para facilitar o sorteio. A leitura da
tabela pode ser feita horizontalmente, verticalmente ou diagonalmente, ou
formando um caminho qualquer.
EX: selecionar uma amostra representativa composta por 10% de 90
funcionários de uma empresa para uma pesquisa sobre os salários.
Tamanho da amostra = 10% de 90 = 9 funcionários
Numeram-se os funcionários de 01 a 90 e define-se uma linha na tabela, por
ex:
Linha 14: 75 –76 –89 –64 –90 –20 –97 –18 –17 –49 –90 –42 –91 –22 -72 –95 –37 – ...
Excluindo os números maiores que 90 e os que se repetem, tem-se os 09
funcionários que irão compor a amostra de nos:
Amostra ÷ 75 – 76 – 89 – 64 – 90 – 20 – 18 – 17 – 49

OBS: No caso de 900 funcionários, numera-se a população de 001 a 900 e se


considera os números da tabela agrupados de 3 em 3 algarismos. Por exemplo,
utilizando a linha 14, tem-se: 757 – 689 – 649 – 020 – 971 – 817 – 499 - ...

- Amostragem proporcional estratificada: quando a população for


constituída de subpopulações ou estratos, em que a variável de interesse
apresentar comportamento diferente nos diferentes estratos, para obter uma
amostra representativa, o procedimento é determinar uma amostra
proporcional estratificada, ou seja, a amostra deve apresentar a mesma
estratificação e a mesma proporcionalidade dos estratos.
EX: Suponha que no exemplo anterior, dos 90 funcionários, 54 sejam do
sexo masculino e 36 sejam do sexo feminino. Obter uma amostra
estratificada com 20% dos elementos da população.
Tamanho da amostra = 20% de 90 = 18 funcionários
Sexo masculino: 20% de 54 = 10,8 ÷ 11
Sexo feminino: 20% de 36 = 7,2 ÷ 7
Total ÷ 18 funcionários

7
OBS: para selecionar os elementos da amostra, utiliza-se a amostragem
casual ou aleatória simples. Numeram-se os funcionários de 01 a 90, sendo
que de 01 a 54 correspondem os funcionários do sexo masculino e de 55 a
90, do sexo feminino. Por ex., definindo a 1ª e 2ª coluna de números
aleatórios, tem-se os seguintes números:
98 –33-80-79-18 –74 –54 –11 –48 –60 –09 –90 –73 –75 –54 –08 –28 –53 –
91 –89 –77 –19 – 21 – 51 – 55 ...
Sexo masculino (01 a 54)÷33–18-54–11-48–09–08–28–53-19–21÷11 funcionários
Sexo feminino (55 a 90) ÷ 80 –79 – 74 – 60 – 90 – 73 – 75 ÷ 07 funcionárias

- Amostragem sistemática: quando os elementos da população estão


ordenados de alguma maneira (em listas, filas, etc...), os elementos da amostra
são escolhidos, não por acaso, mas por um sistema. O procedimento consiste
em retirar um elemento da população, a cada k elementos, ou seja, K =
n
N
, em
que N é o número de elementos da população e n é o número de elementos da
amostra. Escolhe-se por sorteio um número de 01 a K (inclusive), o qual
vai
indicar o 1º elemento da amostra. Os demais elementos, serão periodicamente
considerados de K em K.
EX: suponhamos que a empresa composta por 90 funcionários deseje
selecionar uma amostra sistemática com 20% da população.
N = 90 funcionários e n = 20% de 90 = 18 funcionários
Então : K =
n
N
¬ K = 5
18
90
=
Escolhendo-se, por sorteio, um número entre 01 a 05 (inclusive), por
exemplo
03, o 1º funcionário escolhido será o de nº 03, o próximo o 08, o 13 , o 18 ,...
Ou seja, os 18 funcionários escolhidos serão os de nº: 3 –8 – 13 – 18 – 23 –
28 – 33 – 38 – 43 – 48 – 53 – 58 – 63 – 68 – 73 – 78 – 83 - 88
OBS:
Seleção da amostra aleatória simples utilizando a planilha Excel - 2010
Na planilha Excel digita-se em uma coluna (A) os nºs de 01 a 90 e na coluna
(B) o nome de cada funcionário → DADOS e ANÁLISE DE DADOS.
OBS: Caso a função ANÁLISE DE DADOS não esteja disponível no seu
computador, basta carregá-la primeiro. Clique na guia Arquivo e em
Opções. Clique em Suplementos e, na caixa Gerenciar, selecione
Suplementos do Excel. Clique em Ir. Na caixa Suplementos disponíveis,
selecione a caixa Ferramentas de Análise e clique em OK. Dica: se as
Ferramentas de Análise não estiverem listadas na caixa Suplementos
disponíveis, clique em Procurar para localizá-la. Se você for avisado de que
as Ferramentas de Análise não estão atualmente instaladas no computador,
clique em Sim para instalá-la. Depois que você carregar as Ferramentas
de
Análise, o comando Análise de Dados estará disponível no grupo Análise da
guia Dados. Abre uma janela conforme figura abaixo:

Seleciona Amostragem e clica em OK, abre outra janela conforme figura


acima:
8

Seleciona Amostragem e clica em OK, abre outra janela conforme figura


acima. No campo intervalo de entrada, selecione os dados da população.
Selecione o método de amostragem aleatório e complete no campo nº de
amostras o nº de elementos da amostra. No campo opções de saída,
selecione o intervalo de saída, por ex. em N4 conforme figura e clica
em
OK.

AMOSTRA: 8 - 19 – 22 – 23 – 39 – 51 – 68 – 72 - 84
EXERCÍCIOS:
1) Obtenha uma amostra aleatória com 10% dos alunos curso de Ciências
Contábeis da UNICENTRO (N= 40 alunos) para uma pesquisa sobre o
aproveitamento dos alunos no curso (colunas 19 e 20).

2) Uma população encontra-se dividida em 5 estratos, N


1
= 50, N
2
= 80, N
3
=
120, N
4
= 30 e N
5
= 20. Sabendo que ao ser realizada uma amostragem
proporcional estratificada, 75 elementos foram selecionados para compor a
amostra, determine o número de elementos de cada estrato.
3) A Receita Federal arquiva as declarações de imposto de renda pela
ordem de chegada. Selecionar uma amostra aleatória e uma sistemática de
2% de um lote de 800 declarações. (linha 5).

4) Em uma cidade foram pesquisadas 68 casas comerciais que vendem o


produto X, numeradas de 01 a 68. Obtenha uma amostra aleatória de 20%
dessas casas comerciais (coluna 39 e 40).

5) Um serviço de contabilidade, atende a 70 pequenas empresas, 20 médias


e 5 grandes. Obter uma amostra aleatória constituída de 20% das empresas,
proporcional ao tamanho das empresas. ( linha 16)

6) Uma população se encontra dividida em três estratos, N1 = 40, N 2= 100,


N3 = 60. Sabendo que ao ser realizada uma amostragem estratificada
proporcional, nove elementos da amostra foram retirados do 3º estrato,
determine o número total de elementos da amostra.

7) Numa rua existem 228 casas. Obtenha: a) uma amostra aleatória


correspondendo a 5 % da população ( linha 15). b) uma amostra sistemática
(linha 10) para escolher o 1º elemento da amostra).

8) Uma empresa deseja realizar uma pesquisa sobre preferências de


atividades de lazer entre seus 85 funcionários. Pede-se:
a) a variável em estudo e sua classificação;
b) uma amostra aleatória simples, constituída por 10% da população,
utilizando a linha 22 da tabela de nº aleatórios;
c) uma amostra estratificada constituída por 13% da população (linha 30),
sabendo que 50 funcionários são do sexo masculino,
d) uma amostra sistemática com 11% da população, utilizando a linha 6,
para selecionar o 1º elemento da amostra.

9
4) Apresentação dos dados:
¹
´
¦
÷
÷
cos

gráfi
tabelas

4.1. TABELA: é um quadro que resume um conjunto de observações.


EX: Em uma pesquisa realizada pela gerência da Lanchonete Mordidão
para levantar as vendas dos produtos oferecidos pela Lanchonete, obteve-se
que, em um dia do mês de abril de 2010, foram vendidos 29 sanduíches, 18
pizzas, 65 refrigerantes, 37 salgados e 32 doces. Construa uma tabela
com
os dados, sabendo que os mesmos foram obtidos pela Secretaria da Saúde
do Município.
OBS: Uma tabela deve ser construída de acordo com normas técnicas da
ABNT. Compõe-se de: número, título, corpo, fonte e nota.
Esquematicamente uma tabela tem a seguinte forma:

NÚMERO TÍTULO
TABELA 1 – ESQUEMA GERAL DE UMA TABELA
COLUNA INDICADORA CABE ÇALHO

CORPO
FONTE:
NOTA:
NOTA ESPECÍFICA:
- Número: serve para identificar a tabela no texto. EX: TABELA 1 - ,
ou
TABELA 2.1 –

- Título: explica o que a tabela contém (geralmente em caixa alto). O título


deve responder a três perguntas: O que?, Onde?, e Quando?

- Corpo: conjunto de linhas e colunas que contém informações sobre a


variável em estudo. Constitui-se de cabeçalho, coluna indicadora e casas.
 Cabeçalho: parte superior da tabela, indicando o conteúdo de cada
coluna.
 Coluna Indicadora: especifica o conteúdo de cada linha, devendo ser
alinhada a esquerda e somente a primeira letra ser escrita em
maiúscula, exceto quando se utiliza expressões que totaliza os dados,
como TOTAL. A coluna indicadora deve ser alinhada a esquerda.
 Casas (células): Espaço mínimo do centro de uma tabela, resultante
do cruzamento de uma linha com uma coluna, destinado ao dado
numérico ou ao sinal convencional. Os dados numéricos na tabela
devem, preferencialmente, ser alinhados a direita de cada coluna,
separadas por uma linha imaginária.
As tabelas estatísticas não devem ser fechadas lateralmente por traços
verticais. A separação das colunas, através de traços verticais, deve ser
feita apenas no cabeçalho. As linhas contendo os dados numéricos são
separadas por linhas horizontais imaginárias.

- Fonte: indica os responsáveis pelos dados apresentados. A palavra fonte deve


ser escrita em maiúscula seguida de dois pontos e espaço, seguido do nome da
fonte. Como nome de fonte é permitido o uso de siglas em letras maiúsculas.

- Nota: esclarece aspectos relevantes do levantamento dos dados ou de


apuração ou esclarece a metodologia utilizada na coleta de dados. A palavra
nota deve ser escrita em maiúscula seguida de dois pontos, no mesmo
padrão do título e logo abaixo da fonte. Pode ser usada ainda, a nota
específica para esclarecimento de dados sobre uma parte ou um dado
específico da tabela. A chamada da nota específica deve ser feita por
algarismos arábicos entre parênteses.

Tabelas
¦
¹
¦
´
¦
÷
÷
s frequência de ão distribuiç de tabelas -
entrada dupla de tabelas
simples tabelas

 Tabelas simples:
10
As tabelas simples ou de entrada simples podem apresentar a distribuição de
um conjunto de dados estatísticos a partir de um único fator - época,
local
ou espécie.
Toda tabela simples é denominada de série estatística e conforme o
fator.
Classificam-se em: temporais, geográficas e específicas.

- Séries temporais: os valores


da variável são apresentados
segundo intervalos de tempo
variáveis. São usadas para
apresentar dados referentes a
vendas anuais de uma empresa
nos últimos 10 anos, nº de
trabalhadores empregados nos
últimos 20 anos, preço de
produtos nos últimos anos, etc...
EX:
Inflação no Brasil 1977-1980
(Indice Geral de Preços)
Ano Taxa(%)
1977
1978
1979
1980
38,8
40,8
77,2
110,2
FONTE: BARBOSA, F. de Holanda. A inflação
brasileira no pós-guerra: monetarismo
versus estruturalismo. Rio de Janeiro:
Ipea, 1983.

- Séries geográficas: quando os


valores da variável são
apresentados em determinado
instante discriminados segundo
regiões.

EX:
Duração média dos Cursos Superiores-1994
Países Nº de anos
Itália
Alemanha
Holanda
Inglaterra
7,5
7,0
5,9
menos de 4
FONTE: Revista Veja

- Séries específicas: quando os


valores da variável são
apresentados em determinado
tempo e local, discriminados
segundo especificações ou
categorias.

EX: O que vai fazer com o 13º salário


(Consumidores paulistanos – dez. 2000)
Opções Percentual (%)
Pagar dívida
Fazer compras
Poupar ou guardar
Investir ou aplicar
Gastar nas férias
Outros
53
14
14
7
6
6
FONTE: InformEstado
EX: Suponha que o IBGE tenha realizado uma pesquisa sobre a produção de
café no Brasil, no período de 1991 a 1995 e verificado que em 1991
foram
produzidos 2.535.000 toneladas, em 1992, 2.666.000 toneladas, em 1993,
2.122.000 toneladas, em 1994, 3.750.000 toneladas e em 1995, 2.007.000
toneladas. Organize os dados em uma tabela e classifique a série estatística.

 Tabelas de dupla entrada


Apresentam a distribuição de um conjunto de dados a partir de dois ou
mais fatores ( época e local, espécie e local, etc...). São denominadas de séries
conjugadas EX:
Exportação Brasileira - 1985 – 1990 - 1995
Importadores 1985(%) 1990(%) 1995(%)
América Latina
EUA e Canadá
Europa
Ásia e Oceania
África e Oriente Médio
13,0
28,2
33,9
10,9
14,0
13,4
26,3
35,2
17,7
8,8
25,6
22,2
20,7
15,4
5,5
FONTE: MIC e SECEX

EXERCÍCIOS
1) De acordo com o IBGE(1.988), em 1.986 ocorreram, em acidentes de
trânsito, 27.306 casos de vítimas fatais, assim distribuídos: 11.712
pedestres,
7.116 passageiros e 8.478 condutores. Organize os dados em uma tabela e
classifique a série estatística.

2) Suponha que o IBGE tenha realizado uma pesquisa sobre internações em


estabelecimentos de saúde no Brasil, por espécie de clínica, e verificado que em
1992 foram realizadas 6.457.923 internações em clínica médica, 3.918.308
internações em ginecologia e obstetrícia, 3.031.075 internações em
cirurgia,
2.943.939 internações em pediatria e 3.513.186 internações em outras clínicas.
Organize os dados em uma tabela.

3) Verificou-se em 1.993, o seguinte movimento de importação de mercadorias


no Brasil: 14.839.804 t, oriundas da Arábia Saudita, no valor de US$
1.469.104.000; 10.547.889 t, dos Estados Unidos, no valor de US$
11
6.034.946.000; e 561.024 t, do Japão, no valor de US$ 1.518.843.000.
Organize os dados fornecidos pelo Ministério da Fazenda em uma tabela e
classifique a série obtida.

4) Conforme dados do IBGE (1.999), entre os cinco países mais populosos do


mundo estão: a China com 1.280 milhões de habitantes, a Índia, com
1.010
milhões, os EUA, com 275 milhões, a Indonésia, com 225 milhões e o Brasil,
com 170 milhões. Organize os dados em uma tabela e classifique a série.

5) De acordo com o IBGE, a área terrestre no Brasil distribui-se de


acordo
com os dados: 45,25% corresponde a região Norte, 18,28% a região
Nordeste, 10,85 % a Região Sudeste, 6,76 % a região Sul e o restante
a
região centro Oeste. Organize uma tabela e classifique.

6) Suponha que o IBGE tenha realizado em 1988, uma pesquisa sobre


nascidos vivos no Brasil, segundo o ano de registro e o sexo, no período de
1984 a 1986, e verificado que em 1984 nasceram vivos 1.307.758 meninos e
1.251.280 meninas, em 1985, nasceram vivos 1.339.059 meninos e
1.280.545 meninas e, em 1986, o nº de nascidos vivos masculinos foi de
1.418.050 e femininos foi de 1.361.203. Organize os dados em uma tabela.

7) Em 1.993, no Brasil, foram registrados 46.967 casos de intoxicação


humana, sendo que: 29.601 casos por acidente, 2.604 por abuso, 7.965 por
suicídio, 3.735 casos em que a causa é profissional, 1.959 por outras causas
e 1.103 a causa é ignorada. Organize os dados fornecidos por
MS/FIOCRUZ/SINITOX, em uma tabela.
OBS: Sistema Nacional de Informações Tóxico-Farmacológicas
(SINITOX), criado em 1980 pelo Ministério da Saúde (MS), com sede na
Fundação Oswaldo Cruz (FIOCRUZ).

8) De acordo com o IBGE (1988), a distribuição dos suicídios ocorridos no


Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263 por
alcoolismo, 198 por dificuldade financeira, 700 por doença mental, 189 por
outro tipo de doença, 416 por desilusão amorosa e 217 por outras
causas.
Organize os dados em uma tabela.

9) De acordo com o IBGE (1999), 54% da população brasileira é


constituída por pessoas brancas, 5,4% são negras, 39,9% são pardas e 0,6%
são de raça amarela e indígena. Organize os dados em uma tabela.

 Tabelas de distribuição de freqüências:


Tabelas onde as categorias ou dados da variável estudada estão
dispostos em correspondência com as freqüências. As freqüências são
também denominadas de freqüências absolutas e representam simplesmente
uma contagem do fenômeno estudado.

- Tabelas de distribuição de freqüências para variáveis


qualitativas:
EX: Em um estudo realizado nas Indústrias Engrenagens Ltda, em 2006
sobre o tipo de escolaridade (fundamental, médio, superior ou outro) dos
funcionários da empresa, 30 funcionários foram investigados.
Os funcionários foram nominados por A1, A2, ... A30.
Variável: tipo de escolaridade (fundamental, médio, superior)
Classificação: qualitativa
Após análise dos questionários aplicados obteve-se os seguintes
dados, que chamamos de dados brutos:

Com base nos dados brutos coletados, o processo de construção da


distribuição de freqüência é realizado através da contagem de cada
categoria, ou seja: fundamental = 5 func., médio = 23 func. e superior
= 2
func. Cada categoria da variável (fundamental, médio ou superior) é
representada em uma linha da 1ª coluna da tabela. O número de vezes que
12
cada categoria aparece (freqüência simples ou fi) é representada na 2ª
coluna. Ou seja:

- Tabelas de distribuição de freqüências para variáveis


quantitativas:
Resumem grandes quantidades de dados, indicando os valores
obtidos e a freqüência que ocorrem. Podem ser elaboradas: sem intervalos
de classe e com intervalos de classe.
Uma tabela de distribuição de freqüência sem intervalos de classe é
indicada quando se trata de variável quantitativa discreta de variação
relativamente pequena.
EX: Suponha-se que foram observados o nº de acidentes por dia, em uma empresa,
durante 20 dias, obtendo-se os dados: 0-2-0-1-1-0-0-0-3-2-1-0-1-2-0-1-3-2-2-0.
Organizando-se esses dados em ordem crescente, tem-se :
0-0-0-0-0-0-0-0-1-1-1-1-1-2-2-2-2-2-3-3
Observa-se uma variação relativamente pequena. Assim, a tabela de
distribuição de freqüência é construída colocando-se na 1ª coluna os
valores
distintos da série, chamados x
i
, e na 2ª coluna a freqüência com que os dados
aparecem, indicados por f
i
.
Nº de acidentes, por dia, em uma empresa, durante 20 dias
x
i
– nº de acidentes f
i
– nº de dias
0
1
2
3
8
5
5
2

Uma tabela de distribuição de freqüência com intervalos de classe é


indicada quando os valores de uma característica variam muito ( variável
quantitativa
discreta ou contínua). Nessa situação é conveniente agrupar os dados por faixas
de
valores, os chamados intervalos de classes.
EX: Sejam os salários, em nº de salários mínimos de 30 funcionários de uma empresa:
3 4 2,5 4 4,5 6 5 5,5 6,5 7
7,5 2 3,5 5 5,5 8 8,5 7,5 9 9,5
5 5,5 4,5 4 7,5 6,5 5 6 6,5 6
Organizando-se os dados em ordem crescente, tem-se:
2 2,5 3 3,5 4 4 4 4,5 4,5 5
5 5 5 5,5 5,5 5,5 6 6 6 6,5
6,5 6,5 7 7,5 7,5 7,5 8 8,5 9 9,5

Observa-se grande variação dos dados. Assim, é conveniente construir a


distribuição de freqüências com intervalos de classe. O número de classes
e a
dimensão de cada intervalo depende do pesquisador, podendo o nº de classes oscilar
entre 5 e 20. Existem critérios que podem ser utilizados para determinar o nº de
classes
e a amplitude de cada intervalo.
O nº de classes ( k) pode ser determinado pelo critério da raiz ou pela regra
de Sturges:
- Critério da raiz: k = n em que n = número de elementos da
seqüência de
dados.
No exemplo: n= 30 ÷ k = n
k = 30 ÷ k = 5,47 ÷
k = 5 classes

OBS: o número de classes deve ser um nº inteiro. Embora k=5 classes


(por
arredondamento), pode-se tomar para k uma unidade a menos ou a mais, ou seja 4,
5
ou 6.
- Pela regra de Sturges: k = 1+3,3 log n em que n= nº de dados.
No exemplo: n = 30 ÷ k = 1+3,3 log 30
k = 1 + 3,3 × 1,47 ÷ k = 5,851 ÷ k
= 6 classes
OBS: o número de classes pode ser menor ou maior que 6, ou seja, 5, 6 ou 7.

Determinado o nº de classes k, determina-se a amplitude de cada intervalo de


classe (h) dividindo-se a amplitude amostral (AA) por k, ou seja:
13

k
AA
h = em que AA é a diferença entre o maior e o menor valor da
seqüência de dados.
No exemplo: AA= 9,5 – 2 ÷ AA = 7,5
Assim:
k
AA
h = e tomando- se k = 5, tem-se:
5
5 , 7
h = ÷ h = 1,5
OBS: para facilitar os cálculos posteriores, pode-se arredondar a
amplitude do
intervalo para um n° inteiro. Assim, no caso, pode-se tomar h = 2
No exemplo, conhecendo-se o menor valor da seqüência, no caso, o valor 2,
e conhecendo-se a amplitude de cada intervalo, no caso, h = 2, tem-se: 1ª classe:
2
a 4; 2ª classe: 4 a 6; 3ª classe: 6 a 8; 4ª classe: 8 a 10
De acordo com a Resolução 886/66 do IBGE, os intervalos de classe
devem empregar o símbolo ( ) entre os valores extremos de um
intervalo, o que significa a inclusão do limite inferior e a exclusão do limite
superior. No exemplo:
Classes (i) Nº de salários mínimos
1 2 4
2 4 6
3 6 8
4 8 10
Para completar a tabela resta determinar o nº de observações
correspondentes a cada classe que chamamos de freqüência simples ou
absoluta de uma classe ( f
i
). No exemplo:
1ª classe : 2 4 , tem-se 4 valores ÷ f
1
= 4
2ª classe : 4 6 , tem-se 12 valores ÷ f
2
= 12
3ª classe : 6 8 , tem-se 10 valores ÷ f
3
= 10
4ª classe : 8 10, tem-se 4 valores ÷ f
4
= 4
OBS: A soma das freqüências simples representada por ¿
÷
k
1 i
i
f é igual a n, ou seja:
¿
÷
k
1 i
i
f = n No exemplo: ¿
÷
k
1 i
i
f = f
1
+ f
2
+ f
3
+ f
4
= 4 + 12 + 10 + 4 = 30

Considerando que posteriormente serão realizados cálculos de medidas


características da distribuição, deve-se encontrar um valor que caracterize cada
intervalo. Neste caso, calcula-se o ponto médio de uma classe ( x
i
), somando-
se o limite inferior com o limite superior de cada classe e dividindo-
se por 2.
No exemplo:
x
1
= 3
2
4 2
=
+
x
2
= 5
2
6 4
=
+
x
3
= 7
2
8 6
=
+
x
4
= 9
2
10 8
=
+
Assim, a distribuição de freqüências para as vendas de um produto
será dada por:
Salários de 30 funcionários de uma empresa
Classes unidades x
i
f
i
1 2 4 3 4
2 4 6 5 12
3 6 8 7 10
4 8 10 9 4
¿ = 30 f
i

OBS: a) Os intervalos de classes não precisam necessariamente ter a mesma


amplitude. Porém, sempre que possível, deve-se trabalhar com classes de
mesma amplitude. b) Considerando que intervalo aberto a direita, inclui o
limite inferior e exclui o limite superior, deve-se tomar cuidado com relação
ao último intervalo. O limite superior deve ser maior que o maior valor
da
série de dados. c) A amplitude total da distribuição ( A
T
) é a diferença entre o
limite superior ( máximo) da última classe e o limite inferior (mínimo) da 1ª
classe,
ou seja: No exemplo: A
T
= 10

- 2 ÷ A
T
= 8

 Tipos de freqüências:
- Freqüência Simples ou absoluta ( f
i
): é o valor que realmente representa o
número de dados de cada classe. A soma das freqüências simples é igual ao número
total de dados, ou seja:
¿
÷
k
1 i
i
f = n
No ex., salários de uma empresa : f
1
= 4, f
2
= 12, f
3
= 10 e f
4
= 4 e ¿ = 30 f
i

- Freqüência relativa ( fr
i
): é o valor resultante da razão entre a freqüência simples
da classe i e a freqüência total, ou seja: fr
i
=
¿ i
i
f
f

No exemplo, salários de uma empresa:


fr
1
= % 3 , 13 133 , 0
30
4
fr
f
f
1
i
1
¬ = = ¬
¿
dos func. recebem entre 2, inclusive e 4 s.m.
fr
2
= % 40 400 , 0
30
12
fr
f
f
2
i
2
¬ = = ¬
¿
dos func. recebem entre 4, inclusive e 6 s.m.
14
fr
3
= % 33,3 333 , 0
30
10
fr
f
f
3
i
3
¬ = = ¬
¿
dos func. recebem entre 6, inclusive e 8 s.m.
fr
4
= % 3 , 13 133 , 0
30
4
fr
f
4 f
4
i
¬ = = ¬
¿
dos func. recebem entre 8, inclusive e 10 s.m.
Evidentemente 1 fr
i
= ¿ ou 100%
OBS: o propósito das freqüências relativas é o de permitir a análise ou facilitar
as comparações.
- Freqüência acumulada ( F
i
): é a soma da freqüência simples da classe i com as
freqüências simples das classes que a antecedem, ou seja:
F
i
= f
1
+ f
2

+ … + f
i
No exemplo, vendas de um produto:
F
1
= f
1
= 4 ¬ 4 funcionários recebem entre 2 e 4 s.m. ou menos de 4 s.m.
F
2
= f
1
+ f
2
= 4 + 12 = 16 ¬ 16 funcionários recebem menos de 6 s.m.
F
3
= f
1
+ f
2
+ f
3
= 4 + 12 + 10 = 26 ¬ 26 funcionários recebem menos
de 8 s.m.
F
4
= f
1
+ f
2
+ f
3
+ f
4
= 4 + 12 + 10 + 4 = 30 ¬ 30 funcionários recebem
menos de 10 s.m.
- Freqüência acumulada relativa ( Fr
i
): é a freqüência acumulada da classe i,
dividida pela freqüência total da distribuição, ou seja : Fr
i
=
¿fi
F
i

No exemplo, salários de uma empresa :


Fr
1
= % 3 , 13 133 , 0
30
4
f
F
i
1
¬ = =
¿

dos funcionários recebem entre 2, inclusive e 4 s.m


F
2
= % 3 , 53 533 , 0
30
16
f
F
i
2
¬ = =
¿
dos funcionários recebem entre 2, inclusive e 6 s.m
F
3
= % 7 , 86 867 , 0
30
26
f
F
i
3
¬ = =
¿
dos funcionários recebem entre 2, inclusive e 8 s.m
F
4
= % 100 00 , 1
30
30
f
F
i
4
¬ = =
¿
dos funcionários recebem entre 2, inclusive e 10 s.m
OBS: o conhecimento dos vários tipos de freqüências permite responder a muitas
questões com relativa facilidade.

EXERCÍCIOS
1) A tabela abaixo apresenta as vendas diárias de um determinado aparelho
elétrico, durante um mês, por uma firma comercial:
14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13
15 11 15 13 16 17 14 14
Forme uma distribuição de freqüência sem intervalos de classe.

2) Um banco selecionou ao acaso 25 contas de pessoas físicas em uma


agência, em determinado dia, obtendo os seguintes saldos em dólares:
52.500,00 18.300,00 35.700,00 43.800,00 22.150,00
6.830,00 3.250,00 17.603,00 35.600,00 7.800,00
16.323,00 42.130,00 27.606,00 18.350,00 12.521,00
25.300,00 31.452,00 39.610,00 22.450,00 7.380,00
28.000,00 21.000,00 14.751,00 39.512,00 17.319,00
Agrupe por freqüência estes dados, utilizando intervalos de classe, em que k
= 5, h = 10.000 e o limite inferior da primeira classe seja 0.

3) Considerando as vendas mensais de um produto em 100 casas do ramo:


64 78 66 82 74 103 78 86 103 87
73 95 82 89 73 94 75 92 85 80
81 90 78 86 78 101 85 98 75 73
90 86 67 95 86 84 86 76 76 83
103 86 84 85 76 80 92 102 73 98
108 87 70 85 79 93 82 90 83 81
85 72 81 96 81 85 71 92 68 96
86 70 72 74 84 99 81 89 71 73
63 105 74 72 73 98 78 78 83 96
95 94 88 62 91 83 98 93 83 76

a) Qual a amplitude amostral? b) Qual o valor de k pelo critério da raiz? c)


Qual o valor de k pela regra de Sturges? d) Forme uma distribuição de
freqüência; g) Qual a variação total nas vendas?

4) Uma indústria embala peças em caixas com 100 unidades. O controle


de
qualidade selecionou 48 caixas da linha de produção e anotou em cada caixa
o
número de peças defeituosas. Obteve os seguintes dados:
2 0 0 4 3 0 0 1 0 0 1 1
2 1 1 1 1 1 1 0 0 0 3 0
0 0 2 0 0 1 1 2 0 2 0 0
0 0 0 0 0 0 0 0 0 0 1 0
a) Na sua opinião, os dados devem ser agrupados por freqüência com
intervalos de classe ou sem intervalos de classe? Por quê? b) Agrupe
por
freqüência estes dados.
15

5) Complete o quadro de distribuição de freqüências:


Classes notas x
i
f
i
fr
i
% F
i
Fr
i
%
1 6 10 1
2 10 14 25
3 14 18 14
4 18 22
90
5 22 26 2
¿ =
i
f

7) Dada a distribuição de freqüências, determine: a) ¿ i


f ; b) as freqüências
relativas; c) as freqüências acumuladas; d) as freqüências relativas acumuladas:
x
i
3 4 5 6 7 8
fi 2 5 12 10 8 3

8) A tabela abaixo apresenta uma distribuição de freqüências das áreas de 400


lotes:
Áreas (m2) 300 400 500 600 700 800 900 1000
1100 1.200
Nº de lotes 14 46 58 76 68 62
48 22 6
Com referência a essa tabela, determine:
a) a amplitude total; b) o limite superior da 5ª classe; c) o limite inferior da
oitava
classe; d) o ponto médio da sétima classe; e) a amplitude do intervalo da segunda
classe; f) a freqüência da quarta classe; g) a freqüência relativa da sexta classe;
h) a
freqüência acumulada da quinta classe; i) o número de lotes cuja área não atinge
700
m
2
; j) o número de lotes cuja área atinge e ultrapassa 800 m
2
; l) a percentagem dos
lotes cuja área não atinge 600 m
2
; m) a percentagem dos lotes cuja área seja maior ou
igual a 900 m
2
; n) a percentagem dos lotes cuja área é de 500 m
2
, no mínimo, mas
inferior a 1.000 m2; o) a classe do 72º lote; p) até que classe estão incluídos 60%
dos
lotes;
9) A distribuição abaixo indica o número de acidentes ocorridos com 70 motoristas
de uma empresa de ônibus:
Nº de acidentes 0 1 2 3 4 5 6
7
Nº de motoristas 20 10 16 9 6 5 3 1
Determine: a) o nº de motoristas que não sofreram nenhum acidente; b) o
nº de
motoristas que sofreram pelo menos 4 acidentes; c) o nº de motoristas que sofreram
menos de 3 acidentes; d) o nº de motoristas que sofreram no mínimo 3 e no máximo
5 acidentes; e) a percentagem dos motoristas que sofreram no máximo 2 acidentes.

4.2. GRÁFICOS:
São formas de apresentação de dados estatísticos que permitem
uma visão
completa do fato estudado. Nos gráficos estatísticos são feitas correspondências
entre
os elementos de uma tabela e uma figura geométrica, de tal modo que
haja
proporcionalidade nesta representação.
Todo gráfico deve apresentar número, título, rodapé. Se
necessário deve
conter ainda a legenda explicativa.
O NÚMERO é utilizado para identificar o gráfico. EX: GRÀFICO 1 -
O TÍTULO é colocado acima do gráfico e deve responder as perguntas: o
que?,
onde? E quando?. Preferencialmente em letras maiúsculas seguindo o padrão
do
texto.
O RODAPÉ constitui-se da FONTE, NOTA e NOTA ESPECÍFICA.
A FONTE indica o órgão ou entidade responsável pelo fornecimento dos
dados.
Deve ser colocada abaixo do gráfico e escrita em maiúscula, seguida de dois pontos.
A NOTA quando necessária é utilizada para apresentação de informações de
natureza gera,, esclarecendo o conteúdo e a metodologia. Deve vir em
seguida da
fonte e ser escrita em letra maiúscula seguida de dois pontos.
A NOTA ESPECÍFICA, quando necessária, é utilizada para esclarecer sobre um
item ou uma parte específica do gráfico. Utiliza-se chamadas, indicadas no gráfico,
geralmente no título ou na legenda. A nota específica deve ser chamada
por
algarismos arábicos entre parênteses.
A legenda explicativa informa, se necessário, diferenças entre cores,
símbolos, tipos de retas, etc. Essas informações também podem ser escritas no
título.
Devem ser colocadas, de preferência, à direita do gráfico.

4.2.1. Tipos de gráficos:


Há vários tipos de gráficos, os principais são:
- gráfico em linha ;
- gráfico em coluna ou em barras;
- gráfico em colunas ( barras) múltiplas; ÷ variáveis qualitativas
- gráfico em setores.;
- gráfico de pareto;
- histograma ÷ varáveis quantitativas discretas
ou contínuas
- polígono de freqüências
A escolha do tipo de gráfico a ser utilizado depende do objetivo do mesmo e
também da variável envolvida..

16
- Gráfico em linha ;
Esse tipo de gráfico utiliza-se da linha poligonal para representar a
série
estatística. São elaborados no sistema de coordenadas cartesianas ortogonais ( eixo
das abscissas e eixo das ordenadas). Representa-se uma variável no eixo x e a
outra
no eixo y. Para cada valor de x tem-se um valor de y, formando pares
ordenados
(x,y). Determinados graficamente todos os pontos da série, liga-se todos os pontos,
dois a dois, por segmentos de reta, resultando em uma linha poligonal.
OBS: os
gráficos devem conter escalas. As escalas devem crescer da esquerda para a direita
e
de baixo para cima. As legendas explicativas devem ser colocadas, de preferência, à
direita do gráfico.

EX:
PRODUÇÃO BRASILEIRA DE ÓLEO
DE DENDÊ –1987-92
Anos Quantidade (1000t)
1987
1988
1989
1990
39,3
39,1
53,9
65,1
FONTE: Agropalma

PRODUÇÃO BRASILEIRA DE ÓLEO


DE DENDÊ - 1987-92

FONTE: Agropalma

OBS: sempre que possível o zero deverá ser indicado, especialmente no


eixo vertical (Y). se for impossível utiliza-se um meio e reduz –se o
eixo.
EX:
50
0

Os gráficos em linha são utilizados na identificação de tendências de


aumento ou diminuição dos valores numéricos de uma dada informação, tais como:
análise de lucros ou prejuízos de empresas, incidência de moléstias,
índice de
crescimento populacional ou mortalidade infantil, índices de custo de
vida, etc...
Pode ser representado, através de um gráfico de linha, a variação de
dois ou mais
fenômenos, por exemplo: preferência eleitoral em períodos distintos de dois ou mais
candidatos, etc... EX:
Presidente 2º turno – Brasil-out./2002
Dias Lula (PT)
%
Serra (PSDB)
%
15/10
22/10
26/10
66
65
62
34
35
38
FONTE: IBOPE

- Gráfico em colunas ou em barras;


É a representação de uma série estatística por meio de
retângulos,
dispostos verticalmente (em colunas) ou horizontalmente (em barras).
Quando em colunas, os retângulos têm a mesma base e as alturas são
proporcionais aos respectivos dados. Quando em barras, os retângulos têm a
mesma altura e os comprimentos são proporcionais aos respectivos dados.
EX: represente através de um gráfico em colunas e em barras os dados
da
série: Produção Brasileira de Óleo De Dendê - 1987-92.

- gráfico em colunas: - gráfico em barras:


PRODUÇÃO BRASILEIRA DE PRODUÇÃO BRASILEIRA DE
ÓLEO DE DENDÊ - 1987-92 ÓLEO DE DENDÊ - 1987-92
17
- Gráfico em colunas ( barras) múltiplas;
Usado para representar, simultaneamente dois ou mais fenômenos
estudados com o propósito de comparação entre os fenômenos:
EX: BALANÇA COMERCIAL DO BRASIL – 1989 – 93
Especificações Valor ( US$ 1.000.000)
1989 1990 1991
1992 1993
Exportação 34.383 31.414 31.620 35.793
38.783
Importação 18.263 20.661 21.041 20.554
25.711
FONTE: Ministério da Fazenda

BALANÇA COMERCIAL DO BRASIL – 1989 – 93

FONTE: Ministério da Fazenda

- Gráfico em setores;
Construído com base em um círculo é empregado sempre que se deseja
ressaltar participação de um dado no total. O total é representado pelo círculo
que
fica dividido em tantos setores quantas são as partes. Os setores devem ter áreas
proporcionais aos dados da série. A representação da área de cada setor é obtida
por
uma regra de três simples e direta, ou seja:

Total 360°
Cada parte x°

EX: : PRODUÇÃO DE FERRO-GUSA - BRASIL - 1993


Estados Produção (1000t) x°
Minas Gerais 12.888
Espírito Santo 3.174
Rio de Janeiro 5.008
São Paulo 2.912
FONTE: I. B. Siderurgia

- Cálculo da medida de cada ângulo o


i
:
o
1
= ? ¬ 23.982 360°
12.888 o
1
¬ o
1
= 193°

o
2
= ? ¬

o
3
= ? ¬

o
4
= ? ¬

PRODUÇÃO DE FERRO-GUSA - BRASIL - 1993

Fonte: I. B. Siderurgia

- Gráfico de Pareto:
É um tipo especial de gráfico em colunas e em linhas. Trata-se de um gráfico de
gestão de qualidade usado para visualizar diversos elementos de um problema e
auxiliar
na determinação de sua prioridade.
EX: Suponha que um fabricante de auto peças recebeu um certo número
de
reclamações sobre um determinado produto seu, durante uma semana. A fim
de
melhorar a qualidade da sua produção e prestação de serviços, ele coletou os dados
referentes as reclamações, organizando-as nas categorias.
Reclamações apresentadas
Categoria número
Demora na entrega
Conserto da peça
Defeito na embalagem
Substituição da peça
outros
1
2
3
4
5

18
Definidas as categorias, o fabricante entrevistou 33 clientes, obtendo como
resultado de
sua pesquisa os dados:
Reclamações conforme os entrevistados
1º 1 4º 2 7º 5 10º 2 13º 4 16º 3 19º 1 22º 3 25º 2 28º 3 31º 1
2º 4 5º 1 8º 1 11º 2 14º 1 17º 3 20º 5 23º 3 26º 4 29º 2 32º 3
3º 4 6º 1 9º 1 12º 3 15º 3 18º 5 21º 1 24º 1 27º 2 30º 5 33º 4
A partir dos dados coletados constroem-se duas tabelas de freqüências,
com os
respectivos percentuais e com os percentuais cumulativos. A 1ª tabela apresenta as
reclamações e a 2ª identifica os principais problemas por ordem
decrescente de
freqüência:

Tabela 1: Reclamações dos clientes


Reclamações
(Categorias)
Nº de
clientes
% %
cumulativo
1
2
3
4
5
10
6
8
5
4
30,30
18,18
24,25
15,15
12,12
30,30
48,48
72,73
87,88
100,00
33
clientes

Tabela 2: Principais problemas


Reclamações
(Categorias)
Nº de
clientes
% %
cumulativo
1
3
2
4
5
10
8
6
5
4
30,30
24,25
18,18
15,15
12,12
30,30
54,55
72,73
87,88
100,00
33
clientes

Por fim, constrói-se o gráfico de Pareto:


Reclamações sobre um determinado produto
0
2
4
6
8
10
12
1 3 2 4 5
problemas apresentados
n
º

d
e

r
e
c
l
a
m
a
ç
õ
e
s
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
%

c
u
m
u
l
a
t
i
v
o
Reclamações apresentadas
número Categoria
1 Demora na
entrega
2 Conserto da peça
3 Defeito na
embalagem
4 Substituição da
peça
5 Outros

De posse da tabela e do gráfico fica fácil perceber quais são os principais


problemas
que a fábrica possui. Resolvendo os problemas 1 e 3 tem-se 54,55% das reclamações
eliminadas. Deste modo, é possível atacar poucos problemas e resolver grande parte
das reclamações.

 Uso da Planilha Excel do Microsoft Office 2010 na construção de


gráficos:
A partir de dados registrados em uma planilha do Excel pode-se construir
diferentes tipos de gráficos, usando-se o menu Inserir Gráfico.
Primeiramente selecionar os dados. Após clicar no menu Inserir Gráfico ou
no botão auxiliar gráfico, o Excel apresenta a caixa de diálogo para escolher o
tipo de
gráfico desejado (são 11 tipos diferentes). Escolhido o tipo de gráfico, escolhe-se
o
sub-tipo e clica em OK. Em Selecionar dados, edita-se a coluna indicadora no eixo
x.
Em layout do gráfico escolhe-se o tipo de apresentação. Edita-se título do gráfico
e
dos eixos.

EX: - gráfico em linha: - gráfico


em colunas

Produção brasileira de Óleo de Dendê 1987-92


0
20
40
60
80
1
9
8
7
1
9
8
8
1
9
8
9
1
9
9
0
1
9
9
1
1
9
9
2
Anos
Q
u
a
n
t
i
d
a
d
e

(
1
0
0
0
t
)

Produção Brasileira de óleo de dendê - 1987-92


39,3 39,1
53,9
65,1
69,1
59,5
0
10
20
30
40
50
60
70
80
1987 1988 1989 1990 1991 1992
Anos
Q
u
a
n
t
i
d
a
d
e

(
1
0
0
0
t
)

- gráfico em barras:
- gráfico em colunas múltiplas:

Produção Brasileira de Óleo de Dendê-1987-92


39,3
39,1
53,9
65,1
69,1
59,5
0 20 40 60 80
1987
1988
1989
1990
1991
1992
A
n
o
s
Quantidade (1000t)

BalançaComercial doBrasil - 1989-93


0
5.000
10.000
15.000
20.000
25.000
30.000
35.000
40.000
45.000
1989 1990 1991 1992 1993
Especificações
V
a
l o
r
(
U
S
$

1
. 0
0
0
. 0
0
0
)
Exportação
Importação

19
- gráfico em setores:
Pr odução de Fer r o- Gusa - Br asi l -
1993
54%
12%
13%
21%
Mi nas Ger ai s
Espír i t o Sant o
Ri o de Janei r o
São Paul o

Reclamações sobre um determinado produto


0
2
4
6
8
10
12
1 3 2 4 5
problemas apresentados
n
º

d
e

r
e
c
l
a
m
a
ç
õ
e
s
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
%

c
u
m
u
l
a
t
i
v
o

Fonte: I.B.Siderurgia

EXERCÍCIOS
1) Represente as séries estatísticas abaixo através de gráficos:
a) POPULAÇÃO BRASILEIRA
1950-2000
Anos População (em milhões)
1950
1960
1970
1980
1990
2000
52
70
93
119
147
170
Fonte: IBGE
b) Cidades brasileiras mais
visitadas por turistas
estrangeiros (1999)
Cidades Nº de turistas
(%)
Rio de Janeiro
Florianópolis
São Paulo
Salvador
Foz do Iguaçu
32,54
17,69
13,74
12,67
11,78
Fonte: OMT

2) Represente a série abaixo usando o gráfico em linha e/ou gráfico


em colunas
múltiplas:
Evolução da taxa de desemprego em % (out. e nov. de 2000)
Estado Outubro Novembro
Recife
Salvador
Belo Horizonte
Rio de Janeiro
São Paulo
Porto Alegre
Outros
7,7
9,2
6,9
4,7
7,2
7,6
6,8
6,9
9,2
7,1
4,4
6,2
6,6
6,2
Fonte: IBGE

3) De acordo com a Agencia AutoInforme, caíram as vendas de carros 1.0 ou


1.000cc.
A tendência do brasileiro em comprar carro de 1.000cc está diminuindo.
Em 2004 a
participação deste tipo de motorização era de 57,3% e no ano de 2005 caiu para
55,9%.
Estes compradores migraram para carros de até 2.000 cc, que passou de
42,3% para
43,5% na participação da produção dos carros. Construa uma tabela e um gráfico em
colunas múltiplas para representar os dados.

4) O gráfico abaixo representa os


continentes onde falta água encanada (total:
1,1 bilhão de pessoas). Qual a quantidade de
pessoas sem água encanada na África (1), na
Europa (2), na Ásia (3),na América Latina e
Caribe (4)? Construa uma tabela
reproduzindo os dados :
Continentes onde falta água
encanada
2
2%
4
7%
3
63%
1
28%
1
2
3
4

5) Na figura, determine as parcelas de


trabalhadores correspondentes aos
percentuais indicados, sabendo que a
população de trabalhadores paulistanos
seja de 4,8 milhões. Construa uma
tabela reproduzindo os dados obtidos.
53%
14%
14%
7%
6%
6%
0 20 40 60
Pagar díivdas
Fazer compras
Poupar ou guardar
Investir ou aplicar
Gastar nas férias
Outros
percentual
o
p
ç
õ
e
s
O que vai fazer com o dinheiro do 13º
salário

6) De acordo com o “Conteúdo Tecnológico do Comércio Exterior Brasileiro”, o


Brasil
exportou entre 2000 e 2003, 15% em produtos de alto nível de
tecnologia, 18% em
produtos de média tecnologia, 8% em produtos de baixa tecnologia, 13% de
manufaturados, 39% de Comodities e 7% de outros produtos. Pede-se: a) Organize uma
tabela; b) Construa um gráfico em barras para representar os dados; c) Construa um
gráfico
em setores para representar os dados.

7) Construir um gráfico de Pareto para a tabela abaixo que apresenta as áreas em


que o Procon recebe reclamações e conclua em que áreas o Procon
deverá
centralizar suas investigações.
Reclamações no PROCON por área
Áreas % ou f
i
%
Alimentos
Assuntos financeiros
Habitação
Produtos
Saúde
Serviços
1
23
8
21
7
40

20
- Histograma:
¹
´
¦÷
classe de intervalos COM s freqüência de ão distribuiç de tabelas -
classe de intervalos SEM s freqüência de ão distribuiç de tabelas

É um gráfico de barras verticais utilizado para apresentar os resultados de uma


tabela de distribuição de freqüências. O histograma representa as
freqüências e não os
dados.

 Histograma para tabelas de distribuição de freqüências SEM


intervalos de
classe:
A representação é feita por um conjunto de barras verticais ou segmentos de
retas. O
valor de cada variável é marcado no eixo horizontal (eixo das abscissas)
e a freqüência
simples ou freqüência acumulada é marcada no eixo vertical ( eixo das ordenadas).
EX: Represente graficamente os dados da tabela:
Nº de acidentes, por dia, em uma empresa, durante 20 dias
xi Nº de acidentes ( fi ) Fi
0
1
2
3
8
5
5
2
8
13
18
20

Representação gráfica:
Nº de acidentes, por dia, em uma empresa, durante 20 dias
fi
Fi

x
i
x
i

 Histograma para tabelas de distribuição de freqüências COM intervalos


de
classe:
É o gráfico formado por um conjunto de retângulos verticais justapostos
(unidos). A base de cada retângulo corresponde a amplitude de cada intervalo de
classe. Se todos os intervalos de classe tiverem a mesma amplitude, a altura
de cada retângulo corresponde a freqüência da classe correspondente.

EX: Salários dos funcionários de uma empresa


Classes notas x
i
f
i
1
2
3
4
2 4
4 6
6 8
8 10
3
5
7
9
4
12
10
4
¿ = 30 f
i

Histograma: Salários dos funcionários de uma empresa

- Polígono de freqüências:
Também é utilizado para representar graficamente uma
distribuição
de freqüências com intervalos de classe. É um gráfico em linha, em
que as
freqüências são marcadas sobre as perpendiculares ao eixo horizontal,
levantadas pelos pontos médios dos intervalos de classe.

EX: Salários dos funcionários de uma empresa


Classes Salários x
i
f
i

1
2
3
4
3 4
5 6
6 8
8 10
3
5
7
9
4
12
10
4
¿ = 30 f
i

Polígono de freqüências: Salários dos funcionários de uma empresa

21
OBS: para completar o polígono, unem-se os extremos da linha obtida aos
pontos
médios da classe anterior a primeira e da posterior à última, da distribuição.
Traçado o polígono de freqüência é desejável, que se faça um polimento, de
modo a mostrar o que seria tal polígono com um número maior de dados. Ou seja,
como em geral, os dados coletados pertencem a uma amostra extraída de
uma
população, ampliando-se essa amostra, a amplitude das classes tende a ficar cada
vez menor e a linha poligonal (contorno do polígono de freqüência) tende
a se
transformar em uma curva, chamada “curva de freqüência”.
Tal curva mostra, de modo mais evidente a verdadeira natureza da distribuição
da população. A curva de freqüência pode ser obtida por aproximação ou,
calculando-se novas freqüências, denominadas freqüências calculadas ( fc
i
).

Formas das curvas de freqüências: As curvas de freqüências podem


assumir formas características, tais como:
a) Curvas em forma de sino: caracterizam-se por apresentarem um
valor máximo na região central. Podem ser: simétricas e assimétricas.
- SIMÉTRICA: apresentam o valor máximo no ponto central e os pontos
equidistantes desse ponto têm a mesma freqüência. A curva simétrica ou
em sino é também chamada CURVA NORMAL ou CURVA DE GAUSS.

- ASSIMÉTRICA: na prática, não encontramos distribuição perfeitamente


simétrica. As distribuições obtidas de medidas reais são mais ou menos
assimétricas, em relação a freqüência máxima.

Assimétrica positiva Assimétrica


negativa
b) Curvas em forma de jota: caracterizam-se por apresentarem o ponto
de ordenada máxima em uma das extremidades. São curvas comuns aos
fenômenos econômicos e financeiros.

Curva em jota Curva em jota


invertido
c) Curvas em forma de U: caracterizam-se por apresentarem ordenadas
máximas em ambas as extremidades.

EXERCÍCIOS
1) A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de
balanço
em 50 indústrias:
3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 7,6
18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 8,7
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,4
7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 7,9
4,9 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16,0
a) Forme com esses dados uma distribuição com intervalos de classe iguais a 3, tais
que os limites inferiores sejam múltiplos de 3. b) Confeccione o
histograma e o
polígono de freqüência correspondente.

2) Calcule os valores desconhecidos na distribuição de freqüências


abaixo e
determine:
Quantidade de defeitos por microcomputadores
Qtidade de defeitos por micro N° de aparelhos fri% Fi Fri%
0
1
2
3
4
5
6

24

25

12
66

97,5

¿ =
i
f

a) o número de microcomputadores analisados; b) o numero de micros com


menos de 2 defeitos; c) o número de micros com até 3 defeitos; d) o
percentual de micros com pelo menos 4 defeitos; e) o número de micros com
no mínimo 2 e, no máximo 5 defeitos; f) o número máximo de defeitos
encontrados em setenta por cento dos micros; g) o percentual de micros que
não possuem defeitos; h) o número máximo de defeitos encontrados nos
22
micros; i) o percentual de computadores com 3 defeitos; j) represente
graficamente a distribuição.

3) Construa o histograma e o polígono de freqüências para a série


representativa de uma amostra dos salários de 25 funcionários selecionados em
uma empresa.
Classes Salários US$

nº de funcionários- f
i
1 1.000,00 1.200,00 2
2 1.200,00 1.400,00 6
3 1.400,00 1.600,00 10
4 1.600,00 1.800,00 5
5 1.800,00 2.000,00 2

¿ =
i
f

4) Examinando o histograma abaixo, que corresponde ao consumo mensal de


leite, em litros, no bairro A, responda:
Consumo mensal de leite no bairro A

d
e

f
a
m
í
l
i
a
s
25

20

15

10

0 20 40 60 80 100 120 140 160

Litros de leite consumidos


a) Qual o intervalo de classe que tem maior freqüência? O que significa?
b) Qual a amplitude total da distribuição? O que significa?
c) Qual o nº total de famílias no bairro A que consomem leite?
d) Qual a freqüência do intervalo de classe 110 a 120? O que significa?
e) Quantas famílias consomem entre 50 e 100 litros de leite mensalmente?
f) Calcule o percentual de famílias que consomem de 50 l., inclusive, a 60
litros?
g) Quantas famílias consomem entre 90 (inclusive) e 110 litros de leite por mês?
h) Quantas famílias consomem 100 ou mais litros de leite mensalmente?

5) Considerando a distribuição abaixo, construa o polígono e a curva de


frequência, por aproximação:
Áreas
(m
2
) 300 400 500 600 700 800 900 1.000
1.100 1.200
Nº de 14 46 58 76 68 62 48 22
6
Lotes

5) Medidas de uma distribuição:


São medidas que caracterizam um conjunto de dados, possibilitando
uma análise mais completa a respeito do comportamento desses dados. As
principais medidas de uma distribuição são as medidas de posição e as
medidas de variabilidade ou dispersão.

curtose de Medidas -
assimetria de Medidas
variação de e coeficient -
padrão Desvio -
Variância -
Total Amplitude -
dispersão ou dade variabili de Medidas -
Percentis
Decis
Quartis
Mediana
es Separatriz
Mediana
Moda
Aritmética Média -
Central Tend. de Med. -
Posição de Medidas -
ão distribuiç uma de Medidas
¦
¦
¦
¦
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
¦
¦
¦
¦
¦
´
¦
÷
¦
¦
¹
¦
¦
´
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
´
¦
¦
¦
¹
¦
¦
´
¦
÷
÷
÷
÷
÷
¦
¹
¦
´
¦
÷
÷

5.1) Medidas de posição:


São medidas estatísticas que representam uma série de dados com o
objetivo de orientar quanto a posição da distribuição em relação ao eixo
horizontal (eixo das abscissas).
As medidas de posição mais importantes são as medidas de Tendência
Central: a média aritmética, a moda e a mediana. As outras medidas de
posição são as separatrizes: a própria mediana, os quartis e os percentis.

23
- Medidas de Tendência Central: tais medidas dão o valor do ponto no
eixo das abscissas em torno do qual os dados se distribuem.

a) Média aritmética ( ) X

{
¦
¹
¦
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Aritmética Média

a.1) Média aritmética para dados não agrupados:


Determina-se a média aritmética simples, dividindo-se a soma de todos
os valores da variável pelo número deles. Ou seja:
n
x
X
i ¿
=
EX: Uma empresa de grande atuação nos mercados brasileiro e
internacional vem expandindo seus negócios a cada ano. Um funcionário do
setor de vendas fez um levantamento da variação mensal dos preços de uma
determinada peça, conforme o pedido de um cliente e verificou os seguintes
preços (em centavos):
0,67 0,66 0,67 0,69 0,65 0,68 0,67 0,71 0,73 0,69 0,67 0,66
Calcule o preço médio da peça
x
1
= 0,67, x
2
= 0,66, ........x
12
= 0,66 então = X

Uso da calculadora: as calculadoras possuem a função STAT que permite o


cálculo da média aritmética para um conjunto de dados. Para utilizar a
função STAT, pressiona-se as teclas: ON 2ndf ON . Deverá aparecer
no canto direito do visor a palavra STAT. Na seqüência digita-se cada dado
e a tecla M+ que irá armazenar na memória DATA. Digitados todos os
valores, para o cálculo da média basta digitar a tecla X-M.
a.2) Média aritmética para dados agrupados
¹
´
¦÷
classe de intervalos com -
classe de intervalos sem

-Sem intervalos de classe:


Para dados agrupados, sem intervalos de classe, calcula-se a média
ponderada, somando-se os produtos dos valores distintos da série (x
i
), pela
respectiva freqüência e dividindo-se
a soma pelo número de dados. Ou seja:

¿
¿ ¿
= =
i
i i i i
f
f . x
X ou
n
f . x
X

EX: Numa pesquisa realizada por uma empresa de turismo, foram


entrevistadas 120 famílias que expressaram sua opinião em relação ao
número de quartos que devem existir em chalés.
Número de quartos dos chalés
Nº de quartos
(x
i
)
Freqüência
(f
i
)
x
i
.f
i
1
2
3
4
27
44
33
16
27
88
99
64
Calcule a média do
número de quartos que
devem existir em chalés.

= ¿ i
f 120 ¿ = 278 f . x
i i

¿
¿
=
i
i i
f
f . x
X ¬ 3 , 2 X
120
278
X
120
16 4 33 3 44 2 27 1
X = ¬ = ¬
× + × + × + ×
=
Interpretação do resultado: é lógico que não se pode construir chalés
com
2,3 quartos. Nessa situação considera-se a aproximação do resultado 2,3
para 2 (dois). A interpretação do resultado é que a preferência das famílias
tende para chalés com dois dormitórios.
OBS: Pode-se abrir uma coluna na tabela, correspondente aos produtos x
i
.f
i
,
o que torna mais prático o cálculo da média.

- Com intervalos de classe:


Para dados agrupados, com intervalos de classe, calcula-se a média
ponderada, somando-se o produto do ponto médio de cada classe (x
i
) pela
respectiva freqüência e dividindo-se a soma pelo número de dados. Ou seja:

¿
¿ ¿
= =
i
i i i i
f
f . x
X ou
n
f . x
X

EX: Considere a distribuição:


Salários dos funcionários da companhia A,
em reais, no ano de 2001
Classes Salários(R$) x
i
f
i

1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
500
700
900
1100
1300
79
45
31
12
9
Calcule o salário médio da
na Companhia A, em 2001.
¿
¿
=
i
i i
f
f . x
X

24

Uso da calculadora: Entra na função STAT e digita-se x


i
× f
i
. Cada produto é
armazenado na memória DATA (tecla M+). Na seqüência determina-se a
média x digitando-se a tecla X-M

b) Moda (Mo)
Moda é o valor que ocorre com maior freqüência em uma série de
valores.
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Moda

b.1) Moda para dados não agrupados:


Para dados não-agrupados, basta determinar valor que ocorre com
maior freqüência.
EX: Determine a moda em cada série de dados:
1) 7 – 8- 9- 1 0- 10- 10- 11- 12- 13- 15 ¬ o valor 10 aparece
com maior
freqüência ¬ Mo = 10
2) 3 – 5 – 8 – 10 – 12 – 13 ¬ a série é amodal, ou seja, não tem moda.
3) 2 - 3 - 4 - 4 - 4 - 5 - 6 - 7 - 7 - 7 - 8 - 9 ¬ como o valor 4 e o valor 7
aparecem com maior freqüência e em igual número de vezes, a série tem
duas modas: Mo=4 e Mo=7

b.2) Moda para dados agrupados


¹
´
¦÷
classe de intervalos com -
classe de intervalos sem

-Sem intervalos de classe:


Para dados agrupados sem intervalos de classe, a moda é o valor da
variável que apresenta maior freqüência.
EX: Calcule a moda para os dados da distribuição abaixo:.
Número de quartos dos chalés
Nº de quartos (x
i
) Freqüência (f
i
)
1
2
3
4
27
44
33
16

Como a maior
freqüência é igual a 44
¬ Mo = 2
= ¿ i
f 120

- Com intervalos de classe:


Para dados agrupados, com intervalos de classe, a classe que apresenta a
maior freqüência é chamada classe modal e o valor da moda pode ser obtido
por vários processos, entre eles, a fórmula de Czuber e o cálculo da
moda
bruta.
- Moda bruta:
Mo =
2
L l
* *
+
onde: l* é o limite inferior da classe modal e L* é o limite
superior da classe modal

- Moda de Czuber:
*
2 1
1 *
h
D D
D
l Mo ×
|
|
.
|

\
|
+
+ = onde: l
*
= limite inferior da classe modal
h
*
= amplitude da classe modal
D
1
= f
*
- f(ant.) e f
*
= freqüência da classe modal
D
2
= f
*
- f(post.)

EX: Considere a distribuição:


Salários dos funcionários da companhia A,
em reais, no ano de 2001
Classes Salários(R$) x
i
f
i
Calcule o salário modal:
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
500
700
900
1100
1300
79
45
31
12
9
¬ Maior freqüência = 79
Classe modal 400 600
l
*
= 400 - L
*
= 600

¬ Moda Bruta: Mo = 500 Mo


2
600 400
= ¬
+
¬ Moda de Czuber:
*
2 1
1 *
h
D D
D
l Mo ×
|
|
.
|

\
|
+
+ = ¬ 200
34 79
79
400 × |
.
|

\
|
+
+ = Mo
¬ = Mo 539,82 reais

c) Mediana (Md)
25
Mediana é o valor que se encontra no centro de uma série de dados,
dispostos em ordem crescente. Ou seja, a mediana é o valor situado de
tal
forma em um conjunto de valores que o divide em dois subconjuntos de
mesmo número de elementos.
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Mediana
c.1) Mediana para dados não agrupados:
EX: Determine a mediana em cada série de dados:
1) 6-7-8- 9-10- 11-12-13 -14 ¬ os dados já se encontram ordenados, o valor 10
ocupa a posição central, apresentando o mesmo número de elementos à
sua
direita e a sua esquerda ¬ Md = 10
2) 10-2 -21-13 -12 -18 - 6-7 ¬ ordenando os dados, tem-se a série: 2-6-7-
10-12-13-18-21 ¬ como a série possui nº par de elementos, a Md é a média
aritmética dos dois valores centrais ¬ Md = 11
2
22
2
12 10
= =
+

c.2) Mediana para dados agrupados


¹
´
¦÷
classe de intervalos com -
classe de intervalos sem

-Sem intervalos de classe:


Para dados agrupados sem intervalos de classe, a mediana é o valor
da
variável (x
i
) que corresponde a freqüência acumulada imediatamente
superior a metade do número de dados.
EX: Calcule a mediana para os dados da distribuição:
Número de quartos dos chalés
Nº de quartos
(x
i
)
Freqüência
(f
i
)
F
i
1
2
3
4
27
44
33
16
27
71
104
120
= ¿ i
f 120 ¬ 60
2
120
= . Como
a freqüência acumulada
imediata mente superior a
60 é igual a 71, tem-se Md =
2
= ¿ i
f 120

OBS: Caso F
i
=
2
x x
Md
2
f
1 i i i +
+
= ¬
¿

EX: Seja a tabela:

x
i
f
i
F
i
12
14
15
16
17
20
1
2
1
2
1
1
1
3
4
6
7
8
= ¿ i
f 8 ¬ 4
2
8
= . Como
F
3
=4 , tem-se Md =
5 , 15
2
31
2
16 15
2
x x
4 3
= =
+
=
+

= ¿ i
f 08
- Com intervalos de classe:
Para dados agrupados, com intervalos de classe, calcula-se o ponto do
intervalo em que está compreendida a mediana, após determinar a classe na
qual se acha a mediana, ou seja, a classe mediana, que será, aquela
que
corresponde a freqüência acumulada imediatamente superior a
2
f
i ¿
. A
mediana será obtida pela fórmula:

*
*
* i
*
f
h ) ant ( F
2
f
l Md
× |
.
|

\
|
÷
+ =
¿

onde: l
*
= limite inferior da classe mediana
h
*
= amplitude da classe mediana
F(ant) = freqüência acumulada da classe anterior a classe mediana
f
*
= freqüência simples da classe mediana

EX: Salários dos funcionários da companhia A, em reais, no ano de 2001


Classes Salários(R$) f
i
F
i
Calcule o salário mediano:
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
79
45
31
12
9
79
124
155
167
176
= ¿ i
f 176 ¬ 176/2 = 88. Como
a freqüência acumulada
imediatamente superior a 88 é
igual a 124, tem-se classe
mediana: 600 a 800.

= ¿ i
f 176
l
*
= 400- f
*
=45 - F(ant)=79
*
* i
*
f
h ) ant ( F
2
f
l Md
× |
.
|

\
|
÷
+ =
¿
¬Md=600 +
( )
= ¬
× ÷
Md
45
200 79 88

OBS:
26
1) quando X =Mo=Md a distribuição é simétrica.

X =Mo=Md

2) quando Mo<Md<X a distribuição é assimétrica positiva e


quando
X <Md<Mo a distribuição é assimétrica negativa.
Moda
Mediana
Média

Mo<Md<X X <Md<Mo

EXERCÍCIOS:
1) Uma amostra contendo dez preços referentes ao litro de óleo industrializado
foi
extraída em diferentes postos no dia 3/5/2002. Os preços em reais são:
1,46 -
1,55 - 1,62 - 1,54 - 1,49 - 1,71 - 1,82 - 1,63 - 1,87 -
1,78. Calcule o
preço médio, o preço modal e preço mediano do litro de óleo industrializado.

2) Um produto é acondicionado em lotes contendo cada lote 10 unidades. O lote só


é
aprovado se apresentar um peso superior a 40 quilos. Se as unidades que
compõem
determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4; 5, este lote será
aprovado? Qual o
peso médio do produto?

3) Numa empresa industrial, o departamento de Segurança e Saúde


Ocupacional
divulga semestralmente um relatório com os dados das ocorrências sob sua
responsabilidade, sendo os seguintes:

Construa uma tabela para representar o gráfico e calcule o número


médio de acidentes
ocorridos no 1º semestre nesta empresa.

4) Uma empresa de aviação observou em seus registros recentes, o tempo de mão


de obra (hs) gasto na revisão completa de um motor de jato. O seguinte quadro foi
observado:

Tempo(hs) f
i
x
i
x
i
.f
i

0 4
4 8
8 12
12 16
16 20
4
9
11
8
5

= ¿ i
f

a) Determine o número médio de horas de mão de obra necessário para a


revisão de cada motor; b) Com base nesta informação, qual deve ser o
tempo
total de mão de obra para a revisão de dez motores que aguardam revisão. c)
o
tempo modal. d) o tempo mediano.

5) Uma empresa de âmbito nacional, fornecedora de supermercados, fez um


levantamento
de consumo de seu principal produto em vários supermercados obtendo em determinado
mês, a tabela:
Nº de unidades Nº supermercados- f
i
x
i
x
i
.f
i
0 1000
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
10
50
200
320
150
30

= ¿ i
f
Determine o consumo médio, modal e mediano deste produto por
supermercado pesquisado.

6) Calcule a média, a moda e a mediana da série representativa da


idade de 50
estagiários de uma empresa:

27
Idade, em anos de estagiários de uma empresa
Idades-(em anos)- (x
i
) Freqüência (f
i
) x
i
.f
i
17
18
19
20
21
3
18
17
8
4

= ¿ i
f
50
¿ =
i i
f . x

- Separatrizes
As separatrizes são valores de referência em um conjunto de valores
ordenados e, portanto, são aplicadas a variáveis quantitativas e
qualitativas
ordinais. A mediana é um exemplo destas medidas, pois separa o conjunto
de dados em dois subconjuntos, com as menores e maiores observações.
 Se o interesse é subdividir o conjunto ordenado em 4 partes de
igual tamanho, serão necessários 3 valores para estabelecer esta
separação.. Estes valores são chamados quartis. Os elementos
separatrizes são Q
1
, Q
2
e Q
3
.
Onde: O primeiro quartil (Q1) estabelece o limite entre as 25% menores
observações e as 75% maiores. O segundo quartil (Q2) é igual a mediana e o
terceiro quartil (Q3) separa as 75% menores observações das 25% maiores.
Para o cálculo dos quartis, utiliza-se técnicas semelhantes àquelas do
cálculo da mediana. Assim, determina-se, inicialmente, a classe que contém
o valor quartil a ser calculado. A identificação da classe é feita por meio do
termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2 ou 3

4
Esse termo está localizado numa classe que recebe o nome de classe quartil.

Sendo:
l
Qk
= limite inferior da classe do quartil considerado;
F
ant
= frequência acumulada da classe anterior à classe do quartil
considerado;
h
Qk
= amplitude do intervalo de classe do quartil considerado;
f
Qk
= frequência simples da classe do quartil considerado.

EX 1: Calcule Q
1
, Q
2
e Q
3
para os dados da distribuição:
Número de quartos dos chalés
Nº de quartos (x
i
) Freqüência (f
i
)
1
2
3
4
27
44
33
16

= ¿ i
f 120

 cálculo da classe que contém o valor quartil a ser calculado

EX 2: Considere a distribuição:
Salários dos funcionários da companhia A, em reais, no ano de 200
Classes Salários(R$) f
i
F
i

1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
79
45
31
12
9
79
124
155
167
176

= ¿ i
f 176

Calcule o salário quartil 1 ou 3 na Companhia A, em 2001


 cálculo da classe que contém o valor quartil a ser calculado
28

 Cálculo de Q
1
: (classe 1)
l
Q1
= 400 - F
ant
= 0 - f
Q1
= 79 - h
Q1
= 200

 Cálculo de Q
3
: (classe 3)
l
Q3
= 800 - F
ant
= 124 - f
Q3
= 31 - h
Q3
= 200

 Se o interesse é dividir o conjunto ordenado em 10 partes de


igual tamanho, serão necessários 9 valores para estabelecer esta
separação.. Estes valores são chamados decis. Os elementos
separatrizes são D
1
, D
2
, ... D
5
, .... D
9

Onde:
D
1
é o primeiro decil, corresponde a separação dos primeiros 10% de
elementos da série.
D
5
é o quinto decil, coincide com a mediana.
D
9
é o nono decil, corresponde a separação dos últimos 10% de elementos
da série.
Para o cálculo dos decis, utiliza-se técnicas semelhantes àquelas do
cálculo da mediana. Assim, determina-se, inicialmente, a classe que contém
o valor decil a ser calculado. A identificação da classe é feita por
meio do
termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2, 3, 4, 5, 6, 7, 8 ou 9

10
Esse termo está localizado numa classe que recebe o nome de classe decil.

Sendo:
l
Dk
= limite inferior da classe do decil considerado;
F
ant
= frequência acumulada da classe anterior à classe do decil considerado;
h
Dk
= amplitude do intervalo de classe do decil considerado;
f
Dk
= frequência simples da classe do decil considerado.

 Se o interesse é dividir o conjunto ordenado em 100 partes de


igual tamanho, serão necessários 99 valores para estabelecer
esta separação.. Estes valores são chamados percentis. Os
elementos separatrizes são P
1
, P
2
, ... P
50
, .... P
99

Onde:
P
1
é o primeiro percentil, corresponde a separação dos primeiros 1% de
elementos da série.
P
50
é o cinquentésimo percentil, coincide com a mediana.
P
99
é o nonagésimo nono percentil, corresponde a separação dos últimos 1%
de elementos da série.
Para o cálculo dos percentis, utiliza-se técnicas semelhantes àquelas
do cálculo da mediana. Assim, determina-se, inicialmente, a classe que
contém o valor percentill a ser calculado. A identificação da classe é
feita
por meio do termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2, 3, ...., 97, 98, 99

100
Esse termo está localizado numa classe que recebe o nome de classe
percentil.
29

Sendo:
l
Pk
= limite inferior da classe do percentil considerado;
F
ant
= frequência acumulada da classe anterior à classe do percentil
considerado;
h
Pk
= amplitude do intervalo de classe do percentil considerado;
f
Pk
= frequência simples da classe do percentil considerado.

EXERCÍCIOS:
1) Um parque temático apresenta para cada uma de suas unidades um
consumo de eletricidade em kwh, de acordo com a tabela abaixo.
Consumo de eletricidade em kwh em um parque temático
i Consumo de energia (kwh) Nº de unidades (f
i
)
1
2
3
4
5
6
7
8
9
10 30
30 50
50 70
70 90
90 110
110 130
130 150
150 170
170 190
8
19
17
15
32
28
26
18
10

Calcule: a) a média de consumo de energia em KWh; b) a moda e a


mediana; c) os quartis Q
1
, Q
2
e Q
3
; d) os decis D
4
e D
8
; e) os percentis P
13
,
P
26
; P
58
e P
89
.

2) Uma rede de hotéis tem um gasto salarial com seus funcionários de


acordo com a tabela:
Gasto salarial com funcionários em uma rede de hotéis
i Nº de salários mínimos Nº de funcionários (f
i
)
1 0 2 14
2
3
4
5
6
7
8
9
10
2 4
4 6
6 8
8 10
10 12
12 14
14 16
16 18
18 20
28
19
15
16
17
13
9
6
3

Calcule: a) a média dos salários; b) a moda e a mediana; c) os quartis Q


1
,
Q
2
e Q
3
; d) os decis D
2
, D
6
e D
9
; e) o 18º, 0 29º, o 58º, 72º e o 93º percentil.

5.3. Medidas de variabilidade ou dispersão:


São medidas estatísticas utilizadas para avaliar o grau de
variabilidade
ou dispersão, dos valores em torno da média. Servem para verificar a
representatividade da média. Por exemplo, sejam as séries:
X: 70,70,70,70,70 ¬ X = 70
Y: 68,69,70,71,72 ¬ Y = 70
Z: 5,15,50,120,160 ¬ Z = 70
As três séries apresentam a mesma média aritmética, porém a
distribuição dos valores nas séries são muito diferentes. Na série X não

dispersão dos dados em torno da média, já que todos os valores são iguais a
própria média. Na série Y, já existe uma certa dispersão dos valores em torno
da média, entretanto, uma dispersão menor que a observada na série Z.
Assim, o conjunto X apresenta dispersão ou variabilidade nula e o
conjunto Y apresenta dispersão ou variabilidade menor que o conjunto Z.
Para determinar o grau de dispersão, a estatística recorre as medidas de
dispersão ou variabilidade, entre elas: a amplitude total, a variância, o
desvio padrão e o coeficiente de variação.

30
- Amplitude total (A
T
):

¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não -Dados
Total Amplitude

a) Amplitude Total para dados não agrupados:


A amplitude total é a diferença entre o maior valor e o menor
valor
observado na série.
A
T
= x
máx.
– x
min.

EX: Uma empresa de grande atuação nos mercados brasileiro e


internacional, vem expandindo seus negócios a cada ano. Um funcionário
do setor de vendas fez um levantamento da variação mensal dos preços de
uma determinada peça, conforme o pedido de um cliente e verificou os
seguintes preços (em centavos):
0,67 0,66 0,67 0,69 0,65 0,68 0,67 0,71 0,73 0,69 0,67 0,66
Colocando os valores em ordem crescente:
0,65 0,66 0,66 0,67 0,67 0,67 0,67 0,68 0,69 0,69 0,71
0,73
Então: AT = 0,73 – 0,65 = 0,08 centavos, ou seja, a variação no preço
da
peça foi de 0,08 centavos no ano.
b) Amplitude total para dados agrupados
¹
´
¦÷
classe de intervalos com -
classe de intervalos sem

-Sem intervalos de classe:


Para dados agrupados, sem intervalos de classe, ainda tem-se:
A
T
= x
máx.
– x
mín.

EX: Número de quartos dos chalés


Nº de quartos (x
i
) Freqüência (f
i
)
1
2
3
4
27
44
33
16
Calcule a amplitude total da série.
= ¿ i
f 120
A
T
= x
máx.
– x
mín
¬ A
T
= 4 – 1 ¬ A
T
= 3 quartos Interpretação do
resultado: significa que a opinião em relação ao número de quartos em
chalés variou em número de 3.

- Com intervalos de classe:


Para dados agrupados, com intervalos de classe, a amplitude total é
a
diferença entre o limite superior da última classe (L
máx.
) e o limite inferior
da primeira classe (l
mín.
) . Ou seja:
A
T
= L
máx
- l
mín

EX: Considere a distribuição: Salários dos funcionários da companhia A,


em reais, no ano de 2001
Classes Salários(R$) x
i
f
i
Calcule a amplitude total:
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
500
700
900
1100
1300
79
45
31
12
9
A
T
= Lmáx - lmín
A
T
= 1400 – 400
A
T
= 1000

OBS: a amplitude total tem o inconveniente de só levar em conta os dois


valores extremos da série, sem considerar os termos intermediários, o que
quase sempre invalida o resultado. Assim a amplitude total é apenas uma
indicação de dispersão ou variabilidade. É útil em casos como a medida da
temperatura em um dia ou um ano e quando a compreensão popular é mais
importante que a exatidão e a estabilidade.

- Variância (s
2
) e desvio padrão (s):
São medidas que levam em consideração a totalidade dos valores da
variável em estudo e por isso são as medidas de dispersão e
variabilidade
mais usadas.
A variância é calculada a partir dos quadrados dos desvios, e portanto, é
um número em unidade quadrada em relação a variável em questão, o que
sob o ponto de vista prático, é inconveniente. Por isso mesmo, imaginou-se
uma nova medida, denominada desvio padrão, definido como a raiz
quadrada da variância, ou seja: s=
2
s .

¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não -Dados
padrão desvio e Variância

31
a) Variância e desvio padrão para dados não agrupados:
A variância para dados não agrupados é dada pela média aritmética dos
quadrados dos desvios em torno da média. (Desvio em torno da média é a
diferença entre cada dado e a média). Ou seja: a variância será dada por:

n
) X x (
s
2
i 2 ¿ ÷
= e o desvio padrão (s) é dado por:
n
) X x (
s
2
i ¿ ÷
=

OBS: quando pretende-se fazer inferências sobre a população de onde foi


retirada a amostra, convém utilizar no denominador n-1 ao invés de n, ou seja:

Variância ÷
1 n
) X x (
s
2
i 2
÷
÷
=
¿
e desvio padrão ÷
1 n
) X x (
s
2
i
÷
÷
=
¿

Desse modo o desvio padrão da amostra tende a se aproximar do desvio


padrão da população da qual a amostra foi retirada.

EX: Sabendo que a produção leiteira diária de uma vaca, durante uma semana,
foi de: 10, 14, 13, 15, 16, 18 e 12 litros, calcule a variância e o desvio padrão
da
produção leiteira da vaca A.
Calcula-se litros 14 X = e n = 7

1 n
) X x (
s
2
i 2
÷
÷
=
¿
e tomando-se os valores de x
i
em ordem crescente, tem-se:
s
2
=
1 7
) 14 18 ( ) 14 16 ( ) 14 15 ( ) 14 14 ( ) 14 13 ( ) 14 12 ( ) 14 10 (
2 2 2 2 2 2 2
÷
÷ + ÷ + ÷ + ÷ + ÷ + ÷ + ÷

s
2
= 7 s
6
16 4 1 0 1 4 16 2
= ¬
+ + + + + +

OBS: Para facilitar o cálculo pode-se construir uma tabela e abrir uma
coluna para
x
i
- X e outra para (x
i
- X )
2
, ou seja:
x
i x
i
- X (x
i
- X )
2

10
12
13
14
15
16
18
-4
-2
-1
0
1
2
4
16
4
1
0
1
4
16

1 n
) X x (
s
2
i 2
÷
÷
=
¿

s
2
= 7 s
6
42 2
= ¬ e
s= 7 ¬ s = 2,65

¿ = ÷ 42 ) X x (
2
i

OBS: considerando que, em geral a média aritmética X é um número


fracionário, tornando pouco prático o cálculo de x
i
- X , é mais conveniente
utilizar para o cálculo da variância e do desvio padrão, as fórmulas
abaixo,
derivadas da fórmula anterior e abrir na tabela apenas a coluna x
i
2
:

1 n
n
) x (
x
s
2
i 2
i
2
÷
÷
=
¿
¿
e s =
1 n
n
) x (
x
2
i 2
i
÷
÷ ¿
¿

Dem: Desenvolvendo algebricamente a fórmula anterior de s


2
tem-se:

1 n
) X x (
s
2
i 2
÷
÷
=
¿
¬ s
2
=
1 n
) X X . x 2 x (
2
i
2
i
÷
+ ÷ ¿
¬ s
2
=
1 n
X X . x 2 x
2
i
2
i
÷
+ ÷ ¿ ¿ ¿

s
2
=
1 n
X n . x X 2 x
2
i
2
i
÷
+ ÷ ¿ ¿
¬ s
2
=
1 n
)
n
x
( n x
n
x
2 x
2 i
i
i 2
i
÷
+ ÷ ¿ ¿ ¿ ¿
¬
s
2
=
1 n
n
) x (
n x .
n
x
. 2 x
2
2
i
i
i 2
i
÷
+ ÷ ¿
¿
¿
¿
¬s
2
=
1 n
n
) x (
n
) x (
2 x
2
i
2
i 2
i
÷
+ ÷ ¿
¿ ¿
¬
s
2
=
1 n
n
) x (
x
2
i 2
i
÷
÷ ¿
¿

EX: Sabendo que a produção leiteira diária da vaca A, durante uma semana,
foi de: 10, 14, 13, 15, 16, 18 e 12 litros, calcule a variância e o desvio padrão
da produção leiteira da vaca A.
x
i
x
i
2

10
12
13
14
15
16
18
100
144
169
196
225
256
324
1 n
n
) x (
x
s
2
i 2
i
2
÷
÷
=
¿
¿
¬ s
2
=
1 7
7
98
1414
2
÷
÷
s
2
=
6
42
¬ s
2
= 7
logo: s= 7 ¬ s = 2,65
= ¿ i
x 98 = ¿
2
i
x 1414

32
b) Variância e desvio padrão para dados
agrupados
¹
´
¦÷
classe de intervalos com -
classe de intervalos sem

- Sem intervalos de classe:


Para dados agrupados, sem intervalos de classe, o cálculo da variância e
do desvio padrão leva em consideração as freqüências. Ou seja:

Para a variância (s
2
):
1 n
f . ) X x (
s
i
2
i 2
÷
÷
=
¿
ou
1 n
n
) f . x (
f . x
s
2
i i
i
2
i
2
÷
÷
=
¿
¿

Para o desvio padrão (s) :

1 n
f . ) X x (
s
i
2
i
÷
÷
=
¿
ou s =
1 n
n
) f . x (
f . x
2
i i
i
2
i
÷
÷ ¿
¿

OBS: Para facilitar os cálculos abre-se na tabela colunas para os cálculos de


x
i
.f
i
e x
i
2
.f
i

EX: Na pesquisa realizada por uma empresa de turismo em que foram


entrevistadas 120 famílias quanto ao número de quartos que devem existir em
chalés, calcule a variância e o desvio padrão.
Número de quartos dos chalés
Nº de quartos (x
i
) f
i
x
i
.f
i
x
i
2
x
i
2
.f
i
1
2
3
4
27
44
33
16
27
88
99
64
1
4
9
16
27
176
297
256
= ¿ i
f 120 ¿= 278
¿= 756
1 n
n
) f . x (
f . x .
s
2
i i
i
2
i
2
÷
÷
=
¿
¿
¬ s
2
= 97 , 0 s e 94 , 0
119
97 , 111
119
03 , 644 756
1 120
120
) 278 (
756
2
= = =
÷
=
÷
÷

- Com intervalos de classe:


Para dados agrupados, com intervalos de classe, utilizam-se as mesmas
fórmulas para dados agrupados sem intervalos de classe. Entretanto, por
se
desconhecer os particulares valores de x
i
, substituí-se estes valores pelos
pontos médios de classe. Assim:
Para a variância (s
2
):
1 n
f . ) X x (
s
i
2
i 2
÷
÷
=
¿
ou
1 n
n
) f . x (
f . x
s
2
i i
i
2
i
2
÷
÷
=
¿
¿

Para o desvio padrão (s) :

1 n
f . ) X x (
s
i
2
i
÷
÷
=
¿
ou s =
1 n
n
) f . x (
f . x
2
i i
i
2
i
÷
÷ ¿
¿

em que x
i
é o ponto médio da classe i.

EX: Considere a distribuição: Salários dos funcionários da companhia A,


em reais, no ano de 2001
Classes Salários(R$) f
i
x
i
.f
i
x
i
2
x
i
2
.f
i
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
79
45
31
12
9

= ¿ i
f 176
1 n
n
) f . x (
f . x
s
2
i i
i
2
i
2
÷
÷
=
¿
¿

OBS: O desvio padrão é a mais importante das medidas de dispersão. Nas


distribuições simétricas, em que X =Mo=Md, pode-se afirmar que o
intervalo ] s X , s X [ + ÷ , contém aproximadamente 68% dos valores da série.

68 %

s X ÷ X s X+

33
O intervalo ] s 2 X , s 2 X [ + ÷ contém aproximadamente 95 % dos valores da
série.

95 %

s 2 X÷ X s 2 X+
O intervalo ] s 3 X , s 3 X [ + ÷ contém aproximadamente 99 % dos valores da
série.

99 %
s 3 X÷ X s 3 X+
Quando a distribuição não é perfeitamente simétrica, estes percentuais
apresentam pequenas variações para mais ou para menos, segundo o caso.
Assim, quando se afirma que uma série apresenta média X = 100 e desvio
padrão s = 5, isso significa que:
- o intervalo [95, 105] contém aproximadamente 68% dos valores da série;
- o intervalo [90, 110] contém aproximadamente 95% dos valores da série;
- o intervalo [ 85, 115 contém aproximadamente 99% dos valores da série.

OBS: ao aumentar o tamanho do intervalo, aumenta-se o percentual de


elementos contido no intervalo.

Uso da calculadora:
Dados não-agrupados: Função STAT - f
i
- M+ . Digitados todos os produtos,
digita-se a tecla RM .
Dados agrupados: Função STAT - x
i
× f
i
M+ . Digitados todos os produtos,
digita-se a tecla RM

EXERCÍCIOS
1) Uma amostra contendo dez preços referentes ao litro de óleo industrializado foi
extraída em diferentes postos no dia 8/7/2006. Os preços em reais são:
1,46 - 1,55 - 1,62 - 1,54 - 1,49 - 1,71 - 1,82 - 1,63 - 1,87
- 1,78
Calcule a variação no preço do litro de óleo industrializado, através da amplitude
total e do
desvio padrão.

2) Um produto é acondicionado em lotes contendo cada lote 10 unidades. O lote só


é
aprovado se apresentar um peso superior a 40 quilos. Se as unidades que
compõem
determinado lote pesam: 3; 4; 3,5; 5,0; 3,5; 4; 5; 5,5; 4; 5. Determine a amplitude
total, a
variância e o desvio padrão do lote.

3) Uma empresa produz caixas de papelão para embalagens e afirma que o número
de defeitos por caixa se distribui conforme a tabela:
Nº de defeitos- (x
i
) 0 1 2 3 4 5
Nº de caixas (f
i
) 32 28 11 4 3 1
Pede-se: a) o nº médio de defeitos por caixa; b) o número de caixas com menos de 3
defeitos; c) o número de caixas com mais de 4 defeitos; d) a percentagem de
caixas
com nº de defeitos entre 1 e 4, inclusive; e) o nº mediano de defeitos por caixas;
f) o nº
modal; g) a amplitude total da distribuição; h) a variância; i) o desvio padrão.
4) Uma amostra aleatória de 250 residências de famílias, classe média, com
dois
filhos, revelou a seguinte distribuição do consumo mensal de energia elétrica:
Consumo mensal- (kwh) nº de famílias -f
i

0 50
50 100
100 150
150 200
200 250
250 300
300 350
2
15
32
47
50
80
24

= ¿ i
f

Determine: a) o consumo médio de energia por residência; b) o número de


famílias
com consumo mensal inferior a 200 kwh ; c) o número de famílias com
consumo
mensal maior ou igual a 200 e menor que 250 kwh; d) a percentagem de famílias com
consumo mensal menor que 100 kwh; e) o consumo mediano; f) o consumo modal; g)
a amplitude total da distribuição; h) a variância; i) o desvio padrão.

5) As lojas A e B, bimestralmente, vendem a quantidade de peças para


automóveis
demonstrada pelos dados abaixo:
A: 127 - 211 – 239 – 164 – 198 – 142 – 100 – 214 – 212 – 230 – 132 – 118 – 112
– 125
B : 115 – 118 – 116 – 230 – 215 – 260 – 134 – 129 – 138 – 119 – 231 – 221 - 210
- 131
b) qual a média de vendas de A e de B. Analise essas médias. b) Qual loja
apresenta
maior dispersão nas vendas? Porque? c) Qual é o valor mediano das vendas da loja A
e
da loja B? d) Indique o valor da moda para A e B. Interprete.

34
6) Uma empresa de âmbito nacional, fornecedora de supermercados, fez um
levantamento de consumo de seu principal produto em vários supermercados
obtendo em determinado mês, a tabela:
Nº de unidades f
i
0 1000
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
10
50
200
320
150
30
Determine a amplitude total, a
variância e o desvio padrão da
série

= ¿ i
f

- Coeficiente de variação (CV):


Trata-se de uma medida relativa de dispersão. Enquanto a amplitude total
(A
T
), variância (s
2
) e desvio padrão (s) são medidas absolutas de dispersão,
o coeficiente de variação (CV) mede a dispersão relativa. É dado pela razão
entre o desvio padrão e a média. Assim, para que esse valor seja dado
em
percentagem o resultado é multiplicado por 100. Ou seja:
100
X
s
CV × = s= desvio padrão amostral e X = média amostral
É usado para comparar duas ou mais séries de valores, relativamente à
sua
dispersão ou variabilidade. EX: Em uma empresa, o salário médio dos
homens é de R$ 4.000, com desvio padrão de R$ 1.500, e o salário
médio
das mulheres é de R$ 3.000, com desvio padrão de R$ 1.200. Do ponto de
vista absoluto, o salário dos homens apresenta maior dispersão que o salário
das mulheres. No entanto, se levarmos em consideração as médias, tem-se:
Para os homens : 100
X
s
CV × = ¬ CV = % 5 , 37 100
000 . 4
500 . 1
= × =
Para as mulheres: 100
X
s
CV × = ¬ CV = % 40 100
000 . 3
200 . 1
= ×
Assim: os salários das mulheres têm dispersão relativa maior do que os salários
dos homens.

EXERCÍCIO
1) Em uma sala de aula foram escolhidos ao acaso 5 acadêmicos e a notas deles em
Estatística foram 6, 8, 10, 8, 7, 9, enquanto em outra sala as notas foram 10, 10,
10,
7, 4, 7. Pergunta-se em qual turma as notas foram mais homogêneas, ou seja, onde
foi menor a variação? Calcule o desvio padrão de ambas e verifique o que menos
variou entre elas.

5.3 Medidas de assimetria:


Denomina-se assimetria o grau de desvio ou de afastamento da
simetria,
de uma distribuição. Já vimos que: em uma distribuição simétrica, tem-se
X =Mo=Md. Em uma distribuição assimétrica positiva tem-se: Mo<Md<X e
na assimétrica negativa: X <Md<Mo. Na distribuição assimétrica positiva, a
curva de freqüência tem uma cauda mais longa à direita e na assimétrica
negativa, a curva tem uma cauda mais longa a esquerda.
O grau de assimetria pode ser determinado pela coeficiente de
Pearson,
dado por:
As =
s
Mo X÷

Assim:
- se As=0, diz -se que a distribuição é simétrica ¬

X =Mo=Md

- se As > 0 diz-se que a dist. é assimétrica positiva ¬

Mo<Md< X

- se As < 0, diz-se que a dist. é assimétrica negativa ¬

X <Md<Mo

Segundo esse critério, as distribuições são classificadas da seguinte forma:


- Se As s -1 : assimétrica negativa forte
- Se -1 < As < 0 : assimétrica negativa fraca
- Se As = 0 : simétrica
- Se 0 < As < 1 : assimétrica positiva fraca
- Se As > 1 : assimétrica positiva forte

35
EX: Estaturas de 40 alunos de uma escola A
Estaturas(cm) f
i
150 154
154 158
158 162
162 166
166 170
170 174
4
9
11
8
5
3
Determine o coeficiente de assimetria
161 X = cm - Mo= 159,6 cm - s = 5,57 cm
As =
s
Mo X÷
=
Como As=
= ¿ i
f 40

5.4 Medidas de curtose:


As medidas de curtose classificam as curvas de freqüências quanto ao
afilamento ou achatamento de sua área central em relação a curva normal.
De acordo com o grau de curtose, pode-se classificar três tipos de curvas de
freqüência. Por exemplo:
- se a distribuição apresenta uma curva de freqüência mais fechada que a
curva normal (mais afilada na sua área central), é denominada
leptocúrtica;
- se a distribuição apresenta uma curva de freqüência normal, é
denominada mesocúrtica;
- se a distribuição apresenta uma curva de freqüência mais aberta que a
curva normal (mais achatada na sua área central), é denominada
platicúrtica;

leptocúrtica mesocúrtica platicúrtica

Para classificar uma distribuição quanto a sua curtose, podemos utilizar


o
coeficiente de curtose dado por:
3
s
f
f . ) X x (
K
4
i
i
4
i
÷
÷
=
¿
¿

Em que: Se K = 0 ¬ a distribuição é mesocúrtica


Se K> 0 a distribuição é leptocúrtica
Se K< 0 a distribuição é platicúrtica
Ou utilizando as separatrizes:

) P P .( 2
) Q Q (
K
10 90
1 3
÷
÷
=

Onde: Q3 e Q1 são o terceiro e primeiro quartil


P90 e P10 são o décimo e nonagésimo
Quanto a curtose a distribuição pode ser:
Se K = 0,263 a distribuição é mesocúrtica – normal.
Se K> 0,263 a distribuição é platicúrtica
Se K< 0,263 a distribuição é leptocúrtica

EX: Estaturas de 40 alunos de uma escola A


Estaturas(cm) f
i
x
i x
i
- X (x
i
- X )
4

150 154
154 158
158 162
162 166
166 170
170 174
4
9
11
8
5
3

= ¿ i
f 40
Determine o coeficiente de curtose
) P P .( 2
) Q Q (
K
10 90
1 3
÷
÷
= ¬ K =
36
EXERCÍCIOS
1) Dada a tabela abaixo: Idade, em anos de alunos do 1º ano de uma faculdade
Idades-(em anos)- (xi) Freqüência (fi)
17
18
19
20
21
3
18
17
8
4
Calcule o coeficiente de
variação, o coeficiente de
assimetria e o coeficiente
de curtose.
= ¿ i
f

2) Considerando a distribuição de frequência relativa aos pesos de 100


funcionários de
uma empresa:
Peso (kg) 50 58 58 66 66 74 74 82 82 90 90 98
f
i
10 15 25 24 16 10 = ¿ i
f
Determine: a) o peso médio dos funcionários; b) o número de funcionários
com
peso inferior a 74 Kg; c) o número de funcionários com peso entre 58, inclusive, e
82 kg; d) a percentagem de funcionários com peso superior a 66 kg;
e) o peso
mediano dos funcionários; f) o peso modal; g) a amplitude total da distribuição; h)
s
2
; i) s; j) o coeficiente de variação; k) o coeficiente de assimetria; l) o
coeficiente
de curtose.

3) Em uma classe de 50 alunos, as notas obtidas formaram a seg. distribuição:


notas - (x
i
) 2 3 4 5 6 7 8 9 10
Nº de alunos (f
i
) 1 3 6 10 13 8 5 3 1 = ¿ i
f 50
Determine: a) a nota média dos alunos; b) o número de alunos com nota inferior a
6; c) o número de alunos com nota entre 4, inclusive, e 7; d) a
percentagem de
alunos com nota superior a 7; e) a nota mediana; f) a nota modal; g)
a amplitude
total da distribuição; h) s
2
; i) s; j) o coeficiente de variação; k) o coeficiente de
assimetria.

4) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão
igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média de
161,9 cm,
sendo o desvio padrão igual a 6,01 cm. a) Qual é o coeficiente de variação de cada
uma dos grupos? B) Em termos absolutos, qual grupo apresenta maior dispersão: c)
em termos relativos, qual grupo apresenta menor dispersão?

5) Uma professor resolveu fazer uma investigação a respeito do peso (em Kg) em
dois grupos de 7 alunos cada, escolhidos aleatoriamente de 2 turmas de 8º série. No
primeiro grupo os alunos apresentaram os pesos: 65, 57, 89, 65, 50, 72
e 81. No
segundo grupo foram verificados os pesos: 80, 78, 67, 56, 90, 101 e 66. Qual grupo
apresenta maior dispersão no peso: a) em termos absolutos. Porquê?; b) em termos
relativos. Porquê?

6) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades.
Uma pesquisa realizada com 59 caixas revelou a existência de peças
defeituosas
seguindo a tabela:
Nº de peças defeituosas por caixa (x
i
) Nº de caixas -(f
i
)

0
1
2
3
4
5
20
15
12
6
4
2

= ¿ i
f

Pede-se: a) o número médio de peças defeituosas por caixa; b) o número modal;


c) o nº mediano; d) a amplitude total; e) a variância; f) o desvio
padrão; g) o
coeficiente de variação; h) o coeficiente de assimetria; i) o coeficiente de
curtose.

7) Um fabricante de caixas de cartolina fabrica três tipos de caixas.


Testa-se a
resistência de cada caixa, tomando-se uma amostra de 100 caixas e determinando-
se a pressão necessária para romper cada caixa. São os seguintes os resultados dos
testes:
Tipos de caixas A B C
Pressão média de ruptura 150 200 300
Desvio padrão das pressões 40 50 60
a) Que tipo de caixa apresenta a menor variação absoluta na pressão de
ruptura?
b) Que tipo de caixa apresenta a maior variação relativa na pressão
de
ruptura?

8) Uma indústria de válvulas de televisão tem dois tipos de válvulas,


A e B. As
válvulas têm durações médias de 495 . 1 XA = horas e = B X 1.875 horas
respectivamente, e os desvios padrões de
A
s = 280 horas e =
B
s 310 horas. Qual a
válvula que tem maior: a) dispersão absoluta; b) dispersão relativa?

9) Em um exame final de estatística, o grau médio de um grupo de 150 estudantes


foi de 78 e o desvio padrão 8,0. Em matemática, entretanto, o grau médio final do
grupo foi de 73 e o desvio padrão 7,6. Em que matéria foi maior: a)
a dispersão
absoluta; b) a dispersão relativa?

37
6) Correlação e regressão:
Existem situações nas quais interessa estudar o comportamento
conjunto de duas ou mais variáveis. Por exemplo: as vendas de um produto
dependem dos gastos com propaganda, o gasto com alimentação por família
está relacionado com a renda familiar, a quantidade produzida de um
produto afeta o custo total de produção. Na prática é comum situações
em
que uma variável se relaciona com várias outras, e se deseja determinar um
modelo para descrever a relação entre essas variáveis. Por exemplo: o custo
de um produto depende do tempo gasto em sua fabricação e do número de
operários envolvidos, etc...
No caso de duas variáveis, denomina-se de X a variável
independente e de Y a variável dependente. Na existência de algum tipo de
relacionamento entre as variáveis, diz-se que há uma correlação entre
elas.
Se há correlação entre as variáveis é possível descrever o tipo de
relação
presente entre elas através de uma regressão.

6.1. Correlação:
As correlações são relações estabelecidas após uma pesquisa. Com
base nos resultados da pesquisa, faz-se comparações que eventualmente
podem conduzir ou não à ligação entre as variáveis. Por exemplo: a relação
entre a aquisição de um produto e o salário das pessoas, situação econômica
e sexo, etc.....
Para avaliar se existe correlação entre duas variáveis pode-se utilizar
um gráfico denominado diagrama de dispersão.
O gráfico de dispersão é construído no sistema cartesiano em que os
eixos correspondem as variáveis correlacionadas. A variável dependente Y
situa-se no eixo das ordenadas e o eixo das abscissas é reservado para
a
variável independente X. Os pares ordenados (x,y) formam uma nuvem de
pontos.
A configuração geométrica do diagrama de dispersão pode estar
associada a uma linha reta (correlação linear- positiva ou negativa), uma
linha curva (correlação curvilínea), ou ainda ter os pontos dispersos de
maneira que não definam nenhuma configuração (neste caso não há
correlação).

Correlação linear
Positiva
Correlação linear
negativa
Correlação
curvilínea
Não há
correlação

Definida uma correlação linear entre as variáveis é possível verificar


qual o grau de intensidade na correlação entre as variáveis, através do
estabelecimento de um número, denominado coeficiente de correlação de
Pearson ( r ), dado por:
r =
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
] ) y ( y n ].[ ) x ( x n [
) y ).( x ( y x n
2
i
2
i
2
i
2
i
i i i i
n = nº de observações

OBS: r pode variar entre –1 e +1, inclusive, ou seja: 1 r 1 + s s ÷


Se r = 0 diz-se que não há correlação entre as variáveis X e Y
Se r = –1, diz-se que há uma perfeita correlação negativa entre as variáveis.
Se r = +1, diz-se que há uma perfeita correlação positiva entre as variáveis.
Se os valores de r estiverem próximos de –1 ou +1, indicam, respectivamente
uma forte correlação negativa ou positiva entre as variáveis, ou seja:
se r
próximo de –1, quando X aumenta, Y em média diminui, ou vice-versa; se
r
próximo de +1, as variáveis variam no mesmo sentido.

EX: As vendas de determinado produto, em milhares de unidades, foram


anotadas para diferentes valores de gastos com propaganda, em unidades
monetárias. Foram obtidos os seguintes resultados:
X (gastos- milhares)
1 2 3 4 5 6 7 8
Y (vendas) 2,2 3,0 2,8 3,4 3,7 3,5 3,6 3,8
Verifique, usando o gráfico de dispersão e o coeficiente de Pearson, se
existe relação entre as vendas do produto e os valores gastos com
propaganda, ou seja, verifique se as vendas do produto dependem dos gastos
com propaganda.

38
- Diagrama de dispersão:

O gráfico acima dos valores amostrados das variáveis X e Y indica


que
existe uma relação aproximadamente linear entre as variáveis, isto é, as vendas
do produto crescem de forma aproximadamente linear com os gastos com
propaganda no intervalo considerado. OBS: o diagrama pode ser obtido
utilizando-se a planilha Excel, em inserir gráfico, escolhe-se “dispersão (XY)”,
e um dos diferentes tipos de gráficos de dispersão, conforme modelo abaixo:

Clicando em avançar, abre-se uma nova janela solicitando dados de origem:

Clicando em avançar, abre-se uma nova janela, solicitando opções


do gráfico, como título, eixo dos valores X, eixo dos valores Y, etc...

Nesta mesma janela já se complementa o gráfico, clicando em Eixos, Linhas


de grade, legenda e rótulos de dados., obtendo-se:
39

- Cálculo do coeficiente de Pearson:


r =
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
] ) y ( y n ].[ ) x ( x n [
) y ).( x ( y x n
2
i
2
i
2
i
2
i
i i i i
n= 8

x
i
(gastos) y
i
(vendas) x
i
y
i
x
2
y
2
1
2
3
4
5
6
7
8
2,2
3,0
2,8
3,4
3,7
3,5
3,6
3,8

¿ =
i
x ¿ =
i
y ¿ =
i i
y x
¿ =
2
i
x ¿ =
2
i
y
r =
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
] ) y ( y n ].[ ) x ( x n [
) y ).( x ( y x n
2
i
2
i
2
i
2
i
i i i i
¬ r =

OBS: o coeficiente de correlação de Pearson pode ser obtido utilizando-se a


planilha Excel, em f
x
, categoria da função: estatística, função “PEARSON” :

Clicando em OK aparecerá uma nova janela em que se deverá ser


selecionada a matriz referente aos valores de X ( A2:A9) e a matriz
correspondente aos valores de Y (B2:B9). O resultado aparecerá na janela.
40
EXERCÌCIOS:
1) Certa empresa de produtos esportivos, estudando a variação da demanda
de seu produto em relação a variação de preço de venda, obteve a tabela:
preço -x
i
38 42 50 56 59 63 70 80 95 110
demanda -y
i
350 325 297 270 256 246 238 223 215 208
Faça um diagrama de dispersão, determine o coeficiente de Pearson e
verifique que tipo de correlação existe entre as variáveis preço e demanda.

2) A tabela a seguir apresenta os custos totais de fabricação (Y) em milhares


de reais, de determinado produto em função do nº X de unidades
produzidas:
Quantidade -x
i

10 20 30 40 50
Custos - y
i
110 215 295 400 490
a) Faça um gráfico de dispersão; b)Analisando o gráfico, existe correlação
linear entre as variáveis?
c) Caso positivo, calcule a medida de correlação de Pearson entre a
quantidade e o custo;

3) Seja a tabela abaixo composta pela massa (Kg) e altura em (cm) de


crianças com 10 meses de idade.
Altura -xi (cm) 75 70 73 78 80 69 71 72 74 77
Massa -yi (Kg) 9,0 9,2 8,9 8,5 9,5 9,6 9,1 10,0 8,7 9,4
Faça um diagrama de dispersão, determine o coeficiente de Pearson e
verifique que tipo de correlação ( positiva ou negativa) existe entre as
variáveis massa e altura.

4) Na tabela a seguir tem-se a nota sensorial global do óleo de soja


armazenado em temperatura ambiente durante 190 dias.
Dias 0 28 91 119 153 190
Média global 8,4 7,6 5,2 4,8 4,0 3,6
a) Faça um gráfico de dispersão; b) Analisando o gráfico, existe
correlação linear entre as variáveis?
b) Calcule a medida de correlação de Pearson entre o tempo (dias) e a
média global;
6.2. Regressão
Uma vez caracterizada uma relação entre as variáveis X e Y, pode-se
descrever essa relação através de uma função matemática. A análise de
regressão é uma técnica estatística que consiste em se determinar um
modelo para descrever a relação entre uma variável dependente Y e uma ou
mais variáveis independentes X.
Observando o diagrama de dispersão pode-se ter uma idéia do tipo
de relação entre as variáveis. No caso de duas variáveis X e Y, a
relação
pode tomar várias formas, desde uma simples relação linear (reta) até
uma
complicada função matemática. Considerando a correlação linear entre as
variáveis, pode-se descrever a relação entre as variáveis através de :
- regressão linear simples: trata-se de determinar a equação de uma
reta que melhor se ajuste a dados amostrais. Na regressão linear simples
a
variável dependente Y é função de uma única variável independente X;
- regressão linear múltipla: trata-se de encontrar a melhor linha
ajustante num espaço n-dimensional e a variável dependente Y é função de
duas ou mais variáveis independentes X.

- Regressão Linear Simples:


O modelo de regressão linear simples pode ser representado por:
Y= o + |X
Em que: o = intercepto da reta - representa o valor de Y quando X =
0. É
coeficiente linear da reta
| = inclinação da reta. É o coeficiente angular

A reta de regressão é estimada a partir de uma amostra de n


observações da variável X e os correspondentes valores da variável Y e
é
indicada por:
bx a yˆ + =
em que as constantes a e b são as estimativas dos parâmetros o e |.

vários métodos para encontrar as estimativas de tais parâmetros, sendo que
o mais eficaz é o Método dos Mínimos Quadrados em que:

b =
¿
¿
¿
¿ ¿
÷
÷
n
) x (
x
n
y x
y x
2
i 2
i
i i
i i
e a =
n
x
. b
n
y
i i ¿ ¿
÷ ou a = X . b Y÷
41

EX: As vendas de determinado produto, em milhares de unidades, foram


anotadas para diferentes valores de gastos com propaganda, em unidades
monetárias. Foram obtidos os seguintes resultados:
X (gastos- milhares) 1 2 3 4 5 6 7 8
Y (vendas) 2,2 3,0 2,8 3,4 3,7 3,5 3,6 3,8
Já se sabe, pelo diagrama de dispersão construído anteriormente, que os
valores amostrados das variáveis X e Y indicam que existe uma relação
aproximadamente linear entre as variáveis, isto é, as vendas do produto
crescem de forma aproximadamente linear com os gastos com propaganda.
Também se sabe pelo coeficiente de Pearson, r = 0,888, que realmente
existe correlação linear positiva entre as variáveis. Assim, determine a
reta
de regressão bx a yˆ + = .
Como: b =
¿
¿
¿
¿ ¿
÷
÷
n
) x (
x
n
y x
y x
2
i 2
i
i i
i i
e a =
n
x
. b
n
y
i i ¿ ¿
÷
utilizando-se a tabela construída para o cálculo do coeficiente de
Pearson.,
tem-se:
b =
8
) 36 (
204
8
) 26 ).( 36 (
3 , 125
2
÷
÷
¬ b = 0,1976 e a =
8
36
. 1976 , 0
8
26
÷ ¬ a = 2,3608
Logo: bx a yˆ + = ¬ x 1976 , 0 3608 , 2 yˆ + =

Para traçar a reta estimada sobre os pontos do gráfico, escolhem-se dois


valores quaisquer para x e calcula-se os valores esperados para y
correspondentes. Por exemplo:
Se x = 1 ¬ 1 1976 , 0 3608 , 2 yˆ × + = ¬ 5584 , 2 yˆ =
Se x = 5 ¬ 5 1976 , 0 3608 , 2 yˆ × + = ¬ = yˆ 3,3488
De posse desses valores, marca-se dois pontos (1; 2,5584) e (5; 3,3488) no
gráfico de dispersão e, unindo-os, traça-se a reta obtida.

reta de regressão-gastos x vendas


0
1
2
3
4
0 2 4 6 8 10
gastos com propaganda (x) - em unidades
monetárias
v
e
n
s
d
a
s

(
y
)

e
m

m
i
l
h
a
r
e
s

d
e

u
n
i
d
a
d
e
s

OBS: Utilizando o Excel é possível encontrar os valores de a e b e construir


a linha de tendência sobre o gráfico de dispersão.
- Para encontrar a e b, no comando “Ferramentas” do Excel, clica-se
em “análise de dados”. Abre-se uma janela, solicitando o tipo da
ferramenta de análise.
Caso não conste o comando “análise de dados” em “Ferramentas”,
clique em “suplementos”. Abre-se uma janela. Clique em “Ferramentas
de análise” e OK. O comando “análise de dados” será incluído em
“Ferramentas”. Clique em análise de dados para abrir a janela abaixo:

Clicando-se em “Regressão” e Ok, abre-se nova janela, solicitando


intervalo de entrada de Y (coluna contendo os valores de Y), intervalo
de
entrada de X (coluna contendo os valores de X), intervalo de saída
(célula
superior esquerda para a tabela dos resultados).

42

Clicando em OK, aparecerá na planilha uma tabela que inclui uma


tabela ANOVA, coeficientes, erro padrão de estimativas de y, valores r2,

de observações e erro padrão dos coeficientes. Por ora, interessa apenas
os
valores dos coeficientes e o nº de observações. Os demais resultados
dependem do desenvolvimento de novos conhecimentos da estatística.

- Quanto a reta de regressão, clica-se sobre o gráfico de dispersão. Ativa-


se o comando do ambiente “Gráfico”, entre os comandos “Ferramentas” e
“Janela”. Clicando no comando Gráfico, abre-se uma série de comandos,
entre eles “adicionar linha de tendência”.

Clicando em adicionar linha de tendência abre-se uma janela,


solicitando o tipo de linha desejada, conforme figura abaixo:

Clicando em “linear” e OK, o gráfico de dispersão será


complementado com a linha de regressão.

43

OBS: Encontrada a equação de regressão, pode-se utilizá-la para previsão


do valor da variável dependente Y, dado o valor da variável independente
X, desde que dentro do intervalo de variação dos valores da variável
independente originalmente amostrados. Quanto a previsão do valor de Y
fora deste limite só é possível se o valor de X não estiver muito distante do
primeiro e do último valor de x estudado.
EX: Suponha que os gastos com propaganda sejam de 3,5 unidades
monetárias. Estime o valor das vendas.
Para x = 3,5 ¬ x 1976 , 0 3608 , 2 yˆ + = ¬ 5 , 3 1976 , 0 3608 , 2 yˆ ×
+ = ¬ 0524 , 3 yˆ =

Logo se o valor de gastos com propaganda for de 3,5 unidades monetárias,


estima-se que as vendas serão de 3,0524 milhares de unidades.

- Transformação de variáveis:
Existem situações em que os pares de valores das variáveis X e Y,
apresentados em diagrama de dispersão, não se distribuem em torno de uma
reta. Nesses casos, pode-se experimentar transformar uma das variáveis ou
ambas as variáveis, utilizando-se da transformação logarítmica, extração da
raiz quadrada ou inversão, além de outras.
EX: Seja a tabela:
Construindo
o diagrama
de dispersão,
tem-se:
X Y
0
0,6
1,2
1,5
1,8
2,1
2,4
4,0
8,0
15,0
22,6
36,4
45,3
60,0

Observa-se que os pontos não se apresentam em torno de uma reta. Neste


caso, pode-se experimentar transformar a variável Y em log Y, ou seja:

Construindo
o diagrama
de dispersão,
tem-se:
X logY
0
0,6
1,2
1,5
1,8
2,1
2,4
0,602
0,903
1,176
1,354
1,561
1,656
1,778
diagrama de dispersão
0,000
0,500
1,000
1,500
2,000
0 0,5 1 1,5 2 2,5 3
X
l o
g
Y

Observe que os pontos relativos as variáveis X e log Y estão


praticamente
sobre uma reta. É possível então ajustar uma regressão linear simples. Para
calcular a e b, realiza-se os cálculos intermediários X.logY e X
2
. Assim:

x
i
log y
i
x
i
log y
i
x
i
2
y
2
0
0,6
1,2
1,5
1,8
2,1
2,4
0,602
0,903
1,176
1,354
1,561
1,656
1,778

¿ =
i
x
¿ =
i
y log
¿ =
i i
y log x
¿ =
2
i
x ¿ =
2
i
y
Então : b =
¿
¿
¿
¿ ¿
÷
÷
n
) x (
x
n
y log x
y log x
2
i 2
i
i i
i i
¬ b =
44
a =
n
x
. b
n
y log
i i ¿ ¿
÷ ¬ a =
A reta de regressão será: log bx a yˆ + = ¬ log = yˆ

EXERCÍCIOS
1) Observa-se que um determinado produto tem o seu custo baseado na quantidade
produzida, conforme a tabela abaixo:
Quantidade (X) 10 12 14 16 18 20
Custo em reais R$(Y) 100 112 119 130 139 142
Pede-se:
a) Construa o diagrama de dispersão e verifique se há uma relação entre
as
variáveis.
b) Ajuste uma reta aos dados.
c) Trace a reta ajustada.
d) Qual é o custo para 22 unidades?
Resposta: b) y = 59.02 + 4.31 x

2) Os lucros de uma companhia, no período de 2003 a 2007, são assim


apresentados:
Anos 2003 2004 2005 2006 2007
Lucros em milhões de reais 2,3 3,5 5,8 6,5 7,0
Estimar o lucro para 2008
3) Suponha que um analista toma uma amostra aleatória de 10
carregamentos recentes por caminhão feitos por uma companhia e anota a
distância em quilômetros e o tempo de entrega ao meio dia mais próximo,
obtendo:
Distância-xi (km) Tempo-yi (em dias)
825 3,5
215 1,0
1070 4,0
550 2,0
480 1,0
920 3,0
1350 4,5
325 1,5
670 3,0
1215 5,0

a) Construir o diagrama de dispersão para os dados e interprete o gráfico;


b) Calcular o coeficiente de correlação de Pearson e interprete o resultado;
c) Caso as variáveis estejam correlacionadas linearmente determinar a equação
de regressão, traçar a reta de regressão no diagrama de dispersão e estimar o
tempo de entrega para um carregamento para 1.000 Km.

4) A tabela abaixo apresenta dados de uma amostra referentes ao número de horas de


estudo fora da classe para determinados alunos de um curso de Bioestatística, bem
como os graus obtidos em um exame aplicado no fim do curso
Horas de estudo 20 16 34 23 27 32 18 22
Grau no exame 64 61 84 70 88 92 72 77
a) Construir o diagrama de dispersão para os dados e calcular o
coeficiente de
correlação de Pearson;
b) Determinar a equação de regressão e traçar a reta de regressão no diagrama
de dispersão;
c) Estimar o grau no exame obtido por um estudante que dedicou 30
horas de
estudo fora da classe.

45

Tabela 1: Números aleatórios

FONTE: TIBONI, C.G.R.(2003)

Você também pode gostar