Escolar Documentos
Profissional Documentos
Cultura Documentos
Estatistica
Estatistica
2
ESTATÍSTICA
Ementa: Dados, variáveis, população e amostra. Descrição de amostra com
tabelas e gráficos. Medidas de tendência central. Medidas de dispersão.
Probabilidade. Correlação. Variáveis aleatórias e distribuições discretas.
Distribuições contínuas. Estimação. Testes de hipóteses. Regressão linear.
Principais funções e suas aplicações à Contabilidade.
BIBLIOGRAFIA:
BAZONI, Reinaldo, SAKATE, Maria Massae. Análise de custos,
contabilidade internacional e estatística aplicada. Disponível em:
http://pt.scribd.com/doc/69061580/Analise-de-Custos-Contabilidade-
Internacional-e-a-Aplicada
BUSSAB, Wilton & MORETTIN, Pedro. Estatística Básica. Atual.
CRESPO, Antonio Arnot. Estatística fácil. Saraiva. 1984.
FONSECA, Jairo Simon et alii. Curso de Estatística. 5ª ed. Atlas. São
Paulo, 1994.
KAZMIER, Leonard J. Estatística Aplicada a Economia e Administração.
Tradução: Carlos Augusto Crusius. São Paulo: McGraw-Hill, 1982.
LAPPONI, Juan Carlos. Estatística usando o Excel 5 e 7. São Paulo,
Lapponi Treinamentos e Editora, 1997.
MARTINS, Gilberto de Andrade. Estatística Geral e Aplicada. São Paulo:
Atlas, 2002.
MORETTIN, L. Gonzaga. Estatística Básica – Inferência. São Paulo:
Makron Books.
PEREIRA, Paulo Henrique. Noções de estatística. Campinas, SP: Papirus, 2004.
SILVA, Ermes Medeiros et alli. Estatística para os Cursos de: Economia,
Administração e Ciências Contábeis. São Paulo. Editora Atlas, 1995.
TIBONI, Conceição Gentil Rebelo. Estatística Básica para o Curso de
Turismo. São Paulo: Atlas, 2003.
TOLEDO, Geraldo Luciano. Estatística básica. Atlas. 1988.
WONNACOTT, Ronald & WONNACOTT, Thomas. Fundamentos de
Estatística. LTC.
ESTATÍSTICA
INTRODUÇÃO:
A Estatística é uma ciência que propicia métodos para análise e
avaliação de situações que requerem planejamento ou tomada de decisões. É
utilizada por diversas áreas, como: turismo, economia, medicina, psicologia,
fonoaudiologia, biologia, administração, ciências contábeis, etc....
Na área de ciências sociais aplicadas, em especial em um curso de
Ciências Contábeis, a Estatística é fundamental uma vez que propicia
conhecimentos de técnicas que permitem transformar dados em
informações para tomada de decisões. Para os cursos de pós-graduação
(especializações, mestrados e doutorados) a estatística é imprescindível
para a
correta interpretação dos dados levantados e das análises para os
trabalhos de
monografia, dissertação ou tese.
O uso do instrumental matemático e estatístico torna possível a
resolução de grande variedade de problemas, levando a contabilidade mais
próxima da sua objetividade. Por meio de pesquisas de opinião e formação
de bancos de dados a empresa pode traçar com maior precisão a estratégia a
ser adotada no empreendimento, a escolha das técnicas de verificação e
avaliação da qualidade e quantidade do produto, bem como a expectativa de
lucros ou perdas.
- Histórico:
ANTIGUIDADE: os povos faziam registros de dados que consideravam
importantes, como nº de habitantes, de nascimentos, de óbitos, faziam
avaliações de bens, estimativas das riquezas, cadastramento de propriedades
para cobrança de impostos, no entanto, ainda não faziam análises e
interpretações de tais dados.
SEC. XVI: começaram a fazer as primeiras análises sistemáticas de dados,
originando-se as primeiras tabelas.
SEC. XVIII: As tabelas ficam mais completas, surgem as primeiras
representações gráficas e os cálculos de probabilidades. A estatística
deixa
de ser uma simples tabulação de dados numéricos para se tornar “o conjunto
de métodos utilizados para concluir sobre um todo (população), partindo da
observação de partes dessa população (amostra)".
3
- Definição:
Estatística é uma parte da matemática aplicada que fornece métodos
para coleta, organização, descrição, análise e interpretação de informações
(dados) a respeito de um fenômeno em estudo. Divide-se em :
Estatística
¹
´
¦
÷ ÷
÷ ÷
dados dos ção interpreta e análise da trata l Inferencia ou
dados. dos descrição e o organizaçã coleta, da apenas
Indutiva
trata Descritiva
2º) PLANEJAMENTO:
Como levantar informações? Que dados deverão ser obtidos? Qual
levantamento a ser utilizado? Censitário? Por amostragem? E o cronograma
de atividades? Os custos envolvidos? etc.
OBS:
a) A coleta de dados primários pode ser feita através de: questionários,
entrevistas pessoais, entrevista por telefone, e-mail, deixado em lugares
estratégicos ou por observação.
b) Quanto aos tipos de perguntas, estas podem ser: dicotômicas quando
permitem apenas duas respostas (sim ou não), de múltipla escolha quando
permitem opção de várias possibilidades ou abertas quando é possível
responder de qualquer maneira.
EX de pergunta dicotômica:
Você mora com os seus pais? ( ) sim ( ) não
Você gosta ( ) ou não gosta de matemática ( )?
EX de pergunta de múltipla escolha:
Em que tipo de alojamento você está morando neste ano de estudo?
( ) Alojamento universitário
( ) Casa/apartamento próprio, com os seus pais
( ) Casa/apartamento alugado, com os seus pais
( ) Outro (favor especificar) _______________
Por que escolheu o curso de Ciências Contábeis?
( ) Preferência
( ) Falta de opção
( ) Não decidiu ainda
( ) Outro (favor especificar) _______________
EXERCÍCIO:
Sublinhe em cada caso a variável e classifique em qualitativa (nominal
ou
ordinal) ou quantitativa (discreta ou contínua):
a) nº de peças produzidas por uma certa máquina.
b) diâmetro de peças produzidas por certa máquina.
c) salários dos funcionários de uma empresa.
d) duração de vida, de um novo tipo de lâmpadas produzidas.
e) nº de produtos da marca X vendidos em um supermercado
f) comprimento de pregos produzidos por uma máquina.
g) número de artigos defeituosos produzidos.
h) o valor das vendas diárias de uma empresa
i) grau de instrução (escolaridade) dos funcionários da empresa X
j) número de acidentes de trabalho, por mês
k) cargo dos funcionários de uma empresa.
l) nº de internações hospitalares por uma determinada doença.
m) quantidade de ácido acetilsalicílico em comprimidos.
n) sexo de pacientes internados em uma clínica.
o) nº de dentes perdidos ou danificados em crianças de uma escola.
p) nº de crianças nascidas vivas em uma dada região.
2) Arredondamento de dados:
De acordo com a Resolução 886/66 do IBGE, o arredondamento de dados
é feito da seguinte maneira:
A) Quando o 1º algarismo a ser abandonado é 0, 1, 2, 3 ou 4,
fica
inalterado o último algarismo a permanecer. EX: arredonde os números,
deixando-os com uma casa decimal:
53,24 ÷ 53,2 8,62732 ÷ 8,6
B) Quando o 1º algarismo a ser abandonado é 6, 7, 8 ou 9 aumenta-se
de
uma unidade o algarismo a permanecer. EX: arredonde os nos, deixando-os
com uma casa decimal:
42,87 ÷ 42,9 25,08 ÷ 25,1 53,99 ÷
54,0.
C) Quando o primeiro algarismo a ser abandonado é 5, há duas soluções:
6
- Se ao 5 seguir, em qualquer casa, um algarismo = de zero, aumenta-se
uma unidade ao algarismo a permanecer. EX: arredonde os nos,
deixando-os com uma casa decimal:
2,352 ÷ 2,4 25,6501÷ 25,7
76,2500002 ÷ 76,3
- Se o 5 for o último algarismo ou se ao 5 só se seguirem zeros, o último
algarismo a ser conservado só será aumentado de uma unidade se for
ímpar. EX:
24,75 ÷ 24,8 24,65 ÷ 24,6
24,7500000÷ 24,8 24,65000 ÷ 24,6
EXERCÍCIOS:
1) Arredonde cada um dos números abaixo, deixando-os com apenas uma
casa decimal:
a) 2,38 e) 328,35 i)
89,99
b) 39,85 f) 2,97 j)
23,40
c) 0,351 g) 6,829 k)
48,85002
d) 4,24 h) 5,550 l)
45,09
3) Técnicas de amostragem:
a sistemátic Amostragem -
ada estratific al proporcion Amostragem -
simples aleatória ou casual Amostragem
¦
¹
¦
´
¦÷
7
OBS: para selecionar os elementos da amostra, utiliza-se a amostragem
casual ou aleatória simples. Numeram-se os funcionários de 01 a 90, sendo
que de 01 a 54 correspondem os funcionários do sexo masculino e de 55 a
90, do sexo feminino. Por ex., definindo a 1ª e 2ª coluna de números
aleatórios, tem-se os seguintes números:
98 –33-80-79-18 –74 –54 –11 –48 –60 –09 –90 –73 –75 –54 –08 –28 –53 –
91 –89 –77 –19 – 21 – 51 – 55 ...
Sexo masculino (01 a 54)÷33–18-54–11-48–09–08–28–53-19–21÷11 funcionários
Sexo feminino (55 a 90) ÷ 80 –79 – 74 – 60 – 90 – 73 – 75 ÷ 07 funcionárias
AMOSTRA: 8 - 19 – 22 – 23 – 39 – 51 – 68 – 72 - 84
EXERCÍCIOS:
1) Obtenha uma amostra aleatória com 10% dos alunos curso de Ciências
Contábeis da UNICENTRO (N= 40 alunos) para uma pesquisa sobre o
aproveitamento dos alunos no curso (colunas 19 e 20).
9
4) Apresentação dos dados:
¹
´
¦
÷
÷
cos
gráfi
tabelas
NÚMERO TÍTULO
TABELA 1 – ESQUEMA GERAL DE UMA TABELA
COLUNA INDICADORA CABE ÇALHO
CORPO
FONTE:
NOTA:
NOTA ESPECÍFICA:
- Número: serve para identificar a tabela no texto. EX: TABELA 1 - ,
ou
TABELA 2.1 –
Tabelas
¦
¹
¦
´
¦
÷
÷
s frequência de ão distribuiç de tabelas -
entrada dupla de tabelas
simples tabelas
Tabelas simples:
10
As tabelas simples ou de entrada simples podem apresentar a distribuição de
um conjunto de dados estatísticos a partir de um único fator - época,
local
ou espécie.
Toda tabela simples é denominada de série estatística e conforme o
fator.
Classificam-se em: temporais, geográficas e específicas.
EX:
Duração média dos Cursos Superiores-1994
Países Nº de anos
Itália
Alemanha
Holanda
Inglaterra
7,5
7,0
5,9
menos de 4
FONTE: Revista Veja
EXERCÍCIOS
1) De acordo com o IBGE(1.988), em 1.986 ocorreram, em acidentes de
trânsito, 27.306 casos de vítimas fatais, assim distribuídos: 11.712
pedestres,
7.116 passageiros e 8.478 condutores. Organize os dados em uma tabela e
classifique a série estatística.
k
AA
h = em que AA é a diferença entre o maior e o menor valor da
seqüência de dados.
No exemplo: AA= 9,5 – 2 ÷ AA = 7,5
Assim:
k
AA
h = e tomando- se k = 5, tem-se:
5
5 , 7
h = ÷ h = 1,5
OBS: para facilitar os cálculos posteriores, pode-se arredondar a
amplitude do
intervalo para um n° inteiro. Assim, no caso, pode-se tomar h = 2
No exemplo, conhecendo-se o menor valor da seqüência, no caso, o valor 2,
e conhecendo-se a amplitude de cada intervalo, no caso, h = 2, tem-se: 1ª classe:
2
a 4; 2ª classe: 4 a 6; 3ª classe: 6 a 8; 4ª classe: 8 a 10
De acordo com a Resolução 886/66 do IBGE, os intervalos de classe
devem empregar o símbolo ( ) entre os valores extremos de um
intervalo, o que significa a inclusão do limite inferior e a exclusão do limite
superior. No exemplo:
Classes (i) Nº de salários mínimos
1 2 4
2 4 6
3 6 8
4 8 10
Para completar a tabela resta determinar o nº de observações
correspondentes a cada classe que chamamos de freqüência simples ou
absoluta de uma classe ( f
i
). No exemplo:
1ª classe : 2 4 , tem-se 4 valores ÷ f
1
= 4
2ª classe : 4 6 , tem-se 12 valores ÷ f
2
= 12
3ª classe : 6 8 , tem-se 10 valores ÷ f
3
= 10
4ª classe : 8 10, tem-se 4 valores ÷ f
4
= 4
OBS: A soma das freqüências simples representada por ¿
÷
k
1 i
i
f é igual a n, ou seja:
¿
÷
k
1 i
i
f = n No exemplo: ¿
÷
k
1 i
i
f = f
1
+ f
2
+ f
3
+ f
4
= 4 + 12 + 10 + 4 = 30
- 2 ÷ A
T
= 8
Tipos de freqüências:
- Freqüência Simples ou absoluta ( f
i
): é o valor que realmente representa o
número de dados de cada classe. A soma das freqüências simples é igual ao número
total de dados, ou seja:
¿
÷
k
1 i
i
f = n
No ex., salários de uma empresa : f
1
= 4, f
2
= 12, f
3
= 10 e f
4
= 4 e ¿ = 30 f
i
- Freqüência relativa ( fr
i
): é o valor resultante da razão entre a freqüência simples
da classe i e a freqüência total, ou seja: fr
i
=
¿ i
i
f
f
+ … + f
i
No exemplo, vendas de um produto:
F
1
= f
1
= 4 ¬ 4 funcionários recebem entre 2 e 4 s.m. ou menos de 4 s.m.
F
2
= f
1
+ f
2
= 4 + 12 = 16 ¬ 16 funcionários recebem menos de 6 s.m.
F
3
= f
1
+ f
2
+ f
3
= 4 + 12 + 10 = 26 ¬ 26 funcionários recebem menos
de 8 s.m.
F
4
= f
1
+ f
2
+ f
3
+ f
4
= 4 + 12 + 10 + 4 = 30 ¬ 30 funcionários recebem
menos de 10 s.m.
- Freqüência acumulada relativa ( Fr
i
): é a freqüência acumulada da classe i,
dividida pela freqüência total da distribuição, ou seja : Fr
i
=
¿fi
F
i
EXERCÍCIOS
1) A tabela abaixo apresenta as vendas diárias de um determinado aparelho
elétrico, durante um mês, por uma firma comercial:
14 12 11 13 14 13 12 14 13 14 11 12 12 14 10 13
15 11 15 13 16 17 14 14
Forme uma distribuição de freqüência sem intervalos de classe.
4.2. GRÁFICOS:
São formas de apresentação de dados estatísticos que permitem
uma visão
completa do fato estudado. Nos gráficos estatísticos são feitas correspondências
entre
os elementos de uma tabela e uma figura geométrica, de tal modo que
haja
proporcionalidade nesta representação.
Todo gráfico deve apresentar número, título, rodapé. Se
necessário deve
conter ainda a legenda explicativa.
O NÚMERO é utilizado para identificar o gráfico. EX: GRÀFICO 1 -
O TÍTULO é colocado acima do gráfico e deve responder as perguntas: o
que?,
onde? E quando?. Preferencialmente em letras maiúsculas seguindo o padrão
do
texto.
O RODAPÉ constitui-se da FONTE, NOTA e NOTA ESPECÍFICA.
A FONTE indica o órgão ou entidade responsável pelo fornecimento dos
dados.
Deve ser colocada abaixo do gráfico e escrita em maiúscula, seguida de dois pontos.
A NOTA quando necessária é utilizada para apresentação de informações de
natureza gera,, esclarecendo o conteúdo e a metodologia. Deve vir em
seguida da
fonte e ser escrita em letra maiúscula seguida de dois pontos.
A NOTA ESPECÍFICA, quando necessária, é utilizada para esclarecer sobre um
item ou uma parte específica do gráfico. Utiliza-se chamadas, indicadas no gráfico,
geralmente no título ou na legenda. A nota específica deve ser chamada
por
algarismos arábicos entre parênteses.
A legenda explicativa informa, se necessário, diferenças entre cores,
símbolos, tipos de retas, etc. Essas informações também podem ser escritas no
título.
Devem ser colocadas, de preferência, à direita do gráfico.
16
- Gráfico em linha ;
Esse tipo de gráfico utiliza-se da linha poligonal para representar a
série
estatística. São elaborados no sistema de coordenadas cartesianas ortogonais ( eixo
das abscissas e eixo das ordenadas). Representa-se uma variável no eixo x e a
outra
no eixo y. Para cada valor de x tem-se um valor de y, formando pares
ordenados
(x,y). Determinados graficamente todos os pontos da série, liga-se todos os pontos,
dois a dois, por segmentos de reta, resultando em uma linha poligonal.
OBS: os
gráficos devem conter escalas. As escalas devem crescer da esquerda para a direita
e
de baixo para cima. As legendas explicativas devem ser colocadas, de preferência, à
direita do gráfico.
EX:
PRODUÇÃO BRASILEIRA DE ÓLEO
DE DENDÊ –1987-92
Anos Quantidade (1000t)
1987
1988
1989
1990
39,3
39,1
53,9
65,1
FONTE: Agropalma
FONTE: Agropalma
- Gráfico em setores;
Construído com base em um círculo é empregado sempre que se deseja
ressaltar participação de um dado no total. O total é representado pelo círculo
que
fica dividido em tantos setores quantas são as partes. Os setores devem ter áreas
proporcionais aos dados da série. A representação da área de cada setor é obtida
por
uma regra de três simples e direta, ou seja:
Total 360°
Cada parte x°
o
2
= ? ¬
o
3
= ? ¬
o
4
= ? ¬
Fonte: I. B. Siderurgia
- Gráfico de Pareto:
É um tipo especial de gráfico em colunas e em linhas. Trata-se de um gráfico de
gestão de qualidade usado para visualizar diversos elementos de um problema e
auxiliar
na determinação de sua prioridade.
EX: Suponha que um fabricante de auto peças recebeu um certo número
de
reclamações sobre um determinado produto seu, durante uma semana. A fim
de
melhorar a qualidade da sua produção e prestação de serviços, ele coletou os dados
referentes as reclamações, organizando-as nas categorias.
Reclamações apresentadas
Categoria número
Demora na entrega
Conserto da peça
Defeito na embalagem
Substituição da peça
outros
1
2
3
4
5
18
Definidas as categorias, o fabricante entrevistou 33 clientes, obtendo como
resultado de
sua pesquisa os dados:
Reclamações conforme os entrevistados
1º 1 4º 2 7º 5 10º 2 13º 4 16º 3 19º 1 22º 3 25º 2 28º 3 31º 1
2º 4 5º 1 8º 1 11º 2 14º 1 17º 3 20º 5 23º 3 26º 4 29º 2 32º 3
3º 4 6º 1 9º 1 12º 3 15º 3 18º 5 21º 1 24º 1 27º 2 30º 5 33º 4
A partir dos dados coletados constroem-se duas tabelas de freqüências,
com os
respectivos percentuais e com os percentuais cumulativos. A 1ª tabela apresenta as
reclamações e a 2ª identifica os principais problemas por ordem
decrescente de
freqüência:
d
e
r
e
c
l
a
m
a
ç
õ
e
s
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
%
c
u
m
u
l
a
t
i
v
o
Reclamações apresentadas
número Categoria
1 Demora na
entrega
2 Conserto da peça
3 Defeito na
embalagem
4 Substituição da
peça
5 Outros
(
1
0
0
0
t
)
(
1
0
0
0
t
)
- gráfico em barras:
- gráfico em colunas múltiplas:
1
. 0
0
0
. 0
0
0
)
Exportação
Importação
19
- gráfico em setores:
Pr odução de Fer r o- Gusa - Br asi l -
1993
54%
12%
13%
21%
Mi nas Ger ai s
Espír i t o Sant o
Ri o de Janei r o
São Paul o
d
e
r
e
c
l
a
m
a
ç
õ
e
s
0,00%
20,00%
40,00%
60,00%
80,00%
100,00%
120,00%
%
c
u
m
u
l
a
t
i
v
o
Fonte: I.B.Siderurgia
EXERCÍCIOS
1) Represente as séries estatísticas abaixo através de gráficos:
a) POPULAÇÃO BRASILEIRA
1950-2000
Anos População (em milhões)
1950
1960
1970
1980
1990
2000
52
70
93
119
147
170
Fonte: IBGE
b) Cidades brasileiras mais
visitadas por turistas
estrangeiros (1999)
Cidades Nº de turistas
(%)
Rio de Janeiro
Florianópolis
São Paulo
Salvador
Foz do Iguaçu
32,54
17,69
13,74
12,67
11,78
Fonte: OMT
20
- Histograma:
¹
´
¦÷
classe de intervalos COM s freqüência de ão distribuiç de tabelas -
classe de intervalos SEM s freqüência de ão distribuiç de tabelas
Representação gráfica:
Nº de acidentes, por dia, em uma empresa, durante 20 dias
fi
Fi
x
i
x
i
- Polígono de freqüências:
Também é utilizado para representar graficamente uma
distribuição
de freqüências com intervalos de classe. É um gráfico em linha, em
que as
freqüências são marcadas sobre as perpendiculares ao eixo horizontal,
levantadas pelos pontos médios dos intervalos de classe.
1
2
3
4
3 4
5 6
6 8
8 10
3
5
7
9
4
12
10
4
¿ = 30 f
i
21
OBS: para completar o polígono, unem-se os extremos da linha obtida aos
pontos
médios da classe anterior a primeira e da posterior à última, da distribuição.
Traçado o polígono de freqüência é desejável, que se faça um polimento, de
modo a mostrar o que seria tal polígono com um número maior de dados. Ou seja,
como em geral, os dados coletados pertencem a uma amostra extraída de
uma
população, ampliando-se essa amostra, a amplitude das classes tende a ficar cada
vez menor e a linha poligonal (contorno do polígono de freqüência) tende
a se
transformar em uma curva, chamada “curva de freqüência”.
Tal curva mostra, de modo mais evidente a verdadeira natureza da distribuição
da população. A curva de freqüência pode ser obtida por aproximação ou,
calculando-se novas freqüências, denominadas freqüências calculadas ( fc
i
).
EXERCÍCIOS
1) A tabela abaixo apresenta os coeficientes de liquidez obtidos da análise de
balanço
em 50 indústrias:
3,9 7,4 10,0 11,8 2,3 4,5 10,5 8,4 15,6 7,6
18,8 2,9 2,3 0,4 5,0 9,0 5,5 9,2 12,4 8,7
4,5 4,4 10,6 5,6 8,5 2,4 17,8 11,6 0,8 4,4
7,1 3,2 2,7 16,2 2,7 9,5 13,1 3,8 6,3 7,9
4,9 5,3 12,9 6,9 6,3 7,5 2,6 3,3 4,6 16,0
a) Forme com esses dados uma distribuição com intervalos de classe iguais a 3, tais
que os limites inferiores sejam múltiplos de 3. b) Confeccione o
histograma e o
polígono de freqüência correspondente.
24
25
12
66
97,5
¿ =
i
f
nº de funcionários- f
i
1 1.000,00 1.200,00 2
2 1.200,00 1.400,00 6
3 1.400,00 1.600,00 10
4 1.600,00 1.800,00 5
5 1.800,00 2.000,00 2
¿ =
i
f
d
e
f
a
m
í
l
i
a
s
25
20
15
10
curtose de Medidas -
assimetria de Medidas
variação de e coeficient -
padrão Desvio -
Variância -
Total Amplitude -
dispersão ou dade variabili de Medidas -
Percentis
Decis
Quartis
Mediana
es Separatriz
Mediana
Moda
Aritmética Média -
Central Tend. de Med. -
Posição de Medidas -
ão distribuiç uma de Medidas
¦
¦
¦
¦
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
¦
¦
¦
¦
¦
´
¦
÷
¦
¦
¹
¦
¦
´
¦
¦
¦
¦
¦
¹
¦
¦
¦
¦
´
¦
¦
¦
¹
¦
¦
´
¦
÷
÷
÷
÷
÷
¦
¹
¦
´
¦
÷
÷
23
- Medidas de Tendência Central: tais medidas dão o valor do ponto no
eixo das abscissas em torno do qual os dados se distribuem.
a) Média aritmética ( ) X
{
¦
¹
¦
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Aritmética Média
¿
¿ ¿
= =
i
i i i i
f
f . x
X ou
n
f . x
X
= ¿ i
f 120 ¿ = 278 f . x
i i
¿
¿
=
i
i i
f
f . x
X ¬ 3 , 2 X
120
278
X
120
16 4 33 3 44 2 27 1
X = ¬ = ¬
× + × + × + ×
=
Interpretação do resultado: é lógico que não se pode construir chalés
com
2,3 quartos. Nessa situação considera-se a aproximação do resultado 2,3
para 2 (dois). A interpretação do resultado é que a preferência das famílias
tende para chalés com dois dormitórios.
OBS: Pode-se abrir uma coluna na tabela, correspondente aos produtos x
i
.f
i
,
o que torna mais prático o cálculo da média.
¿
¿ ¿
= =
i
i i i i
f
f . x
X ou
n
f . x
X
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
500
700
900
1100
1300
79
45
31
12
9
Calcule o salário médio da
na Companhia A, em 2001.
¿
¿
=
i
i i
f
f . x
X
24
b) Moda (Mo)
Moda é o valor que ocorre com maior freqüência em uma série de
valores.
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Moda
Como a maior
freqüência é igual a 44
¬ Mo = 2
= ¿ i
f 120
- Moda de Czuber:
*
2 1
1 *
h
D D
D
l Mo ×
|
|
.
|
\
|
+
+ = onde: l
*
= limite inferior da classe modal
h
*
= amplitude da classe modal
D
1
= f
*
- f(ant.) e f
*
= freqüência da classe modal
D
2
= f
*
- f(post.)
\
|
+
+ = ¬ 200
34 79
79
400 × |
.
|
\
|
+
+ = Mo
¬ = Mo 539,82 reais
c) Mediana (Md)
25
Mediana é o valor que se encontra no centro de uma série de dados,
dispostos em ordem crescente. Ou seja, a mediana é o valor situado de
tal
forma em um conjunto de valores que o divide em dois subconjuntos de
mesmo número de elementos.
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não Dados -
Mediana
c.1) Mediana para dados não agrupados:
EX: Determine a mediana em cada série de dados:
1) 6-7-8- 9-10- 11-12-13 -14 ¬ os dados já se encontram ordenados, o valor 10
ocupa a posição central, apresentando o mesmo número de elementos à
sua
direita e a sua esquerda ¬ Md = 10
2) 10-2 -21-13 -12 -18 - 6-7 ¬ ordenando os dados, tem-se a série: 2-6-7-
10-12-13-18-21 ¬ como a série possui nº par de elementos, a Md é a média
aritmética dos dois valores centrais ¬ Md = 11
2
22
2
12 10
= =
+
OBS: Caso F
i
=
2
x x
Md
2
f
1 i i i +
+
= ¬
¿
x
i
f
i
F
i
12
14
15
16
17
20
1
2
1
2
1
1
1
3
4
6
7
8
= ¿ i
f 8 ¬ 4
2
8
= . Como
F
3
=4 , tem-se Md =
5 , 15
2
31
2
16 15
2
x x
4 3
= =
+
=
+
= ¿ i
f 08
- Com intervalos de classe:
Para dados agrupados, com intervalos de classe, calcula-se o ponto do
intervalo em que está compreendida a mediana, após determinar a classe na
qual se acha a mediana, ou seja, a classe mediana, que será, aquela
que
corresponde a freqüência acumulada imediatamente superior a
2
f
i ¿
. A
mediana será obtida pela fórmula:
*
*
* i
*
f
h ) ant ( F
2
f
l Md
× |
.
|
\
|
÷
+ =
¿
onde: l
*
= limite inferior da classe mediana
h
*
= amplitude da classe mediana
F(ant) = freqüência acumulada da classe anterior a classe mediana
f
*
= freqüência simples da classe mediana
= ¿ i
f 176
l
*
= 400- f
*
=45 - F(ant)=79
*
* i
*
f
h ) ant ( F
2
f
l Md
× |
.
|
\
|
÷
+ =
¿
¬Md=600 +
( )
= ¬
× ÷
Md
45
200 79 88
OBS:
26
1) quando X =Mo=Md a distribuição é simétrica.
X =Mo=Md
Mo<Md<X X <Md<Mo
EXERCÍCIOS:
1) Uma amostra contendo dez preços referentes ao litro de óleo industrializado
foi
extraída em diferentes postos no dia 3/5/2002. Os preços em reais são:
1,46 -
1,55 - 1,62 - 1,54 - 1,49 - 1,71 - 1,82 - 1,63 - 1,87 -
1,78. Calcule o
preço médio, o preço modal e preço mediano do litro de óleo industrializado.
Tempo(hs) f
i
x
i
x
i
.f
i
0 4
4 8
8 12
12 16
16 20
4
9
11
8
5
= ¿ i
f
= ¿ i
f
Determine o consumo médio, modal e mediano deste produto por
supermercado pesquisado.
27
Idade, em anos de estagiários de uma empresa
Idades-(em anos)- (x
i
) Freqüência (f
i
) x
i
.f
i
17
18
19
20
21
3
18
17
8
4
= ¿ i
f
50
¿ =
i i
f . x
- Separatrizes
As separatrizes são valores de referência em um conjunto de valores
ordenados e, portanto, são aplicadas a variáveis quantitativas e
qualitativas
ordinais. A mediana é um exemplo destas medidas, pois separa o conjunto
de dados em dois subconjuntos, com as menores e maiores observações.
Se o interesse é subdividir o conjunto ordenado em 4 partes de
igual tamanho, serão necessários 3 valores para estabelecer esta
separação.. Estes valores são chamados quartis. Os elementos
separatrizes são Q
1
, Q
2
e Q
3
.
Onde: O primeiro quartil (Q1) estabelece o limite entre as 25% menores
observações e as 75% maiores. O segundo quartil (Q2) é igual a mediana e o
terceiro quartil (Q3) separa as 75% menores observações das 25% maiores.
Para o cálculo dos quartis, utiliza-se técnicas semelhantes àquelas do
cálculo da mediana. Assim, determina-se, inicialmente, a classe que contém
o valor quartil a ser calculado. A identificação da classe é feita por meio do
termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2 ou 3
4
Esse termo está localizado numa classe que recebe o nome de classe quartil.
Sendo:
l
Qk
= limite inferior da classe do quartil considerado;
F
ant
= frequência acumulada da classe anterior à classe do quartil
considerado;
h
Qk
= amplitude do intervalo de classe do quartil considerado;
f
Qk
= frequência simples da classe do quartil considerado.
EX 1: Calcule Q
1
, Q
2
e Q
3
para os dados da distribuição:
Número de quartos dos chalés
Nº de quartos (x
i
) Freqüência (f
i
)
1
2
3
4
27
44
33
16
= ¿ i
f 120
EX 2: Considere a distribuição:
Salários dos funcionários da companhia A, em reais, no ano de 200
Classes Salários(R$) f
i
F
i
1
2
3
4
5
400 600
600 800
800 1000
1000 1200
1200 1400
79
45
31
12
9
79
124
155
167
176
= ¿ i
f 176
Cálculo de Q
1
: (classe 1)
l
Q1
= 400 - F
ant
= 0 - f
Q1
= 79 - h
Q1
= 200
Cálculo de Q
3
: (classe 3)
l
Q3
= 800 - F
ant
= 124 - f
Q3
= 31 - h
Q3
= 200
Onde:
D
1
é o primeiro decil, corresponde a separação dos primeiros 10% de
elementos da série.
D
5
é o quinto decil, coincide com a mediana.
D
9
é o nono decil, corresponde a separação dos últimos 10% de elementos
da série.
Para o cálculo dos decis, utiliza-se técnicas semelhantes àquelas do
cálculo da mediana. Assim, determina-se, inicialmente, a classe que contém
o valor decil a ser calculado. A identificação da classe é feita por
meio do
termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2, 3, 4, 5, 6, 7, 8 ou 9
10
Esse termo está localizado numa classe que recebe o nome de classe decil.
Sendo:
l
Dk
= limite inferior da classe do decil considerado;
F
ant
= frequência acumulada da classe anterior à classe do decil considerado;
h
Dk
= amplitude do intervalo de classe do decil considerado;
f
Dk
= frequência simples da classe do decil considerado.
Onde:
P
1
é o primeiro percentil, corresponde a separação dos primeiros 1% de
elementos da série.
P
50
é o cinquentésimo percentil, coincide com a mediana.
P
99
é o nonagésimo nono percentil, corresponde a separação dos últimos 1%
de elementos da série.
Para o cálculo dos percentis, utiliza-se técnicas semelhantes àquelas
do cálculo da mediana. Assim, determina-se, inicialmente, a classe que
contém o valor percentill a ser calculado. A identificação da classe é
feita
por meio do termo da ordem calculada pela expressão:
K∑f
i
com K = 1, 2, 3, ...., 97, 98, 99
100
Esse termo está localizado numa classe que recebe o nome de classe
percentil.
29
Sendo:
l
Pk
= limite inferior da classe do percentil considerado;
F
ant
= frequência acumulada da classe anterior à classe do percentil
considerado;
h
Pk
= amplitude do intervalo de classe do percentil considerado;
f
Pk
= frequência simples da classe do percentil considerado.
EXERCÍCIOS:
1) Um parque temático apresenta para cada uma de suas unidades um
consumo de eletricidade em kwh, de acordo com a tabela abaixo.
Consumo de eletricidade em kwh em um parque temático
i Consumo de energia (kwh) Nº de unidades (f
i
)
1
2
3
4
5
6
7
8
9
10 30
30 50
50 70
70 90
90 110
110 130
130 150
150 170
170 190
8
19
17
15
32
28
26
18
10
30
- Amplitude total (A
T
):
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não -Dados
Total Amplitude
- Variância (s
2
) e desvio padrão (s):
São medidas que levam em consideração a totalidade dos valores da
variável em estudo e por isso são as medidas de dispersão e
variabilidade
mais usadas.
A variância é calculada a partir dos quadrados dos desvios, e portanto, é
um número em unidade quadrada em relação a variável em questão, o que
sob o ponto de vista prático, é inconveniente. Por isso mesmo, imaginou-se
uma nova medida, denominada desvio padrão, definido como a raiz
quadrada da variância, ou seja: s=
2
s .
¦
¹
¦
´
¦
¹
´
¦
÷
÷
÷
classe de intervalos com
classe de intervalos sem
agrupados Dados
agrupados - não -Dados
padrão desvio e Variância
31
a) Variância e desvio padrão para dados não agrupados:
A variância para dados não agrupados é dada pela média aritmética dos
quadrados dos desvios em torno da média. (Desvio em torno da média é a
diferença entre cada dado e a média). Ou seja: a variância será dada por:
n
) X x (
s
2
i 2 ¿ ÷
= e o desvio padrão (s) é dado por:
n
) X x (
s
2
i ¿ ÷
=
Variância ÷
1 n
) X x (
s
2
i 2
÷
÷
=
¿
e desvio padrão ÷
1 n
) X x (
s
2
i
÷
÷
=
¿
EX: Sabendo que a produção leiteira diária de uma vaca, durante uma semana,
foi de: 10, 14, 13, 15, 16, 18 e 12 litros, calcule a variância e o desvio padrão
da
produção leiteira da vaca A.
Calcula-se litros 14 X = e n = 7
1 n
) X x (
s
2
i 2
÷
÷
=
¿
e tomando-se os valores de x
i
em ordem crescente, tem-se:
s
2
=
1 7
) 14 18 ( ) 14 16 ( ) 14 15 ( ) 14 14 ( ) 14 13 ( ) 14 12 ( ) 14 10 (
2 2 2 2 2 2 2
÷
÷ + ÷ + ÷ + ÷ + ÷ + ÷ + ÷
s
2
= 7 s
6
16 4 1 0 1 4 16 2
= ¬
+ + + + + +
OBS: Para facilitar o cálculo pode-se construir uma tabela e abrir uma
coluna para
x
i
- X e outra para (x
i
- X )
2
, ou seja:
x
i x
i
- X (x
i
- X )
2
10
12
13
14
15
16
18
-4
-2
-1
0
1
2
4
16
4
1
0
1
4
16
1 n
) X x (
s
2
i 2
÷
÷
=
¿
s
2
= 7 s
6
42 2
= ¬ e
s= 7 ¬ s = 2,65
¿ = ÷ 42 ) X x (
2
i
1 n
n
) x (
x
s
2
i 2
i
2
÷
÷
=
¿
¿
e s =
1 n
n
) x (
x
2
i 2
i
÷
÷ ¿
¿
1 n
) X x (
s
2
i 2
÷
÷
=
¿
¬ s
2
=
1 n
) X X . x 2 x (
2
i
2
i
÷
+ ÷ ¿
¬ s
2
=
1 n
X X . x 2 x
2
i
2
i
÷
+ ÷ ¿ ¿ ¿
s
2
=
1 n
X n . x X 2 x
2
i
2
i
÷
+ ÷ ¿ ¿
¬ s
2
=
1 n
)
n
x
( n x
n
x
2 x
2 i
i
i 2
i
÷
+ ÷ ¿ ¿ ¿ ¿
¬
s
2
=
1 n
n
) x (
n x .
n
x
. 2 x
2
2
i
i
i 2
i
÷
+ ÷ ¿
¿
¿
¿
¬s
2
=
1 n
n
) x (
n
) x (
2 x
2
i
2
i 2
i
÷
+ ÷ ¿
¿ ¿
¬
s
2
=
1 n
n
) x (
x
2
i 2
i
÷
÷ ¿
¿
EX: Sabendo que a produção leiteira diária da vaca A, durante uma semana,
foi de: 10, 14, 13, 15, 16, 18 e 12 litros, calcule a variância e o desvio padrão
da produção leiteira da vaca A.
x
i
x
i
2
10
12
13
14
15
16
18
100
144
169
196
225
256
324
1 n
n
) x (
x
s
2
i 2
i
2
÷
÷
=
¿
¿
¬ s
2
=
1 7
7
98
1414
2
÷
÷
s
2
=
6
42
¬ s
2
= 7
logo: s= 7 ¬ s = 2,65
= ¿ i
x 98 = ¿
2
i
x 1414
32
b) Variância e desvio padrão para dados
agrupados
¹
´
¦÷
classe de intervalos com -
classe de intervalos sem
Para a variância (s
2
):
1 n
f . ) X x (
s
i
2
i 2
÷
÷
=
¿
ou
1 n
n
) f . x (
f . x
s
2
i i
i
2
i
2
÷
÷
=
¿
¿
1 n
f . ) X x (
s
i
2
i
÷
÷
=
¿
ou s =
1 n
n
) f . x (
f . x
2
i i
i
2
i
÷
÷ ¿
¿
1 n
f . ) X x (
s
i
2
i
÷
÷
=
¿
ou s =
1 n
n
) f . x (
f . x
2
i i
i
2
i
÷
÷ ¿
¿
em que x
i
é o ponto médio da classe i.
= ¿ i
f 176
1 n
n
) f . x (
f . x
s
2
i i
i
2
i
2
÷
÷
=
¿
¿
68 %
s X ÷ X s X+
33
O intervalo ] s 2 X , s 2 X [ + ÷ contém aproximadamente 95 % dos valores da
série.
95 %
s 2 X÷ X s 2 X+
O intervalo ] s 3 X , s 3 X [ + ÷ contém aproximadamente 99 % dos valores da
série.
99 %
s 3 X÷ X s 3 X+
Quando a distribuição não é perfeitamente simétrica, estes percentuais
apresentam pequenas variações para mais ou para menos, segundo o caso.
Assim, quando se afirma que uma série apresenta média X = 100 e desvio
padrão s = 5, isso significa que:
- o intervalo [95, 105] contém aproximadamente 68% dos valores da série;
- o intervalo [90, 110] contém aproximadamente 95% dos valores da série;
- o intervalo [ 85, 115 contém aproximadamente 99% dos valores da série.
Uso da calculadora:
Dados não-agrupados: Função STAT - f
i
- M+ . Digitados todos os produtos,
digita-se a tecla RM .
Dados agrupados: Função STAT - x
i
× f
i
M+ . Digitados todos os produtos,
digita-se a tecla RM
EXERCÍCIOS
1) Uma amostra contendo dez preços referentes ao litro de óleo industrializado foi
extraída em diferentes postos no dia 8/7/2006. Os preços em reais são:
1,46 - 1,55 - 1,62 - 1,54 - 1,49 - 1,71 - 1,82 - 1,63 - 1,87
- 1,78
Calcule a variação no preço do litro de óleo industrializado, através da amplitude
total e do
desvio padrão.
3) Uma empresa produz caixas de papelão para embalagens e afirma que o número
de defeitos por caixa se distribui conforme a tabela:
Nº de defeitos- (x
i
) 0 1 2 3 4 5
Nº de caixas (f
i
) 32 28 11 4 3 1
Pede-se: a) o nº médio de defeitos por caixa; b) o número de caixas com menos de 3
defeitos; c) o número de caixas com mais de 4 defeitos; d) a percentagem de
caixas
com nº de defeitos entre 1 e 4, inclusive; e) o nº mediano de defeitos por caixas;
f) o nº
modal; g) a amplitude total da distribuição; h) a variância; i) o desvio padrão.
4) Uma amostra aleatória de 250 residências de famílias, classe média, com
dois
filhos, revelou a seguinte distribuição do consumo mensal de energia elétrica:
Consumo mensal- (kwh) nº de famílias -f
i
0 50
50 100
100 150
150 200
200 250
250 300
300 350
2
15
32
47
50
80
24
= ¿ i
f
34
6) Uma empresa de âmbito nacional, fornecedora de supermercados, fez um
levantamento de consumo de seu principal produto em vários supermercados
obtendo em determinado mês, a tabela:
Nº de unidades f
i
0 1000
1000 2000
2000 3000
3000 4000
4000 5000
5000 6000
10
50
200
320
150
30
Determine a amplitude total, a
variância e o desvio padrão da
série
= ¿ i
f
EXERCÍCIO
1) Em uma sala de aula foram escolhidos ao acaso 5 acadêmicos e a notas deles em
Estatística foram 6, 8, 10, 8, 7, 9, enquanto em outra sala as notas foram 10, 10,
10,
7, 4, 7. Pergunta-se em qual turma as notas foram mais homogêneas, ou seja, onde
foi menor a variação? Calcule o desvio padrão de ambas e verifique o que menos
variou entre elas.
Assim:
- se As=0, diz -se que a distribuição é simétrica ¬
X =Mo=Md
Mo<Md< X
X <Md<Mo
35
EX: Estaturas de 40 alunos de uma escola A
Estaturas(cm) f
i
150 154
154 158
158 162
162 166
166 170
170 174
4
9
11
8
5
3
Determine o coeficiente de assimetria
161 X = cm - Mo= 159,6 cm - s = 5,57 cm
As =
s
Mo X÷
=
Como As=
= ¿ i
f 40
) P P .( 2
) Q Q (
K
10 90
1 3
÷
÷
=
150 154
154 158
158 162
162 166
166 170
170 174
4
9
11
8
5
3
= ¿ i
f 40
Determine o coeficiente de curtose
) P P .( 2
) Q Q (
K
10 90
1 3
÷
÷
= ¬ K =
36
EXERCÍCIOS
1) Dada a tabela abaixo: Idade, em anos de alunos do 1º ano de uma faculdade
Idades-(em anos)- (xi) Freqüência (fi)
17
18
19
20
21
3
18
17
8
4
Calcule o coeficiente de
variação, o coeficiente de
assimetria e o coeficiente
de curtose.
= ¿ i
f
4) Um grupo de 85 moças tem estatura média de 160,6 cm, com um desvio padrão
igual a 5,97 cm. Outro grupo de 125 moças tem uma estatura média de
161,9 cm,
sendo o desvio padrão igual a 6,01 cm. a) Qual é o coeficiente de variação de cada
uma dos grupos? B) Em termos absolutos, qual grupo apresenta maior dispersão: c)
em termos relativos, qual grupo apresenta menor dispersão?
5) Uma professor resolveu fazer uma investigação a respeito do peso (em Kg) em
dois grupos de 7 alunos cada, escolhidos aleatoriamente de 2 turmas de 8º série. No
primeiro grupo os alunos apresentaram os pesos: 65, 57, 89, 65, 50, 72
e 81. No
segundo grupo foram verificados os pesos: 80, 78, 67, 56, 90, 101 e 66. Qual grupo
apresenta maior dispersão no peso: a) em termos absolutos. Porquê?; b) em termos
relativos. Porquê?
6) Uma máquina produz peças que são embaladas em caixas contendo 48 unidades.
Uma pesquisa realizada com 59 caixas revelou a existência de peças
defeituosas
seguindo a tabela:
Nº de peças defeituosas por caixa (x
i
) Nº de caixas -(f
i
)
0
1
2
3
4
5
20
15
12
6
4
2
= ¿ i
f
37
6) Correlação e regressão:
Existem situações nas quais interessa estudar o comportamento
conjunto de duas ou mais variáveis. Por exemplo: as vendas de um produto
dependem dos gastos com propaganda, o gasto com alimentação por família
está relacionado com a renda familiar, a quantidade produzida de um
produto afeta o custo total de produção. Na prática é comum situações
em
que uma variável se relaciona com várias outras, e se deseja determinar um
modelo para descrever a relação entre essas variáveis. Por exemplo: o custo
de um produto depende do tempo gasto em sua fabricação e do número de
operários envolvidos, etc...
No caso de duas variáveis, denomina-se de X a variável
independente e de Y a variável dependente. Na existência de algum tipo de
relacionamento entre as variáveis, diz-se que há uma correlação entre
elas.
Se há correlação entre as variáveis é possível descrever o tipo de
relação
presente entre elas através de uma regressão.
6.1. Correlação:
As correlações são relações estabelecidas após uma pesquisa. Com
base nos resultados da pesquisa, faz-se comparações que eventualmente
podem conduzir ou não à ligação entre as variáveis. Por exemplo: a relação
entre a aquisição de um produto e o salário das pessoas, situação econômica
e sexo, etc.....
Para avaliar se existe correlação entre duas variáveis pode-se utilizar
um gráfico denominado diagrama de dispersão.
O gráfico de dispersão é construído no sistema cartesiano em que os
eixos correspondem as variáveis correlacionadas. A variável dependente Y
situa-se no eixo das ordenadas e o eixo das abscissas é reservado para
a
variável independente X. Os pares ordenados (x,y) formam uma nuvem de
pontos.
A configuração geométrica do diagrama de dispersão pode estar
associada a uma linha reta (correlação linear- positiva ou negativa), uma
linha curva (correlação curvilínea), ou ainda ter os pontos dispersos de
maneira que não definam nenhuma configuração (neste caso não há
correlação).
Correlação linear
Positiva
Correlação linear
negativa
Correlação
curvilínea
Não há
correlação
38
- Diagrama de dispersão:
x
i
(gastos) y
i
(vendas) x
i
y
i
x
2
y
2
1
2
3
4
5
6
7
8
2,2
3,0
2,8
3,4
3,7
3,5
3,6
3,8
¿ =
i
x ¿ =
i
y ¿ =
i i
y x
¿ =
2
i
x ¿ =
2
i
y
r =
¿ ¿ ¿ ¿
¿ ¿ ¿
÷ ÷
÷
] ) y ( y n ].[ ) x ( x n [
) y ).( x ( y x n
2
i
2
i
2
i
2
i
i i i i
¬ r =
10 20 30 40 50
Custos - y
i
110 215 295 400 490
a) Faça um gráfico de dispersão; b)Analisando o gráfico, existe correlação
linear entre as variáveis?
c) Caso positivo, calcule a medida de correlação de Pearson entre a
quantidade e o custo;
b =
¿
¿
¿
¿ ¿
÷
÷
n
) x (
x
n
y x
y x
2
i 2
i
i i
i i
e a =
n
x
. b
n
y
i i ¿ ¿
÷ ou a = X . b Y÷
41
(
y
)
e
m
m
i
l
h
a
r
e
s
d
e
u
n
i
d
a
d
e
s
42
43
- Transformação de variáveis:
Existem situações em que os pares de valores das variáveis X e Y,
apresentados em diagrama de dispersão, não se distribuem em torno de uma
reta. Nesses casos, pode-se experimentar transformar uma das variáveis ou
ambas as variáveis, utilizando-se da transformação logarítmica, extração da
raiz quadrada ou inversão, além de outras.
EX: Seja a tabela:
Construindo
o diagrama
de dispersão,
tem-se:
X Y
0
0,6
1,2
1,5
1,8
2,1
2,4
4,0
8,0
15,0
22,6
36,4
45,3
60,0
Construindo
o diagrama
de dispersão,
tem-se:
X logY
0
0,6
1,2
1,5
1,8
2,1
2,4
0,602
0,903
1,176
1,354
1,561
1,656
1,778
diagrama de dispersão
0,000
0,500
1,000
1,500
2,000
0 0,5 1 1,5 2 2,5 3
X
l o
g
Y
x
i
log y
i
x
i
log y
i
x
i
2
y
2
0
0,6
1,2
1,5
1,8
2,1
2,4
0,602
0,903
1,176
1,354
1,561
1,656
1,778
¿ =
i
x
¿ =
i
y log
¿ =
i i
y log x
¿ =
2
i
x ¿ =
2
i
y
Então : b =
¿
¿
¿
¿ ¿
÷
÷
n
) x (
x
n
y log x
y log x
2
i 2
i
i i
i i
¬ b =
44
a =
n
x
. b
n
y log
i i ¿ ¿
÷ ¬ a =
A reta de regressão será: log bx a yˆ + = ¬ log = yˆ
EXERCÍCIOS
1) Observa-se que um determinado produto tem o seu custo baseado na quantidade
produzida, conforme a tabela abaixo:
Quantidade (X) 10 12 14 16 18 20
Custo em reais R$(Y) 100 112 119 130 139 142
Pede-se:
a) Construa o diagrama de dispersão e verifique se há uma relação entre
as
variáveis.
b) Ajuste uma reta aos dados.
c) Trace a reta ajustada.
d) Qual é o custo para 22 unidades?
Resposta: b) y = 59.02 + 4.31 x
45