Você está na página 1de 19

Fucape Business School

Mestrado em Administração
Disciplina: Métodos Quantitativos Aplicados à Gestão
Professor: Moisés Balassiano

Análise Descritiva de Dados – GABARITO

1. “Guerra das Colas” é o termo popular utilizado para designar a competição entre
Coca-Cola e Pepsi-Cola, na forma levada a efeito pelas campanhas publicitárias.
Suponha que, como parte de uma campanha mercadológica a ser lançada por uma
delas, 1.000 consumidores foram selecionados, dentre as pessoas que bebem pelo
menos uma cola diariamente, para constituir uma amostra. A cada um deles foi
realizado um “blind taste test”, ou seja, um teste de sabor no qual as marcas
foram substituídas por nomes falsos (A e B), e o consumidor deveria identificar a
marca da cola e a preferência entre as duas experimentadas: A ou B.

a) Descreva a população do estudo;

Recordando: população é o conjunto de todos os elementos que constituem a


abrangência do estudo. No caso, é o conjunto de todas as pessoas que bebem
pelo menos um refrigerante do tipo cola diariamente.

b) Descreva a(s) variável(eis) do estudo e classifique-a(s) quanto ao nível de


mensuração;
Recordando: variável é uma característica, ou propriedade, que se deseja
investigar. No caso, queremos investigar duas características:
 Marca do refrigerante consumido (QUALITATIVA NOMINAL)
 Preferência entre as duas marcas (QUALITATIVA ORDINAL)

c) Descreva a amostra;

Recordando: amostra é um subconjunto da população. No caso ela foi


constituída por 1.000 consumidores selecionados dentre as pessoas que
bebem pelo menos uma cola diariamente.

d) Cite, em uma frase, uma possível inferência a ser feita com os resultados.

Recordando: inferência é o processo de generalizar na população alguns


resultados obtidos em uma amostra. No caso poderíamos fazer as seguintes
inferências, com base em resultados imaginários da amostra:
 A marca A é mais reconhecida pelas pessoas que bebem
refrigerantes do tipo cola por ter sido reconhecida por um
percentual maior de pessoas da amostra; ou
 A marca B tem a preferência dos consumidores deste tipo de
refrigerante porque na amostra foi a que teve maior percentual
de aceitação (ou recebeu maior número de pontos, dependendo de
como a preferência foi medida).

1
2. Indústrias, em geral, e fábricas do setor químico, em particular, descarregam nos
rios, invariavelmente, materiais tóxicos, como DDT, sem o devido tratamento
prévio. Quando descarregadas em rios, essas toxinas afetam plantios e animais
que dependem da água dos rios para sobreviver. O órgão responsável por
monitorar a qualidade da água dos rios de uma certa região conduziu um estudo
em quatro afluentes do rio Paraíba. Três tipos de peixes foram encontrados e
cinqüenta de cada tipo foram capturados em cada afluente para terem as
características abaixo medidas e anotadas:

• Nome do afluente onde o peixe foi capturado


• Espécie do peixe
• Comprimento do peixe (cm)
• Peso do peixe (g)
• Concentração de DDT encontrada (partes por milhão)

a) Descreva a população do estudo;

A população é constituída por todos os peixes que habitam os quatro


afluentes do Rio Paraíba considerados na investigação. No caso eles podem
ser classificados pelos três tipos encontrados naqueles rios.

b) Descreva as variáveis do estudo e classifique-as quanto ao nível de


mensuração;

Nome do afluente onde o peixe foi capturado  qualitativa nominal


Espécie do peixe  qualitativa nominal
Comprimento do peixe (cm)  quantitativa de razão (contínua)
Peso do peixe (g)  quantitativa de razão (contínua)
Concentração de DDT (partes por milhões)  quantitativa de razão (contínua)

c) Defina um critério e transforme cada variável quantitativa em qualitativa


ordinal com três categorias cada.

Comprimento do peixe  pequeno sempre que o tamanho for inferior a x cm


médio quando o tamanho estiver entre x e y cm; e
grande, quando for maior do que y cm.

Peso  leve sempre que o peso for inferior a x g


médio quando o peso estiver entre x e y g; e
pesado, quando for superior a y g.

Concentração  baixa sempre que a concentração for inferior a x partes


por milhões
regular quando estiver entre x e y partes por milhões
elevada quando for maior do que y partes por milhões.

d) Descreva a amostra;
A amostra foi constituída pelos 600 peixes capturados, 150 distribuídos pelos
3 tipos em cada um dos quatro afluentes.

2
e) Cite, em uma frase, uma possível inferência a ser feita com os resultados.
“De acordo com a amostra pesquisada, os peixes dos afluentes A, B e C
apresentaram elevado grau de concentração de DDT, fazendo crer que esses
três afluentes encontram-se em situação de alto nível de poluição química. O
afluente D, por sua vez, encontra-se em situação regular em função dos níveis
médios de concentração de DDT encontrados nos três tipos de peixes
provenientes daquele rio.”

3. Vilfredo Pareto (1843-1923), foi um economista italiano que descobriu que 80%
da riqueza dos paises estava concentrada nas mãos de cerca de 20% da
população. Mais tarde, esta descoberta veio a ser aplicada a outras áreas das
ciências sociais. Na administração de empresas, por exemplo, nota-se que
aproximadamente 80% das vendas são realizadas para aproximadamente 20% dos
clientes, cerca de 80% das reclamações são devidas a cerca de 20% dos itens
alvos de reclamações, e aproximadamente 80% dos itens defeituosos, num
processo de fabricação, são devidos a aproximadamente 20% dos possíveis
problemas. Esses exemplos ilustram a idéia subjacente ao princípio de Pareto e
constitui uma importante ferramenta de gestão, usada para permitir concentrar
maior atenção sobre aspectos mais importantes de processos. Para se construir
um diagrama de Pareto é necessário que se disponha os itens (categorias) em
ordem decrescente das freqüências para, em seguida, acumular essas freqüências
para verificar a relação entre as categorias, no âmbito do processo como um
todo. Vamos a uma aplicação. Você é um empresário e quer se estabelecer em um
país da Ásia. Como parte do seu planejamento você contrata uma empresa para
investigar as maiores preocupações dos empresários locais. Uma amostra de 402
empresários locais foi selecionada e cada entrevistado deveria indicar sua maior
preocupação, dentre um elenco de possíveis problemas apresentados (respostas
induzidas). O resultado encontra-se no quadro abaixo.

Preocupação maior Freq. Preocupação maior Freq.


Infra-estrutura de comunicação 8 Mão de obra 11
Proteção ambiental 13 Segurança pessoal 2
Serviços financeiros 14 Preços de imóveis 82
Eficiência governamental 30 Proteção predial 4
Inflação 233 Abastecimento de água 5

a) Construa um diagrama de Pareto para as dez categorias.


Para a construção do diagrama de Pareto é necessário que se faça uma tabela com
as categorias na ordem decrescente das freqüências. A partir dessa tabela é
elaborado o gráfico de barras, no sentido vertical, e uma linha acompanha as
freqüências acumuladas. Note que a inflexão da linha se verifica na categoria com
segunda maior freqüência.

Preocupação maior Freq. Preocupação maior Freq.


Inflação 233 Mão de obra 11
Preços de imóveis 82 Infra-estrutura de comunicação 8
Eficiência governamental 30 Abastecimento de água 5

3
Serviços financeiros 14 Proteção predial 4
Proteção ambiental 13 Segurança pessoal 2

500

Percent
400 100

300

Frequencia
233
200 50

100

82

30
0 0
In

Pr

Ef

Se

Pr

In

Ab

Pr

Se
fla

ão

fra
ic

ot

ote
rv

as

gu


çã

os

de

te

ra
çã
nc

os

ão
o

om

cim


do

o
ia

O
Fin

Am

Pr

a
br

un
s

en

Pe
Im

ed
ov

an

ic
b ie

to

ss
óv

er

ia
ce

de
nt

l
na

õe

oa
e is

iro

al

Ág
m

l
s
e

u
Problemas que Mais Preocupam

b) De acordo com o seu diagrama de Pareto, quais são os fatores revelados como
os mais preocupantes na visão dos empresários locais?

Recordando: o Diagrama de Pareto serve para identificar os fatores que mais


contribuem para um determinado problema. De acordo com Pareto,
geralmente 80% dos problemas decorrem de 20% dos casos. Nesse caso,
Inflação e Preço dos Imóveis representam 20% dos tipos dos problemas
levantados (2 em 10) e são responsáveis por 315 respostas, equivalendo a
78,36% do total. Logo o Princípio de Pareto se aplica de modo aproximado.
Conclusão: esses dois problemas deverão receber sua maior atenção na hora
de decidir em se estabelecer naquela região. A linha superior representa as
freqüências relativas acumuladas.

c) Nesse caso, podemos concluir que o princípio de Pareto se aplica? Justifique a


sua resposta.

De acordo com a resposta acima, o princípio de Pareto se aplica de modo


aproximado.

4. Uma variação do princípio de Pareto é a chamada curva ABC. Esta importante


técnica de gestão permite identificar os itens mais importantes para serem
considerados no cotidiano da empresa, discriminando daqueles que são menos
significativos em termos de valor, permitindo uma gestão mais eficiente e focada.
A técnica consiste em ordenar decrescentemente, como na curva de Pareto, as
freqüências com que cada item é considerado e dividir a distribuição em três
partes. A primeira parte da curva (parte A) representa o grupo de itens mais
importantes, que devem ser tratados com prioridade. A segunda (parte B) é o
grupo de itens com grau de importância mais reduzido, enquanto que a terceira
(parte C) representa o grupo de itens que não justificam grande atenção.
Considere a tabela abaixo contendo os itens de uma clínica ambulatorial de um
hospital.

4
ITEM R$/unidade Consumo Mensal Valor Total
Seringa 2,00 15.000 30.000
Gaze 3,50 2.000 7.000
Algodão 2,00 2.500 5.000
Esparadrapo 1,80 2.500 4.500
Soro 5,00 8.000 40.000
Luvas 0,50 20.000 10.000
Éter 4,20 500 2.100
Álcool 2,00 750 1.500
AAS 16,00 5.000 80.000
A. Oxigenada 1,00 600 600

O gráfico de Pareto associado ao valor total consumido é apresentado abaixo para


facilitar o seu processo de decisão.

200000

Percent
100
VALOR TOTAL CONSUMIDO (R$)

100000

50

80000

40000

30000

10000
0 0

AAS Seringa Gaze Esparadrapo Álcool


Soro Luvas Algodão Éter A. Oxigenada

Material

Defina, de acordo com o seu melhor juízo, a melhor distribuição dos itens que
deveria fazer parte dos três grupos de uma curva ABC associada.

Resolução: Para fazer a separação dos grupos A, B e C, vamos considerar a


distribuição fornecida na ordem decrescente do valor total consumido e
adicionamos uma coluna para o percentual acumulado de cada item no valor total.

ITEM Valor Total Valor Total Valor Total


Acumulado Acumulado %
AAS 80.000 80.000 44,27
Soro 40.000 120.000 66,41
Seringa 30.000 150.000 83,01
Luvas 10.000 160.000 88,54
Gaze 7.000 167.000 92,42
Algodão 5.000 172.000 95,19
Esparadrapo 4.500 176.500 97,68
Éter 2.100 178.600 98,84
Álcool 1.500 180.100 99,67
A. Oxigenada 600 180.700 100,00

Pelos valores da tabela acima, 3 dos 10 itens (AAS, Soro e Seringa), são
responsáveis por 83,01% do valor total consumido pelo hospital. Esses três itens
estariam na parte A da curva. Atenção e controle sobre esses dois itens podem

5
representar um maior índice de economia nos gastos com materiais. Os quatro
itens seguintes (Luvas, Gaze, Algodão e Esparadrapo) respondem por 14,67% do
valor consumido, ficando na faixa B da curva. Portanto, certo controle deve ser
exercido sobre esses itens. Finalmente os demais produtos (Éter, Álcool e Água
Oxigenada), ficariam na parte C da curva, com um percentual de 2,32% do gasto
total recaindo sobre eles, o que não demanda maiores esforços no seu controle
em função do menor peso da sua participação no gasto total.

5. Considere a amostra de 24 empregados de uma empresa, distribuídos de acordo


com seus salários mensais e sexo.

Unidade Salário Sexo Unidade Salário Sexo Unidade Salário Sexo


Abel 1650 M Helio 1740 M Orlando 2140 M
Botelho 1750 M Iracema 2125 F Paula 2000 F
Cristina 1850 F João 1720 M Quirino 1560 M
Djalma 1500 M José 1680 M Raul 1650 M
Eduardo 1555 M Luiz 1200 M Silvana 1580 F
Fernando 1510 M Maria 1700 F Tatiana 1450 F
Gustavo 1690 M Nilo 1980 M Uriel 1520 M
Gabriel 1760 M Nicanor 2110 M William 1380 M

a) Represente os dados acima por meio de uma tabela de freqüência para a


variável sexo e outra por classe de valores para salários;

Distribuição de Freqüências dos Empregados por Sexo

Sexo Freq. Percent.


Masculino 18 75
Feminino 6 25
Total 24 100

No caso dos salários, como a amostra é de apenas 24 empregados, é melhor


trabalhar com poucas classes. Pela regra da raiz quadrada do tamanho da amostra
deveríamos trabalhar com 4 ou 5 classes, mas como poderíamos ficar com baixa
freqüência em alguma classe, optamos por trabalhar com 3 classes e uma amplitude
de R$400,00 para cada classe. A distribuição de freqüência seria então:

Distribuição dos Empregados por Classe de Salários


Classe de Salário Freqüência Percentagem
1.000 a 1.400 2 8,33
1.401 a 1.800 16 66,67
1.801 a 2.200 6 25,00
Total 24 100,00

6
b) Represente graficamente cada uma das duas variáveis estudadas;

Distribuição dos empregados por Sexo


Feminino
6 / 25%

Masculino

18 / 75%

Representação gráfica da variável Salário (quantitativa).

Histograma dos Salários dos Empregados


20

10

Std. Dev = 240,04


Mean = 1700,0

0 N = 24,00
1200,0 1600,0 2000,0

Salário

c) Qual é a medida estatística mais apropriada para a variável sexo? Por quê?

Por se tratar de uma variável qualitativa, qualquer medida baseada nas


freqüências é adequada para se analisar a variável Sexo (a Moda, por
exemplo).

d) Com o auxílio de uma calculadora obtenha, a partir da sua distribuição de


freqüências por classes de valores, as seguintes medidas para a variável
salários:
i. Média;
ii. Desvio Padrão
iii. Coeficiente de Variação

7
3

∑X
i =1
i fi
40.000
(i) X = 3
= = 1.666,67
24
∑f
i =1
i

∑ (X − X ) f
3
2
i i
i =1 1.173.333,33
(ii) S = 3
= = 51.014,49 = 225,86
23
∑f −1
i =1
i

225,86
(iii) CV = = 0,1355 = 13,55%
1.666,67

e) Compare as medidas acima com as obtidas a partir dos valores


efetivamente observados na amostra (use calculadora para a obtenção
das medidas na amostra);

O quadro abaixo resume as medidas calculadas de acordo com os dois


processos:
Amostra Distr. de Freq
Média 1.700,00 1.666,67
Desvio 240,04 225,86
CV 0,1412 0,1355

f) A média dos salários é uma medida representativa da distribuição? Por


quê?

A média aritmética pode ser considerada uma medida representativa da


distribuição face à baixa variabilidade, expressa pelo coeficiente de variação
(menor do que 20%) e coeficiente de assimetria (0,28).

g) Com base nos valores efetivamente observados, esboce um Box Plot para
os salários dos empregados do sexo masculino e outro para os do sexo
feminino. Comente. Você identifica algum outlier aparente?

Categorizando a variável Salários para cada categoria da variável Sexo, obtemos


os Box Plots abaixo. Note que há 2 observações outliers acima do 3o. Quartil para
os salários dos homens. Os gráficos sugerem, ainda, uma distribuição de salários
mais elevados para as mulheres do que para os homens.

8
2400

2200
17
16

2000

1800

Salário
1600

1400

1200

1000
N= 18 6

Masculino Feminino

Sexo

Interessante notar que se o gráfico tivesse sido construído sem a categorização


dos Salários pela variável Sexo, embora o gráfico não mostre, há um salário
outlier de $2.140, quando o LTS é igual a $2.137.

2400

2200

2000

1800

1600

1400

1200

1000
N= 24

Salário

6. Um novo tipo de CD com capacidade para ler e gravar e re-gravar arquivos está
sendo vendido nas lojas. Uma amostra de 17 lojas forneceu os preços cobrados
pelo CD de acordo com a distribuição abaixo:

Loja Preço (R$) Loja Preço (R$) Loja Preço (R$)


1 5 7 8 13 4
2 11 8 6 14 5
3 19 9 4 15 5
4 6 10 4 16 3
5 6 11 5 17 9
6 15 12 4

9
a) Calcule o preço médio e o mediano. Qual deles é o mais representativo da
distribuição? Por quê?

De acordo com as medidas fornecidas pelo Excel, o preço médio do CD foi de


R$7,00 e o mediano R$5,00. Como o coeficiente de variação foi elevado,
0,6186 (61,86%), concluímos que há uma grande variabilidade nos valores da
amostra, e como a distribuição não pode ser considerada homogênea, o preço
mediano, insensível aos preços mais elevados praticados por algumas lojas, é o
mais indicado para representar a distribuição dos valores.

Preço (R$)
Média 7
Mediana 5
Moda 5
Desvio padrão 4,33
Assimetria 1,84
Intervalo 16
Mínimo 3
Máximo 19
1o. Quartil 4
3o. Quartil 8
Contagem 17

b) Há indicações de existência de outlier nos preços praticados pelas lojas


constantes dessa amostra?

O desvio quartílico é igual a R$4 (Q3 – Q1), logo dq = 1,5 x 4 = 6. Não há valor
que diste R$6 abaixo do 1o. Quartil (mesmo porque tal valor seria negativo!),
mas há duas lojas com preços maiores do que o limite de R$6 acima do 3o.
Quartil: R$15 (loja 6) e R$19 (loja 3). Esses dois valores podem ser
considerados outliers.
O Box Plot abaixo permite uma visualização da distribuição dos preços.

30

20
3

10

0
N= 17

PREÇO

10
7. Ana e Carol estão disputando uma indicação para representar a Universidade na
corrida dos 100 m nos próximos jogos. O técnico irá decidir quem será a indicada
com base nos resultados de cinco provas realizadas com intervalos de 20 minutos
entre elas. Os tempos das atletas, em segundos encontra-se abaixo:

Atleta Corrida
1 2 3 4 5
Ana 12,1 12,0 12,0 16,8 12,1
Carol 12,3 12,4 12,4 12,5 12,4

Com base nesses tempos:


a) Qual das duas corredoras foi mais consistente? Por quê?

Considerando as cinco corridas, Ana teve um tempo médio de 13 s com dispersão de


2,12 s enquanto Carol teve um desempenho médio de 12,4 s com dispersão de 0,07 s.
Como os tempos de Carol tiveram um coeficiente de variação inferior (0,0057) ao de
Ana (0,1635), concluímos que aquela foi mais consistente do que esta.

b) Qual das duas corredoras deverá ser a indicada? Por quê?

De acordo com os tempos médios, Carol deveria ser a escolhida, pois registrou tempo
inferior ao da colega, considerando as cinco corridas.

c) A seleção teria sido diferente se o treinador soubesse que Ana escorregou na


largada da 4a. Corrida? Por quê?

A informação que Ana escorregou na largada da quarta corrida deveria anular o


tempo desta corrida. Fazendo assim, Ana não apenas passaria a ter tempo médio
inferior (12,05 s) como se tornaria mais consistente do que Carol, com coeficiente de
variação de 0,0048. Desta forma, considerando apenas as quatro corridas sem
incidentes de Ana, ela seria a indicada.

8. A seqüência de gráficos abaixo apresenta a evolução do percentual de empresas,


dentre as 500 maiores no Estados Unidos (US) e 200 na Inglaterra (UK), em
função da sua estrutura entre o período de 1950 a 1980.

1950 1960 1970 1980

UK

11
1950 1960 1970 1980

US

De acordo com os gráficos acima a categoria A refere-se às empresas com uma


única atividade, B àquelas cuja atividade principal representa pelo menos 70% do
faturamento global, C às que diversificaram suas atividades nos últimos dez anos
e D os grupos conglomerados. Descreva a evolução estrutural das empresas
revelada pelos gráficos.

De um modo geral, observa-se, pelos gráficos, que as empresas com atividade única,
A, tendem a desaparecer do cenário, tanto no Reino Unido como nos Estados Unidos
(neste último já não existia em 1980). Nesse período, as empresas com grande
concentração nas atividades principais, B, também diminuíram a participação relativa
no mercado, nos dois países. No entanto, a participação das empresas que
diversificam suas atividades, C, cresceu, bem como a dos grupos aglomerados, D,
embora em ritmo diferente.

9. Uma das maiores preocupações da indústria de peças e equipamentos é a entrega


de um pedido no prazo acordado. A incapacidade de se cumprir prazos pode levar
os fabricantes a perdas elevadas que variam de multas contratuais até a perda do
cliente. Ao mesmo tempo, antes de aceitar a encomenda, o fabricante deve ter
em conta o tempo que será necessário para o processamento do pedido. Logo, o
fabricante deve conhecer a relação entre o tempo de produção por unidade e o
número de unidades encomendadas. A curva que caracteriza essa relação é
chamada Curva de Aprendizado (Learning Curve). Um fator importante que
influencia essa curva é a mão de obra alocada na produção das peças. Desconfia-
se que na medida em que os operários executam a mesma tarefa repetidamente o
tempo para a execução diminui. Esta informação é importante para se designar os
operários que deverão ser alocados em determinados processos de produção. Uma
amostra de 25 operários foi selecionada e o tempo para a execução de uma
tarefa intermediária no processo de produção foi anotado após a 10a, 30a e 50a.
vez que a mesma tarefa foi executada (em minutos). Os dados encontram-se no
quadro abaixo.

12
Operário T10 T30 T50 Operário T10 T30 T50 Operário T10 T30 T50
1 15 16 10 10 14 15 6 19 18 20 6
2 21 10 5 11 18 10 8 20 17 7 5
3 30 12 7 12 25 11 14 21 16 6 6
4 17 9 9 13 23 9 9 22 20 9 4
5 18 7 8 14 19 11 8 23 22 10 15
6 22 11 11 15 20 10 10 24 19 10 7
7 33 8 12 16 22 13 8 25 24 11 20
8 41 9 9 17 20 12 7
9 10 5 7 18 19 8 8

a) Construa um histograma para cada distribuição de tempo (T10, T30 e T5) com sete
classes de valores com amplitudes constantes e iguais a cinco minutos para cada
distribuição (os intervalos podem ser diferentes entre as distribuições, mas o
número de classes deve permanecer igual a sete). Compare os histogramas e avalie
a hipótese de que o tempo para a realização de uma tarefa diminui com a freqüência
com que a tarefa é repetidamente realizada. Explique com suas palavras como se
observa essa diminuição (é linear, diminui mais para um tempo do que para outro,
etc...);

Tempo após 10 repetições Tempo após 30 repetições


14 14

12 12

10 10

8
Frequencia

8
Frequencia

6 6

4 4

2 2

0 0

5,0 10,0 15,0 20,0 25,0 30,0 35,0 40,0 5,0 7,5 10,0 12,5 15,0 17,5 20,0

Intervalos de Tempo Intervalos de Tempo

Comparando o histograma referente à distribuição dos tempos após 30 repetições com


os de 10 repetições, acima, notamos um deslocamento do gráfico para a esquerda no
eixo dos tempos, o que significa uma redução no tempo para o desempenho da tarefa
após 30 repetições, quando comparado com os tempos após 10 repetições. No entanto,
comparando os histogramas referentes aos tempos após 30 repetições com os após 50
repetições, abaixo, notamos que não há deslocamento da distribuição ao longo do eixo
dos tempos, mas os tempos estão mais concentrados para a esquerda (valores menores)
na distribuição dos tempos após 50 repetições. Isso significa que os tempos diminuem,
porém não tanto quanto diminuem entre a décima e a trigésima repetição.
Logo a redução dos tempos é maior no início da realização de uma determinada tarefa,
mas diminui na medida em que a freqüência das tarefas aumenta, até chegar ao ponto
em que o tempo se manterá constante (ou seja, redução nula).

13
Tempo após 30 repetições Tempo após 50 repetições
10
14

12

10

6
8
Frequencia

Frequencia
6
4

0 0

5,0 7,5 10,0 12,5 15,0 17,5 20,0 5,0 7,5 10,0 12,5 15,0 17,5 20,0

Intervalos de Tempo Intervalos de Tempo

b) Avalie e conclua sobre a hipótese inicial do estudo, agora à luz das medidas de
posição calculadas diretamente a partir dos valores de cada distribuição. Você
mudaria de opinião com relação ao item anterior, ou a confirmaria?

medidas T10 T30 T50


Média 21 10 9
Mediana 20 10 8
Moda 18 10 8

Os histogramas construídos para os tempos nas três ocasiões mostraram uma


diminuição maior nos tempos entre a 10a. e a 30a. repetição da tarefa do que
entre a 30a. e 50a. repetição. As medidas de posição acima confirmam aquela
conclusão. Tanto os tempos médios como os medianos e modais caíram à metade
(em torno de 10’) entre a 10a. e 30a. repetição, mas no máximo dois minutos entre
a 30a. e 50a. repetição. Eu confirmaria a minha conclusão do item anterior.

c) Expresse a diferença entre o significado do valor médio e o do mediano. Essa


diferença conceitual acarreta alguma implicação na prática, com base nesta
amostra?

O tempo médio para a execução das tarefas representa uma medida geral, de todos
os tempos obtidos na amostra. É uma medida não necessariamente observada de fato,
mas expressa o valor central da distribuição, ou seja, um ponto de equilíbrio das
observações. O tempo mediano é o tempo do empregado posicionado no centro da
distribuição. Note que a média é o valor central da distribuição dos tempos,
enquanto a mediana é o tempo do empregado posicionado no centro da distribuição
dos tempos. Confuso? Parece, mas não é. Leia novamente e perceba que a média é
calculada diretamente a partir dos tempos, sem levar em conta a posição dos
empregados, enquanto a mediana é obtida a partir da identificação do empregado
cujo tempo separa a distribuição metade acima e metade abaixo desse valor. Por isso
é que a média é sensível a valores afastados (extremos), ao passo que a mediana é
mais influenciada pelas freqüências, isto é, a ocorrência de um valor muito afastado
dos demais tende a “puxar” a média para o seu sentido, mas acarreta apenas uma
possível alteração no posicionamento do empregado com o tempo situado no centro da
distribuição. Logo, é o posicionamento das unidades (no caso os empregados) é que vai
alterar o valor mediano, não o valor do tempo em si.

14
d) Como você utilizaria o resultado modal nesse estudo?

Sendo o valor de maior freqüência, as modas, indicam a tendência da maioria dos


empregados. Serve para uma caracterização geral da amostra, isto é, estabelecer o
perfil da amostra. Para as três distribuições da nossa amostra, como esses valores
estão próximos das médias e medianas, podemos analisar a moda da mesma forma
como fizemos com aqueles parâmetros.

10. Geralmente, quanto mais atrativo for o papel de uma companhia para o investidor,
maior será o valor da razão P/L (Preço/Lucro) deste papel. Na verdade, se os
investidores esperam que uma ação irá valorizar, isso acaba por fazer com que ela
realmente aumente, levando a um aumento do seu P/L. Podemos dizer, então, que
a razão P/L de um papel é função não apenas da performance da empresa, mas
também da expectativa dos investidores quanto aos valores futuros daquela ação.
Papeis de empresas individuais e de conglomerados podem ter diferente
comportamento na Bolsa de Valores. A razão P/L de 20 empresas individuais e 20
conglomerados no último dia do mês passado permitiu a construção dos
respectivos histogramas e apresentou as medidas estatísticas abaixo:

R az ão P/L Razão P/L

Empres as Indiv iduais Conglomerados


7 8

6
5
Frequência

4
Fre q u ê n c i a

2
2

0 0

1 0 ,0 2 0 ,0 3 0 ,0 4 0 ,0 5 0 ,0 6 0 ,0 7 0 ,0 0,0 5,0 10,0 15,0 20,0 25 ,0 30,0 35,0 40,0 45,0 50,0

Ra z ã o P/ L Razão P/L

Medidas Razão P/L


Estatísticas Individuais Conglomerados
Média 27 13
Mediana 17 12
Moda 16 16

a) Compare as distribuições das razões P/L pelos histogramas dos dois tipos de
empresas;

Trata-se de dois histogramas com formas bem diferentes. O das empresas


individuais apresenta uma distribuição mais uniforme, enquanto o dos
conglomerados apresenta uma distribuição mais diferenciada das razões. O
que ambas têm em comum é o fato de apresentarem firmas com valores
excessivamente altos em comparação com os demais valores dos respectivos
grupos. Dois P/L das empresas individuais e um nos conglomerados revelam
que as médias estão influenciadas por aqueles valores. Não obstante,
observando as escalas notamos que o histograma das empresas individuais
está posicionado à direita do histograma dos conglomerados, o que sugere que
as razões P/L daquelas empresas são maiores.

15
b) Utilize agora as medidas estatísticas de posição para enriquecer e validar a
análise realizada no item anterior.

Levando-se em consideração o valor médio dos P/L, podemos dizer que as


empresas individuais representaram mais do que o dobro do valor dos
conglomerados, indicando maior atratividade, na média. O P/L mediano para os
dois grupos ainda favoreceu as empresas individuais, porém sem a mesma
intensidade. Comparando as razões P/L dominantes para as empresas dois
grupos, observamos que ambas tiveram o mesmo resultado (P/L = 16).

c) Na sua opinião, a que se deve o fato de a distribuição das empresas


individuais ter apresentado o P/L médio bem acima dos conglomerados,
quando os valores medianos apresentaram menor diferença e as modas serem
iguais?

Isso pode ser atribuído ao fato de as empresas individuas terem duas firmas
com P/L bem mais elevado do que o único P/L extremo observado para os
conglomerados. Ou seja, os valores extremos para as empresas individuais são
maiores em grandeza (valor) e intensidade (freqüência).

d) Pelo Histograma, notou-se a existência de duas empresas individuais que


apresentavam razões P/L iguais a 69 e 74, muito acima dos demais valores da
distribuição. Da mesma forma, notou-se um conglomerado cuja razão P/L se
afastava excessivamente dos demais valores, com P/L igual a 48. Retirados
esses valores os novos Histogramas e medidas estatísticas de posição
apresentaram a conformação abaixo. Comente sobre as principais mudanças
ocorridas após o expurgo dos valores extremos das duas distribuições.
Raz ão P/L Razão P/L

Empresas Indiv iduais Conglomerados


10 7

6
Frequências

4
Frequência

3
4

0 0

1 0,0 1 5,0 20 ,0 2 5,0 3 0,0 35 ,0 4 0,0 2,5 5 ,0 7,5 10,0 12,5 1 5,0 1 7,5

Razão P/L Razão P/L

Medidas Razão P/L


Estatísticas Individuais Conglomerados
n 18 19
Média 22 11
Mediana 16,5 12
Moda 16 16

A retirada dos valores extremos veio a confirmar a análise acima. A redução no


valor do P/L médio para o grupo das empresas individuais foi maior do que a dos
conglomerados, além de alterar a dinâmica do tipo de distribuição. As medianas
não apresentaram alterações significantes e as modas não se alteraram, por

16
serem insensíveis a valores extremos. O histograma dos P/L para aquele grupo
sugere a existência de dois subgrupos de empresas individuais.

11. Com relação à distribuição das razões P/L das ações das companhias individuais e
conglomerados, apresentada acima, você irá encontrar abaixo o quadro com as
principais medidas estatísticas associadas às duas distribuições, sem o expurgo
dos valores extremos.

Medidas Razão P/L


Estatísticas Individuais Conglomerados
n 20 20
Média 27 13
Mediana 17 12
Moda 16 16
Desvio Padrão 18,34 9,61
Assimetria 1,53 2,67
Amplitude 65 46
Mínimo 9 2
Máximo 74 48

a) Qual das duas distribuições apresenta maior volatilidade na relação entre


Preço e Lucro? Por quê?

Como as médias são diferentes, devemos calcular os coeficientes de variação para


as duas distribuições. Como os conglomerados apresentaram variação relativa de
74%, superior, portanto, à variação relativa das empresas individuais, de 68%,
podemos dizer que os conglomerados possuem as razões P/L com maior nível de
volatilidade. As duas, porém, são altamente voláteis.

b) Qual medida de posição representa melhor cada distribuição? Por quê?

Dada a alta volatilidade das razões, o P/L mediano deveria ser utilizado para
representar cada uma das distribuições.

c) Que se pode dizer sobre a assimetria das distribuições? A que se deve esse
fato?

Os conglomerados apresentaram nível de assimetria superior ao das empresas


individuais. Isso se deve ao fato de que uma empresa, pertencente aos
conglomerados, possui P/L bem superior às demais, com isso, ela está muito mais
afastada das outras, representando um valor extremamente influente.

d) Ao se retirar os valores extremos das duas distribuições, notamos profundas


diferenças nas medidas e na forma das distribuições. Observe os novos
valores das medidas estatísticas e comente sobre as principais mudanças
verificadas nas medidas de variação e de forma. Utilize os Histogramas para
melhor visualização das distribuições.

17
Medidas Razão P/L
Estatísticas IndividuaisConglomerados
n 18 19
Média 22 11
Mediana 16,5 12
Moda 16 16
Desvio Padrão 10,6 4,9
Assimetria 0,62 -0,43
Amplitude 30 16
Mínimo 9 2
Máximo 39 18

A retirada dos valores extremos das duas distribuições fez com que a medida da
variação relativa dos P/L dos conglomerados (44%) ficasse inferior ao das
empresas individuais (48%), alterando a análise da volatilidade comparada entre
os dois grupos. Do mesmo modo, a medida de assimetria associada a cada
distribuição teve significativa redução. A assimetria dos conglomerados, inclusive,
passa a ter uma assimetria negativa, em contraposição com a forte assimetria
positiva apresentada na distribuição anterior. Isso significa que o impacto da
retirada do P/L extremo observado para os conglomerados teve impacto maior
nas medidas de variação e forma do que a retirada das duas empresas individuais
na mesma situação.

e) O quadro abaixo incorpora às medidas apresentadas anteriormente, o valor


dos quartis das distribuições das razões P/L para as companhias individuais e
os conglomerados. Esboce os gráficos Box Plot associados a cada distribuição
e verifique a existência de possíveis outliers.

Medidas Razão P/L


Estatísticas Individuais Conglomerados
n 18 19
Média 21,78 10,84
Mediana 16,5 12
Moda 16 16
Desvio Padrão 10,64 4,96
Assimetria 0,62 -0,43
Amplitude 30 16
Mínimo 9 2
Máximo 39 18
Percentis – Q1 13,75 6
Q2 16,5 12
Q3 33,75 16
Desv. Quartílico 20 10
1,5 dq 30 15
Lim Teórico Inf -16,25 -9
Lim Teórico Sup 63,75 31

Foram incorporados ao quadro das medidas, os elementos necessários ao esboço


dos Box Plots. Recordando, o desvio interquartílico é a diferença entre o terceiro e o
primeiro quartil, e com base nele calculamos os valores a partir dos quais são

18
estabelecidos os limites teóricos, ou seja, 1,5.dq. Calculamos o limite teórico inferior
subtraindo 1,5.dq de Q1, e o limite teórico superior adicionando o mesmo valor ao Q3.
Note que em nenhuma distribuição os valores máximos e mínimos excedem os
respectivos limites teóricos o que nos leva a concluir que não existe qualquer
candidato a outlier. Fica como prática a construção dos respectivos Box Plots.

12. Padronize os valores dos salários da amostra dos 24 empregados do Exercício 5


e:

a) Com base nos valores padronizados avalie a existência de outlier, considerada


como tal a observação que estiver 3 unidades de desvios acima ou abaixo da
média;

Os valores dos salários padronizados variaram entre –2,08 e 1,83, não


apresentando qualquer salários que se afastasse mais do que 3 unidades de desvio
da média.

b) Re-escalone os valores padronizados de modo a se obter uma distribuição com


média 10 e desvio padrão 2;

Os valores re-escalonados encontram-se na tabela abaixo

Unidade Salário Reesc Unidade Salário Reesc Unidade Salário Reesc


Abel 1650 9,58 Helio 1740 10,33 Orlando 2140 13,67
Botelho 1750 10,42 Iracema 2125 13,54 Paula 2000 12,50
Cristina 1850 11,25 João 1720 10,17 Quirino 1560 8,83
Djalma 1500 8,33 José 1680 9,83 Raul 1650 9,58
Eduardo 1555 8,79 Luiz 1200 5,83 Silvana 1580 9,00
Fernando 1510 8,42 Maria 1700 10,00 Tatiana 1450 7,92
Gustavo 1690 9,92 Nilo 1980 12,33 Uriel 1520 8,50
Gabriel 1760 10,50 Nicanor 2110 13,42 William 1380 7,33

c) Esboce o histograma para os valores padronizados e compare com o


histograma elaborado naquele exercício.

10
10

8
8
Frequency
Frequency

6
6

4 4

2 2

0 0
-2 -1 0 1 2 1200 1400 1600 1800 2000 2200
Salário Padronizado Salário

19

Você também pode gostar