Você está na página 1de 24

UNIVERSIDADE FEDERAL DO PARANÁ

SETOR DE CIÊNCIAS SOCIAIS APLICADAS


CURSO DE PÓS-GRADUAÇÃO EM DESENVOLVIMENTO ECONÔMICO

Resolução dos Exercı́cios da Disciplina de Métodos Quantitativos

– Profs. Resp. Luiz Alberto Esteves e Mauricio Vaz Lobo Bittencourt –

Rodrigo Hermont Ozon 1

Março de 2009

1
Endereço eletrônico rodrigo.ozon@ibqp.org.br Vide meu Curriculum Lattes . Erros e omissões são de
minha completa responsabilidade.
E como toda a vida humana é um grande jogo de azar!...
– Voltaire, Les délices (24 de novembro de 1755.

Ou é um Universo muito bem organizado ou um caos que se encolheu e abraçou a si mesmo, porém, em qualquer
caso, é um Universo, mesmo assim. Mas pode uma certa ordem substituir dentro de ti, enquanto se encontra a
desordem no Todo ?
– As meditações de Marco Aurélio, IV:27 (Século II)
Sumário
1 Questão 1 4
1.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 (d ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 (e) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Questão 2 7
2.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.4 (d ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.5 (e) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.6 (f ) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.7 (g) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

3 Questão 3 15
3.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.4 (d) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

4 Questão 4 16

5 Questão 5 16
5.1 (a) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
5.2 (b) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
5.3 (c) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

6 Questão 6 20

7 Questão 7 20

8 Questão 8 20

9 Questão 9 21

10 Questão 10 22
4

Observação: A planilha Excel com os cálculos desenvolvidos encontram-se aqui.

1 Questão 1
Dada a amostra:
18
15
20
19
19
18
16
17
20
18
16
15
17
19
18
17
16
18
17
19

1.1 (a)
Construa a distribuição de freqüências
Resposta:

“Uma distribuição de frequência é uma tabela resumida na qual os dados são organizados em grupos
de classe ou categorias convenientemente estabelecidas e numericamente ordenadas.” Levine, Berenson
e Stephan, 2000 p. 60 [4]
Como explicam os autores, ao desenvolver a tabela de distribuição de frequência, é desejável
que cada grupo de classe tenha largura de intervalo igual. Para determinar a largura do intervalo
de cada classe, a área de dados2 é dividida pelo número de classes desejado:

intervalo
Largura do intervalo ≈ (1)
número de grupos de classe desejado

Uma vez que existem somente 20 observações, decidimos que 6 grupos de classe seriam
suficientes3 . Através do cálculo da amplitude dada por Xmaior − Xmenor que é igual a 5 e de
(1) a largura de cada intervalo de classe será aproximadamente igual a:
5
Largura do intervalo ≈ ≈ 0, 94 ou então 1
5, 29

Deste modo construı́mos a tabela de distribuição de frequências para a amostra:

2
intervalo=amplitude total
3
Quando se considera intervalos de classe de igual amplitude, o número de classes é obtido através da Regra
de Surges dada por: k = 1 + 3, 3 log10 n, onde k = número de classe e n = número total de observações Cancho
(2004, p. 13) [1]. Desta forma, para a amostra obtemos k = 1 + 3, 3 log10 20 = 5, 29 (arrendondamento para 6)
5

Xi Frequência (f (Xi ))
15 porém inferiores a 16 2
16 porém inferiores a 17 3
17 porém inferiores a 18 4
18 porém inferiores a 19 5
19 porém inferiores a 20 4
20 porém
P inferiores a 21 2
f (Xi ) ou Total 20

No entanto, como a amostra é contida de dados discretos, ou seja, “só poderem assumir um
número finito de diferentes valores de diferentes valores dentro de um intervalo finito” Hoffman (2006,
p.25) [3],não há necessidade de determinar intervalos de classe.
Deste modo, reestruturamos a tabela da seguinte forma:

Frequência
Xi (f (Xi ))
15 2
16 3
17 4
18 5
19 4
P 20 2
f (Xi ) ou Total 20

Tabela 1: Distribuição de frequência de X

1.2 (b)
Determine as freqüências relativas
Resposta:

“A distribuição de frequência relativa (...) é formada dividindo-se as frequências em cada classe


da distribuição de frequência pelo número total de observações. (Levine, Berenson e Stephan, 2000 p.
64 [4])
Deste modo, dividimos o valor de cada f (Xi ) obtidoP na tabela de distribuição de frequência
do exercı́cio anterior (vide a tabela 1.1) pelo seu total ( f (Xi )) para obtermos:

Frequência Frequência Relativa


P
Xi (f (Xi )) (frelativa = fi / fi )
15 2 0,10
16 3 0,15
17 4 0,20
18 5 0,25
19 4 0,20
P 20 2 0,10
ou Total 20 1,00

Tabela 2: Distribuição de frequências relativas de X

1.3 (c)
Determine as freqüências acumuladas
Resposta:
6

A tabela de frequências acumuladas é obtida através da tabela de distribuição de frequências


de X obtida anteriormente (tabela 1.1) somando-se cada valor de frequência pela anterior, da
seguinte maneira:

Frequência Frequência Acumulada


Xi f (Xi ) fAc. = f (Xi ) + f (Xi−1 )
15 2 2
16 3 5
17 4 9
18 5 14
19 4 18
P 20 2 20
ou Total 20 20

Tabela 3: Distribuição de frequências acumuladas de X

1.4 (d )
Determine as freqüências acumuladas relativas
Resposta:

Para a amostra disponı́vel e utilizando a tabela de frequência relativa, obtemos:

Percentagem de Xi com
Xi Valor ”Inferior a ”Indicado
(fAc. Rel. = fRelativa Xi + fRelativa Xi−1 )
15 0
16 0,10
17 0,25
18 0,45
19 0,70
P 20 0,90
ou Total 1,00

Tabela 4: Distribuição de frequências acumuladas relativas de X

1.5 (e)
A porcentagem dos valores menores que 19 e a dos maiores que 17
Resposta:

Para efetuar tais cálculos nos baseamos na tabela 1.1 de frequências de X para verificar as
condições destes valores estarem dentro de tais intervalos.
Os valores em porcentuais foram calculados da seguinte maneira:

• Se f (Xi ) for menor que 19 e 17 então calculamos Pa divisão de f (Xi ) pelo somatório de
f (Xi ), ou seja, se 17 < f (Xi ) < 19 então f (Xi )/ f (Xi ) ;

• Se f (Xi ) for menor que 19 então calculamos


P a divisão de f (Xi ) pelo somatório de f (Xi ),
ou seja, se f (Xi ) < 19 então f (Xi )/ f (Xi );

• Se f (Xi ) for maior que 17 então calculamos


P a divisão de f (Xi ) pelo somatório de f (Xi ),
ou seja, se f (Xi ) > 17 então f (Xi )/ f (Xi )
7
P P
Para 17 < f (Xi ) < 19 obtemos 25% dos valores P dentro deste intervalo, já para f (Xi ) <
19 obtemos um intervalo de valores de 70% e para f (Xi ) > 17 obtemos 55%.
A tabela a seguir resume os cálculos elaborados:

Frequência Percentagem de Percentagem de Percentagem de


Xi (f ) 17 < f (Xi ) < 19 f (Xi ) < 19 f (Xi ) > 17
15 2 0,10
16 3 0,15
17 4 0,20
18 5 0,25 0,25 0,25
19 4 0,20
20 2 0,10
P
ou Total 20 0,25 0,70 0,55

Tabela 5: Resumo para proporções de 17 < f (Xi ) < 19, f (Xi ) < 19 e f (Xi ) > 17

2 Questão 2
Considere 2 empresas que pagam os seguintes salários aos seus funcionários, em
R$:
Empresa A Empresa B
500 100
600 100
600 100
700 200
700 200
800 200
800 300
800 300
900 500
900 6000
1000
1000
1100

2.1 (a)
Calcule e interprete as medidas de tendência central (média aritmética, mediana e
moda) referentes à relação salarial de cada empresa.
Resposta:

A média aritmética que é a soma dos valores dividida pelo número de valores é calculada da
seguinte maneira:
Xn
Xi
i=1
X=
n
Sendo X = média aritmética da amostra, n = tamanho da amostra, Xi = i−ésima observação
n
X
da variável aleatória X e Xi = somatório de todos os valores de Xi na amostra.
i=1
Para a nossa amostra das 2 empresas e salários de funcionários obtemos:
8

n
X
Xi
i=1 500, 00 + 600, 00 + 600, 00 + . . . + 1100, 00
X Empresa A = = = R$ 800,00
n 13

n
X
Xi
i=1 100, 00 + 100, 00 + 100, 00 + . . . + 500, 00 + 6000, 00
X Empresa B = = = R$ 800,00
n 10
Observamos aqui que a média calculada é a mesma (R$ 800,00) para ambas as empresas
mesmo que somente a empresa A apresente três valores salariais iguais a média calculada. Além
disso, verificamos que para esse conjunto de dados, na empresa A cinco valores são menores que
a média e cinco são maiores, enquanto que para a empresa B, apesar de nenhum funcionário
receber salário igual a média, nove valores são menores que a sua média e somente um é maior.
“A média funciona como um ponto de equilı́brio de modo que as observações que são menores
equilibram aquelas que são maiores.
Note que o cálculo da média baseia-se em todas as observações (X1 , X2 , . . . , Xn ) no conjunto
de dados. Nenhuma outra medida de tendência central comumente utilizada possui essa
caracterı́stica. Uma vez que seu cálculo baseia-se em todas as observações, a média aritmética
é altamente afetada por um ou mais valores exremos. Nestes casos, a média aritmética não
seria a melhor medida a ser utilizada para descrever ou resumir tal conjunto de dados”.
Levine, Berenson e Stephan, 2000 p. 120 [4].

O cálculo da mediana que é o valor do meio de uma sequência ordenada de dados, é desen-
volvido da seguinte maneira:

“Caso não existam valores repetidos, metade das observações será menor e metade será
maior. A mediana não é afetada por qualquer observação extrema em um conjunto de dados.
Assim, sempre que uma observação extrema está presente, é apropriado utilizar a mediana
em vez de média aritmética para descrever um conjunto de dados.
Para calcular a mediana através de um conjunto de dados coletados em sua forma crua,
precisamos primeiramente posicionar os dados em uma posição ordenada. Então utilizamos
a fórmula do ponto de posicionamento

n+1
D= 2

para encontrar, na disposição ordenada, o lugar que corresponde ao valor da mediana. Uma
das seguintes regras é

• Regra 1: Se o tamanho da amostra for um número ı́mpar, a mediana é representada pelo


valor numérico correspondente ao ponto de posicionamento - (n + 1)/2 das observações
após ordenação.
• Regra 2: Se o tamanho da amostra for um número par, o ponto de posicionamento fica
entre as duas observações no meio na disposição ordenada. A mediana é a média dos
valores numéricos correspondentes àquelas observações centrais.” Levine, Berenson e
Stephan (2000, p. 122) [4]

Para a amostra de tamanho par, “a mediana é, por convenção, a média aritmética
dos dois valores centrais” Hoffman (2006, p.32) [3] e para ı́mpar “a mediana é o
valor central”.

Com a organização dos dados em ordem crescente obtemos as seguintes classificações para
ambas empresas:
9

Empresa A Empresa B
500,00 100,00
600,00 100,00
600,00 100,00
700,00 200,00
700,00 200,00
800,00 200,00
800,00 300,00
800,00 300,00
900,00 500,00
900,00 6000,00
1000,00
1000,00
1100,00

Para a empresa A como n é ı́mpar, calculamos a média de 800,00+800,00


2 = 800, 00 para
obtermos o valor da mediana, e para a empresa B como n é par, o valor da mediana, por
convenção é igual a 200,00.
A moda, ou o valor que ocorre com maior frequência para a amostra de salários da empresa
A = M1 = 800, 00 e para a empresa B = M1 = 100, 00, sendo portanto unimodais.
No entanto, como os salários se caracterizam como variável contı́nua precisamos tabular e
organizar os dados em distribuições de frequências para o cálculo das medidas de tendência
central.
Valor Frequência Frequência
PRelativa Frequência Acumulada Frequência Rel. Ac.
f (Xi ) f (Xi )/ f (Xi ) fAc. = f (Xi ) + f (Xi−1 ) fAc.Rel = fRel. Xi + fRel. Xi−1
400 porém inferiores a 600 1 0,08 1 0,08
600 porém inferiores a 800 4 0,31 5 0,38
800 porém inferiores a 1000 5 0,38 10 0,77
1000 porém inferiores a 1200 3 0,23 13 1,00
Totais 13 1 13 1,00

Tabela 6: Distribuição de Frequências completa para os salários pagos aos funcionários da Empresa A

Valor Frequência FrequênciaPRelativa Frequência Acumulada Frequência Rel. Ac.


f (Xi ) f (Xi )/ f (Xi ) fAc. = f (Xi ) + f (Xi−1 ) fAc.Rel = fRel. Xi + fRel. Xi−1
0 porém inferiores a 2000 9 0,9 9 0,9
6000 porém inferiores a 8000 1 0,1 10 1
Totais 10 1 10 1

Tabela 7: Distribuição de Frequências completa para os salários pagos aos funcionários da Empresa B

Deste modo o cálculo da média aritmética para as distribuições de frequências toma a seguinte
especificação:
k
X
Xj fj
k
j=1 1X
X= = Xj fj
k n
j=1
X
fi
j=1
10

Já a mediana, dada pela relação: Hoffman, 2006 p. 32 [3]


 
h−1
1 n X
D = Lh + − fj  (Lh+1 − Lh )
fh 2
j=q

“Onde se supõe que a classe mediana seja a h−ésima, D indica a mediana, Lh é o limite
inferior da classe mediana, Lh+1 é o limite superior
P da classe mediana, n é o número de dados
observados, fh é a frequência da classe mediana e h−1
j=1 fj é a soma das frequências das classes
inferiores à classe mediana.” Hoffman, 2006 p. 32 [3].
Todavia, não podemos encontrar a classe mediana quando a distribuição de frequências
assume intervalos de classe pares, uma vez que a fórmula acima é interpolativa.
Finalmente, se calcularmos a moda para os salários em ambas as empresas, e para isso,
primeiramente localizamos a classe modal, “que no caso de intervalos de classe terem a mesma
amplitude é aquela que apresenta a maior frequência. Se a amplitude das classes varia, a classe
modal é aquela que apresenta o maior valor para o quociente da divisão da frequência pela
amplitude do intervalo de classe.” Hoffman, 2006 p. 33 [3]
Assim, a fórmula que representa o cálculo da moda para as distribuições de frequência assume
a seguinte especificação:
fh − fh−1
M = Lh + (Lh+1 − Lh )
2fh − fh−1 − fh+1
onde: supõe-se que a classe modal seja a h−ésima, M a moda, Lh , Lh+1 e fh são respec-
tivamente, o limite inferior, o limite superior e a frequência da classe modal, e fh−1 , fh+1 são
frequências das classes vizinhas à classe modal.
Deste modo, calculamos a moda para ambas as empresas da seguinte maneira:
5−4
MEmpresa A = 800 + · 200 = 866, 66
2·5−4−3
9−1
MEmpresa B = 0 + · 2000 = 941, 17
2·9−1
Finalmente, concluı́mos resumidamente que as medidas de tendência central para os dados
de salários pagos aos funcionários de ambas as empresas pode ser facilmente visualizado pela
tabela abaixo:
Estatı́stica Empresa A Empresa B
Média 800,00 800,00
Mediana 800,00 200,00
Moda 800,00 100,00
Media (dist. freq.) 853,85 1.600,00
Mediana (dist. freq.) - -
Moda (dist. freq.) 866,66 941,18

Tabela 8: Resumo das Medidas de Tendência Central para a amostra de salários entre as empresas A e B

2.2 (b)
Ao analisar as medidas de tendência central (MTC) e esboçar, em um gráfico,
a distribuição dos salários pagos pela empresa A, o que se pode concluir sobre
a relação existente entre as suas MTC ? Quanto à sua distribuição, ela é uma
distribuição simétrica, assimétrica positiva ou assimétrica negativa ?
Resposta:
11

Se considerarmos que os dados são discretos, a distribuição é unimodal e simétrica pois


X = D = M = 800, 00, e se considerarmos que salários se caracterizam como contı́nuos,
verificamos que a distribuiçao é unimodal assimétrica a esquerda pois X < M ou seja X =
853, 85 < M = 866, 66.

2.3 (c)
Fazer o mesmo solicitado na letra b) para a empresa B.
Resposta:

Como visto na tabela 2.1 vimos que X = 800, 00 > D = 200, 00 > M = 100, 00 que se
caracteriza como uma distribuição de frequências unimodal e assimétrica à direita (assimetria
positiva) e se considerarmos que os salários são contı́nuos, vemos que a distribuição de frequências
também é unimodal e assimétrica à direita, uma vez que X = 1.600, 00 > M = 941, 18.
Vale ressaltar um exemplo de litı́gio salarial em uma empresa destacado por Hoffman (2006) [3]:
“Do ponto de vista do empresário, preocupado com os custos de produção, o salário médio é a
medida de tendência central mais conveniente (...). Para os representantes dos trabalhadores,
12

por outro lado, o salário modal e o salário mediano seriam medidas de tendência central
mais apropriadas do que o salário médio, pois refletem melhor a situação da maioria dos
empregados.” Hoffman, 2006 p. 39 [3].

2.4 (d )
Encontre o desvio-padrão dos salários pagos pela empresa A e dos salários pagos
pela empresa B, considerado o número total de salários que cada empresa paga.
Resposta:

A variância da população é igual à soma das diferenças ao quadrado em torno da média


aritmética da população, divida pelo tamanho da população:

N
X
(Xi − µ)2
2 i=1
σEmpresa A= N = 29.230, 77

onde N = tamanho da população √ e µ = média aritmética da população enquanto o desvio



padrão (σ 2 ) para a empresa A é σ 2 = σ 2 = 29.230, 77 = 170, 97 e da mesma maneira para a
empresa B:

N
X
(Xi − µ)2
2 i=1
σEmpresa B = N = 3.018.000, 00

e σ 2 Empresa B = 1737, 24

2.5 (e)
Mas se fosse considerada uma amostra, haveria diferença no resultado do desvio-
padrão dessa amostra para o desvio-padrão da população ? Por quê ?
Resposta:

Inicialmente, é interessante distinguir população e amostra, sendo que população é o conjunto


total de elementos portadores de, pelo menos, uma caracterı́stica comum.
E amostra é uma parcela representativa da população que é examinada com o propósito de
tirarmos conclusões sobre a essa população.
Sobre isso, Cancho (2004, p. )
“Uma população é o conjunto maior de indivı́duos ou objetos cujo estudo nos interessa
ou acerca dos quais deseja ter informações. Os elementos desse conjunto se denominam
dados ou observações. As observações mensuráveis denominam-se dados quantitativos. Por
exemplo, altura de estudantes, idade de pessoas, a duração de uma lâmpada de luz ( vida
útil das lâmpadas) etc. Porém, o sexo, o estado civil das pessoas, a marca de cigarros são
não mensuráveis e denominam-se dados qualitativos. Assim, uma população estatı́stica é o
conjunto de observações quantitativas ou qualitativas. A população sendo infinita, portanto,
é impossı́vel ter uma informação completa sobre ela, a população sendo numerosa talvez
não seja possı́vel estudar cada um dos seus elementos. Nesses casos, recorre-se à informação
proporcionada por uma parte nita da população chamada amostra. Em estatı́stica é freqüente
trabalhar com as chamadas amostras aleatórias, nas quais todos os elementos da população
têm a mesma chance de serem escolhidos para compor a amostra. Uma amostra aleatória
tem a propriedade de refletir as caracterı́sticas da população da qual foi sorteada.” Cancho,
(2004, p. 2) [1]
13

Para calcularmos o desvio padrão inicialmente pegamos a raiz quadrada da variância da


amostra (S 2 ) de salários dada por:

n
X
(Xi − X)2
i=1
S2 =
n−1

2 (500, 00 − 800, 00)2 + (600, 00 − 800, 00)2 + . . . + (1.100, 00 − 800, 00)2


SEmpresa A= = 31.666, 66
13 − 1

e a partir da variância calculamos o desvio padrão (S) que é o mesmo que:


v
u n
uX
u
u (Xi − X)2
t i=1
SEmpresa A = = 177, 95
n−1

e da mesma forma para a empresa B obtemos:


v
u n
uX
u
u (Xi − X)2
t i=1
SEmpresa B = = 1.831, 21
n−1

Já a variância (σ 2 ) e o desvio padrão da população (σ) são obtidos da seguinte maneira:
A variância da população é igual à soma das diferenças ao quadrado em torno da média
aritmética da população, dividida pelo tamanho da população.
PN
i=1 (Xi − µ)2
µ=
N

onde N = tamanho da população, Xi = i−ésimo valor da variável aleatória, N


P
PN i=1 X)i =
2
somatório de todos os valores de Xi da população, i=1 (Xi − µ) ) = somatório de todas as
diferenças ao quadrado entre os valores Xi e µ. E o desvio-padrão da população (σ) é a raiz
quadrada da variância da população (σ 2 ):
s
PN
i=1 (Xi − µ)2
σ=
N

Logo, nota-se a partir das fórmulas amostrais e populacionais que haveria prováveis diferenças
nos resultados conforme elucidam Levine, Berenson e Stephan (2000, p. 151) [4]:
“Notamos que as fórmulas para a variância da população e para o desvio padrão diferem das
fórmulas para a amostra na medida em que (n − 1) no denominador de S 2 e S é substituı́do
por N no denominador de σ 2 e σ.

A tabela a seguir compara as medidas de dispersão amostral e populacional:


14

Medida de Dispersão Empresa A Empresa B


Média Amostral (X) 800,00 800,00
Média Populacional (µ) 800,00 800,00
Variância Amostral 31666,67 3353333,33
Variância populacional 29230,77 3018000,00
Desvio padrão Amostral 177,95 1831,21
Desvio padrão populacional 170,97 1737,24

Tabela 9: Comparativo entre medidas de dispersão amostral e populacional

2.6 (f )
Comparando a média salarial da empresa A com a média salarial da empresa B,
pode-se afirmar que as 2 médias têm a mesma representatividade? Justifique com
base no desvio-padrão.
Resposta:

Como visto na tabela 2.5 do exercı́cio anterior, para os mesmos valores de médias para ambas
empresas: “Essa medida de posição apresenta a desvantagem de ser fortemente influenciada por
valores discrepantes, isto é, valores muito pequenos ou muito elevados. Portanto, nesse caso essa
medida já não será um valor representativo do conjunto de dados.” Cancho (2004, p. 18) [1]
A variância e o desvio padrão são utilizados para comparar a variabilidade de conjuntos de
dados expressados nas mesmas unidades, com médias que sejam aproximadamente similares.
Deste modo vimos que tanto as variâncias amostrais e populacionais da empresa A são muito
menores do que os da empresa B, e da mesma maneira os desvios-padrões, evidenciando que os
salários da empresa A apresentam menor variabilidade do que a empresa B.
Portanto, não podemos afirmar que as 2 médias tem a mesma representatividade, se consid-
erarmos as medidas de variabilidade em torno das mesmas.

2.7 (g )
Com base na conclusão da letra d), em qual das duas empresas você gostaria de
trabalhar ? Por quê ?
Resposta:

Se nos basearmos no critério de escolha somente pelos desvios-padrões notamos como evi-
denciado anteriormente que a empresa A é menos volátil que a B, todavia o desvio padrão como
medida de dispersão absoluta dimensiona o afastamento médio entre os termos de uma série e
seu valor médio. Seu resultado é expresso na mesma unidade de medida dos dados pesquisados.
Se medirmos o coeficiente de variação que é uma medida de variabilidade adimensional
expressa o número de vezes que o desvio padrão contém a média. Essa medida estatı́stica é
utilizada para comparar conjuntos de dados que têm diferentes unidades ou quando as médias
são muito diferentes. Denota-se o coeciente de variabilidade populacional e amostral por CV e
cv; respectivamente.

σ
População: CV =
µ

onde µ = média populacional e σ = desvio padrão populacional; e

S
Amostral: cv =
X
15

onde X = média amostral e S = desvio padrão amostral, encontramos:


CVEmpresa A = 0, 2137 CVEmpresa B = 2, 1715

cvEmpresa A = 0, 2224 cvEmpresa B = 2, 2890


Concluindo, portanto, com base na média salarial igual em ambas empresas e sendo os
desvios-padrões e coeficientes de variação da empresa B superiores aos da empresa A, claramente
opta-se por trabalhar na empresa A pela sua menor dispersão salarial.

3 Questão 3
Considere as informações do seguinte quadro:
PESO Excessivo Normal Deficiente Peso Total
PRESSÃO
Elevada 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1

3.1 (a)
Qual a probabilidade de uma pessoa escolhida ao acaso ter pressão elevada ?
Resposta:

Sendo P (A) a probabilidade de ocorrência do evento pressão elevada, então P (A) = 0, 20 ou


20%.

3.2 (b)
Qual a probabilidade de uma pessoa escolhida ao acaso ter peso deficiente ?
Resposta:

Sendo P (B) a probabilidade de ocorrência do evento simples (ou marginal), peso deficiente,
então P (A) = 0, 22 ou 22%.

3.3 (c)
Se a pessoa escolhida ao acaso tem excesso de peso, qual a probabilidade de ter
pressão elevada ?
Resposta:

Sendo P (C) a probabilidade de ocorrência do evento simples (ou marginal), excesso de peso
e P (A) a probabilidade de ocorrência do evento pressão elevada, então P (C) = P (A)|P (C) =
0, 10/0, 25 = 0, 22 ou 22%.

3.4 (d)
Se a pessoa escolhida ao acaso tem pressão normal, qual a probabilidade de ter peso
deficiente ?
Resposta:

Sendo P (D) a probabilidade de ocorrência do evento pressão e P (B) a probabilidade de


ocorrência do evento peso deficiente, então P (D) = P (B)/P (D) = 0, 20/0, 80 = 0, 20 ou 20%.
16

4 Questão 4
Dados os valores de X e suas respectivas probabilidades, encontre a esperança e a
variância de x.
X p(X)
0 1/16
1 4/16
2 6/16
3 4/16
4 1/16

Resposta:

A esperança ou valor esperado é a média ponderada dos valores que a variável aleatória ou
função assume, usando-se, como pesos para ponderação, as probabilidades correspondentes a
cada valor.
X∞
Deste modo, para uma variável aleatória discreta temos: E(X) = p(Xi )Xi e para uma
i=1
variável aleatória contı́nua X o valor esperado calcula-se mediante o integral de todos os valores
da função de densidade f (x):
Z ∞
f (E(X)) = Xf (x)d(x)
−∞

Nessa definição supõe-se que somatório e a integral convergem. Em caso contrário dizemos
que o valor esperado da variável aleatória X não existe.
Como para a amostra selecionada E(X) = µ = 2, “A distribuição, ou dispersão, dos valores X
em torno do valor esperado pode ser medida pela variância, que é definida como

2 = E(X − µ)2
var(X) = σX
2
A raiz quadrada positiva de σX , σX e definida como desvio-padrão de X. A variância ou o desvio-
padrão dão uma indicação de quão próxima ou dispersamente os valores X individuais se espalham em
torno de seu valor médio. A variância definida anteriormente é calculada como segue: Gujarati, 2000 p.
771 [2]
2
P
x (X − µ) f (x) se X for uma v.a. discreta (2)

= −∞ (X − µ)2 f (x)d(x)
R∞
se X for uma v.a. contı́nua

Por conveniência de cálculo, a fórmula da variância dada anteriormente pode também ser expressa
como”

(X) = σx2 = E(X − µ)2


= E(X 2 ) − µ
= E(X 2 ) − [E(X)]2
Assim, utilizando-se da equação (2) obtemos:
var(X) = (0 − 2)2 1/16 + (1 − 2)2 4/16 + (2 − 2)2 6/16 + (3 − 2)2 4/16 + (4 − 2)2 1/16 = 1%

5 Questão 5

K(1 − X) se 1 ≤ X ≤ 2
Dada a função f (x) =
0 para outros valores
Pede-se:
5.1 (a)
O valor de K para que f (x) seja uma P DF
Resposta:

Como explicam Morettin, Hazzan e Bussab (2003, p.196) [5]


“Esse conceito é bastante utilizado em Estatı́stica, em que as probabilidades são calculadas
como áreas sob um gráfico de uma função chamada densidade de probabilidade. Dada uma
variável contı́nua, as probabilidades a ela associadas são obtidas a partir de uma função f (x)
chamada função densidade de probabilidade, cujas caracterı́sticas são:

• (i)f (x) ≥0, para todo x;


Z ∞
• (ii) f (x)dx = 1
−∞

Por exemplo, pode-se verificar que a função


 −x
e se x ≥ 0
f (x) =
0 se x < 0
é uma função densidade de probabilidade. A probabilidade de uma variável contı́nua estar
Rb
entre dois valores a e b, com a < b é dada pela integral a f (x)dx. Assim, no exemplo dado,
a probabilidade de a variável estar entre 1 e 3 é dada por

3
1 1
Z
e−x dx = [−e−x ]31 = −e−3 + e−1 = −
1 e e3

Deste modo, para encontrarmos o valor de K, calculamos a integral


Z 2
K(1 − X)dx
1

Para que seja uma função de densidade é preciso verificar se a área sob eixo x e a função
f (x) é igual a 1. Isto é, a integral de −∞ a ∞ deve ser igual a um.
Z −∞ Z 1 Z 2 Z ∞ Z 2
f (x)d(x) = f (x)d(x) + f (x)d(x) + f (x)d(x) = f (x)d(x)
∞ −∞ 1 2 1

2 2
X2 22 12
  
1
Z
= K(1 − X)dx = K · X − =K · 2− −1− =− K
1 2 1 2 2 2
Logo, para encontrarmos a função de distribuição de probabilidades, o valor da integral
definida deve ser igual a 1
1
− K=1
2
Então é fácil ver que se Z 2
K = −2 = K(1 − X)dx = 1
1
Tirando a prova real para K = −2 em f (x), encontramos
Z 2
−2(1 − X)dx
1
2
X2

= −2 · X −
2 1
22 12
 
= −2 · 2 − −1−
172 2
18

1
= −2 × − = 1
2
então finalmente provamos que:
Z 2
−2(1 − X)dx = 1
1

1=1
no qual o valor de K = −2 faz com que a f (x) seja uma PDF.

5.2 (b)
O gráfico da função
Resposta:

Observa-se que a função f (x) ≥ 0 (é não negativa) ∀x ∈ R, ou seja, no D = {x|1 ≤ x ≤ 2} e


Im = {f (x)|0 ≤ f (x) ≤ 2}.

5.3 (c)
As probabilidades P (x < 3/2) e P (x ≥ 5/3)
Resposta:

Quando um dos extremos (limites) da integração forem por exemplo +∞


Z ∞ Z k
Definição: f (x)dx = lim f (x)dx,
a k→∞ a

desde que o limite exista e seja finito.


Analogamente, definem-se:
Z b Z b
f (x)dx = lim f (x)dx desde que o limite seja finito
−∞ k→−∞ k
19

Z ∞ Z c Z ∞
f (x)dx = f (x)dx + f (x)dx desde que existam as integrais do segundo
−∞ −∞ c membro para o valor c considerado
Se chamarmos de probabilidade do evento: A = {x ∈ Rx | x < 3/2}, ou seja,
Z 3/2 Z 1 Z 3/2 Z 3/2
P (A) = P (X < 3/2) = f (x)dx = f (x)dx + f (x)dx = f (x)dx4
−∞ −∞ 1 1
3/2 3/2
X2 (3/2)2 12
Z   
= K(1 − X)dx = K · X − = K · 3/2 − −1− =
1 2 1 2 2
   
3 9/4 1 1 3 9 1 1 1
=K· − − − =K· − × − − =
2 2 1 2 2 4 2 1 2

  
3 9 1 1 12 9 8 4 1
− − −
K· =K· − − − =− K
2 8 1 2 8 8 8 8 8
Como do exercı́cio anterior encontramos K = −2, substituı́mos no resultado para
1 1
P (A) = P (X < 3/2) = − × −2 = = 0, 25
8 4

Já para a probabilidade do evento: B = {x ∈ R | x ≥ 5/3}, fazemos:


Z ∞ Z ∞ Z 8/3 Z 8/3
P (B) = P (X ≥ 5/3) = f (x)dx = f (x)dx + f (x)dx = f (x)dx
5/3 8/3 5/3 5/3
8/3 8/3
X2 8 8/32 5 5/32
Z   
= K(1 − X)dx = K · X − =K· − − −
5/3 2 5/3 3 2 3 2
           
8 32 5 25 24 32 16 5 16 5 21 7
= K· − − − = K· − − − − = K· − = K· − =− K
3 9 3 18 9 9 18 18 18 18 18 6
Como do exercı́cio anterior encontramos K = −2, substituı́mos no resultado para
7 14
P (B) = P (X ≥ 5/3) = − × −2 = = 2, 3333
6 6
Note que este resultado parece um pouco estranho uma vez que se espera que P (B) fique entre 0 e
1. Se calcularmos pela definição apresentada no inı́cio, verificamos que:
Z k
lim K(1 − X)dx
k→∞ 5/3

∞
X2 ∞2
    
5 25
= lim X − = lim ∞− − − ) = não ∃ nos R, ou seja, o limite é indefinido.
k→∞ 2 5/3 k→∞ 2 3 18
No entanto, se reescrevermos o intervalo para o evento P(A e B)= {X ∈ R|3/2 ≤ X ≤ 5/3}, teremos
Z 5/3
K(1 − X)dx
3/2
   
5 25 3 9 7 7 14 1
=K· − − − =− K = − × −2 = = = 0, 1944
3 18 2 8 72 72 72 5
4
Para os limites superiores da integral definida, quando queremos obter P (x < qualquer número real), sub-
traı́mos o equivalente a uma unidade do mesmo e ao contrário, quando desejamos saber se P (x > qualquer número
real), adicionamos o equivalente a uma unidade. Caso contrário de acordo com a definição exposta acima, o valor
de Z 3/2 3/2
x2 k2
  
3
lim K(1 − X) = lim x − = lim −k− = −∞
k→−∞ k k→∞ 2 −∞ k→−∞ 8 2
e não encontrarı́amos a percentual de probabilidade. No exercı́cio para encontrar P (x < 3/2) subtraı́mos 1/2,
ou seja fizemos 3/2 − 1/2 = 1 para encontrar os limites da integral definida para b (superior) e a (inferior).
20

6 Questão 6
Dado X˜N (3, 16), ou seja, X segue uma distribuição normal com média 3 e variância 16,
encontre a probabilidade de X ser maior igual a 2 e menor que 5, ou seja, P (2 ≤ X ≤ 5).
Resposta:

Para que não precisemos utilizar a função:


1 2
f (X) = √ e−(1/2)(X−µ)/σ]
2πσ
utilizamos a padronização dos dados, geralmente dispostos em tabelas da distribuição normal padronizada.
Utilizando a fórmula da transformação (Z), qualquer variável aleatória normal X é convertida em uma
variável normal padronizada Z.
O valor de Z é igual à diferença entre X e a média aritmética µ, dividida pelo desvio padrão σ.

X −µ
Z=
σ

Enquanto os dados originais para a v.a. X possuı́am média aritmética µ e desvio padrão σ, a variável
aleatória padronizada Z terá sempre média aritmética µ = 0 e desvio padrão σ = 1
2
√ Sendo X˜N (3, 16) ou seja, distribuı́da normalmente com µ = 3 e σ = 16 e sabendo-se que σ =
σ 2 = 4 a P (2 ≤ X ≤ 5), será obtida através da padronização para X = 2 e X = 5
2−3 5−3
Z= = −1/4 ou − 0, 25 e = 1/2 ou 0, 5
4 4
Deste modo, a probabilidade pedida para X = 2 que corresponde na tabela de distribuição normal
padronizada ao valor de Z de 0,0987 e X = 5 a 0,1915.
Logo P (2 ≤ X ≤ 5) = P (−0, 25 ≤ X ≤ 0, 5) = 0, 0987 + 0, 1915 = 0, 2902 ou então 29%.

7 Questão 7
Se uma variavel aleatória tem distribuição normal com µ = 10 e σ = 5 , qual e a probabilidade
de ela assumir um valor no intervalo de 12 a 15 ?
Resposta:

Para encontrarmos P (12 ≤ X ≤ 15) procedemos primeiramente com a fórmula da padronização:


12 − 10 2 15 − 10
Z12 = = = 0, 4 e Z15 = =1
5 5 5
Em seguida, subtraı́mos a área correspondente de Z15 da tabela que é =0,3413 de Z12 = 0, 4 = 0, 1554
P (12 < X < 15) = 0, 3413 − 0, 1554 = 0, 1859 ou 18,6%.

8 Questão 8
Calcular os ı́ndices de preços de Laspeyres, Paasche e Fischer para os dados abaixo: (ano-
base 2002)

2002 2003
Item Preço Quantidade Preço Quantidade
X 35 3 39 5
Y 28 5 20 8
Z 12 9 18 10

Resposta:

O ı́ndice de Laspeyres é dado pela fórmula:


21
n
X
Pit Qi0
i=1
IL∗ (pt |p0 ) = n · 100
X
Pi0 Qi0
i=1

Onde Pit é o valor do preço no perı́odo t, Qi0 é a quantidade no ano-base e Pi0 é o preço no ano-base.
Para medirmos a variação
P no nı́vel de preços, comparamos o custo de aquisição da cesta de mercadorias
qt no perı́odo
P t, dado por Pit Qit , com custo de aquisição da cesta de mercadorias no perı́odo base,
dado por Pi0 Qit . Dessa maneira obtemos o ı́ndice de preços de Paasche, dado por

n
X
Pit Qit
i=1
Ip∗ (pt |p0 ) = n · 100
X
Pi0 Qit
i=1

mostrando que o ı́ndice de preços de Paasche para o perı́odo t pode ser interpretado como uma
média ponderada dos preços relativos, utilizando-se como fatores de ponderação os valores monetários
das quantidades vendidas no perı́odo t, considerando os preços do perı́odo-base, isto é utilizando Pi0 Qit
como fator de ponderação para o preço relativo da i−ésima mercadoria.
Como o método de Laspeyres e Paasche darão, em geral resultados diferentes quando analisamos
a variação no nı́vel dos preços de um conjunto de produtos, o ı́ndice de Fischer conduz a um valor
intermediário entre os dois.
Este ı́ndice é por definição a média geométrica entre o ı́ndice de preços de Laspeyres e Paasche, ou
seja
q
IF (pt |p0 ) = IL∗ (pt |p0 )Ip∗ (pt |p0 )

Ou seja o ı́ndice de Fischer é a raiz da multiplicação do valor de ı́ndice Laspeyres pelo ı́ndice de
Paasche.
Para a tabela acima encontramos para os três produtos (X, Y e Z), os seguintes resultados:
IL∗ (pt |p0 ) = 107, 3654391

Ip∗ (pt |p0 ) = 103, 0828516



IF (pt |p0 ) = 107, 36 × 103, 08 = 105, 2023556

9 Questão 9
Calcular as medidas de desigualdade G, R, V (Z) e W para a distribuição de renda para 8
indivı́duos dada abaixo:

i Xi
1 1
2 1
3 1
4 2
5 4
6 8
7 13
8 20

Resposta:
Este exercı́cio está resolvido em Hoffman (2006, p. 341) [3]. Para calcularmos o Gini, procedemos
construindo a tabela:
22
i
X
i Xi pi Xj φi φi−1 + φi
j=1

1 1 0,125 1 0,02 0,02


2 1 0,125 2 0,04 0,06
3 1 0,125 3 0,06 0,10
4 2 0,250 5 0,10 0,16
5 4 0,500 9 0,18 0,28
6 8 1,000 17 0,34 0,52
7 13 1,625 30 0,60 0,94
8 20 2,500 50 1,00 1,60

Pi
Em que pi é o resultado da divisão de Xi pelo último valor de i (nesse caso 8), Xj é a soma de
Pij=1
Xi até i, ou seja, o valor do quarto Xj é igual a 2+1+1+1=5, φi é o resultado de j=1 Xij divido pelo
seu último valor, ou seja o valor do quarto φ é dado por 5/50=0,10 e φi−1 + φi é o valor da adição de φi
com o anterior, ou seja o valor do quarto φ é igual a 0,10+0,06=0,16.
E assim, calculamos o Gini, através da fórmula:

n
1X
G=1− (φi−1 + φi )
n i=1

E então encontramos
1
G=1− · 3, 68 = 0, 54
8
Os valores do coeficiente de Gini variam, portanto, entre 1 e zero; quanto mais próximo de 1 for o
coeficiente, maior será a concentração na distribuição de qualquer variável, acontecendo o contrário à
medida que esse coeficiente se aproxima de zero.
A entropia é, então, uma medida do grau de igualdade de uma distribuição. Theil (1967) mostrou
que é mais interessante utilizar uma medida de desigualdade obtida subtraindo a entropia de seu valor
máximo. Esta medida é chamada Redundância da distribuição, e é dada por:
 
n n
X X  yi 
R = log n − H(y) = yi log(nyi ) = yi log  
1
i=1 i=1
n

onde 0 ≤ R ≤ log n.

[falta resolver]

..
.

10 Questão 10
Calcular as medidas de concentração CR2 , HH, B, e E para uma indústria com quatro em-
presas cujas produções são: 12, 132, 12, e 36.
Resposta:

Inicialmente para calcularmos o a razão de concetração organizamos as empresas de maneira que


X1 ≥ X2 · · · ≥ Xn e em seguida obtemos a razão de concentração das k maiores empresas pela fórmula
23

k
X Xi
CRk = yi onde yi =
i=1

sendo n o tamanho da amostra e µ a média populacional de Xi .


Em seguida, resumimos os cálculos conforme tabela a seguir:

Empresa i Xi yi
A 1 132 0,6875
B 2 36 0,1875
C 3 12 0,0625
D 4 12 0,0625

Para encontrarmos o valor de CR2 basta somarmos os valores dos dois primeiros yi da tabela para
encontrarmos, CR2 = 0, 6875 + 0, 1875 = 0, 875.
O ı́ndice de Hirschman-Herfindahl é definido por (Hoffman, 2006 p. 372) [3]

1 2
H= (C + 1) onde C = σ/µ
n

Sendo que C é o coeficiente de variação de Xi .


A expressão alternativa do ı́ndice HH nos mostra que para um dado valor de coeficiente de variação,
o ı́ndice HH é inversamente proporcional ao número de empresas. Adicionalmente, para um n fixo, o
ı́ndice HH varia diretamente com o coeficiente de variação.
Para a nossa amostra, obtemos
1
HH = · [(49, 48/48)2 + 1] = 0, 516
4
O ı́ndice de Rosenbluth quando as empresas de uma indústria estão organizadas de maneira que
y1 ≥ y2 · · · yn , então o ı́ndice de Rosenbluth é

1
B= X
2 iyi − 1

Onde i corresponde ao número da observação de yi .


Deste modo, obtemos
1
B= = 0, 5
2 · 1, 5 − 1
Para calcularmos a entropia da distribuição da produção entre as empresas de uma indústria, pro-
cedemos
n  
X 1
E= yi log com 0 ≤ E ≤ log n
i=1
yi

Sendo que log é logaritmo natural ou neperiano.


Para o nosso exercı́cio, montamos a tabela

Empresa i Xi yi log(1/yi ) log(1/yi )yi


A 1 132 0,6875 0,37 0,257601746
B 2 36 0,1875 1,67 0,313870581
C 3 12 0,0625 2,77 0,173286795
D 4 12 0,0625 2,77 0,173286795

Aplicando a fórmula obtemos E = 0, 918.

OBS.: As respostas serão disponibilizadas até a quarta-feira da semana da prova.5 .


5
As respostas encontram-se no site http://www.sitenarede.com/luiz esteves/ibqp
24

Referências
[1] Cancho, V., G. Noções de Estatı́stica e Probabilidade. Universidade Federal de Ouro Preto,
Instituto de Ciências Exatas e Biológicas, Departamento de Matemática, 5 de agosto de 2004.
[2] Gujarati, D., N. Econometria Básica. ed. Pearson Education do Brasil, São Paulo, 2000.
[3] Hoffman, R. Estatı́stica para economistas. 4 ed. Pioneira Thomson Learning, São Paulo, 2006.
[4] Levine, D., M., Berenson, M., L., Stephan, D. Estatı́stica: Teoria e Aplicações Usando Mi-
crosoft Excel em Português. LTC - Livros Técnicos e Cientı́ficos, Rio de Janeiro, 2000.
[5] Morettin, P., Hazzan, S., Bussab, W. Cálculo Funções de uma e de várias variáveis. Ed.
Saraiva, São Paulo, 2003.
[6] Santos, R. J. Introdução ao LATEX. Disponı́vel em: <http://www.mat.ufmg.br>