Você está na página 1de 15

Universidade Federal de Santa Catarina

Departamento de Ciências Econômicas


Estatística Econômica (3ª Fase)
Prof.: Gueibi Peres Souza

Lista 1 de Exercícios

1) Qual o objetivo que se busca ao se calcular uma medida de tendência central de um conjunto de dados?
R.: representar/tipificar um conjunto de dados com apenas um único número.
2) Que tipo de confusão interpretativa determinado resultado do cálculo de a3 pode trazer para uma análise intuitiva
acerca da representatividade do valor calculado da medida de tendência central de um conjunto de dados?
R.: a de acreditar que existe mais informação nesta medida do que realmente possui pelo fato de se
mostrar relativamente simétrica, quando que a dispersão é o que mais importa para esta
interpretação. Por isto a importância de se observar a curtose também.
3) Com base nos dados abaixo, considerando os conceitos discutidos em sala, responda:

Data 2003 2004 2005 2006 2007 2008 2009 2010

IPCA (% a.a.) 9,3 7,6 5,69 3,14 4,46 5,9 4,31 5,91
Fonte: Ipea.

a) Represente adequadamente em um único valor o IPCA que caracteriza individualmente cada um dos períodos
de ambos os mandatos do Presidente Lula (2003-2006 e 2007-2010). Justifique a metodologia utilizada.

b) Qual dos valores construídos na letra “a” desta questão é o que apresenta a maior representatividade do seu
respectivo período? Justifique sua resposta com base em cálculos.

4) Porque em uma análise descritiva de um conjunto de dados é interessante sabermos ao menos as medidas de
tendência central, dispersão, assimetria e curtose?

5) Que sugestão você daria a alguém que precisa tomar decisões referentes a situações futuras acerca de um
conjunto de dados com 60 observações cujo cálculo de a3 foi 0,1 e de a4 foi 4,5?

6) Que sugestão você daria a alguém que precisa tomar decisões referentes a situações futuras acerca de um
conjunto de dados cujo cálculo da formulação proposta por Bera e Jarque resultou em um valor maior que 5,99?

7) Segundo da formulação proposta por Bera e por Jarque qual a relação existente entre o tamanho da amostra e os
coeficientes de assimetria e curtose em um conjunto de dados. Justifique sua resposta.
R.: Quanto maior o tamanho da amostra mais tolerante é o teste de hipóteses em relação a valores
diferentes de zero para a3 e diferentes de três para a4. No entanto, quanto maior é a amostra maior é
a convergência destes valores para zero e três, respectivamente. Justificativa: Teorema do limite
central ou lei dos grandes números.
8) Explique o que é o teste de Bera-Jarque, no que é baseado, qual sua interpretação e cite uma utilidade prática.

9) No trabalho de Wiese 2008 (”Uma Análise de Comportamento Não-Linear em Séries Temporais de Retornos em
Mercados Financeiros”) a tabela 1 abaixo (construída pelo próprio autor) foi utilizada para apresentar a análise
descritiva dos índices de retornos de papéis em sete mercados por ele pesquisados (EUA, Japão, Argentina, Coréia
do Sul, Brasil, México e Chile, respectivamente). Baseando-se nestes dados, responda:

Fonte: Wiese (2008), pp.36-37.


a) Ponderando risco e rentabilidade, qual dos mercados se mostra menos atraente para se investir? Justifique
sua resposta.
b) Quais os mercados apresentam incoerências entre as medidas de tendência central e a de assimetria, o que
indica possíveis erros não amostrais (de digitação, por exemplo)? Justifique sua resposta.
c) No caso brasileiro, quantos papéis aproximadamente apresentariam retornos superiores a 0,042788?
Justifique sua resposta.
d) Baseando-se na formulação proposta por Bera e por Jarque qual o tratamento que você daria ao conjunto de
dados do índice sul-coreano (KOSPI) e ao conjunto de dados do índice japonês (NIKKEI)? Justifique suas
respostas.

10) Baseando-se nos conceitos discutidos em sala e na análise descritiva abaixo, responda:

Ma Me Σ σ2 a3 a4 Min. Máx. n
4,06 3,75 138 1,91 1,41 7,36 2 7 40

a) Aproximadamente quantos dados temos entre 1,30 e 6,82? Justifique sua resposta.

b) Com base em a3, qual a conclusão que podemos chegar com relação ao valor 7?

c) Como você julgaria esta série com relação à assimetria e curtose?

d) Se houvesse a intenção de utilizar a regra empírica para embasar o processo decisório com relação ao
desempenho desta turma, qual o procedimento que você julgaria como sendo o mais adequado para lidar
com os resultados do cálculo de assimetria e curtose?

e) Com relação aos valores mínimo e máximo, se você tivesse de escolher um delas para classificar como a mais
provável, qual seria?

11) Qual a utilidade prática na realização de uma análise descritiva de um conjunto de dados?

12) Sabendo-se que a estatística descritiva dos resultados obtidos com a avaliação de uma turma com a aplicação de
uma prova revelou os números apresentados na tabela abaixo, classifique cada uma das afirmativas abaixo como
verdadeira (V) ou falsa (F) justificando sua resposta responda:

Ma Mo Me σ2 a3 a4 Min. Máx. Σ n BJ

5,91 5,5 5,5 2,83 0,14 2,37 2,5 8,5 136 23 0,46

a) ( ) Existem mais alunos acima da média da turma do que abaixo.


R: Falsa. Ma > Me.
b) ( ) Existem ao menos 17 alunos com notas entre 2,55 e 9,27.
R: Verdadeiro. Existem 22 alunos com notas entre 2,55 e 9,27.
c) ( ) Neste grupo é mais provável alguém tirar 10 do que zero.
R: Verdadeiro. Zero está fora de 3σ da média e 10 está dentro (μ+3σ = 10,95 e μ-3σ = 0,87).
d) ( ) A possibilidade de alguém tirar uma nota igual à 2,5 é levemente menor do que alguém tirar uma nota
igual à 8,5.
R: Falso. É o contrário, devido à leve assimetria positiva e segundo o teste de BJ permitir considerar
a distribuição simétrica.
e) ( ) Os desempenhos tendem a apresentar uma centralidade relativamente fraca em torno da média.
R: Verdadeiro. Devido à curtose mostrar um leve achatamento da curva em relação à curva
gaussiana.

13) Sabendo-se os resultados obtidos em uma determinada turma com a aplicação de uma primeira avaliação revelou
os dados apresentados na tabela abaixo, responda:

Nota na primeira avaliação F Nota na primeira avaliação F


3,5 1 7,5 2
4,5 1 8 6
5 2 8,5 1
5,5 2 9 3
6 4 9,5 2
6,5 2 10 3

a) Qual o valor esperado para a turma na aplicação desta segunda avaliação?


R: Média = 7,36 ~7,4.
b) Se os resultados fossem exatamente os mesmos, aproximadamente quantos alunos da turma estariam
contidos no intervalo de um desvio padrão da média?
R: Aproximadamente 62% (18 em 29) uma vez que a Var(x) = 3,17 e Dp(x) = 1,78, o que gera o
intervalo de 5,58 a 9,14, ou seja, os acima de 5,5 e abaixo de 9,5.

14) No trabalho de Specket al. 2000 (“Os Custos da Corrupção”) a tabela 1 abaixo foi utilizada para apresentar a
posição de onze países latino-americanos no ranking mundial de corrupção. Segundo os dados presentes nesta
tabela responda:

a) Qual o valor do índice de corrupção que você escolheria como representativo destes onze países latino-
americanos?

b) Qual o índice mínimo da classe que determina os 50% com maior grau de corrupção e quais são estes
países?

Fonte: Speck et al. 2000, p.49.

15) O que caracteriza o desvio padrão como a medida de variabilidade mais robusta dentre as discutidas?

16) A seguir é apresentada uma relação de faturamento (R$ milhões) de algumas empresas latino-americanas
negociadas em bolsas de valores. Sabendo que este conjunto de dados possui s ≈ 91 e Ma = 185 responda:

119 120 123 125 145 148 152 156

156 156 177 189 199 204 315 475

c) Quais os motivos que nos impedem de utilizarmos a regra empírica para embasar a decisão de investir ou
não neste conjunto de empresas?
R: a3 = 2,10 e a4 = 6,78 (BJ = 21,31).
d) Quais as alternativas disponíveis para analisarmos este conjunto de dados?
R: Utilização do Teorema de Chebyshev ou o tratamento da assimetria (eliminação de outlier’s) e da
curtose.
17) No trabalho de Manso et al. 2010 (“Bem-Estar Social, Mercado de Trabalho e Desequilíbrio Regional Brasileiro”) a
tabela 1 abaixo foi utilizada para caracterizar a concentração da renda familiar per capta nas cinco regiões do país
no período de 1995 a 2006. Segundo os dados presentes nesta tabela responda:

a) Qual Região apresenta a situação mais confiável para embasar o processo decisório com relação à construção
de políticas públicas?

b) Qual Região apresenta a situação menos confiável para embasar o processo decisório com relação à
construção de políticas públicas?

c) Construa um Diagrama de Caixas (Box Plot) para as regiões mencionadas na letra “a” e “b” desta questão e
realize um comentário comparando ambas as figuras que fundamente a resposta dada na letra “a” desta
questão.

d) Construa uma tabela de distribuição de frequência para os dados da região respondida na letra “a” desta
questão e realize um comentário comparando a representação gráfica desta tabela de distribuição de
frequência e o Box Plot construído na letra “c” desta questão, de modo que seja possível identificar o
intervalo onde possamos esperar que se encontre o índice de concentração de renda desta Região.
Tabela 1 – Índice de Gini da Renda Familiar Per Capita
Período Nordeste Norte Centro-Oeste Sudeste Sul
1995 0.613 0.596 0.588 0.571 0.568
1996 0.629 0.592 0.604 0.565 0.565
1997 0.628 0.6 0.603 0.569 0.559
1998 0.62 0.593 0.607 0.57 0.561
1999 0.615 0.579 0.597 0.563 0.567
2001 0.611 0.58 0.602 0.571 0.552
2002 0.607 0.58 0.6 0.567 0.533
2003 0.597 0.559 0.584 0.561 0.534
2004 0.594 0.555 0.577 0.546 0.525
2005 0.584 0.546 0.58 0.547 0.519
2006 0.584 0.538 0.566 0.54 0.511
Obs: Elaborado pelo autor a partir de dados da PNAD.

Fonte: MANSO et al. 2010.

18) O que caracteriza a3 e a4 como medidas de assimetria e curtose, respectivamente, mais robustas que as medidas
desenvolvidas por Pearson, Bowley, Kelley ou a amplitude semi-quartílica?

19) Considerando os conceitos discutidos em sala responda:

a) Qual a utilidade de se construir o histograma de um determinado conjunto de dados durante uma análise
descritiva?

b) Porque, durante uma análise descritiva de um determinado conjunto de dados agrupados, precisamos
construir uma coluna de frequência acumulada direta e uma de pontos médios?

20) Qual a utilidade de se calcular coeficientes de assimetria e curtose ao analisarmos descritivamente um conjunto de
dados?

21) Qual a utilidade de se calcular medidas de dispersão ao analisarmos descritivamente um conjunto de dados?

22) Quando realizamos o arredondamento estatístico que consequência estamos causando aos resultados obtidos com
nossa amostra ou população?

23) Qual a razão da existência da “regra de preferência pelo número par” em certas situações onde o arredondamento
estatístico é necessário? Justifique sua resposta.

24) Na pesquisa “Mulheres e Trabalho: Avanços e Continuidades” a tabela abaixo foi utilizada para caracterizar a
evolução da escolarização da população brasileira com pelo menos 15 anos segundo gênero. Segundo os dados
presentes nesta tabela responda:

a) Tais valores possuem que possível tipo de problema para representar esta informação? Justifique sua
resposta.

b) Com relação à resposta dada para a letra “a” desta questão, que metodologia poderia ser sugerida (dentro da
mesma intenção de caracterização do conjunto de dados desta tabela) visando tornar mais confiável a
representação da quantidade de anos de estudo de cada gênero?

Fonte: Ipadata.
25) Na pesquisa “Os Efeitos do Programa Bolsa Família sobre a Economia dos Municípios” a tabela abaixo foi utilizada
para caracterizar os grupos nos quais os municípios foram classificados segundo a porcentagem de sua população
que é beneficiada pelo programa. Segundo os dados presentes nesta tabela responda:

a) Os valores observados na coluna “Anos médio de estudo” possuem que possível tipo de problema para
representar tais dados? Justifique sua resposta.

b) Com relação à resposta dada para a letra “a” que metodologia poderíamos sugerir (dentro da mesma
intenção de caracterização do conjunto de dados desta coluna) visando tornar mais confiável a representação
da quantidade de anos de estudo de cada grupo?

c) Da forma como estão dispostos os dados na tabela, qual dos grupos apresenta a medida de “Anos médio de
estudo” provavelmente mais confiável?

31) Com base nos dados do censo do ano de 2000 da tabela abaixo (considerando como amostra os dados referentes
apenas aos estados da federação), retirada da pesquisa “Um Estudo sobre os Diferenciais de Remuneração entre
os Professores das redes Pública e Privada de Ensino”, responda:

a) Considerando apenas as diferenças observadas na Região Sul (PR, RS e SC) quais as diferenças que se
fossem observadas no censo de 2010, para esta mesma Região, poderiam ser consideradas outlier’s?
b) Entre a Região Sul (PR, RS e SC) e a Região Sudeste (ES, MG, RJ e SP), em qual delas teoricamente se
obteria uma estimativa com menor precisão da diferença salarial?

Fonte: FILHOet al. 2009.

32) Um teste β foi aplicado em candidatos a empregos em uma determinada indústria. Os resultados obtidos são
apresentados abaixo. Imaginando que a segunda fase no processo seletivo seja uma entrevista, quais os
candidatos que você classificaria para a segunda etapa utilizando os conceitos de variabilidade? Justifique.

Acertos Candidatos
8 |--------------------- 12 10
12 |--------------------- 16 12
16 |--------------------- 20 18
20 |--------------------- 24 30
24 |--------------------- 28 52
28 |--------------------- 32 98
32 |--------------------- 36 86
36 |--------------------- 40 44
40 |--------------------- 44 28
44 |--------------------- 48 15
48 |--------------------- 52 7
TOTAL 400
33) Segundo reportagem publicada em um Jornal de grande circulação no Estado, é possível observar que embora a
indústria brasileira tenha mostrado umaelevação no mês de março (elevando em 0,7% sua produção em relação à
fevereiro) o setor revelou uma desaceleração. Com base nos dados divulgados abaixo, responda:

a) Qual o intervalo mínimo de variação percentual que possui (teoricamente) a maior chance de ocorrer
considerando este período amostral?

b) Se desejássemos realizar uma avaliação mais criteriosa a respeito da variação percentual da produção do
setor industrial no Brasil nesse período, qual o “primeiro tratamento” que deveríamos dar a este conjunto de
dados?

Fonte: Diário Catarinense – 06/05/2009 p.18.

34) A seguir é apresentada uma relação de faturamento (R$ milhões) de algumas empresas latino-americanas
negociadas em bolsas de valores. Como você caracterizaria estes dados em termos de assimetria e que hipóteses
construiria a partir da descrição desta característica?

119 120 123 125 145 148 152 156

156 156 177 189 199 204 315 475

35) As idades de um grupo de candidatos de uma importante universidade são apresentadas na figura abaixo. Analise
o perfil dos candidatos a partir da assimetria da distribuição com vistas a construção de uma política pública para
ampliar o acesso as vagas.

450
400
350
300
250
200
150
100
50
0
17
19
21
23
25
27
29
31
33
35
37
39
41
43
45
47
49

36) Admitindo que os funcionários administrativos de uma indústria possuam a seguinte distribuição de frequência
referente a seus salários, determine qual o percentual de funcionários que recebem salários a dois desvios padrão
da média do grupo e quais os valores que representam os limites deste percentual?

Salários (R$) Funcionários

5.000 |--------------------- 5.500 8

5.500 |--------------------- 6.000 10

6.000 |--------------------- 6.500 16

6.500 |--------------------- 7.000 18

7.000 |--------------------- 7.500 24

7.500 |--------------------- 8.000 12

8.000 |--------------------- 8.500 10


8.500 |--------------------- 9.000 7

9.000 |--------------------- 9.500 6


9.500 |--------------------- 10.000 5

10.000 |--------------------- 10.500 4

10.500 |--------------------- 11.000 2


TOTAL 122
37) Qual a conclusão que podemos tirar a respeito da relação entre tamanho da amostra e tolerância à assimetria e
curtose segundo o teste de Bera-Jarque? Qual seria seu argumento se tivesse de justificar o sentido (coerência) da
sua conclusão a respeito desta relação?

38) Com base nas séries históricas abaixo das taxas de juros cobradas pelos bancos brasileiros, responda as questões
abaixo justificando sua resposta utilizando para isto os conceitos discutidos em sala:

a) Qual entre estes dois conjuntos de dados é mais homogêneo?


b) Como você classificaria a distribuição de frequência para ambos os conjuntos de dados?

Fonte: Diário Catarinense, 27/03/2009, p.17.

39) Com base nos polígonos de frequência apresentados abaixo, dos cheques devolvidos no Brasil por Estado para
cada 1000 compensados no primeiro trimestre deste ano, determine a quantidade mais frequente de
inadimplência através desta forma de pagamento (cheques devolvidos no período), além da quantidade que a
partir dela estiveram no máximo 11,11% da frequência dos dados.

Polígono de Frequência Polígono de Frequência


13 13
14 14

12 12
10 10
8
8
F

5
F

6 5
4 6
3 4
4 3
1 1 4
2 1 1
2
0
17,8 |- 32,56 |- 47,32 |- 62,08 |- 76,84 |- 91,6 |- 0
32,56 47,32 62,08 76,84 91,6 106,36 25,18 39,94 54,7 69,46 84,22 98,98
Classes Pm

Fonte: Diário Catarinense, 27/03/2009, p.17.

40) Segundo reportagem publicada no jornal Diário Catarinense no último dia 27 a previsão do PIB brasileiro feita pela
Confederação Nacional da Indústria (CNI) para o ano 2009 foi de 0%. Com base na série histórica do produto
nacional representada no gráfico abaixo, utilizando conceitos discutidos em sala (medidas de tendência central e
dispersão):

a) Realize uma projeção pontual e uma intervalar para o PIB brasileiro para no ano de 2009;
b) Faça um breve comentário acerca da previsão divulgada pela CNI a partir da comparação com a previsão
construída.
Evolução do PIB no Brasil - 2000 a 2008
5,7
6

5 4,3

Crescimento (%)
5,7
5,1
4
2,7
4
3
3,2
2

1
1,3 1,1
0
2000 2001 2002 2003 2004 2005 2006 2007 2008

Fonte: Diário Catarinense, 27/03/2009.


41) Com base nos dados da Balança Comercial do Estado de Santa Catarina nos anos de 2007 e 2008, qual das contas
abaixo (exportações, importações ou saldo da Balança Comercial) nos traria o cenário teoricamente mais confiável
para embasar decisões relacionadas a períodos futuros?

Exportações Importações Saldo

Classes F Classes F Classes F

385.551 |-- 468.820 1 320.890 |-- 409.230 5 -119.569 |-- -49.019 3

468.820 |-- 552.089 3 409.230 |-- 497.570 5 -49.019 |-- 21.531 2


552.089 |-- 635.358 5 497.570 |-- 585.910 5 21.531 |-- 92.081 6

635.358 |-- 718.627 7 585.910 |-- 674.250 3 92.081 |-- 162.631 5

718.627 |-- 801.896 6 674.250 |-- 762.590 4 162.631 |-- 233.181 3

801.896 |-- 885.165 2 762.590 |-- 850.930 2 233.181 |-- 303.731 5

TOTAL 24 TOTAL 24 TOTAL 24


Fonte: Bacen.

42) Imagine que uma pesquisa feita com sete clientes escolhidos ao acaso de um pequeno negócio (amostra
significativa e representativa) revelou os seguintes dados. Se desejarmos realizar uma estimativa do perfil da
população dos clientes deste negócio observando cada variável individualmente, para qual das variáveis seria mais
fácil realizar a estimativa? Justifique.

Cliente Idade Renda Mensal Despesa Média

A 49 700 60

B 22 650 90

C 30 8000 60

D 31 350 50

E 74 650 80

F 49 840 90

G 31 420 40

R: Para as idades. Menor variabilidade (desvio padrão).


43) Qual a consequência prática para uma análise indutiva (onde há a estimativa de parâmetros) a amostragem não
ter sido probabilística?

44) Construa um comentário crítico (conciso – máximo de 7 linhas – e completo) acerca do fato das análises
quantitativas na área de ciências econômicas, predominantemente, preocuparem-se apenas com o erro tipo I.

45) Que fatores são importantes a serem considerados quando do cálculo de um tamanho de amostra para uma
análise indutiva (onde há a intenção de se estimar parâmetros)? Justifique sua resposta.

46) Com base no que foi discutido em sala, disserte brevemente acerca da importância de uma análise descritiva de
um conjunto de dados explorando cada uma das suas quatro medidas principais discutidas em sala.
47) Com base no que foi discutido em sala, disserte brevemente acerca da importância da avaliação e obtenção de
uma distribuição normal de probabilidade em uma análise quantitativa.

48) Com base no que foi discutido em sala, disserte brevemente acerca da importância do cálculo do tamanho mínio
de uma amostra e da técnica de amostragem adotada para a análise quantitativa de um conjunto de dados.

49) Com base no que foi discutido em sala, descreva cada um dos passos da realização de um teste de hipóteses bem
como as conseqüências práticas de cada uma das decisões que devem ser tomadas neste processo,
principalmente as relacionadas a bi ou unilateralidade e as relacionadas ao grau de confiança.

50) A Copa do Mundo da Fifa de 2014, realizada no Brasil, teve como as quatro primeiras colocadas, respectivamente,
as seleções da Alemanha, da Argentina, da Holanda e do Brasil. Com base nos dados abaixo, referentes ao PIB per
capita (US$ - paridade do poder de compra) de cada um destes países de 2000 a 2010, e os conceitos discutidos
em sala, estabeleça um ranking destes países baseando-se na medida conjunta de tamanho e estabilidade de suas
economias e faça um comentário comparando ambos os ordenamentos. Fundamente sua resposta em
cálculos.

Medias Descritivas Alemanha Argentina Holanda Brasil


Média 31682,72 11391,27 36039,68 8770,587

Mediana 31114,53 10833,41 35104,49 8509,43

Moda #N/D #N/D #N/D #N/D

Desvio padrão 4383,03 2789,527 4953,339 1481,105

Variância da amostra 19210949 7781460 24535565 2193672


Curtose -1,72177 -1,48809 -1,81262 -1,4379

Assimetria 0,067233 0,35378 0,123634 0,350593


Fonte: Ipea.
R.: Holanda, Alemanha, Brasil e Argentina, pois seus CV são, respectivamente, 13,74%; 13,83%;
14,56%; 15,39%; 16,89% e 24,49%.
51) Que característica apresentada pela variância de uma determinada população permitiria a inferência estatística de
parâmetros estimados a partir de uma amostragem não probabilística?
R.: A de ser relativamente baixa, ao ponto de poder tornar plausível se presumir uma relativa
homogeneidade na população.
52) Construa um comentário crítico (conciso – máximo de 7 linhas – e completo) acerca do fato das análises
quantitativas na área de ciências econômicas, predominantemente, não preocuparem-se com o erro tipo II.
R.: O comentário deve conter a situação de que é comum em economia, apesar de ser uma ciência
que já há algum tempo sofre uma crise de paradigmas, credita ainda muita veracidade à suas
hipóteses nulas. Parece ser mais constrangedor para um economista cometer um erro tipo I (rejeitar
uma H0 verdadeira) do que um erro tipo II (aceitar uma H0 falsa).
53) Com base nas informações contidas na tabela abaixo, quais das duas economias tenderia a apresentar a menor
precisão em uma previsão futura? Justifique suas respostas com base em cálculos.

Argentina - PIB per Brasil - PIB per capita Argentina – IPA Brasil – IPCA
Data
capita (US$ milhões) (US$ milhões) (base: 2000 = 100) (base: 2000 = 100)
2000 9.114,09 7.016,62 100,00 100,00
2001 8.821,08 7.169,27 97,96 107,67
2002 7.912,41 7.378,58 174,62 121,17
2003 8.717,63 7.522,07 208,87 132,43
2004 9.687,66 8.075,82 224,98 142,50
2005 10.833,41 8.509,43 244,10 150,61
2006 12.026,22 9.035,62 270,78 155,34
2007 13.333,58 9.768,68 302,73 162,26
2008 14.417,98 10.405,16 346,56 171,84
2009 14.547,33 10.414,91 368,33 179,25
2010 15.892,54 11.180,29 423,85 189,84
Fonte: Ipea.
R.: A Argentina, pois seus indicadores de variabilidade no período são maiores do que os brasileiros
(coeficiente de variação de 38,38% contra 7,2% do Brasil e desvio padrão de 1.963,54 US$ milhões
contra 434,1 US$ milhões do Brasil).
54) Uma determinada organização observando seu banco de dados concluiu que a média mensal de faturamento nos
últimos anos foi de R$ 60.500,00 mensais e o desvio padrão de R$ 10.250,00. O profissional responsável por esta
análise, quando questionado, afirmou que a distribuição de frequência destes dados tinha um formato que poderia
ser considerado simétrico. Com base nestas informações, responda:
a) Aproximadamente, qual a porcentagem de exercícios mensais futuros apresentarão faturamento superior a
R$ 40.000,00 mensais, partindo do pressuposto que a alegação do profissional esteja correta? Justifique
sua resposta.
R.: Aproximadamente 97,5% dos exercícios mensais. Justificativa: por ser a área maior ao limite
inferior de 2 desvios padrão da média e a distribuição ser simétrica, ou seja, segundo a regra
empírica temos 95% dos dados a dois desvios padrão da média.
b) Aproximadamente, qual a porcentagem de exercícios mensais futuros apresentarão faturamento superior a
R$ 40.000,00 mensais, partindo do pressuposto que a alegação do profissional esteja equivocada?
Justifique sua resposta.
R.: Pelo menos 87,5% dos exercícios mensais. Justificativa: por ser a área maior ao limite
inferior de 2 desvios padrão da média e a distribuição não ser simétrica, ou seja, segundo a
regra de Chebyshev temos ao menos 75% dos dados a dois desvios padrão da média.
c) Aproximadamente, qual a porcentagem de exercícios mensais futuros apresentarão faturamento inferior a R$
40.000,00 mensais, partindo do pressuposto que a alegação do profissional esteja correta? Justifique sua
resposta.
R.: Aproximadamente 2,5% dos exercícios mensais. Justificativa: por ser a área inferior ao limite
inferior de 2 desvios padrão da média e a distribuição ser simétrica, ou seja, segundo a regra
empírica temos 95% dos dados a dois desvios padrão da média.
d) Suponha que o faturamento em determinado exercício mensal tenha sido inferior a R$ 30.000,00. Quais as
quatro inferências que você pode acerca deste resultado? Justifique sua resposta.
R.: Dada a baixa probabilidade de ocorrência deste valor (inferior a praticamente 0,5%), 1) que
houve uma quebra estrutural nas vendas; 2) que não havia simetria na distribuição de
freqüência dos dados; 3) que a média foi calculada equivocadamente; ou 4) que o desvio padrão
foi calculado equivocadamente.
55) Explique a relação existente entre tamanho mínimo de amostra e tamanho da população, grau de confiança
escolhido, variância dos dados e erro tolerado na futura estimava de parâmetros desta amostra.
R.: Tamanho da população: relação direta, porém inversa em termos proporcionais, ou seja, quanto
maior a amostra maior a amostra, mas menor proporcionalmente falando; grau de confiança: relação
direta, ou seja, quanto maior o grau de confiança escolhido maior será o tamanho da amostra
mínima; variância dos dados: relação direta, ou seja, quanto maior a variância dos dados maior será
o tamanho mínimo da amostra; erro tolerado: relação inversa, ou seja, quanto maior o erro tolerado
na estimativa dos parâmetros menor será o tamanho mínimo da amostra necessária.
56) Imagine que um teste de hipóteses que avalia a significância estatística de coeficientes de correlação tenha sido
aplicado a dois pares distintos de variáveis (XY e WZ), onde H0 somente pode ser rejeitada com 10% de
significância para as variáveis X e Y e 1% de significância para as variáveis W e Z. Considerando as consequências
práticas do tipo de decisão que será tomada a partir dos resultados deste teste (relacionamento significante ou
não de variáveis, o que determinará a consideração ou não das mesmas em uma análise indutiva – regressão –
para fundamentar inferências estatísticas) juntamente com as possíveis consequências teóricas disto
(probabilidades de se cometer erro tipo I e erro tipo II nesta decisão), construa um comentário acerca da robustez
de cada uma destas análises (XY e WZ) individualmente.
R.: Aqui o aluno deve contrapor a questão de que se de fato a consideração de um maior grau de
confiança (menor nível de significância) torna a análise mais robusta (e gera a decisão mais
acertada), uma vez que minimiza a probabilidade do erro tipo I (considerar como diferente de zero o
grau de relacionamento entre duas variáveis que não apresentam um grau de relacionamento
significativo), apesar de, no entanto, estar maximizando a probabilidade de erro tipo II (aceitando
uma H0 falsa, ou seja, desconsiderando duas variáveis em uma análise indutiva por acreditar que seu
relacionamento, que é significativo, não existe). No fundo o que deve nortear a escolha do grau de
confiança (nível de significância) é o grau de credibilidade e veracidade que creditamos em H0, se
acreditamos ser bastante confiável maior deve ser a escolha do grau de confiança.
57) A escolha do grau de confiança em um teste de hipóteses está associada à probabilidade tolerada em se cometer
erro Tipo I e/ou erro Tipo II. Com base nisto, diga o que significaria cometer erro tipo I e também erro tipo II nos
testes de hipóteses t e F de uma análise de regressão.
R.: Erro Tipo I: Teste t: considerar estimativas de parâmetros estatisticamente insignificantes. Teste
F: considerar um modelo inválido. Erro Tipo II: Teste t: desconsiderar parâmetros importantes. Teste
F: desconsiderar um modelo válido.
58) Cite as duas utilidades práticas que justificam a realização de uma análise descritiva antes de uma análise indutiva.
R.: Identificar a metodologia mais adequada para realizar a análise indutiva, identificar os
tratamentos necessários nas variáveis envolvidas, identificar o período (quando série temporal) ou o
conjunto de dados (quando dados de corte) mais adequado para análise, identificar a necessidade de
modificação de variáveis ou próxies selecionadas para a análise indutiva,...

59) A partir dos conceitos e ferramentais discutidos em sala acerca dos temas amostra e amostragem e das
informações contidas nas figuras abaixo, aponte a fragilidade e também a inconsistência observáveis no
procedimento metodológico adotado de ambas as pesquisas divulgadas em 02/09/2019 e 26/09/2019,
respectivamente. Para isto considere que segundo o TSE (http://www.tse.jus.br/eleitor/estatisticas-de-
eleitorado/estatistica-do-eleitorado-por-sexo-e-faixa-etaria) a quantidade de eleitores com 16 anos ou mais em
agosto de 2019 no Brasil era de exatamente 69.428.036 pessoas.
Fonte: http://datafolha.folha.uol.com.br/opiniaopublica/2019/09/1988394-sobe-reprovacao-a-governo-
bolsonaro.shtml.

Fonte: file:///C:/Users/Usuario/Desktop/JOB_0444_BRASIL%20-
%20Relat%C3%B3rio%20de%20tabelas%20(avalia%C3%A7%C3%A3o%20do%20governo).pdf.

60) Com base na discussão proposta em sala e considerando a análise descritiva abaixo, responda:

N Ma Me s a3 a4 BJ

2424 0,000518 0,001268 0,018828 -0,3245 6,315539 1152,814


a. O que você colocaria, de forma concisa e completa, a respeito dos resultados da tabela acima?
R.: Comentar algo acerca das medidas de tendência central (Ma e Me), principalmente que são
bem mais baixas do que a medida de dispersão (s), o que denota a pouca representatividade
destes valores em relação aos 2424 dados. Comentar que existe uma assimetria negativa e um
excesso de curtose. Além do fato de que, apesar do elevado tamanho da amostra, que o
conjunto de dados não respeita uma distribuição normal.
b. Na intenção de realizar uma análise indutiva que envolva testes paramétricos de hipóteses, qual seria a
principal inadequação a ser contornada?
R.: O fato dos dados não respeitarem uma distribuição normal.
c. Se a opção na análise indutiva fosse a de insistir em testes de hipóteses paramétricos, procedendo assim com
um tratamento deste conjunto de dados, o que você orientaria a ser realizado? Fundamente sua resposta nos
conceitos e ferramentais discutidos em sala.
R.: Para saber se o problema da não normalidade está associado à aparente assimetria negativa,
a possível leptocurtose ou às duas, seria necessário aplicar o teste de Bera Jarque duas vezes e
observar seus resultados. Em uma delas considerando a assimetria igual a zero e na outra a
curtose igual à 3. Como em ambos os casos o resultado do teste permanece acima de 5,99
(aproximadamente 48 e 1110, respectivamente), identifica-se que tanto assimetria quanto a
curtose são as causas da não normalidade. A orientação seria no sentido de tratamento dos
discrepantes à esquerda para o problema de assimetria e a aplicação de um logaritmo na série
para o problema de curtose.
61) A partir da discussão de conceitos realizada em sala, responda utilizando suas próprias palavras:

a) O que uma pesquisadora busca quando opta por uma metodologia probabilística de amostragem?
R.: Garantir a cientificidade da inferência estatística.
b) Que pressuposição está sendo assumida como válida quando, para efeitos de conclusões acerca dos
resultados obtidos, trata-se como indiferente se a metodologia de amostragem adotada foi probabilística ou
não?
R.: De que a população é homogênea.
c) Quais os elementos considerados no cálculo do tamanho mínimo de uma amostra a ser coletada? Qual a
relação (direta ou inversa) de cada um destes componentes com o tamanho mínimo resultante?
R.: Tamanho da população (relação nominalmente direta e proporcionalmente inversa), grau de
confiança (relação direta), variância (relação direta) e erro tolerado (relação inversa).
d) Qual a relação (direta ou inversa) existente entre grau de confiança adotado e a percepção de precisão em
estimativas intervalares de parâmetros? Justifique sua resposta.
R.: Relação inversa, pois quanto mais alto o grau de confiança mais afastados estarão os limites
superior e inferior da estimativa intervalar.
e) Qual a relação (direta ou inversa) entre grau de confiança e erro tipo I em testes de hipóteses? E entre o erro
tipo II?
R.: Relação inversa com o erro tipo I e direta com o erro tipo II.
f) O que justifica, em estimações de parâmetros em Economia, o prestígio maior que geralmente se dá à
minimização do erro tipo I (em detrimento do erro tipo II)? Qual o argumento que pode ser utilizado para
fundamentar uma opção que prestigia mais o erro tipo II no momento da escolha do grau de confiança?
R.: A exacerbada confiança na veracidade da hipótese nula (paradigma teórico). O argumento
pode ser o de reduzir a probabilidade de desconsiderar uma variável ou mesmo um modelo útil
em ciências sociais aplicadas.
g) O que o nível de significância representa em um teste de hipóteses?
R.: A probabilidade de cometer erro tipo I.
62) Fundamentando-se nos conceitos e ferramentais discutidos em sala, e também nas informações contidas na figura
abaixo (a qual revela o procedimento metodológico adotado em uma pesquisa realizada pelo Instituto Data Folha
divulgada em 10/04/2019), aponte a inconsistência observável da conclusão: “Considerando tudo o que viram ou
ouviram sobre a Reforma da Previdência, independente do grau de conhecimento e repercussão sobre a proposta,
51% dos brasileiros se declaram contra a medida, 41% que são a favor, e uma parcela de 7% é indiferente à
reforma, além de 2% que não opinaram”.
Fonte: em http://datafolha.folha.uol.com.br/opiniaopublica/2019/04/1987701-51-rejeitam-reformar-
previdencia.shtml.
R.: O fato de realizar uma inferência estatística a partir de uma amostragem a esmo em uma
população que não se pode presumir homogeneidade de opinião acerca da medida que foi polêmica.
63) Responda:

N Ma Me s a3 a4 BJ
2424 0,000518 0,001268 0,018828 -0,3245 6,315539 1152,814

a) O que você colocaria, de forma concisa e completa, a respeito dos resultados da tabela acima?

b) Na intenção de realizar uma análise indutiva que envolva testes paramétricos de hipóteses, qual seria a
principal inadequação a ser contornada?

c) Se a opção na análise indutiva fosse a de insistir em testes de hipóteses paramétricos, procedendo assim com
um tratamento deste conjunto de dados, o que você orientaria a ser realizado? Fundamente sua resposta nos
conceitos e ferramentais discutidos em sala.

64) A partir da discussão de conceitos realizada em sala, responda utilizando suas próprias palavras:

a) O que uma pesquisadora busca quando opta por uma metodologia probabilística de amostragem?

b) Que pressuposição está sendo assumida como válida quando, para efeitos de conclusões acerca dos
resultados obtidos, trata-se como indiferente se a metodologia de amostragem adotada foi probabilística ou
não?

c) Quais os elementos considerados no cálculo do tamanho mínimo de uma amostra a ser coletada? Qual a
relação (direta ou inversa) de cada um destes componentes com o tamanho mínimo resultante?

d) Qual a relação (direta ou inversa) existente entre grau de confiança adotado e a percepção de precisão em
estimativas intervalares de parâmetros? Justifique sua resposta.

e) Qual a relação (direta ou inversa) entre grau de confiança e erro tipo I em testes de hipóteses? E entre o erro
tipo II?

f) O que justifica, em estimações de parâmetros em Economia, o prestígio maior que geralmente se dá à


minimização do erro tipo I (em detrimento do erro tipo II)? Qual o argumento que pode ser utilizado para
fundamentar uma opção que prestigia mais o erro tipo II no momento da escolha do grau de confiança?

g) O que o nível de significância representa em um teste de hipóteses?

65) Construa um comentário conciso e completo (no máximo em 10 linhas) acerca da importância da distribuição
normal de probabilidade para os ferramentais discutidos na disciplina.

66) Quais os dois aspectos que podemos utilizar para fundamentar a importância da realização de uma análise
descritiva em um conjunto de dados?
67) Quais os elementos considerados no cálculo do teste de Bera-Jarque de um conjunto de dados? Qual a relação
(direta ou inversa) de cada um destes componentes com o resultado do teste?

68) Quando os resultados do teste de Bera-Jarque apontam para a rejeição da hipótese nula (normalidade), como o(a)
pesquisador(a) poderia proceder na intenção de realizar uma análise indutiva que envolva testes paramétricos de
hipóteses onde não é possível aumentar o tamanho da amostra?

69) O que uma metodologia probabilística de amostragem possibilita em termos de conclusões acerca dos resultados
que uma metodologia não probabilística não permite? Em que tipo de situação torna-se indiferente se a
metodologia adotada foi uma ou outra?

70) Qual a relação (direta ou inversa) entre o tamanho mínimo de uma amostra e: I) o erro tolerado na estimativa de
um parâmetro? II) o tamanho da população? III) a dispersão dos dados? IV) o grau de confiança escolhido?

71) A seguinte afirmação é verdadeira ou falsa?: “a percepção de precisão em estimativas intervalares de parâmetros
é maior quanto menor o grau de confiança adotado”. Justifique sua resposta.

72) Qual a implicação da escolha do grau de confiança para a probabilidade tanto do erro tipo I quanto do erro tipo II
em testes de hipóteses?

73) O que um(a) pesquisador(a) está buscando, em estimações de parâmetros em Economia, quando opta por
trabalhar com menos de 90% de confiança?

74) Qual a definição que se estabelece com a escolha do grau de confiança em um teste de hipóteses?

75) Existem utilidades práticas em se aplicar uma análise descritiva prévia sobre um conjunto de dados que se
pretenda realizar uma análise indutiva. Quais duas delas você mencionaria?

76) Em análises indutivas, especificamente que alternativas devemos considerar quando não for possível ou razoável,
sob qualquer circunstância relacionada ao tamanho da amostra ou ao grau de confiança adotado, aceitar a
hipótese nula de um teste de normalidade realizado previamente?

77) Quando não podemos assumir ou presumir homogeneidade nos dados populacionais, o que somente uma
metodologia probabilística de amostragem permite?

78) Fundamentando-se nos conceitos e ferramentais discutidos em sala, e também nas informações contidas na figura
abaixo, responda:

a. Que comentário se pode fazer acerca do tamanho da amostra coletada? Apresente a fundamentação técnica
objetiva adotada.

b. Que correção técnica se pode fazer na conclusão apresentada pelos responsáveis pela pesquisa:
“Considerando tudo o que viram ou ouviram sobre a Reforma da Previdência, independente do grau de
conhecimento e repercussão sobre a proposta, 51% dos brasileiros se declaram contra a medida, 41% que
são a favor, e uma parcela de 7% é indiferente à reforma, além de 2% que não opinaram”.
Fonte: em http://datafolha.folha.uol.com.br/opiniaopublica/2019/04/1987701-51-rejeitam-reformar-
previdencia.shtml.

79) Qual a relação (direta ou inversa) existente entre grau de confiança adotado (escolhido) e a amplitude do
resultante intervalo de confiança de seus parâmetros (calculado)? Qual a consequência desta relação para o nível
de percepção de precisão desejado deste tipo de estimativa de parâmetros (intervalar)?

80) Em que exemplo de situação, constatada geralmente por uma análise descritiva, a aplicação prévia de um
método de agrupamentos seria útil ou mesmo necessária antes da realização de uma análise indutiva em dados de
corte (ou sessão cruzada, ou seja, que variam no espaço e não no tempo)?

81) Com base na tabela de contingência e também na matriz q2 abaixo, baseada em uma amostra referente às
respostas de 9417 empresas (pequenas, médias e grandes), de diferentes setores (indústria, construção, comércio
e hospitalidade, transporte e comunicação, serviços financeiros e imobiliários, além de outros serviços) e diversos
países europeus (Alemanha, Espanha, França, Itália, Holanda, Áustria e Reino Unido) prestadas no ano de 2015,
construa um comentário conciso e completo acerca da evidência ou não da existência de uma possível relação, e
seu tipo se houver, entre a existência da possibilidade dos funcionários de trocar horas extras por folgas
(HACCUOV) – utilização de um banco de horas – e a ocorrência de mudanças no uso de tecnologia nos últimos
cinco anos (JCHTECH) – inovação – na Comunidade Econômica Europeia.

HACCUOV
JCHTECH Sim, possível para Sim, possível para Não sabe ou Não TOTAL
Não
todos alguns respondeu
Sim 2191 904 1098 25 4218
Não 2638 947 1499 20 5104
Não sabe ou Não
41 28 23 3 95
respondeu
TOTAL 4870 1879 2620 48 9417

Fonte: European Company Survey.

HACCUOV
JCHTECH Sim, possível para Sim, possível para Não sabe ou Não TOTAL
Não
todos alguns respondeu
Sim 0,04 4,62 4,86 0,57 10,10
Não 0,00 5,01 4,39 1,39 10,79
Não sabe ou Não
respondeu 1,35 4,32 0,45 13,07 19,18
TOTAL 1,39 13,95 9,70 15,03 40,06

Fonte: tabela de contingência da European Company Survey.

Você também pode gostar