Universidade Federal do Rio Grande do Norte - UFRN
Centro de Ciências Sociais Aplicadas - CCSA
Curso de Ciências Econômicas Estatı́stica Econômica I - 2021.1 - Avaliação Parcial 1 - 15/07/2021 Prof. Dr. Diego André Nome:
1. (300 points) Utilizando a base de dados ”bwght.csv”, responda os itens a seguir:
(a) (60 points) Analise a variável peso ao nascer (”bwghtlbs”) quanto à sua simetria e curtose. (b) (60 points) Existe relação entre o peso de uma criança ao nascer (”bwghtlbs”) e a renda familiar (”lfaminc”) ? (c) (60 points) Existe relação entre o peso de uma criança ao nascer (”bwghtlbs”) e a quantidade de cigarros que a mãe fumou durante a gravidez (”cigs”)? (d) (60 points) Qual a diferença, em termos percentuais, entre o peso médio ao nascer (”bwghtlbs”) de uma criança do sexo masculino (”male”) e o peso médio ao nascer de uma criança do sexo feminino? (e) (60 points) Qual a diferença, em termos percentuais, entre o peso médio ao nascer (”bwghtlbs”) de uma criança branca (”white”) e o peso médio ao nascer de uma criança não branca?
2. (300 points) Utilizando a base de dados ”catholic.csv”, responda os itens a seguir:
(a) (60 points) Calcule e interprete a correlação entre as variáveis ”read12” e ”math12”. (b) (60 points) Qual o percentual da variação total da variável ”math12” que é expli- cada pela variação da variável ”female”? (c) (60 points) Analise a variável renda familiar (”lfaminc”) quanto a sua simetria e curtose. (d) (60 points) A nota média de leitura (variável ”read12”) é maior entre os alunos que frequentaram uma escola católica (variável ”cathhs”) ou entre alunos que não frequentaram? (e) (60 points) Existe diferença entre a nota média de leitura (variável ”read12”) no grupo de alunos onde os pais são católicos versus o grupo onde os pais não são (variável ”parcath”)?
3. (200 points) Utilizando a base de dados ”SmokeBan.csv” , responda os itens a seguir:
(a) (50 points) Existe associação entre as variáveis ”smoker” e ”ban”? (b) (50 points) Qual o valor do coeficiente T entre as variáveis ”education” e ”gender”? (c) (50 points) Entre os não fumantes (variável ”smoker”), existe mais homens ou mul- heres (Variável ”gender”)? Avaliação Parcial 1 Estatı́stica Econômica I - Page 2 of 2 15/07/2021
(d) (50 points) A distância interquantı́lica da distribuição da variável ”age” é maior no
grupo de não fumantes ou no grupo de fumantes (variável ”smoker”)? O que isso significa?
4. (200 points) Utilizando a base de dados ”ShipAccidents.csv”, julgue as seguintes afirmações
(Justificando a sua resposta): (a) (50 points) A variável ”incidents” possui distribuição assimétrica à esquerda com concentração à direita. Além disso, possui mediana maior do que a média. (b) (50 points) A variável ”incidents” possui 5 outliers. (c) (50 points) Classificando os navios por tipo (variável ”type”), a categoria que tem o maior número médio de acidentes é a categoria B. Se classificarmos os navios por data de construção (variável ”construction”), a categoria que tem o menor número médio de acidentes é a categoria 1975-79. (d) (50 points) Existe correlação positiva entre as variáveis ”service” e ”incidents”, indicando que navios que tem mais tempo de serviço tendem a se envolver mais em incidentes.