Você está na página 1de 8

Relatório Final de Probabilidade e

Estatística
Avaliação quarto bimestre
Professora: Viviane Leite Dias de Mattos

Nome Aluno 1: Fernando Piva Mendes Matrícula Aluno 1: 149399

1. Introdução

Foi dado ao aluno um banco de dados que se refere a algumas


características físicas de uma amostra formada por alguns indivíduos residentes nos
EUA. O levantamento de dados foi feito em 2018, por um grupo de pesquisadores,
com o objetivo de obter subsídios para uma análise ergonométrica de um posto de
trabalho que utiliza computadores. Foram coletadas diversas características físicas,
entre as quais, idade e peso, e foi pedido que realizássemos diversas análises.
2. Metodologia

Utilizando dos métodos e técnicas aprendidas em aula, com ajuda do


RStudio para fazer a análise das informações, consegue-se várias informações
usando as funções pré existentes no R, como frequências, médias e medianas, e
valores como variância e desvio padrão, além da correlação e regressão. Também
foram utilizadas as bibliotecas “ggplot2” para formar os gráficos, “fdth” para análise
das frequências, a biblioteca “e1071” para vermos a curtose e a assimetria e a
biblioteca “lmtest” para regressão.
3. Resultados

Para o exercício 1 fazemos uma análise exploratória dos dados de ambas as


variáveis usando métodos gráficos e analíticos.

Tabela da análise exploratória da idade.


Boxplot da idade.

Histograma da idade.

Tabela da análise exploratória do peso.


Boxplot do peso.

Histograma do peso.
Para o exercício 2 fazemos uma análise de correlação utilizando o coeficiente de
correlação linear de Pearson.

Plot do Peso pela Idade.

Resultados da análise de correlação.

Para o exercício 3 ajustamos um modelo de regressão linear simples, considerando


idade como variável independente e peso como variável dependente e então realizamos as
seguintes análises.
1. Identificar a reta de regressão.

Reta de regressão no modelo ajustado.

2. Testar a significância dos coeficientes do modelo.

Resultados da significância.

3. Fazer uma análise da variância.

Resultado da variância.
4. Determinar o coeficiente de determinação.

Resultado do coeficiente de determinação.

5. Fazer uma análise exploratória dos resíduos do modelo.

Resultados da análise exploratória dos resíduos.

Boxplot dos resíduos

Histograma dos resíduos.


6. Usar testes de hipóteses para avaliar a independência, normalidade e
homogeneidade das variâncias dos resíduos.

Resultados da independência.

Resultados da normalidade.

Resultados da homogeneidade.

7. Estimar o valor para o peso de um indivíduo com idade de 35 anos.

Estimação do valor previsto.

8. Estimar o valor médio para o peso de um indivíduo com idade de 35 anos.

Estimação do valor médio.

Para o exercício 4 foi pedido para apresentarmos a nossa conclusão.

4. Conclusões

Este trabalho foi muito interessante para aprendermos a utilizar a ferramenta


RStudio e melhorarmos nossas habilidades na programação em R, junto também
exercitamos bastante a nossa análise exploratória de dados, entendendo como
analisar cada variável, e ver quais parâmetros usamos, aprender a estudar a
correlação das variáveis e entender como realizar a regressão linear do modelo.
Também podemos inferir que temos uma boa distribuição do peso e das
idades, ambas com apenas com um valor fora do padrão. Porém o peso apresenta
um desvio padrão e uma variância bem maior que a idade, podemos concluir que o
peso é uma variável bem mais volátil do que a idade. Também podemos ver uma
correlação entre as variáveis usando o coeficiente de Pearson. Sobre a regressão
podemos ver que o padrão se mantém e os valores estão bem distribuídos ao redor
da nossa reta e temos uma boa significância no nosso modelo.

5. Referências

Não foram usadas nenhuma referência externa, apenas os slides


disponibilizados em aula pela professora.

6. Código R

O código usado está disponibilizado em um arquivo separado.

Você também pode gostar