Você está na página 1de 14

Roteiro de Aula Prática

ESTATÍSTICA DE DADOS AMBIENTAIS


Disciplina: Estatística de Dados Ambientais
Clique aqui e veja orientações e exemplos de roteiro de aula prática.

ROTEIRO DE AULA PRÁTICA 1


Unidade: 4
Aula (White Label)/Seção (KLS): 4.2

SOFTWARE

☒Software / ☐ Acesso on-line


☐Pago / ☒ Não Pago

Infraestrutura:
O software R 4.2.0 ou posterior está disponível para Windows, Linux ou macOS.
1. O software R 4.2.0 ou posterior para o Windows requer:
▪ Windows 10 ou Windows Server 2016 ou mais recente.
▪ Em versões anteriores do Windows, deve-se instalar o UCRT (Universal C Runtime) deve
antes da instalação do R. O UCRT está disponível para Windows desde o Windows Vista
SP2 e Windows Server 2008 SP2.
▪ Processador de 64 bits.
▪ O sistema de arquivos deve permitir nomes de arquivo longos que respeitam maiúsculas
e minúsculas (como é provável, exceto talvez para alguns sistemas montados em rede).
▪ Uma instalação ocupa até 175 MB de espaço em disco.
2. O software R 4.2.0 ou posterior para o macOs requer:
▪ Macs baseados em Intel de 64 bits, isto é, qualquer máquina fabricada desde meados de
2008.
3. O software R 4.2.0 ou posterior para o Linux requer:
▪ As distribuições que já possuem um pacote pré-compilado são: Debian, Fedora, Redhat,
Suse e Ubuntu.
▪ pelo menos 1GB de RAM.

Descrição do software:
O ambiente R é um software livre voltado para computação estatística e construção de gráficos.
Segundo Andrade e Silva et al. (2021, p. 9) “o software R é um ambiente computacional integrado
e ao mesmo tempo uma linguagem de programação orientada, desenvolvido para análise de
dados, realização de cálculos e modelos estatísticos”. O fato de que o R é um software livre,
permite que ele possua uma grande variedade de técnicas, o que o torna atualmente o software
estatístico mais utilizado mundialmente, ganhando cada vez mais espaço em todas as áreas do
conhecimento. O software está disponível para download em https://www.r-project.org/ (acesso
15 maio. 2023) para sistemas operacionais Linux, Windows e MacOS.
ATIVIDADE PRÁTICA 1

Atividade proposta:
A atividade consistirá na realização e interpretação de testes de hipóteses com o auxílio do
software R. Esse software, permite que sejam feitos diferentes testes de hipóteses, como por
exemplo o teste de hipótese para média. O foco da atividade será a construção de testes de
hipótese para média quando a variância populacional é desconhecida. Para isso serão propostos
problemas que envolvam esse conceito, além disso, com base no resultado do teste o estudante
deverá tomar uma decisão de acordo com o proposto nos problemas.
Objetivos:
A atividade tem como objetivo analisar e interpretar o resultado de testes de hipóteses para média
quando a variância populacional é desconhecida. Assim, ao final dessa atividade espera-se que o
estudante seja capaz de reconhecer as características do teste bem como seja capaz de decidir
qual das hipóteses deve ser aceita a fim de realizar inferências sobre a população analisada.
Procedimentos para a realização da atividade:
A atividade será composta por três problemas relacionados aos testes de hipóteses, sendo que
esses problemas deverão ser resolvidos com o auxílio do software R. Os 3 problemas são
resolvidos por meio dos testes para a média quando a variância populacional é desconhecida. A
seguir as instruções para você realizar os testes no ambiente R. O R já possui um comando para
a realização do teste T para uma média, basta que você siga os seguintes passos.
1) Após a instalação do sofware R abra o programa.

2) Crie um vetor com os valores das amostras fornecidas no problema. Para criar um objeto
“vetor”, utilize a função c() conforme segue:
Nome do vetor<-c()
Coloque entre parênteses os valores fornecidos. Os valores devem ser separados por vírgula. A
imagem a seguir mostra um exemplo de como criar um vetor nomeado por x.
3) Antes de realizar o teste você deve definir as hipóteses nulas e alternativas, explicitando
se o teste é unilateral ou bilateral.
4) No R utilize o comando:
t.test(amostra, mu=, alternative=)
Amostra refere-se aos valores dados no problema, esse valores são os mesmos do vetor criado
no passo 2.
Mu é o valor da média populacional.
Alternative refere-se a hipótese alternativa. Se o teste é bilateral, após o igual você deve escrever
“two.sided”. Se o teste é unilateral à esquerda você deve escrever “less” e se o teste for unilateral
à direita você deve escrever “greater”.
A imagem a seguir considera um teste em que a hipotese nula é 휇 = 35 e a alternativa é 휇 ≠ 35

A imagem a seguir considera um teste em que a hipotese nula é 휇 = 35 e a alternativa é 휇 > 35


A imagem a seguir considera um teste em que a hipotese nula é 휇 = 35 e a alternativa é 휇 < 35

5) Faça a interpretação correta da saída do R. Para saber qual hipótese foi aceita, basta
verificar o valor do p-value e compará-lo com o nível de significância dado.
Agora é a hora de você conhecer os problemas irá resolver com o auxílio do software R.
Problema 1: Um estudo foi realizado para verificar o nível de colesterol de adultos fumantes. É
desejável que o nível de colesterol esteja abaixo de 200 mg/dL. Foi coletada uma amostra de 16
indivíduos adultos fumantes e o nível de colesterol foi mensurado. Os valores obtidos, em mg/dL,
foram os seguintes:
215 190 282 186 184 231 240 230
178 219 166 199 221 176 225 213
A um nível de significância de 5% podemos dizer que o nível de colesterol é menor que 200 mg/dL?
Problema 2: Admite-se que o tempo médio de reação de seres vivos a um certo tipo de estímulo
segue, em geral, o modelo normal com 휇 = 6, 0푠 . O pesquisador desconfia, entretanto, que o
tempo médio sofre alteração por influência de uma certa substância.
Assim, para verificar se existe efeito dessa substância no tempo de reação, um experimento foi
desenvolvido com cobaias, inoculadas com a substância e submetidas a um estímulo elétrico, com
seus tempos de reação (em segundos) anotados. Os seguintes valores foram obtidos:
9 9,2 7,2 7,5 13,2 10,8 7,1 9,9 8,0 8,6
Verifique se a desconfiança do pesquisador procede, ao nível de 5% de significância.
Problema 3: Em um seringal no qual se utiliza o processo convencional de sangria, a produção
média de borracha seca é de 26g / árvore / corte. Tomou-se uma amostra ao acaso, composta de
25 seringueiras, as quais foram sangradas, usando-se um novo processo. Os resultados
encontram-se a seguir.
20 22 21 23 19 15 18 27 28 26 25 16 17
30 29,5 29 19,5 20,5 24,5 24 23,5 27,5 21,5 22,5 20,5

Ao nível de significância de 5% podemos dizer que o novo processo é mais eficiente que o
convencional?
Checklist:
✓ Instalar o software R.
✓ Abrir o software R.
✓ Analisar o problema dado, destacando qual a amostra.
✓ Construir o vetor com os valores da amostra.
✓ Retornar ao problema e identiifcar as hipóteses nula e alternativa.
✓ Utilizar o comando t.test
✓ Intepretar o resultado de saída do R e responder ao problema.
Resultado: Aluno, você deverá entregar:
Após o desenvolvimento da aula prática, você deverá entregar um relatório contemplando as
seguintes informações:
MODELO DE RELATÓRIO
I. Nome da disciplina
II. Atividade proposta
Nessa parte você deve descrver os problemas propostos, bem como a solução de cada um. É
nessa parte que você deve inserir um print de tela dos comondos e da resolução no R de cada um
dos problemas. Identifique quais são as hipóteses e não se esqueça que depois do resultado no
R é necessário que você o interprete a fim de responder as perguntas dos problemas.
III. Conclusão
Faça um texto de aproximadamente meia página explicitando a importância dos testes de
hipóteses, abordados nessa aula prática, na sua área de atuação e cite situações em que esses
testes podem ser utilizados.
IV. Referências bibliográficas
Toda a bibliografia utilizada para elaborar o relatório deverá ser citada. Utilize a norma ABNT para
a colocação das referências.

Referências:
ANDRADE E SILVA, Ana Hermínia et al.. Introdução à estatística no software R [recurso
eletrônico] - João Pessoa: Editora UFPB, 2021.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R


Foundation for Statistical Computing, Vienna, Austria. Disponível em http://www.R-project.org.
2023.
SOUZA, Emanuel Fernando Maia de et al.. Software Livre R: aplicação estatística. 2014.
ROTEIRO DE AULA PRÁTICA 2
Unidade: 4
Aula (White Label)/Seção (KLS): 4.3

SOFTWARE

☒Software / ☐ Acesso on-line


☐Pago / ☒ Não Pago

Infraestrutura:
O software R 4.2.0 ou posterior está disponível para Windows, Linux ou macOS.
4. O software R 4.2.0 ou posterior para o Windows requer:
▪ Windows 10 ou Windows Server 2016 ou mais recente.
▪ Em versões anteriores do Windows, deve-se instalar o UCRT (Universal C Runtime) deve
antes da instalação do R. O UCRT está disponível para Windows desde o Windows Vista
SP2 e Windows Server 2008 SP2.
▪ Processador de 64 bits.
▪ O sistema de arquivos deve permitir nomes de arquivo longos que respeitam maiúsculas
e minúsculas (como é provável, exceto talvez para alguns sistemas montados em rede).
▪ Uma instalação ocupa até 175 MB de espaço em disco.
5. O software R 4.2.0 ou posterior para o macOs requer:
▪ Macs baseados em Intel de 64 bits, isto é, qualquer máquina fabricada desde meados de
2008.
6. O software R 4.2.0 ou posterior para o Linux requer:
▪ As distribuições que já possuem um pacote pré-compilado são: Debian, Fedora, Redhat,
Suse e Ubuntu.
pelo menos 1GB de RAM.
Descrição do software:
O ambiente R é um software livre voltado para computação estatística e construção de gráficos.
Segundo Andrade e Silva et al. (2021, p. 9) “o software R é um ambiente computacional integrado
e ao mesmo tempo uma linguagem de programação orientada, desenvolvido para análise de
dados, realização de cálculos e modelos estatísticos”. O fato de que o R é um software livre,
permite que ele possua uma grande variedade de técnicas, o que o torna atualmente o software
estatístico mais utilizado mundialmente, ganhando cada vez mais espaço em todas as áreas do
conhecimento. O software está disponível para download em https://www.r-project.org/ (acesso
15 maio. 2023) para sistemas operacionais Linux, Windows e MacOS.

ATIVIDADE PRÁTICA 2

Atividade proposta:
A atividade consistirá na realização e interpretação de testes de hipóteses com o auxílio do
software R. Esse software, permite que sejam feitos diferentes testes de hipóteses, como por
exemplo o teste de hipótese para média. O foco da atividade será a construção de testes de
hipótese para duas médias, sejam elas dependentes ou independentes. Para isso serão
propostos problemas que envolvam esse conceito, além disso, com base no resultado do teste o
estudante deverá tomar uma decisão de acordo com o proposto nos problemas..
Objetivos:
A atividade tem como objetivo analisar e interpretar o resultado de testes de hipóteses para duas
médias. Assim, ao final dessa atividade espera-se que o estudante seja capaz de reconhecer as
carcaterísticas de cada tipo de teste bem como seja capaz de decidir qual das hipóteses deve
ser aceita a fim de realizar inferências sobre a população analisada.
Procedimentos para a realização da atividade:
A atividade será composta por dois problemas relacionados aos testes de hipóteses, sendo que
esses problemas deverão ser resolvidos com o auxílio do software R. Os 2 problemas são
resolvidos por meio dos testes para duas médias. A seguir as instruções para você realizar os
testes no ambiente R. O R já possui um comando para a realização do teste T para duas médias,
basta que você siga os seguintes passos.
1) Abra o programa em seu computador.

2) Construa os dois vetores com os valores das amostras informados no problema. Para criar
um objeto “vetor”, utilize a função c() conforme segue:
Nome do vetor<-c()
Coloque entre parênteses os valores fornecidos. Os valores devem ser separados por vírgula. A
imagem a seguir mostra um exemplo de como criar um vetor nomeado por x e outro por y.
3) Se as amostras são independentes você deve utilizar o seguinte comando:
t.test(amostra 1,amostra 2, conf.level = )
amostra 1 e amostra 2 são os vetores que você criou no passo 2. Conf.level é o intervalo de
confiança. Lembre-se que o intervalo é dado por 1 menos o nível de significância. Vamos utilizar
os vetores do exemplo do passo 2 para realizar o teste e verificar se as médias são diferentes.
Se as amostras são dependetes você deve utilizar o seguinte comando:
t.test(amostra 1,amostra 2,conf.level=,paired=T)
a diferença desse comando para o anterior é o elemento paired=T que indica a dependência entre
as amostras.

4) Faça a interpretação correta da saída do R. Para saber qual hipótese foi aceita, basta
verificar o valor do p-value e compará-lo com o nível de significância dado.
Agora é a hora de você conhecer os problemas irá resolver com o auxílio do software R.
Problema 1: Um estudo foi realizado para verificar se o nível de colesterol de adultos fumantes
e não fumantes diferem. Foi coletada uma amostra de 16 indivíduos de cada grupo e o nível de
colesterol foi mensurado. Os valores obtidos, em mg/dL, foram os seguintes:
215 190 282 186 184 231 240 230
Sim
178 219 166 199 221 176 225 213
Fumante?
221 171 165 234 224 205 256 239
Não
180 183 217 199 298 173 267 248
Ao nível de significância de 5%, podemos dizer que os níveis de colesterol diferem?
Problema 2: Foi conduzido um experimento para estudar o conteúdo de hemoglobina no sangue
de suínos com deficiência de niacina. Aplicaram-se 20 mg de niacina em oito suínos. Os níveis
de hemoglobina no sangue foram mensurados antes e depois da aplicação da niacina. Os
resultados obtidos no experimento foram:
Animal 1 2 3 4 5 6 7 8
Antes 12,4 13,6 13,6 14,7 12,3 12,2 13,0 11,4
Depois 10,4 11,4 12,5 14,6 13,0 11,7 10,3 9,8

Aonível de significância de 5% pode-se afirmar que a aplicação de niacina alterou a hemoglobina


no sangue dos suínos?
Checklist:
✓ Abrir o software R.
✓ Analisar o problema dado, destacando quais as amostra.
✓ Construir o vetor com os valores da amostra.
✓ Retornar ao problema e identiifcar se as amostras são dependentes ou independetes.
✓ Determinar o intervalo de confiança.
✓ Utilizar o comando t.test(amostra 1,amostra 2, conf.level = ) ou t.test(amostra 1,amostra
2,conf.level=,paired=T)
✓ Intepretar o resultado de saída do R e responder ao problema.
Resultados da aula prática: Aluno, você deverá entregar:
Após o desenvolvimento da aula prática, você deverá entregar um relatório contemplando as
seguintes informações:
MODELO DE RELATÓRIO
I. Nome da disciplina
II. Atividade proposta
Nessa parte você deve descrver os problemas propostos, bem como a solução de cada um. É
nessa parte que você deve inserir um print de tela dos comondos e da resolução no R de cada
um dos problemas. Identifique quais são as hipóteses e não se esqueça que depois do resultado
no R é necessário que você o interprete a fim de responder as perguntas dos problemas.
III. Conclusão
Faça um texto de aproximadamente meia página explicitando a importância dos testes de
hipóteses abordados nessa aula prática na sua área de atuação e cite situações em que esses
testes podem ser utilizados.
IV. Referências bibliográficas
Toda a bibliografia utilizada para elaborar o relatório deverá ser citada. Utilize a norma ABNT
para a colocação das referências.

Referências:
ANDRADE E SILVA, Ana Hermínia et al.. Introdução à estatística no software R [recurso
eletrônico] - João Pessoa: Editora UFPB, 2021.

R DEVELOPMENT CORE TEAM. R: A language and environment for statistical computing. R


Foundation for Statistical Computing, Vienna, Austria. Disponível em http://www.R-project.org.
2023.

SOUZA, Emanuel Fernando Maia de et al.. Software Livre R: aplicação estatística. 2014.

Você também pode gostar