Você está na página 1de 7

UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ

ENGENHARIA DA COMPUTAÇÃO

ELLIAN MACIEL MOREIRA RIBEIRO

TERCEIRA AVALIAÇÃO

PROBABILIDADE E ESTATÍSTICA

CORNÉLIO PROCÓPIO
2023
O conjunto de dados ``seringueira.xls'' corresponde a um estudo observacional
com o objetivo de estudar a altura e a produção de latex em serigueiras. Para
realizar esse estudo um pesquisador selecionou 15 serigueiras em 3 locais
diferentes (totalizando 45 árvores). Para cada seringueira foi medido a altura em
metros e a produção de latex em gramas por um mês. Utilizando essas
informações testar hipóteses de tal forma que seja possível verificar se:

Utilizando essas informações testar hipóteses de tal forma que seja possível
verificar se:

1) A produção de latex está correlacionada com a altura da seringueira;

2) A produção de latex é afetada pelo local em que a seringueira foi plantada.

OBS: Para todos os itens definir as hipóteses que serão testadas (H0 e
H1); citar o teste paramétrico e sua versão não-paramétrica necessário
para resolver o problema e explicar o motivo da escolha; estipular um
nível de significância; calcular todos os P-valores (interpretar o
resultado); se necessário calcular o intervalo de confiança (interpretar o
resultado); fazer uma conclusão final. (Os gráficos de normalidade devem
ser inseridos na prova).

Exercício 1: 1) A produção de latex está correlacionada com a altura da


seringueira;

Como o interesse é verificar se a produção de latex está correlacionada com


a altura da seringueira; Então, vamos seguir os seguintes passos:

1. Identificar H0 e H1: Como o interesse é se a produção de latex está


correlacionada com a altura da seringueira, então, o interesse em
testar as seguintes hipóteses,

𝐻0 : 𝜌 = 0
{
𝐻1 : 𝜌 ≠ 0

Ou seja, tem-se o interesse em verificar se o coeficiente de correlação ρ


é igual ou diferente de zero. Se o coeficiente de correlação for diferente de zero
há indícios de que as duas variáveis contínuas. estão correlacionadas, caso
contrário (ρ = 0) as duas variáveis contínuas não estão correlacionadas.

2. Escolher o teste estatístico: Como o interesse aqui é verificar a


correlação entre duas variáveis continuas, o teste realizado é o teste
de correlação de Pearson
3. Fixar o nível de significância 𝛼: Cometer o erro Tipo I é dizer que, a
amostra da produção de latex esta corelacionada com a altura da
seringueira quando na população as duas variáveis não esta
relacionada. Supor que o grau de gravidade em comenter esse erro é
baixo, o nível de significância aqui estipulado é em 𝛼=1%

Executando o teste de Shapiro-Wilk para ambos os dados,


podemos identificar que ambas obedecem a distribuição normal

𝑝 − 𝑣𝑎𝑙𝑜𝑟𝑎 = 0,046
{
𝑝 − 𝑣𝑎𝑙𝑜𝑟𝑝 = 0,3875

Portanto, a partir dos gráficos da Figura 1 e 2 percebe-se que eles estão


seguindo um comportamento linear acompanhando a linha vermelha teórica e
como os p-valores do teste de Shapiro-Wilk para as variáveis altura e produção
são maiores que o nível de significância 1% então a hipótese de normalidade
das duas variáveis não é rejeitada. Portanto, o teste de correlação de Pearson
pode ser utilizado para resolver o problema

Figura 1 (Gráfico quantil-quantil Altura)


Figura 2 (Gráfico quantil-quantil da Produção)

4. Calcular o valor da quantidade amostral (p-valor): Para realizar o


teste de correlação de Pearson utilizando o Software R, a função
cor.test é utilizada Temos P-Valor = 0,00246

5. Verificar se rejeita ou não a hipótese nula: Observando os valores


encontrados acima, temos que 𝑝−𝑣𝑎𝑙𝑜𝑟=0,00246. Com o nível de
significância (𝛼=0,01), podemos analisar que o (𝑝−𝑣𝑎𝑙𝑜𝑟< 𝛼).

6. Em fim concluímos que, com 1% de significância, existem evidencias


que a produção de látex está sim correlacionada com a altura da
seringueira. E verificando o coeficiente de correlação 0,075 e 0,701
percebe-se uma relação positiva forte

Exercício 2) A produção de latex é afetada pelo local em que a seringueira foi


plantada.

Para testar a hipótese de que a produção de latex é afetada pelo local em que
a seringueira foi plantada, pode ser utilizado o teste ANOVA (Análise de
Variância). Esse teste permite comparar a média da produção de latex em cada
um dos três locais, verificando se há diferenças significativas entre elas.
Seguindo os seguintes passos:

1. Identificar H0 e H1: Como o interesse é verificar se o nível de


peso da criança (normal, baixo) está associado com a presença
de irritabilidade uterina. Então, podemos testar as seguintes
hipóteses,
𝐻0 : 𝜇1 = 𝜇2 = 𝜇4
{
𝐻1 : 𝑃𝑒𝑙𝑜 𝑚𝑒𝑜𝑠 𝑢𝑚𝑎 𝑑𝑎𝑠𝑚é𝑑𝑖𝑎𝑠é𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑑𝑎𝑠 𝑑𝑒𝑚𝑎𝑖𝑠
2. Escolher o teste estatístico: Para testar a hipótese de que a
produção de latex é afetada pelo local em que a seringueira foi
plantada, pode ser utilizado o teste ANOVA (Análise de
Variância).

3. Fixar o nível de significância: O 𝛼: Cometer o erro Tipo I é dizer


que, a amostra da produção de latex esta corelacionada com o
local da seringueira foi plantada quando na população a
produção é a mesma. Supor que o grau de gravidade em
cometer esse erro é baixo, o nível de significância aqui estipulado
é em 𝛼=1%
4. VERIFICAR NORMALIZDADE DE RESIDUOS

Shapiro-Wilk p-value =0.4144

Figura 3 (Gráfico quantil-quantil dos resíduos da ANOVA segue


distribuição normal)

5. VERIFICAR HOMOCEDASTICIDADE DE RESIDUOS

studentized Breusch-Pagan test

p-value = 0.4449

Goldfeld-Quandt test
p-value = 0.7378

6. VERIFICAR HIDEPENDENCIA DOS RESIDUOS


Durbin-Watson test
p-value =0.5956
7. Em todos os teste o p-valor ficou maior que 𝛼 então as
hipóteses não foram rejeitadas

8. Calcular o valor da quantidade amostral (p-valor): Para


realizar o teste do P-valor da ANOVA, iremos utilizar a função
summary, temos que o resultado do 𝑝−𝑣𝑎𝑙𝑜𝑟= 3,91027e-08.

9. Verificar se rejeita ou não a hipótese nula: Observando os


valores acima, o p-valor é dado por (𝑝−𝑣𝑎𝑙𝑜𝑟=3,91027e-08) com
o nível de significância estipulado por (𝛼=0,05), então temos que
(𝑝−𝑣𝑎𝑙𝑜𝑟< 𝛼). Portanto existem evidencias de que pelo menos
um local tem maior produção
Tukey multiple comparisons of means
99% family-wise confidence level

diff lwr
L2-L1 35.88933 1.273766
L3-L1 -45.46933 -80.084901
L3-L2 -81.35867 -115.974234
upr p adj
L2-L1 70.50490 0.0073773
L3-L1 -10.85377 0.0006306
L3-L2 -46.74310 0.0000000

10. Concluímos, portanto, O teste de Tukey HSD indica que a


diferença de produção de latex entre os locais é significativa. A
partir dos resultados do teste, pode-se observar que:

- Entre L2 e L1, a diferença média de produção é de 35.89 gramas, com


um intervalo de confiança de 1.27 a 70.50 gramas e um p-valor de
0.007.

- Entre L3 e L1, a diferença média de produção é de -45.47 gramas,


com um intervalo de confiança de -80.08 a -10.85 gramas e um p-valor
de 0.0006.
- Entre L3 e L2, a diferença média de produção é de -81.36 gramas,
com um intervalo de confiança de -115.97 a -46.74 gramas e um p-valor
menor que 0.0001.

Considerando uma significância de 1%, pode-se concluir que a


produção de latex é maior no Local L1 em comparação com os demais
locais.

Você também pode gostar