Escolar Documentos
Profissional Documentos
Cultura Documentos
> #I2: > closeAllConnections() > rm(list=ls()) > # Processo: > μ = 1800 #kg > σ = 100 #kg >
#Amostra: > n = 50 #tamanho amostral > mediaAmostral = 1850 #kg > ##Testar suspeita de
que a média aumentou: > #Teste de hipóteses para a média populacional com σ² conhecido e
n ≥ 30. > α = 0.01 #1%, nível de significância > z = (mediaAmostral - μ) / (σ / sqrt(n)) > #Teste
Unilateral à Direita > # H0: μ = 1800 (μ ≤ 1800) Média não aumentou > # H1: μ >
1800 Média aumentou > #Rejeitar H0 se z > zα > zα = qnorm(p = 1-α, mean =
0, sd = 1, lower.tail = TRUE) > #lower.tail logical; if TRUE (default), probabilities are P[X ≤ x] >
zα = qnorm(p = α, mean = 0, sd = 1, lower.tail = FALSE) > #lower.tail logical; if FALSE,
probabilities are P[X > x]. > #Decisão: > paste0("H0: μ = μ0 (μ <= μ0); H1: Média aumentou")
[1] "H0: µ = µ0 (µ <= µ0); H1: Média aumentou" > if (z > zα) { paste0("Rejeitar H0") } else {
paste0("Não rejeitar H0") } [1] "Rejeitar H0" > ######Teste pelo P-Valor para Normal
unilateral: > #z = (mediaAmostral - μ) / (σ / sqrt(n)) > p.valor = pnorm(q = abs(z), mean = 0, sd =
1, lower.tail = FALSE) > #lower.tail logical; if FALSE, probabilities are P[X > x]. > if (p.valor > α) {
paste0("Não rejeitar H0") } else { paste0("Rejeitar H0") } [1] "Rejeitar H0"
O zero não faz parte do intervalo, logo a diferença entre as médias é diferente de zero,
portanto, os processos são diferentes.
QUESTÃO I4 OK
22 )()1)(( pZn
> # π = p / (2p-1), tal que a função tem assintota vertical em p=1/2. (e assintota horizontal em
π=1/2) > #Dessa forma é interessante que o pesquisador defina o erro admissível, (p-π).
n=Z2(π)(1−π) /(p−π)²
dπ(1−π) /dπ
QUESTÃO I5 OK
Deseja-se estimar a resistência média de certo tipo de peça com precisão de 2kg e 95% de
confiança. Desconhecendo-se a variabilidade dessa resistência, roperam-se cinco peças,
obtendo-se para elas os seguintes valores de sua resistência (em kg): 50,58,52,49,55. Com
base no resultado obtido, determinouse que deveriam ser rompidas mais quinze peças, a fim
de se conseguir o resultado desejado. Qual sua opinião a respeito dessa conclusão?
> #I5: > setwd(dir = "K:/2016_1 UFBA/ENGD02/Statistics R WDir") > closeAllConnections() >
rm(list=ls()) > ############################################################
######### > dados = c(50,58,52,49,55) > erro = 2 #kg > α = 0.05 #5%, nível de significância >
s = sd(dados) > s [1] 3.701351 > n = length(dados) > n [1] 5 > #distribuição t-Student > t = qt(p =
(α/2), df = (n-1), lower.tail = FALSE) > t [1] 2.776445 > n = ( t * s/erro )^2 > n = ceiling(n) > n #n
= 27 [1] 27 > #distribuição t-Student > #Calculando a nova probabilidade t com df=27-1: > t =
qt(p = (α/2), df = (n-1), lower.tail = FALSE) > t [1] 2.055529 > #Calculando novo n, com
erro=2kg: > n = ( t * s/erro )^2 > n = ceiling(n) > n #N = 15 [1] 15
QUESTÃO RLM1 OK Acredita-se que a vazão de vapor (em ton/h) usada mensalmente por uma
planta química está relacionada com a temperatura ambiente (em oF) daquele mês. Os usos e
temperaturas dos últimos anos estão mostradas na tabela que segue:
Mês Jan Fev Mar Abr Mai Jun Jul Ago Set Out Nov Dez Temp. 21 24 32 47 50 59 68 74 62 50 41
30 Vazão/1000 185,79 214,47 288,03 424,84 454,58 539,03 621,55 675,06 562,03 542,93
369,95 273,98
> closeAllConnections() > rm(list=ls()) > par(mar=c(4,4,1,1)) > par(mfrow=c(1,1)) > setwd(dir =
"K:/2016_1 UFBA/ENGD02/Statistics R WDir") > planta = read.table(file =
"RegressaoLinearMultipla/RLM1/PlantaQuimica.txt", header = TRUE, dec = ',') > #Importante:
Deve haver um \n ao fim do vetor de dados no arquivos .txt para evitar um alerta no RStudio >
#Transpor matriz mantendo os nomes do cabeçário: > planta =
setNames(data.frame(t(planta[,-1])), planta[,1]) > modelo = lm(planta$`Vazão/1000` ~
planta$Temp.) #Modelo Linear > summary(modelo) Call: lm(formula = planta$`Vazão/1000` ~
planta$Temp.) Residuals: Min 1Q Median 3Q Max -11.528 -8.467 -6.977 -6.130
81.014 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) -3.2621 23.0726
-0.141 0.89 planta$Temp. 9.3036 0.4673 19.910 2.24e-09 *** --Signif. codes: 0 ‘***’
0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 26.88 on 10 degrees of freedom
Multiple R-squared: 0.9754, Adjusted R-squared: 0.9729 F-statistic: 396.4 on 1 and 10 DF, p-
value: 2.243e-09 > plot(planta$Temp.)
Avaliando o p-valor do Teste de Normalidade, conclui-se que os resíduos são normais, já que o
p-valor é muito pequeno quando comparado a qualquer nível de significância.
QUESTÃO RLM7 OK
Um modelo linear multivariado foi construído para representar uma variável de um
processo. Para tanto, foi utilizado o método Stepwise. Sendo você um especialista do
processo, sugira um meio de interferir na seleção das variáveis pelo método Stepwise;
justifique sua resposta considerando inclusive conceitos estatísticos.
“Qualquer procedimento para seleção ou exclusão de variáveis de um modelo é
baseado em um algoritmo que checa a importância das variáveis, incluindo ou
excluindo-as do modelo se baseando em uma regra de decisão. A importância da
variável é definida em termos de uma medida de significância estatística do
coeficiente associado à variável para o modelo. Essa estatística depende das
suposições do modelo. No Stepwise da regressão linear um teste F é usado desde que
os erros tenham distribuição normal.”
Sabendo disso, o especialista, conhecendo o processo estudado e sabendo da
importância ou não de determinadas variáveis, poderá interferir na seleção de
variáveis alterando o nível de significância, α , do teste.
A regressão stepwise padrão adiciona e remove preditores conforme necessário em
cada etapa. O procedimento para quando todas as variáveis fora do modelo possuem
valores p maiores que o alfa especificado para inclusão e quando todas as variáveis no
modelo possuem valores p menores que ou iguais aos valores alfa para exclusão.
Variável sai do modelose p-valor ¿α Variável entra no modelo se p-valor ¿α
Dessa forma, aumenta-se o nível de significância para permitir que determinada
variável entre no modelo e diminui-se o nível de significância para fazer com que
determinada variável saia do modelo, tendo em vista a importância da variável em
questão através do teste de hipóteses.
Problemas com a regressão stepwise:2 Quando duas variáveis preditoras são
altamente correlacionadas, é possível que apenas uma fique no modelo mesmo se a
outra for importante. Como o procedimento ajusta muitos modelos, ele pode
selecionar aqueles que ajustam os dados bem apenas por acaso. A regressão
stepwise pode não parar necessariamente com o modelo com o valor R² mais alto
possível para um número especificado de preditores. Procedimentos automáticos
não consideram conhecimento especializado que o analista poderia ter sobre os
dados. Por isso o modelo selecionado pode não ser o melhor sob um ponto de vista
prático.