Escolar Documentos
Profissional Documentos
Cultura Documentos
INSTITUTO DE QUMICA
CURSO DE GRADUAO EM ENGENHARIA QUMICA
DISCIPLINA: INTRODUO QUIMIOMETRIA
AULAS PRTICAS
2015/1
OBS: O software R-studio s funciona se o software R estiver instalado tambm. Nas aulas
prticas ser usado o software R-studio.
# Download e instalao do software R:
V para o endereo: http://www.r-project.org
Clique em CRAN (Comprehensive R Archive Network).
Escolha o espelho mais prximo (No nosso caso, FIOCRUZ)
Clique em Download and Install R, Windows.
Aps instalar, v em Iniciar/Todos os Programas/R ou clique no cone na rea de trabalho.
# Download e instalao do software Rstudio:
V para o endereo: http://www.rstudio.com/products/rstudio/download/
Selecione a plataforma (Windows XP/Vista/7/8)
Faa o download do programa e instale o mesmo
Pgina 2
Pgina 3
causa <- c(143, 1039, 258, 834, 442, 275, 413, 371, 292, 1987) # criao do vetor de dados causa
names(causa) <- c("Pontos negros", "Avarias", "Manchas", "Marcas de pino", "Arranhes", "Marcas de
moldagem", "Riscos", "Marcas de afundamento", "Marcas de tinta", "Deformidades") #dando nomes
windows(); pareto.chart(causa, ylab = " Frequncia de erro ", col=rainbow(length(causa))) # criao do vetor do
diagrama de pareto
"lavender"),
Pgina 4
Titulao
% m/m
Titulao
% m/m
Titulao
% m/m
Titulao
% m/m
3,91
3,91
11
3,96
16
3,51
4,01
3,82
12
3,85
17
3,85
3,61
3,70
13
3,67
18
4,04
3,83
3,50
14
3,83
19
3,74
3,75
10
3,77
15
3,77
20
3,97
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51, 3.85, 4.04,
3.74, 3.97) #criao do vetor titulao
windows(bg="steelblue1")
hist(titulacao, main="Histograma", xlab="Titulao de cido actico", ylab="Frequncia", col="aquamarine",
border="red", fg="cadetblue4", prob=TRUE)
Pgina 5
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51, 3.85,
4.04, 3.74, 3.97) #criao de um vetor de dados
require(agricolae) # chamar pacote agricolae que j deve estar instalado
h<-graph.freq(titulacao, plot=FALSE)
points<-ojiva.freq(h,type="l",col="red",frame=FALSE,
xlab="Limite das classes", ylab="Frequncia relativa acumulada", main="Ogiva")
grid(col="black")
Pgina 6
a) P(X=9), = 7,0 segundos e = 2,0 segundos #probabilidade de X = 9 quando a mdia populacional igual a 7 e
o desvio padro populacional igual a dois.
b) P(X>9), = 7,0 segundos e = 2,0 segundos #probabilidade #probabilidade de X > 9 quando a mdia
populacional igual a 7 e o desvio padro populacional igual a dois.
c) P(7<X<9), = 7,0 segundos e = 2,0 segundos #probabilidade de 7 < X < 9 quando a mdia populacional
igual a 7 e o desvio padro populacional igual a dois
d) Grfico de probabilidade normal
#Resoluo letra A
Ou
- probabilidade
#Resoluo letra C
pnorm(9, 7, 2) - pnorm(7, 7, 2) # rea acumulada sob a Curva Normal - probabilidade
#Resoluo letra D
custo.energia <- c(96, 171, 202, 178, 147, 102, 153, 197, 127, 82, 157, 185, 90, 116, 172, 111, 148, 213, 130, 165,
141, 149, 206, 175, 123, 128, 144, 168, 109, 167, 95, 163, 150, 154, 130, 143, 187, 166, 139, 149, 108, 119, 183,
151, 114, 135, 191, 137, 129, 158) #criao do vetor custo
qqnorm(custo.energia, main="Grfico de probabilidade normal", sub="grfico", xlab="Valor de Z", ylab="Custo da
Energia Eltrica", pch=3, col="blue") #criao do grfico de probabilidade normal
qqline(custo.energia, col="red") #criao da linha de probabilidade normal
Pgina 7
O gerente de uma loja de tintas deseja estimar a verdadeira quantidade de tinta contida em latas de 1 galo,
adquiridas de um fabricante nacionalmente conhecido. As especificaes do fabricante declaram que o desviopadro da quantidade de tinta igual a 0,02 galo. Uma amostra aleatria de 50 latas selecionada, e a mdia
aritmtica da amostra para a quantidade de tinta, por lata de um galo, igual a 0,995 galo.
a) Construa uma estimativa para o intervalo de confiana de 99% da mdia aritmtica da populao
relativa quantidade de tinta contida em uma lata de 1 galo.
b) Construa uma estimativa para o intervalo de confiana de 95%.
#Resoluo letra A
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 #insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
# erro.padrao <- qnorm(0.995)*s/sqrt(n)
erro.padrao <- qnorm(0.995)*desv.pad /sqrt(n)
limite.inferior <- media - erro.padrao #clculo do limite inferior
limite.superior <- media + erro.padrao #clculo do limite superior
limite.inferior; limite.superior #exibe os valores de limite inferior e superior
# Resoluo letra B
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 # insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
erro.padrao2 <- qnorm(0.975)* desv.pad /sqrt(n) # clculo do erro padro
limite.inferior2 <- media - erro.padrao2 #clculo do limite inferior
Pgina 8
Calorias Gordura
360
370
380
400
400
16
470
20
470
20
500
24
510
19
540
30
550
23
550
30
570
25
580
19
640
29
660
29
720
30
740
30
910
40
950
56
Construa um intervalo de confiana de 95% para a mdia aritmtica da populao correspondente ao total
de gordura, em gramas por poro.
Pgina 9
frango.gordura <- c(7, 8, 4, 5, 16, 20, 20, 24, 19, 30, 23, 30, 25, 19, 29, 29, 30, 30, 40, 56) #criao do vetor de
dados
t.test(frango.gordura) #teste t de Student
Pgina 10
#Resoluo
zteor.sup <- qnorm(0.975) #valor de Z superior crtico
zteor.inf <- qnorm(0.025) valor de Z inferior crtico
zcalc <- (69.1-70) / (3.5 / sqrt(49) ) #valor de Z calculado
pvalor.z <- 2*(1-pnorm(abs(zcalc))) # clculo do p-valor
zteor.sup; zcalc; zteor.inf; pvalor.z #mostra os valores de Z crtico e calculado e p valor.
Pgina 11
tempo desde a data da consulta at o pagamento ao mdico correspondeu a 39,6 dias, e o desvio-padro da
amostra foi de 7.4 dias. Utilizando um nvel de significncia de 0,05, existem evidncias de que a mdia aritmtica
da populao se modificou em relao aos 41,4 dias?
H0: = 41.4 dias
H1: 41.4 dias
: 0.05 ; s: 7.4 dias; = 39.6 dias; n = 100 pagamentos; g.l. = 100 - 1 = 99.
# Resoluo
t <- (39.6-41.4)/(7.4/sqrt(100)) #clculo do valor de t
pvalor.t <- 2*(1-pt(abs(t),99)) #clculo do p - valor
t; pvalor.t #mostra os valores de t calculado e p valor
Pgina 12
litros e
litros. Um
engenheiro da qualidade suspeita que ambas as mquinas encham at o mesmo volume lquido mdio,
independente desse volume ser ou no de 16,0 litros. Uma amostra aleatria de 10 garrafas retirada na sada de
cada mquina:
Mquina #1 (litros)
Mquina #2 (litros)
16,03
16,01
16,02
16,03
16,04
15,96
15,97
16,04
16,05
15,98
15,96
16,02
16,05
16,02
16,01
16,01
16,02
15,99
15,99
16,00
Existe uma diferena significativa entre os valores de volume mdio nas duas mquinas, com um nvel de
significncia alfa=0,05?
# Resoluo:
maq1 <- c(16.03, 16.04, 16.05, 16.05, 16.02, 16.01, 15.96, 15.98, 16.02, 15.99) #criao do vetor de dados
maq2 <- c(16.02, 15.97, 15.96, 16.01, 15.99, 16.03, 16.04, 16.02, 16.01, 16.00) #criao do vetor de dados
D <- (mean(maq1)-mean(maq2)) #diferena entre as mdias
dp1 <- 0.020 # desvio-padro da 1 amostra
dp2 <- 0.025 # desvio-padro da 2 amostra
n <- 10 #tamanho de cada amostra. Como so iguais, ser representado apenas por n
Pgina 13
a) Supondo que as varincias das populaes de ambas as condies sejam iguais, existem evidncias de
uma diferena entre as mdias aritmticas correspondentes solidez da superfcie entre placas de ao notratadas e placas de ao tratadas? (utilize alfa=0,05).
b) Determine o p-valor em (a) e interprete seu resultado.
No Tratada
Tratada
164,368
177,135
158,239
150,226
159,018
163,903
138,216
155,62
153,871
167,802
168,006
151,233
165,096
160,818
149,654
158,653
157,184
167,433
145,456
151,204
154,496
163,538
168,178
150,869
160,92
164,525
154,321
161,657
164,917
171,23
162,763
157,016
Pgina 14
169,091
174,964
161,02
156,67
175,276
166,311
167,706
147,92
# Resoluo Letra A:
nao.trat <- c(164.368, 159.018, 153.871, 165.096, 157.184, 154.496, 160.92, 164.917, 169.091, 175.276, 177.135,
163.903, 167.802, 160.818, 167.433, 163.538, 164.525, 171.23, 174.964, 166.311) #criao do vetor de dados
trat <- c(158.239, 138.216, 168.006, 149.654, 145.456, 168.178, 154.321, 162.763, 161.02, 167.706, 150.226,
155.62, 151.233, 158.653, 151.204, 150.869, 161.657, 157.016, 156.67, 147.92) #criao do vetor de dados
med1 <- mean(nao.trat) # mdia da amostra 1
med2 <- mean(trat) #mdia da amostra 2
dp1 <- sd(nao.trat) # desvio-padro da amostra 1
dp2 <- sd(trat) #desvio-padro da amostra 2
n<-20 #tamanho da amostra
D <- (med1-med2) # diferena entre as mdias amostrais
Sp2 <- (((n-1)*dp1^2)+((n-1)*dp2^2))/((n-1)+(n-1)) # varincia agrupada
tcalc <- (D-0)/sqrt(Sp2*((1/n)+(1/n))) # valor de tcalc
tcalc #mostra o valor de t calculado
# Resoluo Letra B:
pvalor.t <- 2*(1-pt(abs(tcalc),38)) # teste bilateral, com n1+n2-2 graus de liberdade
Pgina 15
Pgina 16
Leitores
Dardos
39,5
-31,0
39,0
-1,1
-20,7
31,9
-4,5
-45,0
14,1
-8,0
-73,3
5,4
Existem evidncias de uma diferena significativa na mdia do rendimento para as trs categorias? Utilize
= 0,05. Compare o valor de F calculado com o F tabelado.
#Resoluo
dados <-c(39.5, -31.0, 39.0, -1.1, -20.7, 31.9, -4.5, -45.0, 14.1, -8.0, -73.3, 5.4) #criao do vetor de dados
rotulo <- factor(rep(c("Especialista", "Leitores", "Dardos"),1:4,12),ordered=TRUE) #criao do rtulo dos dados
resultado <- aov(dados~rotulo) #aov = anlise da varincia
resultado #mostra o resultado da anova
gl1<-3-1 #nmero de graus de liberdade 1 (gl1 = c-1, onde c o nmero de grupos)
Pgina 17
gl2<-12-3 #nmero de graus de liberdade 2 (gl2 = n c, onde c o nmero de grupos e o n tamanho total)
ssqrotulo <-9195.435 #valor de Soma quadrtica dentro dos grupos de acordo com a ANOVA
ssqresiduals <-3763.927 #valor de Soma quadrtica entre os grupos de acordo com a ANOVA
mqrotulo<-ssqrotulo/gl1 #clculo da mdia quadrtica dentro dos grupos
mqresiduals<-ssqresiduals/gl2 #clculo da mdia quadrtica entre os grupos
mqrotulo;mqresiduals #mostra as medias quadrticas calculadas
F<-mqrotulo/mqresiduals #clculo do valor de F
F #mostra o valor de F
# Resoluo
tratamento <- data.frame(rotulo=rotulo, dados=dados) #criao do data frame dos dados
Pgina 18
Pgina 19
# Resoluo letra A
sangue<-c(1, 0, 1, 2, 5, 1, 4, 6, 2, 3, 5, 4, 6, 8, 4, 5, 7, 9, 7, 6) #cria vetor de dados
sonora<-c(60, 63, 65, 70, 70, 70, 80, 80, 80, 80, 85, 89, 90, 90, 90, 90, 94, 100, 100, 100) #cria vetor de dados
plot(sonora, sangue, xlab=" Nvel da Presso Sonora (dB)", ylab=" Aumento da Presso Sangunea (mmHg)",
main="Diagrama de disperso") #construo do diagrama de Disperso
# Resoluo letra B
Pgina 20
preditos <- predict(modelo) #previso dos dados pelo mtodo dos mnimos quadrados
preditos # visualizao dos valores preditos
Atividade 3: Medidas de variao (anlise da regresso)
Fonte de
Soma
Graus de
Mdia
variao
quadrtica
liberdade
quadrtica
Regresso
SQreg
MQreg
Erro
SQres
n-2
MQres
Total
SQT
n-1
Fcalc
Valor-p
MQres/MQres
# Resoluo
anova(modelo) # anova
summary(modelo) # Obtm-se alm das SQs e MQs, o R2, o R2aj, o Erro-Padro da estimativa e o valor de
tcalc para a inclinao de uma populao (coeficientes angular e linear)
Pgina 21