Você está na página 1de 15

UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO

INSTITUTO DE QUMICA
CURSO DE GRADUAO EM ENGENHARIA QUMICA
DISCIPLINA: INTRODUO QUIMIOMETRIA
PROFESSORES: JSSICA PINHO
ADERVAL LUNA
IGOR LIMA

2015-2
INTRODUO QUIMIOMETRIA - UERJ

SUMRIO

PRTICA 0 Instalao do R e R Studio...................................................................................03


PRTICA 1 Apresentao de dados........................................................................................03
PRTICA 2 Medidas Descritivas.............................................................................................06
PRTICA 3 Distribuio Normal..............................................................................................06
PRTICA 4 Estimativa do intervalo de confiana....................................................................07
PRTICA 5 Teste de Hiptese para uma amostra..................................................................09
PRTICA 6 Teste de Hiptese para duas amostras................................................................10
PRTICA 7 Anlise da Varincia (ANOVA).............................................................................13
PRTICA 8 Regresso Linear Simples...................................................................................14

2
INTRODUO QUIMIOMETRIA - UERJ

AULA 0: GUIA DE INSTALAO DOS SOFTWARES R E R - STUDIO

OBS: O software R-studio s funciona se o software R estiver instalado tambm. Nas aulas
prticas ser usado o software R-studio.
# Download e instalao do software R:
V para o endereo: http://www.r-project.org
Clique em CRAN (Comprehensive R Archive Network).
Escolha o espelho mais prximo (No nosso caso, FIOCRUZ)
Clique em Download and Install R, Windows.
Aps instalar, v em Iniciar/Todos os Programas/R ou clique no cone na rea de trabalho.

# Download e instalao do software Rstudio:


V para o endereo: http://www.rstudio.com/products/rstudio/download/
Selecione a plataforma (Windows XP/Vista/7/8)
Faa o download do programa e instale o mesmo

PRTICA 1 APRESENTAO DE DADOS


Atividade 1: Construir uma tabela de contingncia
basedados <- c(10, 30, 20, 15) # criao de um vetor de dados
tabcontingencia <- matrix(basedados, 2, 2, byrow=TRUE) # transformao em matriz, com duas linhas,
duas colunas
tabcontingencia #para visualizar a tabela de contingncia criada
rownames(tabcontingencia) <- c("nome_linha_1", "nome_linha_2") #Insero de rtulos nas linhas
colnames(tabcontingencia) <- c("nome_coluna_1", "nome_coluna_2") #Insero de rtulos nas colunas
tabcontingencia #para visualizar a tabela de contingncia criada aps a insero dos rtulos nas linhas
e colunas
Atividade 2: Criao do grfico de barras
basedados <- c(10, 30, 20, 15) # criao de um vetor de dados
tabcontingencia <- matrix(basedados, 2, 2, byrow=TRUE) # transformao em matriz, com duas linhas,
duas colunas, por sequencia em linha
windows(); barplot(c(tabcontingencia), col="darksalmon", lwd=2, space=2, main="Grfico de barras de
quatro variveis") #grfico de barras vertical
windows(); barplot(c(tabcontingencia), col="burlywood ", lwd=2, space=3, main="Grfico de barras de
quatro variveis", horiz=TRUE, font.main=3, border=" BlueViolet") #grfico de barras horizontal, com
ttulo em itlico.
Atividade 3: Criao do grfico de pizza
sorvete.vendas <- c(0.12, 0.3, 0.26, 0.16, 0.04, 0.12) # vetor de vendas de sorvetes, em kg.
names(sorvete.vendas) <- c("Blueberry", "Cherry", "Apple", "Boston Cream", "Other", "Vanilla Cream") #
adicionando nomes

3
INTRODUO QUIMIOMETRIA - UERJ

windows(); pie(sorvete.vendas, col = c("purple", "violetred1", "green3", "cornsilk", "cyan", "white"),


main="Grfico de pizza", sub="Sorvetes") # criao do grfico de setores
Atividade 4: Construir um diagrama de Diagrama de Pareto
require(qcc) # carregar pacote qcc (Quality Control Charts) que j deve estar previamente instalado
causa <- c(143, 1039, 258, 834, 442, 275, 413, 371, 292, 1987) # criao do vetor de dados causa
names(causa) <- c("Pontos negros", "Avarias", "Manchas", "Marcas de pino", "Arranhes", "Marcas de
moldagem", "Riscos", "Marcas de afundamento", "Marcas de tinta", "Deformidades") #dando nomes
windows(); pareto.chart(causa, ylab = " Frequncia de erro ", col=rainbow(length(causa))) # criao do
vetor do diagrama de pareto

Atividade 5: Construir um grfico de barras paralelas


risco <- c(332, 132, 16, 14, 113, 231) # criao de um vetor de dados
tabcont.risco <- matrix(risco, 2, 3, byrow=TRUE) # transformao em matriz, com duas linhas, duas
colunas
tabcont.risco #visualizao da matriz criada
rownames(tabcont.risco) <- c("Crescimento", "Valorizao") #Insero de rtulos nas linhas
colnames(tabcont.risco) <- c("Alto", "Mdio", "Baixo") #Insero de rtulos nas colunas
tabcont.risco #visualizao da matriz criada aps a insero de rtulos nas linhas e colunas
windows(); barplot(tabcont.risco, beside=FALSE, col=c("mistyrose", "lightcyan", "lavender"),
legend=rownames(tabcont.risco), ylim=c(0, 350)) # criao do grfico de barras paralelas.
Atividade 6: Construir um grfico de ramos-e-folhas
set.seed(165) # Inicializao de um gerador de nmeros aleatrios reprodutvel
aleatorio <- runif(50) # criao de 50 nmeros aleatrios, oriundos de uma distribuio uniforme
stem(aleatorio, scale=2, width=80, atom=1e-08) #criao do grfico de ramos-e-folhas
Atividade 7: Construir um Histograma
A tabela abaixo mostra o resultado de 20 titulaes feitas no mesmo lote de vinagre usando a soluo
de NaOH 0,100 mol.L-1 e fenolftalena como indicador do ponto final da titulao. A concentrao de
cido actico obtida na amostra de vinagre em percentagem mssica (% m/m):
Titulao % m/m Titulao % m/m Titulao % m/m Titulao % m/m
1 3,91 6 3,91 11 3,96 16 3,51
2 4,01 7 3,82 12 3,85 17 3,85
3 3,61 8 3,70 13 3,67 18 4,04
4 3,83 9 3,50 14 3,83 19 3,74
5 3,75 10 3,77 15 3,77 20 3,97
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51,
3.85, 4.04, 3.74, 3.97) #criao do vetor titulao
windows(bg="steelblue1")

4
INTRODUO QUIMIOMETRIA - UERJ

hist(titulacao, main="Histograma", xlab="Titulao de cido actico", ylab="Frequncia",


col="aquamarine", border="red", fg="cadetblue4", prob=TRUE)
Atividade 8: Construir um Polgono de Percentagens
# Construir um polgono de frequncias sobre o histograma
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77,
3.51, 3.85, 4.04, 3.74, 3.97) #criao de um vetor de dados
require(agricolae) # chamar pacote agricolae que j deve estar instalado
windows(bg="white")
h1 <- hist(titulacao)
polygon.freq(h1,frequency=1,col="red") #construo do polgono de porcentagens
Atividade 9: Construir um Polgono de Percentagem Acumulada (Ogiva)
# Construir um polgono de percentagens acumuladas (OGIVA)
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77,
3.51, 3.85, 4.04, 3.74, 3.97) #criao de um vetor de dados
require(agricolae) # chamar pacote agricolae que j deve estar instalado
h<-graph.freq(titulacao, plot=FALSE)
points<-ogive.freq(h,type="l",col="red",frame=FALSE,
xlab="Limite das classes", ylab="Frequncia relativa acumulada", main="Ogiva")
grid(col="black")
Atividade 10: Grfico de disperso dos dados
Calorias <- c(240, 260, 350, 350, 420, 510, 530) #criao do vetor de dados
Gordura <- c(8.0, 3.5, 22.0, 20.0, 16.0, 22.0, 19.0) #criao do vetor de dados
windows(); plot(Gordura, Calorias, col= "red", pch= 18, main="Grfico de disperso", xlab= "Gordura",
ylab= "Calorias") # grfico de disperso
windows(); plot(Calorias ~ Gordura, col= "red", pch= 18, main="Grfico de disperso", xlab= "Gordura",
ylab= "Calorias") #outro comando para o grfico de disperso
cor(Calorias, Gordura) # coeficiente de correlao de Pearson
m <- lm(Calorias ~ Gordura) #modelo de regresso por mnimos quadrados
abline(m) #curva de regresso por mnimos quadrados
legend(5, 500, "r = 0,72", pch=18, col="red") # coloca legenda (escala mximo de 500, coeficiente de
correlao de Pearson que nesse caso igual a 0,72)
cov(Gordura, Calorias) #covarincia
cor(Gordura, Calorias) #correlao

5
INTRODUO QUIMIOMETRIA - UERJ

PRTICA 2 ESTATSTICA DESCRITIVA

Atividade 1: Estatstica Descritiva


Suponha que uma agncia bancria, localizada em rea residencial, esteja preocupada com o horrio
de pico do almoo, das 12 s 13 horas. Foi registrado o tempo de espera, em minutos, de uma amostra
de 15 clientes, durante esse horrio, ao longo do perodo de uma semana. Os resultados so
apresentados a seguir:
9,66 / 5,90 / 8,02 / 5,79 / 8,73 / 3,82 / 8,01 / 8,35 / 10,49 / 6,68 / 5,64 / 4,08 / 6,17 / 9,91 / 5,47
a) Calcule a mdia aritmtica, a mediana, o primeiro e o terceiro quartil.
b) Calcule a varincia, o desvio padro, a amplitude, a amplitude interquartil, o coeficiente de
variao e os escores Z.
#Resoluo letra A
tempo.espera <- c(9.66, 5.90, 8.02, 5.79, 8.73, 3.82, 8.01, 8.35, 10.49, 6.68, 5.64, 4.08, 6.17, 9.91, 5.47)
#criao do vetor tempo de espera
summary(tempo.espera) # Resumo dos cinco nmeros
# Resoluo letra B
var(tempo.espera) # varincia
sd(tempo.espera) # desvio-padro
max(tempo.espera) - min(tempo.espera) # amplitude
IQR(tempo.espera) # amplitude interquartil
tem.esp.rsd <- (sd(tempo.espera)/mean(tempo.espera))*100 # coeficiente de variao
tem.esp.rsd #visualizao do coeficiente de variao
z <- scale(tempo.espera) # padronizao dos dados
z # mostra os valores dos dados padronizados

PRTICA 3 DISTRIBUIO NORMAL

Atividade 1: Distribuio Normal Padronizada

a) P(X=9), = 7,0 segundos e = 2,0 segundos #probabilidade de X = 9 quando a mdia populacional


igual a 7 e o desvio padro populacional igual a dois.
b) P(X>9), = 7,0 segundos e = 2,0 segundos #probabilidade #probabilidade de X > 9 quando a
mdia populacional igual a 7 e o desvio padro populacional igual a dois.
c) P(7<X<9), = 7,0 segundos e = 2,0 segundos #probabilidade de 7 < X < 9 quando a mdia
populacional igual a 7 e o desvio padro populacional igual a dois
d) Grfico de probabilidade normal
#Resoluo letra A

6
INTRODUO QUIMIOMETRIA - UERJ

pnorm(9, 7, 2, log=FALSE) # rea acumulada sob a Curva Normal - probabilidade


#Resoluo letra B
1 - pnorm(9, 7, 2, log = FALSE) Ou pnorm(9, 7, 2, lower.tail = FALSE) # rea acumulada sob
a Curva Normal - probabilidade
#Resoluo letra C
pnorm(9, 7, 2) - pnorm(7, 7, 2) # rea acumulada sob a Curva Normal - probabilidade
#Resoluo letra D
custo.energia <- c(96, 171, 202, 178, 147, 102, 153, 197, 127, 82, 157, 185, 90, 116, 172, 111, 148,
213, 130, 165, 141, 149, 206, 175, 123, 128, 144, 168, 109, 167, 95, 163, 150, 154, 130, 143, 187, 166,
139, 149, 108, 119, 183, 151, 114, 135, 191, 137, 129, 158) #criao do vetor custo
qqnorm(custo.energia, main="Grfico de probabilidade normal", sub="grfico quartil-quartil", xlab="Valor
de Z", ylab="Custo da Energia Eltrica", pch=3, col="blue") #criao do grfico de probabilidade normal
qqline(custo.energia, col="red") #criao da linha de probabilidade normal

Atividade 2: Construo do grfico de distribuio normal


x <- seq(1,20,length=1000) # os valores 1 e 20 so os valores mnimo e mximo respectivamente da
sequncia de dados
y <- dnorm(x,mean=12, sd=2) # distribuio normal com mdia 12 e desvio padro igual a 2
y1 <- dnorm(x,mean=10, sd=3) # distribuio normal com mdia 10 e desvio padro igual a 3
y2 <- dnorm(x,mean=11, sd=3) # distribuio normal com mdia 11 e desvio padro igual a 3
windows(); plot(x,y,type= "l", lwd=3, col="black", main="Distribuio Normal")
lines(x,y1, lty=2, col="red", lwd=3)
lines(x,y2, lty=3, col="green", lwd=3)
legend("topleft", c("mdia=12 dp=2", "mdia=10 dp=3", "mdia=11 dp=3"), lty=1:3, col=c("black", "red",
"green"), lwd=2)

PRTICA 4 ESTIMATIVA DO INTERVALO DE CONFIANA

Atividade 1: Estimativa do Intervalo de Confiana para a Mdia Aritmtica (desvio padro


conhecido):

O gerente de uma loja de tintas deseja estimar a verdadeira quantidade de tinta contida em latas de 1
galo, adquiridas de um fabricante nacionalmente conhecido. As especificaes do fabricante declaram
que o desvio-padro da quantidade de tinta igual a 0,02 galo. Uma amostra aleatria de 50 latas
selecionada, e a mdia aritmtica da amostra para a quantidade de tinta, por lata de um galo, igual a
0,995 galo.
a) Construa uma estimativa para o intervalo de confiana de 99% da mdia aritmtica da populao
relativa quantidade de tinta contida em uma lata de 1 galo.
b) Construa uma estimativa para o intervalo de confiana de 95%.

7
INTRODUO QUIMIOMETRIA - UERJ

#Resoluo letra A
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 #insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
# erro.padrao <- qnorm(0.995)*s/sqrt(n)
erro.padrao <- qnorm(0.995)*desv.pad /sqrt(n)
limite.inferior <- media - erro.padrao #clculo do limite inferior
limite.superior <- media + erro.padrao #clculo do limite superior
limite.inferior; limite.superior #exibe os valores de limite inferior e superior
# Resoluo letra B
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 # insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
erro.padrao2 <- qnorm(0.975)* desv.pad /sqrt(n) # clculo do erro padro
limite.inferior2 <- media - erro.padrao2 #clculo do limite inferior
limite.superior2 <- media + erro.padrao2 #clculo do limite superior
limite.inferior2; limite.superior2 #exibe os valores dos limites inferior e superior

Atividade 2: Estimativa do Intervalo de Confiana para a Mdia Aritmtica (desvio padro


desconhecido):
Os dados contidos na tabela a seguir representam o total de gordura, em gramas por poro, de uma
amostra de 20 sanduches de frango, selecionados de cadeias de lanchonetes.
Caloria Gordur
Sanduche s a
Grelhado de Frango Mximo da Wendy 360 7
Original Baja Taco com Frango Tostado da Baja Fresh 370 8
Baguette de Frango Grelhado BBQ Fire Defumado da Burger
King 380 4
Frango Honey Bourbon no Po Integral da Quiznos Sub 400 5
Chicken McGrill do McDonalds 400 16
Frango Grelhado Hot Sub da Blimpie 470 20
Peito de Frango Assado no Forno da Subway 470 20
Frango Bfalo Hot Sub da Blimpie 500 24
Fil de Frango Condimentado da Wendy 510 19
Soft Taco de Frango Rancheiro da Taco Bell (dois tacos) 540 30
Enrolado Macio de Frango Tostado ao Forno da KFC 550 23
Frango Bfalo Sub da Subway 550 30
Chicken Whooper da Burger King 570 25
Frango Arizona da Au Bon Pain 580 19
Talhado de Frango da Boston Market Rotisserie 640 29
Tacos Macios com Frango da Chipolte 660 29
Frango Grelhado com Tomates, Manjerico e Mussarela, da Cosi 720 30
Pesto Panini de Frango Grelhado no Carvo, da Atlanta Bread
Company 740 30
Pomodori Panini de Frango da Corner Bakery Caf 910 40
Frango Toscano no molho Foccacia Rosemary & Cebola da
Panera Bread 950 56

Construa um intervalo de confiana de 95% para a mdia aritmtica da populao correspondente ao


total de gordura, em gramas por poro.

8
INTRODUO QUIMIOMETRIA - UERJ

frango.gordura <- c(7, 8, 4, 5, 16, 20, 20, 24, 19, 30, 23, 30, 25, 19, 29, 29, 30, 30, 40, 56) #criao do
vetor de dados
n<-20
ttab<-(qt=0.975,df=n-1) # valor de t tabelado
ttab #exibe o t tabelado
t.test(frango.gordura) #teste t de Student

Atividade 3: Determinar o tamanho da amostra para estimar a mdia aritmtica


Uma pesquisa planejada para determinar a mdia aritmtica das despesas mdicas familiares anuais
de empregados de uma grande empresa. A administrao da empresa deseja estar 95% confiante de
que a mdia aritmtica da amostra est correta dentro dos limites de $50 em relao mdia
aritmtica da populao correspondente a despesas mdicas familiares anuais. Um estudo anterior
indica que o desvio-padro aproximadamente igual a $400.
a) De que tamanho precisa ser a amostra?
b) Se a administrao deseja estar correta dentro dos limites de $25, que tamanho de amostra
necessrio?
#Resoluo letra A

Z <- qnorm(.975); #valor crtico de Z superior


Sigma <- 400; #valor crtico de Z inferior
Erro <- 50 #valor do erro
N <- (Z^2)*(Sigma^2)/(Erro^2) # clculo do tamanho da amostra
N # exibe o valor do tamanho da amostra
#Resoluo letra B

Z <- qnorm(0.975); #valor de Z crtico superior


Sigma <- 400; #valor do desvio padro
Erro2 <- 25 # valor do erro
N2 <- (Z^2)*(Sigma^2)/(Erro2^2) #clculo do tamanho da amostra
N2 #exibe o tamanho da amostra

PRTICA 5 TESTE DE HIPTESE PARA UMA AMOSTRA

Atividade 1: Utilizando o teste Z para a mdia aritmtica, conhecido


O gerente de operaes de uma fbrica de tecidos precisa determinar se uma nova mquina est
produzindo um determinado tipo de tecido de acordo com as especificaes do fabricante, que indicam
que o tecido deve ter uma mdia aritmtica de resistncia ao rompimento equivalente a 70 libras e um
desvio-padro de 3,5 libras. Uma amostra de 49 peas
H0: = 70 lb
H1: 70 lb.
: 0.05 ; : 3.5 lb; = 69.1; n = 49 peas

#Resoluo
zteor.sup <- qnorm(0.975) #valor de Z superior crtico
zteor.inf <- qnorm(0.025) valor de Z inferior crtico
zcalc <- (69.1-70) / (3.5 / sqrt(49) ) #valor de Z calculado
pvalor.z <- 2*(1-pnorm(abs(zcalc))) # clculo do p-valor

9
INTRODUO QUIMIOMETRIA - UERJ

zteor.sup; zcalc; zteor.inf; pvalor.z #mostra os valores de Z crtico e calculado e p valor.


# OBS.: Para teste unilateral superior e inferior:
pvalor.zsup <- 1-pnorm(zcalc) # valor-p do teste unilateral superior
pvalor.zinf <- pnorm(zcalc) # valor-p do teste unilateral inferior
Atividade 2: Utilizando o teste t para a mdia aritmtica, desconhecido.
O atraso em pagamentos por servios mdicos pode fazer crescerem os custos da assistncia mdica.
Um artigo relatou que a mdia aritmtica do tempo desde a data da consulta at o pagamento ao
mdico pelas seguradoras correspondeu a 41,4 dias, durante um perodo recente. Suponha que seja
selecionada uma amostra de 100 solicitaes de pagamento a mdicos durante o perodo mais recente.
A mdia aritmtica da amostra para o tempo desde a data da consulta at o pagamento ao mdico
correspondeu a 39,6 dias, e o desvio-padro da amostra foi de 7.4 dias. Utilizando um nvel de
significncia de 0,05, existem evidncias de que a mdia aritmtica da populao se modificou em
relao aos 41,4 dias?
H0: = 41.4 dias
H1: 41.4 dias
: 0.05 ; s: 7.4 dias; = 39.6 dias; n = 100 pagamentos; g.l. = 100 - 1 = 99.

# Resoluo
t <- (39.6-41.4)/(7.4/sqrt(100)) #clculo do valor de t
pvalor.t <- 2*(1-pt(abs(t),99)) #clculo do p valor
n<-100
ttab<-qt(0.975,n-1) #valor de t tabelado
ttab #exibe o valor de t tabelado
t; pvalor.t #mostra os valores de t calculado e p valor
# OBS: Para testes unilaterais superior ou inferior:
pvalor.tsup <- (1-pt(t,99)) # valor-p do teste unilateral superior
pvalor.tinf <- pt(t,99) # valor-p do teste unilateral inferior

PRTICA 6 TESTE DE HIPTESE PARA DUAS AMOSTRAS

Atividade 1: Dados independentes (teste Z)


Duas mquinas so usadas para encher garrafas de plstico com um volume lquido de 16,0 litros. O
volume de enchimento pode ser suposto normal, com um desvio-padro de litros e
litros. Um engenheiro da qualidade suspeita que ambas as mquinas encham at o mesmo
volume lquido mdio, independente desse volume ser ou no de 16,0 litros. Uma amostra aleatria de
10 garrafas retirada na sada de cada mquina:

10
INTRODUO QUIMIOMETRIA - UERJ

Mquina #1 (litros) Mquina #2 (litros)


16,03 16,01 16,02 16,03
16,04 15,96 15,97 16,04
16,05 15,98 15,96 16,02
16,05 16,02 16,01 16,01
16,02 15,99 15,99 16,00
Existe uma diferena significativa entre os valores de volume mdio nas duas mquinas, com um nvel
de significncia alfa=0,05?

# Resoluo:
maq1 <- c(16.03, 16.04, 16.05, 16.05, 16.02, 16.01, 15.96, 15.98, 16.02, 15.99) #criao do vetor de
dados
maq2 <- c(16.02, 15.97, 15.96, 16.01, 15.99, 16.03, 16.04, 16.02, 16.01, 16.00) #criao do vetor de
dados
D <- (mean(maq1)-mean(maq2)) #diferena entre as mdias
dp1 <- 0.020 # desvio-padro da 1 amostra
dp2 <- 0.025 # desvio-padro da 2 amostra
n <- 10 #tamanho de cada amostra. Como so iguais, ser representado apenas por n
zsup <- qnorm(0.975) #valor de Z crtico superior
zinf <- qnorm(0.025) #valor de Z crtico inferior
zcalc <-((D) - 0)/sqrt(((dp1^2)/n)+((dp2^2)/n)) # valor de Z calculado
pvalor.z <- 2*(1-pnorm(abs(zcalc))) # clculo do p - valor
zinf; zcalc; zsup; pvalor.z #mostra os valores de Z crtico superior e inferior e Z calculado e p valor.

Atividade 2: Dados independentes (Teste T)


Na gravao de entalhe, um desenho, ou figura, entalhado na superfcie de um metal resistente ou de
uma pedra. Suponha que seja projetado um experimento com o objetivo de comparar diferenas em
termos da mdia aritmtica da solidez da superfcie das placas de ao utilizadas na gravao em
entalhe (medida em termos tcnicos especficos para o entalhe), com base em duas diferentes
condies de superfcie no-tratada e ligeiramente polida com esmeril. No experimento, 40 placas de
ao so distribudas aleatoriamente 20 que no so tratadas e 20 que so ligeiramente polidas.
a) Supondo que as varincias das populaes de ambas as condies sejam iguais, existem evidncias
de uma diferena entre as mdias aritmticas correspondentes solidez da superfcie entre placas de
ao no-tratadas e placas de ao tratadas? (utilize alfa=0,05).
b) Determine o p-valor em (a) e interprete seu resultado.

11
INTRODUO QUIMIOMETRIA - UERJ

No Tratada Tratada
164,368 177,135 158,239 150,226
159,018 163,903 138,216 155,62
153,871 167,802 168,006 151,233
165,096 160,818 149,654 158,653
157,184 167,433 145,456 151,204
154,496 163,538 168,178 150,869
160,92 164,525 154,321 161,657
164,917 171,23 162,763 157,016
169,091 174,964 161,02 156,67
175,276 166,311 167,706 147,92

# Resoluo Letra A:
nao.trat <- c(164.368, 159.018, 153.871, 165.096, 157.184, 154.496, 160.92, 164.917, 169.091,
175.276, 177.135, 163.903, 167.802, 160.818, 167.433, 163.538, 164.525, 171.23, 174.964, 166.311)
#criao do vetor de dados
trat <- c(158.239, 138.216, 168.006, 149.654, 145.456, 168.178, 154.321, 162.763, 161.02, 167.706,
150.226, 155.62, 151.233, 158.653, 151.204, 150.869, 161.657, 157.016, 156.67, 147.92) #criao do
vetor de dados
med1 <- mean(nao.trat) # mdia da amostra 1
med2 <- mean(trat) #mdia da amostra 2
dp1 <- sd(nao.trat) # desvio-padro da amostra 1
dp2 <- sd(trat) #desvio-padro da amostra 2
n<-20 #tamanho da amostra
D <- (med1-med2) # diferena entre as mdias amostrais
Sp2 <- (((n-1)*dp1^2)+((n-1)*dp2^2))/((n-1)+(n-1)) # varincia agrupada
tcalc <- (D-0)/sqrt(Sp2*((1/n)+(1/n))) # valor de tcalc
tcalc #mostra o valor de t calculado
# Resoluo Letra B:
pvalor.t <- 2*(1-pt(abs(tcalc),38)) # teste bilateral, com n1+n2-2 graus de liberdade
pvalor.t #mostra o p - valor
# OBS: para teste unilateral superior e inferior
pvalor.tsup <- (1-pt(tcalc,38)) # valor-p do teste unilateral superior
pvalor.tinf <- pt(tcalc,38) # valor-p do teste unilateral inferior

12
INTRODUO QUIMIOMETRIA - UERJ

Atividade 3: Dados dependentes (teste T)


g1<-c(6,20,3,0,4) #grupo antes
g2<-c(4,6,2,0,0) #grupo depois
d<-g1-g2 #diferena entre os dados dos grupos
n<-5 #tamanho das amostras
Dmedia<-mean(d) # clculo da mdia
DpD<-sd(d) #clculo do desvio padro
tcalc<-(Dmedia 0)/(DpD/sqrt(n)) #clculo do valor de t
tcalc #exibe o valor de t calculado
ttab<-qt(0.975,n-1) #valor de t tabelado
ttab #exibe o valor de t tabelado

Atividade 4: Teste para homogeneidade das varincias (Teste de Levene)


Existem evidncias de uma diferena significativa na variao nos rendimentos para as trs categorias?
(utilize alfa=0,05).
dados <-c(39.5, -31.0, 39.0, -1.1, -20.7, 31.9, -4.5, -45.0, 14.1, -8.0, -73.3, 5.4) #criao do vetor de
dados
rotulo <- factor(rep(c("Especialista", "Leitores", "Dardos"),1:4,12),ordered=TRUE) #criao do rtulo dos
dados
tratamento <- data.frame(rotulo=rotulo, dados=dados) #criao do data frame dos dados
tratamento # exibe tratamento
require(car) #requere o pacote j previamente instalado
leveneTest(dados, rotulo) #teste de Levene modificado (diferena absoluta da mediana)
leveneTest(dados, rotulo, center=mean) #teste de Levene original (diferena absoluta da mdia)

PRTICA 7 ANOVA

Atividade 1: Utilizando o teste ANOVA de fator nico


Periodicamente, o The Wall Street Journal conduz um concurso de escolha de aes. O mais
recente foi conduzido em maro de 2001. Nesse experimento, trs diferentes mtodos foram
utilizados para selecionar aes que se esperava apresentassem um bom desempenho nos
cinco meses subsequentes. Quatro profissionais de Wall Street, considerados especialistas em
escolha de aes, selecionaram, cada um deles, uma ao. Quatro leitores do The Wall Street
Journal, escolhidos aleatoriamente, selecionaram cada um uma ao. Por fim, quatro aes
foram selecionadas por arremesso de dardos em um alvo contendo uma lista de aes. Os

13
INTRODUO QUIMIOMETRIA - UERJ

rendimentos das aes selecionadas, no perodo entre 20 de maro de 2001 at 31 de agosto


de 2001 (em termos do percentual de rendimento) esto apresentados a seguir:
Especialistas Leitores Dardos
39,5 -31,0 39,0
-1,1 -20,7 31,9
-4,5 -45,0 14,1
-8,0 -73,3 5,4
Existem evidncias de uma diferena significativa na mdia do rendimento para as trs categorias?
Utilize = 0,05. Compare o valor de F calculado com o F tabelado.

#Resoluo
dados <-c(39.5, -31.0, 39.0, -1.1, -20.7, 31.9, -4.5, -45.0, 14.1, -8.0, -73.3, 5.4) #criao do vetor de
dados
rotulo <- factor(rep(c("Especialista", "Leitores", "Dardos"),1:4,12),ordered=TRUE) #criao do rtulo dos
dados
resultado <- aov(dados~rotulo) #aov = anlise da varincia
resultado #mostra o resultado da anova
gl1<-3-1 #nmero de graus de liberdade 1 (gl1 = c-1, onde c o nmero de grupos)
gl2<-12-3 #nmero de graus de liberdade 2 (gl2 = n c, onde c o nmero de grupos e o n tamanho
total)
ssqrotulo <-9195.435 #valor de Soma quadrtica dentro dos grupos de acordo com a ANOVA
ssqresiduals <-3763.927 #valor de Soma quadrtica entre os grupos de acordo com a ANOVA
mqrotulo<-ssqrotulo/gl1 #clculo da mdia quadrtica dentro dos grupos
mqresiduals<-ssqresiduals/gl2 #clculo da mdia quadrtica entre os grupos
mqrotulo;mqresiduals #mostra as medias quadrticas calculadas
F<-mqrotulo/mqresiduals #clculo do valor de F
F #mostra o valor de F

14
INTRODUO QUIMIOMETRIA - UERJ

PRTICA 8 REGRESSO LINEAR SIMPLES

Atividade 1: Regresso por mnimos quadrados


Um artigo descreveu um estudo investigando a relao entre exposio ao barulho e hipertenso. Os
seguintes dados so representativos daqueles reportados no artigo: para o parmetro Aumento da
Presso Sangunea (mmHg): 1, 0, 1, 2, 5, 1, 4, 6, 2, 3, 5, 4, 6, 8, 4, 5, 7, 9, 7 e 6. J para o parmetro
Nvel da Presso Sonora (dB): 60, 63, 65, 70, 70, 70, 80, 80, 80, 80, 85, 89, 90, 90, 90, 90, 94, 100,
100 e 100.
a) Desenhe um diagrama de disperso de y (aumento da presso sangunea) versus x (nvel da
presso sonora). Parece razovel propor um modelo de regresso linear simples para essa situao?
b) Ajuste o modelo de regresso linear simples usando o mtodo dos mnimos quadrados.
# Resoluo letra A
sangue<-c(1, 0, 1, 2, 5, 1, 4, 6, 2, 3, 5, 4, 6, 8, 4, 5, 7, 9, 7, 6) #cria vetor de dados
sonora<-c(60, 63, 65, 70, 70, 70, 80, 80, 80, 80, 85, 89, 90, 90, 90, 90, 94, 100, 100, 100) #cria vetor de
dados
plot(sonora, sangue, xlab=" Nvel da Presso Sonora (dB)", ylab=" Aumento da Presso Sangunea
(mmHg)", main="Diagrama de disperso") #construo do diagrama de Disperso
# Resoluo letra B

modelo <- lm(sangue~sonora) # regresso linear, y em funo de x


plot(sonora, sangue, xlab=" Nvel da Presso Sonora (dB)", ylab=" Aumento da Presso Sangunea
(mmHg)", main="Regresso linear simples", pch=3)
abline(modelo, col="red") # desenho da reta de mnimos quadrados, com os coeficientes angular e
linear do modelo calculado.
Atividade 2: previso com equao por mnimos quadrados
preditos <- predict(modelo) #previso dos dados pelo mtodo dos mnimos quadrados
preditos # visualizao dos valores preditos
Atividade 3: Construo do grfico de resduos
residuos<-sangue-preditos
plot(sonora, residuos, xlab=" Nvel da Presso Sonora (dB)", ylab=" Resduos (mmHg)", main="Grfico
de resduos") #construo do grfico de resduos

15