Você está na página 1de 21

UNIVERSIDADE DO ESTADO DO RIO DE JANEIRO

INSTITUTO DE QUMICA
CURSO DE GRADUAO EM ENGENHARIA QUMICA
DISCIPLINA: INTRODUO QUIMIOMETRIA
AULAS PRTICAS

Prof. Dr. Aderval S. Luna


Prof. MSc. Igor Campos de Almeida Lima
Prof MSc. Jssica da Silva Alves de Pinho

2015/1

AULA 0: GUIA DE INSTALAO DOS SOFTWARES R E R - STUDIO

OBS: O software R-studio s funciona se o software R estiver instalado tambm. Nas aulas
prticas ser usado o software R-studio.
# Download e instalao do software R:
V para o endereo: http://www.r-project.org
Clique em CRAN (Comprehensive R Archive Network).
Escolha o espelho mais prximo (No nosso caso, FIOCRUZ)
Clique em Download and Install R, Windows.
Aps instalar, v em Iniciar/Todos os Programas/R ou clique no cone na rea de trabalho.
# Download e instalao do software Rstudio:
V para o endereo: http://www.rstudio.com/products/rstudio/download/
Selecione a plataforma (Windows XP/Vista/7/8)
Faa o download do programa e instale o mesmo

Pgina 2

AULA PRTICA 1 R STUDIO


Atividade 1: Construir uma tabela de contingncia

basedados <- c(10, 30, 20, 15) # criao de um vetor de dados


tabcontingencia <- matrix(basedados, 2, 2, byrow=TRUE) # transformao em matriz, com duas linhas,
duas colunas
tabcontingencia #para visualizar a tabela de contingncia criada
rownames(tabcontingencia) <- c("nome_linha_1", "nome_linha_2") #Insero de rtulos nas linhas
colnames(tabcontingencia) <- c("nome_coluna_1", "nome_coluna_2") #Insero de rtulos nas colunas
tabcontingencia #para visualizar a tabela de contingncia criada aps a insero dos rtulos nas linhas e
colunas
Atividade 2: Criao do grfico de barras

basedados <- c(10, 30, 20, 15) # criao de um vetor de dados


tabcontingencia <- matrix(basedados, 2, 2, byrow=TRUE) # transformao em matriz, com duas linhas,
duas colunas, por sequencia em linha
windows(); barplot(c(tabcontingencia), col="darksalmon", lwd=2, space=2, main="Grfico de barras de quatro
variveis") #grfico de barras vertical
windows(); barplot(c(tabcontingencia), col="burlywood ", lwd=2, space=3, main="Grfico de barras de quatro
variveis", horiz=TRUE, font.main=3, border=" BlueViolet") #grfico de barras horizontal, com ttulo em itlico.

Atividade 3: Criao do grfico de pizza


sorvete.vendas <- c(0.12, 0.3, 0.26, 0.16, 0.04, 0.12) # vetor de vendas de sorvetes, em kg.
names(sorvete.vendas) <- c("Blueberry", "Cherry", "Apple", "Boston Cream", "Other", "Vanilla Cream") #
adicionando nomes
windows(); pie(sorvete.vendas, col = c("purple", "violetred1", "green3", "cornsilk", "cyan", "white"),
main="Grfico de pizza", sub="Sorvetes") # criao do grfico de setores

Atividade 4: Construir um diagrama de Diagrama de Pareto


require(qcc) # carregar pacote qcc (Quality Control Charts) que j deve estar previamente instalado

Pgina 3

causa <- c(143, 1039, 258, 834, 442, 275, 413, 371, 292, 1987) # criao do vetor de dados causa
names(causa) <- c("Pontos negros", "Avarias", "Manchas", "Marcas de pino", "Arranhes", "Marcas de
moldagem", "Riscos", "Marcas de afundamento", "Marcas de tinta", "Deformidades") #dando nomes
windows(); pareto.chart(causa, ylab = " Frequncia de erro ", col=rainbow(length(causa))) # criao do vetor do
diagrama de pareto

Atividade 5: Construir um grfico de barras paralelas


risco <- c(332, 132, 16, 14, 113, 231) # criao de um vetor de dados
tabcont.risco <- matrix(risco, 2, 3, byrow=TRUE) # transformao em matriz, com duas linhas, duas colunas
tabcont.risco #visualizao da matriz criada
rownames(tabcont.risco) <- c("Crescimento", "Valorizao") #Insero de rtulos nas linhas
colnames(tabcont.risco) <- c("Alto", "Mdio", "Baixo") #Insero de rtulos nas colunas
tabcont.risco #visualizao da matriz criada aps a insero de rtulos nas linhas e colunas
windows();
barplot(tabcont.risco,
beside=FALSE,
col=c("mistyrose",
"lightcyan",
legend=rownames(tabcont.risco), ylim=c(0, 350)) # criao do grfico de barras paralelas.

"lavender"),

Atividade 6: Construir um grfico de ramos-e-folhas


set.seed(165) # Inicializao de um gerador de nmeros aleatrios reprodutvel
aleatorio <- runif(50) # criao de 50 nmeros aleatrios, oriundos de uma distribuio uniforme
stem(aleatorio, scale=2, width=80, atom=1e-08) #criao do grfico de ramos-e-folhas

Atividade 7: Construir um Histograma


A tabela abaixo mostra o resultado de 20 titulaes feitas no mesmo lote de vinagre usando a soluo de NaOH
0,100 mol.L-1 e fenolftalena como indicador do ponto final da titulao. A concentrao de cido actico obtida
na amostra de vinagre em percentagem mssica (% m/m):

Pgina 4

Titulao

% m/m

Titulao

% m/m

Titulao

% m/m

Titulao

% m/m

3,91

3,91

11

3,96

16

3,51

4,01

3,82

12

3,85

17

3,85

3,61

3,70

13

3,67

18

4,04

3,83

3,50

14

3,83

19

3,74

3,75

10

3,77

15

3,77

20

3,97

titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51, 3.85, 4.04,
3.74, 3.97) #criao do vetor titulao
windows(bg="steelblue1")
hist(titulacao, main="Histograma", xlab="Titulao de cido actico", ylab="Frequncia", col="aquamarine",
border="red", fg="cadetblue4", prob=TRUE)

Atividade 8: Construir um Polgono de Percentagens


# Construir um polgono de frequncias sobre o histograma
titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51, 3.85,
4.04, 3.74, 3.97) #criao de um vetor de dados
require(agricolae) # chamar pacote agricolae que j deve estar instalado
windows(bg="white")
h1 <- hist(titulacao)
polygon.freq(h1,frequency=1,col="red") #construo do polgono de porcentagens

Atividade 9: Construir um Polgono de Percentagem Acumulada (Ogiva)


# Construir um polgono de percentagens acumuladas (OGIVA)

Pgina 5

titulacao <- c(3.91, 4.01, 3.61, 3.83, 3.75, 3.91, 3.82, 3.70, 3.50, 3.77, 3.96, 3.85, 3.67, 3.83, 3.77, 3.51, 3.85,
4.04, 3.74, 3.97) #criao de um vetor de dados
require(agricolae) # chamar pacote agricolae que j deve estar instalado
h<-graph.freq(titulacao, plot=FALSE)
points<-ojiva.freq(h,type="l",col="red",frame=FALSE,
xlab="Limite das classes", ylab="Frequncia relativa acumulada", main="Ogiva")
grid(col="black")

Atividade 10: Grfico de disperso dos dados


Calorias <- c(240, 260, 350, 350, 420, 510, 530) #criao do vetor de dados
Gordura <- c(8.0, 3.5, 22.0, 20.0, 16.0, 22.0, 19.0) #criao do vetor de dados
windows(); plot(Gordura, Calorias, col= "red", pch= 18, main="Grfico de disperso", xlab= "Gordura", ylab=
"Calorias") # grfico de disperso
windows(); plot(Calorias ~ Gordura, col= "red", pch= 18, main="Grfico de disperso", xlab= "Gordura", ylab=
"Calorias") #outro comando para o grfico de disperso
cor(Calorias, Gordura) # coeficiente de correlao de Pearson
m <- lm(Calorias ~ Gordura) #modelo de regresso por mnimos quadrados
abline(m) #curva de regresso por mnimos quadrados
legend(5, 500, "r = 0,72", pch=18, col="red") # coloca legenda (escala mximo de 500, coeficiente de correlao
de Pearson que nesse caso igual a 0,72)
cov(Gordura, Calorias) #covarincia
cor(Gordura, Calorias) #correlao

Pgina 6

AULA PRTICA 3 R STUDIO


Atividade 1: Distribuio Normal Padronizada

a) P(X=9), = 7,0 segundos e = 2,0 segundos #probabilidade de X = 9 quando a mdia populacional igual a 7 e
o desvio padro populacional igual a dois.
b) P(X>9), = 7,0 segundos e = 2,0 segundos #probabilidade #probabilidade de X > 9 quando a mdia
populacional igual a 7 e o desvio padro populacional igual a dois.
c) P(7<X<9), = 7,0 segundos e = 2,0 segundos #probabilidade de 7 < X < 9 quando a mdia populacional
igual a 7 e o desvio padro populacional igual a dois
d) Grfico de probabilidade normal
#Resoluo letra A

pnorm(9, 7, 2, log=FALSE) # rea acumulada sob a Curva Normal - probabilidade


#Resoluo letra B
1 - pnorm(9, 7, 2, log = FALSE)

Ou

pnorm(9, 7, 2, lower.tail = FALSE) # rea acumulada sob a Curva Normal

- probabilidade
#Resoluo letra C
pnorm(9, 7, 2) - pnorm(7, 7, 2) # rea acumulada sob a Curva Normal - probabilidade
#Resoluo letra D
custo.energia <- c(96, 171, 202, 178, 147, 102, 153, 197, 127, 82, 157, 185, 90, 116, 172, 111, 148, 213, 130, 165,
141, 149, 206, 175, 123, 128, 144, 168, 109, 167, 95, 163, 150, 154, 130, 143, 187, 166, 139, 149, 108, 119, 183,
151, 114, 135, 191, 137, 129, 158) #criao do vetor custo
qqnorm(custo.energia, main="Grfico de probabilidade normal", sub="grfico", xlab="Valor de Z", ylab="Custo da
Energia Eltrica", pch=3, col="blue") #criao do grfico de probabilidade normal
qqline(custo.energia, col="red") #criao da linha de probabilidade normal

Pgina 7

AULA PRTICA 4 R STUDIO


Atividade 1: Estimativa do Intervalo de Confiana para a Mdia Aritmtica (desvio padro conhecido):

O gerente de uma loja de tintas deseja estimar a verdadeira quantidade de tinta contida em latas de 1 galo,
adquiridas de um fabricante nacionalmente conhecido. As especificaes do fabricante declaram que o desviopadro da quantidade de tinta igual a 0,02 galo. Uma amostra aleatria de 50 latas selecionada, e a mdia
aritmtica da amostra para a quantidade de tinta, por lata de um galo, igual a 0,995 galo.

a) Construa uma estimativa para o intervalo de confiana de 99% da mdia aritmtica da populao
relativa quantidade de tinta contida em uma lata de 1 galo.
b) Construa uma estimativa para o intervalo de confiana de 95%.

#Resoluo letra A
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 #insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
# erro.padrao <- qnorm(0.995)*s/sqrt(n)
erro.padrao <- qnorm(0.995)*desv.pad /sqrt(n)
limite.inferior <- media - erro.padrao #clculo do limite inferior
limite.superior <- media + erro.padrao #clculo do limite superior
limite.inferior; limite.superior #exibe os valores de limite inferior e superior

# Resoluo letra B
media <- 0.995 #insere o valor da mdia previamente fornecido
desv.pad <- 0.02 # insere o valor do desvio padro previamente fornecido
n <- 50 #insere o tamanho da amostra previamente fornecido
erro.padrao2 <- qnorm(0.975)* desv.pad /sqrt(n) # clculo do erro padro
limite.inferior2 <- media - erro.padrao2 #clculo do limite inferior

Pgina 8

limite.superior2 <- media + erro.padrao2 #clculo do limite superior


limite.inferior2; limite.superior2 #exibe os valores dos limites inferior e superior
Atividade 2: Estimativa do Intervalo de Confiana para a Mdia Aritmtica (desvio padro desconhecido):
Os dados contidos na tabela a seguir representam o total de gordura, em gramas por poro, de uma amostra de
20 sanduches de frango, selecionados de cadeias de lanchonetes.
Sanduche

Calorias Gordura

Grelhado de Frango Mximo da Wendy

360

Original Baja Taco com Frango Tostado da Baja Fresh

370

Baguette de Frango Grelhado BBQ Fire Defumado da Burger King

380

Frango Honey Bourbon no Po Integral da Quiznos Sub

400

Chicken McGrill do McDonalds

400

16

Frango Grelhado Hot Sub da Blimpie

470

20

Peito de Frango Assado no Forno da Subway

470

20

Frango Bfalo Hot Sub da Blimpie

500

24

Fil de Frango Condimentado da Wendy

510

19

Soft Taco de Frango Rancheiro da Taco Bell (dois tacos)

540

30

Enrolado Macio de Frango Tostado ao Forno da KFC

550

23

Frango Bfalo Sub da Subway

550

30

Chicken Whooper da Burger King

570

25

Frango Arizona da Au Bon Pain

580

19

Talhado de Frango da Boston Market Rotisserie

640

29

Tacos Macios com Frango da Chipolte

660

29

Frango Grelhado com Tomates, Manjerico e Mussarela, da Cosi

720

30

Pesto Panini de Frango Grelhado no Carvo, da Atlanta Bread Company

740

30

Pomodori Panini de Frango da Corner Bakery Caf

910

40

Frango Toscano no molho Foccacia Rosemary & Cebola da Panera


Bread

950

56

Construa um intervalo de confiana de 95% para a mdia aritmtica da populao correspondente ao total
de gordura, em gramas por poro.

Pgina 9

frango.gordura <- c(7, 8, 4, 5, 16, 20, 20, 24, 19, 30, 23, 30, 25, 19, 29, 29, 30, 30, 40, 56) #criao do vetor de
dados
t.test(frango.gordura) #teste t de Student

Atividade 3: Determinar o tamanho da amostra para estimar a mdia aritmtica


Uma pesquisa planejada para determinar a mdia aritmtica das despesas mdicas familiares anuais de
empregados de uma grande empresa. A administrao da empresa deseja estar 95% confiante de que a mdia
aritmtica da amostra est correta dentro dos limites de $50 em relao mdia aritmtica da populao
correspondente a despesas mdicas familiares anuais. Um estudo anterior indica que o desvio-padro
aproximadamente igual a $400.

a) De que tamanho precisa ser a amostra?


b) Se a administrao deseja estar correta dentro dos limites de
necessrio?
#Resoluo letra A

$25, que tamanho de amostra

Z <- qnorm(.975); #valor crtico de Z superior


Sigma <- 400; #valor crtico de Z inferior
Erro <- 50 #valor do erro
N <- (Z^2)*(Sigma^2)/(Erro^2) # clculo do tamanho da amostra
N # exibe o valor do tamanho da amostra
#Resoluo letra B

Z <- qnorm(0.975); #valor de Z crtico superior


Sigma <- 400; #valor do desvio padro
Erro2 <- 25 # valor do erro
N2 <- (Z^2)*(Sigma^2)/(Erro2^2) #clculo do tamanho da amostra
N2 #exibe o tamanho da amostra

Pgina 10

AULA PRTICA 5 R STUDIO


Atividade 1: Utilizando o teste Z para a mdia aritmtica, conhecido
O gerente de operaes de uma fbrica de tecidos precisa determinar se uma nova mquina est produzindo um
determinado tipo de tecido de acordo com as especificaes do fabricante, que indicam que o tecido deve ter
uma mdia aritmtica de resistncia ao rompimento equivalente a 70 libras e um desvio-padro de 3,5 libras.
Uma amostra de 49 peas
H0: = 70 lb
H1: 70 lb.
: 0.05 ; : 3.5 lb; = 69.1; n = 49 peas

#Resoluo
zteor.sup <- qnorm(0.975) #valor de Z superior crtico
zteor.inf <- qnorm(0.025) valor de Z inferior crtico
zcalc <- (69.1-70) / (3.5 / sqrt(49) ) #valor de Z calculado
pvalor.z <- 2*(1-pnorm(abs(zcalc))) # clculo do p-valor
zteor.sup; zcalc; zteor.inf; pvalor.z #mostra os valores de Z crtico e calculado e p valor.

# OBS.: Para teste unilateral superior e inferior:


pvalor.zsup <- 1-pnorm(zcalc) # valor-p do teste unilateral superior
pvalor.zinf <- pnorm(zcalc) # valor-p do teste unilateral inferior
Atividade 2: Utilizando o teste t para a mdia aritmtica, desconhecido.
O atraso em pagamentos por servios mdicos pode fazer crescerem os custos da assistncia mdica. Um artigo
relatou que a mdia aritmtica do tempo desde a data da consulta at o pagamento ao mdico pelas seguradoras
correspondeu a 41,4 dias, durante um perodo recente. Suponha que seja selecionada uma amostra de 100
solicitaes de pagamento a mdicos durante o perodo mais recente. A mdia aritmtica da amostra para o

Pgina 11

tempo desde a data da consulta at o pagamento ao mdico correspondeu a 39,6 dias, e o desvio-padro da
amostra foi de 7.4 dias. Utilizando um nvel de significncia de 0,05, existem evidncias de que a mdia aritmtica
da populao se modificou em relao aos 41,4 dias?
H0: = 41.4 dias
H1: 41.4 dias
: 0.05 ; s: 7.4 dias; = 39.6 dias; n = 100 pagamentos; g.l. = 100 - 1 = 99.

# Resoluo
t <- (39.6-41.4)/(7.4/sqrt(100)) #clculo do valor de t
pvalor.t <- 2*(1-pt(abs(t),99)) #clculo do p - valor
t; pvalor.t #mostra os valores de t calculado e p valor

# OBS: Para testes unilaterais superior ou inferior:


pvalor.tsup <- (1-pt(t,99)) # valor-p do teste unilateral superior
pvalor.tinf <- pt(t,99) # valor-p do teste unilateral inferior

Pgina 12

AULA PRTICA 6 R STUDIO


Atividade 1: Utilizando o teste Z para a diferena entre duas mdias aritmticas
Duas mquinas so usadas para encher garrafas de plstico com um volume lquido de 16,0 litros. O volume de
enchimento pode ser suposto normal, com um desvio-padro de

litros e

litros. Um

engenheiro da qualidade suspeita que ambas as mquinas encham at o mesmo volume lquido mdio,
independente desse volume ser ou no de 16,0 litros. Uma amostra aleatria de 10 garrafas retirada na sada de
cada mquina:
Mquina #1 (litros)

Mquina #2 (litros)

16,03

16,01

16,02

16,03

16,04

15,96

15,97

16,04

16,05

15,98

15,96

16,02

16,05

16,02

16,01

16,01

16,02

15,99

15,99

16,00

Existe uma diferena significativa entre os valores de volume mdio nas duas mquinas, com um nvel de
significncia alfa=0,05?

# Resoluo:
maq1 <- c(16.03, 16.04, 16.05, 16.05, 16.02, 16.01, 15.96, 15.98, 16.02, 15.99) #criao do vetor de dados
maq2 <- c(16.02, 15.97, 15.96, 16.01, 15.99, 16.03, 16.04, 16.02, 16.01, 16.00) #criao do vetor de dados
D <- (mean(maq1)-mean(maq2)) #diferena entre as mdias
dp1 <- 0.020 # desvio-padro da 1 amostra
dp2 <- 0.025 # desvio-padro da 2 amostra
n <- 10 #tamanho de cada amostra. Como so iguais, ser representado apenas por n

Pgina 13

zsup <- qnorm(0.975) #valor de Z crtico superior


zinf <- qnorm(0.025) #valor de Z crtico inferior
zcalc <-((D) - 0)/sqrt(((dp1^2)/n)+((dp2^2)/n)) # valor de Z calculado
pvalor.z <- 2*(1-pnorm(abs(zcalc))) # clculo do p - valor
zinf; zcalc; zsup; pvalor.z #mostra os valores de Z crtico superior e inferior e Z calculado e p valor.
Atividade 2: Utilizando o teste t com varincia agrupada
Na gravao de entalhe, um desenho, ou figura, entalhado na superfcie de um metal resistente ou de uma
pedra. Suponha que seja projetado um experimento com o objetivo de comparar diferenas em termos da mdia
aritmtica da solidez da superfcie das placas de ao utilizadas na gravao em entalhe (medida em termos
tcnicos especficos para o entalhe), com base em duas diferentes condies de superfcie no-tratada e
ligeiramente polida com esmeril. No experimento, 40 placas de ao so distribudas aleatoriamente 20 que no
so tratadas e 20 que so ligeiramente polidas.

a) Supondo que as varincias das populaes de ambas as condies sejam iguais, existem evidncias de
uma diferena entre as mdias aritmticas correspondentes solidez da superfcie entre placas de ao notratadas e placas de ao tratadas? (utilize alfa=0,05).
b) Determine o p-valor em (a) e interprete seu resultado.
No Tratada

Tratada

164,368

177,135

158,239

150,226

159,018

163,903

138,216

155,62

153,871

167,802

168,006

151,233

165,096

160,818

149,654

158,653

157,184

167,433

145,456

151,204

154,496

163,538

168,178

150,869

160,92

164,525

154,321

161,657

164,917

171,23

162,763

157,016

Pgina 14

169,091

174,964

161,02

156,67

175,276

166,311

167,706

147,92

# Resoluo Letra A:
nao.trat <- c(164.368, 159.018, 153.871, 165.096, 157.184, 154.496, 160.92, 164.917, 169.091, 175.276, 177.135,
163.903, 167.802, 160.818, 167.433, 163.538, 164.525, 171.23, 174.964, 166.311) #criao do vetor de dados
trat <- c(158.239, 138.216, 168.006, 149.654, 145.456, 168.178, 154.321, 162.763, 161.02, 167.706, 150.226,
155.62, 151.233, 158.653, 151.204, 150.869, 161.657, 157.016, 156.67, 147.92) #criao do vetor de dados
med1 <- mean(nao.trat) # mdia da amostra 1
med2 <- mean(trat) #mdia da amostra 2
dp1 <- sd(nao.trat) # desvio-padro da amostra 1
dp2 <- sd(trat) #desvio-padro da amostra 2
n<-20 #tamanho da amostra
D <- (med1-med2) # diferena entre as mdias amostrais
Sp2 <- (((n-1)*dp1^2)+((n-1)*dp2^2))/((n-1)+(n-1)) # varincia agrupada
tcalc <- (D-0)/sqrt(Sp2*((1/n)+(1/n))) # valor de tcalc
tcalc #mostra o valor de t calculado
# Resoluo Letra B:
pvalor.t <- 2*(1-pt(abs(tcalc),38)) # teste bilateral, com n1+n2-2 graus de liberdade

Pgina 15

pvalor.t #mostra o p - valor


# OBS: para teste unilateral superior e inferior
pvalor.tsup <- (1-pt(tcalc,38)) # valor-p do teste unilateral superior
pvalor.tinf <- pt(tcalc,38) # valor-p do teste unilateral inferior

Pgina 16

AULA PRTICA 7 R STUDIO


Atividade 1: Utilizando o teste ANOVA de fator nico
Periodicamente, o The Wall Street Journal conduz um concurso de escolha de aes. O mais recente foi
conduzido em maro de 2001. Nesse experimento, trs diferentes mtodos foram utilizados para
selecionar aes que se esperava apresentassem um bom desempenho nos cinco meses subsequentes.
Quatro profissionais de Wall Street, considerados especialistas em escolha de aes, selecionaram, cada
um deles, uma ao. Quatro leitores do The Wall Street Journal, escolhidos aleatoriamente,
selecionaram cada um uma ao. Por fim, quatro aes foram selecionadas por arremesso de dardos em
um alvo contendo uma lista de aes. Os rendimentos das aes selecionadas, no perodo entre 20 de
maro de 2001 at 31 de agosto de 2001 (em termos do percentual de rendimento) esto apresentados
a seguir:
Especialistas

Leitores

Dardos

39,5

-31,0

39,0

-1,1

-20,7

31,9

-4,5

-45,0

14,1

-8,0

-73,3

5,4

Existem evidncias de uma diferena significativa na mdia do rendimento para as trs categorias? Utilize
= 0,05. Compare o valor de F calculado com o F tabelado.

#Resoluo
dados <-c(39.5, -31.0, 39.0, -1.1, -20.7, 31.9, -4.5, -45.0, 14.1, -8.0, -73.3, 5.4) #criao do vetor de dados
rotulo <- factor(rep(c("Especialista", "Leitores", "Dardos"),1:4,12),ordered=TRUE) #criao do rtulo dos dados
resultado <- aov(dados~rotulo) #aov = anlise da varincia
resultado #mostra o resultado da anova
gl1<-3-1 #nmero de graus de liberdade 1 (gl1 = c-1, onde c o nmero de grupos)

Pgina 17

gl2<-12-3 #nmero de graus de liberdade 2 (gl2 = n c, onde c o nmero de grupos e o n tamanho total)
ssqrotulo <-9195.435 #valor de Soma quadrtica dentro dos grupos de acordo com a ANOVA
ssqresiduals <-3763.927 #valor de Soma quadrtica entre os grupos de acordo com a ANOVA
mqrotulo<-ssqrotulo/gl1 #clculo da mdia quadrtica dentro dos grupos
mqresiduals<-ssqresiduals/gl2 #clculo da mdia quadrtica entre os grupos
mqrotulo;mqresiduals #mostra as medias quadrticas calculadas
F<-mqrotulo/mqresiduals #clculo do valor de F
F #mostra o valor de F

Atividade 2: Utilizando o teste de Levene para homogeneidade da varincia


Existem evidncias de uma diferena significativa na variao nos rendimentos para as trs categorias? (utilize
alfa=0,05).

# Resoluo
tratamento <- data.frame(rotulo=rotulo, dados=dados) #criao do data frame dos dados

Pgina 18

tratamento # exibe tratamento


require(car) #requere o pacote j previamente instalado
leveneTest(dados, rotulo) #teste de Levene modificado (diferena absoluta da mediana)
leveneTest(dados, rotulo, center=mean) #teste de Levene original (diferena absoluta da mdia)

Pgina 19

AULA PRTICA 8 R STUDIO


Atividade 1: Regresso por mnimos quadrados
Um artigo descreveu um estudo investigando a relao entre exposio ao barulho e hipertenso. Os seguintes
dados so representativos daqueles reportados no artigo: para o parmetro Aumento da Presso Sangunea
(mmHg): 1, 0, 1, 2, 5, 1, 4, 6, 2, 3, 5, 4, 6, 8, 4, 5, 7, 9, 7 e 6. J para o parmetro Nvel da Presso Sonora (dB):
60, 63, 65, 70, 70, 70, 80, 80, 80, 80, 85, 89, 90, 90, 90, 90, 94, 100, 100 e 100.

a) Desenhe um diagrama de disperso de y (aumento da presso sangunea) versus x (nvel da presso


sonora). Parece razovel propor um modelo de regresso linear simples para essa situao?
b) Ajuste o modelo de regresso linear simples usando o mtodo dos mnimos quadrados.

# Resoluo letra A
sangue<-c(1, 0, 1, 2, 5, 1, 4, 6, 2, 3, 5, 4, 6, 8, 4, 5, 7, 9, 7, 6) #cria vetor de dados
sonora<-c(60, 63, 65, 70, 70, 70, 80, 80, 80, 80, 85, 89, 90, 90, 90, 90, 94, 100, 100, 100) #cria vetor de dados
plot(sonora, sangue, xlab=" Nvel da Presso Sonora (dB)", ylab=" Aumento da Presso Sangunea (mmHg)",
main="Diagrama de disperso") #construo do diagrama de Disperso
# Resoluo letra B

modelo <- lm(sangue~sonora) # regresso linear, y em funo de x


plot(sonora, sangue, xlab=" Nvel da Presso Sonora (dB)", ylab=" Aumento da Presso Sangunea (mmHg)",
main="Regresso linear simples", pch=3)
abline(modelo, col="red") # desenho da reta de mnimos quadrados, com os coeficientes angular e linear do
modelo calculado.
Atividade 2: previso com equao por mnimos quadrados

Pgina 20

preditos <- predict(modelo) #previso dos dados pelo mtodo dos mnimos quadrados
preditos # visualizao dos valores preditos
Atividade 3: Medidas de variao (anlise da regresso)

Fonte de

Soma

Graus de

Mdia

variao

quadrtica

liberdade

quadrtica

Regresso

SQreg

MQreg

Erro

SQres

n-2

MQres

Total

SQT

n-1

Fcalc

Valor-p

MQres/MQres

# Resoluo
anova(modelo) # anova
summary(modelo) # Obtm-se alm das SQs e MQs, o R2, o R2aj, o Erro-Padro da estimativa e o valor de
tcalc para a inclinao de uma populao (coeficientes angular e linear)

Pgina 21

Você também pode gostar