Minitab - Apostila - FZEA-USP

INTRODUO AO USO DO
MINITAB
NAS DISCIPLINAS DE ESTATSTICA
DO CURSO DE
GRADUAO EM ZOOTECNIA
DA FZEA/USP
Material preparado pelo Prof. Dr. Csar Gonalves de Lima

E_mail: cegdlima@usp.br
Para uso nas aulas das disciplinas:

ZAB 230 - Estatstica I, ZAB 216 - Estatstica II e
ZAB 050 - Utilizao de pacotes estatsticos na anlise de dados experimentais
PIRASSUNUNGA - SP
Maro / 2004
1. INTRODUO
O MINITAB consiste de uma planilha de dados diversos comandos e subcomandos usados
para executar operaes matemticas e diversas anlises estatsticas. Uma planilha pode conter:
colunas de dados denotadas por C1, C2,...,
constantes denotadas por K1, K2, ...
matrizes numricas de dados, denotadas por M1, M2,...
Na apresentao dos comandos/subcomandos, a letra E pode denotar tanto uma constante, quanto
uma coluna ou matriz.
Na janela principal do Minitab encontramos uma rgua que disponibiliza os grupos de
comandos e subcomandos usados para manipulao de arquivos File; edio de dados Edit;
manipulao de dados Manip; clculos envolvendo colunas Calc; clculos de estatsticas e de
diversos tipos de anlises estatsticas Stat; contruo de grficos Graph; um editor de comandos Editor; um controlador das janelas de trabalho Window, alm de uma boa tela de auxlio
Help.
As quatro janelas de trabalho so apresentadas como:

Session: que usada para digitarmos os comandos e visualizarmos a sada dos resultados;
Data: que a planilha de dados;
History: que guarda uma cpia de todos os comandos usados numa sesso, e
Info: que apresenta informaes sobre as colunas, as constantes e as matrizes definidas numa
sesso.
As colunas e as constantes podem ter nomes, devendo-se evitar o uso de acentos. Por exemplo: para nomearmos a coluna C1 com o nome Tratamento, a coluna C2 com o nome Producao
e a constante K2 com o nome ProducaoMedia utilizamos o seguinte comando:
MTB > NAME C1 'Tratamento' C2 'Producao' K1 'ProducaoMedia'
Os comandos e subcomandos podem ser digitados em letras maisculas e/ou minsculas,
no havendo necessidade de entrarmos com mais do que as suas quatro primeiras letras. Por
exemplo, para calcular a menor das produes e colocar o resultado em K2, podemos usar os
comandos:
MTB > Let K2 = Minimum(C2)
ou
MTB > Let K2 = Mini(C2)
que os resultados sero idnticos. Ao invs do nmero da coluna C2 tambm pode ser usado o
seu nome:
MTB > Let K2 = Mini(Producao)
Os dados da planilha podem ser digitados diretamente na planilha Data, copiados de um
outro programa e colados na planilha ou lidos de arquivos j existentes. As colunas com valores
numricos apresentam seus valores colados direita e as colunas com valores alfanumricos, alm
de indicar essa coluna com uma letra T, apresentam seus valores colados esquerda.
A seguir, apresentamos algumas informaes sobre o uso efetivo do Minitab em alguns
pontos relevantes do curso de Estatstica II:
a) reviso de estatstica descritiva, visando a obteno de medidas de tendncia central e de disperso, alm de grficos e tabelas;
Introduo ao uso do MINITAB
2
b) simulaes e clculo de probabilidades;
c) intervalos de confiana para a mdia e para a proporo;
d) testes de hipteses para a mdia de uma populao, comparao de mdias e de varincias de
duas populaes;
e) correlao e anlise de regresso.
EXERCCIOS DE APLICAO REVISO DE ESTATSTICA DESCRITIVA

Entre com os dados das variveis C1: Idade, C2: Peso e C3: Altura, na janela Data.
Idade
22
19
17
17
19
21
19
17
19
18
20
20
19
19
17
18
21
26
20
19
18
18
17
18
19
18
18
20
Peso
70
85
48
72
89
76
62
68
49
71
54
52
70
76
73
55
93
51
45
57
65
92
69
56
54
75
71
75
Altura
1.75
1.88
1.63
1.80
1.82
1.72
1.85
1.80
1.64
1.80
1.75
1.64
1.77
1.80
1.75
1.70
1.80
1.65
1.53
1.70
1.78
1.83
1.75
1.64
1.70
1.83
1.81
1.78
Siga corretamente as instrues e tente traduzir as sadas.

1) Para visualizar os dados na tela: Manip > Display data e
selecionar em Columns, constants and matrices to display,
as colunas C1, C2 e C3. Como alternativa, na janela Session,
entrar com:
MTB > print c1 c2 c3
ou
MTB > print 'Idade' 'Peso' 'Altura'
2) Para obter estatsticas descritivas das variveis: Stat > Basic
Statistics > Describe Statistics... e selecionar as colunas
C1, C2 e C3. Como alternativa, entrar com o comando:
MTB > Desc c1 c2 c3
3) Para obter essas estatsticas para as variveis C2: Peso e C3:
Altura, para cada um dos valores de C1: Idade: Stat > Basic
Statistics > Describe Statistics... selecionar as colunas C2 e
C3 e selecionar em By variables: a coluna C1. Como
alternativa, usar:
MTB > Desc c2 c3;
SUBC> by c1.
4) Para construir um histograma dos dados da varivel C2:
Peso: Graph > Histogram.. e escolher C2 em Graph
variables. Alternativa:
MTB > Histo c2
5) Para construir o histograma de C2 definindo os limites (cutpoints) das classes: Graph >
Histogram... escolher C2 em Graph variables, entrar em Options..; em Type of Intervals
clicar em Cutpoint; em Definition of Intervals, clicar em Midpoint/Cutpoint positions: e
entrar com os valores 1.60 1.70 1.80 1.90 2.00, com espaos entre os nmeros.
6) Para visualizar a relao entre as variveis C2: Peso e C3: Altura: Graph > Plot.. e escolher C2
como Graph variables: Y e C3 como Graph variables: X. Como alternativa, usar:
MTB > plot c2*c3
3
7) Para construir um box-plot dos dados de C3: Altura: Graph > Boxplot.. e escolher em Graph
variable: Y, a coluna C3. Ou ento, usar:
MTB > boxplot C3
8) Para obter uma distribuio de freqncias da varivel discreta C1: idade: Stat > Table > Tally,
escolher como Variables: a coluna C1 e marcar Counts e Percents em Display. Como alternativa, usar:
MTB > Tally 'Idade';
SUBC> Counts;
SUBC> Percents.
9) Para obter uma tela com diversas estatsticas descritivas, distribuio de freqncias, box-plot,
teste de normalidade dos dados de C2: Peso, alm de intervalos de confiana para a mdia e para
a mediana:
MTB> %Describe c2 ou
MTB> %Describe 'Peso'
2. AS OPES DA BARRA STAT

O MINITAB oferece diversas opes para anlise descritiva e inferencial de dados experimentais. Praticamente todas as opes aparecem no menu Stat da barra principal do programa:
A seguir, apresentaremos alguns detalhes de cada uma das opes deste menu. Maiores informaes
sobre as opes podem ser obtidas em Help, no boto , ou usando a tecla F1, Menu Commands
e Stat Menu.
Basic Statistics (Stat Menu > Basic Statistics)
Permite calcular diversas estatsticas descritivas, executar testes de hipteses, calcular a correlao e covarincias entre variveis numricas e testar a normalidade dos dados. Os principais comandos so:
Display Descriptive Statistics: produz uma tabela com estatsticas descritivas: nmero de
valores (N); mdia (Mean); mediana (Median); tri-mdia (TrMean);desvio padro (StDev);
erro padro da mdia (SE Mean); menor valor (Minimum); maior valor (Maximum);1o quartil
(Q1) e 3o quartil (Q3). Tambm produz grficos como o histograma (Histogram); grfico de
pontos (Dotplot), boxplot (BoxPlot) e um grfico resumo (Graphical summary) com diversas
estatsticas descritivas, intervalos de confiana para a mdia, mediana e desvio padro e um
teste de normalidade dos dados (Anderson-Darling Normalitty Test).
4

Store Descriptive Statistics: calcula diversas estatsticas descritivas e grava os resultados na

planilha.
1-Sample Z: calcula um Intervalo de Confiana e executa o teste de hiptese para a mdia de
uma populao normal com varincia populacional conhecida (z-test).
1-Sample t: calcula um Intervalo de Confiana e executa o teste de hiptese para a mdia de
uma populao normal com varincia populacional desconhecida (t-test).
2-Sample t: calcula um Intervalo de Confiana e executa o teste de hiptese para comparar as
mdias de duas populaes normais (t-test) de varincias iguais ou no.
Paired t: testa a diferena entre mdias quando os dados esto pareados.
1 Proportion: calcula um intervalo de confiana e executa um teste para a proporo.
2 Proportions: calcula um intervalo de confiana e executa um teste para a diferena entre
duas propores.
2 Variances: executa um teste para a igualdade (homogeneidade) de varincias de duas
populaes usando os testes F e de Levene.
Correlation: calcula o coeficiente de correlao de Pearson entre variveis numricas e o
nvel descritivo do teste H0: = 0 vs. H1: 0. Opcionalmente, grava os resultados numa
matriz de correlaes.
Covariance: calcula a covarincia entre variveis numricas e grava os seus valores numa
matriz de covarincias.
Normality Test: testa a normalidade dos dados (Testes de Anderson-Darling, Ryan-Joiner e
Kolmogorov-Smirnov) e apresenta um grfico normal de probabilidades (normal probability
plot).

Regression (Stat > Regression)

Permite executarmos anlises de regresso simples, polinomial e mltipla com os mecanismos
stepwise, forward e backward de seleo de variveis e regresso logstica. Produz grficos para
anlise de resduos e ajusta alguns modelos de regresso logstica.
ANOVA (Stat > ANOVA)
Permite executarmos a anlise de varincia, testar a homogeneidade de varincias e gerar diversos grficos. Os principais comandos so:
Oneway: executa a anlise de varincia com um fator (one way), com as respostas em uma
coluna e os ndices em outra. Tambm possibilita a comparao das mdias atravs dos testes
de Tukey, Dunnett etc.
Oneway (Unstacked): executa a anlise de varincia para o modelo com um fator (One way),
com as respostas de cada tratamento colocadas em colunas diferentes.
Twoway: executa a anlise de varincia para o modelo com dois fatores (Two way) e dados
balanceados.
Analysis of Means: mostra um grfico de Anlise de Mdias e uma tabela resumo para dados
normais, binomiais e de Poisson.
Balanced ANOVA: analisa dados uni ou multivariados, balanceados, atravs de modelos
mistos com fatores cruzados e hierrquicos.
General Linear Model: executa a anlise de varincia para dados uni ou multivariados e
desbalanceados com fatores cruzados e hierrquicos e covariveis. Executa tambm a anlise
de varincia multivariada.
Fully Nested ANOVA: executa a anlise de varincia para modelos hierrquicos (nested) e
estima componentes de varincia para cada varivel resposta.
5

Balanced MANOVA: executa a anlise de varincia multivariada de delineamentos balanceados (todas as combinaes de nveis de fatores devem ter o mesmo nmero de repeties).
General MANOVA: executa a anlise de varincia multivariada de delineamentos balanceados ou desbalanceados, ou que envolve covariveis.
Test for Equal Variances: executa os testes F, de Bartlett e de Levene para a homogeneidade
de varincias.
Interval Plot...: produz um grfico de grupos de mdias com barras de erro padro ou de
intervalos de confiana das mdias.
Main Effects Plot: gera um grfico de mdias dos nveis dos fatores.
Interactions Plot: gera um grfico da interao dos nveis dos fatores (ou matriz de grficos)

DOE (Design of Experiments) (Stat > DOE)

Disponibiliza diversas opes para criao e anlise de delineamentos experimentais ortogonais.
Control Charts (Stat > Control Charts)
Disponibiliza diversos tipos de grficos para o controle de qualidade para dados numricos ou
no.
Quality Tools (Stat > Quality Tools)
Disponibiliza diversas tcnicas para construo de grficos de qualidade e checa a acurcia e a
preciso de um sistema de medidas.
Reliability/Survival (Stat > Reliability/Survival)
Disponibiliza alguns comandos para analisar dados de tempos de falha e ferramentas para estimar a variabilidade de funes que descrevem tais distribuies. Possibilita tambm a anlise de
tabelas de sobrevivncia.
Multivariate (Stat >Multivariate)
Proporciona a execuo de anlises multivariadas, como a de Componentes Principais (PCA),
Anlise de Fatores ou Fatorial, Anlise Discriminante etc.
Time Series (Stat > Time Series)
Disponibiliza a anlise de sries temporais e diversas tcnicas de anlise descritiva de tais
conjuntos de dados.
Tables (Stat > Tables)
Imprime tabelas de contingncia com uma ou duas entradas para variveis associadas e executa
uma anlise de Qui-quadrado.
Cross Tabulation: imprime tabelas de contingncia e tabelas de estatsticas para variveis
associadas.
Tally: imprime tabelas de freqncia absolutas e percentuais de variveis numricas.
Chisquare Test: executa a anlise de Qui-quadrado de tabelas de contingncia.
Nonparametrics (Stat > Nonparametrics)
Permite a execuo de diversos testes no paramtricos, como os Testes dos sinais, de Wilcoxon,
Mann-Whitney, Kruskal-Wallis etc., alm da construo de intervalos de confiana para a
mediana.
EDA (Exploratory Data Analysis) (Stat > EDA)

Disponibiliza diversas ferramentas para fazer uma anlise exploratria de dados, como os
grficos de ramos e folhas (stem-and-leaf), boxplot etc. Tais mtodos so utilizados antes dos
mtodos tradicionais de anlise, ou para examinar os resduos de um modelo. Tambm so teis
6
para identificar observaes discrepantes e examinar a violao de suposies de modelos, como
a no linearidade dos resduos ou a heterocedasticidade das varincias.
3. USANDO O MINITAB PARA SIMULAES E CLCULO DE PROBABILIDADES

Vamos explorar a capacidade do MINITAB de simular distribuies de probabilidades de
variveis aleatrias discretas (Bernoulli, Binomial, Poisson etc.) e contnuas (Exponencial, Normal,
Qui-quadrado, t-Student, F-Snedecor etc.), que pode ser feito atravs do comando random, disponvel em Calc > Random Data.
Alm disso, o MINITAB tambm tem recursos para o clculo de probabilidades, com os
comandos: PDF (probability distribution function) e CDF (cumulative distribution function), que
esto disponveis em Calc > Probability Distributions.
A seguir sero apresentados alguns detalhes de aplicao desses comandos em exemplos
bastante comuns nos estudos j desenvolvidos nas aulas de Estatstica I e que voltaro a ser necessrios nas aulas do curso de Estatstica II e Estatstica Experimental.
COMANDO PDF (probability distribution function): Permite calcular probabilidades (distribuies discretas) ou densidades (distribuies contnuas). O nosso propsito o de calcular probabilidades para variveis discretas. Por exemplo: para a distribuio Binomial, X ~B(n, p), possvel usar este comando com dois propsitos diferentes:
i) Construir uma distribuio de probabilidades completa para a Binomial, com parmetros n e p.
Por exemplo, para n = 7 e p = 0,3:
MTB > PDF;
SUBC> BINOMIAL 7 0.3.
gera a seguinte sada:

Probability Density Function
Binomial with n = 7 and p = 0.300000
x
P( X = x)
0
0.0824
1
0.2471
2
0.3177
3
0.2269
4
0.0972
5
0.0250
6
0.0036
7
0.0002
ii) Calcular a probabilidade de que a v.a. X ~ B(n = 7 e p = 0.3) assuma o valor k = 4, ou seja,
calcular P(X = 4).
MTB > PDF 4;
Probability Density Function

x
P( X = x)
4.00
0.0972
COMANDO CDF (cumulative distribution function): permite calcular a probabilidade acumulada at um valor k fixado, ou seja, calcular F(k) = P(X k). Para uma distribuio binomial com
n = 7 e p = 0.3, podemos calcular P(X 4) utilizando os resultados j calculados anteriormente,
fazendo:
P(X 4) = P(X = 0) + P(X = 1) + P(X = 2) + P(X = 3) + P(X = 4)
= 0,0824 + 0,2471 + 0,3177 + 0,2269 + 0,0972
= 0,9712
Porm, este resultado pode ser obtido mais facilmente utilizando o comando CDF:
MTB > CDF 4;
Cumulative Distribution Function

x
P( X <= x)
4.00
0.9712
ou seja: a probabilidade de encontrarmos at 4 sucessos, quando X ~ B(7; 0,3) igual a 0,9712.

Podemos estar interessados tambm, em calcular probabilidades acumuladas para diversas
distribuies associadas a variveis contnuas, como a normal, qui-quadrado, F-Snedecor, t-Student
etc. Por exemplo: para calcular a probabilidade de uma varivel normal reduzida, N( = 0; 2 = 1),
assumir valores iguais ou inferiores a 1, P(Z 1), usamos o comando:
MTB > CDF 1;
SUBC> NORMAL 0 1.

Normal with mean = 0 and standard deviation = 1.00000
x
P( X <= x)
1.0000
0.8413
OBS: Quando usamos uma varivel normal reduzida, no precisamos indicar quais so os valores da mdia e do desvio padro, ou seja, basta usar os comandos:
MTB > CDF 1;
SUBC> NORMAL.
A probabilidade da varivel aleatria "X = altura dos calouros 99", que tem distribuio
normal com mdia 1,70m e varincia 0,01m2 (e desvio padro 0,10m), assumir valores iguais ou
inferiores a 1,85, P(X 1,85), pode ser obtida com o comando:
MTB >
SUBC>
CDF 1.85;
NORMAL 1.70 0.10.

Normal with mean = 1.70000 and standard deviation = 0.100000
x
P( X <= x)
1.8500
0.9332
ou seja, 93,3% dos calouros 99 tm altura igual ou inferior a 1,85 metros.

8
COMANDO INVCDF ( inverse cumulative distribution function): Faz o papel inverso do comando CDF, ou seja, calcula o nmero x , que deixa sua esquerda a probabilidade indicada. Deste
modo, o comando:
MTB >
SUBC>
INVCDF 0.95;
NORMAL.
Inverse Cumulative Distribution Function

Normal with mean = 0 and standard deviation = 1.00000
P( X <= x)
x
0.9500
1.6449
ou seja, o valor 1,6449 1,65, da normal reduzida, deixa sua esquerda uma rea igual a 95%,
ou ainda: P(X 1,65) = 0,95.
Outro exemplo: Qual a altura, acima da qual esto 28% dos calouros de 99?. Para tanto,
basta usar o comando:
MTB >
SUBC>
INVCDF 0.72;
NORMAL 1.70 0.10.
Inverse Cumulative Distribution Function

Normal with mean = 1.70000 and standard deviation = 0.100000
P( X <= x)
x
0.7200
1.7583
ou seja, abaixo de 1,76m esto 72% dos calouros 99, ou ento, acima de 1,76m esto 28% dos
calouros de 99.
COMANDO RANDOM: Permite gerar amostras aleatrias de distribuies tericas associadas a

variveis discretas ou contnuas. Por exemplo: estamos interessados em estudar um experimento
que consiste em contar o "nmero de eleitores favorveis a um certo candidato A" numa amostra
de 10 eleitores, supondo que a porcentagem de eleitores favorveis a este candidato tenha sido
estimada em 0,70. (Perceba nesta descrio que a varivel envolvida tem distribuio binomial
de parmetros n=10 e p=0,70). Assim os comandos:
MTB > RANDOM 15 C1;
SUBC > BINOMIAL 10 0.7.
MTB > PRINT C1
simulam (e mostram) os resultados de 15 experimentos binomiais com n = 10 eleitores e p =

0,70, colocando-os na coluna C1:
Data Display
C1
8
7
6
Como sabemos que a mdia de uma varivel com distribuio binomial, X ~ B(n; p) igual a
E(X) = np e a varincia igual a Var(X) = np(1-p), temos que E(X) = 7 e Var(X) = 2,1 (e desvio
padro = 1,4491). Para verificar se a amostra representativa dessa populao, usamos:
MTB >
DESCRIBE C1
9
Descriptive Statistics
Variable
C1
N
15
Mean
6.733
Median
7.000
Tr Mean
6.846
Variable
C1
Min
4.000
Max
8.000
Q1
6.000
Q3
8.000
StDev
1.223
SE Mean
0.316
e podemos perceber que a amostra representa razoavelmente bem a referida populao, j que a
mdia e o desvio padro amostrais foram iguais a 6,733 e 1,2223, respectivamente.
Se estivermos interessados em gerar uma amostra de tamanho n = 40 da varivel X = "pesos
corporais de frangos da linhagem Hubbard, aos 42 dias de idade", sabendo-se que esta varivel
tem distribuio normal N( = 1,80; 2 =0,01), usamos o comando:
MTB >
SUBC>
RANDOM 40 C5;
NORMAL 1.80 0.10.
Para imprimir os dados simulados de C2 e as estatsticas descritivas correspondentes, usamos:

MTB >
PRINT C5
Data Display
C5
1.88368
1.85025
1.70791
1.84269
1.60558
MTB >
1.90070
1.95905
1.98492
1.74938
1.79857
1.74597
1.70512
1.77098
1.74669
1.66694
1.65488
1.82874
1.67058
1.61301
1.87760
1.74494
1.86497
1.84883
1.84342
1.75625
1.60249
1.96199
1.80105
1.61336
1.70891
1.78853
1.81543
1.84905
1.84578
1.83445
StDev
0.1770
SE Mean
0.0280
1.75199
1.71719
1.73582
1.84137
1.72964
DESCRIBE C2
Variable
C1
N
40
Mean
1.7807
Median
1.7747
Tr Mean
1.7841
Variable
C1
Min
1.3367
Max
2.1235
Q1
1.6640
Q3
1.9001
OBS: dificilmente os pesos que voc obteve utilizando esses mesmos comandos sero idnticos
a esses. Lembre-se que o Minitab gera amostras aleatrias...
Se estivermos interessados em arredondar para duas casas decimais os pesos dos frangos
que esto em C5 e coloc-los em C6, usamos o comando round da seguinte maneira:
MTB > LET C6 = 0.01*ROUND(100*C5)
MTB > PRINT C6
Data Display
C3
1.88
1.71
1.85
1.85
1.90
1.83
1.80
1.84
1.75
1.86
1.85
1.61
1.65
1.96
1.74
1.80
1.74
1.82
1.84
1.67
1.60
1.72
1.75
1.88
1.79
1.71
1.75
1.76
1.75
1.98
1.61
1.71
1.85
1.77
1.84
1.83
1.96
1.67
1.61
1.73
10
COMANDO SAMPLE: Possibilita sortear amostras com ou sem reposio de alguma populao
conhecida. Como exemplo, podemos utilizar os dados de peso da coluna C3 como sendo a populao da qual queremos sortear uma amostra aleatria de tamanho 10. Isto pode ser feito de duas
maneiras:
i) sem reposio:
MTB > SAMPLE 10 C3 C10
coloca em C10 os dez valores de C3 (peso de frangos aos 42 dias) sorteados ao acaso e sem
reposio.
ii) com reposio:
MTB >
SUBC>
SAMPLE 10 C3 C11;
REPLACE.
coloca em C11 os dez valores de C3 sorteados ao acaso e com reposio.
4. INTERVALOS DE CONFIANA
O objetivo principal deste material apresentar os comandos do Minitab que podem ser
usados para a construo de intervalos de confiana para a mdia () de uma populao com distribuio normal e para a proporo p de uma varivel dicotmica.
4.1. INTERVALO DE CONFIANA PARA A MDIA DE UMA POPULAO COM DISTRIBUIO NORMAL
CASO 1: I.C. (
) quando a varincia populacional (
2) conhecida
Usar o caminho Stat > Basic Statistics > 1-Sample z, ou o comando ZINTERVAL:
MTB > ZINTERVAL [coeficiente de confiana] sigma Ci
Comentrios:
Esse comando permite calcular o I.C.() a partir dos dados amostrais de uma varivel Ci que
tem distribuio normal com desvio padro = sigma, conhecido.
Se no informarmos o valor do desvio padro, o Minitab assumir sigma = 1;
Se no informarmos qual o valor do coeficiente de confiana, o Minitab assumir = 95%;
Exemplo: Calcular o I.C. para a mdia das idades dos alunos de Estatstica I da turma de 1997,
que tem distribuio normal e desvio padro = 1, baseado na seguinte amostra de n = 10
alunos: {19; 17; 19; 18; 17; 20; 18; 19; 20; 18}. Aps colocarmos os dados na coluna C7,
usamos o comando:
MTB > NAME C7 'Idade'
MTB > ZINTERVAL 95 1 C7
11
Confidence Intervals
The assumed sigma = 1.00
Variable N
Idade
10
Mean
18.500
StDev
1.080
SE Mean
0.316
95.0 % CI
(17.880, 19.120)
ou seja: o I.C.(; = 95%) = [17,88; 19,12] anos contem o verdadeiro valor da idade mdia dos
alunos de Estatstica I, com 95% de confiana. Se quisermos um I.C.() com uma confiana =
99%, basta trocarmos no comando acima, o valor 95 por 99.
CASO 2: I.C.(
) quando a varincia populacional (
2) desconhecida
Usar o caminho: Stat > Basic Statistics > 1-Sample t ou o comando TINTERVAL:
MTB > TINTERVAL [coeficiente de confiana] Ci
Permite calcular o I.C. para a mdia de uma varivel Ci (ou mais variveis) com distribuio
normal e varincia populacional (2) desconhecida;
O Minitab se incumbe de estimar a varincia, j que ela desconhecida.
Exemplo: calcular o I.C. = 95%, para a mdia das idades dos alunos de Estatstica I, que tem
distribuio normal, baseado na seguinte amostra de n = 10 alunos: {19; 17; 19; 18; 17; 20; 18;
19; 20; 18}.
MTB > TINTERVAL 95 C1
Confidence Intervals
Variable
N
Mean
Idade
10
18.500
StDev
1.080
SE Mean
0.342
95.0 % CI
(17.727, 19.273)
Ou seja: o intervalo [17,727; 19,273] anos, contem o verdadeiro valor da mdia das idades dos
alunos do curso de Estatstica I, com = 95% de confiana.
4.2. INTERVALO DE CONFIANA PARA A PROPORO (p)

Para calcularmos o I.C.(p) podemos entrar com os dados numa coluna (Ci) ou indicar o
tamanho da amostra e o nmero de sucessos.
Exemplo: numa amostra de n = 100 elementos, temos 42 sucessos e 58 fracassos, ento devemos
criar uma coluna (C8, por exemplo) com 42 nmeros 1 e 58 nmeros 0, de modo que a mdia
desta coluna seja igual a 42/100 = 0.42, que coincide com a proporo de sucessos. No Minitab,
isso feito com o comando:
MTB > set c8
DATA> 42(1) 58(0)
DATA> end
12
CASO 1: Amostras grandes
Como neste caso o intervalo de confiana baseado na distribuio normal, usar o caminho Stat
> Basic Statistics > 1 Proportion... e escolher C8 em Samples in columns: e em Options
marcar Use test and interval based on normal distribution, ou o comando:
MTB > POne c8;
SUBC> UseZ.
resultando em:
Test and CI for One Proportion: C8
Test of p = 0.5 vs p not = 0.5
Success = 1
Variable
C8
X
42
N
100
Sample p
0.420000
95.0% CI
(0.323264; 0.516736)
Z-Value
-1.60
P-Value
0.110
e podemos afirmar que o intervalo [0,32; 0,52] contem a verdadeira proporo de sucessos com
uma confiana de 99%.
Note que este comando tambm executa um teste de hipteses para a proporo, cujos resultados
sero comentados quando tratarmos desse assunto.
CASO 2: Amostras pequenas (usa a distribuio binomial)

Em Stat > Basic Statistics > 1 Proportion... escolher C8 em Samples in columns: ou o comando:
MTB > Pone c8
resultando em:
Test and CI for One Proportion: C8
Test of p = 0.5 vs p not = 0.5
Success = 1
Variable
C8
X
42
N
100
Sample p
0.420000
95.0% CI
(0.321986; 0.522881)
Exact
P-Value
0.133
OBS: Vale observar que esse intervalo tem uma amplitude maior que o do intervalo de confiana
baseado na distribuio normal.
Ao invs de entrarmos com os dados na coluna C8 podemos especificar em Stat > Basic
Statistics > 1 Proportion... > Summarized data, o nmero de tentativas (Number of trials) igual a
100 e o nmero de sucessos (Number of successess) igual a 42. A seguir devemos escolher se o IC
ser baseado na distribuio normal (Use test and interval based on normal distribution) ou no.
13
5. TESTES DE HIPTESE PARA A MDIA DE UMA DISTRIBUIO NORMAL E PARA A PROPORO

) QUANDO A VARINCIA POPULACIONAL CONHE5.1. TESTE PARA A MDIA (
CIDA
Usar o caminho Stat > Basic Statistics > 1-Sample z ou o comando ZTEST, cuja sintaxe :
MTB > ZTEST [0] [sigma] C;
SUBC> ALTERNATIVE [k].
Executa o teste de hiptese: H0: = 0 vs. H1: < 0 (ou H1: 0 ou H1: > 0) quando a
varincia conhecida.
Se no informarmos os valores de 0 e sigma, o Minitab assume os valores 0 e 1, respectivamente.
Para a hiptese alternativa H1: < 0 devemos escolher k = 1; para H1: 0, usar k = 0 e
para H1: > 0, usar k = +1.
Se o valor de k for omitido, o programa assume k = 0;
Exemplo: Testar a hiptese de que a idade mdia dos alunos de Estatstica I igual a 18 anos,
admitindo que 2 = 1, baseado na amostra de n = 10 alunos: {19; 17; 19; 18; 17; 20; 18; 19; 20;
18}. Aps digitarmos os dados na coluna C1, usamos o comando:
MTB > ZTEST 18 1 C1;
SUBC> ALTERNATIVE 0.
Ou ento: Stat > Basic Statistics > 1-Sample z, escolhemos C1 em Variables, colocamos o
valor 18 em Test mean, escolhemos not equal em Alternative e digitamos o valor 1.0 em
Sigma. Em ambos os casos, o resultado o seguinte:
Z-Test
Test of mu = 18.000 vs mu not = 18.000
The assumed sigma = 1.00
Variable
N
Mean
Idade
10
18.500
StDev
1.080
SE Mean
0.316
Z
1.58
P
0.11
que apresenta uma descrio das hipteses envolvidas no teste, o valor do desvio padro ( = 1),
o tamanho da amostra (n = 10), o valor da mdia amostral ( x =18,50), o desvio padro amostral
(s = 1,080), o erro padro da mdia (s( x ) = 0,316), o valor da estatstica Z (zcalc = 1,58) e o nvel
descritivo do teste ( = P = 0,11), ou seja, para rejeitarmos H0 precisamos assumir um nvel de
significncia igual ou superior a 11%.
5.2. TESTE PARA A MDIA QUANDO A VARINCIA POPULACIONAL DESCONHECIDA

Usar o caminho: Stat > Basic Statistics > 1-Sample t ou o comando TTEST, cuja sintaxe :
MTB > TTEST [0] C;
SUBC> ALTERNATIVE [k].
14
usado quando queremos realizar um teste de hiptese para a mdia de uma populao normal e desconhecemos a varincia populacional 2.
Sua sintaxe bastante similar do comando ZTEST .
Exemplo: Para testar a hiptese de que idade mdia dos alunos de Estatstica I igual a 18 anos,
usamos o comando:
MTB > TTest 18 C1;
SUBC> Alternative 0.
Ou seguimos o caminho: Stat > Basic Statistics > 1-Sample t, escolhemos C1 em Variables,
colocamos o valor 18 em Test mean e escolhemos not equal em Alternative. O resultado o
seguinte:
T-Test of the Mean

Test of mu = 18.000 vs mu not = 18.000
Variable
Idade
N
10
Mean
18.500
StDev
1.080
SE Mean
0.342
T
1.46
P
0.18
Como o valor do nvel descritivo do teste relativamente grande ( = P = 0,18), podemos

assumir que os alunos de Estatstica I, em mdia, no tm idade diferente de 18 anos.
5.3. TESTE PARA A PROPORO

Usar o caminho: Stat > Basic Statistics > 1 Proportion ou o comando Pone. Quando os
dados j estiverem digitados em numa coluna (Ci) e utilizarmos a distribuio normal (caso de
grandes amostras), devemos usar os comandos:
MTB >
SUBC>
SUBC>
SUBC>
POne Ci;
Test [p];
Alternative [k];
UseZ.
Se no optarmos pela aproximao normal, devemos excluir o subcomando da ltima linha. Outra
possibilidade consiste em indicarmos o nmero de elementos da amostra (Number of trials) e o nmero de casos favorveis (Number of successes) em Summarized data.
Exemplo: Precisando saber se um candidato vai se reeleger como prefeito de Pirassununga, foi feita
uma pesquisa com 180 eleitores, dentre os quais, 95 so favorveis reeleio. Ao nvel = 5%
podemos concluir que a proporo de eleitores favorveis reeleio superior 50%?
Seguimos o caminho: Stat > Basic Statistics > 1 Proportion, em Summarized data, digitamos
180 como Number of trials: e 95 em Number of successes. A seguir, em Options, indicamos em
Test proportion o valor 0.50, em Alternative: greater then e usamos a opo Use test and
interval based on normal distribution. Como alternativa, digitamos:
MTB > POne 180 95;
SUBC>
Test .50;
SUBC>
Alternative 1;
SUBC>
UseZ.
15
Test and CI for One Proportion

Test of p = 0.5 vs p > 0.5
Sample
X
N Sample p
1
95
180 0.527778
95.0% Lower Bound

0.466572
Z-Value
0.75
P-Value
0.228
e podemos concluir que a hiptese H0: p = 0,50 no deve ser rejeitada, pois o nvel descritivo do
teste muito alto ( = P = 0,228), ou seja, a reeleio do candidato A no est garantida.
6. COMPARAES ENTRE AS MDIAS DE DUAS DISTRIBUIES NORMAIS

Para compararmos as mdias de duas populaes normalmente distribudas e independentes,
ou seja, Ho: i = j versus H1: i j (ou H1: i > j ou ainda H1: i < j), quando as varincias
populacionais so desconhecidas, seguimos o caminho Stat > Basic Statistics > 2-Sample t ou usamos o comando:
MTB > TWOSAMPLE [coeficiente de confiana] Ci Cj
Ci e Cj identificam as colunas onde esto inseridos os valores amostrais das duas populaes.
Se as varincias populacionais forem consideradas iguais, usamos tambm o subcomando
POOLED.
Se o coeficiente de confiana () for omitido, ser calculado um I.C. para a diferena entre as
mdias populacionais assumindo = 95%.
Exemplo: Utilizando os dados do exemplo da seo 4.1e assumindo que uma outra amostra de idades foi retirada da turma de 1998, cujos resultados foram {18; 19; 19; 19; 18; 18; 17; 18; 19; 18},
desejamos testar se as idades mdias das turmas de 1997 e 1998 podem ser consideradas iguais.
C1
1997
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
19
17
19
18
17
20
18
19
20
18
C2
1998
18
19
19
19
18
18
17
18
19
18
C3
Amostra
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
C4
Idade
19
17
19
18
17
20
18
19
20
18
18
19
19
19
18
18
17
18
19
18
Os dados das amostras podem estar colocados em colunas diferentes (C1 e C2, respectivamente) ou empilhadas na coluna C4, mas com a
coluna C3 indicando o nmero da amostra correspondente, de acordo com a figura abaixo:
Para empilharmos os dados das colunas C1
(1997) e C2 (1998) na coluna C4, colocando em
C3 um ndice associando o nmero da amostra,
usamos o comando:
MTB > Stack (c1 c2) c4;
SUBC> Subscripts c3.
Como j sabemos, antes de compararmos as

mdias, devemos saber se podemos admitir que as
varincias das idades das duas turmas podem ser
consideradas iguais ou no.
Para compararmos as varincias das duas
turmas, que consiste em testar H0: 12 = 22 versus
H1: 12 22 , usamos:
16
MTB > %Vartest C4 C3;
SUBC> Confidence 95.0.
Resultando em:
Test for Equal Variances
Response
Factors
ConfLvl
Idade
Amostra
95.0000
Bonferroni confidence intervals

Lower
Sigma
Upper
0.706534
1.08012
2.17499
0.441500
0.67495
1.35911
for standard deviations

N Factor Levels
10
1
10
2
F-Test (normal distribution)

Test Statistic: 2.561
P-Value
: 0.177
Levene's Test (any continuous distribution)
Ou seja, pelos testes F e de Levene, a igualdade das varincias foi aceita, pois o nvel descritivo
associado s estatsticas foi igual ou superior a 0,104 (valor que pode ser considerado alto!).
Aps a deciso sobre a igualdade (ou no) das varincias, podemos comparar as mdias populacionais, usando o teste t-Student conveniente.
CASO 1. AS VARINCIAS POPULACIONAIS FORAM CONSIDERADAS IGUAIS

Seguimos o caminho: Stat > Basic Statistics > 2-Sample t, em > Samples in different
columns indicamos C1 em First e C2 em Second. A seguir escolhemos Alternative: not equal e
clicamos em Assume equal variances. Alternativamente, usamos o comando:
MTB > TWOSAMPLE 95 c1 c2;
SUBC> Alternative 0;
SUBC> pooled.
Two-Sample T-Test and CI: Amostra 1; Amostra 2

Two-sample T for Amostra 1 vs Amostra 2
Amostra1
Amostra2
N
10
10
Mean
18.50
18.300
StDev
1.08
0.675
SE Mean
0.34
0.21
Difference = mu Amostra 1 - mu Amostra 2

Estimate for difference: 0.200
95% CI for difference: (-0.646; 1.046)
T-Test of difference = 0 (vs not =): T-Value= 0.50 P-Value= 0.626 DF= 18
Both use Pooled StDev = 0.901
Observe que so apresentados:

a mdia (mean), o desvio padro (StDev) e o erro padro da mdia (SE Mean) de cada uma das
amostras;
17
um intervalo de confiana para a diferena das mdias, com = 95%;
o valor da estatstica t-Student (T=0.50), o nvel descritivo do teste ( = P = 0.626) e o nmero
de graus de liberdade (DF=18);
o valor do desvio padro comum (Both use Pooled StDev) 0,901 e usado no teste porque
assumimos que as varincias podem ser consideradas iguais.
Como o nvel descritivo do teste foi alto ( = P = 0,63), no temos motivos para rejeitar a hiptese H0 e conclumos que as idades mdias das turmas de 1997 e 1998 so iguais.
Podemos tambm realizar o teste com os dados que esto empilhados em C3 e C4, usando os
comandos:
MTB > TWOT 95 C4 C3;
SUBC> Alternative 0;
SUBC> Pooled.
Ou usando o caminho: Stat > Basic Statistics > 2-Sample t e indicamos C4 em Samples in the
column > Samples e C3 em Subscripts. A seguir escolhemos Alternative: not equal e clicamos em Assume equal variances.
CASO 2. AS VARINCIAS POPULACIONAIS FORAM CONSIDERADAS DIFERENTES

Para desejamos comparar as mdias de duas populaes normalmente distribudas e com
varin-cias desconhecidas e diferentes, usamos o caminho: Stat > Basic Statistics > 2-Sample t,
em > Samples in different columns indicamos C1 em First e C2 em Second. A seguir escolhemos
Alternative: not equal, mas no selecionamos Assume equal variances.
Quando no usamos a opo Assume equal variances, o Minitab faz a comparao das
mdias usando a estatstica t-Student aproximada, com nmero de graus de liberdade calculados
pela frmula de Sattertwait. Alternativamente, podemos usar o comando:
MTB > TWOSAMPLE C1 C2
Two Sample T-Test and Confidence Interval

Two sample T for Amostra1 vs Amostra2
N
Mean
StDev
SE Mean
Amostra1 10
18.50
1.08
0.34
Amostra2 10
18.300
0.675
0.21
95% CI for mu Amostra1 - mu Amostra2: ( -0.66, 1.06)
T-Test mu Amostra1 = mu Amostra2 (vs not =): T=0.50 P=0.63
DF=15
Ou seja: como o nvel descritivo do teste foi alto (0,63), no temos motivos para rejeitar a hiptese H0 e ento, conclumos que as mdias dos dois grupos de idades so iguais.
18
7. COMPARAO DE MDIAS DE DUAS POPULAES DEPENDENTES

DADOS PAREADOS.
Outro problema bastante comum consiste em compararmos as mdias de duas populaes
normais que no so independentes, ou seja, os dados so pareados.
Exemplo (Apostila de Estatstica II) Com o objetivo de testar ( = 5%) se a suplementao de
alfafa aumenta o ganho mdio de peso de coelhos em mais de 0,10kg, foram utilizados 8 pares de
coelhos. Os resultados foram os seguintes:
Par no
X (com)
Y (sem)
1
0,72
0,32
2
0,90
0,49
3
0,67
0,51
4
0,83
0,45
5
0,67
0,70
6
0,93
0,52
7
0,80
0,35
8
0,75
0,60
Para fazermos a comparao de mdias proposta, precisamos criar as trs colunas de dados: C5,
C6 e C7, que obtida:
MTB > Let c7 = c5 - c6
1
2
3
4
5
6
7
8
C5
Com
C6
Sem
C7
D=Com-Sem
0.72
0.90
0.67
0.83
0.32
0.49
0.51
0.45
0.40
0.41
0.16
0.38
0.67
0.93
0.70
0.52
-0.03
0.41
0.80
0.75
0.35
0.60
0.45
0.15
Aps a criao da coluna C7, para testarmos

H0: D = 0,10 vs H1: D > 0,10, seguimos o
caminho: Stat > Basic Statistics > 1-Sample t,
escolhemos C7 em Variables, colocamos o valor
0.10 em Test mean e escolhemos greater than
em Alternative. Uma maneira alternativa, comsiste em entrar com o comando:
MTB > ttest 0.10 C7;
SUBC> alternative 1.
Resultado em:
T-Test of the Mean
Test of mu = 0.1000 vs mu > 0.1000

Variable
D=COM-SEM
N
8
Mean
0.2913
StDev
0.1746
SE Mean
0.0617
T
3.10
P
0.0087
Como o nvel descritivo do teste muito pequeno (p = 0.0087) rejeitamos a hiptese H0 e comclumos que a suplementao de alfafa aumenta o ganho mdio de peso de coelhos em mais de
0,10 kg.
Outra alternativa de executar o teste consiste em utilizar os comandos:
MTB > Paired 'Com' 'Sem';
SUBC>
Test .10;
SUBC>
Alternative 1.
ou o caminho: Stat > Basic Statistics > Paired t..., indicando C5 como First sample e C6 em
Second sample. Resultando em:
19
Paired T-Test and CI: Com; Sem
Paired T for Com - Sem
N
Mean
Com
8
0.7837
Sem
8
0.4925
Difference
8
0.2912
StDev
0.0988
0.1240
0.1746
SE Mean
0.0349
0.0438
0.0617
95% lower bound for mean difference: 0.1743

T-Test of mean difference = 0.1 (vs > 0.1): T-Value = 3.10
P-Value = 0.009
8. CORRELAO E REGRESSO LINEAR SIMPLES

A seguir veremos como usar o Minitab para estudar o relacionamento entre duas variveis
quantitativas, calculando o coeficiente de correlao linear (de Pearson) entre elas e ajustando uma
reta que relaciona uma varivel Y (varivel resposta ou dependente) e outra varivel X (tambm
chamada de covariada, varivel explanatria ou independente).
8.1. COEFICIENTE DE CORRELAO LINEAR DE PEARSON

Exemplo (da Apostila de Estatstica II) Com o objetivo de estudar a relao entre o peso mdio
de coelhos ao abate (Y), em quilogramas, e o tamanho de ninhada (X), foram coletados na granja do
Campus os dados apresentados a seguir.
X: Tamanho da ninhada
Y: Peso mdio ao abate
4
2,125
8
1,980
6
2,270
1
2,300
7
1,880
3
2,320
7
1,860
5
2,050
Vamos colocar os dados das variveis X e Y nas colunas C8 e C9.

1
2
3
4
5
6
7
8
C8
Ninhada
4
8
6
1
7
3
7
5
C9
Peso
2.125
1.980
2.270
2.300
1.880
2.320
1.860
2.050
Para visualizarmos a possvel relao entre as variveis:

Ninhada e Peso ao Abate, seguimos o caminho: Graph > Plot
e em Graph variables escolhemos C9 em Y e C8 em X, por
exemplo. Ou ento, digitamos:
MTB > plot C9*C8
(note que os valores da coluna C9 vo aparecer no eixo-y e os

valores da coluna C8, no eixo-x)
Pode-se observar no grfico que, medida que o tamanho da ninhada aumenta, ocorre uma
diminuio do peso ao abate, indicando uma correlao negativa entre as duas variveis.
20
2.35
Peso
2.25
2.15
2.05
1.95
1.85
1
Ninhada
Grfico de disperso dos pesos ao abate (kg) e tamanhos de ninhada de coelhos

Para calcularmos o coeficiente de correlao linear de Pearson entre as colunas C8 e C9 seguimos o caminho: Stat > Basic statistics > Correlation... e escolhemos C8 e C9 como Variables.
Ou ento, digitamos:
MTB > Correlation C8 C9
Correlations: Ninhada; Peso
Pearson correlation of Ninhada and Peso = -0.776

P-Value = 0.024
confirmada a correlao negativa (0,776) entre o tamanho da ninhada e o peso ao abate. A hiptese H: (X, Y) = 0 foi rejeitada, pois o nvel descritivo do teste (P-Value= 0,024) foi pequeno. Concluimos ento que existe uma dependncia entre X: tamanho da ninhada e Y: peso ao
abate de coelhos.
8.2. REGRESSO LINEAR SIMPLES

Exemplo (Apostila de Estatstica II) Determinar a reta que relaciona a Absorbncia (Y) com a
concentrao de nitrito (X, em mg/100ml) em amostras de mortadela. Os dados experimentais so:
X: nitrito
Y: Absorbncia
0,5
0,040
1,0
0,078
2,0
0,145
3,0
0,215
4,0
0,300
5,0
0,340
6,0
0,395
7,0
0,460
8,0
0,560
9,0
0,715
Antes de realizarmos os clculos, importante visualizarmos a (possvel !) relao linear entre as

variveis X: Nitrito e Y: Absorbncia. Isso pode ser feito atravs do comando:
MTB > plot C11*C10
21
Colocando os dados de X: Nitrito e Y: Absorbncia nas colunas C10 e C11, respectivamente, a
anlise de regresso feita da seguinte maneira: Stat > Regression > Regression... e escolhemos C11 como Response, e C10 como Predictors. Ou ento, usamos o comando:
MTB > Regress C11 1 C10
The regression equation is

Y:Absorbncia = - 0.0044 + 0.0724 X:Nitrito
Predictor
Constant
X:Nitrit
Coef
-0.00439
0.072350
SE Coef
0.01975
0.003698
S = 0.03271
R-Sq = 98.0%
(5)
Analysis of Variance
Source
Regression
Residual Error
Total
DF
1
8
9
SS
0.40947
0.00856
0.41803
(1)
T
-0.22
19.56
P
0.830
0.000
R-Sq(adj) = 97.7%
MS
0.40947
0.00107
F
382.69
(2)
(3)
(4)
P
0.000
(6)
Unusual Observations
Obs
X:Nitrit
Y:Absorb
Fit
SE Fit
Residual
10
9.00
0.7150
0.6468
0.0194
0.0682
R denotes an observation with a large standardized residual
St Resid
2.59R
Onde podemos identificar:

(1) A equao da reta ajustada: Y:Absorbncia = 0.0044 + 0.0724 X:Nitrito.
(2) A estimativa do intercepto ( a = 0,00439), o seu erro padro (0,01975), o valor da estatstica
para o teste H0: a = 0 vs. H1: a 0 T = 0,22 e o nvel descritivo do teste P = 0,830.
(3) A estimativa da inclinao ( b = 0,072350), o seu erro padro (0,003698), o valor da estatstica para o teste H0: b = 0 vs. H1: b 0 T = 19,56 e o nvel descritivo do teste P = 0,000.
(4) A estimativa do desvio padro s = 0,03271, o coeficiente de determinao (R2) R-Sq =
98,0% e o coeficiente de determinao ajustado (R2ajust) para o nmero de parmetros RSq(adj) = 97,7%
(5) O quadro da anlise de varincia para a regresso, indicando que o modelo de regresso
linear foi significativo (isto , explica bem o relacionamento entre Y e X), j que a fonte de
variao associada ao modelo (Regression) significativa (P = 0.000)
(6) Indica que a dcima observao (X = 9 e Y = 0,7150) apresenta um grande residuo padronizado, sendo uma sria candidata a outlier.
Comentrios: o intercepto pode ser retirado do modelo, pois a hiptese H0: a = 0 no foi rejeitada; o coeficiente angular da reta (inclinao) no nulo, pois a hiptese H0: b = 0 foi rejeitada; o
valor alto do coeficiente de determinao (R2) indica uma boa qualidade do ajuste.
Para solicitarmos a construo de um grfico dos resduos do modelo em funo da varivel X:
Nitrito, aps definirmos o modelo de regresso linear, vamos para Graphs > Residuals for
Plots > Regular e em Residuals versus the variables: escolhemos C10. O grfico resultante
sugere a no existncia de aleatoriedade dos resduos e a presena de um outlier.
22
Residuals Versus X:Nitrit

(response is Y:Absorb)
outlier
Residual
0.05
0.00
-0.05
0
X:Nitrit
Se quisermos que o modelo de regresso no contenha o intercepto, fazemos: Stat > Regression
> Regression..., como Response escolhemos a coluna C11 e como Predictors, a coluna C10 e
em Options desmarcamos a opo Fit intercept. Ou ento, utilizamos o comando:
MTB > Regress 'Y:Absorbancia' 1 'X:Nitrito';
SUBC> NoConstant;
The regression equation is

Y:Absorbancia = 0.0716 X:Nitrito
Predictor
Noconstant
X:Nitrito
Coef
SE Coef
0.071649
0.001832
39.12
0.000
SS
1.4644
0.0086
1.4730
MS
1.4644
0.0010
F
1530.18
S = 0.03094
Analysis of Variance
Source
DF
Regression
1
Residual Error
9
Total
10
Unusual Observations
Obs
X:Nitrit
Y:Absorb
10
9.00
0.71500
Fit
0.64484
SE Fit
0.01648
P
0.000
Residual
0.07016
St Resid
2.68R
Dos resultados apresentados, temos que a estimativa da inclinao da reta que passa pela origem
0,071649, um pouco inferior do modelo com intercepto (0.072350).
Mais uma vez, o Minitab indica que a dcima observao candidata a valor discrepante.
Sugesto: retirar este par de valores (X=9, Y=0,7150) do conjunto de dados e refazer a anlise.
Como exerccio, faa isso e verifique que o problema da presena de outlier fica resolvido e as
concluses sobre o modelo no se alteram.
23
9. TABELAS DE CONTINGNCIA
No mdulo Stat > Tables encontramos as ferramentas para construo de tabelas, como:
Cross tabulation: constri tabelas de contingncia para uma, duas ou mais variveis categricas. As suas clulas podem conter contagens, porcentagens e estatsticas descritivas tais como a
mdia e o desvio padro, associadas a variveis numricas. Tambm disponibiliza o teste de
Quiquadrado testar a associao de variveis.
Tally: constri tabelas com freqncias absolutas, percentuais e percentuais acumuladas para os
valores distintos das variveis.
Chi-Squared Test: faz o teste de Quiquadrado de uma tabela de contingncia.
Multiple Correspondence Analysis: executa a anlise de correspondncia para trs ou mais
variveis categricas.
Para exercitar o uso de alguns desses comandos, vamos utilizar os dados da tabela com
caractersticas da turma de Estatstica II de 1997.
1) Para construir uma distribuio de freqncias da varivel Idade, seguimos o caminho Stat >
Tables > Tally..., selecionamos a varivel Idade e todas as opes de Display, ou digitamos:
MTB > Tally 'Idade';
SUBC>
Counts;
SUBC>
CumCounts;
SUBC>
Percents;
SUBC>
CumPercents.
Tally for Discrete Variables: Idade
Idade Count CumCnt Percent CumPct
18
5
5
16.13 16.13
19
9
14
29.03 45.16
20
8
22
25.81 70.97
21
6
28
19.35 90.32
22
1
29
3.23 93.55
23
2
31
6.45 100.00
N=
31
2) Ser que a maioria dos alunos que fizeram escola pblica (2o grau) tambm fez cursinho?
Para ajudar a responder essa pergunta, vamos construir uma tabela de contingncia das variveis:
Escola pblica? e Cursinho? usando: Stat > Tables > Cross tabulation..., escolhendo as
variveis: Escola pblica? e Cursinho? e selecionando como Display: Counts e Row percents,
ou digitamos:
MTB > Table 'Escola Pblica?' 'Cursinho?';
SUBC>
Counts;
SUBC>
RowPercents.
24
Rows: Escola Pblica?
Columns: Cursinho?
no
sim
All
no
10
40.00
15
60.00
25
100.00
sim
1
16.67
5
83.33
6
100.00
All
11
35.48
20
64.52
31
100.00
Cell Contents -- Count

% of Row
onde podemos perceber que 83,33% dos alunos que fizeram o 2o em Escola Pblica precisaram
fazer cursinho; dentre os alunos de escola particular, essa porcentagem cai para 60%.
Para testarmos se existe alguma relao entre essas duas variveis categricas, podemos
solicitar o teste de Quiquadrado para as hipteses
H0: Cursinho? independente de Escola Pblica?
H1: Cursinho? dependente de Escola Pblica?
usando os comandos:
MTB > Table 'Escola Pblica?' 'Cursinho?';
SUBC> Chisquare.
Rows: Escola Pblica?
no
sim
All
Columns: Cursinho?
no
sim
All
10
1
11
15
5
20
25
6
31
Chi-Square = 1.151; DF = 1; P-Value = 0.283

2 cells with expected counts less than 5.0
como o nvel descritivo alto (P-value=0,283) no rejeitamos H0 e conclumos que as duas

variveis classificatrias so independentes.
3) Construir uma tabela com estatsticas bsicas da varivel C4: peso, por C2: sexo e por C13:
Fuma?, mais o teste de Quiquadrado para verificar se o ato fumar independe do sexo:
MTB > table c2 c13;
SUBC> stats c4;
SUBC> chisq.
25
Rows: Sexo
Columns: Fuma?
no
10
56.380
6.050
10
sim
3
62.333
15.373
3
All
13
57.754
8.582
13
15
80.267
16.241
15
3
79.000
13.077
3
18
80.056
15.414
18
All
25
6
31
70.712
70.667
70.703
17.614
15.693
17.007
25
6
31
Chi-Square = 0.199; DF = 1; P-Value = 0.656
2 cells with expected counts less than 5.0
Cell Contents -Peso:N
Mean
StDev
Count
4) Para construir uma tabela com trs variveis classificatrias C2: Sexo, C10: Alojamento? e C12:
Esporte?, podemos usar o comando
MTB > table c2 c10 c12
Control: Esporte? = no
Rows: Sexo
Columns: Alojamen
F
M
All
no
sim
All
1
4
5
2
1
3
3
5
8
Control: Esporte? = sim

Rows: Sexo
Columns: Alojamen
F
M
All
no
sim
All
1
6
7
9
7
16
10
13
23
Cell Contents -Count
Se trocarmos a ordem das colunas no comando, mudamos a disposio das variveis na tabela.
Podemos tambm alterar a apresentao dos resultados na tabela, para evidenciar alguma relao
ou para compactar a sada dos resultados, utilizando o subcomando layout.
26
Neste mesmo exemplo, onde temos 3 variveis classificatrias, se quisermos que a tabela apresente uma varivel nas linhas e duas variveis nas colunas, devemos usar:
MTB > table c2 c10 c12;
SUBC> layout 1 2.
Rows: Sexo
Columns: Alojamen / Esporte?
no
-------------no
sim
F
M
All
1
4
5
1
6
7
sim
-------------no
sim
2
1
3
9
7
16
All
----All
13
18
31
Cell Contents -Count
Se quisermos ainda, que seja apresentada a porcentagem de alunos por sexo nas diversas classes
e a mdia de C14: Estatstica I, usamos:
MTB >
SUBC>
SUBC>
SUBC>
table c2 c10 c12;

layout 1 2;
rowpercents;
mean C14.
Rows: Sexo
Columns: Alojamen / Esporte?
no
-------------no
sim
sim
-------------no
sim
All
----All
7.69
6.0000
7.69
8.4000
15.38
2.9500
69.23
4.3667
100.00
4.5846
22.22
6.5250
33.33
3.5500
5.56
4.4000
38.89
5.6000
100.00
5.0556
All
16.13
6.4200
22.58
4.2429
9.68
3.4333
51.61
4.9063
100.00
4.8581
Cell Contents -% of Row

Estat-I: Mean
Onde podemos notar:

que a porcentagem de alunas que praticam esporte maior dentre aquelas que moram no alojamento;
essa caracterstica tambm se mantm entre os alunos, mas de forma menos sensvel;
dentre os alunos de ambos os sexos que no moram no alojamento, a mdia em Estatstica I
foi maior entre aqueles que no praticam qualquer tipo de esporte.
27
INTRODUO AO USO DO MINITAB

NA ANLISE DE VARINCIA
(COM EXEMPLOS)
EXEMPLO 1. DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)
Com o objetivo de avaliar a utilizao do farelo bruto realizou-se um experimento com durao de
28 dias, envolvendo 4 tratamentos (0, 10, 20 e 30% de substituio) e 5 repeties por tratamento.
Cada parcela foi constituda de 50 pintos de um dia de idade da linhagem "Ross", sendo 25 machos
e 25 fmeas. Os resultados dos ganhos de peso mdio, em kg, de cada parcela so:
% de substituio por farelo bruto
0%
10%
20%
30%
0.60
0.82
0.79
0.82
0.62
0.85
0.83
0.81
0.61
0.78
0.82
0.79
0.64
0.79
0.81
0.80
0.63
0.80
0.82
0.79

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
C1
Farelo
0
0
0
0
0
10
10
10
10
10
20
20
20
20
20
30
30
30
30
30
C2
Repet
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
C3
GP
0.60
0.62
0.61
0.64
0.63
0.82
0.85
0.78
0.79
0.80
0.79
0.83
0.82
0.81
0.82
0.82
0.81
0.79
0.80
0.79
A criao de uma planilha (Worksheet) com esses dados

envolve a digitao dos dados em trs colunas: a
primeira (C1) de nome Farelo, indicando os nveis de
tratamento; a segunda (C2) de nome Repet, com o
nmero da repetio dentro de cada tratamento e a
terceira (C3) de nome GP, com os correspondentes
ganhos de peso.
Para exibir esses dados no monitor, usamos o mouse e
clicamos em Manip > Display data... A seguir selecionamos as colunas C1, C2 e C3 com um clique duplo
sobre seus nomes e depois clicamos em Ok. Uma forma
alternativa consiste em entrar com o seguinte comando
na janela Session:
MTB > print c1-c3
Para calcular algumas estatsticas descritivas da coluna

de ganhos de peso, usamos:
Variable Farelo N
Mean
GP
0
5 0.62000
10
5 0.80800
20
5 0.81400
30
5 0.80200
Variable
GP
Farelo
0
10
20
30
Min
0.60000
0.78000
0.79000
0.79000
MTB > describe c3;
Resultando em:
Median
0.62000
0.80000
0.82000
0.80000
Max
0.64000
0.85000
0.83000
0.82000
Tr Mean
0.62000
0.80800
0.81400
0.80200
Q1
0.60500
0.78500
0.80000
0.79000
StDev
0.01581
0.02770
0.01517
0.01304
SE Mean
0.00707
0.01240
0.00678
0.00583
Q3
0.63500
0.83500
0.82500
0.81500
28
Se quizermos calcular somente a mdia e o desvio padro de GP de cada um dos tratamentos, podemos fazer: Stat > Table > Cross Tabulation, escolher como Classification variables a
coluna C1 Farelo; em Summaries escolher C2 GP como Associated variables: e marcar no
Display os nomes Means e Standard deviations. Como alternativa, entramos com o comando:
MTB > table c1;
SUBC> mean c3;
SUBC> stdev c3.
Rows: Farelo
Ganho
Mean
1
0.62000
2
0.80800
3
0.81400
4
0.80200
All 0.76100
Ganho
StDev
0.01581
0.02775
0.01517
0.01304
0.08540
Se quisermos testar a homogeneidade das varincias dos tratamentos, devemos clicar em Stat >
ANOVA > Homogeneity of variance e a seguir, escolher em Response a coluna C3 GP e em
Factors a coluna C1 Farelo. Ou ento usar o comando:
MTB > %Vartest
c3 c1
O resultado consiste de um grfico com intervalos de confiana para os desvios padres dos tratamentos e os resultados dos testes de Bartlett e de Levene. Vale lembrar que podemos assumir que
as varincias so iguais se o P-value (nvel descritivo do teste) for superior a 5% (mais comum!)
ou a 10%.
Homogeneity of Variance Test for GP

95% Confidence Intervals for Sigmas
Factor Levels
0
Bartlett's Test
10
20
P-Value
: 0.439
Levene's Test
P-Value
: 0.548
30
0.00
0.05
0.10
Para fazer a anlise de varincia dos dados desse experimento, cujo delineamento o inteiramente casualizado com 5 repeties/tratamento, comparar as mdias atravs do teste de Tukey
29
(= 5%) e calcular os resduos (e gravar em C5) para, posteriormente, verificarmos se os erros
tm distribuio normal, devemos clicar em Stat > ANOVA > Oneway, escolher em Response a
coluna C3 GP, em Factor a coluna C1 Farelo, em Comparisons a opo Tukey, family error
rate: 5 e clicar no quadro Store residuals. Ou ento, entrar com o comando:
MTB > oneway c3 c1 c4;
SUBC> Tukey 5.
Analysis of Variance for Ganho
Source
Farelo
Error
Total
DF
3
16
19
Level
1
2
3
4
N
5
5
5
5
Pooled StDev =
SS
0.132900
0.005680
0.138580
(1)
MS
0.044300
0.000355
Mean
0.62000
0.80800
0.81400
0.80200
StDev
0.01581
0.02775
0.01517
0.01304
0.01884
Tukey's pairwise comparisons
F
124.79
P
0.000
Individual 95% CIs For Mean

Based on Pooled StDev
(2)
----+---------+---------+---------+-(--*-)
(-*--)
(-*--)
(--*-)
----+---------+---------+---------+-0.630
0.700
0.770
0.840
(3)
Family error rate = 0.0500

Individual error rate = 0.0113
Critical value = 4.05
Intervals for (column level mean) - (row level mean)
1
-0.22213
-0.15387
-0.22813
-0.15987
-0.04013
0.02813
-0.21613
-0.14787
-0.02813
0.04013
-0.02213
0.04613
Comentrios sobre os resultados:

(1) no quadro da anlise de varincia podemos verificar a significncia do fator Farelo (p<0,0001),
ou seja, podemos afirmar que existe pelo menos um efeito no nulo do fator Farelo sobre o GP,
ou que pelo menos duas das mdias do fator Farelo so diferentes entre si, quanto ao GP.
(2) o nmero de observaes, a mdia e o desvio padro de cada nvel do fator Farelo, alm de
intervalos de confiana para as mdias, podendo-se observar que os animais que receberam os
nveis 10, 20 e 30 tiveram um GP similar entre si e superior ao nvel 0 (zero).
(3) resultados da comparao das mdias do fator Farelo utilizando o teste de Tukey (5%). So
apresentados intervalos de confiana para a diferena entre as mdias dos diversos nveis.
Diferenas significativas entre mdias podem ser identificadas nos intervalos onde os limites
(inferior e superior) tm o mesmo sinal. Pode-se perceber que as comparaes envolvendo o
nvel 0 so significativas e que as comparaes envolvendo outras duas mdias no so
significativas. A tabela seguinte, resume esses resultados:
30
Farelo
0
10
20
30
Mdia
0.62000
0.80800
0.81400
0.80200
a
b
b
b
OBSERVAO IMPORTANTE: como o fator Farelo uma varivel quantitativa, no indicado o uso de qualquer mtodo de comparao mltipla para avaliar as possveis diferenas
entre as mdias desse fator. Neste caso, indicado um estudo de regresso, para estudarmos a
relao entre os nveis do fator Farelo e os ganhos de peso dos animais.
Com o Minitab, podemos visualizar o comportamento das respostas mdias fazendo: Stat >
ANOVA > Main Effects plot.. e escolhendo C3 GP como Responses: e C1 Farelo como Factors:.
Do grfico resultante pode-se perceber uma tendncia quadrtica de resposta de Y (ganho de peso)
em funo de X (% de substituio por farelo bruto). Para ajustar uma equao do segundo grau,
fazemos Stat > Regression > Fitted Line Plot... e escolhemos C3 GP como Response (Y) e C1
Farelo como Predictor (X) e finalmente, escolhemos Quadratic em Type of Regression Model.
O resultado um grfico de disperso com o desenho da curva ajustada, sua equao GP =

0.6282 + 0.02052 Farelo - 0.0005 Farelo**2, uma estimativa do desvio padro dos dados S =
0,0270120, o coeficiente de determinao R-Sq = 91.0 % e o coeficiente de determinao ajustado
R-Sq(adj) = 90.0 %, indicando um timo ajuste do modelo.
A partir da equao de regresso ajustada, podemos estimar a porcentagem de substituio
de farelo que proporciona o maior ganho de peso. Para tanto, igualamos a zero a derivada primeira
de GP em relao a X (Farelo):
0,02052
d (GP)
= 0,02052 0,0010X = 0 X =
= 20,52
dx
0,0010
e obtemos o ponto de resposta mxima Farelo = 20,52% e GP = 0,84 kg no intervalo de 28 dias.
31
Se os dados de GP dos tratamentos 0, 10, 20 e 30% estivessem digitados nas colunas C5,
C6, C7 e C8, respectivamente:

1
2
3
4
5
C5
0%
0.60
0.62
0.61
0.64
0.63
C6
10%
0.82
0.85
0.78
0.79
0.80
C7
20%
0.79
0.83
0.82
0.81
0.82
C8
30%
0.82
0.81
0.79
0.80
0.79
A mesma anlise pode ser feita clicando-se em Stat > ANOVA > Oneway (Unstacked) e, a seguir,
escolher em Responses (in separate columns) as colunas C5 a C8, ou entrar com o comando:
MTB > aovoneway C5-c8
Com esta opo, somente sero mostrados os quadros (1) e (2), no havendo possibilidade de se
comparar os pares de mdias atravs do teste de Tukey.
Para testar a normalidade dos erros podemos clicar em Stat > Basic Statistics > Normality
test e a seguir escolher em Variable a coluna C5 RESI1 e em Tests for Normality, escolher um
dos testes disponveis (Anderson-Darling, Ryan-Joiner ou Kolmogorov-Smirnov).
O resultado do teste de Anderson-Darling permite concluir que os erros do modelo (estimados pelos resduos gravados em C5 RESI1) tm distribuio normal, pois o teste forneceu um nvel
descritivo muito alto (P-Value = 0,909). Um modo mais rpido de executar esse teste consiste em
usar o comando:
MTB > %NormPlot c5
Normal Probability Plot
.999
.99
Probability
.95
.80
.50
.20
.05
.01
.001
-0.03
-0.02
-0.01
0.00
0.01
0.02
0.03
0.04
RESI1
Average: 0
StDev: 0.0172901
N: 20
Anderson-Darling Normality Test

A-Squared: 0.176
P-Value: 0.909
Comentrios:
a) neste tipo de anlise ainda podemos utilizar alguns grficos, como por exemplo, o dotplot e o
boxplot, para avaliar a distribuio, a variabilidade, a assimetria, a presena de valores discrepantes nos dados originais, alm do histograma, normal plot etc. dos resduos para avaliar a sua distribuio.
b) se a varivel que define o fator quantitativa, sempre devemos optar por uma anlise de regresso para estudar o comportamento das respostas em funo dos nveis desse fator.
32
EXEMPLO 2. DELINEAMENTO INTEIRAMENTE CASUALIZADO - EXPERIMENTO
FATORIAL
No setor de suinocultura do Campus foi feito um estudo sobre o consumo dirio de rao,
em kg/dia, em sunos no perodo de crescimento/ acabamento, envolvendo trs tipos de rao (R1:
farelada; R2: granulada e R3: peletizada) e duas formas de arraoamento (A1: vontade e A2:
controlada) e utilizando 4 animais/tratamento. Os dados experimentais resultantes esto apresentados na tabela abaixo:
Arraoamento
Rao
Farelada
2.63
Granulada
2.19
Peletizada
2.31
2.64
2.21
2.30
2.65
2.22
2.30
2.70
2.20
2.28
2.28
2.32
2.19
2.26
2.30
2.18
2.23
2.31
2.16
2.20
2.30
2.21
vontade
Controlada
A planilha com os dados construda de modo similar do Exemplo 1: nas trs primeiras
colunas esto as informaes sobre o tipo de rao (C1), o tipo de arraoamento (C2) e o nmero
da repetio (C3); em C4 esto os dados do consumo diria de rao, em kg/dia. Uma parte da
planilha est apresentada a seguir. Vale notar que a letra -T nas colunas C1 e C2 indica que elas no
so numricas.
C1-T
Racao
Farelada
C2-T
C3
C4
Arracoamento Repet Consumo
A vontade
1
2.63
Farelada
A vontade
2.64
Farelada
A vontade
2.65
Farelada
A vontade
2.70
Farelada
Controlada
2.28
Farelada
Controlada
2.26
Farelada
Controlada
2.23
Farelada
Controlada
2.20
continua...
Uma tabela com as mdias de consumo, por tipo de rao e tipo de arraoamento obtida
com os comandos:
MTB > table c1 c2;
SUBC > means c4.
33
Rows: Racao
Columns: Arracoam
vontad Controla
Farelada
Granulad
Peletiza
All
2.6550
2.2050
2.2975
2.3858
2.2425
2.3075
2.1850
2.2450
All
2.4488
2.2563
2.2413
2.3154
Cell Contents -Consumo:Mean
Podemos inverter a disposio das variveis classificatrias fazendo:

MTB > table c2 c1;
SUBC > means c4.
Rows: Arracoam
Columns: Racao
Farelada Granulad Peletiza

vontad
Controla
All
2.6550
2.2425
2.4488
2.2050
2.3075
2.2563
2.2975
2.1850
2.2413
All
2.3858
2.2450
2.3154
Cell Contents -Consumo:Mean
Para testar a homogeneidade de varincias clicamos em Stat > ANOVA > Homogeneity of
variance e a seguir, escolhemos em Response a coluna C4 Consumo e em Factors as colunas C1
Racao e C2 Arracoam. Ou ento, podemos usar o comando:
MTB > %vartest c4 c1 c2
34
Da figura, podemos perceber que pelos testes de Bartlett (P-Value = 0,225) e de Levene (P-Value =
0,265) a homogeneidade das varincias foi aceita, e podemos realizar anlise de varincia.
IMPORTANTE: Se a homogeneidade das varincias for rejeitada, a anlise de varincia no deve
ser utilizada para comparar os tratamentos, j que isso pode interferir nos resultados finais. Solues
para este problema envolvem a busca de uma transformao da varivel resposta ou o uso de mtodos de anlise no paramtricos.
A anlise de varincia do experimento fatorial 3x2 (3 tipos de rao e 2 tipos de arraoamento) em um delineamento inteiramente casualizado com r = 4 repeties, considerando os fatores
de efeito fixo, feita clicando-se em Stat > ANOVA > Twoway, escolher em Response a coluna
C4 Consumo, em Row factor a coluna C1 Racao, em Column factor a coluna C2 Arracoam Store,
alm de clicar em Display means e Store residuals.
Two-way ANOVA: Consumo versus Racao; Arracoamento

Analysis of Variance for Consumo
Source
DF
SS
MS
Racao
2 0.214233 0.107117
Arracoam
1 0.119004 0.119004
Interaction
2 0.267633 0.133817
Error
18 0.009125 0.000507
Total
23 0.609996
Racao
Farelada
Granulad
Peletiza
Mean
2.4488
2.2563
2.2413
Arracoam
vontad
Controla
Mean
2.3858
2.2450
F
211.30
234.75
263.97
P
0.000
0.000
0.000
Individual 95% CI
----------+---------+---------+---------+(--*--)
(--*--)
(--*-)
----------+---------+---------+---------+2.2800
2.3400
2.4000
2.4600
Individual 95% CI
----+---------+---------+---------+------(--*--)
(--*--)
----+---------+---------+---------+------2.2500
2.3000
2.3500
2.4000
Como o nmero de repeties o mesmo para todos os tratamentos, uma alternativa para
realizar a anlise, consiste em utilizar a opo Balanced Anova... Escolhemos ento Stat >
ANOVA > Balanced Anova...; em Responses C4 Consumo; em Model escrevemos Racao
Arracoam Racao*Arracoam e em Storage marcamos Residuals. Em Options... > Display means
corresponding to the terms escrevemos Racao Arracoam Racao*Arracoam. Ou ento, entramos
com o comando:
MTB > anova c4 = c1 c2 c1*c2;
SUBC > means c1 c2 c1*c2;
SUBC > residuals c4.
35
ANOVA: Consumo versus Racao; Arracoamento

Factor
Racao
Arracoam
Type Levels Values

fixed
3
Farelada Granulada Peletizada
fixed
2 A vontade Controlada
Analysis of Variance for Consumo

Source
DF
SS
Racao
2
0.21423
Arracoam
1
0.11900
Racao*Arracoam
2
0.26763
Error
18
0.00912
Total
23
0.61000
MS
0.10712
0.11900
0.13382
0.00051
F
211.30
234.75
263.97
P
0.000
0.000
0.000
Means
Racao
Farelada
Granulada
Peletizada
N
8
8
8
Arracoam
vontade
Controlada
N
12
12
Racao
Farelada
Farelada
Granulada
Granulada
Peletizada
Peletizada
Consumo
2.4488
2.2563
2.2413
Consumo
2.3858
2.2450
Arracoam
vontade
Controlada
vontade
Controlada
vontade
Controlada
N
4
4
4
4
4
4
Consumo
2.6550
2.2425
2.2050
2.3075
2.2975
2.1850
Comentrios:
a interao Racao*Arracoam foi significativa (P < 0,001), indicando que o consumo dos animais
que receberam um certo tipo de rao (farelada, granulada ou peletizada) depende do tipo de
arraoamento ( vontade ou controlada) ou vice-e-versa.
os efeitos individuais de Rao (P < 0,001) e de Arraoamento (P < 0,001) foram significativos,
mas esses resultados no tem grande importncia porque a interao foi significativa.
A interao pode ser melhor entendida analisando-se os grficos apropriados que so obtidos
em Stat > ANOVA > Interactions plot , escolhendo a coluna C4: Consumo em Responses:,
em Factors, as colunas C1: Racao e C2: Arracoam e selecionando Display full interaction plot
matrix. De forma alternativa, pode-se utilizar o comando
MTB > %Interact c1 c2;
SUBC> Response c4;
SUBC> Full.
36
Interaction
Plotada- Data Meansde for Consumo
a
ad
da
la
re
a
F
l
nu
ra
G
e
el
P
tiz
a
nt
vo
da
la
tro
n
o
2.6
Racao
Peletizada
2.4
Granulada
2.2
Farelada
2.6
Arracoamento
Controlada
2.4
2.2
A vontade
Exemplo 3. DELINEAMENTO EM BLOCOS CASUALIZADOS E EXPERIMENTO EM

PARCELAS SUBDIVIDIDAS
Para estudar o efeito de trs nveis de adubao (A) e de dois espaamentos (E) na altura
(em centmetros) de certo tipo de plantas, planejou-se um experimento em parcelas subdivididas
num delineamento em blocos casualizados. Os tratamentos principais correspondem a trs nveis de
adubao (A0, A1 e A2) e os tratamentos secundrios a dois espaamentos (E1 e E2). Os blocos (I, II,
III, IV) controlam a fertilidade do solo. Os dados so apresentados a seguir:
A0
Bloco
A1
A2
E1
58
E2
44
E1
85
E2
59
E1
66
E2
54
II
77
59
90
68
93
75
III
38
30
73
45
67
53
IV
52
34
77
55
64
48
A planilha com os dados construda de modo similar dos exemplos anteriores: nas trs
primeiras colunas esto as informaes sobre os nveis de adubao (C1: Adubacao), os dois espaamentos (C2: Espacamento) e os blocos (C3: Bloco); em C4 esto as alturas em centmetros (C4:
Altura).
Se os quadros auxiliares de totais forem necessrios para o clculo de somas de quadrados
da interao entre Adubao e Espaamento, podemos utilizar os comandos
MTB > table c1 c2;
SUBC> sums c4.
resultando em:
37
Tabulated Statistics
Rows: Espacame
Columns: Adubacao
A0
A1
A2
All
E1 225.000 325.000 290.000 840.000
E2 167.000 227.000 230.000 624.000
All 392.000 552.000 520.000 1464.000
Cell Contents -Altura:Sum
Para testar a homogeneidade das varincias, podemos (verifique!) utilizar o comando:

MTB > %Vartest
C4 C1 C2
e, como os nveis descritivos dos testes de Bartlett (P = 0.883) e de Levene (P= 0.953) so muito
altos podemos aceitar a hiptese de homogeneidade das varincias. (Verifique!!!)
Para realizar a anlise de varincia deste experimento em parcelas subdivididas num delineamento em blocos casualizados, consideraremos os nveis do fator C1: Adubacao aplicados s parcelas e os nveis de C2: Espacamento, aplicados s subparcelas, ambos de efeito fixo. Para que os
testes F de significncia sejam feitos corretamente, devemos considerar o fator Bloco como de
efeito aleatrio.
Da utilizarmos a seqncia: Stat > ANOVA > Balanced Anova... e inserimos as informaces necessrias como apresentado na figura seguinte. Em Storage marcamos Residuals e em
Options... > Display means corresponding to the terms escrevemos: Adubacao Espacamento
Adubacao*Espacamento. De modo alternativo, podemos entrar com o comando:
MTB >
SUBC>
SUBC>
SUBC>
anova c4 = c3 c1 c1*c3 c2 c1*c2;

random c3;
residuals c5;
means c1 c2 c1*c2;
Resultando em:
38
ANOVA: Altura versus Bloco; Adubacao; Espacamento

Factor
Type Levels Values
Bloco
random
4
I
Adubacao fixed
3
A0
Espacame fixed
2
E1
II
A1
E2
III
A2
IV
Analysis of Variance for Altura

Source
Bloco
Adubacao
Bloco*Adubacao
Espacame
Adubacao*Espacame
Error
Total
DF
3
2
6
1
2
9
23
SS
2352.00
1792.00
320.00
1944.00
127.00
57.00
6592.00
MS
784.00
896.00
53.33
1944.00
63.50
6.33
F
14.70
16.80
8.42
306.95
10.03
P
0.004
0.003
0.003
0.000
0.005
Means
Adubacao
A0
A1
A2
N
8
8
8
Altura
49.000
69.000
65.000
Espacame
E1
E2
N
12
12
Altura
70.000
52.000
Adubacao
A0
A0
A1
A1
A2
A2
Espacame
E1
E2
E1
E2
E1
E2
N
4
4
4
4
4
4
Altura
56.250
41.750
81.250
56.750
72.500
57.500
Vale notar que os testes de significncia da ANOVA foram realizados corretamente: para
testar o efeito de Bloco e de Adubao, que esto relacionados variao entre parcelas, foi
utilizado o QM da interao Bloco*Adubacao, que corresponde ao QMResiduo(a); nos demais
testes relacio-nados variao entre subparcelas, foi utilizado o QM do Error, que corresponde ao
QMResiduo(b).
Como a interao entre os fatores Adubacao e Espacamento foi significativa, podemos estud-la
atravs dos grficos apropriados: Stat > ANOVA > Interactions plot, escolhendo em Factors C1
Adubacao e C2 Espacamento, em Raw response data in: a coluna C4 Altura e clicando em
Display full interaction plot matrix.
39
Se quisermos que tambm sejam calculadas as E(QM) e as estimativas dos componentes de

varincias dos fatores de efeito aleatrio, que so muito teis no melhoramento animal, basta selecionarmos em Options... o item Display expected mean squares, ou incluirmos o subcomando
SUBC> EMS;
no comando ANOVA. O resultado o seguinte:

Source
1
2
3
4
5
6
Variance Error Expected Mean Square for Each Term

component term (using unrestricted model)
Bloco
121.778
3
(6) + 2(3) + 6(1)
Adubacao
3
(6) + 2(3) + Q[2;5]
Bloco*Adubacao
23.500
6
(6) + 2(3)
Espacame
6
(6) + Q[4;5]
Adubacao*Espacame
6
(6) + Q[5]
Error
6.333
(6)
CONSIDERAES FINAIS:
o MINITAB no executa testes de comparaes de mdias dos nveis de fatores envolvidos na
interao
Para obtermos algumas informaes sobre o comportamento das mdias dos nveis de um fator
dentro dos nveis do outro fator, podemos utilizar os grficos Interactions plot..., no caso de um
experimento fatorial ou em parcelas subdivididas.
A opo Stat > ANOVA > Balanced ANOVA... deve ser utilizada na anlise de experimentos
oneway ou de experimentos mais complexos, desde que o conjunto de dados seja balanceado
(mesmo nmero de repeties).
No caso de experimentos mais complexos ou desbalanceados deveremos utilizar a opo Stat

> ANOVA > General Linear Model, cujos detalhes no sero apresentados nesta apostila.

Minitab - Apostila - FZEA-USP

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Minitab - Apostila - FZEA-USP

Enviado por

Direitos autorais:

Formatos disponíveis

INTRODUO AO USO DO

Material preparado pelo Prof. Dr. Csar Gonalves de Lima

Para uso nas aulas das disciplinas:

As quatro janelas de trabalho so apresentadas como:

MTB > Let K2 = Mini(C2)

EXERCCIOS DE APLICAO REVISO DE ESTATSTICA DESCRITIVA

Siga corretamente as instrues e tente traduzir as sadas.

2. AS OPES DA BARRA STAT

Store Descriptive Statistics: calcula diversas estatsticas descritivas e grava os resultados na

Regression (Stat > Regression)

Introduo ao uso do MINITAB

DOE (Design of Experiments) (Stat > DOE)

EDA (Exploratory Data Analysis) (Stat > EDA)

3. USANDO O MINITAB PARA SIMULAES E CLCULO DE PROBABILIDADES

gera a seguinte sada:

Probability Density Function

Introduo ao uso do MINITAB

Cumulative Distribution Function

ou seja: a probabilidade de encontrarmos at 4 sucessos, quando X ~ B(7; 0,3) igual a 0,9712.

Cumulative Distribution Function

Cumulative Distribution Function

ou seja, 93,3% dos calouros 99 tm altura igual ou inferior a 1,85 metros.

Inverse Cumulative Distribution Function

Inverse Cumulative Distribution Function

COMANDO RANDOM: Permite gerar amostras aleatrias de distribuies tericas associadas a

simulam (e mostram) os resultados de 15 experimentos binomiais com n = 10 eleitores e p =

Introduo ao uso do MINITAB

Para imprimir os dados simulados de C2 e as estatsticas descritivas correspondentes, usamos:

Introduo ao uso do MINITAB

coloca em C11 os dez valores de C3 sorteados ao acaso e com reposio.

MTB > ZINTERVAL 95 1 C7

Introduo ao uso do MINITAB

4.2. INTERVALO DE CONFIANA PARA A PROPORO (p)

Introduo ao uso do MINITAB

CASO 2: Amostras pequenas (usa a distribuio binomial)

Introduo ao uso do MINITAB

5. TESTES DE HIPTESE PARA A MDIA DE UMA DISTRIBUIO NORMAL E PARA A PROPORO

5.2. TESTE PARA A MDIA QUANDO A VARINCIA POPULACIONAL DESCONHECIDA

T-Test of the Mean

Como o valor do nvel descritivo do teste relativamente grande ( = P = 0,18), podemos

5.3. TESTE PARA A PROPORO

Test and CI for One Proportion

95.0% Lower Bound

6. COMPARAES ENTRE AS MDIAS DE DUAS DISTRIBUIES NORMAIS

Como j sabemos, antes de compararmos as

Introduo ao uso do MINITAB

Bonferroni confidence intervals

for standard deviations

F-Test (normal distribution)

CASO 1. AS VARINCIAS POPULACIONAIS FORAM CONSIDERADAS IGUAIS

Two-Sample T-Test and CI: Amostra 1; Amostra 2

Difference = mu Amostra 1 - mu Amostra 2

Observe que so apresentados:

CASO 2. AS VARINCIAS POPULACIONAIS FORAM CONSIDERADAS DIFERENTES

Two Sample T-Test and Confidence Interval

Introduo ao uso do MINITAB

7. COMPARAO DE MDIAS DE DUAS POPULAES DEPENDENTES

Aps a criao da coluna C7, para testarmos

Test of mu = 0.1000 vs mu > 0.1000

95% lower bound for mean difference: 0.1743

8. CORRELAO E REGRESSO LINEAR SIMPLES

8.1. COEFICIENTE DE CORRELAO LINEAR DE PEARSON

Vamos colocar os dados das variveis X e Y nas colunas C8 e C9.

anova c4 = c3 c1 c1c3 c2 c1c2;