Você está na página 1de 24

UNIVERSIDADE FEDERAL DE SERGIPE

CENTRO DE CIENCIAS EXATAS E TECNOLOGIA


DEPARTAMENTO DE ESTATÍSTICA E CIÊNCIAS ATUARIAIS
Disciplina:
Professora:

NOTAS DE AULA

1-Por que Utilizar a Estatística


A Estatística nada mais é que uma ferramenta que poderá auxiliará na
interpretação dos resultados e poderá confirmar a hipótese a ser testada ou
simplesmente recusá-la.
Desta forma devemos ter muito cuidado ao utilizar a estatística, como a
ferramenta que irá dizer se, por exemplo "uma área será condenada por
poluição de metais pesado no solo". O que pode ocorrer é que a estatística irá
indicar uma diferença numérica, caberá ao profissional avaliar os parâmetros
não previsíveis no modelo matemático e tomar a decisão.

2-Ensaio x Experimentação

Existem diferenças básicas entre os dois métodos de avaliar um dado


científico. As diferenças vão desde a simples forma de avaliar e encarar a coleta
dos dados até a forma de apresentação dos dados. Abaixo no Quadro 1 são
listadas as diferenças entre os dois métodos.

1
3-Planejamento Experimental

3.1 Fases do Planejamento

Quando realizamos um estudo, primeiro consideramos sua importância.


Em seguida, traçamos os objetivos que pretendemos alcançar e a finalidade de
sua realização.
Se houver alguma informação que possa auxiliar como ponto de partida,
esta poderá fornecer alguns indicadores ou ensinar novas técnicas que servirão
para complementar nossa experiência. Estas informações deverão ser avaliadas
e criticadas, pois os dados poderão apresentar falhas ou nada representaram
para o estudo do problema ou para a elaboração das hipóteses a serem
formuladas. Em suma, diremos que os dados selecionados devem ser os
estritamente necessários.

3.1.1 Problema

Ao planejar o problema que se vai pesquisar, deverá ser dada especial


atenção aos seguintes pontos:

• Definição da importância do problema que se estuda;


• Determinação do(s) objetivo(s) e finalidade da investigação.

Definir a importância do problema que se estuda é explicar o que vamos


estudar. Será impossível o planejamento das etapas subseqüentes se não ficar
claramente evidenciado o problema a investigar. Não basta, por exemplo, dizer
que se vai estudar a biodiversidade da floresta atlântica, o efeito da poluição do
rio Paraíba do Sul, pois provavelmente nenhum pesquisador terá possibilidade e
capacidade de abordar todos os aspectos da biodiversidade ou da poluição. É
importante também especificar sua extensão.

3.1.2 Informações Existentes

Antes de empreender o experimento, o pesquisador deve revisar tudo o


que diz respeito ao fato em estudo, com a finalidade de saber o que já se
conhece sobre o assunto.
Decerto serão encontrados vários subsídios que fornecerão valiosa
colaboração para o estudo.
A revisão bibliográfica sobre o assunto deverá sofrer cuidadosa seleção
para que os resultados mais afins possam ser aproveitados no conforto e
discussão posteriores à da pesquisa.

3.1.3 Noções Gerais Sobre Hipótese

A hipótese, resultado de um raciocínio indutivo (consciente ou


subconsciente), requer demonstração ou prova de sua adequação. Sabemos
que a veracidade de uma hipótese nunca pode ser demonstrada ou provada
2
definitivamente. O que se faz é verificar se ela não seria falsa; o que nos levaria
a rejeitá-la e a formular uma outra, se necessário.
Enquanto não se possa demonstrar que ela é incorreta, mantém-se a
hipótese como boa. Dela deduzimos as conseqüências ou fazemos previsões.
Por sua vez, essas conseqüências e previsões serão testadas, para ver se a
hipótese adotada ainda se mantém ou não.
O planejamento de pesquisa consiste, portanto, na elaboração de um
plano de observação, ou de experimentação, destinado a contestar
determinada hipótese, por mais justa e sólida que possa parecer. A estratégia
para isso depende da natureza do problema em causa.
Muitas vezes, o que se tem em vista é verificar uma relação de causa e
efeito: queremos saber se a variável X e a variável Y, peculiares a determinado
fenômeno, guardam entre si relações de causa e efeito (direta ou
indiretamente).

3.1.4 Formulação das Hipóteses

A estatística, testa duas hipóteses, que geralmente são denominadas de


H0 ou Hipótese nula e Ha ou Hipótese alternativa.

Elaborando as hipóteses

O pressuposto a hipótese estatística é sempre testar a nulidade dos


dados. Por exemplo, em um experimente está sendo testada a capacidade de
duas substâncias possuírem o mesmo poder de reação química, nas proporções
utilizadas. A H0 deverá ser a seguinte: as substâncias possuem a mesma
capacidade de reação. Já a Ha, será as substâncias não possuem a mesma
capacidade de reação.

A hipótese nula admite que os resultados são iguais ou com diferenças


aleatórias entre os tratamentos.

Já a hipótese alternativa, testa a falta de nulidade ou falta de diferenças


aleatórias entre os tratamentos.

Testando as Hipóteses

Existem várias formas de testar as hipóteses elaboradas. Normalmente


testa-se a través de modelos matemáticos, que são denominados testes
estatísticos, que se dividem basicamente em Teste Paramétricos e Não
Paramétricos.

3
4.1 Tipos de Amostras

4.1.1 Amostras Simples ao Acaso

Um dos métodos mais usados. Emprega-se este processo, quando


dispomos de uma população que apresenta características homogêneas, isto é,
pouca variação no conjunto dos elementos, ou seja, variância próxima ou igual
à média.

4.1.2 Amostra Estratificada

Utilizada quando dispomos


de informações de que a
população apresenta
características heterogêneas, isto
é, grande número de fatores ou
variáveis que podem
comprometer as conclusões se
não eliminados, através de um
procedimento correto.
A população heterogênea é
transformada em sub-populações
homogêneas. Estas sub-populações têm nome de estratos. O tamanho da
amostra será determinado em função da variância de característica a estudar
em cada estrato, ou então considerando o número de seus elementos e
procedendo-se a um percentual de cada estrato. Obtém-se, assim, uma
amostra estratificada proporcional.
Considera-se este tipo de amostra que possibilita maior precisão quanto
aos resultados.

4.1.3 Amostra Sistemática

Aplicada quando a população apresenta um número finito de elementos


e os dados estão distribuídos aleatoriamente. O número de elementos da
amostra será obtido da seguinte forma:
Numa população constituída por 500 elementos e a amostra por 50
elementos, onde N = 500 e n = 50, dividem-se N por n, isto é, 500 por 50,
obtendo-se 10, em seguida, sorteia-se um número da primeira dezena e, a
partir dele, escolhem-se os demais, observando-se que se o número sorteado
for, por exemplo, cinco, o segundo deverá ser 15, o terceiro será 25, e assim
por diante, até obterem-se os 50 elementos que constituirão a amostra.

4
4.1.4 Amostra por Conglomeradas

Visto que, pela estratificação, o uso de amostragem nos conduz a ganhar


em precisão. Embora a subdivisão da população seja em estratos, para que, de
cada um, utiliza-se uma quantidade de elementos – o que torna o método de
seleção um pouco mais trabalhoso – ele redunda conseqüentemente em ganho
de precisão, o que é, no entanto, compensado apenas pela diminuição das
tarefas. Após a determinação dos conglomerados da população, sorteiam-se
aleatoriamente os conglomerados que irão participar da amostra.
Outros métodos de seleção poderão ser associados para determinação
dos elementos de cada conglomerado para compor a fração amostral.

5. Termos Importantes
Aleatorização ou Casualização

Na oportunidade em que organizamos os ensaios devemos proporcionar


condições idênticas para cada tratamento, possibilitando que houver algum erro
este seja atribuído ao acaso, ou seja, não tendencioso. Com este processo o
erro experimental poderá ser mensurado através do modelo matemático
utilizado para analisar os dados.

Por exemplo: Aleatorização pode ser feita da seguinte forma: toma-se uma
unidade e joga-se uma moeda: se ocorrer “cara”, a unidade é designada para o
grupo tratado e se ocorrer “coroa” a unidade é designada para o grupo
controle, ou também pode ser feita através de tabelas de números ao acaso,
obtidas em livros de estatística ou em computadores.

Unidade Experimental

O termo parcela foi criado para designar a unidade de área usada no


experimento. Essa unidade de área era, originalmente, uma faixa de terra, mas
também podia ser um vaso, ou uma planta.
Hoje o termo parcela tem significado mais geral porque, dependendo do
experimento, a parcela pode ser um animal, uma peça fabricada, uma pessoa
etc. Muitos autores, no entanto, passaram a usar o termo unidade
experimental, em lugar de parcela, porque é mais abrangente.

Tratamento

O termo tratamento também foi introduzido em experimentação através


da área agrícola. Servia para indicar o que estava em comparação: fertilizantes,
inseticidas, variedades. Hoje o termo tratamento tem significado mais geral.
Muitos experimentos são feitos para comparar máquinas, métodos, produtos ou
materiais.
Mas o interesse, em experimentação, nem sempre é o de comparar
tratamentos. Muitas vezes, o pesquisador quer apenas saber se determinado

5
tratamento tem efeito. Por exemplo, um agrônomo pode estar interessado em
saber se determinado adubo tem efeito sobre a produção de uma planta. Nesse
caso, o agrônomo deve tomar um conjunto de plantas similares e cultivar
algumas plantas com o adubo e outras sem o adubo. As plantas que recebem o
grupo tratado e as plantas que não recebem o adubo constituem o grupo
controle ou testemunha.

Repetição

A idéia, em experimentação, é comparar grupos, não apenas unidades.


As unidades experimentais do mesmo grupo recebem, em estatística, o nome
de repetições ou replicas. O mais importante é a variabilidade do material
experimental. Quanto mais homogêneo, menor é o número de réplicas
necessárias para mostrar, com clareza, o efeito de um tratamento.

Exemplo: Imagine então que, para verificar se determinado hormônio tem


efeito sobre o peso de ratos, um pesquisador forneceu o hormônio para um
rato e deixou outro sem o hormônio. Se, no final do experimento, o rato que
recebeu o hormônio pesar, por exemplo, 150 gramas e o outro pesar 120
gramas, o pesquisador pode afirmar que o hormônio tem efeito sobre o peso
dos ratos (150>120), mas essa conclusão é pouco confiável. Afinal, dois ratos
podem apresentar diferença de peso por diversas razões, além do tratamento.
Por outro lado, se um grupo de ratos recebeu o hormônio (grupo
tratado) e outro grupo de ratos ficou sem o hormônio (grupo controle) e, no
final do experimento, os pesos dos ratos que não receberam o hormônio
variarem em torno de 150 gramas, enquanto os pesos dos ratos que receberam
o hormônio variarem em torno de 150 gramas, enquanto os pesos dos ratos
que não receberam o hormônio variarem em torno de 120 gramas, o
pesquisador também poderá concluir que o hormônio tem efeito. Essa conclusa
é muito mais confiável.
Do ponto de vista do estatístico, é sempre desejável que os
experimentos tenham grande número de repetições. Na pratica, porem, o
número de repetições é limitado pelos recursos disponíveis. De qualquer forma,
o pesquisador deve levar em conta – quando estabelece o tamanho do seu
experimento – o que é usual na área.

Erros de Observações

Quanto aos componentes de uma população, o pesquisador terá a


oportunidade de verificar a existência de diferenças entre os mesmos.
Através da observação ou coleta de dados, haverá sempre uma
discrepância entre as amostragens realizadas, seja por falha no aparelho
utilizado ou pela desatenção do observador. São os erros experimentais
oriundos de fatores que não podem ser controlados.

6
Erro por Falta de Resposta

Este tipo de erro poderá ou não ocorrer no experimento. Ele ocorrerá se


não houver a possibilidade de obter, dentro da metodologia, o dado que irá
compor o conjunto de informações a serem analisadas.
Em experimento, que constituem blocos e parcelas, o erro por falta de
resposta ocorrerá através da perda de uma parcela.
Os modelos matemáticos que prevêem erros por falta de resposta são
apropriados, pois irão permitir uma flexibilidade de estimar o dado faltoso.

Métodos de Coleta de Dados

Embora a maioria das experimentações as informações devam ser


retiradas diretamente no "campo", em muitas ocasiões podem-se aproveitar
dados previamente obtidos por outras pessoas. No primeiro caso, consideramos
que a informação foi recolhida de fonte primária e no segundo caso dizemos
que a fonte é secundária.

6 Pesquisa Experimental

A experimentação é um método científico e de observação dos fatos ou


fenômenos naturais, sob condições particulares estabelecidas pelo pesquisador.
Em sua essência, a experimentação deve permitir comparar o efeito de
suas ou mais condições ou tratamentos, bem definidos, sobre um atributo do
organismo ou material que é objeto da pesquisa.
As condições, que o pesquisador seleciona ou manipula na experiência,
são geralmente denominadas variáveis independentes, enquanto que as
mudanças observadas em consequência, no atributo, são as variáveis
independentes. Assim, em estudos de dietas ou os alimentos administrados
seriam as variáveis independentes, e o crescimento em peso ou altura,
corresponderiam as variáveis dependentes.
Em experiências mais simples, os valores de uma variável independente
(eixo das abscissas - X), são confrontados com os dados da variável
dependente (eixo das ordenadas - Y). Por vezes, apenas duas condições da
variável são testadas (por exemplo: duas temperaturas, duas concentrações de
uma substância, a presença ou a ausência de luz, a administração ou não de
um medicamento, etc.). Mas, como a resposta do organismo ou do fenômeno
pode não ser diretamente proporcional à intensidade do fator ensaiado, torna-
se em geral necessário experimentar três ou mais valores de variável
independente, para que se possa apreciar seu efeito e estabelecer a lei do
fenômeno. (Figura 3).

7
6.1 Princípios da Experimentação

A experimentação é a forma que o pesquisador, seja na área científica


ou social, encontra para estimar os dados da pesquisa que irá realizar.

Os princípios básicos da experimentação científica são:

a. A experimentação deverá ter impreterivelmente repetições, para


assegurar que a resposta não foi obtida por mera casualidade e sim por
inerência do tratamento.
b. A casualização é um princípio fundamental, pois permite que o
experimento possa ser regido por efeitos gerais a todos os experimentos.
Assim as parcelas dos tratamentos deverão ser distribuídas ao acaso
pelo experimento, caso a área experimental não apresente uniformidade;
c. O controle das variáveis aleatórias (chuva, vento, temperatura, efeito
antrópico, etc.), deverá ser controlado, caso não seja possível,
recomenda-se que o efeito seja igual para todos os tratamentos ou itens
testados;
d. O experimento deverá ser realizado de acordo com uma técnica já
conhecida e testada; e. Caso a técnica a ser utilizada seja original, esta
deverá ser experimentada antes de ser utilizada na experimentação;
e. Caso a técnica a ser utilizada seja original, esta deverá ser
experimentada antes de ser utilizada na experimentação;
f. Os modelos estatísticos a serem utilizados na experimentação deverão
ser adequados ao que se pretende responder, ou seja, deverá haver
uma adequação da metodologia (objetivos) com o modelo, para que os
resultados possam levar o pesquisador a uma resposta coerente e
segura;

8
g. Amostragens regulares, quando possíveis, pois permitem uma melhor
análise dos dados;
h. Certificação de que as pessoas envolvidas na experimentação possuam
treinamento e conhecimento a cerca do modelo estatístico e da
metodologia a ser empregada.

Nota: Do que foi visto aqui, é fácil entender que, para planejar um
experimento, é essencial definir a unidade experimental e o que será medido ou
observado nessa unidade. Depois, é preciso definir os tratamentos que serão
colocados em comparação. Finalmente, é preciso estabelecer a maneira de
fazer a casualização.

Então o experimento está planejado quando estão definidos:


a) A unidade experimental;
b) A variável em analise e a forma como será medida;
c) Os tratamentos em comparação;
d) A forma como os tratamentos serão designados as unidades
experimentais.

Apenas como exemplo, imagine que se deseja comparar o efeito de duas


rações na engorda de suínos. Nesse caso, o experimento poderia ser
planejado como segue:

a) A unidade experimental: um animal


b) A variável em analise: ganho de peso, medido pela diferença entre o
peso final e o peso inicial de cada animal
c) Os tratamentos em comparação: ração A e ração B
d) A forma como os tratamentos serão designados as unidades: por sorteio.

Exercícios

1. Planeje um experimento para comparar dois métodos de prevenção de


cáries, isto é, o uso de uma pasta dental fluoretada e a aplicação tópica
de flúor.
2. Planeje um experimento para estudar o efeito de um analgésico em
pacientes com cefaléia.

Nota: nos experimentos de adubação usam-se, como parcela, três linhas da


cultura. Considera-se, na analise, apenas a produção da linha central,
conhecida como área útil da parcela. As duas linhas laterais são chamadas
bordaduras e servem para evitar que o adubo, colocado numa parcela, afete a
produção da área útil das parcelas vizinhas.

9
7 Delineamentos Experimentais

7.1.1 Delineamento Inteiramente Casualizado (DIC)


O DIC é mais simples dos
delineamentos. Os tratamentos se
distribuem ao acaso em todas as unidades
experimentais e o número de repetições por
tratamento pode ser igual ou diferente. É
muito útil para o estudo de métodos e
técnicas de trabalho de laboratório, ensaios
de vegetação e em experimentos com
animais. Para sua aplicação, há necessidade
que o meio atue de forma uniforme em
todas as unidades experimentais e que estas
sejam facilmente identificadas para receber o tratamento.
Mas a idéia de similaridade precisa ser bem entendida. Não existe um
conjunto de “animais iguais”, nem faixa de terra de “igual fertilidade”. Em
experimentação, porém, as unidades não precisam ser “iguais”. Basta que
respondam aos tratamentos da mesma forma.

Por exemplo:

1º) Nos testes de ganho de peso os animais não precisam ser “iguais” – podem
até ser de cores diferentes – mas, para que sejam considerados similares, é
preciso que sejam da mesma raça, mesmo sexo, mesma idade e que tenham,
no inicio do experimento, pesos bastante próximos. É comum, nos
experimentos inteiramente ao acaso, que todos os tratamentos tenham igual
numero de repetições.

2º) Em um estudo do efeito da glicose na liberação de insulina, 12 espécies de


tecido pancreático idênticas foram subdivididas em três grupos de 4 espécies
cada uma. Três níveis (baixo - tratamento 1, médio tratamento - 2 e alto
tratamento - 3) de concentração de glicose foram aleatoriamente designados
aos três grupos, e cada espécie dentro de cada grupo foi tratado com o nível de
concentração de glicose sorteado a eles. A quantidade de insulina liberada
pelos tecidos pancreáticos amostrados são as seguintes:

Este é um estudo experimental com 12 unidades experimentais


(amostras de tecido pancreático) e k=3 tratamentos. Cada tratamento é um
nível de fator simples: concentração de glicose. Existem 4 repetições para cada

10
tratamento. Os dados, quantidade de insulina liberada pelo tecido pancreático
podem ser considerados como três amostras aleatórias, cada uma com r=4
repetições, ou de tamanho r=4 sorteadas de três populações.

7.1.2 Delineamento em Blocos ao Acaso (DBA)


É aplicado quando as unidades experimentais não são similares, ou seja,
apresentem certa heterogeneidade, sendo este é o que permite comparar
adequadamente os tratamentos.
Os experimentos em blocos ao acaso surgiram na área agrícola. O
campo era dividido em blocos e os blocos eram divididos em parcelas. Então o
termo bloco designava, originalmente, uma faixa de terra de mesma fertilidade.
Considere um experimento para
comparar o efeito de três rações, A, B
e C, no ganho de peso de frangos de
corte. Se os frangos disponíveis forem,
de alguma forma, heterogêneos, pode
ser feito um experimento em blocos ao
acaso. Para entender como se faz o
delineamento, observe a figura ao
lado, onde a heterogeneidade das
unidades esta representada por
formas geométricas. Mas existem
unidades similares. Essas unidades
foram então agrupadas, formando o que o estatístico chama de blocos. A
formação de blocos está representada na parte central da figura acima.

Como os blocos são formados por unidades similares, o sorteio dos


tratamentos é feito dentro de cada bloco. Se o numero de unidades similares
que constitui o bloco é sempre igual ao numero de tratamentos, cada
tratamento aparece em casa bloco uma única vez, como mostrou a parte
inferior da figura à cima.
A figura abaixo ilustra outra situação importante na aplicação de
experimentos em blocos na agricultura. Se a fertilidade do solo varia ao longo
da encosta, isto é, se os solos da parte mais baixa são os mais ricos, cada faixa
que acompanha uma curva de nível deve formar um bloco.

11
A lógica dos experimentos em blocos ao acaso precisa ser bem
entendida. O bloco pode ser uma faixa de terra, uma ala de estufas, um
período de tempo, uma ninhada, uma partida de produtos industriais, uma faixa
de idade – tudo depende do que está em experimentação. O essencial é que os
blocos reúnam unidades similares – que se distingam apenas pelo tratamento
que recebem – e que haja variabilidade entre blocos. Não teria sentido
organizar blocos se não houvesse variabilidade entre blocos. Mas quem decide
se a variabilidade entre unidades justifica ou não a formação de blocos é o
pesquisador, não o estatístico. Veja figura abaixo:

Embora o bloco deva reunir unidades similares, isso não significa que
essa reunião deva ser física.

Por exemplo: Se um médico pretende comparar duas drogas hipotensoras, A


e B, e considerar que a pressão arterial do paciente, no inicio do tratamento, é
importante na resposta do paciente a droga, deve organizar blocos. Cada bloco
será formado por um par de pacientes com pressões arteriais similares, mas,
para formar os blocos, o médico não precisa colocar seus pacientes em fila,
nem juntá-los aos pares. Basta reunir os dados numéricos. Dois pacientes do
mesmo bloco não precisam nem mesmo se conhecer.

8 Análise de dados em experimentos


8.1 Análise de variância com um fator

Definição: é uma técnica de teste de hipótese usada para comparar médias de


três ou mais populações. A análise de variância geralmente é abreviada como
ANOVA.

Exemplo: Suponha que um médico pesquisador esteja analisando a eficiência


de três tipos de analgésico e queira determinar se há uma diferença na média
de tempo que cada um leva para aliviar a dor. Para determinar se essa
diferença existe, o pesquisador pode usar a distribuição F com a ANOVA. Como
uma variável independente esta sendo estudado, o processo é chamado de
análise de variância com um fator.

12
Passo a Passo

Para começar a análise de variância com um fator, você deve determinar


uma hipótese nula e alternativa, são sempre parecidas com as sentenças a
seguir:

(Todas as médias amostrais são iguais)

(pelo menos uma das médias é diferente das


demais)
Quando você rejeita a hipótese rejeita a hipótese nula em uma ANOVA,
você pode concluir que, no mínimo, uma das médias é diferente das demais.
Sem fazer outros testes estatísticos, porém, você não consegue determinar qual
das médias é diferente.
Em um teste da variância com um fator, as seguintes condições devem
ser observadas.

1. Cada amostra deve ser selecionada aleatoriamente de uma população


normal ou aproximadamente normal.
2. As amostras devem ser independentes entre si.
3. Cada população deve ter a mesma variância.

O teste estatístico de uma ANOVA com um fator é a razão entre duas


variâncias: a variância entre as amostras e a variância dentro das amostras.

Variância entre amostras


Teste estatístico =
Variância dentro das amostras
1. A variância entre as amostras MSB mede as diferenças relacionadas ao
tratamento dado a cada amostra e, as vezes, é chamado de média
entre quadrados.
2. A variância dentro das amostras MSw mede as diferenças relacionadas
aos lançamentos dentro da mesma amostra. Essa variância, as vezes
chamada de média dos quadrados internos, se dá por causa do erro
de amostragem.

8.2 Teste da ANOVA com um fator

Nesta tabela 1 está apresentado um experimento com k tratamentos:


cada tratamento tem r repetições. A soma dos resultados das r repetições de
um mesmo tratamento constitui o total desse tratamento. As médias dos
tratamentos foram indicadas por y1 , y 2 ,..., y k . O total geral é dado pela soma
dos totais de tratamentos.

13
Tabela 1: Um experimento inteiramente ao acaso

Para fazer a analise de variância de um experimento inteiramente ao


acaso é preciso calcular as seguintes quantidades:

a) Os graus de liberdade para o teste F são: gl tratamentos=k-1 e gl


resíduos=N-k.
b) O valor C, dado pelo total geral elevado ao quadrado e dividido pelo
numero de observações. O valor C é conhecido como correção:
(∑ y )
2

C=
n
c) A soma de quadrados total: SQT = ∑ y 2 − C

d) A soma de quadrados de tratamentos: SQTr =


∑T 2

−C
r
e) A soma de quadrados de resíduo: SQR=SQT-SQTr
SQTr
f) O quadrado médio de tratamentos: QMTr =
k −1
SQR
g) O quadrado médio de resíduo: QMT =
n−k
QMTr
h) O valor de F: F =
QMR

Se há pouca ou nenhuma diferença entre as médias, então MQTr será


aproximadamente igual a MQR e o teste estatístico será aproximadamente 1.
Valores de F próximos a 1 sugerem que você não deve rejeitar a hipótese nula.
Porém, se uma das médias difere significativamente das outras, MQTr será
maior que MQR e o teste estatístico será maior que 1. Valores de F
significantemente maiores que 1 sugerem que você rejeite a hipótese nula.
Como tais, todos os testes de analise de variância simples são unicaudais a
direita. Isto é, se o teste estatístico for maior que o valor crítico, H0 será
rejeitada.

14
INSTRUÇÃO
Em palavras Em símbolos
1. Identifique a afirmação. Determine as H0 e Ha
hipóteses
2. Especifique o nível de significância Identifique α
3. Identifique os graus de liberdade Gl_tratamentos=k-1
Gl_residuos=n-k
4. Determine o valor critico Usar tabela
5. Determine a região de rejeição
6. Calcule a estatística de teste QMTR
F=
QMR
7 Decida entre rejeitar ou não a hipótese Se F estiver na região de
nula rejeição, rejeite H0. Caso
contrário, não rejeite H0.
8 Interprete a decisão no contexto da
afirmação original

As tabelas são uma forma conveniente de resumir os resultados de uma


analise simples do teste de variância. Tabelas com resumo ANOVA são
definidos da seguinte forma:

Tabela de resumo ANOVA DE UM EXPERIMENTO INTEIRAMENTE AO ACASO


Variação GL Soma dos Média dos F
quadrados quadrados
TRATAMENTOS k-1 SQTr QMTr QMTr
QMR
RESÍDUO n-k SQR QMR
TOTAL n-1 SQT

EXEMPLO DE APLICAÇÃO

1º) Para comparar a produtividade de milho, um agrônomo tomou vinte


parcelas similares e plantou a variedade A em cinco parcelas, similares e
plantou a variedade em outras cinco parcelas e assim por diante, até completar
as vinte parcelas (Tabela 2). É claro que o agrônomo sorteou uma variedade
para cada parcela. O esquema de campo desse experimento está na figura 1.
Este é um experimento inteiramente ao acaso, com quatro tratamentos
(variedades) e cinco repetições.

Figura 1. Esquema de campo de um experimento inteiramente ao acaso.

A C D C A
B D A B C
D A B D B
B C D C A

15
Tabela 2. Produção de milho em kg/100m2 segundo a variedade.
VARIEDADE
A B C D
25 31 22 33
26 25 26 29
20 28 28 31
23 27 25 34
21 24 29 28

Para fazer a análise de variância desse experimento é preciso calcular:

a) os graus de liberdade
b) o valor de C
c) a soma de quadrados total
d) a soma de quadrados de tratamentos
e) a soma de quadrados de resíduo
f) o quadrado médio de tratamentos
g) o quadrado médio de resíduos
h) o valor de F

Respostas

a) g.l. tratamentos: 4-1=3


g.l. total: 20-1=19
g.l. resíduo: 19-3=16

b) C =
(25 + 26 + ... + 28)2 =
(535)2 = 14311,25
4 ∗5 20
c) a soma de quadrados total: SQT = 25 2 + 26 2 + ... + 28 2 − 14311,25 = 275,75

d) A soma de quadrados de tratamentos:


115 2 + 135 2 + 130 2 + 155 2
SQTr = − 14311,25 = 163,75
5

e) A soma de quadrados de resíduo: SQR=275,75-163,75=112,00

163,75
f) O quadrado médio de tratamentos: QMTr = = 54,58
3

112,00
g) O quadrado médio de resíduo: QMT = = 7,00
16

QMTr 54,58
h) O valor de F: F = = = 7,80
QMR 7,00

Esses resultados estão apresentados na tabela 3.

16
Tabela 3. Analise de variância dos dados da tabela 2
Soma dos Média dos
Variação GL F
quadrados quadrados
TRATAMENTOS 3 163,75 54,58 7,80
RESÍDUO 16 112,00 7,00
TOTAL 19 275,75

O agrônomo queria comparar quatro variedades de milho. Os dados


deram origem ao resultado na tabela 3 de F, ao nível de significância de 5% e
associado a 3 (tratamentos e resíduo) graus de liberdade, encontra-se o valor
3,24. Como 7,80 é maior do que 3,2 rejeita-se, ao nível de significância de 5%,
a hipótese de que as medias de variedades são iguais. Em termos mais
práticos, o agrônomo pode concluir que, ao nível de significância de 5%, as
variedades A, B, C e D não tem, em média, a mesma produção.

8.3 Análise de variância para experimentos em blocos ao acaso

Para entender como se faz a análise de variância de um experimento em


blocos ao acaso, primeiro observe a Figura 2 abaixo. Nessa Figura 2 estão os
dados de um experimento em blocos ao acaso com k tratamentos e r blocos. O
total de cada tratamento é dado pela soma das r unidades submetidas a esse
tratamento: o total de bloco é dado pela soma das k unidades do bloco.

Figura 2. Um experimento em blocos ao acaso.

Para fazer a analise de variância de um experimento em blocos ao acaso


é preciso obter:

a) Os graus de liberdade para o teste F são:

gl tratamentos=k-1

17
gl blocos=r-1
gl total=Kr-1
gl resíduo= (k-1)(r-1)

b) O valor C, dado pelo total geral elevado ao quadrado e dividido pelo


(∑ y )2

numero de observações: C =
kr
c) A soma de quadrados total: SQT = ∑ y 2 − C

d) A soma de quadrados de tratamentos: SQTr =


∑T 2

−C
r

e) A soma quadrados em blocos: SQTr =


∑B 2

−C
k
f) A soma de quadrados de resíduo: SQR= SQT-SQTr-SQB
SQTr
g) O quadrado médio de tratamentos: QMTr =
k −1
SQB
h) O quadrado médio de blocos: QMB =
r −1
SQR
i) O quadrado médio de resíduo: QMR =
(k − 1) − (r − 1)
QMTr
j) O valor de F: F =
QMR

As somas de quadrados são apresentadas na tabela de analise de


variância. Para calcular os quadrados médios basta dividir cada soma de
quadrados pelos respectivos graus de liberdade. O valor de F para tratamento é
dado pelo quociente entre o quadrado médio de tratamentos e o quadrado
médio do resíduo: o valor de F para blocos é dado pelo quociente entre o
quadrado médio de blocos e o quadrado médio do resíduo.

Tabela de resumo ANOVA DE UM EXPERIMENTO EM BLOCOS AO ACASO


Variação GL Soma dos Média dos F
quadrados quadrados
Tratamentos k-1 SQTr QMTr FT
Blocos r-1 SQB QMB FB
Resíduo (k-1)(r-1) SQR QMR
TOTAL kr-1 SQT

Exemplo de aplicação

1º) Um agrônomo queria comparar quatro variedades de milho, mas, em lugar


de sortear as variedades para as parcelas no campo, primeiro dividiu a área de
que dispunha de cinco blocos tão homogêneos quanto possível. Depois dividiu
cada bloco em quatro parcelas e sorteou, para cada bloco, uma variedade por
parcela. O esquema do experimento no campo está na figura 3. Este é um
experimento em blocos ao acaso, com quatro tratamentos e cinco blocos.

18
Figura 3. Esquema de campo de um experimento em blocos ao acaso

Vejamos a tabela 4 para compreender como se faz uma ANOVA para


blocos ao acaso, nesta tabela 4 estão indicados os dados de um experimento
em blocos ao acaso com k tratamentos e r blocos. O total de cada tratamento é
dado pela soma das r unidades submetidas a esse tratamento: o total de bloco
é dado pela soma das k unidades do bloco. Segue a produção de milho de cada
parcela é dada na tabela:

Tabela 4. Produção de milho em kg/100 m2 segundo a variedade e o bloco

Para fazer a análise de variância de um experimento em blocos ao acaso


é preciso obter:

a) Os graus de liberdade:

gl tratamentos: 4-1=3
gl blocos: 5-1=4
gl total:4.5-1=19
gl resíduo: (19-3-4) ou 3.4=12

19
b) O valor C, dado pelo total geral elevado ao quadrado e dividido pelo

numero de observações: C =
(700)2
20
c) A soma de quadrados total: SQT = 34 2 + 26 2 + ... + 32 2 − 24500 = 950
d) A soma de quadrados de tratamentos:
160 2 + 175 2 + 215 2 + 150 2
SQTr = − 24500 = 490
5
e) A soma quadrados em blocos:
120 2 + 136 2 + 144 2 + 148 2 + 152 2
SQTr = − 24500 = 160
4
f) A soma de quadrados de resíduo: SQR=950-490-160=300
490
i) O quadrado médio de tratamentos: QMTr = = 163,33
3
SQB 160
j) O quadrado médio de blocos: QMB = = = 40
r −1 4
SQR 300
k) O quadrado médio de resíduo: QMR = = = 25
(k − 1) − (r − 1) 3 ∗ 4
QMTr
l) O valor de F: F = = 6,53
QMR

Os valores calculados estão apresentados na tabela 5

Tabela 5. ANOVA dos dados da tabela 4


Soma dos Média dos
Variação GL F
quadrados quadrados
Tratamentos 3 490 163,33 6,53
Blocos 4 160 40,00 1,6
Resíduo 12 300 25,00
TOTAL 19 950

Na tabela de F, ao nível de significância de 5% e com 3 e 12 graus de


liberdade, encontra-se o valor 3,49. Logo, o valor F=6,53 é significativo ao nível
de 5%. O agrônomo pode então concluir que as variedades estudadas não têm,
em media, a mesma produção.

9 A comparação de médias (teste paramétrico)

Quando a ANOVA de um experimento mostra que as médias de


tratamento não são estatisticamente iguais, é apenas lógico perguntar quais
são as medias que diferem entre si. O pesquisador em geral gostaria de aplicar
um teste para comparar médias, duas a duas. Considere um experimento para
comparar três tratamentos, A, B e C. Se a analise de variância mostrar que as
médias desses tratamentos não são estatisticamente iguais, é bastante possível
que o pesquisador procure um teste estatístico para comparar as medias de A e
B, A e C, B e C. Mas como se faz a comparação de médias, duas a duas?

20
9.1 Diferença mínima significante (d.m.s.)

Para responder as perguntas do pesquisador em qual das medias


diferem uma das outras é preciso do método que fornece a d.m.s. entre duas
médias. Toda vez que o valor absoluto da diferença entre duas médias é igual
ou maior do que a diferença mínima significante, as médias são consideradas
estatisticamente diferentes, ao nível de significância estabelecida.
Foram propostas diversas maneiras de calcular a diferença mínima
significante. Cada proposta é, na realidade, um teste que, leva o nome de seu
autor. Não existe um procedimento para a comparação de médias que seja
definitivamente “melhor” que todos os outros. Por isso, serão apresentados
aqui os procedimentos mais comuns e, posteriormente, discutidas suas
propriedades.

9.2 O teste t

Para obter a diferença mínima significante (d.m.s.) estabelecida pelo


teste t, basta cacular:
2 ∗ QMR
d .m.s. = t
r
em que t é um valor dado em tabela, QMR é o quadrado médio do resíduo da
analise de variância e r é o numero de repetições de cada tratamento. Toda vez
que o valor absoluto da diferença entre duas médias é igual ou maior do que o
valor absoluto da diferença entre duas medias igual ou maior do que o valor da
d.m.s., as médias são estatisticamente diferentes.
A tabela de t é dada em livros de experimentação. Para entender como
se usa essa tabela, observe a figura 4 a seguir. Cada valor de t esta associado a
determinado nível de significância e aos graus de liberdade do resíduo. Assim, o
valor assinalado seria utilizado para obter a d.m.s. ao nível de significância e
aos graus de liberdade do resíduo. Assim, o valor assinalado seria utilizado para
obter a d.m.s. ao nível de significância de 5%, no caso de um experimento com
5 graus de liberdade no resíduo.

Figura 4. Valores de t, para o nível de significância de 5% e 5 graus de


liberdade no resíduo.

21
É fácil comparar médias usando a d.m.s. estabelecida pelo teste t. Como
exemplo considere os dados apresentados na tabela? . Imagine que esses
dados são de um experimento para comparar o efeito de cinco drogas na
diminuição da pressão arterial. Para fazer esse experimento um médico tomou
30 pacientes e dividiu ao acaso em seis grupos: o grupo controle recebeu um
placebo e os grupos receberam cada uma das drogas. Os valores apresentados
na tabela 6 são a diminuição da pressão arterial, dada pela diferença entre a
pressão arterial no inicio e no fim do experimento.

Tabela 6. Diminuição da pressão arterial, em milímetros de mercúrio, segundo o


tratamento

Os dados da tabela foram submetidos a analise de variância. Os


resultados dessa análise estão na tabela 7.

Tabela 7. Análise de variância dos dados da tabela 6


Soma dos Média dos
Variação GL F
quadrados quadrados
Tratamentos 5 2354,17 470,83 13,08
Resíduo 24 864,00 36,00
TOTAL 29 3118,17

Como o valor de F apresentado na tabela 7 é significante ao nível de 5%,


é razoável procurar um teste para comparar as médias dos tratamentos. A
d.m.s. estabelecida pelo teste t, ao nível de significância de 5%, é:
2 ∗ 36,00
d .m.s. = 2,064 = 7,83
5

uma vez que 2,064 é o valor de t dado na tabela para o nível de significância
de 5% e 24 g.l. (veja o resíduo na analise de variância), 36,00 é o quadrado
médio do resíduo e 5 é o numero de repetições de cada tratamento.
As médias de diminuição da pressão arterial, segundo o tratamento,
estão na tabela 8. Faça as diferenças das médias, duas a duas, e compare
essas diferenças com a d.m.s., que é 7,83. É fácil ver, por exemplo, que os
pacientes que receberam a droga A tiveram, em média, diminuição de pressão
arterial significantemente maior do que os pacientes que receberam a droga B,
uma vez que o valor absoluto da diferença entre a media de A e a media de B
(veja tabela 8) é: 21-8=13, maior do que 7,83 (diferença mínima
significante).

22
Tabela 8. Média da diminuição da pressão arterial segundo o tratamento

Tratamento Média
A 21
B 8
C 10
D 29
E 13
Controle 2

9.3 O teste de tukey

Para obter o valor da diferença mínima significante (d.m.s.) pelo teste de


Tukey basta calcular:

QMR
d .m.s. = q
r
em q é o valor dado na tabela ao nível de significância estabelecido, QMR é o
quadrado médio dos resíduo da analise de variância e r é o número de
repetições de cada um dos tratamentos. De acordo com o teste, duas médias
são estatisticamente diferentes toda vez que o valor absoluto da diferença entre
elas for igual ou maior do que d.m.s.
Para entender como se usa a tabela para o teste de tukey, observe a
figura 6. O valor assinalado seria utilizado para comparar as médias de um
experimento com quatro tratamentos e 16 graus de liberdade no resíduo, ao
nível de significância de 5%.

Figura 6. Valor de q

23
Considere os dados apresentados na tabela 6. Esses dados foram
submetidos a analise de variância. Os resultados dessa análise estão na tabela
7. Como o valor de F apresentado na tabela 7 é significante ao nível de 5%, as
médias de tratamentos não são estatisticamente iguais. Mas qual é, ou quais
são, as medias diferentes?
A pergunta pode ser respondida com a aplicação do teste de tukey.
Considerando um nível de significância de 5%, tem-se que:
36
d .m.s. = 4,37 = 11,73
5
Uma vez que q=4,37 (valor dado na tabela, ao nível de significância de
5%, associado a 6 tratamentos e 24 graus de liberdade de resíduo), QMR=36
(quadrado médio de resíduo, obtido na ANOVA) e r = 5 (número de
repetições).
As médias estão na tabela 8. Pode-se então concluir, por exemplo, que a
média de A é significantemente maior que a média de B porque:

21-8=13>11,73.

24

Você também pode gostar