Escolar Documentos
Profissional Documentos
Cultura Documentos
ESTATÍSTICA EXPERIMENTAL
SEMANA 1
NOTAS DE AULAS
E
EXERCÍCIOS
1º SEMESTRE DE 2009
NOTAS DE AULAS DE
VERSÃO PROVISÓRIA
INTRODUÇÃO
FORMULAÇÃO
DE
DESENVOLVIMENTO OBTENÇÃO DE
DA TEORIA OBSERVAÇÕES
VERIFICAÇÃO
DAS HIPÓTESES
De acordo com o objetivo da pesquisa científica, a análise dos dados pode ser
exploratória, descritiva ou explicativa. A estatística experimental utiliza as técnicas da
análise explicativa, mas geralmente é precedida das análises exploratória e descritiva
que fornecem indícios importantes para as análises seguintes.
Para a análise explicativa, um dos requisitos das hipóteses científicas é de que
elas sejam testáveis. A denominação “análise confirmatória” como sinônima de análise
explicativa não é apropriada, lembrando que a estatística nunca prova nada (ao contrário
do dito popular: é possível provar qualquer coisa com a estatística). A estatística permite
mensurar a confiança que pode ser considerada no resultado de uma pesquisa ou a
probabilidade de erro cometido na aceitação ou rejeição de uma hipótese científica.
Existem muitas técnicas estatísticas para a análise explicativa e, dependendo dos
objetivos do experimentador, algumas são mais apropriadas ou mais vantajosas que
outras enquanto que algumas podem não ser apropriadas. A escolha da técnica
apropriada de análise dos dados é função do bom planejamento da pesquisa e da
fundamentação teórica do estatístico.
1.4 Inferência
O que é Inferência?
A inferência é um processo de raciocínio tal que a validade de uma proposição é
aceita como conseqüência da validade de uma proposição que a precede. A inferência
indutiva é o processo de raciocínio em que o conhecimento de um grupo é estendido a
todos os elementos da população.
Estimativa e Estimador.
O valor de uma função dos indivíduos de uma população para descrever uma
característica qualquer é denominado parâmetro e o objetivo das pesquisas com
amostragem é conhecer sobre os parâmetros da população já que, através das amostras,
não é possível obtê-los. Assim, o papel da inferência estatística é generalizar resultados
obtidos em amostras para os parâmetros da população objetivo. O valor obtido de uma
amostra para uma variável Y através de uma função qualquer, f(Y), é chamado
estimativa do respectivo parâmetro e a função f, estimador daquele parâmetro.
n
Yi
i =1
Por exemplo, o estimador da média populacional µ é Y = onde n é o
n
n
yi
i =1
tamanho da amostra. A estimativa de µ é mˆ = onde yi , i=1,2, ..., n , são possíveis
n
valores amostrais de Yi.
Propriedade do Estimador.
A escolha de um estimador que forneça a estimativa θˆ para o parâmetro θ , deve
considerar as seguintes propriedades:
. não tendência - E( θˆ ) = θ
. eficiência - Var( θˆ ) = mínimo
i =1
Erro de Estimação.
A diferença entre uma estimativa e o parâmetro é o erro de estimação que pode
ser expresso como uma função da variabilidade inerente à variável em estudo. Se a
variabilidade é pequena, repetidas amostras da população, provavelmente, fornecerão
estimativas similares implicando em que a estimativa obtida de uma amostra qualquer
provavelmente esteja mais próxima do valor do parâmetro, diferentemente do que
aconteceria para uma variável com grande variabilidade.
Para a estimativa da média populacional, o erro de estimação, designado por erro
σ2
padrão da média, é σ mˆ = , onde σ 2 é a variância populacional. A estimativa do
n
σˆ 2
erro padrão da média é dada por σˆ mˆ = .
n
A definição do erro de estimação e a teoria das distribuições amostrais permitem
que sejam determinados limites, inferior e superior, da distribuição amostral da
estimativa que, com uma determinada probabilidade, contenha o valor do parâmetro.
Estes limites definem uma estimação por intervalo para o parâmetro.
Como exemplo, se a distribuição amostral de médias é a distribuição Normal de
probabilidades, o intervalo de confiança para a média populacional, com base em uma
amostra de tamanho n e com 95% de confiança, é: mˆ − 1,96σˆ mˆ ≤ µ ≤ mˆ + 1,96σˆ mˆ .
Testes de Hipóteses.
Outro procedimento utilizado pela Inferência Estatística são os Testes de
Hipóteses que consistem dos seguintes passos:
1. Construção da Hipótese a ser testada (H0) e de uma hipótese alternativa (Ha);
2. Especificação, a priori, do grau de confiança ( );
3. Escolha de uma estatística de teste que avalie os desvios de H0 e que tenha
distribuição amostral conhecida;
4. Cálculo da estatística de teste através da(s) amostra(s) (Dc);
5. Regra de Decisão.
Experimento
Um experimento é a realização de um procedimento ou de um fenômeno natural
em que algumas características explicativas são controladas pelo experimentador.
Variáveis
A função numérica que estabelece a correspondência um a um entre as
manifestações de uma característica e os valores de um conjunto numérico é
denominada variável. Os valores que uma variável assume são suas categorias (tipos ou
níveis).
Ao iniciar-se o estudo de um problema, o pesquisador se depara com uma
grande quantidade de variáveis envolvendo o processo em foco. A definição da
relevância destas variáveis e das premissas envolvendo as relações causa-efeito entre
elas é uma etapa fundamental nesta fase de planejamento da pesquisa e corresponde ao
início do processo de modelagem do problema em estudo.
As variáveis relevantes consideradas no estudo de um problema são
agrupadas em variáveis causais (ci), como aquelas afetam o desempenho dos elementos
e variáveis efeitos (ej), como aquelas que exprimem o desempenho dos mesmos (Figura
2.1). As variáveis irrelevantes, por exclusão, são todas as outras variáveis inerentes aos
elementos do processo.
Fator e Resposta
O início do planejamento experimental consiste na seleção das variáveis causais,
das variáveis efeitos e de suas categorias, conforme os objetivos da pesquisa. As outras
variáveis causais deverão ser controladas através das técnicas experimentais. As
variáveis causais escolhidas são denominadas fatores e as variáveis efeitos são
denominadas variáveis respostas (Figura 2.2).
Tratamentos
Quando um experimento estuda apenas um fator, as categorias deste fator são
denominadas tratamentos. Para o caso de dois ou mais fatores, os tratamentos são as
combinações das categorias destes fatores.
FIGURA 2.1. Variáveis causais (ci), variáveis efeitos (ej) e outras variáveis.
Variáveis relevantes
FATOR controladas RESPOSTA 1
1
EXPERIMENTO
FATOR RESPOSTA q
p
Variáveis irrelevantes e
variáveis relevantes não
controladas
Parcela Experimental
Cada tratamento é aplicado a uma quantidade de material experimental
denominada unidade experimental ou parcela experimental. A quantidade de material
que define uma parcela ou o tamanho da parcela é função da variabilidade inerente à
variável resposta. O que caracteriza uma parcela é que, em cada uma é aplicado apenas
um tratamento e obtido apenas um dado para cada variável resposta.
Existem procedimentos apropriados para a determinação do tamanho e forma de
parcelas experimentais, fundamentados na teoria da amostragem. No entanto, na prática,
o tamanho da parcela de um experimento frequentemente é escolhido por analogia com
outros ensaios de mesma natureza e condições experimentais.
Bordadura
Quando existe a possibilidade de uma parcela ser influenciada pelos tratamentos
aplicados nas parcelas vizinhas, cada parcela devera conter uma quantidade de material
a mais para servir de proteção contra esta interferência. Esta técnica é denominada
bordadura sendo que este material não deve ser incluindo na obtenção de dados para as
variáveis respostas. A área da parcela, excetuando-se a bordadura, é denominada área
útil e apenas nela deverão ser efetuadas as avaliações.
0,5 m
1,5 m
Área Útil:
5,0 m 2,0 m2
EXEMPLO 2.1.
Um engenheiro, interessado em estudar a resistência de fibras sintéticas
utilizadas na confecção de vestuário, decidiu utilizar diferentes quantidades de algodão
já que é sabido, de pesquisas anteriores, que a resistência de fibras sintéticas aumenta
com a inclusão de algodão. Como o produto final deve conter de 10 a 40% de algodão
devido a outras características importantes para a qualidade do produto, escolheu as
quantidades de 15, 20, 25, 30 e 35% de algodão. Também, decidiu testar cinco amostras
de cada nível de algodão tomando, como amostra, um atado de fibras com 10
centímetros de diâmetro. As avaliações foram feitas em apenas uma máquina e por um
único técnico.
Neste exemplo, tem-se apenas um fator que se refere aos teores de algodão na
fibra com as categorias (ou níveis): 15, 20, 25, 30 e 35%. Como as categorias deste fator
são expressas em uma escala intervalar, o fator é denominado quantitativo. Quando as
categorias de um fator são expressas em uma escala nominal, o fator é denominado
qualitativo. A tensão ao rompimento corresponde à variável resposta. Os valores obtidos
para a resistência das amostras são os dados.
Os tratamentos são: t1 = 15% de algodão na fibra, t2 = 20% de algodão na
fibra,..., t5 = 35% de algodão na fibra. Em um experimento em que os fatores fossem
Reagentes (A e B) e uso ou não de um Catalisador, os tratamentos serião: t1 = reagente
A sem catalisador; t2 = reagente A com catalisador; t3 = reagente B sem catalisador e t4
= reagente B com catalisador.
No Exemplo 2.1, cada parcela corresponde a um amarrado de fibras com dez
centímetros de diâmetro.
2.1 Conceitos Fundamentais
Erro Experimental.
As alterações nas variáveis respostas provocadas pelos fatores são o objeto da
pesquisa, mas outras variáveis consideradas de menor importância ou aquelas cujo
controle não foi eficiente e, ainda, outras variáveis desconhecidas do pesquisador,
também podem ser agentes causais de efeitos observáveis nas características respostas.
Esta variação é denominada Erro Experimental que pode fazer com que as inferências
sejam tendenciosas ou até mesmo inviabilizar a utilização dos resultados das pesquisas.
O erro experimental também pode ser considerado como o desvio de ajuste (erro
de estimação) do modelo proposto para explicar o efeito dos fatores sobre as variáveis
respostas. Em se tratando de estudos de amostragem, ele sempre estará presente e assim,
as técnicas de planejamento, controle e de condução dos experimentos devem visar à
minimização da quantidade destas variáveis e de seus efeitos nas respostas, tornando
constantes ou irrelevantes suas manifestações nos resultados.
No Exemplo 2.1, algumas variáveis responsáveis pelo erro experimental
poderiam ser: regulagem da máquina, variações na matéria prima e na preparação das
fibras, variações no diâmetro da amostra e muitas outras relacionadas, principalmente
com a condução do ensaio.
Quando o pesquisador busca conhecer as variáveis envolvidas em um
experimento e homogeneizar as condições experimentais através de, por exemplo,
seleção do material experimental, treinamento de pessoal, aperfeiçoamento da técnica
de condução além de outros, ele visa minimizar os erro experimentais.
Quanto menor o erro cometido em um processo de mensuração, maior a precisão
das medidas. A precisão é função da maior ou menor proximidade das medidas
repetidas efetuadas nas parcelas. Precisão alta implica em que as observações iram
fornecer estimativas mais próximas aos valores paramétricos.
Um processo de mensuração pode apresentar outro tipo de erro – o erro
sistemático. Neste caso, as medidas obtidas são tendenciosas ou viesadas, subestimando
ou superestimando os valores verdadeiros. Este tipo de erro não contribui para o erro
experimental e, portanto, não afeta a precisão do experimento.
Controle Local
As variáveis controladas geralmente são as características do ambiente onde será
desenvolvido o experimento, do equipamento empregado, das atividades e técnicas na
condução do ensaio e dos materiais utilizados, de tempo e outras. O controle exercido
sobre estas variáveis é denominado controle local e busca tornar homogêneo o efeito
sobre os vários elementos presentes no experimento de forma que as variações
observadas nas variáveis respostas sejam funções apenas dos efeitos dos fatores
estudados.
O controle local consiste no agrupamento das parcelas de um experimento de
maneira que os efeitos de variáveis estranhas, mas conhecidas, não sejam confundidos
com os efeitos dos fatores. Os grupos de parcelas são denominados blocos e cada um
representa uma categoria da variável (is) a ser (em) controlada (s), ou seja, os blocos
devem ser homogêneos, mas podem variar entre si.
No Exemplo 2.1, supondo que, ao invés de apenas um técnico fossem utilizados
quatro pessoas diferentes para conduzir o ensaio, o pesquisador poderia supor que a
diferença de habilidade entre os quatro técnicos afetaria aleatoriamente a variável
resposta. Uma solução para o controle desta variável seria distribuir uma amostra de
cada um dos cinco tratamentos para cada técnico. Assim, cada pessoa (ou bloco) estaria
avaliando todos os diferentes tratamentos com o mesmo critério pessoal.
Sempre que as categorias de várias variáveis puderem ser combinadas, seus
efeitos serão confundidos, mas o controle simultâneo pelos blocos poderá ser efetuado.
Para usar o Exemplo 2.1, supondo que as medições não pudessem ser realizadas em um
mesmo dia da semana, além de serem necessários os quatro técnicos, o experimento
poderia ser realizado em quatro dias diferentes, em cada dia um determinado técnico iria
avaliar uma amostra de cada tratamento. Assim, os tratamentos em cada bloco (técnico-
dia), estariam sendo avaliados com o mesmo grau de habilidade e sujeitos as mesmas
condições climáticas. Os efeitos de diferença de habilidade dos técnicos e diferenças de
luminosidade estariam confundidos entre si, mas não estariam confundidos com os
efeitos das outras variáveis.
Interação entre Fatores
A interação entre dois ou mais fatores significa que os efeitos destas variáveis
são relacionados ou que o efeito de um fator depende da categoria do outro fator. Neste
caso, os efeitos observados nas variáveis respostas são funções dos efeitos de cada fator
e dos efeitos das interações entres eles.
Na Tabela 2.1(a), o efeito do Fator A, calculado com as suas médias marginais é:
145,0 – 126,0 = 19,0 significando que o efeito da mudança da categoria A1 para A2
corresponde a um aumento médio de 19 unidades na variável resposta. Este mesmo
efeito é verificado tanto na categoria B1: 140,0 – 121,0 =19 quanto na categoria B2: 150
– 131 = 19. Estes resultados indicam que o efeito da mudança de categoria no fator A é
o mesmo independentemente da do fator B. Esta independência entre os fatores A e B
pode ser verificada, da mesma forma, analisando as mudanças de categoria do Fator B
em cada categoria do fator A. Nesta situação, não existe interação entre os fatores A e
B. Pode-se escrever que o efeito na variável resposta corresponde a soma do efeito do
fator A com o efeito do fator B.
No caso (b), o efeito do fator C na categoria D1 é: 17 - 24 = -7 enquanto que na
categoria D2 é: 20 – 30 = -10. Calculando o efeito do fator C através de suas médias
marginais: 18,5 – 27,0 = -8,5.
Vê-se que o efeito do fator C depende da categoria do fator D, ou seja, para D1, a
mudança de categoria do fator C provoca um decréscimo de 7 unidades enquanto que,
em D2, o decréscimo é de 10 unidades. Com as médias marginais, este efeito seria
representado por um decréscimo de 8,5 unidades, que não correspondem aos efeitos em
cada categoria, o que poderia ser explicado admitindo-se a existência de uma interação
entre os fatores C e D. O efeito na variável resposta, neste caso, corresponde a soma do
efeito do fator C mais o efeito do fator D mais o efeito da interação.
Repetição
A Repetição consiste na aplicação de cada tratamento a mais de uma parcela
experimental. A função da repetição é permitir a obtenção de uma estimativa da
variabilidade atribuída ao erro experimental, já que o erro experimental corresponde à
variação entre as observações de cada tratamento.
O número de repetições em um experimento geralmente é escolhido
empiricamente, mas existem procedimentos estatísticos apropriados para a
determinação do número necessário de repetições para determinados graus de
confiança, considerando-se a variabilidade do material experimental e os objetivos da
pesquisa.
Aleatorização
A aleatorização ou casualização das parcelas experimentais consiste no
procedimento que permita a cada uma ter a mesma chance de pertencer a qualquer parte
da área experimental. A função da casualização é evitar a tendenciosidade ou viés dos
efeitos das variáveis não controladas sobre os efeitos dos tratamentos e sobre o erro
experimental, permitindo que as estimativas e os testes de hipóteses sejam válidos.
3.
PLANEJAMENTO EXPERIMENTAL
c) Ser futurista. A pesquisa agrícola é demorada e, para ser mais útil, deve
sempre que possível ter a solução do problema antes que ele ocorra ao
nível de propriedade rural. Como na pesquisa agrícola, especialmente em
algumas áreas como a de melhoramento genético, realizar um trabalho que,
no momento de sua difusão, não mais constitui um problema para os
agricultores, pode ser um esforço inútil.
• Título
• Antecedentes e Justificativa
• Referencial Teórico
• Objetivos e Metas
• Hipóteses
• Material e Métodos
• Cronograma de Execução
• Difusão de Tecnologia
• Orçamento
• Literatura Consultada
• Equipe Envolvida
a) Título
Deve ser bem sucinto e procurar conter em poucas palavras o que o
projeto pretende realizar. Em realidade o título é uma síntese dos objetivos do
trabalho. Normalmente o título é definido no final da elaboração do projeto.
b) Antecedentes e Justificativas
Nesse caso a redação deve ser bem clara. Deve-se evitar o máximo, a
colocação de informações por demais conhecidas e, portanto, supérfluas. Por
exemplo, em um projeto com a cultura do milho, não começar dizendo que ela
é uma espécie importante. Lembre-se que quem irá avaliar o seu projeto é um
especialista da área e assa informação é bastante conhecida.
Vá direto ao assunto, apontando o problema (demanda geradora) e
mostrando que você não só teve condições de diagnosticá-lo como também
está apto a resolvê-lo. Deve ficar bem explícito a necessidade de realização do
trabalho para solucionar o problema.
Alguns pesquisadores escrevem demais nesse tópico. Isso não é
conveniente. Na maioria dos casos há restrições com relação ao número de
páginas que compõem o projeto. Se esse item for excessivamente grande,
informações metodológicas mais importantes deixarão de ser colocadas. Esse
item deve abranger de 1 a 1,5 laudas
d) Objetivos
Devem ser redigidos de forma a não deixar dúvidas do que se deseja
obter nesse projeto. O estabelecimento dos objetivos necessita de algumas
considerações. A principal delas são aqueles objetivos ambiciosos demais.
Especialmente os pesquisadores novos, muitas vezes movidos pelo
entusiasmo, almejam resolver todos os problemas de uma dada espécie
vegetal, de uma única vez, através da proposta do projeto. Sabemos que isso
não é possível. O conhecimento e, consequentemente, a geração de tecnologia
é sempre obtido por etapas. Um projeta de pesquisa, normalmente quando
bem sucedido, dá uma pequena contribuição a informação existente sobre o
tema. Assim, projetos com objetivos ambiciosos demais dificilmente são
aprovados, pois os consultores têm vivência no assunto e sabem que a
proposta é de baixa viabilidade. Muitas vezes são colocados objetivos viáveis,
porém inúmeros deles. Nesse caso, embora eles sejam viáveis, o pesquisador
pode se perder no manuseio de toda a informação que é gerada o projeto
reduz sua eficiência. Portanto, os objetivos devem ser pensados, avaliando a
probabilidade de sucesso.
e) Metas
Os comentários realizados no item anterior são válidos aqui. Só devem
ser colocadas metas factíveis e que podem evidentemente serem atingidas
com o projeto. Devem-se projetar metas que dependam exclusivamente do
desempenho do projeto. Por exemplo, recentemente foi avaliado um projeto em
que uma das metas era aumentar 10% da produção de grãos de uma espécie,
em um Estado. É evidente como essa meta não pode ser colocada. O aumento
da produção de grãos, em um Estado, depende de uma infinidade de fatores,
que fogem do escopo do projeto. Essa é uma meta ilusória. Esse tipo de
procedimento depõe contra o projeto, pois mostra desconhecimento dos
profissionais envolvidos sobre a cadeia produtiva como um todo.
f) Hipóteses
Como já mencionado anteriormente é sempre aconselhável apresentar
as hipóteses a serem testadas. Essa é uma prática mais freqüente na área de
pesquisas sociais. Entretanto, na pesquisa agrícola a colocação explicita das
hipóteses tem sido verificado com mais freqüência.
A hipótese é a proposição testável do projeto. Ela deve ser coerente com
os objetivos e com a metodologia. Isto é, a hipótese deve conter a proposta
testável dos objetivos e a metodologia apresentada deve ser capaz de testá-la.
g) Material e Métodos
Deve ser definido em função das hipóteses formuladas. Na redação
desse tópico é necessário colocar o maior número de detalhes possíveis,
porem sem exagero. Devem ser incluídos especialmente os seguintes itens:
- Informações sobre os locais de condução dos experimentos:
coordenadas geográficas e principais características de clima e solo, histórico
da área (cultura antecedente ou tipos de experimentos anteriores).
. Material genético: Se o experimento envolve, por exemplo, a avaliação
de algumas cultivares. É importante colocar as principais características desses
materiais, tais como origem tipo material (híbrido, linhagens etc.), precocidade,
cruzamentos, reação às doenças etc.
- Delineamento experimental: Definir o delineamento (DBC, DIC, látice,
etc.) o tamanho da parcela, número de repetições. É comum o pesquisador
encher esse tópico de números colocando o tamanho da parcela útil, parcela
total, área do bloco do experimento etc. Isso não é correto. Apenas a área da
parcela é suficiente. Qualquer indivíduo que se dispõe a avaliar o projeto tem
condições de calcular o restante. Colocar o croqui do experimento é também
desnecessário.
- Detalhes sobre a condução dos experimentos: Sempre que possível
colocar época de semeadura, adubação, espaçamento, debaste, detalhe sobre
irrigação, controle de pragas, das doenças, das invasoras etc.
i) Difusão de Tecnologia
Esse é um tópico exigido por várias fontes financiadoras. É importante
especificar os detalhes de como as informações geradas no projeto
chegarão aos agricultores. É interessante ter capacidade criativa nesse
tópico. Muitas vezes o sucesso da pesquisa falha no momento de sua
adoção. Devem-se colocar no projeto todos os detalhes possíveis de
como a difusão de tecnologia será efetuada.
j) Orçamento
Normalmente é o item complicado porque nem sempre ele recebe
treinamento nessa área. Prever com dois a três anos de antecedência todos os
materiais, viagens, diárias etc., não é uma tarefa fácil. Um complicador pode
ser a instabilidade econômica do país, podendo ocorrer defasagem no
orçamento quando a inflação atinge níveis elevados. Quando possível,
pesquisador deve recorrer ao setor administrativo de sua instituição para
auxiliá-lo no levantamento de preços.
É importante pedir o necessário. Não devemos subestimar a solicitação,
pois indica desconhecimento do assunto e nem pedir em excesso, pois nesses
casos caímos no ridículo. É comum solicitar a mais já imaginando que serão
efetuados cortes. Esse procedimento não é correto.
Procure apresentar o orçamento atendendo aos itens de despesas que a
fonte financiadora normalmente exige. Leia com atenção as informações a
esse respeito, procurando não misturar materiais de consumo com materiais
permanentes.
Sempre que possível procure justificar a aquisição de cada
equipamento, procurando evidenciar a sua importância na execução do projeto.
k) Literatura Consultada
Devem ser relacionadas todas as literaturas citadas efetivamente
consultadas na elaboração do projeto. Nas citações siga as normas da ABNT.
BIBLIOGRAFIA
5. Ler o Capítulo 3.