Explorar E-books
Categorias
Explorar Audiolivros
Categorias
Explorar Revistas
Categorias
Explorar Documentos
Categorias
ESTATÍSTICA
BÁSICA
LAVRAS - MG
1996
i
ÍNDICE
Pag.
I. Conteúdo programático v
1. Estatística Descritiva 1
1.4. Exercícios 31
2. Distribuição de probabilidade 38
contínuas 40
A. Distribuição Binomial 41
B. Distribuição de Poisson 42
D. Distribuição normal 45
Pag.
3. Amostragem 49
não probabilística. 50
4. Distribuição de amostragem 54
4.3. Distribuição de t, χ2 e F 62
A. Distribuição de t de Student 62
B. Distribuição de χ2 (Qui-Quadrado) 64
C. Distribuição de F de Snedecor 65
5. Teoria da estimação 69
iii
Pag.
médias 77
6. Teoria da decisão 86
de decisão 86
6.3.1. Algoritmo 88
C. Dados emparelhados 99
MEC/UFLA/DEX
CEX-117 - ESTATÍSTICA
CONTEÚDO PROGRAMÁTICO
I- ESTATÍSTICA DESCRITIVA
III- AMOSTRAGEM
PROBABILÍSTICA.
SISTEMÁTICA.
4. TÓPICOS EM AMOSTRAGEM.
3. DISTRIBUIÇÃO DE t, χ 2 E F.
4. DISTRIBUIÇÃO DE AMOSTRAGEM DE PROPORÇÕES.
V- TEORIA DA ESTIMAÇÃO
ESTIMADORES.
BIBLIOGRAFIA
BUSSAB, W.O. & MORETTIN, P.A. Estatística básica. 4a ed., Atual Editora, S.P., 1993.
FONSECA, J.S. & MARTINS, G. de A. Curso de estatística, 4a ed., Editora Atlas, S.P., 1993.
GUERRA, M.J. & DONAIRE, D. Estatística indutiva: Teoria e aplicações. Livraria Ciência e
SNEDECOR, G.W. & COCHRAN, W.G. Statistical methods, 7th edition. The Iowa State University
A
estatística é um ramo da matemática que se interessa em obter conclusões a partir
pioneiros de Gauss no fim do século anterior e dos trabalhos de Gosset de 1908, publicados
descritiva preocupa-se com a coleta, organização e apresentação dos dados amostrais, sem
inferir sobre a população; e a estatística indutiva preocupa-se com a análise e interpretação dos
dados amostrais. Conclusões importantes podem ser inferidas da análise dos dados amostrais.
No entanto, a inferência não pode ser "absolutamente certa", daí a necessidade de se utilizar
Na maioria das situações agrícolas as leis de causa e efeito não são conhecidas na
prática pelo pesquisador, no entanto, existe a necessidade de se obter uma solução para os
problemas que surgem naturalmente. Foi com o objetivo de se apresentar tais soluções é que a
Finalmente é necessário ter em mente que a estatística é um método científico, por meio
do qual o pesquisador pode tomar decisões para solucionar os problemas que são encontrados
durante suas pesquisas. Para que a estatística seja bem usada é necessário conhecer os seus
fundamentos e os seus princípios, e que acima de tudo que o pesquisador tenha a possibilidade
que a estatística possa ser aplicada a essas observações, elas devem estar na forma de
números. Para exemplificar, pode-se destacar, por exemplo, que no melhoramento de plantas
esses números podem ser produtividade de uma parcela de milho ou de feijão, na zootecnia
podem ser ganhos de peso por animal sob o efeito de alguma dieta especial, ração com produto
variabilidade ou variação que apresentam. Essa característica, que pode assumir diferentes
valores de indivíduo para indivíduo, é chamada de variável. Quando todos os elementos de uma
população ou de uma amostra apresentam o mesmo valor para uma determinada característica,
aquelas para as quais uma medição numérica não é possível; e as quantitativas aquelas que
podem ser mensuradas numa escala de valores. As variáveis qualitativas podem ser ordinais ou
em um conjunto enumerável, sendo próprias de dados de contagem. As contínuas por sua vez,
DADOS BRUTOS: Dados originais na forma com que foram coletados (não foram
Com os dados elaborados pode-se estimar a amplitude total (A), ou seja, a diferença
exemplo, no qual se destaca a forma de representação dos dados qualitativos mais comuns.
Exemplo: Num determinado estudo de cor de flor, as cores branca e roxa foram observadas. Na
Tabela 1.1. Representação tabular para representar a herança de cor de flor em uma progênie
F 2.
Número de indivíduos 15 85
Representação gráfica:
90 Branca
Roxa
75
60
45
30
15
0
Branca Roxa
Figura 1.1. Gráfico de colunas para representar a herança de cor de flor em uma progênie F2
15% Roxa
Branca
85%
Figura 1.2. Gráfico de setores para representar a herança de cor de flor em uma progênie F2.
freqüência de classe.
DANIEL FURTADO FERREIRA 5
A seguir será abordada uma das formas mais comuns de se construir uma tabela de
(a) Determinar o número de classes (k): geralmente o número de classes é escolhido por muitos
com os dados é que deve indicar quantas classes devem ser construídas. No entanto, esse
critério pode variar consideravelmente de pesquisador para pesquisador, por isso 2 critérios
(i) Critério baseado no tamanho amostral (n) proposto por Oliveira (1995).
Tabela 1.2. Número de classes (k) determinado em função do tamanho amostral (n) (OLIVEIRA,
1994)
Tamanho da amostra (n) Número de classes (k)
(ii) Critério baseado na distribuição normal dos dados da amostra proposto por SCOTT (1979).
1
An 3
k = 1+
3, 49S
ESTATÍSTICA BÁSICA 6
apresentada no Capítulo 2). No exemplo dos coelhos, usando o primeiro critério tem-se:
determinada classe. Na construção da distribuição de freqüência não é possível saber quais são
os limites de classe a priori e, portanto, deve-se ter uma maneira diferente para determinar c.
A
c=
k −1
inferior da primeira classe a ser formada. A escolha deste valor é feita por muitos autores, como
menor valor amostral. No presente material, adota-se o critério a seguir. A idéia por detrás desse
critério é determinar o limite inferior da primeira classe como um valor menor do que o menor
valor observado na amostra, uma vez que por um mero acaso valores da população inferiores a
A forma de representação de uma classe adotada é dada por 2,413├─ 2,528, ou seja, a
classe tem seu limite inferior de 2,413Kg incluído na classe e o seu limite superior de 2,528Kg
excluído. Outra notação pode ser usada, qual seja [2,413; 2,528). O significado é o mesmo do
descrito anteriormente.
(i) Somar ao valor do limite inferior da primeira classe a amplitude de classe e obter-se o limite
superior;
(ii) O limite superior da primeira classe será o limite inferior da segunda classe;
(iii) Repetem-se os passos (i) e (ii) até completar k classes, ou equivalentemente até que o maior
freqüências obtida.
Tabela 1.3. Distribuição de freqüência para o peso dos coelhos híbridos Norfolk abatidos aos 90
dias.
acumuladas: Freqüência acumulada abaixo de (Fc↓) e acima de (Fc↑), Tabela 1.4 e 1.5.
Tabela 1.4. Distribuição de freqüência acumulada “abaixo de” para o peso dos coelhos híbridos
Abaixo de Fc↓
2,413 0
2,528 2
2,643 9
2,758 10
Tabela 1.5. Distribuição de freqüência acumulada “acima de” para o peso dos coelhos híbridos
Acima de Fc↑
2,413 10
2,528 8
2,643 1
2,758 0
de classe são consideradas iguais ao ponto médio da classe. Essa hipótese é conhecida como
hipótese tabular básica (HTB). Os cálculos das medidas de posição ou de dispersão amostral
usando os pontos médios das classes como representantes de todos os seus elementos contém
menor precisão do que àqueles realizados utilizando os dados brutos ou elaborados. No entanto,
estes erros, como já constatado por muitos pesquisadores em estatística, podem ser
distribuição de freqüência refere-se à simplificação estrutural dos dados sem grandes perdas de
DANIEL FURTADO FERREIRA 9
precisão, bem como a aumento da facilidade de cálculos devido a estas simplificações, além de
fornecer uma idéia da forma da distribuição da variável por meio da representação gráfica.
REPRESENTAÇÃO GRÁFICA
amplitude, as alturas dos retângulos são proporcionais às freqüências das classes, e em caso
Fi
Fi( aj .) =
ci
(b) Polígono de freqüência: Gráfico de linhas que une os pontos médios das classes no topo
dos retângulos.
H istog ram a
Polig ono de freq uência
6
Frequência
0
2.300 2.415 2.530 2.645 2.760
C lasses de peso
Figura 1.3. Polígono de freqüência e histograma da distribuição dos pesos de coelhos híbridos
na Figura 1.4.
2
Frequências acumuladas
OGIVAS
0
2.298 2.413 2.528 2.643 2.758 2.873
Peso dos coelhos
Figura 1.4. Representação gráfica das distribuições acumuladas (ogivas) do peso de coelhos
dos dados amostrais ou experimentais. Esta classificação é de suma importância, pois grande
parte das análises que são abordadas posteriormente neste material depende da natureza desta
simétrica.
DANIEL FURTADO FERREIRA 11
MULTIMODAL
ESTATÍSTICA BÁSICA 12
simétrica, nota-se que geralmente que os dados são mais freqüentes perto de um valor central e
são mais raros ao afastar-se deste. A obtenção deste valor central é de importância fundamental
tanto para a pesquisa quanto para a extensão. Pode-se exemplificar através de uma situação em
que em uma grande firma produtora de milho, o empregador exige do agrônomo que este lhe
empregador tomará uma grande decisão com base nesta estimativa. Utilizando métodos de
amostragem apropriados e uma medida de posição e de seu erro, o agrônomo pode fornecer as
informações solicitadas com grande probabilidade de acerto. Este é um problema que pode ser
a maioria das situações práticas. Deve-se diferenciar, por meio de notação apropriada à média
elemento. A amostra por sua vez refere-se a um subconjunto de elementos desta população e
obtida de acordo com alguns critérios, de tal forma que haja uma representatividade da
população da qual foi extraída, e para qual se deseja extrapolar as informações (inferências
10.000ha plantados e uma amostra poderia ser de 20ha distribuídos ao acaso pela região
plantada. Será utilizada para diferenciar a média da amostra e da população a seguinte notação:
⎧
⎪ µ PARA POPULA Ç Ã O
⎨
Simbologia:
⎪ X PARA AMOSTRA
⎩
n
∑ Xi
X1 + X 2 +...+ Xn
X= i =1
=
n n
2,47 + 2,49+"+2,70
X= = 2,584 kg
10
∑X F i i
X= i =1
n
estimadores. A resposta é dada pela hipótese tabular básica, a qual considera que todos os
elementos de uma classe são representados pelo seu ponto médio, fato este, que não é
verdadeiro em praticamente todas as situações. Desta forma, este último resultado é apenas
Propriedades da média
∑ ( Xi − X) = 0
n
i=1
(ii) A soma dos quadrados dos desvios de um conjunto de dados em relação a sua média e um
valor mínimo.
i=1
Demonstração:
Fazendo:
D = ∑ ( Xi − A)
n 2
i=1
D = ∑ ( X i − A ) = ∑ ( X i2 − 2AX i + A 2 ) = ∑ X 2i − ∑ 2AX i + ∑ A 2
n 2 n n n n
∂D n
= −2∑ X i + 2nA
∂A i=1
∂D n
= −2∑ X i + 2nA = 0
∂A i=1
n
2 nA = 2∑ X i
i=1
n
∑ Xi
i=1
A= =X
n
Portanto, o ponto ótimo obtido igualando a primeira derivada a zero, pode ser um
ponto de máximo ou de mínimo. Para certificar que o valor de D, quando A é igual à média
amostral, é um valor mínimo basta mostrar que a segunda derivada é positiva. A segunda
∂D
= 2n > 0
∂A∂A
(iii) A média de um conjunto de dados acrescido (ou subtraído) em cada elemento por uma
X '= X ± K
(iv) Multiplicando todos os dados por uma constante a nova média será igual ao produto da
X′ =K X
Exemplo,
Classes Fi
5├─ 10 10
10├─ 20 20
20├─ 50 45.
50 ou mais 20
X ( n / 2 ) + X ( (n + 2) / 2)
(i) Se n for par: md =
2
Exemplo 1. No caso dos coelhos a posição central esta entre o 50 e o 60 elemento. Portanto, a
No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte
expressão:
⎡n ⎤
⎢ 2 − FA ⎥
m d = LI md + ⎢ c
Fmd ⎥ md
⎢ ⎥
⎣ ⎦
Em que, Fmd: freqüência da classe mediana; cmd: amplitude da classe mediana; FA: freqüência
acumulada das classes anteriores à classe mediana; e Limd é o limite inferior da classe mediana.
distribuição de freqüência.
No exemplo: Posição mediana = 10/2 = 5 (contida na 2a classe), FA= 2; Limd = 2,528 Fmd
= 7 e cmd = 0,115kg.
Propriedades
Muitas vezes existem dúvidas de qual medida utilizar para sintetizar os dados
amostrais. Como uma regra geral, pode-se definir qual medida é mais conveniente para uma
distribuição dos dados for assimétrica, isto é quando valores extremos predominam em uma das
caudas da distribuição, deve se preferir a mediana como medida sintetizadora. Isto se deve ao
fato da mediana ser pouco sensível a presença de valores extremos, sendo considerada mais
robusta que a média. O termo robusto é o termo técnico usado para indicar esta propriedade da
mediana em relação à média aritmética, que quando a situação de simetria é violada a mediana
sendo o valor de maior freqüência na amostra. Para dados quantitativos contínuos a moda é o
valor de maior densidade. Portanto para dados quantitativos contínuos o estimador da moda é
polígono de freqüências. Um conjunto pode ter mais de uma moda ou até mesmo não ter moda.
expressão:
m o = LI mo + ∆ 1
c mo
∆1 + ∆ 2
No exemplo, a classe modal foi à segunda: 2,528 ├── 2,643 com F2=7. Logo,
classe modal, como é apresentado por diversos autores. A justificativa é dada pela hipótese
tabular básica, que diz que todos os valores de uma classe são iguais ao seu ponto médio.
Como neste caso a classe modal é a de maior freqüência, a moda é considerada como igual a
cálculos da mediana e da moda, o que para grandes conjuntos de dados, seus cálculos exatos
Propriedades
G = n X1. X2 ... Xn
como, por exemplo, o número de bactérias em uma colônia. Espera-se que a cada reprodução, o
1
H = n
1 1
n
∑
i =1 X i
20% do número total de observações. Esta eliminação dos valores extremos é para eliminar o
1 4 5 6 6 7 7 7 7 8 8 8 8 8 8 9 9 10 10 40
4 + 5+...+10 135
A média é: X = 8,80 a média aparada X A = = = 7,50
18 18
insuficientes para sintetizar as informações amostrais. Para exemplificar este fato, têm-se a
variabilidade em relação ao valor central. Desta forma pode-se afirmar que uma amostra deve
ser representada por uma medida de posição e dispersão. As principais medidas de dispersão
A amplitude é definida como a diferença entre o maior e o menor valor de uma amostra.
(i) só considerar os valores extremos para o seu cálculo, e principalmente se houver “outlier” ela
será grandemente afetada. Como só dois extremos são considerados amostras com valores
menor valor discrepar dos demais; e (ii) ser influenciada pelo tamanho da amostra, pois à
medida que a amostra aumenta a amplitude tende a ser maior. Esta última desvantagem, não
Para contornar a desvantagem de que apenas dois valores são utilizados para o cálculo
da amplitude, poderia ser cogitado, então, o uso de a soma dos desvios em relação à média
como medida de dispersão ou de variabilidade. No entanto, esta medida não é adequada, devido
ao fato de a soma de desvios em relação à média ser nula, sendo que todos as amostras
Assim, uma medida da variabilidade que considera todas as observações e que é a mais
variância ou a sua raiz quadrada, o desvio padrão. A variância pode ser entendida como se
amostra de tamanho n deveria ser utilizado este valor (n) como divisor desta soma de quadrados
Simbologia
DANIEL FURTADO FERREIRA 23
∑ ( Xi − X )
n 2
i=1
S2 =
n −1
desvio padrão, por sua vez, é expresso na mesma unidade do conjunto de dados, sendo obtido
ocorrem com freqüência. Por essa razão é preferível utilizar as seguintes expressões:
⎡ ⎛ n ⎞ ⎤
2
⎢ ∑ i ⎥
X
1 ⎢ n 2 ⎜⎝ i=1 ⎟⎠ ⎥
S2 = ∑ i
n − 1 ⎢ i=1
X −
n ⎥
⎢ ⎥
⎢⎣ ⎥⎦
S= S
2
ESTATÍSTICA BÁSICA 24
S2 = (66,8116-25,842/10)/9 = 0,00456kg2
S= 0,00456 = 0,0675kg
⎡ ⎛ n ⎞ ⎤
2
⎢
1 ⎢ n ⎜∑ i i ⎟ ⎥
FX
⎝ i =1 ⎠ ⎥
S =
2
⎢ ∑
n − 1 i =1
i i −
FX 2
n ⎥
Variância
⎢ ⎥
⎢⎣ ⎥⎦
S= S
2
Desvio padrão
Para o exemplo:
S = 0,065279kg
ser comparada diretamente pelas estimativas da variância ou do desvio padrão obtidas. Para
intuitivo que os desvios padrão de valores iguais a 1 têm importâncias diferentes. É conveniente
observar que um desvio padrão igual a 1 é mais importante no conjunto X, pois representa 50%
do valor médio.
Propriedades
(i) Variância
Somando ou subtraindo uma constante K aos dados o desvio padrão não se altera;
Multiplicando todos os dados por uma constante K o novo desvio padrão fica
multiplicado por K.
numéricos que possuem a mesma média e a mesma unidade de medida ou grandeza. Diz-se
que o desvio padrão é uma medida de dispersão absoluta. Nos casos em que os conjuntos
ESTATÍSTICA BÁSICA 26
possuem diferentes unidades e possuem médias diferentes, uma medida de dispersão relativa,
coeficiente de variação refere-se à variabilidade dos dados mensurada em relação a sua média,
S
CV = x 100
X
determinado período está apresentado na Tabela 1.6. Verifica-se que a temperatura apresentou
uma maior variabilidade relativa do que a apresentada pela precipitação, pois o CV foi maior
para essa variável. Se fossem comparados os desvios padrão, a conclusão seria de que a
precipitação seria mais variável que a temperatura. Essa conclusão seria, não obstante,
S 5 0C 100mm
DANIEL FURTADO FERREIRA 27
CV 22,7% 12,5%
populacional. É bastante intuitivo supor que se uma nova amostra aleatória for realizada a
estimativa obtida será diferente daquela da primeira amostra. Esse processo se repetido
fornecerá estimativas diferentes em cada etapa. Dessa forma, reconhece-se que as médias
amostrais estão sujeitas à variação e formam populações de médias amostrais, quando todas as
possíveis (ou as infinitas) amostras são retiradas de uma população. No entanto, é intuitivo,
também, o conceito de que as médias amostrais variem menos que uma simples observação. A
S
SX =
n
0, 0675
SX = = 0, 02135kg
10
Nesse caso o erro padrão foi de 0,02135kg e representou 0,83% do valor médio,
indicando que a média foi estimada com alta precisão. Nos próximos capítulos outros métodos
para avaliação da precisão com que uma média foi calculada são apresentados.
ESTATÍSTICA BÁSICA 28
para avaliação da natureza da distribuição dos dados. Neste último caso por uma inspeção
empírica o pesquisador podia inferir que tipo de distribuição os dados de sua pesquisa
distribuição apresentava uma concentração maior dos valores em torno do valor central e se à
simetria de uma distribuição, pode ser dada pelo coeficiente de assimetria, cuja notação para
m3
a 3 = b1 =
m2 m2
( ) ( )
n 2 n 3
∑ xi − x ∑ xi − x
i =1 i =1
m2 = e m3 =
n n
Nas situações reais da pesquisa, esta informação é de grande valia, uma vez,
assimetria será exatamente igual a zero, mesmo quando proveniente de uma distribuição
distribuição quanto à simetria, no capítulo 6, será apresentado um critério estatístico para fazer
este julgamento.
curtose, a qual é representada por a4 ou b2. Esta é uma medida do grau de achatamento da
distribuição quando comparada ao de uma distribuição conhecida como distribuição normal, que
será vista no capítulo 2. Para esta distribuição normal o valor de a4 é 3, sendo denominada de
leptocúrticas, ou seja, são mais “afiladas“ que a distribuição normal. E distribuições com valores
m4
a 4 = b2 =
m22
( )
n 4
∑ xi − x
i =1
m4 =
n
leptocúrtica
mesocúrtica
platicúrtica
mesocúrtica e platicúrtica.
∑(x − x)
2
i
m2 = i =1
=0,004104
n
∑(x − x)
3
i
m3 = i =1
=-0,000062112
n
∑(x − x)
4
i
m4 = i =1
=0,000043419552
n
DANIEL FURTADO FERREIRA 31
m3
a 3 = b1 = =-0,2362
m2 m2
m4
a 4 = b2 = =2,5779
m22
Como o valor de assimetria é menor que zero, pode se inferir que a distribuição
pode-se inferir que a distribuição é platicúrtica, uma vez que seu coeficiente de curtose é inferior
a 3. Como já comentado, os valores amostrais destas estatísticas, em geral não são exatamente
iguais aos padrões de uma normal, mesmo quando são provenientes de uma distribuição
sabidamente normal. Então, neste momento, ainda não há como saber com grande segurança
se a diferença dos valores desta estatística para os padrões da distribuição normal é irrelevante
1.4. Exercícios
2. Notação de somatório
n
O símbolo ∑ X j é usado para representar a soma de todos os valores Xj desde j=1 até
j =1
n
∑ X j =X1 + X2 + ... + Xn,
j =1
3. Propriedades
n n
3.1. ∑ aX j = aX1 + aX2 + ... + aXn=a ∑ X j
j =1 j =1
n
3.2. ∑Y j X j = Y1 X1 + Y2X2 + ... + YnXn
j =1
n n n
3.3. ∑ (aX j + bY j ) = a ∑ X j + b ∑Y j
j =1 j =1 j =1
n
3.4. ∑ K = nK
j =1
Tabela 1.7. Produtividade em t/ha de uma forrageira sob o efeito de 3 doses de N em combinação com 4
doses de P observados em um experimento zootécnico.
Em algumas análises estatísticas é necessário muitas vezes somar as linhas e/ou colunas,
bem como toda a tabela. A notação de somatório pode ser utilizada com essa finalidade. Como dois fatores
determinam a produtividade, dois índices são utilizados para representá-los, como comentado
anteriormente. Assim, dois símbolos de somatórios podem ser utilizados em alguns casos. Assim será
definido, o seguinte somatório:
∑∑ x
i =1 j=1
ij
= x 11 + x 12 + " + x 43 = 4, 6 + 5, 0 + " + 6,8 = 68,1
5. Exercícios propostos
Sejam os conjuntos de dados a seguir:
X={2, 4, 4, 3, 2 }
Y={1, 2, 3, 6, 7}
Obtenha:
4 5
5.1. ∑ X j 5.2. ∑Y j
j =1 j =1
5 5
2
5.3. ∑ 4 X j 5.4. ∑ X jY j
j =1 j =1
5 4 5
2
5.5. ∑ ( 3 X j + 2Y j ) 5.6. ∑ X jY j + ∑Y j
j =1 j =2 j =1
n ⎡ ⎛n ⎞ ⎤
2
∑X
j=1
j ⎢ ⎜∑X ⎟ ⎥
1 ⎢ n 2 ⎝ j=1 j ⎠ ⎥
6. Seja X= a média aritmética e S =
2
∑X − a variância. Dado o
n n − 1 ⎢ j =1 j n ⎥
⎢ ⎥
⎣ ⎦
conjunto de dados X={2, 4, 5, 6, 1, 8}, calcule a sua média e variância.
n
7. Demonstre numericamente e algebricamente que ∑ (X
j=1
j − X) = 0 . Use os dados do exemplo anterior
3
8.3. ∑ X2ij i = 1, 2, 3, 4
j=1
1. Os dados apresentados a seguir são relativos às produções de 50 plantas de uma progênie F2 de feijoeiro
em g/planta, avaliados no Departamento de Biologia da UFLA, em 1997.
DANIEL FURTADO FERREIRA 35
2,81 3,19 3,49 3,76 6,02 8,23 2,23 3,01 4,43 13,94 3,10 1,52 3,38
2,85 4,64 7,33 6,78 13,12 13,84 9,40 6,20 2,39 9,19 7,07 9,20 13,46
3,90 8,99 7,97 5,15 12,95 25,52 6,61 16,56 9,60 6,71 6,73 3,86 3,50
4,80 8,40 13,86 6,53 18,44 22,14 9,15 8,75 10,86 14,20 10,09
8,13 8,23 8,60 8,80 8,97 9,05 9,12 9,30 9,35 9,78
9,80 9,86 9,90 9,95 10,00 10,11 10,13 10,15 10,16 10,23
10,31 10,33 10,40 10,46 10,50 11,14 11,29 11,46 12,05 12,14
e) Se for multiplicado a produtividade por 0,27 de cada produtor, para se obter a renda média por
produtor/animal/dia, qual, qual será o valor para amostra?
f) obtenha a média harmônica.
11,80 11,90 12,00 12,30 12,80 12,99 13,10 13,50 13,80 14,10
14,55 14,65 14,70 15,00 15,10 15,20 15,50 15,80 15,90 15,96
f) Se cada dado for dividido por 12, para se obter o intervalo de partos em anos, qual será os
novos valores da amplitude, variância, desvio padrão, CV e erro padrão da média?
algumas situações amostrais. Classifique cada uma delas quanto à simetria e o grau de
Coef. simetria (a3) Coef. curtose (a4) Class. da simetria Class. da curtose
0,5 3,0
-2,0 2,0
2,0 2,0
3,0 3,0
0,0 3,0
0,0 3,5
-3,0 4,5
produção de leite - um estudo no oeste do Paraná - Brasil. Lavras, MG, Agosto, 1997.
PROBABILIDADE
variáveis aleatórias. Inúmeros modelos probabilísticos podem ser usados para modelar a
inferência estatística usa esses modelos e suas propriedades para formular as principais teorias
diferentes num total de “n” modos possíveis, então a probabilidade de ocorrência do evento é
a
definida por: p = . Assim, o conjunto de todas as possíveis formas de ocorrer um determinado
n
fenômeno deve ser especificado ou pelo menos enumerado. Esse conjunto é denominado de
de dados, denominado de domínio da variável aleatória. Como já foi visto, elas podem ser
discretas ou continuas. Será visto duas principais distribuições discretas e a mais importante das
continuas, a distribuição normal. Nesse curso, devido a carga horária limitada e a grande
Se uma variável X pode assumir um conjunto de valores discretos X1, X2, ..., Xn
com probabilidades p1, p2, ..., pn, sendo Σpi=1, diz-se que está definida uma distribuição de
probabilidade de X.
freqüência amostral torna-se, no limite de uma população, uma curva continua. Essa curva
µ a b
A área total sob a curva limitada pelo eixo X é igual a 1. E a área entre a e b
A. DISTRIBUIÇÃO BINOMIAL
observados. Essa variável tem distribuição binomial. São exemplos de variáveis binomiais:
em uma amostra de tamanho n; entre outros. A distribuição binomial é a mais importante das
distribuições de v.a.discretas.
DANIEL FURTADO FERREIRA 42
x n−x
P(X=x)= C nx p q
n!
Cn =
x
em, e x é o número de sucessos ocorridos em n tentativas. x=0, 1, 2, ..., n.
x !( n − x )!
pergunta-se qual a probabilidade de nascer 2 fêmeas? 1 fêmea? e nascer pelo menos uma fêmea?
2 2−2
2! ⎛ 1 ⎞ ⎛ 1 ⎞
P(X=2)= ⎜ ⎟⎜ ⎟ = 0,25 = 25%
2!0! ⎝ 2 ⎠ ⎝ 2 ⎠
1 2 −1
2! ⎛ 1 ⎞ ⎛ 1 ⎞
P(X=1)= ⎜ ⎟⎜ ⎟ = 0,50 = 50%
1!1! ⎝ 2 ⎠ ⎝ 2 ⎠
P(X=0)= 25%
ESTATÍSTICA BÁSICA 43
Tabela 2.1. A distribuição de probabilidade refere-se aos possíveis valores que X pode assumir
x 0 1 2
F(x).
µ x = np σ 2x = npq = np(1 − p)
B. DISTRIBUIÇÃO DE POISSON
tendendo para zero, permanecendo finito e não nulo o produto np (média da distribuição). Na
prática, para uma boa aproximação, adota-se n≥50 e p≤0,10. A distribuição de Poisson, também,
DANIEL FURTADO FERREIRA 44
pode ser vista como sendo a distribuição de uma variável X que mede a ocorrência do número de
elementos por unidade de tempo, área ou volume. Assim, por exemplo, a ocorrência de uma planta
de uma determinada espécie por unidade de área pode ser modelada pela distribuição Poisson; a
ocorrência de formigueiros por talhão; a ocorrência do número de uma determinada doença por
Função de densidade
x
−k
k
P(X=x) = e
x!
t=0 t!
Exemplo: 2% dos animais de um rebanho estão atacados por uma doença. Qual a probabilidade
(ii) 1 doente?
(iii) 2 doentes?
k=np=100x0,02=2
0
(i) P(X=0)= e−2
2 =13,53%
0!
ESTATÍSTICA BÁSICA 45
e −2 21
(ii) P(X=1)= =27,07%
1!
e −2 2 2
(iii) P(X=2)= =27,07%
2!
µ x = np = k σ 2x = np = k
Uma variável aleatória discreta X assumindo valores x1, x2, . . ., xk terá distribuição
1
P(X=x)= ; x = x1, x2, . . ., xk
k
DANIEL FURTADO FERREIRA 46
D. DISTRIBUIÇÃO NORMAL
em pesquisas das ciências agrárias. A distribuição normal tem densidade dada por:
(x −µ ) 2
1 −
f (x) = e 2 σ2
2πσ2
Propriedades
(σ2 = 1 e µ = 0)
X−µ
Se X ∩ N( µ , σ2) então a V.A. Z, definida por: Z = , terá distribuição normal
σ
padronizada-N(0,1). Sabe-se que a probabilidade de X estar entre dois valores quaisquer (a, b) é
µ a b
b
P(a<X<b)= ∫ a f(x) dx
Como o cálculo dessa integral não é trivial, usam-se as tabelas obtidas a partir da
curva normal padronizada. Calcular a área compreendida entre 0 e 1 na curva normal reduzida.
DANIEL FURTADO FERREIRA 48
0 1
P(0≤Z≤1) = 0,3413.
P(-1≤Z≤0)=P(0≤Z≤1)=0,3413
desconhecidos e devem ser estimados da amostra. Nesse caso a as probabilidades são apenas
estimativas das reais probabilidades. As estimativas são tanto melhores, quanto maiores forem às
apresentado a seguir.
Exemplo: No exemplo dos coelhos híbridos, assumindo distribuição normal dos pesos, tem-se que
P(X>2,701)=?
2 ,5 8 4 2 ,7 0 1
X− X 2,701 − 2,584
Zc = = =1,73
S 0,0675
0 1 ,7 3
(i) Binomial
X ∩ B(n,p)
Deseja-se calcular probabilidades tais como P(X≥7), P(0≤X≤4), etc. Pode-se fazer
tal cálculo usando a própria distribuição binomial ou usar a aproximação normal. No caso da
aproximação normal, o erro cometido será tanto menor quanto maior for n e quanto mais próximo
de 0,50 estiver o valor de p. Alguns autores afirmam que quando np≥5 a aproximação normal é
considerada boa.
■ Usando a Binomial:
P(X≥7)=P(X=7)+P(X=8)+P(X=9)+P(X=10)=0,171875=17,1875%
µx= np =10x0,50 = 5 ≥ 5
■ Como P(X≥7) inclui o 7 e X segue uma distribuição discreta, deve-se fazer correção para
descontinuidade, para que P(X=7) seja considerada na aproximação normal, e o erro seja
minimizado.
ESTATÍSTICA BÁSICA 51
■ P(X≥7) inclui o 7, logo se deve considerar no caso contínuo P(X>6,5) (pois considera a
probabilidade de X ser 6,5 ou mais). Se fosse P(X>7), que não inclui o valor 7 deve-se calcular a
P(X>7,5).
retângulo correspondente sob a curva contínua usada para aproximar a distribuição discreta.
-1 0 1 2 3 4 5 6 7 8 9 10 11
X − µx 6,5 − 5,0
Zc= = = 0,95
σx 2,5
(ii) Poisson
Nesse caso o processo é análogo, sendo que a média e a variância são dados por:
µx= np =k e σ2 = np=k
P(X>7) não inclui o 7, logo a probabilidade desejada será: P(X>7,5) na aproximação Normal.
X − µx 7,5 − 5,0
Zc = = = 1,12
σx 5
obtido foi: P(X>7)=13,34%. Novamente observa-se que o erro cometido foi pequeno, não sendo
importante.
n
E(X) = ∑ x P(X = x ) , se X é uma v.a. discreta.
i
i i
ESTATÍSTICA BÁSICA 53
∞
E(X) = ∫ xf ( x )dx , se X é uma v.a. contínua
−∞
Propriedades
(iii) E[X-E(X)]=0
2.5. EXERCÍCIOS
2) Suponha que X (V.A. discreta) seja o número de animais doentes de uma determinada raça.
Sabe-se que esta doença é controlada geneticamente e que ataca 1/3 da raça. Numa amostra de
5 animais, pede-se:
a) A distribuição de probabilidade de X? (Use a binomial)
b) A probabilidade de haver na amostra mais de 1 animal doente?
c) A probabilidade de haver mais de um animal sadio?
DANIEL FURTADO FERREIRA 54
3) Numa lâmina verificou-se que existiam em média 2,5 bactérias/cm2. A lâmina foi subdividida em
300 quadrados de 1cm2. Em quantos destes quadrados vocês espera encontrar no máximo 1
4) Um pesquisador da área de zootecnia conseguiu uma série de dados dos últimos 120 anos,
com o registro do número de uma doença rara em eqüinos da localidade em que trabalhava. Os
Número de doenças 0 1 2 3 4 5
Número de anos 50 42 20 5 2 1
b) Calcule para cada valor de X, as probabilidades associadas. suponha que X possua distribuição
de Poisson.
d) Compare os resultados esperados com os observados. Com base nesta comparação, você
pode afirmar que a distribuição de Poisson é adequada para explicar a ocorrência desta doença na
distribuição normal padronizada N(0,1), com média zero e variância 1: P(Z≥1,96), P(Z≥0,95),
2. Encontre o valor de Zc tal que: P(Z> Zc)=0,025, P(Z< Zc)=0,600 e P(1<Z< Zc)=0,1200.
ESTATÍSTICA BÁSICA 55
considerando uma determinada raça e rebanho) segue a distribuição normal e possui média
P(7<X<11,5). Qual é o valor Xc, tal que 90% das vacas tem produtividade inferior ao mesmo, ou
seja, P(X<Xc)=0,90?
5.Seja X uma variável aleatória discreta, que representa a incidência de uma doença num
determinado rebanho. Supor que X possua distribuição de Poisson com média, K=17. Determine
as seguintes probabilidades pela aproximação normal, para uma amostra de 200 animais.
(e) Calcule o valor exato de (c) pela Poisson. Determine o erro de aproximação encontrado.
CAPÍTULO III - AMOSTRAGEM
3.1. IMPORTÂNCIA
POPULAÇÃO AMOSTRA
µ X
σ ⎯⎯→
2
⎯⎯→
2
S
^
P P
Parâmetros populacionais desconhecidos Estimadores amostrais
Exemplo: Pop.={A, B, C} com N=3. Retirar amostras de tamanho n = 2 com e sem reposição.
Amostras possíveis: {AA, AB, AC, BA, BB, BC, CA, CB, CC}
▄ Sem reposição: 3!/(2!1!)= 3
Amostras possíveis: {AB,AC,BC}
(B) AMOSTRAGEM SISTEMÁTICA
Exemplo: Uma determinada região possui 10.000 plantas de eucaliptos. Obter uma amostra de 50
plantas (n=50).
▄ r = 10.000 ÷ 50 = 200;
▄ Sorteia-se o primeiro elemento da amostra;
▄ Com razão r = 200 os demais elementos são amostrados;
▄ Se por exemplo sorteou-se o elemento número 20, a amostra será:
Amostra = {20, 220, 420, 620, ..., 9820}
Exemplo: Estimar o número de cabeças de gados de certa região. Sorteiam-se alguns municípios
dessa região e dentro deles algumas propriedades para compor a amostra.
(i) UNIFORME
(ii) PROPORCIONAL
Ni
ni = n
N
DANIEL FURTADO FERREIRA 60
A seguir é apresentada uma outra situação em uma outra região que se pretendia
caracterizar o padrão tecnológico da agricultura utilizada. Conforme o caso anterior uma amostra
de n = 50 elementos deve ser extraída da população de N = 1.000 propriedades existentes e
distribuída conforme as áreas apresentadas na Tabela 3.2.
(iii) ÓTIMA
N iσ i n
ni = k
∑ N iσ i
i =1
▄ a obtenção de informações sobre a população é otimizada, pois no estrato que houver menor
variação haverá uma menor quantidade de elementos amostrados;
possível realizar amostragens piloto em cada estrato e obter estimativas dessa variabilidade.
Esses procedimentos, no entanto, não garante a optimalidade do método.
Exemplo: Liquido ou gás ⇒ homogeneizar e retirar a amostra a esmo. Obs. É impraticável sortear.
(D) INTENCIONAL
3.3. EXERCÍCIOS
ecológico, possuem os seguintes diâmetros a altura do peito em cm (DAP): 25, 20, 35, 21, 22,
22, 24 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27,
25, 23, 28, 27, 22. Com o objetivo de estimar o DAP médio, como você extrairia uma amostra
2. Suponha que as plantas desta população estejam distribuídas em 5 fileiras de 7 plantas. Faça
realizado.
3. Uma empresa agrícola tem 3.414 empregados repartidos nos seguintes setores:
Administrativo 314
Transporte 948
Campo 1.451
Outros 701
Para se estudar o nível salarial médio da empresa, resolveu-se fazer uma amostra de 50
funcionários. Você julga que a ASA seria apropriada, para este caso? Se afirmativo, justifique sua
resposta, caso contrário, discuta qual método seria adequado? detalhe o processo de amostragem
neste caso.
4. Quais são as situações em que a amostragem estratificada deve ser preferida à amostragem
simples ao acaso?
AMOSTRAGEM
4.1. IMPORTÂNCIA
probabilística. Por exemplo, se existe interesse em saber a incidência de doenças em uma cultivar
experimentais. Para se fazer inferência é necessário saber como as estimativas variam de amostra
para amostra, como são os erros de estimação e qual modelo probabilístico pode ser usado para
Quadro 4.1 apresenta-se o esquema da distribuição amostral em que uma população com um
POPULAÇÃO ⇒ AMOSTRAS
θ ⇒ 1 ⇒ t1
. 2 ⇒ t2
Parâmetro . .
populacional . .
desconhecido ⇒ .
K ⇒ tk
Quadro 4.1. Descrição do processo de amostragem, onde k amostras são retiradas de uma
(i) Dada uma população com um parâmetro θ de interesse, que pode ser a média (µ), variância
(iv) Com os valores t1, t2, ..., tk (estimativas) das K amostras faz-se a distribuição de T.
θ Τ
Nesse processo algumas definições devem ser formalizadas para que o leitor possa ter
Definições
interesse (X);
▄ Estimador ou estatística - É uma variável aleatória que é função dos elementos amostrais Xi,
i=1,2, ..., n.
entre médias.
4.2.1. DISTRIBUIÇÃO DE X
população uniforme discreta com três valores apresentados a seguir. A população considerada e
amostras com ou sem reposição dessa população, como já comentado anteriormente. Esses dois
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 66
processos são descritos a seguir utilizando amostras de tamanho n=2. Todas as possíveis
amostras foram extraídas dessa população e a distribuição das médias foi então obtida.
Nesse processo cada elemento após ter sido amostrado retorna a população
Tabela 4.1. Amostras e médias amostrais possíveis retiradas de uma população de tamanho igual
a 3.
µ X = µ = 2,0
É possível provar que a média das médias amostrais é igual a média populacional,
⎡ ⎛ 9 ⎞2 ⎤
⎢ ⎜∑ X ⎟ ⎥
1 ⎢ 9 2 ⎝ i=1 ⎠ ⎥
= ⎢∑ X −
2
σX ⎥
9 ⎢ i=1 9 ⎥
⎢⎣ ⎥⎦
2
▄ Dividindo σ2/σ X = n = 2
2
2 σ
⇒ σX =
n
X Fi
1,0 1
1,5 2
2,0 3
2,5 2
3,0 1
Total 9
Tabela 4.2. Distribuição de freqüências das médias amostrais para amostras de tamanho n=2
Figura 4.2. Distribuição amostral das médias - amostragem com reposição e n=2.
▄ Se n = 1:
1 2 3
Figura 4.3. Distribuição amostral das médias - amostragem com reposição e n=1.
acaso de uma população qualquer com tamanho N, média µ e variância σ2, será
2
2 σ
aproximadamente normal com µ X = µ e σX = (amostragem com reposição ou sem
n
2
2 σ N −n
reposição com população infinita) ou σ X
= x (amostragem sem reposição com
n N −1
n
população finita ≥ 0,05 ). Se n≥30 a aproximação é considerada boa.
N
Amostras X
1,2 1,5
1,3 2,0
2,3 2,5
Quadro 4.2. Distribuição das médias amostrais retiradas sem reposição de uma população de
tamanho 3.
Verifica-se que:
2
2 σ N −n
■ µ X = µ = 2,0 e ■ σ X
= x = (2/3)/2 x (3-2)/(3-1) = 1/6
n N −1
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 70
Esse resultado é válido para todas as populações finitas. Para populações infinitas, o fator
⎛ N−n ⎞
de correção na expressão da variância ⎜ ⎟ não deve ser usado. Assim, em populações
⎝ N −1 ⎠
infinitas mesmo que a amostra seja realizada sem reposição a variância populacional é dada por
2
2 σ N −n
σX = x .
n N −1
segunda e forem obtidas todas as diferenças possíveis entre as médias das amostras da
amostragem dessa diferença é possível fazer inferências com base nesses resultados para os
parâmetros µ1 e µ2.
⎧µ ⎧µ
Pop 1 - ⎨ Pop. 2 - ⎨
1 2
⎩σ ⎩σ
2 2
1 2
AMOSTRAS AMOSTRAS
↓ n1
↓ n2
n1 n2
∑ Xi ∑ Xi
X1 = i =1
X2 = i =1
n1 n2
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 71
amostras possíveis de cada população e obter-se sua distribuição, então a média e variância
σ 12 σ 22
µ X1− X 2 = µ 1 − µ 2 e σ 2X 1 − X 2 = +
n1 n2
Exemplo: Um vendedor afirma que duas rações possuem o mesmo efeito no ganho de pesos de
Ração A Ração B
n1=30 n2=30
X 1 =33Kg X 2 =30Kg
S1=5Kg S2=4Kg
Quadro 4.3. Resultados do ganho de pesos de animais após terem sido submetidos as rações A e
■ µ1 - µ2=0 por hipótese ⇒ µ1 - µ2 ≥ 0 (por suspeita que a média da ração A é superior a da ração
B, ou seja, que a ração A é mais eficiente que a ração B, quanto ao efeito no ganho de peso dos
médias. E adotando que as diferenças das médias amostrais possuem distribuição normal tem-se:
S 12 S 22 25 + 16
S 2X 1 − X 2 = + = = 1,3667
n1 n2 30
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 72
estimativa da variância no lugar desse parâmetro. A distribuição normal nesse caso é apenas
3− 0
ZC = = 2,57
1,3667
■ Para testar a hipótese de que as rações não diferem quanto ao ganho de peso proporcionado,
deve-se calcular a probabilidade de que o ganho de peso padronizado supere o limite de 2,57.
Em outras palavras, seria determinar a probabilidade, adotando a hipótese de que as rações são
que a diferença amostral de 3kg entre as duas rações, seja devida ao acaso é de apenas 0,51%.
Portanto é mais fácil acreditar que as rações A e B tenham efeitos diferentes para o ganho de peso
dos animais, do que acreditar que a diferença amostral de 3kg seja devida ao acaso, haja vista, a
4.3. DISTRIBUIÇÃO DE t, χ2 E F
aproximadamente normais.
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 73
σ2
N( µ X = µ ; σ 2X = ), dessa forma, pode-se obter o valor da curva normal padronizada, N(0,1),
n
X−µ
ZC =
σ
n
amostral, for usada como estimador de σ2, os valores estandardizados, de uma população normal:
X−µ
tC =
S
n
Características da distribuição de t
(iii) Quando n tende para infinito, a distribuição de t, se torna equivalente à distribuição normal;
Exemplo: Um agricultor afirma que sua produtividade média é de 2,20t/ha. Um agrônomo numa
amostra de n=25 parcelas obteve uma média de 1,70t/ha, e desvio padrão de 0,8t/ha. Baseado no
resultado da amostra é possível que o agricultor esteja superestimando sua produtividade média?
de 2,20t/ha seja verdadeira. Usando este valor como verdadeiro determinar se a diferença de
0,50t/ha (2,2-1,70) é devida apenas ao acaso, ou realmente é porque a hipótese é falsa. Para isso,
calcula-se a probabilidade de que a diferença encontrada seja devida ao acaso, usando a hipótese
como verdadeira. Se esta probabilidade é baixa, é mais fácil acreditar que a hipótese é falsa, do
1,7 − 2,2
tC = = −3,125
0,8
25
exceto quando se utilizam alguns softwares de estatística e probabilidade. Portanto, são definidas
regiões que correspondem a probabilidades pequenas (5% e 1%) divididas nos extremos da curva,
como ilustrado na Figura 4.4. Se o valor de tc cai numa destas regiões a probabilidade do evento
ter ocorrido devido ao acaso deve ser menor que os níveis estipulados. Desta forma, para o
9 5 %
2 ,5 % 2 ,5 %
-2 ,0 6 4 0 2 ,0 6 4
FIGURA 4.4. Região crítica ou de rejeição da hipótese da distribuição amostral de t para uma
■ Conclusão: Como o valor de tc=-3,125 supera o valor em módulo de t tabelado ao nível de 95%
2
(B) DISTRIBUIÇÃO DE χ (QUI-QUADRADO)
( n − 1) S 2
A variável aleatória obtida por: χ =
2
, é definida como qui-quadrado. Sua
σ2
entre uma distribuição teórica e uma distribuição experimental, e ajuste de freqüências teóricas
capítulo de estimação.
Exemplo: Qual o valor de χ 2 cuja área acima do mesmo é de 5%, obtido numa amostra de
n=25.
tabelado é 36,415.
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 76
95 %
0
0 3 6,41 5
FIGURA 4.5. Região crítica ou de rejeição da hipótese da distribuição de qui-quadrado para uma
amostra de n=25.
2
S1
σ1
2
para testar a igualdade entre duas variâncias e na análise de variância (estatística experimental),
para se efetuar o teste da hipótese de igualdade de efeitos tratamentos que se deseja comparar.
n1-1
n2-1 1 2 3 4 5 ... ∞
1 F 1 F 2 F3 F4 F 5 F∞
2 .
3 .
4 .
. .
. .
. .
∞ F 1 F 2 F3 F4 F 5 F∞
QUADRO 4.4. Esquema da tabela de F, para n1-1 e n2-1 graus de liberdade. Os valores Fi
população considerada foi definida no esquema 4.1. A partir desta população serão realizadas
diversas amostragens.
N1
P=N1/N
⇒
N
ESQUEMA 4.1. População de tamanho N, com N1 elementos que constitui um evento de interesse
relação à população.
CEX 117 - ESTATÍSTICA DANIEL FURTADO FERREIRA 78
N: tamanho total da população; por exemplo, total de plantas doentes e sadias de um campo de
sementes.
1 n n1
P 1 =
n
2 n
n2
P 2 =
. . n
.
. .
.
. . .
nk
K n P k =
n
população de tamanho N.
P(1 − P)
µP = P e σ P2 =
n
Se np≥5 a distribuição pode ser bem aproximada pela normal. Com populações
P(1 − P) N − n
µP = P e σ P2 = x
n N−1
µ X = nP e σ 2X = nP(1 − P)
⎛N − n⎞
µ X = nP e σ 2X = nP(1 − P) ⎜ ⎟
⎝ N− 1⎠
anteriormente. Assim, a distribuição de p̂ também é binomial, embora possa ser aproximada pela
Foi visto que a inferência estatística tem por objetivo fazer generalizações sobre
uma população com base em dados amostrais, uma vez que os parâmetros populacionais são
desconhecidos na maioria das situações práticas. Muitos problemas, na área agrícola, necessitam
POPULAÇÃO AMOSTRA
µ X
2
σ ⎯⎯→ ⎯⎯→ S
2
^
P P
Parâmetros populacionais desconhecidos Estimadores amostrais
TABELA 5.1. Descrição do processo de amostragem de uma população com parâmetros
desconhecidos com os respectivos estimadores (ou estatísticas).
(a) Estimação de parâmetros: é o processo que usa os resultados amostrais (estatísticas) para
(a) Estimação por ponto: obtém-se nesse caso um único valor amostral. Ex. X é uma estatística
■ Obs. Como já foi visto, o estimador (ou estatística) é uma variável aleatória que é função dos
elementos amostrais e a estimativa é o valor numérico obtido pelo estimador em uma certa
amostra.
(i) Não viciado ou não viesado: Quando sua esperança (valor médio) é igual ao próprio valor do
Ex. E( X ) = µ, portanto X é um estimador não viciado de µ; por outro lado, E(S) ≠ σ, portanto S é
um estimador viciado de σ.
(ii) Consistência: Um estimador será consistente se além de não viciado sua variância tende para
σ2
Ex. Como, E( X )=µ e lim σ X2 = lim = 0 , portanto, X é um estimador consistente de µ.
n→∞ n→∞ n
probabilidades utilizadas são em geral de 95% e 99%. As estimativas por ponto, as quais foram
vistas até agora, são usadas quando se necessita, pelo menos aproximadamente, conhecer o
quase certamente são distintas do valor do parâmetro, ou seja, quase certamente se comete um
erro de estimação. Por esta razão torna-se necessário à construção de intervalos de confiança que
DANIEL FURTADO FERREIRA 82
paramétrico. Como os níveis de confiança são, em geral, fixados com 95% e 99%, α será igual a
possível o valor de α, no entanto, é conveniente lembrar neste instante que este valor é
inversamente proporcional a probabilidade de se cometer o erro tipo II. Então, não se pode reduzir
Exemplo de IC: Com 95% de confiança a verdadeira média da produtividade de milho BR201 está
entre [4,0 t/ha; 6,0 t/ha], para um determinado nível de utilização de tecnologia.
Será visto nos itens subsequentes, a estimação por intervalo dos principais
não se conhece a variância populacional (σ2) e deve-se usar seu estimador amostral (S2). Nesse
às variações amostrais, e a distribuição de t é mais apropriada. Por outro lado, foi comentado que
entanto, o pesquisador fica livre para escolher entre as duas distribuições quando n≥30. A seguir,
σ
Sabe-se, como já abordado no capítulo IV, que X ∩ N(µ, ). No entanto, como
n
em geral, nas situações práticas, não se conhece a variância populacional, então se deve utilizar o
estimador, S2, e a distribuição de t, como já argumentado anteriormente. Desta forma, a regra para
IC1-α: X ± e
S
onde, e = tα/2 e tα/2 com n - 1 graus de liberdade (GL).
n
n
■ Populações finitas ( > 0,05 ) e amostras sem reposição.
N
A regra geral é a mesma para o caso da amostragem ser feita com reposição de
apresentada a seguir:
IC1-α: X ± e
DANIEL FURTADO FERREIRA 84
S N−n
onde, e = z α / 2 e tα/2 com n - 1 graus de liberdade (GL), sendo a única alteração o
n N −1
pq
refere-se ao uso de um estimador da variância populacional, que neste caso é . No entanto
n
neste caso, devido a algumas considerações de ordem teórica que não serão abordadas neste
material, por fugir do seu objetivo, a distribuição de amostragem aproximada é a normal. Neste
caso é usada a distribuição normal para construir os intervalos de confiança, além de outras
IC1-α: p ± e
pq
onde, e = zα / 2 .
n
n
■ Populações finitas ( > 0,05 ) e amostras sem reposição
N
IC1-α: p ± e
pq N−n
onde, e = zα / 2 , sendo a única alteração o fator de correção para amostragem sem
n N −1
reposição de populações finitas.
É conveniente salientar que a aproximação normal para populações finitas é apenas uma
aproximação grosseira, uma vez que o modelo normal assume populações infinitas. Mesmo em
considerada grosseira.
padronização, a qual tem distribuição aproximadamente normal, mas que não pode ser utilizada
em situações reais devido ao fato de exigir que o parâmetro binomial p seja conhecido. Em todos
confiança. Seja n o tamanho da amostra e y o número de sucessos (y=0, 1, 2, ..., n-1, n).
DANIEL FURTADO FERREIRA 86
Nos casos especiais em que y=0 e y=n, deve-se proceder da seguinte forma:
y + 0,5 − np
= − z α/ 2
np(1 − p )
⎧⎪ ( zα / 2 ) 2 ⎫⎪
y − 0,5 ⎛ y − 0,5 ⎞ ( zα / 2 )
2
1 y − 0,5 zα / 2
LI = ⎨ − ⎜1 − ⎟+ + ⎬
( zα / 2 ) 2 ⎪⎩ n n n ⎝ n ⎠ 4n 2n ⎪
⎭
1+
n
⎧⎪ ( zα / 2 ) 2 ⎫⎪
y + 0,5 ⎛ y + 0,5 ⎞ ( zα / 2 )
2
1 y + 0,5 zα / 2
LS = ⎨ + ⎜1 − ⎟+ + ⎬
( zα / 2 ) 2 ⎪⎩ n n n ⎝ n ⎠ 4n 2n ⎪
⎭
1+
n
alternativa para os limites de confiança para o parâmetro binomial, a qual é apresentada a seguir.
ESTATÍSTICA 87
−1
⎡ 2⎧
[
⎢ ⎛ y ⎞ ⎪ 81y( n − y +1) − 9n − 8 + 3 zα / 2 9y( n − y +1)(9n + 5 − zα / 2) + n +1
2
] ⎫3 ⎤
⎪ ⎥
LI = ⎢1+ ⎜ ⎟ ⎨ ⎬ ⎥
⎢⎣
⎝ n − y +1⎠ ⎪
⎩
[81y2 − 9y(2 + zα2 / 2) +1] ⎪⎭ ⎥
⎦
−1
⎡ 2⎧
[
⎢ ⎛ y +1 ⎞ ⎪ 81( y +1)( n − y) − 9n − 8 − 3 zα / 2 9( y +1)( n − y)(9n + 5 − zα / 2) + n +1
2
] ⎫3 ⎤
⎪ ⎥
LS = ⎢1+ ⎜ ⎟ ⎨ ⎬ ⎥
⎢⎣
⎝ n − y⎠ ⎪
⎩
[81( y +1)2 − 9( y +1)(2 + zα2 / 2) +1] ⎪⎭ ⎥
⎦
y
dado por p = , em que y representa o número de sucessos do evento sob estudo em uma
n
amostra de tamanho n, geralmente é obtido por processos numéricos iterativos. Estes processos
computação.
Leemis & Trivedi (1996). Este intervalo é em geral de rápido cálculo, vistos que muitos softwares já
seguir:
⎡ ⎤
⎢ 1 1 ⎥
IC1-α: ⎢ ; ⎥
⎢1+ n−y +1 n−y ⎥
1+
⎢⎣ yF2 y;2(n − y + 1);1− α / 2 (y + 1)F2( y + 1);2( n− y );α / 2 ⎥⎦
em que, F refere-se ao valor cuja probabilidade α/2 ou 1-α/2 é da cauda superior direita da
Nos casos especiais em que y=0 e y=n, deve-se proceder da mesma forma
sejam obtidos os percentis 1-α/2 a partir dos percentis α/2, da seguinte forma:
1
Fv1, v 2,1− α / 2 =
Fv 2, v1,α / 2
5.3.2.5. Exemplos
Método LI LS
Método LI LS
e até mesmo quando n é grande (n=100). A aproximação de Pratt é a melhor aproximação dentre
diferencial entre duas populações ou entre dois tratamentos, para alguma variável de interesse.
Estas inferências sobre as médias de duas populações podem ser feitas utilizando os IC para
σ 12 σ 22
da diferença entre médias, é aproximadamente normal, com média µ 1 − µ 2 e variância + .
n1 n2
deve-se utilizar, os estimadores amostrais. Desta forma, como já comentado nos casos anteriores,
diferentes, o teste t é apenas aproximado. As razões deste fato estão fora do propósito deste
IC1-α: X1 − X 2 ± e
DANIEL FURTADO FERREIRA 90
2 2
S1 + S2
onde, e= t α e t α possui ν graus de liberdade, dados por Satterthwaite (1946):
2
n1 n2 2
2
⎡ S12 S22 ⎤
⎢ + ⎥
⎣ n1 n2 ⎦
ν= 2 2
⎛ S12 ⎞ ⎛ S22 ⎞
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ ⎝ n2 ⎠
+
n1 − 1 n2 − 1
quando as variâncias são iguais, como neste tópico, o teste t é exato. Por outro lado, alguém pode
questionar: se as variâncias populacionais são desconhecidas, como se pode afirmar que elas são
iguais ou diferentes? A resposta, para essa pergunta, poderá ser formulada apenas no capítulo
seguinte, em que será apresentado, baseado nos estimadores das variâncias populacionais, um
teste para a hipótese de igualdade das variâncias populacionais. Neste capítulo, a informação de
que as variâncias populacionais são iguais ou diferentes, será fornecida, até que seja apresentado
IC1-α: X1 − X 2 ± e
1 1
em que, e= t SP α + e t α possui n1 + n2 - 2 graus de liberdade. Como as variâncias das
2
n1 n2 2
duas populações são iguais, uma melhor estimador da variância comum é obtida pela média
ponderada das variâncias amostrais, cujos pesos são os graus de liberdade de cada amostra. Esta
variância é definida por SP2 , onde o subscrito “p” refere-se a palavra americana “pooled” que
ESTATÍSTICA 91
Sp =
( n1 − 1) S12 + ( n 2 − 1) S22
n1 + n 2 − 2
NORMAL.
(n − 1) S2
Como foi visto no capítulo IV, segue a distribuição de χ2. Portanto pode-
σ
2
⎡ (n − 1) S2 (n − 1) S2 ⎤
IC1-α: ⎢ ; ⎥
χα/ 2 χ1−α/ 2 ⎦
2 2
⎣
liberdade.
Da mesma forma que para variância, o IC desvio padrão é dado pela regra geral
apresentada a seguir. Observe que se trata da raiz quadrada dos limites do IC para variância.
DANIEL FURTADO FERREIRA 92
⎡ (n − 1) 2 (n − 1) S2 ⎤
IC1-α: ⎢
S ; ⎥
χα/ 2 χ1−α/ 2 ⎥⎦
2 2
⎢⎣
graus de liberdade.
S σ
Seja, k = um estimador do CV populacional K = , na escala de 0 a 1. Como
X µ
se sabe uma estimativa por ponto deste parâmetro é muito importante para se avaliar a
experimental. No entanto, o IC é muito mais informativo para se inferir a respeito deste parâmetro.
distribuição de qui-quadrado com ν=n-1 graus de liberdade, então o IC modificado de McKay para
⎡ ⎤
⎢ ⎥
⎢ k k ⎥
IC1-α/2: ;
⎢ ⎛U + 2 ⎞ U ⎛ U + 2 ⎞ 2 U2 ⎥
⎢ ⎜
1
− 1⎟ k 2 + 1 ⎜ 2 − 1⎟ k + ⎥
⎣ ⎝ ν+1 ⎠ ν ⎝ ν+1 ⎠ ν ⎦
Exemplo: Dada à amostra com 5 tensões mensuradas em plantas: 326, 302, 307, 299, 329. As
estatísticas amostrais são: X = 312,6; S=13,94; k=0,0446. Com α=0,05, determinar o IC para o CV
populacional.
ESTATÍSTICA 93
EXEMPLOS
1. Em uma amostra de 25 plantas de uma variedade braquítica de milho foi encontrada a média de
Como o tamanho da população não foi fornecido, deve-se considerar que a fração da
amostra em relação ao da população é menor que 5%, devendo esta população ser
considerada infinita. Com 95% de confiança tem-se que α=0,05. Para graus de liberdade de
28
e = 2,064 = 2,18 , logo,
25
2. De uma população de tamanho N=40, foi retirada uma amostra de tamanho n=10. A média da
amostra foi de 130,2cm e a variância foi de 69,2888cm2. Faça o IC para a média populacional
Com 90% de confiança tem-se que α=0,10. Para graus de liberdade de n-1=9 o valor de
69,2888 40 − 10
e = 1833
, = 4,23 , logo,
10 40 − 1
estimativas. O erro "e" é conhecido como semi-amplitude do IC. Assim, o pesquisador interessado
prévios, ou seja, com um menor erro e sem alterar o nível de confiança, deve aumentar o tamanho
da amostra (n). A seguir são discutidas formas de dimensionar amostra para estimar os
S
semi-amplitude desse intervalo por: e = tα/ 2 . Assim, se o valor de α e o valor desse erro forem
n
ESTATÍSTICA 95
fixados pode-se estimar a amostra adequada. Portanto, para que o pesquisador possa determinar
o tamanho da amostra ideal é necessário conhecer uma estimativa do desvio padrão populacional
e ter-se uma idéia do erro que se deseja cometer. Para isso, pode-se fazer uma pequena amostra,
denominada amostra piloto, que fornecerá estes valores. Uma regra para se determinar o tamanho
2
⎛ S× tα/ 2 ⎞
n =⎜ ⎟
⎝ e ⎠
Essa fórmula deve ser utilizada iterativamente, pois para se obter o tamanho da
amostra depende-se do quantil tα/2 que por sua vez depende dos graus de liberdade, que são
calcula-se utilizando a fórmula proposta o valor de n. Com esse novo valor de n, obtém-se novo
até que uma dada estimativa de n não difira da imediatamente anterior para uma dada precisão
pré-estipulada.
Com base nas informações obtidas “a priori” na amostra piloto conclui-se qual deve
tamanho da amostra for menor que o da amostra piloto, indica que nenhum elemento deve ser
acrescido à amostra.
dimensionamento de amostras.
DANIEL FURTADO FERREIRA 96
2
⎛ zα 2 ⎞
n =⎜ ⎟ p (1 − p )
⎝ e ⎠
como o anterior. Isso porque o valor de zα/2, quantil superior da distribuição normal, não depende
de graus de liberdade para ser computado. No entanto, depende de uma estimativa de P, a qual
Para contornar o problema de se ter que realizar uma amostra piloto adota-se o
não haja uma dependência de estimativas de P em amostras piloto, obtém-se o nmax. Esse valor de
n garante na pior das hipóteses que o erro cometido no processo de estimação não irá ser maior
do que aquele fixado a priori para o coeficiente de confiança adotado. Isso se verifica pois com o
(1 − p ) .
valor ½ têm-se o máximo do valor de p
2
⎛ zα / 2 ⎞
n =⎜ ⎟
⎝ 2e ⎠
Exemplo: Em uma amostra y=57 em n=150 plantas apresentaram uma determinada doença. Essa
amostra é suficiente para estimar a proporção de plantas doentes com erro de 0,08 e 95% de
confiança?
57
p = = 0,38 = 38% e z0,025=1,96
150
2
⎛ 1,96 ⎞
n =⎜ ⎟ x0,38x 0,62 ≅ 141 plantas
⎝ 0,08 ⎠
ESTATÍSTICA 97
Conclui-se que a amostra de 150 plantas foi suficiente para estimar a proporção de
2
⎛ 1,96 ⎞
n =⎜ ⎟ ≅ 150 plantas
⎝ 2x 0,08 ⎠
Nesse caso verifica-se que, também, nenhuma planta deveria ser incluída na
amostra. Esta última situação é mais conservadora e o pesquisador deve optar entre uma maior
5.5. Referências
LEEMIS, L.M.; TRIVEDI, K.S. A comparison of approximate interval estimators for the
Bernoulli parameter. The American Statistician. V. 50, n.1, p.63-68, February, 1996.
VANGEN, M.G. Confidence interval for a normal coefficient of variation. The American
BLYTH, C.R. Approximate binomial confidence limits. Journal of the American Statistical
PRATT, J.W. A normal approximation for binomial, F, beta, and other common, related tail
1968.
CAPÍTULO V - TEORIA DA DECISÃO
populações, com base nas informações das amostras. Para se tomar decisões é conveniente à
formulação de hipóteses. Essas hipóteses podem ser verdadeiras ou não. A tomada de decisão
será então baseada no teste desta hipótese. Uma decisão errada pode levar a grandes prejuízos,
daí a importância desse capítulo, que tem por objetivo demonstrar os procedimentos para se testar
cometer erros, nas decisões tomadas. Inicialmente, antes de se comentar sobre os erros, será
visto que as hipóteses são de dois tipos básicos, que estão apresentadas a seguir. (i) Hipótese
nula (H0) - aquela que será testada; admite-se que a diferença entre a estimativa e o parâmetro
populacional é devida ao acaso; e (ii) Hipótese alternativa (H1) - qualquer hipótese diferente de H0,
H1: µA>10
(i) Erro tipo I: erro que se comete ao rejeitar uma hipótese verdadeira.
(ii) Erro tipo II: erro que se comete ao aceitar uma hipótese falsa como verdadeira.
ESTATÍSTICA 99
Realidade
Aceitar H0 1-α β
Rejeitar H0 α 1-β
Tabela 6.1. Probabilidades de se cometer os erros tipo I e II, e de se tomar à decisão correta para
os testes de hipóteses.
CARACTERÍSTICAS
da amostra.
(iv) Se H0 for falsa, β será maior quanto mais próximo o valor do parâmetro estiver do valor
Neste capítulo será realizado apenas teste de significância, haja vista que não se
pode controlar diretamente a probabilidade de se cometer o erro tipo II a não ser indiretamente
6.3.1. ALGORITMO
(ii) Usar a teoria estatística e as informações disponíveis para julgar o estimador adequado;
RRH0 RRH0
1−α α
Figura 6.1. Região crítica para um teste unilateral, usando a distribuição de t de student ou a
normal.
(v) Se o valor da estatística pertencer RAH0 não se rejeita H0, caso contrario rejeita-se.
Exemplo. Uma máquina de empacotar café foi regulada para 500g. O fabricante resolveu fazer
S2=400g2. Ele resolveu consultar um estatístico se deveria paralisar a máquina para novo ajuste.
400
(ii) X ∩ t (µ, )
16
(iii) α = 0,01
-2 ,9 4 7 0 2 ,9 4 7
- 2 ,6 0 2 0
B IL A T E R A L U N IL A T E R A L
(mutuamente exclusivos).
492 − 500
(iv) t c = = −1,60
20
4
(v) tc = -1,60 ∈ a RAH0 em ambos os casos (unilateral e bilateral). Portanto, o desvio da média
amostral para a média hipotética proposta em H0 foi devido ao acaso. Então, esta hipótese não
2
S
Sabe-se do capítulo IV, que X ∩ t (µ, ). Desta forma, o algoritmo para o teste
n
de hipótese é:
(i) H0: µ = µo
X − µ o
(ii) t c = S
n
■ Existe uma relação direta entre teste de significância e intervalos de confiança. Com a
■ Para amostras sem reposição em populações finitas (n/N>0,05), o erro padrão da média é:
S N−n
n N−1
X− µ0
tc =
S N−n
n N−1
Exemplo: No caso dos coelhos abatidos aos 90 dias (n=10, X =2,584Kg, S=0,0675Kg), teste a
hipótese de que a média populacional é igual a 2,701Kg, contra a hipótese alternativa que ela é
X − µ o 2,584 − 2,701
(ii) t c = = = −5,481
S 0,0675
n 10
pelo teste t, ou seja, a média do peso ao abate aos 90 dias é inferior a 2,701kg, com 95% de
confiança.
valor (P0) o seguinte algoritmo deverá ser implementado. Este algoritmo pressupõe que a
(i) Formulam-se as hipóteses de nulidade e a alternativa, que pode ser unilateral ou bilateral.
H0: P = Po
(ii) O nível crítico, ou a probabilidade de se cometer o erro tipo I é fixado em geral por α = 5% ou
α = 1%
P − P0
zc =
P (1 − P )
n
Exemplo: Numa amostra de 100 plantas de um campo de produção de sementes, verificou-se que
2% estavam com uma determinada doença. Teste a hipótese que a verdadeira proporção de
doenças do campo é igual a 3,5%, como afirma um técnico de inspeção do campo de produção de
sementes.
H0: P = 0,035
P − P0 0,02 − 0,035
tz = = = −1,07
P (1 − P ) 0,02(1 − 0,02 )
n 100
(v) Como zc ≤ ztab , aceita-se H0 ao nível de 95% de confiança, ou seja, a não existe razão
para duvidar que a média da incidência de doença no campo não seja de 3,5%. A
de uma população com distribuição normal. O teste adequado é o de χ2, cuja distribuição foi vista
no capítulo IV.
(i) Formulam-se as hipóteses de nulidade e alternativa, a qual pode ser unilateral ou bilateral.
H0: σ 2 = σ 20
ou α = 1%
(n − 1) S2
χ 2c =
σ 20
DANIEL FURTADO FERREIRA 106
R A H 0
1− α
R R H
R R H 0 α /2
0
α /2
0
2
χ χ 2
0 1 -α /2 α /2
Figura 6.3. Regiões críticas (RRH0) para o teste bilateral, da hipótese apresentada em (i).
R A H 0
1 - α
R R H 0
α
0
2
0 χ
α
Figura 6.4. Região crítica (RRH0) para o teste unilateral, da hipótese apresentada em (i).
ESTATÍSTICA 107
R A H 0
1 -α
R R H 0
α
0 2
χ 1 -α
0
Figura 6.5. Região crítica (RRH0) para o teste unilateral, da hipótese apresentada em (i).
médias populacionais distintas. Este teste tem grande aplicabilidade nas ciências agrárias, que é o
principal interesse deste material. Muitas vezes deseja-se comparar dois tratamentos distintos,
duas variedades de qualquer espécie quanto à produtividade, duas rações na dieta de animais,
entre diversos outros exemplos. A seguir é apresentada a situação em que normalmente estas
comparações podem ser realizadas do ponto de vista prático. As situações mais teóricas fogem do
Duas médias populacionais distintas podem ser comparadas por este método,
desde que a amostragem, ou até mesmo a experimentação, seja realizada de forma independente
para cada uma delas. Alguém, no entanto, pode questionar o fato de que se as variâncias
DANIEL FURTADO FERREIRA 108
populacionais são desconhecidas, fato bastante comum na prática, então, como saber se elas são
diferentes, para enquadrar o teste nesta opção. Para responder esta pergunta, antes de apresentar
o algoritmo para o teste da hipótese de igualdade entre as duas médias populacionais, será
Inicialmente deve ser lembrado neste ponto que a estatística definida por:
2
S1
σ
2
F= 2
1
segue a distribuição F de Snedecor. É usada para testar a igualdade entre duas
S2
σ
2
2
variâncias. As tabelas de F, são consultadas de acordo com os graus de liberdade n1-1 associados
2
S1
Fc = 2
. Desta forma Fc segue a distribuição de F, e um valor observado, muito alto, ou seja, um
S2
valor que deixe menos de 5% ou menos de 1% dos valores de F acima do mesmo deve ser
considerado significativo. Desta forma, este valor indica que é mais fácil acreditar que a hipótese,
não seja verdadeira, do que este grande valor tenha ocorrido ao acaso. O algoritmo para realizar o
H 0: σ 1 = σ 2
2 2
H 1: σ 1 ≠ σ 2
2 2
(ii) Fixa-se o valor crítico, ou a probabilidade de se cometer o erro tipo I, que em geral é:
ESTATÍSTICA 109
α = 5% ou α = 1%
As variâncias amostrais são denominadas de tal forma que S12 ≥ S22 . Desta forma Fc será sempre
maior ou igual a 1.
usado. Para o caso de se aceitar a hipótese em questão o procedimento adequado a ser adotado
(i) Formulam-se as hipóteses de nulidade e alternativa, as quais podem ser unilaterais ou bilaterais
H0: µ1-µ2 = 0
(ii) Fixa-se o nível crítico, ou a probabilidade de se cometer o erro tipo I, que em geral é:
α = 5% ou α = 1%
DANIEL FURTADO FERREIRA 110
X1 − X 2
tc = 2 2
S1 S2
+
n1 n2
onde, tα/2 (teste bilateral) ou tα (teste unilateral) possui ν graus de liberdade dados por:
2
⎛ S12 S22 ⎞
⎜ + ⎟
n n2 ⎠
ν = ⎝ 12 2
⎛ S12 ⎞ ⎛ S22 ⎞
⎜ ⎟ ⎜ ⎟
⎝ n1 ⎠ + ⎝ n 2 ⎠
n1 − 1 n 2 − 1
Convém salientar que este teste, quando as variâncias populacionais são distintas,
é apenas aproximado. Estudos de simulação feitos por Borges & Ferreira (1996) demonstra que
este teste mantém satisfatoriamente a probabilidade de se cometer o erro tipo I, mesmo, para
baixos tamanhos amostrais, mas o erro tipo II fica comprometido à medida que magnitude da
Como no caso do item A.2, o teste para hipótese de igualdade entre duas médias
populacionais quando as variâncias são iguais, segue praticamente todos os passos. O primeiro
passo é verificar se realmente as variâncias populacionais são iguais, conforme descrito no item
A.1. O segundo passo consiste em implementar o seguinte algoritmo, lembrando que o teste, sob a
bilaterais:
H0: µ1-µ2 = 0
(ii) Se fixa o nível crítico, ou a probabilidade de se cometer o erro tipo I, que em geral é:
α = 5% ou α = 1%
X1 − X 2
tc =
1 1
Sp +
n1 n2
em que, tα/2 (teste bilateral) ou tα (teste unilateral) possui ν=n1+n2-2 graus de liberdade.
variância comum é obtido por uma variância média ponderada pelos graus de liberdade de cada
amostra. Esta variância é definida por SP2 , onde o subscrito “p” refere-se a palavra americana
desvio padrão combinado que é a raiz quadrada da variância, o qual é apresentado a seguir:
( n1 − 1) S12 + ( n 2 − 1) S22
SP =
n1 + n 2 − 2
DANIEL FURTADO FERREIRA 112
Quando os dados são relacionados dois a dois, eles são denominados pareados.
É comum na experimentação, tomar-se dados de uma amostra de uma população antes e após a
Exemplo: os dados de peso de bezerros foram medidos antes e depois da aplicação de uma
n=5 bezerros.
Bezerros 1 2 3 4 5
Diferença 20 10 22 34 2
(Di)
Tabela 6.2. Peso de cinco bezerros antes (Xi) e após (Yi) o tratamento de uma ração nova por um
mês, além da diferença (Di) entre o peso após e antes do tratamento (ganho de peso do período).
Neste exemplo fica claro que os dados são pareados, pois são mensurados cinco
bezerros antes e após a dieta com uma ração específica. Antes de prosseguir, é necessário, que
se calcule algumas estatísticas básicas, desta variável aleatória Di. Estas estatísticas são a média
e o desvio padrão.
n
∑ Di
Média: D= i=1
n
ESTATÍSTICA 113
⎡ ⎛⎜ n ⎞⎟ ⎤
2
∑ D
1 ⎢ n 2 ⎝ i= 1 i ⎠ ⎥
Desvio Padrão: SD = ⎢ ∑ Di − ⎥
n − 1 ⎢ i= n ⎥
⎢⎣ ⎥⎦
testar, não possui efeito significativo, então se espera que não haja diferença entre as medidas
antes e após o tratamento ser aplicado. Desta forma, a diferença média real livre dos efeitos de
meio deve ser testada para hipótese de que ela é realmente igual a zero. Esta hipótese seguida
H0: µD = D0
H1: µD ≠ D0 Bilateral; ou
(ii) Se fixa o nível crítico, ou a probabilidade de se cometer o erro tipo I, que em geral é α = 5% ou
α = 1%.
D − D0
tc =
SD
n
H0: µD = 0
que significa que está se testando a ausência de efeito da ração para promover o
ganho de peso, contra a alternativa que esta possui um efeito positivo no ganho de peso. O valor
de tc, utilizando as expressões anteriormente apresentadas, foi de 3,226. O valor de ttabelado (t0,05) foi
2,132 com n-1=4 GL. Então, como |tc| > |ttab| rejeita-se H0, existe efeito positivo da ração no ganho
freqüências relativas esperadas. Estes modelos teóricos muitas vezes podem ser aplicados a
dados experimentais observados em um dado fenômeno. Neste caso, cada valor da variável
aleatória (classe) possui uma freqüência observada em uma amostra de tamanho n. De acordo
com as características deste fenômeno, pode-se elaborar um modelo teórico para ajustá-lo. Com
base neste modelo podem-se obter as freqüências relativas esperadas nesta amostra de tamanho
ajustamento. Porém, uma avaliação, visual além de muito pobre, pode não conseguir distinguir
entre afastamentos entre as freqüências esperadas e observadas que são devidos ao acaso e os
natureza, o teste de χ2 é recomendado. A seguir será apresentado, como proceder para se avaliar
aderência).
(i) Primeiro passo é determinar qual o modelo teórico deve ser usado: Isto normalmente não é
trivial, mesmo para pesquisadores experientes. Este primeiro passo é o mais importante, pois
uma escolha errada de um modelo levará a um ajustamento muito pobre ou na maioria dos
(ii) Calcular de acordo com o modelo proposto as freqüências esperadas (FE) para cada classe da
variável aleatória;
(iii) Comparar as freqüências esperadas com as freqüências observadas (Fo) através do seguinte
teste:
2
⎛ ⎞
⎜ Fo i − FE i ⎟
K ⎝ ⎠
χ 2c = ∑
i= 1 FE i
(iv) A hipótese que se testa é H0: o modelo teórico se ajusta à distribuição observada. O valor de
qui-quadrado calculado em (iii) deve ser comparado com o valor crítico da distribuição de
DANIEL FURTADO FERREIRA 116
se χ α < χ c.
2 2
K −1 GL
Exemplo: Verificar se os dados abaixo estão de acordo com a 2a lei de Mendel, ou seja, lei da
segregação independente de genes. Na Tabela 6.2, estão apresentados o fenótipo de dois genes,
um que controla, a altura das plantas, as quais podem ser alta ou anã, e o outro que controla o tipo
de folha, que podem ser normal ou tipo batata. Se os genes forem independentes, ou seja, se
segregação fenotípica na geração F2 de um certo cruzamento: 9 plantas altas com folha normal : 3
plantas altas com folha batata : 3 plantas anãs com folha normal : 1 planta anã com folha batata
(9:3:3:1).
Tabela 6.3. Segregação fenotípica observada e esperada para geração F2 de um cruzamento entre
uma linhagem alta de folha normal com outra anã de folha batata. A freqüência esperada foi
baseada no modelo de segregação independente dos genes que controlam a altura de planta e o
tipo de folha (2a lei de Mendel), na proporção de 9:3:3:1.
(ii) calculam-se as freqüências esperadas tomando-se por base a hipótese H0: As freqüências
(v) conclusão:
seja os genes para controle da altura de planta e do tipo de folha, são independentes.
$SrQGLFH
FHVV
7DEHOD $ 3UREDELOLGDGHV D GD GLVWULEXLomR QRUPDO SDGUmR 1 SDUD YDORUHV GR TXDQWLO =W
SDGURQL]DGRGHDFRUGRFRPRVHJXLQWHHYHQWR3==W D
=W
=
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
Q
7DEHOD $ 4XDQWLV VXSHULRUHV GD GLVWULEXLomR W GH 6WXGHQW WD FRP Q JUDXV GH OLEHUGDGH H SDUD
GLIHUHQWHV YDORUHV GD SUREDELOLGDGH D GH DFRUGR FRP R VHJXLQWH HYHQWR
3W ! W D D