Você está na página 1de 140

MINISTRIO DA EDUCAO E DO DESPORTO

ESTATSTICA
BSICA
Prof. DANIEL FURTADO FERREIRA

LAVRAS - MG
1996

NDICE

Pag.
I. Contedo programtico
II. Bibliografia bsica

v
vii

1. Estatstica Descritiva

1.1. Importncia nas cincias agrrias

1.2. Coleta, organizao e apresentao de dados

1.3. Medidas de posio e disperso

12

1.3.1. Medidas de posio ou de tendncia central

12

1.3.2. Medidas de disperso

21

1.3.3. Medidas de assimetria e curtose

27

1.4. Exerccios

31

2. Distribuio de probabilidade

38

2.1. Conceito e importncia

38

2.2. Variveis aleatrias e distribuio de probabilidades

39

2.3. Distribuio de probabilidades discretas e


contnuas

40

A. Distribuio Binomial

41

B. Distribuio de Poisson

42

C. Distribuio uniforme discreta

45

D. Distribuio normal

45

E. Aproximao normal da Binomial e Poisson

49

ii

Pag.
2.4. Esperana matemtica e suas leis

49

2.5. Tabelas de F, 2 , t e Normal

51

3. Amostragem

49

3.1. Importncia nas cincias agrrias


3.2. Amostra e populao

49
49

3.3. Amostragem probabilstica e


no probabilstica.

50

3.3.1. Amostragem probabilstica

50

3.3.2. Amostragem no probabilstica

53

4. Distribuio de amostragem

54

4.1. Importncia nas cincias agrrias

54

4.2. Distribuio amostral das mdias

56

4.2.1. Distribuio de X

56

4.2.2. Distribuio de X 1 X 2
4.3. Distribuio de t, 2 e F
A. Distribuio de t de Student

60
62
62

B. Distribuio de 2 (Qui-Quadrado)

64

C. Distribuio de F de Snedecor

65

4.4. Distribuio amostral das propores (p)


5. Teoria da estimao

66
69

iii

Pag.
5.1. Importncia nas cincias agrrias

69

5.2. Estimao por ponto e por intervalo e


propriedades dos estimadores
5.3. Estimao de mdias, varincias e propores

69
71

5.3.1. Intervalo de confiana para

71

5.3.2. Intervalo de confiana para P

73

5.3.3. Intervalo de confiana para diferena entre


mdias

77

5.3.4. Intervalo de confiana para 2

79

5.3.5. Intervalo de confiana para

80

5.3.6. Intervalo de confiana para CV

80

5.4. Dimensionamento das amostras

82

6. Teoria da deciso
6.1. Importncia nas cincias agrrias

86
86

6.2. Hiptese estatstica. Erros envolvidos no processo


de deciso
6.3. Construo de uma regra de deciso

86
88

6.3.1. Algoritmo

88

6.3.2. Teste para com varincia desconhecida

90

6.3.3. Teste para propores

91

6.3.4. Teste para varincia populacional

93

6.3.5. Comparaes entre duas mdias populacionais

95

iv

A. Varincias populacionais desconhecidas e diferentes (12 22 )

95

B. Varincias populacionais desconhecidas e iguais (12 = 22 )

98

C. Dados emparelhados
6.4. Teste de 2 para ajuste de modelos
7. Regresso e Correlao

99
102
106

MEC/UFLA/DEX
CEX-117 - ESTATSTICA

CARGA HORRIA: 45 TERICA e 30 PRTICA CRDITOS: 4

CONTEDO PROGRAMTICO

I- ESTATSTICA DESCRITIVA

1. IMPORTNCIA NAS CINCIAS AGRARIAS


2. COLETA, ORGANIZAO E APRESENTAO DE DADOS
3. MEDIDAS DE POSIO E DISPERSO
4. TPICOS EM ESTATSTICA DESCRITIVA

II- DISTRIBUIO DE PROBABILIDADE

1. CONCEITO E IMPORTNCIA DE PROBABILIDADE


2. VARIVEL ALEATRIA E DISTRIBUIO DE PROBABILIDADE
3. DISTRIBUIO DE PROBABILIDADES DISCRETAS E CONTNUAS: BINOMIAL,
POISSON, UNIFORME DISCRETA E NORMAL. APROXIMAO NORMAL.
4. ESPERANA MATEMTICA E SUAS LEIS.
5. TPICOS EM DISTRIBUIO DE PROBABILIDADES.

vi
III- AMOSTRAGEM

1. IMPORTNCIA NAS CINCIAS AGRARIAS


2. AMOSTRA

POPULAO.

AMOSTRAGEM

PROBABILSTICA E NO

PROBABILSTICA.
3. AMOSTRAGEM SIMPLES AO ACASO, ESTRATIFICADA, POR CONGLOMERADO E
SISTEMTICA.
4. TPICOS EM AMOSTRAGEM.

IV- DISTRIBUIO DE AMOSTRAGEM

1. IMPORTNCIA DO ESTUDO EM CINCIAS AGRARIAS.


2. DISTRIBUIO DE AMOSTRAGEM DE MEDIAS
3. DISTRIBUIO DE t,

2 E F.

4. DISTRIBUIO DE AMOSTRAGEM DE PROPORES.


5. TPICOS DE DISTRIBUIO DE AMOSTRAGEM.

V- TEORIA DA ESTIMAO

1 . IMPORTNCIA NAS CINCIAS AGRARIAS


2. ESTIMATIVAS POR PONTO E

POR

INTERVALO.

PROPRIEDADES

ESTIMADORES.
3. ESTIMATIVAS DE MEDIAS, VARINCIAS E PROPORES.
4. ERROS DAS ESTIMATIVAS E DIMENSIONAMENTO DAS AMOSTRAS.
5. TPICOS EM TEORIA DA ESTIMAO.

DOS

vii
VI- TEORIA DA DECISO

1. IMPORTNCIA NAS CINCIAS AGRRIAS


2. HIPTESE ESTATSTICA. ERROS ENVOLVIDOS NUM PROCESSO DE DECISO.
3. CONSTRUO DE UMA REGRA DE DECISO E MECNICA OPERACIONAL DE
APLICAO DOS TESTES.
4. TESTES DE INDEPENDNCIA, ADERNCIA E COMPROVAES DE LEIS.
5. TPICOS EM TEORIA DA DECISO.

VII- REGRESSO E CORRELAO

BIBLIOGRAFIA

AQUINO, L.H. de Estatstica. Lavras, MG, 1981. Vol. 3 (mimeografado).


BUSSAB, W.O. & MORETTIN, P.A. Estatstica bsica. 4a ed., Atual Editora, S.P., 1993.
STEVENSON, W.J. Estatstica aplicada administrao. Traduo de Alfredo Alves de Farias.
Harbra, S.P., 1981.
FONSECA, J.S. & MARTINS, G. de A. Curso de estatstica, 4a ed., Editora Atlas, S.P., 1993.
GUERRA, M.J. & DONAIRE, D. Estatstica indutiva: Teoria e aplicaes. Livraria Cincia e
Tecnologia Editora, S.P., 1984.
MEYER, P.L. Probabilidade, aplicaes a estatstica. Traduo de Ruy C. B. Loureno Filho,
(ENCE/IBGE), Rio de Janeiro, R.J., 1984.
SNEDECOR, G.W. & COCHRAN, W.G. Statistical methods, 7th edition. The Iowa State University
Press, Ames, Iowa, USA, 1980.

DANIEL FURTADO FERREIRA

CAPTULO I - ESTATSTICA DESCRITIVA

1.1. IMPORTNCIA NAS CINCIAS AGRRIAS

estatstica um ramo da matemtica que se interessa em obter concluses a partir


de dados observados e nos mtodos cientficos para coleta, organizao, resumo,
apresentao, anlise e interpretao dos dados amostrais. Iniciou-se como mtodo
cientifico a partir de 1925 com os trabalhos de R.A. Fisher, embora os trabalhos

pioneiros de Gauss no fim do sculo anterior e dos trabalhos de Gosset de 1908, publicados
com o pseudnimo de "Student", foram de extrema importncia.
A estatstica se divide em estatstica descritiva e indutiva (ou inferncia). A estatstica
descritiva preocupa-se com a coleta, organizao e apresentao dos dados amostrais, sem
inferir sobre a populao; e a estatstica indutiva preocupa-se com a anlise e interpretao dos
dados amostrais. Concluses importantes podem ser inferidas da anlise dos dados amostrais.
No entanto, a inferncia no pode ser "absolutamente certa", da a necessidade de se utilizar
uma linguagem de probabilidade.
Na maioria das situaes agrcolas as leis de causa e efeito no so conhecidas na
prtica pelo pesquisador, no entanto, existe a necessidade de se obter uma soluo para os
problemas que surgem naturalmente. Foi com o objetivo de se apresentar tais solues que a
estatstica se desenvolveu, face s incertezas oriundas da variabilidade dos dados provenientes
das observaes dos pesquisadores.
Finalmente necessrio ter em mente que a estatstica um mtodo cientfico, por meio
do qual o pesquisador pode tomar decises para solucionar os problemas que so encontrados
durante suas pesquisas. Para que a estatstica seja bem usada necessrio conhecer os seus
fundamentos e os seus princpios, e que acima de tudo que o pesquisador tenha a possibilidade
de desenvolver um esprito critico sobre a pesquisa empreendida.

ESTATSTICA BSICA

1.2. COLETA, ORGANIZAO E APRESENTAO DE DADOS.

As observaes se constituem no material bsico com que o pesquisador trabalha. Para


que a estatstica possa ser aplicada a essas observaes, elas devem estar na forma de
nmeros. Para exemplificar, pode-se destacar, por exemplo, que no melhoramento de plantas
esses nmeros podem ser produtividade de uma parcela de milho ou de feijo, na zootecnia
podem ser ganhos de peso por animal sob o efeito de alguma dieta especial, rao com produto
ou dosagem de componente diferente, entre outras possibilidades.
Estes nmeros so os dados e a caracterstica comum inerente aos mesmos a
variabilidade ou variao que apresentam. Essa caracterstica, que pode assumir diferentes
valores de indivduo para indivduo, chamada de varivel. Quando todos os elementos de uma
populao ou de uma amostra apresentam o mesmo valor para uma determinada caracterstica,
essa caracterstica denominada de constante.
As variveis podem ser qualitativas ou quantitativas. As variveis qualitativas so
aquelas para as quais uma medio numrica no possvel; e as quantitativas aquelas que
podem ser mensuradas numa escala de valores. As variveis qualitativas podem ser ordinais ou
nominais. As variveis quantitativas dividem em discretas e contnuas. As discretas so definidas
em um conjunto enumervel, sendo prprias de dados de contagem. As contnuas por sua vez,
podem assumir qualquer valor real entre dois extremos.
As variveis so mensuradas em uma amostra, e as suas realizaes (ou observaes)
podem ser dispostas da seguinte forma:

DADOS BRUTOS: Dados originais na forma com que foram coletados (no foram
numericamente organizados ou ordenados).
Ex. Peso de 10 coelhos hbridos NORFOLK em kg abatidos aos 90 dias.
2,61 2,56 2,47 2,62 2,59
2,56 2,62 2,70 2,49 2,62

DANIEL FURTADO FERREIRA

De uma forma geral:


X1, X2, ..., Xn.

DADOS ELABORADOS: Dados numricos arranjados em ordem crescente ou decrescente.


2,47 2,49 2,56 2,56 2,59
2,61 2,62 2,62 2,62 2,70

De uma forma geral:

X(1), X(2), ..., X(n).

Com os dados elaborados pode-se estimar a amplitude total (A), ou seja, a diferena
entre o maior e menor valor da amostra.

A = X(n) X(1) = MAIOR VALOR - MENOR VALOR

A forma de representar os dados depende da sua natureza. Para dados qualitativos a


enumerao e tabulao e a forma mais simples de represent-los. A seguir ser discutido um
exemplo, no qual se destaca a forma de representao dos dados qualitativos mais comuns.

Exemplo: Num determinado estudo de cor de flor, as cores branca e roxa foram observadas. Na
prognie F2 constituda de 100 indivduos foi anotada a cor de flor:

ESTATSTICA BSICA

Tabela 1.1. Representao tabular para representar a herana de cor de flor em uma prognie
F 2.
Cor da flor

BRANCA

ROXA

15

85

Nmero de indivduos

Representao grfica:

90
75

Branca
Roxa

60
45
30
15
0
Branca

Roxa

Figura 1.1. Grfico de colunas para representar a herana de cor de flor em uma prognie F2

15%

Roxa
Branca

85%

Figura 1.2. Grfico de setores para representar a herana de cor de flor em uma prognie F2.

Para os dados quantitativos a forma de representao mais simples a distribuio de


freqncia. A distribuio de freqncia a distribuio dos dados em classes ou categorias,
onde o nmero de elementos pertencentes a cada classe determinado e representa a
freqncia de classe.

DANIEL FURTADO FERREIRA

A seguir ser abordada uma das formas mais comuns de se construir uma tabela de
distribuio de freqncia. A seqncia de passos :

(a) Determinar o nmero de classes (k): geralmente o nmero de classes escolhido por muitos
autores em um valor entre 5 e 20, de uma forma emprica. A familiaridade do pesquisador
com os dados que deve indicar quantas classes devem ser construdas. No entanto, esse
critrio pode variar consideravelmente de pesquisador para pesquisador, por isso 2 critrios
so propostos a seguir.

(i) Critrio baseado no tamanho amostral (n) proposto por Oliveira (1995).

Em funo do tamanho da amostra pode-se determinar o nmero de classes


ideal, de acordo com os critrios apresentados na Tabela 1.2.

Tabela 1.2. Nmero de classes (k) determinado em funo do tamanho amostral (n) (OLIVEIRA,
1994)
Tamanho da amostra (n)

Nmero de classes (k)

At 100

n (inteiro mais prximo)

Acima de 100

5 log10 n (inteiro mais prximo)

(ii) Critrio baseado na distribuio normal dos dados da amostra proposto por SCOTT (1979).

Partindo-se do pressuposto que os dados seguem a distribuio normal, a qual


possui forma de sino, o nmero de classes determinado por:

An 3
k = 1+
3, 49S

ESTATSTICA BSICA

Em que: A a amplitude total, n o tamanho da amostra e S o desvio padro (cuja estimao


apresentada no Captulo 2). No exemplo dos coelhos, usando o primeiro critrio tem-se:
k = n0,5 = 100,5 = 3,16 3 classes.

(b) Amplitude de classe (c)

A amplitude de classe a diferena entre os limites superior e inferior de uma


determinada classe. Na construo da distribuio de freqncia no possvel saber quais so
os limites de classe a priori e, portanto, deve-se ter uma maneira diferente para determinar c.
Neste material adotado o seguinte critrio.

c=

A
k 1

Para o exemplo: c = 0,230/2 = 0,115kg

(c) Limite inferior da primeira classe (LI1a)

Deve-se iniciar o processo de construo das classes determinando o limite


inferior da primeira classe a ser formada. A escolha deste valor feita por muitos autores, como
menor valor amostral. No presente material, adota-se o critrio a seguir. A idia por detrs desse
critrio determinar o limite inferior da primeira classe como um valor menor do que o menor
valor observado na amostra, uma vez que por um mero acaso valores da populao inferiores a
X(1) podem no ter sido amostrados.

LI1a = X(1) - c/2

No exemplo dos coelhos tem-se: LI1a = 2,47 - 0,115/2 = 2,413.

DANIEL FURTADO FERREIRA

A forma de representao de uma classe adotada dada por 2,413 2,528, ou seja, a
classe tem seu limite inferior de 2,413Kg includo na classe e o seu limite superior de 2,528Kg
excludo. Outra notao pode ser usada, qual seja [2,413; 2,528). O significado o mesmo do
descrito anteriormente.

(d) Determinao das classes

Para a determinao das k classes necessrio seguir os seguintes passos:

(i) Somar ao valor do limite inferior da primeira classe a amplitude de classe e obter-se o limite
superior;

(ii) O limite superior da primeira classe ser o limite inferior da segunda classe;

(iii) Repetem-se os passos (i) e (ii) at completar k classes, ou equivalentemente at que o maior
valor esteja contido na ltima classe.

No exemplo dos coelhos hbridos Norfolk, a Tabela 1.3. apresenta a distribuio de


freqncias obtida.

Tabela 1.3. Distribuio de freqncia para o peso dos coelhos hbridos Norfolk abatidos aos 90
dias.
Classes (Kg)

Xi

Fi

Fri

Fpi

2,413 2,528

2,471

0,20

20

2,528 2,643

2,586

0,70

70

2,643 2,758

2,701

0,10

10

10

1,00

100

Total

ESTATSTICA BSICA

Uma outra possibilidade utilizada fazer a tabela das distribuies de freqncias


acumuladas: Freqncia acumulada abaixo de (Fc) e acima de (Fc), Tabela 1.4 e 1.5.

Tabela 1.4. Distribuio de freqncia acumulada abaixo de para o peso dos coelhos hbridos
Norfolk abatidos aos 90 dias.
Abaixo de

Fc

2,413

2,528

2,643

2,758

10

Tabela 1.5. Distribuio de freqncia acumulada acima de para o peso dos coelhos hbridos
Norfolk abatidos aos 90 dias.
Acima de

Fc

2,413

10

2,528

2,643

2,758

Para fins de anlises matemticas todas as observaes contidas num intervalo


de classe so consideradas iguais ao ponto mdio da classe. Essa hiptese conhecida como
hiptese tabular bsica (HTB). Os clculos das medidas de posio ou de disperso amostral
usando os pontos mdios das classes como representantes de todos os seus elementos contm
menor preciso do que queles realizados utilizando os dados brutos ou elaborados. No entanto,
estes erros, como j constatado por muitos pesquisadores em estatstica, podem ser
considerados desprezveis e, portanto, devem ser ignorados. A vantagem de se utilizar a
distribuio de freqncia refere-se simplificao estrutural dos dados sem grandes perdas de

DANIEL FURTADO FERREIRA

preciso, bem como a aumento da facilidade de clculos devido a estas simplificaes, alm de
fornecer uma idia da forma da distribuio da varivel por meio da representao grfica.

REPRESENTAO GRFICA

(a) Histogramas: Retngulos cujas bases so proporcionais s amplitudes de classes e as


reas proporcionais s freqncias das classes. Se todas as classes tiverem a mesma
amplitude, as alturas dos retngulos so proporcionais s freqncias das classes, e em caso
contrrio tm que ser ajustadas por:

Fi( aj .) =

Fi
ci

(b) Polgono de freqncia: Grfico de linhas que une os pontos mdios das classes no topo
dos retngulos.

H istog ram a
Polig ono de freq uncia

Frequncia

0
2.300

2.415

2.530

2.645

2.760

C lasses de peso

Figura 1.3. Polgono de freqncia e histograma da distribuio dos pesos de coelhos hbridos
norfolk, abatidos aos 90 dias.

10

ESTATSTICA BSICA

Os grficos das freqncias acumuladas so denominados ogivas e esto apresentados


na Figura 1.4.

Frequncia acumulada
acima de

10

Frequncia acumulada
abaixo de

Frequncias
acumuladas
2

OGIVAS
0
2.298

2.413

2.528

2.643

2.758

2.873

Peso dos coelhos

Figura 1.4. Representao grfica das distribuies acumuladas (ogivas) do peso de coelhos
hbridos Norfolk abatidos aos 90 dias.

Tipos de curvas de freqncias

Com base no polgono de freqncia pode-se classificar o tipo de distribuio


dos dados amostrais ou experimentais. Esta classificao de suma importncia, pois grande
parte das anlises que so abordadas posteriormente neste material depende da natureza desta
distribuio, sendo que a maioria requer distribuio do tipo simtrica ou aproximadamente
simtrica.

DANIEL FURTADO FERREIRA

ASS. DIREITA

SIMTRICA

BIMODAL

ASS. ESQUERDA

MULTIMODAL

11

ESTATSTICA BSICA

12

1.3. Medidas de posio e disperso.


1.3.1. Medidas de posio ou de tendncia central

Uma medida de tendncia central procura sintetizar as informaes da amostra em um


nico e informativo valor. Ao examinar uma distribuio amostral simtrica ou aproximadamente
simtrica, nota-se que geralmente que os dados so mais freqentes perto de um valor central e
so mais raros ao afastar-se deste. A obteno deste valor central de importncia fundamental
tanto para a pesquisa quanto para a extenso. Pode-se exemplificar atravs de uma situao em
que em uma grande firma produtora de milho, o empregador exige do agrnomo que este lhe
fornea uma estimativa da produtividade da rea de 10.000 ha plantados em uma regio. O
empregador tomar uma grande deciso com base nesta estimativa. Utilizando mtodos de
amostragem apropriados e uma medida de posio e de seu erro, o agrnomo pode fornecer as
informaes solicitadas com grande probabilidade de acerto. Este um problema que pode ser
solucionado com o auxlio e conhecimento das tcnicas estatsticas. As principais medidas de
posio esto apresentadas a seguir.

(a) Mdia aritmtica

A mdia a principal medida de posio, sendo utilizada principalmente quando


os dados apresentam distribuio simtrica ou aproximadamente simtrica, como acontece com
a maioria das situaes prticas. Deve-se diferenciar, por meio de notao apropriada mdia
populacional da amostral. A populao refere-se a todos os elementos de interesse do
pesquisador para a qual fica praticamente impossvel tomar as informaes elemento a
elemento. A amostra por sua vez refere-se a um subconjunto de elementos desta populao e
obtida de acordo com alguns critrios, de tal forma que haja uma representatividade da
populao da qual foi extrada, e para qual se deseja extrapolar as informaes (inferncias
estatsticas). No exemplo anterior da plantao de milho, a populao refere-se a todos os

DANIEL FURTADO FERREIRA

13

10.000ha plantados e uma amostra poderia ser de 20ha distribudos ao acaso pela regio
plantada. Ser utilizada para diferenciar a mdia da amostra e da populao a seguinte notao:

PARA POPULA O

Simbologia:
X PARA AMOSTRA

em que, o estimador da mdia populacional :

X=

Xi
i =1

X1 + X 2 +...+ Xn
n

em que, n o tamanho da amostra,


Para o exemplo dos coelhos (dados elaborados), tem-se que:

X=

2,47 + 2,49+"+2,70
= 2,584 kg
10

Para os dados agrupados em distribuio de freqncia o estimador :

X=

X F

i i

i =1

em que, X i o ponto mdio e Fi a freqncia da classe i.

Para o exemplo dos coelhos em questo:

ESTATSTICA BSICA

X=

14

2,471 2 + 2,586 7 + 2,701 1


= 2,5745kg
10

Algum pode questionar a razo da diferena observada no uso dos dois


estimadores. A resposta dada pela hiptese tabular bsica, a qual considera que todos os
elementos de uma classe so representados pelo seu ponto mdio, fato este, que no
verdadeiro em praticamente todas as situaes. Desta forma, este ltimo resultado apenas
aproximado. No entanto, o erro cometido mnimo e, portanto, pode ser desprezado.

Propriedades da mdia

(i) A soma algbrica dos desvios em relao mdia aritmtica nula.

( Xi X) = 0
n

i=1

(ii) A soma dos quadrados dos desvios de um conjunto de dados em relao a sua mdia e um
valor mnimo.

D = ( X i X ) representa um valor mnimo.


n

i=1

Demonstrao:

Fazendo:

D = ( Xi A)
n

i=1

Expandindo o somatrio e derivando D em relao a A tem-se:

15

DANIEL FURTADO FERREIRA

D = ( X i A ) = ( X i2 2AX i + A 2 ) = X 2i 2AX i + A 2
n

i=1

i=1

i=1

i=1

i=1

n
D
= 2 X i + 2nA
i=1
A

Igualando a derivada a zero, e resolvendo em A, tem-se:


n
D
= 2 X i + 2nA = 0
i=1
A
n

2 nA = 2 X i
i=1

A=

Xi
i=1

=X

Portanto, o ponto timo obtido igualando a primeira derivada a zero, pode ser um
ponto de mximo ou de mnimo. Para certificar que o valor de D, quando A igual mdia
amostral, um valor mnimo basta mostrar que a segunda derivada positiva. A segunda
derivada de D em relao a A dada por:

D
= 2n > 0
AA

Verifica-se que para qualquer tamanho de amostra o valor 2n ser positivo,


ficando concludo assim a demonstrao.

(iii) A mdia de um conjunto de dados acrescido (ou subtrado) em cada elemento por uma
constante e igual mdia original mais (ou menos) essa constante.

X '= X K

em que X ' a mdia do novo conjunto de dados.

16

ESTATSTICA BSICA

(iv) Multiplicando todos os dados por uma constante a nova mdia ser igual ao produto da
mdia anterior pela constante.

X =K X

(v) A mdia influenciada por valores extremos


(vi) No pode ser mensurada em distribuies com classes indeterminadas.

Exemplo,
Classes

Fi

5 10

10

10 20

20

20 50

45.

50 ou mais

20

(b) Mediana (md )

A mediana divide as observaes ordenadas em partes iguais. Para sua determinao


necessrio o conhecimento da posio central. Basicamente tm-se duas situaes distintas:

X ( n / 2 ) + X ( (n + 2) / 2)

(i) Se n for par:

md =

(ii) Se n for impar:

m d = X ( (n +1) / 2)

Exemplo 1. No caso dos coelhos a posio central esta entre o 50 e o 60 elemento. Portanto, a
mediana a mdia aritmtica destas duas observaes.

DANIEL FURTADO FERREIRA

17

md = (2,59 + 2,61)/2 = 2,60Kg

Exemplo 2. A = {1, 2, 3}. n=3

md = X(2) = 2

No caso de dados agrupados a mediana pode ser calculada de acordo com a seguinte
expresso:

n
2 FA
m d = LI md +
c
Fmd md

Em que, Fmd: freqncia da classe mediana; cmd: amplitude da classe mediana; FA: freqncia
acumulada das classes anteriores classe mediana; e Limd o limite inferior da classe mediana.
A classe mediana a classe que contm a posio n/2 (posio mediana) da
distribuio de freqncia.

No exemplo: Posio mediana = 10/2 = 5 (contida na 2a classe), FA= 2; Limd = 2,528 Fmd
= 7 e cmd = 0,115kg.

md = 2,528 + [(5-2)/7] x 0,115 = 2,577 kg

Propriedades

(i) md ' = md K (somando constante aos dados)

(ii) md ' = md .K (multiplicando os dados por uma constante)

ESTATSTICA BSICA

(iii)

iXi-md representa um

18

valor mnimo

Muitas vezes existem dvidas de qual medida utilizar para sintetizar os dados
amostrais. Como uma regra geral, pode-se definir qual medida mais conveniente para uma
dada situao com base na anlise do histograma ou do polgono de freqncias. Se a
distribuio dos dados for assimtrica, isto quando valores extremos predominam em uma das
caudas da distribuio, deve se preferir a mediana como medida sintetizadora. Isto se deve ao
fato da mediana ser pouco sensvel a presena de valores extremos, sendo considerada mais
robusta que a mdia. O termo robusto o termo tcnico usado para indicar esta propriedade da
mediana em relao mdia aritmtica, que quando a situao de simetria violada a mediana
uma medida que sofre menos interferncias nas suas estimativas.

(c) moda (mo)

A moda definida para dados qualitativos ou para quantitativos discretos como


sendo o valor de maior freqncia na amostra. Para dados quantitativos contnuos a moda o
valor de maior densidade. Portanto para dados quantitativos contnuos o estimador da moda
baseado na distribuio de freqncias. Esse estimador busca encontrar o ponto de mximo do
polgono de freqncias. Um conjunto pode ter mais de uma moda ou at mesmo no ter moda.
O estimador da moda para dados quantitativos contnuos definido a partir da
distribuio de freqncia por meio de um mtodo geomtrico, o qual conduz a seguinte
expresso:

m o = LI mo +

1 + 2

c mo

LImo : limite inferior da classe modal;


1: diferena entre as freqncias da classe modal e a classe anterior;

DANIEL FURTADO FERREIRA

19

2: diferena entre as freqncias da classe modal e a classe posterior;

cmo : amplitude da classe modal;

Classe modal a classe com maior freqncia.


No exemplo, a classe modal foi segunda: 2,528 2,643 com F2=7. Logo,

mo = 2,528 + {(7-2)/[(7-2)+(7-1)]}0,115 = 2,580Kg

O estimador da moda pode tambm ser considerado como o valor mdio da


classe modal, como apresentado por diversos autores. A justificativa dada pela hiptese
tabular bsica, que diz que todos os valores de uma classe so iguais ao seu ponto mdio.
Como neste caso a classe modal a de maior freqncia, a moda considerada como igual a
este ponto mdio. Nesse material o mtodo geomtrico anteriormente apresentado
considerado, por ser considerado mais eficiente.
conveniente comentar que as calculadoras eletrnicas no fornecem os
clculos da mediana e da moda, o que para grandes conjuntos de dados, seus clculos exatos
podem ser extremamente laborioso.

Propriedades

(i) mo' = mo K (somando K a todos os dados)


(ii) mo' = mo .K (multiplicando todos os dados por K)

Relaes empricas entre mdia, mediana e moda

(i)

X = md = mo (distribuio simtrica)

(ii)

X > md > mo (distribuio assimtrica direita)

20

ESTATSTICA BSICA
(iii) X < md < mo (distribuio assimtrica esquerda)

Outras medidas de posio

(i) mdia geomtrica (G)

Definida somente para nmeros positivos, da seguinte forma:

G = n X1. X2 ... Xn
Usada principalmente para variveis que crescem em progresso geomtrica,
como, por exemplo, o nmero de bactrias em uma colnia. Espera-se que a cada reproduo, o
nmero de bactrias dobre.

(ii) Mdia harmnica (H)

H =

1
1
n

i =1

1
X

(iii) Mdia aparada ( X A )

A mdia aparada obtida eliminando do conjunto de dados m observaes


menores e m observaes maiores. O valor de m corresponde a uma percentagem entre 2,5% e
20% do nmero total de observaes. Esta eliminao dos valores extremos para eliminar o
efeito de observaes discrepantes, conhecidas como outliers, no clculo da mdia aritmtica.

DANIEL FURTADO FERREIRA

21

A ttulo de ilustrao considere o conjunto de dados a seguir e com o clculo da mdia


aritmtica e da mdia aparada com m=1 (5%) das observaes.

1 4 5 6 6 7 7 7 7 8 8 8 8 8 8 9 9 10 10 40

A mdia : X = 8,80 a mdia aparada X A =

4 + 5+...+10 135
=
= 7,50
18
18

1.3.2. Medidas de disperso

As medidas de posio no informam sobre a variabilidade dos dados e so


insuficientes para sintetizar as informaes amostrais. Para exemplificar este fato, tm-se a
seguir trs amostras com a mesma mdia:

A={8, 8, 9, 10, 11, 12, 12}

X A = 10

B={5, 6, 8, 10, 12, 14, 15}

X B = 10

C={1, 2, 5, 10, 15, 18, 19}

X C = 10

Pode se observar que as amostras diferem grandemente em variabilidade. Por esta


razo torna-se necessrio estabelecer medidas que indiquem o grau de disperso, ou
variabilidade em relao ao valor central. Desta forma pode-se afirmar que uma amostra deve
ser representada por uma medida de posio e disperso. As principais medidas de disperso
que so abordadas esto apresentadas a seguir.

(a) Amplitude total (A)

ESTATSTICA BSICA

22

A amplitude definida como a diferena entre o maior e o menor valor de uma amostra.
No exemplo do peso de coelhos a amplitude foi A = 0,23kg. A amplitude tem a desvantagem de
(i) s considerar os valores extremos para o seu clculo, e principalmente se houver outlier ela
ser grandemente afetada. Como s dois extremos so considerados amostras com valores
intermedirios praticamente idnticos podem apresentar grande amplitude se s o maior e o
menor valor discrepar dos demais; e (ii) ser influenciada pelo tamanho da amostra, pois
medida que a amostra aumenta a amplitude tende a ser maior. Esta ltima desvantagem, no
ser demonstrada aqui por requerer conhecimentos profundos de estatsticas de ordens.

(b) Varincia e desvio padro

Para contornar a desvantagem de que apenas dois valores so utilizados para o clculo
da amplitude, poderia ser cogitado, ento, o uso de a soma dos desvios em relao mdia
como medida de disperso ou de variabilidade. No entanto, esta medida no adequada, devido
ao fato de a soma de desvios em relao mdia ser nula, sendo que todos as amostras
apresentariam variabilidade nula.
Assim, uma medida da variabilidade que considera todas as observaes e que a mais
utilizada na maioria das situaes na estatstica, devido s propriedades que possui, a
varincia ou a sua raiz quadrada, o desvio padro. A varincia pode ser entendida como se
fosse praticamente a mdia da soma de quadrados de desvios em relao mdia. Numa
amostra de tamanho n deveria ser utilizado este valor (n) como divisor desta soma de quadrados
de desvios. No entanto, devido a motivos associados a propriedades dos estimadores, o divisor
da varincia amostral dado por n-1 em lugar de n na expresso do estimador da varincia.

Simbologia

DANIEL FURTADO FERREIRA

23

Populao: Varincia Desvio padro


2

Amostra:

Varincia S2 Desvio padro S

A varincia amostral dada por:

( Xi X )
n

S2 =

i=1

n 1

em que, n - 1 denominado graus de liberdade.


A unidade da varincia igual ao quadrado da unidade dos dados originais. O
desvio padro, por sua vez, expresso na mesma unidade do conjunto de dados, sendo obtido
pela extrao da raiz quadrada da varincia.
Para o clculo da varincia ou desvio padro amostral a partir dos dados
elaborados pode-se usar a expresso anterior. No entanto, devido necessidade de se calcular
os desvios em relao mdia e calcular, ainda, o seu quadrado, erros de arredondamentos
ocorrem com freqncia. Por essa razo prefervel utilizar as seguintes expresses:

n

X

i
1 n 2 i=1
S2 =
X

n 1 i=1
n

Para a obteno do desvio padro, basta extrair a raiz quadrada:

S= S

24

ESTATSTICA BSICA
No exemplo dos coelhos:

S2 = (66,8116-25,842/10)/9 = 0,00456kg2

S=

0,00456 = 0,0675kg

Clculo para dados agrupados em distribuies de freqncia:

n

FX

i i
1 n
i =1

2
2
S =
FX

i i

n 1 i =1
n

S= S

Varincia

Desvio padro

Para o exemplo:

S2 = [(2x2,4712+7x2,5862+1x2,7012) - (2x2,471+7x2,586+1x2,701)2 /10]/9= 0,004261kg2

S = 0,065279kg

A varincia e o desvio padro medem a variabilidade absoluta de uma amostra.


Portanto, a variabilidade de amostras de grandezas diferentes ou de mdias diferentes no pode
ser comparada diretamente pelas estimativas da varincia ou do desvio padro obtidas. Para
esclarecer este fato os trs conjuntos a seguir so ilustrativos.

X = {1, 2, 3}; Y = {101, 102, 103} e Z = {1001, 1002, 1003}

DANIEL FURTADO FERREIRA


Sx = 1,0;

Sy = 1,0

25

Sz = 1,0

Os trs conjuntos possuem a mesma variabilidade absoluta, porm bastante


intuitivo que os desvios padro de valores iguais a 1 tm importncias diferentes. conveniente
observar que um desvio padro igual a 1 mais importante no conjunto X, pois representa 50%
do valor mdio.

Propriedades

(i) Varincia

Somando ou subtraindo uma constante aos dados a varincia no se altera;

Multiplicando todos os dados por uma constante K a nova varincia ficara


multiplicada por K2.

(ii) Desvio padro

Somando ou subtraindo uma constante K aos dados o desvio padro no se altera;

Multiplicando todos os dados por uma constante K o novo desvio padro fica
multiplicado por K.

(c) Coeficiente de variao (CV)

O desvio padro ou varincia permitem a comparao da variabilidade entre conjuntos


numricos que possuem a mesma mdia e a mesma unidade de medida ou grandeza. Diz-se
que o desvio padro uma medida de disperso absoluta. Nos casos em que os conjuntos

26

ESTATSTICA BSICA

possuem diferentes unidades e possuem mdias diferentes, uma medida de disperso relativa,
como o coeficiente de variao (CV), indispensvel para se comparar variabilidade. O
coeficiente de variao refere-se variabilidade dos dados mensurada em relao a sua mdia,
sendo obtido pela expresso seguinte.

CV =

S
X

x 100

No exemplo dos trs conjuntos apresentados anteriormente, tem-se:

CVx=50%; CVy=1% e CVz=0,1%

Portanto, o conjunto X apresentou uma maior variabilidade em relao aos demais. No


exemplo dos coelhos o CV = (0,0675/2,584) x 100 =2,61% representa relativamente uma
pequena disperso dos dados em relao ao valor central.
Um outro exemplo, referente a dados de temperatura e de precipitao num
determinado perodo est apresentado na Tabela 1.6. Verifica-se que a temperatura apresentou
uma maior variabilidade relativa do que a apresentada pela precipitao, pois o CV foi maior
para essa varivel. Se fossem comparados os desvios padro, a concluso seria de que a
precipitao seria mais varivel que a temperatura. Essa concluso seria, no obstante,
incorreta, pois as grandezas so bastante diferentes.

Tabela 1.6. Estatsticas amostrais de posio e disperso de uma determinada regio em um

determinado perodo referente temperatura e precipitao.


Estatsticas amostrais

Temperatura

Precipitao

Mdia

220C

800mm

5 0C

100mm

27

DANIEL FURTADO FERREIRA

CV

22,7%

12,5%

(d) Erro padro da mdia ( S )


X

Quando se obtm uma amostra aleatria de tamanho n, estima-se a mdia


populacional. bastante intuitivo supor que se uma nova amostra aleatria for realizada a
estimativa obtida ser diferente daquela da primeira amostra. Esse processo se repetido
fornecer estimativas diferentes em cada etapa. Dessa forma, reconhece-se que as mdias
amostrais esto sujeitas variao e formam populaes de mdias amostrais, quando todas as
possveis (ou as infinitas) amostras so retiradas de uma populao. No entanto, intuitivo,
tambm, o conceito de que as mdias amostrais variem menos que uma simples observao. A
variabilidade de uma mdia estimada pelo seu erro padro ( SX ):

SX =

S
n

O erro padro fornece um mecanismo de medir a preciso com que a mdia


populacional foi estimada. Para o exemplo dos coelhos o erro padro :

SX =

0, 0675
= 0, 02135kg
10

Nesse caso o erro padro foi de 0,02135kg e representou 0,83% do valor mdio,
indicando que a mdia foi estimada com alta preciso. Nos prximos captulos outros mtodos
para avaliao da preciso com que uma mdia foi calculada so apresentados.

28

ESTATSTICA BSICA

1.3.3. Medidas de assimetria e curtose

Como foi visto vrias medidas sintetizadoras da amostra so apresentadas,


destacando-se suas vantagens e desvantagens. So apresentadas, tambm, formas grficas
para avaliao da natureza da distribuio dos dados. Neste ltimo caso por uma inspeo
emprica o pesquisador podia inferir que tipo de distribuio os dados de sua pesquisa
apresentavam. Naquele instante deu-se nfase a simetria da distribuio, ou seja, se a forma da
distribuio apresentava uma concentrao maior dos valores em torno do valor central e se
medida que se afastassem em ambas as direes deste centro, o comportamento se mantinha
semelhante, reduzindo-se as freqncias. Uma forma de se estimar o grau de assimetria ou de
simetria de uma distribuio, pode ser dada pelo coeficiente de assimetria, cuja notao para
represent-lo a3 ou

b1 , sendo esta ltima notao mais conhecida na literatura.

a 3 = b1 =

m3
m2 m2

em que, m2 e m3 so momentos de ordem 2 e 3, respectivamente, centrados para a mdia,


podendo ser obtidos por:

m2 =

xi x

i =1

e m3 =

xi x

i =1

O coeficiente de assimetria pode ser interpretado da seguinte forma:


i.

a3 < 0 distribuio assimtrica esquerda;

ii.

a3 = 0 distribuio simtrica.

iii. a3 > 0 distribuio assimtrica direita.

DANIEL FURTADO FERREIRA

29

Nas situaes reais da pesquisa, esta informao de grande valia, uma vez,
que os processos de deciso e estimao so baseados em distribuies simtricas. Como os
dados destas pesquisas referem-se a amostras de uma populao, dificilmente o coeficiente de
assimetria ser exatamente igual a zero, mesmo quando proveniente de uma distribuio
sabidamente simtrica. Para que no se infira incorretamente a respeito da natureza da
distribuio quanto simetria, no captulo 6, ser apresentado um critrio estatstico para fazer
este julgamento.
Uma outra medida para verificar a natureza da distribuio, denominada de
curtose, a qual representada por a4 ou b2. Esta uma medida do grau de achatamento da
distribuio quando comparada ao de uma distribuio conhecida como distribuio normal, que
ser vista no captulo 2. Para esta distribuio normal o valor de a4 3, sendo denominada de
distribuio mesocrtica. Valores de a4 maiores que 3, representam as distribuies
leptocrticas, ou seja, so mais afiladas que a distribuio normal. E distribuies com valores
de a4 menores do que 3 representam as distribuies platicrticas, ou seja, aquelas mais
achatadas do que a normal.
O coeficiente de curtose pode ser estimado pela seguinte expresso:

a 4 = b2 =

m4
m22

em que, m4 o momento de ordem 4 centrado na mdia, podendo ser estimado por:

m4 =

xi x

i =1

Na Figura 1.5 esto representados os tipos de distribuio quanto ao grau de


achatamento, em relao aos valores do coeficiente de curtose.

30

ESTATSTICA BSICA

leptocrtica

mesocrtica
platicrtica

Figura 1.5. Tipos de distribuies quanto ao grau de achatamento (curtose): leptocrtica,


mesocrtica e platicrtica.

Exemplo: Calcular os coeficiente de assimetria e de curtose para os dados de peso de coelhos


apresentados anteriormente, e discutir sobre os resultados encontrados.
Os coeficientes m2, m3 e m4 devem ser calculados inicialmente. Devido s
elevadas potncias aconselha-se a utilizao de planilhas eletrnicas na obteno destes
coeficientes. Os valores desses momentos para o exemplo esto apresentados a seguir.

m2 =

(x
i =1

(x
i =1

=0,004104

x)

=-0,000062112

m4 =

m3 =

x)

(x
i =1

x)

=0,000043419552

DANIEL FURTADO FERREIRA

31

O prximo passo utilizar as expresses para obter as estimativas do


coeficiente de assimetria (a3)e de curtose (a4):

a 3 = b1 =

a 4 = b2 =

m3
m2 m2

=-0,2362

m4
=2,5779
m22

Como o valor de assimetria menor que zero, pode se inferir que a distribuio
possui assimetria negativa, ou seja, considerada assimtrica esquerda. Da mesma forma
pode-se inferir que a distribuio platicrtica, uma vez que seu coeficiente de curtose inferior
a 3. Como j comentado, os valores amostrais destas estatsticas, em geral no so exatamente
iguais aos padres de uma normal, mesmo quando so provenientes de uma distribuio
sabidamente normal. Ento, neste momento, ainda no h como saber com grande segurana
se a diferena dos valores desta estatstica para os padres da distribuio normal irrelevante
ou no. A resposta para essa questo ser fornecida no captulo 6.

ESTATSTICA BSICA

32

1.4. Exerccios
1.4.1. Tcnicas de somatrio
1. ndices ou notao por ndices
O smbolo Xj (leia X ndice j) representa qualquer um dos n valores, X1, X2, ..., Xn,
assumidos pela varivel X, na amostra ou no conjunto de dados. A letra j, usada como ndice,
pode representar qualquer um dos valores: 1, 2, ..., n. Evidentemente pode ser usada qualquer
outra letra alm de j.
2. Notao de somatrio
n

O smbolo X j usado para representar a soma de todos os valores Xj desde j=1 at


j =1

j = n, ou seja, por definio:


n

X j =X1 + X2 + ... + Xn,

j =1

O smbolo a letra grega sigma, que indica soma.


3. Propriedades
n

j =1

j =1

3.1. aX j = aX1 + aX2 + ... + aXn=a X j


n

3.2. Y j X j = Y1 X1 + Y2X2 + ... + YnXn


j =1
n

j =1

j =1

j =1

3.3. (aX j + bY j ) = a X j + b Y j
n

3.4. K = nK
j =1

Obs. a, b e K so constantes e X e Y variveis aleatrias.


4.

Soma de variveis arranjadas com dupla identificao


um procedimento comum que os dados de um experimento ou de uma amostragem

serem representados em uma tabela de dupla entrada. Desta forma tem se a varivel X com dois ndices
(Xi j). O ndice i representa as linhas e o ndice j s colunas. Um exemplo, apresentado na Tabela 1.7,
refere-se produo mdia por hectare de uma gramnea aps a utilizao de adubos nitrogenados e
fosfatados. Trs quantidades de nitrognio foram aplicadas e quatro doses de fsforo.

33

DANIEL FURTADO FERREIRA

Tabela 1.7. Produtividade em t/ha de uma forrageira sob o efeito de 3 doses de N em combinao com 4
doses de P observados em um experimento zootcnico.
Teor de nitrognio (j)
Teor de fsforo (i)

4,6

5,0

5,5

5,0

5,5

6,1

5,2

5,8

6,4

6,0

6,2

6,8

Em algumas anlises estatsticas necessrio muitas vezes somar as linhas e/ou colunas,
bem como toda a tabela. A notao de somatrio pode ser utilizada com essa finalidade. Como dois fatores
determinam a produtividade, dois ndices so utilizados para represent-los, como comentado
anteriormente. Assim, dois smbolos de somatrios podem ser utilizados em alguns casos. Assim ser
definido, o seguinte somatrio:
i.

Somar todas as produtividades da Tabela 1..


4

x
i =1 j=1

ij

= x 11 + x 12 + " + x 43 = 4, 6 + 5, 0 + " + 6,8 = 68,1

ii. Somar cada uma das linhas


3

xij = xi1 + xi 2 + xi 3 i = 1, 2, 3, 4
j= 1

Assim por exemplo, para fsforo dose 2 (i=2), a produtividade total :


3

x 2 j = x 21 + x 22 + x 23 = 5,0 + 5,5 + 6,1 = 16,6


j =1

iii. Somar cada uma das colunas


4

x ij = x1 j + x 2 j + x 3 j + x 4 j j = 1, 2, 3

i =1

Assim por exemplo, para nitrognio dose 3 (j=3), a produtividade total :


4

x i 3 = x13 + x23 + x 33 + x 43 = 5,5 + 6,1 + 6,4 + 6,8 = 24,8

i =1

ESTATSTICA BSICA

5.

34

Exerccios propostos
Sejam os conjuntos de dados a seguir:
X={2, 4, 4, 3, 2 }
Y={1, 2, 3, 6, 7}

Obtenha:
4

5.1. X j

5.2. Y j

j =1

j =1

2
5.3. 4 X j

5.4. X jY j

j =1

j =1

j =1

X=

6. Seja

j=1

j =2

j =1

2
5.6. X jY j + Y j

5.5. ( 3 X j + 2Y j )

n

X

1 n 2 j=1 j
2
X
a mdia aritmtica e S =
a varincia. Dado o

n 1 j =1 j
n

conjunto de dados X={2, 4, 5, 6, 1, 8}, calcule a sua mdia e varincia.

7. Demonstre numericamente e algebricamente que

(X
j=1

X) = 0 . Use os dados do exemplo anterior

para demonstrar numericamente.


8. Obtenha a partir da Tabela 1.7, as seguintes somas:
4

8.1.

X2ij

i = 1 j= 1

2
8.2. Xij j = 1, 2, 3
i =1

8.3.

X2ij i = 1, 2, 3, 4
j=1

1.4.2. Coleta organizao e apresentao de dados

1. Os dados apresentados a seguir so relativos s produes de 50 plantas de uma prognie F2 de feijoeiro


em g/planta, avaliados no Departamento de Biologia da UFLA, em 1997.

35

DANIEL FURTADO FERREIRA


2,81 3,19 3,49 3,76 6,02 8,23 2,23 3,01 4,43 13,94 3,10 1,52 3,38
2,85 4,64 7,33 6,78 13,12 13,84 9,40 6,20 2,39 9,19 7,07 9,20 13,46
3,90 8,99 7,97 5,15 12,95 25,52 6,61 16,56 9,60 6,71 6,73 3,86 3,50
4,80 8,40 13,86 6,53 18,44 22,14 9,15 8,75 10,86 14,20 10,09
a) Agrupe os dados, determinando o nmero de classes pelo critrio de Oliveira.
b) Faa o histograma e o polgono de freqncia num mesmo grfico.
c) Construir as distribuies de freqncias acumuladas.
d) Trace as ogivas no mesmo plano cartesiano.

e) Qual a porcentagem de plantas com produtividade superior a 9g/planta. Utilize as ogivas e a


interpolao algbrica a partir da distribuio de freqncia. Compare e discuta os resultados obtidos com a
proporo amostral exata, obtida dos dados elaborados.
f) Discuta sobre a natureza da distribuio, baseado no item b?
g) Acima de qual produtividade esto 50% das plantas (25 plantas)?
h) Qual a porcentagem de plantas com produtividade inferior a 3,5g?
i) Obtenha as produtividades que deixam 25% de plantas com produtividade acima das mesmas e 25%
abaixo.
Obs. Utilize em todos os casos (g, h, i) a distribuio de freqncia.

1.4.3. Medidas de posio


1. Foi realizada na regio Oeste do Paran, no municpio de Marechal Cndido Rondon, em
1992, um levantamento da produtividade leiteira diria de 30 produtores rurais, atendidos pelo
plano Panela Cheia (Roesler, 1997). Os resultados da produtividade diria dos 30 produtores
esto apresentados a seguir.
8,13

8,23

8,60

8,80

8,97

9,05

9,12

9,30

9,35

9,78

9,80

9,86

9,90

9,95

10,00

10,11

10,13

10,15

10,16

10,23

10,31

10,33

10,40

10,46

10,50

11,14

11,29

11,46

12,05

12,14

Obtenha as seguintes estimativas das medidas de posio:


a) Mdia aritmtica
b) Mdia aparada (m=2)
c) Mediana
n

d) Cheque que ( X j X ) = 0 .
j =1

36

ESTATSTICA BSICA

e) Se for multiplicado a produtividade por 0,27 de cada produtor, para se obter a renda mdia por
produtor/animal/dia, qual, qual ser o valor para amostra?
f) obtenha a mdia harmnica.
2) Faa a distribuio de freqncia destes dados e calcule:
a) Mdia aritmtica
b) Mediana
c) Moda
d) Faa a comparao destes valores com os obtidos no exerccio anterior, e discuta sobre as
razes das diferenas.
e) Trace o histograma e o polgono de freqncia
f) Baseado nestes grficos, determine qual a natureza da distribuio, quanto simetria.
Baseado nesta resposta indique qual medida de posio a mais adequada para representar os
dados amostrais. Justifique
g) Se voc fosse solicitado pelo prefeito da cidade para estimar a produtividade de leite total
diria da cidade, como voc faria?
Informaes adicionais: nmero de produtores de leite da cidade - 7309; Quantidade total de
vacas (mdia da amostra) - 11,80 vacas/produtor; Nmero mdio de vacas em lactao: 8,075.

1.4.4. Medidas de disperso


1. Foi realizada na regio Oeste do Paran, no municpio de Marechal Cndido Rondon, em
1992, um levantamento da produtividade leiteira diria de 20 produtores rurais, atendidos pelo
plano Panela Cheia (Roesler, 1997). Os resultados dos intervalos de parto (em meses) dos 20
produtores esto apresentados a seguir.
11,80

11,90

12,00

12,30

12,80

12,99

13,10

13,50

13,80

14,10

14,55

14,65

14,70

15,00

15,10

15,20

15,50

15,80

15,90

15,96

Obtenha as seguintes estimativas das medidas de disperso:


a) Amplitude total
b) Varincia e desvio padro
c) Coeficiente de variao
d) Erro padro da mdia
e) Em cada caso anterior comentar, sobre o significado da estimativa obtida e sobre a forma que
devem ser aplicadas.

37

DANIEL FURTADO FERREIRA

f) Se cada dado for dividido por 12, para se obter o intervalo de partos em anos, qual ser os
novos valores da amplitude, varincia, desvio padro, CV e erro padro da mdia?
2) Faa a distribuio de freqncia destes dados e calcule:
a) Amplitude, varincia, desvio padro, CV e erro padro da mdia?
b) Faa a comparao destes valores com os obtidos no exerccio anterior, e discuta sobre as
razes das diferenas.
c) Se voc fosse solicitado a representar os dados por duas medidas, quais voc usaria e por
que?
d) Aps o programa Panela Cheia o intervalo de partos apresentou mdia de 13,85 e desvio
padro de 2,00 meses. Qual na sua opinio a situao que apresentou maior variabilidade,
ante ou aps o Programa?

3) A seguir esto apresentadas s estimativas dos coeficientes de assimetria e de curtose de


algumas situaes amostrais. Classifique cada uma delas quanto simetria e o grau de
achatamento da distribuio de freqncia, baseando-se nas estimativas destes coeficientes.

Coef. simetria (a3)


0,5
-2,0
2,0
3,0
0,0
0,0
-3,0

Coef. curtose (a4)


3,0
2,0
2,0
3,0
3,0
3,5
4,5

Class. da simetria

Class. da curtose

1.5. Literatura citada


ROESLER, D.A. Impactos do programa de crdito por equivalncia-produto no sistema de
produo de leite - um estudo no oeste do Paran - Brasil. Lavras, MG, Agosto, 1997.
89p. (Dissertao de Mestrado).

CAPTULO II - DISTRIBUIO DE
PROBABILIDADE

2.1. CONCEITO E IMPORTNCIA

Na experimentao agropecuria um dos principais objetivos a retirada de


concluses a partir de experimentos que envolvem incertezas. Na obteno das concluses
necessrio o uso da teoria da probabilidade. Os dados de uma amostra so realizaes de
variveis aleatrias. Inmeros modelos probabilsticos podem ser usados para modelar a
ocorrncia distribuio e facilitar a compreenso de como os eventos aleatrios ocorrem. A
inferncia estatstica usa esses modelos e suas propriedades para formular as principais teorias
utilizadas pelos investigadores cientficos em suas pesquisas.
Nesse material, apenas uma abordagem simplificada do conceito de probabilidade
apresentada. Nessa abordagem a probabilidade relacionada com a ocorrncia de um evento
em relao a todas possibilidades possveis. Se um evento pode ocorrer de "a" maneiras
diferentes num total de n modos possveis, ento a probabilidade de ocorrncia do evento
definida por: p =

a
n

. Assim, o conjunto de todas as possveis formas de ocorrer um determinado

fenmeno deve ser especificado ou pelo menos enumerado. Esse conjunto denominado de
espao amostral. O subconjunto de interesse denominado de evento.

Exemplo: Seja o nascimento de fmeas numa leitegada de tamanho 3. Qual a probabilidade de


nascer 2 fmeas? e nenhuma fmea?

Os eventos possveis so apresentados a seguir pelo espao amostral :

: {1.MMM; 2.MMF; 3.MFM; 4.FMM; 5.MFF; 6.FMF; 7.FFM; 8.FFF}

DANIEL FURTADO FERREIRA

40

E1 ={ocorrncia de duas fmeas}={5,6,7}


p = Prob {E1} = 3/8 =0,375 = 37,50%

E2={no ocorrncia de fmeas}={1}


p = Prob {E2} = 1/8 =0,1250 = 12,50%

2.2. VARIVEIS ALEATRIAS E DISTRIBUIO DE PROBABILIDADES

As variveis aleatrias podem assumir qualquer valor de um determinado conjunto


de dados, denominado de domnio da varivel aleatria. Como j foi visto, elas podem ser
discretas ou continuas. Ser visto duas principais distribuies discretas e a mais importante das
continuas, a distribuio normal. Nesse curso, devido a carga horria limitada e a grande
quantidade de assuntos a serem tratados, so penalizados alguns conceitos fundamentais de
probabilidade, regras de contagem e anlise combinatria.

DISTRIBUIES DE PROBABILIDADES DISCRETAS

Se uma varivel X pode assumir um conjunto de valores discretos X1, X2, ..., Xn
com probabilidades p1, p2, ..., pn, sendo pi=1, diz-se que est definida uma distribuio de
probabilidade de X.

DISTRIBUIES DE PROBABILIDADES CONTNUAS

Neste caso X pode assumir um conjunto continuo de valores. O polgono de


freqncia amostral torna-se, no limite de uma populao, uma curva continua. Essa curva
contnua denominada distribuio de probabilidade contnua. As probabilidades dos eventos so
definidas por reas sob essa curva.

41

ESTATSTICA BSICA

A rea total sob a curva limitada pelo eixo X igual a 1. E a rea entre a e b
fornece a probabilidade de X estar entre a e b.

2.3. DISTRIBUIO DE PROBABILIDADES DISCRETAS E CONTINUAS.

A. DISTRIBUIO BINOMIAL

A distribuio binomial apropriada para situaes em que se tm 2 nicos


resultados: sucesso e fracasso quando se obtm uma amostra de um nico elemento da
populao. Se em uma amostra de tamanho n forem mantidas constantes as probabilidades
associadas ao sucesso e ao fracasso, pode-se definir a varivel X pelo nmero de sucessos
observados. Essa varivel tem distribuio binomial. So exemplos de variveis binomiais:
florescimentos de plantas de uma espcie em uma amostra de tamanho n; nascimento de fmeas
em uma amostra de tamanho n; entre outros. A distribuio binomial a mais importante das
distribuies de v.a.discretas.

DANIEL FURTADO FERREIRA

42

Se p e a probabilidade do sucesso de um evento ocorrer em uma nica tentativa e


q=1-p e a probabilidade do fracasso, ento, a probabilidade do evento ocorrer x vezes em n
tentativas apresentada a seguir:

P(X=x)= C nx p q

em,

Cn =
x

nx

n!
e x o nmero de sucessos ocorridos em n tentativas. x=0, 1, 2, ..., n.
x !( n x )!

Exemplo. No nascimento de dois bezerros considerando o sucesso a ocorrncia de fmeas,


pergunta-se qual a probabilidade de nascer 2 fmeas? 1 fmea? e nascer pelo menos uma fmea?

n=2; p=1/2;

q=1-p = 1/2

e X: nmero de fmeas; x=0, 1, 2.

={MM, MF, FM, FF}

P(X=2)=

2! 1 1

2!0! 2 2

2! 1 1
P(X=1)=

1!1! 2 2

22

= 0,25 = 25%

2 1

= 0,50 = 50%

P(X1) = P(Pelo menos uma fmea)=P(X=1)+P(X=2)=0,25+0,50=75%

P(X=0)= 25%

43

ESTATSTICA BSICA

A distribuio de probabilidade de X (nmero de fmeas), est apresentada no


Tabela 2.1. A distribuio de probabilidade refere-se aos possveis valores que X pode assumir
associados as suas respectivas probabilidades de ocorrncia.

x
P(X=x)

0,25

0,50

0,25

Tabela 2.1. Distribuio de probabilidade da ocorrncia de fmeas.

A funo de distribuio de probabilidade refere-se as probabilidades acumuladas.


No exemplo, refere-se probabilidade de ocorrncia de no mximo x fmeas e representada por
F(x).

F(x) = P (Xx) = P(X=0)+P(X=1)+...+P(X=x-1)+P(X=x)

Ex. F(1) = P(X1) = P(X=0)+P(X=1)=0,25+0,50=0,75=75%

F(2) = P(X2) = P(X=0)+P(X=1)+P(X=2) =0,25+0,50+0,25=100%

Mdia e Varincia da Binomial


x = np

2x = npq = np(1 p)

B. DISTRIBUIO DE POISSON

A distribuio de Poisson pode ser vista como sendo uma aproximao da


binomial quando o n grande tendendo para e a probabilidade do sucesso p pequena
tendendo para zero, permanecendo finito e no nulo o produto np (mdia da distribuio). Na
prtica, para uma boa aproximao, adota-se n50 e p0,10. A distribuio de Poisson, tambm,

DANIEL FURTADO FERREIRA

44

pode ser vista como sendo a distribuio de uma varivel X que mede a ocorrncia do nmero de
elementos por unidade de tempo, rea ou volume. Assim, por exemplo, a ocorrncia de uma planta
de uma determinada espcie por unidade de rea pode ser modelada pela distribuio Poisson; a
ocorrncia de formigueiros por talho; a ocorrncia do nmero de uma determinada doena por
uma determinada unidade de tempo; entre outros.

Funo de densidade
P(X=x) = e

x!

onde, k =np a mdia da distribuio.

Funo de distribuio de Poisson:


x

k
F(x) = P(Xx) = e
t=0

t!

Exemplo: 2% dos animais de um rebanho esto atacados por uma doena. Qual a probabilidade

de encontrar em uma amostra de 100 animais:


(i) nenhum animal doente?
(ii) 1 doente?
(iii) 2 doentes?
(iv) mais de trs animais doentes?

n=100>50 e p=0,02 < 0,10 (sucesso ou fracasso) Poisson.

k=np=100x0,02=2

(i) P(X=0)= e2

2 =13,53%
0!

ESTATSTICA BSICA

(ii) P(X=1)=

e 2 21
=27,07%
1!

(iii) P(X=2)=

e 2 2 2
=27,07%
2!

45

(iv) P(X>3) = 1-F(3)=1-P(X3)=1-[P(X=0)+P(X=1)+P(X=2)+P(X=3)]=1-0,8571=14,29%

Mdia e Varincia da Poisson

x = np = k 2x = np = k

A distribuio Poisson possui mdia e varincias iguais.

C. DISTRIBUIO DE PROBABILIDADE UNIFORME DISCRETA

Uma varivel aleatria discreta X assumindo valores x1, x2, . . ., xk ter distribuio
uniforme discreta se todos elementos forem equiprovveis. A funo de densidade de
probabilidade dada por:

P(X=x)=

1
; x = x1, x2, . . ., xk
k

DANIEL FURTADO FERREIRA

46

D. DISTRIBUIO NORMAL

a mais importante das distribuies do grupo continuo pela grande aplicabilidade


em pesquisas das cincias agrrias. A distribuio normal tem densidade dada por:

f (x) =

1
22

(x ) 2
2 2

Em que e 2 so os parmetros dessa distribuio, os quais so respectivamente


a mdia e varincia dessa distribuio. O grfico da funo normal :

Propriedades
(i) simtrica em relao a

(ii) tem forma de sino;


(iii) fica completamente definida conhecendo-se a sua mdia e varincia;
(iv) assinttica em relao abscissa;
(v) rea total sob a curva e igual a 1.

47

ESTATSTICA BSICA

Distribuio normal reduzida ou padronizada

(2 = 1 e = 0)
Se X N( , 2) ento a V.A. Z, definida por: Z =

X
, ter distribuio normal

padronizada-N(0,1). Sabe-se que a probabilidade de X estar entre dois valores quaisquer (a, b)
dada pela rea sob a curva normal entre estes valores:

P(a<X<b)= a f(x) dx

Como o clculo dessa integral no trivial, usam-se as tabelas obtidas a partir da


curva normal padronizada. Calcular a rea compreendida entre 0 e 1 na curva normal reduzida.

DANIEL FURTADO FERREIRA

48

Consultando a tabela da curva normal padro obtm-se:

P(0Z1) = 0,3413.

A tabela s fornece valores positivos de Z. Portanto se a probabilidade desejada


corresponde rea de 0 a -1, deve-se usar a propriedade de simetria da curva normal.

P(-1Z0)=P(0Z1)=0,3413
Em muitas situaes prticas os parmetros da distribuio normal so
desconhecidos e devem ser estimados da amostra. Nesse caso a as probabilidades so apenas
estimativas das reais probabilidades. As estimativas so tanto melhores, quanto maiores forem s
amostras das populaes normais obtidas. Um exemplo de aplicao dessa natureza
apresentado a seguir.

Exemplo: No exemplo dos coelhos hbridos, assumindo distribuio normal dos pesos, tem-se que

X =2,584 e S=0,0675. Qual a probabilidade de encontrar um animal pesando mais que


2,701Kg?

49

ESTATSTICA BSICA
P(X>2,701)=?

(i) Usar grfico para visualizar melhor a probabilidade desejada

2 ,5 8 4

2 ,7 0 1

(ii) Colocar X na forma reduzida:

Zc =

X X
S

2,701 2,584
0,0675

=1,73

1 ,7 3

(iii) P(X>2,701) = P(Z>1,73)=0,50-0,4582= 0,0418 P(X>2,701) = 4,18%

DANIEL FURTADO FERREIRA

50

E. Aproximao normal das distribuies Binomial e Poisson

(i) Binomial
X B(n,p)

Deseja-se calcular probabilidades tais como P(X7), P(0X4), etc. Pode-se fazer
tal clculo usando a prpria distribuio binomial ou usar a aproximao normal. No caso da
aproximao normal, o erro cometido ser tanto menor quanto maior for n e quanto mais prximo
de 0,50 estiver o valor de p. Alguns autores afirmam que quando np5 a aproximao normal
considerada boa.

EX. X B(n=10, p=0,50). Qual P(X7)?

Usando a Binomial:
P(X7)=P(X=7)+P(X=8)+P(X=9)+P(X=10)=0,171875=17,1875%

Usando a aproximao Normal:

x= np =10x0,50 = 5 5
2 = npq =10x0,5x0,5 = 2,5

Como P(X7) inclui o 7 e X segue uma distribuio discreta, deve-se fazer correo para
descontinuidade, para que P(X=7) seja considerada na aproximao normal, e o erro seja
minimizado.

51

ESTATSTICA BSICA

P(X7) inclui o 7, logo se deve considerar no caso contnuo P(X>6,5) (pois considera a
probabilidade de X ser 6,5 ou mais). Se fosse P(X>7), que no inclui o valor 7 deve-se calcular a
P(X>7,5).

Observe a figura ilustrativa a seguir para visualizar as correes de continuidade


apresentadas. A probabilidade de cada valor de X estimada no caso contnuo pela rea do
retngulo correspondente sob a curva contnua usada para aproximar a distribuio discreta.

-1

P(X>6,5) = P(Z> Zc), onde Zc dado por:

Zc=

X x

6,5 5,0
2,5

= 0,95

P(Z>0,95) = 0,1711 = 17,11%

O erro cometido desprezvel.

10

11

DANIEL FURTADO FERREIRA

52

(ii) Poisson

Nesse caso o processo anlogo, sendo que a mdia e a varincia so dados por:

x= np =k e 2 = np=k

Ex. Seja k=5 e n=100. Qual a P(X>7)?


Deve ser feito o ajuste para descontinuidade:
P(X>7) no inclui o 7, logo a probabilidade desejada ser: P(X>7,5) na aproximao Normal.

P(X>7,5) = P(Z>Zc) = P(Z>1,12), pois:

Zc =

X x

7,5 5,0
5

= 1,12

P(Z>1,12) = 0,50 - P(0<Z<1,12) =0,50 - 0,3686 = 0,1314 = 13,14%

A probabilidade exata foi calculada usando um algoritmo em Pascal, e o resultado


obtido foi: P(X>7)=13,34%. Novamente observa-se que o erro cometido foi pequeno, no sendo
importante.

2.4. ESPERANAS MATEMTICAS

A mdia de uma varivel aleatria X recebe o nome de valor esperado ou


esperana matemtica de X. E definida por:
n

E(X) =

x P(X = x ) , se X uma v.a. discreta.


i

ESTATSTICA BSICA

53

E(X) = xf ( x )dx , se X uma v.a. contnua

Propriedades

(i) Sejam a e b constantes:


E(aX+b) = aE(X) + b (X v.a. discreta)
E(aX+b) =

(ax + b)f (x)dx =a xf (x)dx + b (X v.a. contnua)

(ii) E[X-E(X)]2 um valor mnimo (varincia de X)


(iii) E[X-E(X)]=0

2.5. EXERCCIOS

2.5.1. Distribuio de probabilidades discretas

1. Considere ninhadas de 4 filhotes de coelhos. Construa todos os possveis eventos de


nascimentos quanto ao sexo dos filhotes. Ex. (MMMM), (MMMF), etc.
a) sendo X a ocorrncia de fmeas, construa a distribuio de probabilidade de X.
b) Calcule as probabilidades dos seguintes eventos, pelo conceito de probabilidade.
i) nascimento de exatamente duas fmeas?
ii) nascimento de pelo menos um macho?
iii) nascimento de pelo menos duas fmeas?
iv) nascimento de no mximo uma fmea?
c) Suponha que voc faa uma amostragem de 500 ninhadas de 4 filhotes. Em quantas vocs
espera encontrar exatamente 1 macho?
2) Suponha que X (V.A. discreta) seja o nmero de animais doentes de uma determinada raa.
Sabe-se que esta doena controlada geneticamente e que ataca 1/3 da raa. Numa amostra de
5 animais, pede-se:
a) A distribuio de probabilidade de X? (Use a binomial)
b) A probabilidade de haver na amostra mais de 1 animal doente?
c) A probabilidade de haver mais de um animal sadio?

54

DANIEL FURTADO FERREIRA


d) A probabilidade de haver no mximo trs animais doentes?
e) A funo de distribuio de probabilidade de X, F(X).
f) A mdia e a varincia?

3) Numa lmina verificou-se que existiam em mdia 2,5 bactrias/cm2. A lmina foi subdividida em
300 quadrados de 1cm2. Em quantos destes quadrados vocs espera encontrar no mximo 1
bactria? Qual a probabilidade de se encontrar mais de 3 bactrias por centmetro quadrado?

4) Um pesquisador da rea de zootecnia conseguiu uma srie de dados dos ltimos 120 anos,
com o registro do nmero de uma doena rara em eqinos da localidade em que trabalhava. Os
dados obtidos foram:
Nmero de doenas

Nmero de anos

50

42

20

a) Estime o nmero mdio de doenas /ano?


b) Calcule para cada valor de X, as probabilidades associadas. suponha que X possua distribuio
de Poisson.
c) Calcule a freqncia esperada (em anos) para cada valor de X.
d) Compare os resultados esperados com os observados. Com base nesta comparao, voc
pode afirmar que a distribuio de Poisson adequada para explicar a ocorrncia desta doena na
regio de estudo? Justifique.

2.5.2. Distribuio de probabilidades contnuas

1. Calcule e faa os esboos dos grficos para representar as seguintes probabilidades da


distribuio normal padronizada N(0,1), com mdia zero e varincia 1: P(Z1,96), P(Z0,95),
P(Z1,54), P(Z-1,645) e P(-0,45Z2,00).
2. Encontre o valor de Zc tal que: P(Z> Zc)=0,025, P(Z< Zc)=0,600 e P(1<Z< Zc)=0,1200.

ESTATSTICA BSICA

55

3. A varivel aleatria X (quantidade de kg de leite produzidos por um animal diariamente,


considerando uma determinada raa e rebanho) segue a distribuio normal e possui mdia
9,87kg/dia/animal e varincia 8,87(kg/animal/dia)2. Calcule a P(X<3), P(X>8), P(10<X<12),
P(7<X<11,5). Qual o valor Xc, tal que 90% das vacas tem produtividade inferior ao mesmo, ou
seja, P(X<Xc)=0,90?
4. no nascimento de 80 bezerros qual a probabilidade de nascer pelo menos 30 fmeas? E de
nascer pelo menos 70 fmeas? Usar a aproximao normal.
5.Seja X uma varivel aleatria discreta, que representa a incidncia de uma doena num
determinado rebanho. Supor que X possua distribuio de Poisson com mdia, K=17. Determine
as seguintes probabilidades pela aproximao normal, para uma amostra de 200 animais.
(a) P(15x16) (b) P(X22)

(c) P(X=13)

(d) F(15)

(e) Calcule o valor exato de (c) pela Poisson. Determine o erro de aproximao encontrado.

CAPTULO III - AMOSTRAGEM

3.1. IMPORTNCIA
O objetivo fazer inferncia sobre a populao, como descrito no Quadro 3.1, ou
seja, fazer afirmaes sobre caractersticas da populao, tomando-se por base os resultados da
amostra. O processo pelo qual por meio da amostra so estudadas as caractersticas
populacionais e denominado de amostragem. Para a validade deste processo as amostras devem
ser representativas. As vantagens do processo de amostragem em relao ao censo o menor
custo, o menor tempo e a maior preciso.

POPULAO

AMOSTRA

Parmetros populacionais desconhecidos

Estimadores amostrais

Quadro 3.1. Descrio do processo de amostragem pelo qual se obtm uma


caracterizao do universo desconhecido que a populao.

3.2. AMOSTRAGEM PROBABILSTICA E NO PROBABILSTICA.


A amostragem o conjunto de tcnicas para se obter um subconjunto de valores
de um universo desconhecido para se caracteriz-lo. Esse universo de valores a populao e o
subconjunto a amostra. Populao e amostra podem ser definidas de uma forma bastante
simplificada por: (i) populao o conjunto de todos os elementos que tem pelo menos uma
caracterstica comum de interesse. Por exemplo, a populao de rvores de eucaliptos da Aracruz
Celulose no Esprito Santo e Bahia; (ii) e amostra um subconjunto da populao, o qual deve
possuir caractersticas da populao de onde foi extrado.

ESTATSTICA BSICA

57

A amostragem se subdivide em dois tipos fundamentais: a amostragem


probabilstica e a amostragem no probabilstica. A amostragem probabilstica aquela em que
todos os indivduos da populao possuem probabilidade conhecida e no nula de pertencer
amostra. A principal caracterstica desse processo a realizao de sorteio para a obteno da
amostra. Uma amostra obtida por um processo probabilstico denominada de amostra aleatria.
Dentre os tipos de amostragem probabilstica destacam-se:
Amostragem simples ao acaso (ASA)
Sistemtica
Conglomerado
Estratificada
A amostragem no probabilstica, por outro lado, aquela em que nem todos os
elementos populacionais tm chance no nula de pertencer amostra, sendo caracterizada pela
ausncia de sorteio, ou quando o sorteio realizado alguns elementos da populao so excludos
do sorteio por alguma razo qualquer. Os principais tipos so:
Inacessibilidade a toda populao;
Amostragem sem norma (a esmo);
Populao formada por material que continuo (gases e lquidos); e
Intencional.

3.2.1. AMOSTRAGEM PROBABILSTICA


(A) AMOSTRAGEM SIMPLES AO ACASO (ASA)
Para se realizar esse tipo de amostragem enumeram-se todos os elementos da
populao alvo e sorteiam-se n elementos dessa seqncia atravs de um dispositivo aleatrio
qualquer, o qual pode ser a tabela de nmeros aleatrios, papis numerados em urna, ou a funo
random em computadores e calculadoras. Esse tipo de amostragem pode ser realizado com
reposio ou sem reposio. Para realizar esse tipo de amostragem a populao deve ser
uniforme internamente ou homognea. A homogeneidade difcil de ser determinada, porm de
forma alguma significa ausncia de variabilidade na populao alvo.
Com reposio: Nn amostras possveis.
Sem reposio: CNn =

n!
n !(N n)!

amostras possveis.

Exemplo: Pop.={A, B, C} com N=3. Retirar amostras de tamanho n = 2 com e sem reposio.
Com reposio: 32 = 9 amostras possveis.

58

DANIEL FURTADO FERREIRA


Amostras possveis: {AA, AB, AC, BA, BB, BC, CA, CB, CC}
Sem reposio: 3!/(2!1!)= 3
Amostras possveis: {AB,AC,BC}
(B) AMOSTRAGEM SISTEMTICA

E uma simplificao do processo anterior. Neste caso o primeiro elemento e


sorteado e os demais so retirados em uma progresso aritmtica, com uma determinada razo r,
ate completar o total de elementos da amostra (n). Para isso a populao deve estar disposta de
tal forma que se consiga sistematizar a forma de obter as unidades amostrais. Da mesma forma,
exige uma determinada homogeneidade da populao alvo.
Exemplo: Uma determinada regio possui 10.000 plantas de eucaliptos. Obter uma amostra de 50
plantas (n=50).
r = 10.000 50 = 200;
Sorteia-se o primeiro elemento da amostra;
Com razo r = 200 os demais elementos so amostrados;
Se por exemplo sorteou-se o elemento nmero 20, a amostra ser:
Amostra = {20, 220, 420, 620, ..., 9820}

(C) AMOSTRAGEM POR CONGLOMERADO


Quando a populao apresenta uma subdiviso natural de grupos menores
(denominados

conglomerados),

sorteia-se

um

nmero

suficiente

desses

grupos

(ou

conglomerados) e dentro dos conglomerados sorteia-se parte dos elementos para compor a
amostra. Esse tipo de amostragem tem menor custo que os anteriores.
Exemplo: Estimar o nmero de cabeas de gados de certa regio. Sorteiam-se alguns municpios
dessa regio e dentro deles algumas propriedades para compor a amostra.
(D) AMOSTRAGEM ESTRATIFICADA
A populao constituda de subpopulaes (estratos) que so homogneos
internamente, podendo ser heterogneos de estrato para estrato. Dessa forma, a amostragem
deve ser realizada fazendo com que todos os estratos populacionais sejam representados na
amostra final obtida. Para especificar nmero de elementos/estrato que ir compor a amostra, so
considerados trs mtodos: uniforme, proporcional e tima. Esses mtodos dependem
basicamente do tamanho dos estrados populacionais e de sua variabilidade.

59

ESTATSTICA BSICA
(i) UNIFORME

De K estratos retiram-se amostras de mesmo tamanho. Usada quando os estratos


populacionais possuem o mesmo tamanho (freqncia). O tamanho amostral do i-simo estrato
dado por:

ni =

n
K

A seguir apresentada uma situao fictcia de uma determinada regio em que


se pretendia amostrar n = 50 propriedades de uma populao com N = 500 propriedades rurais
distribudas em relao ao tamanho de suas reas conforme Tabela 3.1, apresentada a seguir. A
varivel estratificadora foi o tamanho da rea e objetivo da pesquisa era caracterizar o padro
tecnolgico da agricultura utilizada na regio. Essa varivel foi escolhida como estratificadora por
considerar que o grau de tecnologia dependa do tamanho da propriedade.
reas (ha)

Nmero de propriedades

Tamanho amostral

0 2

100

10

2 5

98

10

5 10

104

10

10 20

102

10

20 40

96

10

Total

500

50

Tabela 3.1. Nmero de propriedades amostradas uniformemente de uma populao estratificada


pela rea.
Em cada estrato uma amostragem simples ao acaso ou uma amostragem
sistemtica realizada para retirar os 10 elementos necessrios pesquisa.
(ii) PROPORCIONAL
Esse tipo de amostragem realizado quando os tamanhos dos estratos
populacionais so distintos. O estrato i fornece uma quantidade ni de elementos, proporcional ao
tamanho Ni populacional do respectivo estrato, para formar a amostra de tamanho n. O tamanho
do estrato i (i = 1,2, ..., K) dado por:

ni =

Ni
N

60

DANIEL FURTADO FERREIRA

A seguir apresentada uma outra situao em uma outra regio que se pretendia
caracterizar o padro tecnolgico da agricultura utilizada. Conforme o caso anterior uma amostra
de n = 50 elementos deve ser extrada da populao de N = 1.000 propriedades existentes e
distribuda conforme as reas apresentadas na Tabela 3.2.
reas (ha)

Nmero de propriedades

Tamanho amostral

0 2

500

25

2 5

320

16

5 10

100

10 20

50

20 40

30

1000

50

Tabela 3.2. Nmero de propriedades amostradas proporcionalmente de uma populao


estratificada quanto rea.

(iii) TIMA
Nesse tipo de amostragem so considerados o tamanho a variabilidade de cada
estrato populacional para a extrao da amostra. De cada estrato retira-se uma quantidade ni de
elementos, a qual proporcional ao tamanho (Ni) e ao desvio padro populacional do respectivo
estrato (i), dada por:

ni =

N i i n
k

N i i

i =1

As principais caractersticas desse mtodo podem ser resumidas por:


a obteno de informaes sobre a populao otimizada, pois no estrato que houver menor
variao haver uma menor quantidade de elementos amostrados;
a necessidade de conhecer o desvio padro populacional em cada estrato, para a varivel
estratificadora a principal dificuldade. Dessa forma, a variabilidade da varivel estratificadora
que tem influencia direta na varivel resposta alvo da pesquisa pode ser usada. Tambm,

ESTATSTICA BSICA

61

possvel realizar amostragens piloto em cada estrato e obter estimativas dessa variabilidade.
Esses procedimentos, no entanto, no garante a optimalidade do mtodo.

3.2.2. AMOSTRAGEM NO-PROBABILSTICA


(A) INACESSIBILIDADE A TODA POPULAO
Amostragem realizada na parte da populao que acessvel.
Exemplo. Fabricao de um certo implemento agrcola: amostra realizada nos implementos
produzidos, a outra parte hipottica (no foi ainda produzida).
(B) AMOSTRAGEM SEM NORMA (A ESMO)
No se usa nenhum sorteio embora o amostrador procure ser aleatrio.
Exemplo: Escolher 100 galinhas num galinheiro com 3.000 aves.
Se a populao for homognea, ento o processo equivalente amostragem
probabilstica.
(C) POPULAO FORMADA DE MATERIAL CONTNUO
Exemplo: Liquido ou gs homogeneizar e retirar a amostra a esmo. Obs. impraticvel sortear.
(D) INTENCIONAL
O pesquisador escolhe deliberadamente certos elementos para formar a amostra,
baseado num pr-julgamento. Por exemplo, uma pesquisa de mercado para lanar uma nova
marca de leite tipo longa vida realizada. O pesquisador selecionou apenas indivduos com poder
aquisitivo mdio/alto.

DANIEL FURTADO FERREIRA

62

3.3. EXERCCIOS

1. As 35 plantas de uma de uma determinada espcie (populao), pertencentes a um parque


ecolgico, possuem os seguintes dimetros a altura do peito em cm (DAP): 25, 20, 35, 21, 22,
22, 24 25, 30, 38, 24, 20, 20, 25, 20, 19, 25, 23, 20, 24, 28, 24, 24, 22, 28, 26, 23, 25, 22, 27,
25, 23, 28, 27, 22. Com o objetivo de estimar o DAP mdio, como voc extrairia uma amostra
simples ao acaso, de tamanho n=10 desta populao. D todos os detalhes.
2. Suponha que as plantas desta populao estejam distribudas em 5 fileiras de 7 plantas. Faa
uma amostragem sistemtica de 10 plantas, d os detalhes do processo amostral e do sorteio
realizado.

3. Uma empresa agrcola tem 3.414 empregados repartidos nos seguintes setores:
Setores

Nmero de funcionrios

Administrativo
314
Transporte
948
Campo
1.451
Outros
701
Para se estudar o nvel salarial mdio da empresa, resolveu-se fazer uma amostra de 50
funcionrios. Voc julga que a ASA seria apropriada, para este caso? Se afirmativo, justifique sua
resposta, caso contrrio, discuta qual mtodo seria adequado? detalhe o processo de amostragem
neste caso.
4. Quais so as situaes em que a amostragem estratificada deve ser preferida amostragem
simples ao acaso?
5. Qual a principal diferena entre amostra probabilstica e no-probabilstica?
6. Diferencie: ASA e amostra sistemtica, amostra estratificada e amostra sistemtica?
7. Qual a principal idia sob a determinao do tamanho do estrato na amostragem estratificada
tima, em relao variabilidade do estrato populacional i?

CAPTULO IV - DISTRIBUIO DE
AMOSTRAGEM

4.1. IMPORTNCIA

A inferncia estatstica baseada nas distribuies amostrais e na teoria


probabilstica. Por exemplo, se existe interesse em saber a incidncia de doenas em uma cultivar
em uma regio especifica, deve-se realizar um estudo baseado em dados amostrais ou
experimentais. Para se fazer inferncia necessrio saber como as estimativas variam de amostra
para amostra, como so os erros de estimao e qual modelo probabilstico pode ser usado para
esse propsito. O que se deseja determinar como o processo de distribuio amostral. No
Quadro 4.1 apresenta-se o esquema da distribuio amostral em que uma populao com um
parmetro desconhecido reamostrada um nmero grande (k), s vezes infinito, de vezes e as
estimativas ti de um estimador T de so obtidas. O interesse est na distribuio de T.

POPULAO

AMOSTRAS

1 t1

2 t2

Parmetro

populacional

desconhecido

K tk
Quadro 4.1. Descrio do processo de amostragem, onde k amostras so retiradas de uma
populao com um parmetro de interesse e se obtm estimativas ti, i=1,2...,k.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

64

Resumo do processo descrito no Quadro 4.1:

(i) Dada uma populao com um parmetro de interesse, que pode ser a mdia (), varincia
(2), proporo (P), etc.
(ii) Retiram-se k amostras por um processo aleatrio qualquer.
(iii) Calcula-se o valor t para cada amostra da estatstica T.
Obs. A estatstica T representa um estimador de . Assim, por exemplo, se refere-se mdia
populacional, T ser a mdia amostral.
(iv) Com os valores t1, t2, ..., tk (estimativas) das K amostras faz-se a distribuio de T.

FIGURA 4.1. Distribuio amostral do estimador T

Nesse processo algumas definies devem ser formalizadas para que o leitor possa ter
uma ampla caracterizao de todo ele.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

65

Definies
Parmetros Constantes inerentes a populaes relacionadas a uma determinada varivel de
interesse (X);

Estimador ou estatstica - uma varivel aleatria que funo dos elementos amostrais Xi,
i=1,2, ..., n.

Exemplo: A mdia amostral ( X ) um estimador de (parmetro populacional).

Estimativa - o valor numrico do estimador em uma determinada amostra.

4.2. DISTRIBUIO AMOSTRAL DAS MDIAS


So apresentadas a seguir as distribuies amostrais das mdias e das diferenas
entre mdias.

4.2.1. DISTRIBUIO DE X

Para se ilustrar o processo de distribuio amostral das mdias considerada uma


populao uniforme discreta com trs valores apresentados a seguir. A populao considerada e
seus respectivos parmetros so:

Pop. = {1, 2, 3} N=3, =2,0 e 2=2/3

Na obteno da distribuio de amostragem das mdias podem ser retiradas


amostras com ou sem reposio dessa populao, como j comentado anteriormente. Esses dois

CEX 117 - ESTATSTICA

66

DANIEL FURTADO FERREIRA

processos so descritos a seguir utilizando amostras de tamanho n=2. Todas as possveis


amostras foram extradas dessa populao e a distribuio das mdias foi ento obtida.

(a) Amostras com reposio


Nesse processo cada elemento aps ter sido amostrado retorna a populao
podendo ser sorteado novamente. Considerando amostras de tamanho 2 (n=2) as mdias
amostrais correspondentes so apresentadas na Tabela 4.1.

Amostras

Amostras

Amostras

1,1

1,0

2,1

1,5

3,1

2,0

1,2

1,5

2,2

2,0

3,2

2,5

1,3

2,0

2,3

2,5

3,3

3,0

Tabela 4.1. Amostras e mdias amostrais possveis retiradas de uma populao de tamanho igual
a 3.

Calculando-se a mdia de todas as mdias amostrais:

X =

1,0 + 1,5 + 2,0+...+3,0


= 2,0
9

Logo,

X = = 2,0

possvel provar que a mdia das mdias amostrais igual a mdia populacional,
para todas os tamanhos de amostras e para todas as populaes amostradas.

Varincia das mdias amostrais amostrais:

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

67

9 2

X
1 9 2 i=1
= X

9 i=1
9

Dividindo 2/ X = n = 2

X =

possvel demonstrar que a varincia das mdias amostrais sempre igual a


varincia da populao dividida pelo respectivo tamanho da amostra.

Fazendo a distribuio de freqncia e o histograma:


X

Fi

1,0

1,5

2,0

2,5

3,0

Total

Tabela 4.2. Distribuio de freqncias das mdias amostrais para amostras de tamanho n=2
retiradas com reposio.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

1.0

1.5

2.0

2.5

68

3.0

Figura 4.2. Distribuio amostral das mdias - amostragem com reposio e n=2.

Se n = 1:

Figura 4.3. Distribuio amostral das mdias - amostragem com reposio e n=1.

medida que n aumenta o histograma, ou a distribuio de freqncia vai se tornando mais


concentrada em torno da mdia populacional. Quando n suficientemente grande a distribuio
de

vai se aproximando da distribuio normal independentemente da distribuio

populacional. Esse resultado conhecido como Teorema do Limite Central (TLC).

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

69

TLC: A distribuio das mdias amostrais obtidas de amostras de tamanho n selecionadas ao


acaso de uma populao qualquer com tamanho N, mdia e varincia 2, ser
2

X =

aproximadamente normal com X = e

reposio com populao infinita) ou

populao finita

n
N

2
X

(amostragem com reposio ou sem

N n
N 1

(amostragem sem reposio com

0,05 ). Se n30 a aproximao considerada boa.

(b) Amostras sem reposio

Utilizando o mesmo exemplo, com n=2 e N=3 tem-se:

Amostras

1,2

1,5

1,3

2,0

2,3

2,5

Quadro 4.2. Distribuio das mdias amostrais retiradas sem reposio de uma populao de
tamanho 3.

Verifica-se que:

X = = 2,0

2
X

N n
N 1

= (2/3)/2 x (3-2)/(3-1) = 1/6

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

70

Esse resultado vlido para todas as populaes finitas. Para populaes infinitas, o fator
de correo na expresso da varincia

Nn

no deve ser usado. Assim, em populaes


N 1

infinitas mesmo que a amostra seja realizada sem reposio a varincia populacional dada por
2

X =

N n
N 1

4.2.2. DISTRIBUIO AMOSTRAL DAS DIFERENAS DE MDIAS.

Para descrever essa distribuio amostral considere duas populaes com


diferentes mdias e varincias, conforme apresentado no esquema seguinte. Se forem retiradas
todas (infinitas ou no) amostras de tamanhos n1 da primeira populao e todas de tamanho n2 da
segunda e forem obtidas todas as diferenas possveis entre as mdias das amostras da
populao 1 em relao s mdias das amostras da populao 2 e ento obtida a distribuio de
amostragem dessa diferena possvel fazer inferncias com base nesses resultados para os
parmetros 1 e 2.

Pop 1 -

1
2

X1 =

AMOSTRAS
n1

n1
Xi
i =1

n1

Pop. 2 -

2
2

X2 =

AMOSTRAS
n2

n2
Xi
i =1

n2

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

71

Se for calculada todas as diferenas entre as mdias X 1 e X 2 para todas as


amostras possveis de cada populao e obter-se sua distribuio, ento a mdia e varincia
dessa distribuio so:

X1 X 2 = 1 2

2X 1 X 2 =

12
n1

22
n2

Exemplo: Um vendedor afirma que duas raes possuem o mesmo efeito no ganho de pesos de
determinados animais, i. e., 1=2. Em um ensaio obtiveram-se os seguintes resultados:

Rao A

Rao B

n1=30

n2=30

X 1 =33Kg

X 2 =30Kg

S1=5Kg

S2=4Kg

Quadro 4.3. Resultados do ganho de pesos de animais aps terem sido submetidos as raes A e
B, respectivamente, durante 1 semana.

Com base nesse ensaio, voc acredita na afirmao do vendedor?


1 - 2=0 por hiptese 1 - 2 0 (por suspeita que a mdia da rao A superior a da rao
B, ou seja, que a rao A mais eficiente que a rao B, quanto ao efeito no ganho de peso dos
animais, por hiptese).
Calculam-se em seguida as estimativas das varincias da diferena entre as
mdias. E adotando que as diferenas das mdias amostrais possuem distribuio normal tem-se:

S 2X 1 X 2 =

S 12
n1

S 22
n2

25 + 16
30

= 1,3667

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

72

Como os parmetros da distribuio normal so desconhecidos usa-se a


estimativa da varincia no lugar desse parmetro. A distribuio normal nesse caso apenas
aproximada e vlida para grandes amostras. O valor padronizado de Z, considerando a hiptese
de igualdade das mdias das duas populaes como verdadeira :

ZC =

3 0
1,3667

= 2,57

Para testar a hiptese de que as raes no diferem quanto ao ganho de peso proporcionado,
deve-se calcular a probabilidade de que o ganho de peso padronizado supere o limite de 2,57.
Em outras palavras, seria determinar a probabilidade, adotando a hiptese de que as raes so
iguais, de que a diferena de 3kg observada foi devido apenas ao acaso.

P(Z>Zc) = P(Z>2,57) = 0,50-0,4949 = 0,51%

Sob a hiptese de que as raes no possuem efeitos diferenciais, a probabilidade


que a diferena amostral de 3kg entre as duas raes, seja devida ao acaso de apenas 0,51%.
Portanto mais fcil acreditar que as raes A e B tenham efeitos diferentes para o ganho de peso
dos animais, do que acreditar que a diferena amostral de 3kg seja devida ao acaso, haja vista, a
pequena probabilidade (0,51%) de que essa diferena seja devida ao acaso.

4.3. DISTRIBUIO DE t, 2 E F

Outras importantes distribuies amostrais que desempenham papel crucial na


estatstica so as distribuies t, qui-quadrado e F. Essas distribuies participam dos testes de
hipteses e da estimao de parmetros das amostragens de populaes normais ou
aproximadamente normais.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

73

(A) DISTRIBUIO DE t DE STUDENT

Foi visto que as mdias amostrais segue a distribuio normal, i. e., X n


N( X = ; 2X =

2
n

), dessa forma, pode-se obter o valor da curva normal padronizada, N(0,1),

calculando o valor padronizado por:

ZC =

que tambm segue a distribuio normal padro, N(0,1).


No entanto, se no se conhece a varincia populacional, situao mais comum na
pratica, e se as amostras forem pequenas (n<30), e S2 (varincia da amostra), sujeita variao
amostral, for usada como estimador de 2, os valores estandardizados, de uma populao normal:

tC =

X
S
n

seguem uma distribuio de t de Student, com n-1 graus de liberdade:

Caractersticas da distribuio de t
(i) Simtrica em relao mdia;
(ii) Forma de sino;
(iii) Quando n tende para infinito, a distribuio de t, se torna equivalente distribuio normal;
(iv) Possui n-1 graus de liberdade.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

74

Exemplo: Um agricultor afirma que sua produtividade mdia de 2,20t/ha. Um agrnomo numa
amostra de n=25 parcelas obteve uma mdia de 1,70t/ha, e desvio padro de 0,8t/ha. Baseado no
resultado da amostra possvel que o agricultor esteja superestimando sua produtividade mdia?
considerado, para fins de se avaliar a afirmao feita, que a produtividade mdia
de 2,20t/ha seja verdadeira. Usando este valor como verdadeiro determinar se a diferena de
0,50t/ha (2,2-1,70) devida apenas ao acaso, ou realmente porque a hiptese falsa. Para isso,
calcula-se a probabilidade de que a diferena encontrada seja devida ao acaso, usando a hiptese
como verdadeira. Se esta probabilidade baixa, mais fcil acreditar que a hiptese falsa, do
que ela ocorreu devido ao acaso. O valor de t calculado :
tC =

1,7 2,2
= 3,125
0,8
25

A avaliao da probabilidade exata na distribuio de t difcil de ser obtida,


exceto quando se utilizam alguns softwares de estatstica e probabilidade. Portanto, so definidas
regies que correspondem a probabilidades pequenas (5% e 1%) divididas nos extremos da curva,
como ilustrado na Figura 4.4. Se o valor de tc cai numa destas regies a probabilidade do evento
ter ocorrido devido ao acaso deve ser menor que os nveis estipulados. Desta forma, para o
exemplo, o valor de tc=-3,125 caiu na regio achurada, apresentada na Figura 4.4.

9 5 %

2 ,5 %

2 ,5 %
-2 ,0 6 4

2 ,0 6 4

FIGURA 4.4. Regio crtica ou de rejeio da hiptese da distribuio amostral de t para uma
amostra de n=25, com mdia 1,70t/ha e desvio padro de 0,8t/ha.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

75

Concluso: Como o valor de tc=-3,125 supera o valor em mdulo de t tabelado ao nvel de 95%
de confiana, rejeita-se a afirmao do agricultor.

(B) DISTRIBUIO DE

(QUI-QUADRADO)

2
A varivel aleatria obtida por: =

( n 1) S 2

, definida como qui-quadrado. Sua

distribuio conhecida por distribuio de qui-quadrado, sendo tambm dependente do nmero


de graus de liberdade (n - 1), como na distribuio de t de Student.
Esta distribuio usada principalmente, entre diversas aplicaes, na
determinao de intervalos de confiana para varincias e desvios padres. Curvas de aderncia
entre uma distribuio terica e uma distribuio experimental, e ajuste de freqncias tericas
esperadas e freqncias experimentais observadas. Detalhes de sua utilizao sero vistos no
captulo de estimao.

Exemplo: Qual o valor de 2 cuja rea acima do mesmo de 5%, obtido numa amostra de
n=25.

Consultando a tabela de qui-quadrado para 24 graus de liberdade e 5% de


probabilidade, tem-se a representao apresentada na Figura 4.5. O valor de qui-quadrado
tabelado 36,415.

CEX 117 - ESTATSTICA

DANIEL FURTADO FERREIRA

76

95 %
R eg io de aceitao
de H0

R eg io d e reje io de H 0
5%

0
0

3 6,41 5

FIGURA 4.5. Regio crtica ou de rejeio da hiptese da distribuio de qui-quadrado para uma
amostra de n=25.

(C) DISTRIBUIO F DE SNEDECOR

S1

A estatstica definida por: F =

2
2

segue a distribuio F de Snedecor. usada

2
2

para testar a igualdade entre duas varincias e na anlise de varincia (estatstica experimental),
para se efetuar o teste da hiptese de igualdade de efeitos tratamentos que se deseja comparar.
As tabelas de F, so consultadas de acordo com os graus de liberdade (n1-1) associados
varincia 1 (numerador da expresso) na primeira linha, e graus de liberdade (n2-1) associados
varincia 2 (denominador da expresso) na primeira coluna, e probabilidade desejada.

CEX 117 - ESTATSTICA

77

DANIEL FURTADO FERREIRA

n1-1
n2-1

1
F 1 F 2 F3 F4 F 5
2
3
4
.
.
.

F 1 F 2 F3 F4 F 5
QUADRO 4.4. Esquema da tabela de F, para n1-1 e n2-1 graus de

...

.
.
.
.
.
.

F
liberdade. Os valores Fi

representam os valores tabelados da distribuio de F.

4.4. DISTRIBUIO DE AMOSTRAGEM DE PROPORES (P)

Para se estudar a distribuio de amostragem para propores, a


populao considerada foi definida no esquema 4.1. A partir desta populao sero realizadas
diversas amostragens.

POPULAO

Parmetro populacional desconhecido

N1

P=N1/N

N
ESQUEMA 4.1. Populao de tamanho N, com N1 elementos que constitui um evento de interesse
para o pesquisador, Neste caso, P representa a proporo de elementos favorveis do evento, em
relao populao.

CEX 117 - ESTATSTICA

78

DANIEL FURTADO FERREIRA

A partir do esquema 4.1, definiu-se:


N: tamanho total da populao; por exemplo, total de plantas doentes e sadias de um campo de
produo de sementes genticas.

N1: nmero total de elementos da populao que constituem um evento de interesse do


pesquisador. Por exemplo, o numero de plantas doentes deste campo de produo de
sementes.
Se for realizado um processo de amostragem, com K amostras, tem-se a
distribuio de amostragem apresentada no Quadro 4.5.

Amostras

Tamanho

Estimador
P 1 =

P 2 =

P k =

n1
n

n2
n

.
.
nk
n

QUADRO 4.5. Distribuio de amostragem para K amostras de tamanho n retiradas de uma


populao de tamanho N.

Fazendo a distribuio de P , tem-se a distribuio amostral das propores, cuja


mdia e varincia so:

P = P e

P2 =

P(1 P)
n

Se np5 a distribuio pode ser bem aproximada pela normal. Com populaes
finitas e amostras sem reposio, a mdia e varincia so:

CEX 117 - ESTATSTICA

P = P e

DANIEL FURTADO FERREIRA

P2 =

79

P(1 P) N n
x
n
N1

Se for feita a distribuio do nmero de sucessos ni ao invs de P , tem-se a


distribuio definida com mdia e varincias:

X = nP e

2X = nP(1 P)

E para populaes finitas e amostragem sem reposio:

X = nP e

N n

N 1

2X = nP(1 P)

Pode ser observado que se trata da distribuio binomial, j estudada

tambm binomial, embora possa ser aproximada pela


anteriormente. Assim, a distribuio de p
normal em algumas situaes de p prximo a e n grande.

CAPTULO V - TEORIA DA ESTIMAO

5.1. IMPORTNCIA NAS CINCIAS AGRRIAS

Foi visto que a inferncia estatstica tem por objetivo fazer generalizaes sobre
uma populao com base em dados amostrais, uma vez que os parmetros populacionais so
desconhecidos na maioria das situaes prticas. Muitos problemas, na rea agrcola, necessitam
desse tipo de inferncia.

POPULAO

AMOSTRA

Parmetros populacionais desconhecidos

Estimadores amostrais

TABELA 5.1. Descrio do processo de amostragem de uma populao com parmetros


desconhecidos com os respectivos estimadores (ou estatsticas).

Na inferncia pode-se salientar


(a) Estimao de parmetros: o processo que usa os resultados amostrais (estatsticas) para
inferir, fazer afirmaes ou conjecturas, sobre a populao (parmetros);
(b) Testes de hipteses sobre parmetros populacionais.

5.2. ESTIMAO POR PONTO E POR INTERVALO

(a) Estimao por ponto: obtm-se nesse caso um nico valor amostral. Ex. X uma estatstica
usada para fazer a estimao por ponto de .

ESTATSTICA

81

Obs. Como j foi visto, o estimador (ou estatstica) uma varivel aleatria que funo dos
elementos amostrais e a estimativa o valor numrico obtido pelo estimador em uma certa
amostra.

Principais propriedades de um estimador

(i) No viciado ou no viesado: Quando sua esperana (valor mdio) igual ao prprio valor do
parmetro populacional que se pretende estimar.

Ex. E( X ) = , portanto X um estimador no viciado de ; por outro lado, E(S) , portanto S


um estimador viciado de .

(ii) Consistncia: Um estimador ser consistente se alm de no viciado sua varincia tende para
zero, quando n tende para .
Ex. Como, E( X )= e lim X2 = lim
n

2
n

= 0 , portanto, X um estimador consistente de .

(iii) Eficincia: o estimador de maior eficincia o que possui menor varincia.

(b) Estimao por intervalo

A estimao por intervalo feita quando a partir da amostra procura-se construir


intervalos de confiana, com uma certa probabilidade, de conter o parmetro populacional. As
probabilidades utilizadas so em geral de 95% e 99%. As estimativas por ponto, as quais foram
vistas at agora, so usadas quando se necessita, pelo menos aproximadamente, conhecer o
valor do parmetro para utiliz-lo numa expresso qualquer.
No entanto, os estimadores so variveis aleatrias, e as estimativas obtidas
quase certamente so distintas do valor do parmetro, ou seja, quase certamente se comete um
erro de estimao. Por esta razo torna-se necessrio construo de intervalos de confiana que

DANIEL FURTADO FERREIRA

82

tenha probabilidade (1-) de conter o valor do parmetro. O nvel chamado de nvel de


significncia, e refere-se probabilidade de se cometer o erro tipo I, rejeitar uma hiptese
verdadeira. No caso, o nvel de probabilidade , refere-se probabilidade do IC no conter o valor
paramtrico. Como os nveis de confiana so, em geral, fixados com 95% e 99%, ser igual a
5% e 1%, respectivamente. Um pesquisador desavisado, poderia pensar em diminuir o mximo
possvel o valor de , no entanto, conveniente lembrar neste instante que este valor
inversamente proporcional a probabilidade de se cometer o erro tipo II. Ento, no se pode reduzir
demasiadamente o valor de , sem aumentar a probabilidade de se aceitar uma hiptese falsa
como verdadeira (erro tipo II).

Exemplo de IC: Com 95% de confiana a verdadeira mdia da produtividade de milho BR201 est

entre [4,0 t/ha; 6,0 t/ha], para um determinado nvel de utilizao de tecnologia.

5.3. ESTIMAO DE MDIAS, VARINCIAS PROPORO E COEFICIENTE


DE VARIAO.
Ser visto nos itens subsequentes, a estimao por intervalo dos principais
parmetros estudados no curso de estatstica. Todos os exemplos apresentados adotam os nveis
de 95% ou 99% de confiana.

5.3.1. INTERVALO DE CONFIANA PARA

Como foi visto no captulo de distribuio de amostragem (captulo IV), na prtica


no se conhece a varincia populacional (2) e deve-se usar seu estimador amostral (S2). Nesse
caso a distribuio de X ser aproximadamente normal. Quanto maior o tamanho de n, melhor
ser a aproximao. Na prtica, quando n30, a aproximao considerada boa, e a distribuio
normal pode ser usada.

83

ESTATSTICA

No entanto quando n<30, o estimador da varincia populacional (S2), est sujeito


s variaes amostrais, e a distribuio de t mais apropriada. Por outro lado, foi comentado que
quando n aumenta a distribuio de t de Student se aproxima da distribuio normal. Por essa
razo, ser usada somente a distribuio de t, independentemente do tamanho da amostra. No
entanto, o pesquisador fica livre para escolher entre as duas distribuies quando n30. A seguir,
esto apresentadas as regras para se obter os IC para , de populaes finitas e infinitas e
amostragem com ou sem reposio.

Populaes infinitas ou finitas e amostras com reposio


Sabe-se, como j abordado no captulo IV, que X N(,

). No entanto, como

em geral, nas situaes prticas, no se conhece a varincia populacional, ento se deve utilizar o
estimador, S2, e a distribuio de t, como j argumentado anteriormente. Desta forma, a regra para
construo do IC neste caso :

IC1-: X e

onde, e =

t/2

S
n

e t/2 com n - 1 graus de liberdade (GL).

Populaes finitas ( > 0,05 ) e amostras sem reposio.


N

A regra geral a mesma para o caso da amostragem ser feita com reposio de
populaes finitas ou amostragem com ou sem reposio de populaes infinitas, e est
apresentada a seguir:

IC1-: X e

84

DANIEL FURTADO FERREIRA

onde, e = z / 2

S
n

Nn
e t/2 com n - 1 graus de liberdade (GL), sendo a nica alterao o
N 1

fator de correo para amostragem sem reposio de populaes finitas.

5.3.2 INTERVALO DE CONFIANA PARA P (PROPORO)

As mesmas observaes usadas para mdia valem para as propores, no que se


refere-se ao uso de um estimador da varincia populacional, que neste caso


pq
n

. No entanto

neste caso, devido a algumas consideraes de ordem terica que no sero abordadas neste
material, por fugir do seu objetivo, a distribuio de amostragem aproximada a normal. Neste
caso usada a distribuio normal para construir os intervalos de confiana, alm de outras
aproximaes que fornecem melhores resultados. As aproximaes do intervalo de confiana so
apresentadas a seguir. Primeiramente apresentada a aproximao de normal e posteriormente,
sero apresentados dois mtodos aproximados e um exato.

5.3.2.1. IC para P utilizando a aproximao normal

A seguir sero apresentados os IC obtidos a partir da aproximao normal. Esta


aproximao recomendada quando p tende para 0,5 e n tende para .

Populaes infinitas ou finitas e amostras com reposio

ESTATSTICA

85

O IC dado pela regra geral:


IC1-: p e

onde, e = z / 2


pq
.
n
n

Populaes finitas ( > 0,05 ) e amostras sem reposio


N

Da mesma forma anterior, o intervalo de confiana aproximado :

IC1-: p e

onde, e = z / 2


pq
n

Nn
, sendo a nica alterao o fator de correo para amostragem sem
N 1

reposio de populaes finitas.


conveniente salientar que a aproximao normal para populaes finitas apenas uma
aproximao grosseira, uma vez que o modelo normal assume populaes infinitas. Mesmo em
condies favorveis de P prximo a ou grandes tamanhos amostrais, tal aproximao ainda
considerada grosseira.

5.3.2.2. IC para P de Blyth

Outras aproximaes baseadas na distribuio normal so conhecidas na literatura


e apresentadas a seguir. A primeira delas devida a Blyth (1986) baseada na seguinte
padronizao, a qual tem distribuio aproximadamente normal, mas que no pode ser utilizada
em situaes reais devido ao fato de exigir que o parmetro binomial p seja conhecido. Em todos
os casos so apresentadas as seguintes definies necessrias para a obteno do intervalo de
confiana. Seja n o tamanho da amostra e y o nmero de sucessos (y=0, 1, 2, ..., n-1, n).

DANIEL FURTADO FERREIRA

86

Nos casos especiais em que y=0 e y=n, deve-se proceder da seguinte forma:

Se y=0, o LI do IC tomado como 0 e o LS obtido conforme a expresso apresentada.


Se y=n, o LS do IC tomado como 1 e o LI obtido conforme a expresso apresentada.

y + 0,5 np
np(1 p )

= z / 2

Elevando ao quadrado, ambos os lados desta expresso e resolvendo a equao


quadrtica em p, e checando as razes para satisfazer a expresso, o resultado :

LI =
1+

( z / 2 ) 2
n
1

LS =
1+

( z / 2 ) 2
n

y 0,5 z / 2

n
n

y + 0,5 z / 2

+
n
n

2
( z / 2 ) 2
y 0,5 y 0,5 ( z / 2 )

+
1
+
4n
2n
n
n

2
( z / 2 ) 2
y + 0,5 y + 0,5 ( z / 2 )

+
1
+
4n
2n
n
n

5.3.2.3. IC para P de Pratt

Usando a aproximao de qui-quadrado para F, Pratt (1968) derivou a forma


alternativa para os limites de confiana para o parmetro binomial, a qual apresentada a seguir.

87

ESTATSTICA

2
2
y 81y( n y +1) 9n 8 + 3 z / 2 9y( n y +1)(9n + 5 z / 2) + n +1
LI = 1+

n y +1
[81y2 9y(2 + z2 / 2) +1]

2
2
y +1 81( y +1)( n y) 9n 8 3 z / 2 9( y +1)( n y)(9n + 5 z / 2) + n +1
LS = 1+

n y
[81( y +1)2 9( y +1)(2 + z2 / 2) +1]

5.3.2.4. IC exato para P utilizando a distribuio de F

O intervalo de confiana exato para o estimador de mxima verossimilhana de P


dado por p =

y
n

, em que y representa o nmero de sucessos do evento sob estudo em uma

amostra de tamanho n, geralmente obtido por processos numricos iterativos. Estes processos
se tornam lentos, em geral, quando n e y crescem, requerendo grande quantidade de tempo de
computao.
Um intervalo de confiana exato, utilizando a distribuio de F apresentado por
Leemis & Trivedi (1996). Este intervalo em geral de rpido clculo, vistos que muitos softwares j
apresentam os percentis da distribuio de F em suas rotinas. Este intervalo apresentado a
seguir:

1
1
IC1-:
;
ny +1
ny
1+
1+

yF2 y;2(n y + 1);1 / 2


(y + 1)F2( y + 1);2( n y ); / 2

em que, F refere-se ao valor cuja probabilidade /2 ou 1-/2 da cauda superior direita da


distribuio de F; n o tamanho da amostra e y o nmero de sucessos (y=0, 1, 2, ..., n-1, n).

Nos casos especiais em que y=0 e y=n, deve-se proceder da mesma forma
descrita anteriormente, ou seja:

88

DANIEL FURTADO FERREIRA

Se y=0, o LI do IC tomado como 0 e o LS obtido anteriormente.


Se y=n, o LS do IC tomado como 1 e o LI obtido anteriormente.

Convm lembrar que uma importante propriedade da distribuio de F permite que


sejam obtidos os percentis 1-/2 a partir dos percentis /2, da seguinte forma:

Fv1, v 2,1 / 2 =

1
Fv 2, v1, / 2

5.3.2.5. Exemplos

a) n=10 y=3 =0,05 p =0,30

Mtodo

LI

LS

1 - Exato

0,067

0,652

2 - Aproximao normal

0,016

0,584

3 Aproximao de Blyth

0,081

0,646

4 - Aproximao de Pratt

0,065

0,652

LI

LS

1 Exato

0,212

0,400

2 - Aproximao normal

0,210

0,390

3 - Aproximao Blyth

0,215

0,401

4 - Aproximao Pratt

0,212

0,400

b) n=100 y=30 =0,05 p =0,30

Mtodo

89

ESTATSTICA

A aproximao normal a pior de todas, principalmente quando p afasta-se de 0,5


e at mesmo quando n grande (n=100). A aproximao de Pratt a melhor aproximao dentre
todas as aproximaes, mesmo em situaes de p afastado de e/ou de n pequeno.

5.3.3. INTERVALO DE CONFIANA PARA DIFERENA DE MDIAS

Muitas vezes o pesquisador se depara com o problema de estimar o efeito


diferencial entre duas populaes ou entre dois tratamentos, para alguma varivel de interesse.
Estas inferncias sobre as mdias de duas populaes podem ser feitas utilizando os IC para
diferenas entre as mdias destas populaes.

(a) Varincias populacionais desconhecidas e diferentes ( 12 22 )

Foi visto, no captulo de distribuio de amostragem, captulo IV, que a distribuio


da diferena entre mdias, aproximadamente normal, com mdia 1 2 e varincia

12
n1

22
n2

No entanto, como, em geral, no se conhece na prtica a varincia de ambas as populaes,


deve-se utilizar, os estimadores amostrais. Desta forma, como j comentado nos casos anteriores,
a distribuio apropriada a distribuio de t de Student. No caso de varincias populacionais
diferentes, o teste t apenas aproximado. As razes deste fato esto fora do propsito deste
material, e no ser discutido. Neste caso, a regra geral, :

IC1-: X1 X 2 e

90

DANIEL FURTADO FERREIRA


2

onde,

e= t

S1 + S2
n1 n2

possui graus de liberdade, dados por Satterthwaite (1946):


2

S12 S22
+

n1 n2
=
2
2
S12 S22

n1 n2
+
n1 1 n2 1

(b) Varincias populacionais desconhecidas e iguais (1 = 2 )


2

As mesmas consideraes feitas no item (a) se aplicam aqui tambm. No entanto,


quando as varincias so iguais, como neste tpico, o teste t exato. Por outro lado, algum pode
questionar: se as varincias populacionais so desconhecidas, como se pode afirmar que elas so
iguais ou diferentes? A resposta, para essa pergunta, poder ser formulada apenas no captulo
seguinte, em que ser apresentado, baseado nos estimadores das varincias populacionais, um
teste para a hiptese de igualdade das varincias populacionais. Neste captulo, a informao de
que as varincias populacionais so iguais ou diferentes, ser fornecida, at que seja apresentado
o teste comentado. Desta forma, a regra geral :

IC1-: X1 X 2 e

em que,

e= t SP

n1 n2

possui n1 + n2 - 2 graus de liberdade. Como as varincias das

duas populaes so iguais, uma melhor estimador da varincia comum obtida pela mdia
ponderada das varincias amostrais, cujos pesos so os graus de liberdade de cada amostra. Esta
varincia definida por SP2 , onde o subscrito p refere-se a palavra americana pooled que

91

ESTATSTICA

significa, combinada. Portanto, o smbolo SP refere-se ao estimador do desvio padro combinado,


o qual apresentado a seguir:

( n1 1) S12 + ( n 2 1) S22

Sp =

n1 + n 2 2

5.3.4. INTERVALO DE CONFIANA PARA VARINCIA DE UMA POPULAO


NORMAL.

Como foi visto no captulo IV,

(n 1) S2

segue a distribuio de 2. Portanto pode-

se construir o IC para 2, baseado nesta distribuio, da seguinte forma:

(n 1) S2

IC1-:

em que, 1 / 2 e
2

/ 2
2

(n 1) S2

2
1/ 2

2 / 2 so os valores da distribuio de qui-quadrado com n - 1 graus de

liberdade.

5.3.5. INTERVALO DE CONFIANA PARA DESVIO PADRO DE UMA


POPULAO NORMAL.

Da mesma forma que para varincia, o IC desvio padro dado pela regra geral
apresentada a seguir. Observe que se trata da raiz quadrada dos limites do IC para varincia.

92

DANIEL FURTADO FERREIRA

(n 1) 2
S

IC1-:

em que, 1 / 2 e
2

/ 2
2

(n 1) S2

2
1/ 2

2 / 2 so os quantis superiores da distribuio de qui-quadrado com n - 1

graus de liberdade.

5.3.6. INTERVALO DE CONFIANA PARA COEFICIENTE DE VARIAO

Seja, k =

S
um estimador do CV populacional K = , na escala de 0 a 1. Como

se sabe uma estimativa por ponto deste parmetro muito importante para se avaliar a
variabilidade de uma varivel de interesse e na experimentao para se avaliar a preciso
experimental. No entanto, o IC muito mais informativo para se inferir a respeito deste parmetro.
Para se obter o IC Vangen (1996) apresenta a expresso de McKay, relatada a
seguir. Sejam, U 1 = 2 ; / 2 e U 2 = 2 ; 1 / 2 os percentis 1-/2 e /2 da cauda direita da
distribuio de qui-quadrado com =n-1 graus de liberdade, ento o IC modificado de McKay para
o CV de uma populao normal :

k
k

;
IC1-/2:
U + 2
U + 2 2 U2
U
1
1 k 2 + 1 2
1 k +

+1

+1

Exemplo: Dada amostra com 5 tenses mensuradas em plantas: 326, 302, 307, 299, 329. As
estatsticas amostrais so: X = 312,6; S=13,94; k=0,0446. Com =0,05, determinar o IC para o CV
populacional.

ESTATSTICA

93

U1 = 24;0,025 = 11,14 e U 2 = 24;0,975 = 0, 4844 , ento:

IC0,95: [0,0267; 0,1287]

Observa-se que se trata de um intervalo assimtrico por ser baseado na


distribuio de qui-quadrado. Pode-se inferir tambm que, o CV populacional se encontra entre
2,67% e 12,87% com 95% de confiana.

EXEMPLOS

1. Em uma amostra de 25 plantas de uma variedade braqutica de milho foi encontrada a mdia de
altura de 122cm e varincia amostral de 28cm2. Obtenha o IC de 95% de confiana para a
mdia () da variedade em questo.

Como o tamanho da populao no foi fornecido, deve-se considerar que a frao da


amostra em relao ao da populao menor que 5%, devendo esta populao ser
considerada infinita. Com 95% de confiana tem-se que =0,05. Para graus de liberdade de
n-1=24 o valor de t0,025 2,064. Portanto:

e = 2,064

28
= 2,18 , logo,
25

IC0,95: 122 2,18 = [119,82; 124,18]

Com 95% de confiana pode-se afirmar que a mdia da variedade braqutica de


milho est compreendida entre 119,82cm a 124,18cm.

DANIEL FURTADO FERREIRA

94

2. De uma populao de tamanho N=40, foi retirada uma amostra de tamanho n=10. A mdia da
amostra foi de 130,2cm e a varincia foi de 69,2888cm2. Faa o IC para a mdia populacional
com 90% de confiana.

Com 90% de confiana tem-se que =0,10. Para graus de liberdade de n-1=9 o valor de
t0,05 1,833. Portanto:

e = 1833
,

69,2888 40 10
= 4,23 , logo,
10
40 1

IC0,90: 130,2 4,23 = [125,97; 134,43]

5.4. DIMENSIONAMENTO DE AMOSTRAS

O tamanho da amostra esta diretamente relacionado com a preciso das


estimativas. O erro "e" conhecido como semi-amplitude do IC. Assim, o pesquisador interessado
na estimao de um parmetro populacional com maior preciso do que a encontrada em estudos
prvios, ou seja, com um menor erro e sem alterar o nvel de confiana, deve aumentar o tamanho
da amostra (n). A seguir so discutidas formas de dimensionar amostra para estimar os
parmetros: mdia ou a proporo.

5.4.1. Dimensionamento da amostra para obter uma determinada preciso na


estimao da mdia populacional.

Foi visto que para o calculo do intervalo de confiana calculava-se a


semi-amplitude desse intervalo por: e =

t/ 2

S
. Assim, se o valor de e o valor desse erro forem
n

95

ESTATSTICA

fixados pode-se estimar a amostra adequada. Portanto, para que o pesquisador possa determinar
o tamanho da amostra ideal necessrio conhecer uma estimativa do desvio padro populacional
e ter-se uma idia do erro que se deseja cometer. Para isso, pode-se fazer uma pequena amostra,
denominada amostra piloto, que fornecer estes valores. Uma regra para se determinar o tamanho
amostral, apresentada a seguir:

S t/ 2
n =

Essa frmula deve ser utilizada iterativamente, pois para se obter o tamanho da
amostra depende-se do quantil t/2 que por sua vez depende dos graus de liberdade, que so
desconhecidos. Assim, obtm-se o valor de t com os graus de liberdade da amostra piloto e
calcula-se utilizando a frmula proposta o valor de n. Com esse novo valor de n, obtm-se novo
quantil superior de t de Student e refaz-se o clculo de n. O processo aplicado reiteradas vezes
at que uma dada estimativa de n no difira da imediatamente anterior para uma dada preciso
pr-estipulada.
Com base nas informaes obtidas a priori na amostra piloto conclui-se qual deve
ser o tamanho da amostra para aqueles nveis de significncia e preciso estabelecidos. Se o
tamanho da amostra for menor que o da amostra piloto, indica que nenhum elemento deve ser
acrescido amostra.

5.4.2. Dimensionamento da amostra para a estimao de propores.

Utilizando-se o mesmo raciocnio do item 5.4.1 tem-se a seguinte regra de


dimensionamento de amostras.

DANIEL FURTADO FERREIRA

96

z 2
n =
p (1 p )
e

conveniente salientar que essa frmula no depende de processos iterativos


como o anterior. Isso porque o valor de z/2, quantil superior da distribuio normal, no depende
de graus de liberdade para ser computado. No entanto, depende de uma estimativa de P, a qual
pode ser obtida em uma amostra piloto.
Para contornar o problema de se ter que realizar uma amostra piloto adota-se o

 (1 p ) tem mximo quando p = 0,5 , ento, para que


seguinte procedimento. Como o valor de p
no haja uma dependncia de estimativas de P em amostras piloto, obtm-se o nmax. Esse valor de
n garante na pior das hipteses que o erro cometido no processo de estimao no ir ser maior
do que aquele fixado a priori para o coeficiente de confiana adotado. Isso se verifica pois com o

 (1 p ) .
valor tm-se o mximo do valor de p

z / 2

n =
2e

Exemplo: Em uma amostra y=57 em n=150 plantas apresentaram uma determinada doena. Essa
amostra suficiente para estimar a proporo de plantas doentes com erro de 0,08 e 95% de
confiana?

p =

57
= 0,38 = 38% e z0,025=1,96
150

1,96
n =
x0,38x 0,62 141 plantas
0,08

ESTATSTICA

97

Conclui-se que a amostra de 150 plantas foi suficiente para estimar a proporo de
plantas doentes com o erro e a confiana desejados.

Para esse exemplo, utilizando-se a expresso de nmax tem-se:

1,96
n =
150 plantas
2x 0,08

Nesse caso verifica-se que, tambm, nenhuma planta deveria ser includa na
amostra. Esta ltima situao mais conservadora e o pesquisador deve optar entre uma maior
confiabilidade ou uma maior economia.

5.5. Referncias

LEEMIS, L.M.; TRIVEDI, K.S.

A comparison of approximate interval estimators for the

Bernoulli parameter. The American Statistician. V. 50, n.1, p.63-68, February, 1996.

VANGEN, M.G. Confidence interval for a normal coefficient of variation. The American
Statistician. V.50, n.1, February, 1996.

BLYTH, C.R. Approximate binomial confidence limits. Journal of the American Statistical
Association. v.81, n.395, p.843-855, 1986.

PRATT, J.W. A normal approximation for binomial, F, beta, and other common, related tail
probabilities, II. Journal of the American Statistical Association. n.63, p.1457-1483,
1968.

CAPTULO V - TEORIA DA DECISO

6.1. IMPORTNCIA NAS CINCIAS AGRRIAS

Na prtica necessrio, com muita freqncia, tomar decises a respeito das


populaes, com base nas informaes das amostras. Para se tomar decises conveniente
formulao de hipteses. Essas hipteses podem ser verdadeiras ou no. A tomada de deciso
ser ento baseada no teste desta hiptese. Uma deciso errada pode levar a grandes prejuzos,
da a importncia desse captulo, que tem por objetivo demonstrar os procedimentos para se testar
hipteses sobre os principais parmetros populacionais.

6.2. TIPOS DE HIPTESES - ERROS ENVOLVIDOS NA DECISO


No teste das hipteses que so formuladas, existe sempre a probabilidade de se
cometer erros, nas decises tomadas. Inicialmente, antes de se comentar sobre os erros, ser
visto que as hipteses so de dois tipos bsicos, que esto apresentadas a seguir. (i) Hiptese
nula (H0) - aquela que ser testada; admite-se que a diferena entre a estimativa e o parmetro
populacional devida ao acaso; e (ii) Hiptese alternativa (H1) - qualquer hiptese diferente de H0,
isto , aquela que ser aceita se H0 for rejeitada.
Ex: H0: A=10
H1: A>10
Dois tipos de erros podem ser cometidos, como comentado anteriormente, os
quais esto apresentados a seguir:

(i) Erro tipo I: erro que se comete ao rejeitar uma hiptese verdadeira.
(ii) Erro tipo II: erro que se comete ao aceitar uma hiptese falsa como verdadeira.

99

ESTATSTICA

Os erros tipo I e tipo II e as suas respectivas probabilidades, bem como s


probabilidades de se tomar as decises corretas esto apresentados na Tabela 6.1.

Realidade
Deciso

Aceitar H0

Rejeitar H0

H0 verdadeira

H0 falsa

Deciso correta

Erro tipo II

1-

Erro tipo I

Deciso correta

1-

Tabela 6.1. Probabilidades de se cometer os erros tipo I e II, e de se tomar deciso correta para
os testes de hipteses.

CARACTERSTICAS
(i) Erro tipo I e tipo II so correlacionados: O aumento da probabilidade de ocorrncia de um
reduz a probabilidade de ocorrncia do outro;
(ii) Erro tipo I controlado com a escolha de .
(iii) A nica forma de causar uma reduo de e simultaneamente aumentar o tamanho
da amostra.
(iv) Se H0 for falsa, ser maior quanto mais prximo o valor do parmetro estiver do valor
sob a hiptese H0.

Neste captulo ser realizado apenas teste de significncia, haja vista que no se
pode controlar diretamente a probabilidade de se cometer o erro tipo II a no ser indiretamente
com amostras representativas e suficientemente grandes e escolha de testes mais poderosos.

100

DANIEL FURTADO FERREIRA

6.3. CONSTRUO DE UMA REGRA DE DECISO.


6.3.1. ALGORITMO

(i) Formular as hipteses H0 e H1;


(ii) Usar a teoria estatstica e as informaes disponveis para julgar o estimador adequado;
(iii) Fixar e usar esse valor para criar a regio crtica;

RRH0
1

RRH0

Figura 6.1. Regio crtica para um teste unilateral, usando a distribuio de t de student ou a
normal.

(iv) Calcular o valor da estatstica que nortear a deciso;


(v) Se o valor da estatstica pertencer RAH0 no se rejeita H0, caso contrario rejeita-se.

Exemplo. Uma mquina de empacotar caf foi regulada para 500g. O fabricante resolveu fazer
amostras de 16 pacotes de 2 em 2 horas. Numa dessas amostras ele encontrou X =492g e

101

ESTATSTICA

S2=400g2. Ele resolveu consultar um estatstico se deveria paralisar a mquina para novo ajuste.
Qual seria sua deciso?

(i) H0: =500g


H1: 500g (Hiptese bilateral) ou
H1: <500g (Hiptese unilateral).
(ii) X t (,

400
16

(iii) = 0,01

RRH

/2

RRH

-2 ,9 4 7

RRH
/2

2 ,9 4 7

B IL A T E R A L

RRH

- 2 ,6 0 2

RAH0
1 - /2

0
U N IL A T E R A L

Figura 6.2. Regies de rejeio de H0 para o teste bilateral e unilateral ao nvel de 1%


(mutuamente exclusivos).

(iv) t c =

492 500
= 1,60
20
4

O tc o mesmo independentemente se o teste for unilateral ou bilateral. O que se


alteram so as regies de rejeio e aceitao de H0.

(v) tc = -1,60 a RAH0 em ambos os casos (unilateral e bilateral). Portanto, o desvio da mdia
amostral para a mdia hipottica proposta em H0 foi devido ao acaso. Ento, esta hiptese no
deve ser rejeitada no valor nominal de 1% de significncia.

DANIEL FURTADO FERREIRA

102

6.3.2. TESTE PARA MDIA POPULACIONAL NORMAL COM VARINCIA


DESCONHECIDA

Sabe-se do captulo IV, que X t (,

). Desta forma, o algoritmo para o teste

de hiptese :

(i) H0: = o
H1: o (Hiptese bilateral) ou
H1: > o (Hiptese unilateral) ou
H1: < o (Hiptese unilateral).

(ii) t c =

X
S

n
(ii) Define-se a regio de rejeio de H0 com:
t/2 com n - 1 GL para o teste bilateral;
t com n - 1 GL para o teste unilateral ( > o); e
-t com n - 1 GL para o teste unilateral ( < o).
(iii) Rejeita-se H0 se t c t tab , ou seja, se tc RRH0.

Existe uma relao direta entre teste de significncia e intervalos de confiana. Com a
construo do IC pode-se verificar se o valor do parmetro sob H0 se encontra no mesmo. Se
afirmativo no se rejeita H0, caso contrrio, rejeita-se.
Para amostras sem reposio em populaes finitas (n/N>0,05), o erro padro da mdia :

portanto, o valor de tc, neste caso :

Nn

N1

ESTATSTICA

tc =

103

X 0
S

Nn

N1

Exemplo: No caso dos coelhos abatidos aos 90 dias (n=10, X =2,584Kg, S=0,0675Kg), teste a
hiptese de que a mdia populacional igual a 2,701Kg, contra a hiptese alternativa que ela
menor que 2,701Kg. Dado, =0,05.

(i) H0: = 2,701kg o=2,701


H1: < 2,701kg

(ii) t c =

X o 2,584 2,701
=
= 5,481
S
0,0675
n

10

(iii) t0,05 = 1,833 -t0,05 = -1,833 com 9 GL.

(iv) Como t c t tab , ou seja, 5,481>1,833, ento Rejeita-se H0 ao nvel de 5% de probabilidade


pelo teste t, ou seja, a mdia do peso ao abate aos 90 dias inferior a 2,701kg, com 95% de
confiana.

6.3.3. TESTES PARA PROPORES

Para se testar a hiptese de que a proporo de uma populao igual a um dado


valor (P0) o seguinte algoritmo dever ser implementado. Este algoritmo pressupe que a
distribuio do estimador de P aproximadamente normal e que quando se utiliza o estimador da
varincia a distribuio adequada passar a ser a distribuio t de Student.

DANIEL FURTADO FERREIRA

104

(i) Formulam-se as hipteses de nulidade e a alternativa, que pode ser unilateral ou bilateral.
H0: P = Po
H1: P Po (Hiptese bilateral) ou
H1: P > Po (Hiptese unilateral) ou
H1: P < Po (Hiptese unilateral).

(ii) O nvel crtico, ou a probabilidade de se cometer o erro tipo I fixado em geral por = 5% ou
= 1%

(iii) Determina-se o valor da estatstica do teste adequado por:

zc =

P P0
P (1 P )
n

(iv) Se zc ztab rejeita-se H0

Exemplo: Numa amostra de 100 plantas de um campo de produo de sementes, verificou-se que
2% estavam com uma determinada doena. Teste a hiptese que a verdadeira proporo de
doenas do campo igual a 3,5%, como afirma um tcnico de inspeo do campo de produo de
sementes.
(i) Determinando as hipteses
H0: P = 0,035
H1: P < 0,035 (unilateral)
(ii) Fixar o nvel de significncia em 5%
(iii) Calculando o valor de zc

105

ESTATSTICA

tz =

P P0
=
P (1 P )
n

0,02 0,035
0,02(1 0,02 )
100

= 1,07

(iv) o valor de tabelado : z0,05=-1,645 com 99 GL


(v) Como zc ztab , aceita-se H0 ao nvel de 95% de confiana, ou seja, a no existe razo
para duvidar que a mdia da incidncia de doena no campo no seja de 3,5%. A
diferena amostral de 1,5% foi apenas casual.

6.3.4. TESTE PARA VARINCIA POPULACIONAL 2

A seguir apresentado o algoritmo para se testar hipteses sobre uma varincia


de uma populao com distribuio normal. O teste adequado o de 2, cuja distribuio foi vista
no captulo IV.

(i) Formulam-se as hipteses de nulidade e alternativa, a qual pode ser unilateral ou bilateral.
H0: 2 = 20
H1: 2 20 (Hiptese bilateral); ou
H1: 2 > 20 (Hiptese unilateral); ou
H1: 2 < 20 (Hiptese unilateral).

(ii) O valor crtico de significncia ou a probabilidade de se cometer o erro tipo I fixada em = 5%


ou = 1%

(iii) Determina-se o valor da estatstica, para o teste adequado por:

2c =

(n 1) S2

20

DANIEL FURTADO FERREIRA


(iv) Determinar a regio critica (RRH0)

R A H
1
R R H
/2
0
0

R R H
/2

1 - /2

/2

Figura 6.3. Regies crticas (RRH0) para o teste bilateral, da hiptese apresentada em (i).

R A H
1 -

R R H

0
0

Figura 6.4. Regio crtica (RRH0) para o teste unilateral, da hiptese apresentada em (i).

106

ESTATSTICA

107

R A H 0
1 -

R R H 0

0
0

2
1 -

Figura 6.5. Regio crtica (RRH0) para o teste unilateral, da hiptese apresentada em (i).

(v) Se c RRH0 definidas nas Figuras 6.3, 6.4 e 6.5, rejeita-se H0


2

6.3.5. COMPARAES ENTRE DUAS MDIAS POPULACIONAIS


Um dos principais testes apresentado refere-se necessidade de comparar duas
mdias populacionais distintas. Este teste tem grande aplicabilidade nas cincias agrrias, que o
principal interesse deste material. Muitas vezes deseja-se comparar dois tratamentos distintos,
duas variedades de qualquer espcie quanto produtividade, duas raes na dieta de animais,
entre diversos outros exemplos. A seguir apresentada a situao em que normalmente estas
comparaes podem ser realizadas do ponto de vista prtico. As situaes mais tericas fogem do
objetivo do presente material, e no sero abordadas.

(A) VARINCIAS POPULACIONAIS DESCONHECIDAS E DIFERENTES ( 12 22 )

Duas mdias populacionais distintas podem ser comparadas por este mtodo,
desde que a amostragem, ou at mesmo a experimentao, seja realizada de forma independente
para cada uma delas.

Algum, no entanto, pode questionar o fato de que se as varincias

DANIEL FURTADO FERREIRA

108

populacionais so desconhecidas, fato bastante comum na prtica, ento, como saber se elas so
diferentes, para enquadrar o teste nesta opo. Para responder esta pergunta, antes de apresentar
o algoritmo para o teste da hiptese de igualdade entre as duas mdias populacionais, ser
apresentado o teste para a hiptese de igualdade das varincias populacionais.

A.1. Teste para hiptese de igualdade entre as varincias populacionais

Inicialmente deve ser lembrado neste ponto que a estatstica definida por:
2

S1
F=

2
1

S2

segue a distribuio F de Snedecor. usada para testar a igualdade entre duas

2
2

varincias. As tabelas de F, so consultadas de acordo com os graus de liberdade n1-1 associados


a varincia 1 (numerador da expresso) na primeira linha, e graus de liberdade n2-1 associados a
varincia 2 (denominador da expresso), na primeira coluna, e probabilidade desejada.
Pode-se observar que a estatstica F, se H0: 12 = 22 for verdadeira, se resume em
2

Fc =

S1

S2

. Desta forma Fc segue a distribuio de F, e um valor observado, muito alto, ou seja, um

valor que deixe menos de 5% ou menos de 1% dos valores de F acima do mesmo deve ser
considerado significativo. Desta forma, este valor indica que mais fcil acreditar que a hiptese,
no seja verdadeira, do que este grande valor tenha ocorrido ao acaso. O algoritmo para realizar o
teste est apresentado a seguir.

i) Formulam-se as hipteses de nulidade e alternativa bilateral.

H 0: 1 = 2
2

H 1: 1 2
2

(ii) Fixa-se o valor crtico, ou a probabilidade de se cometer o erro tipo I, que em geral :

ESTATSTICA

109

= 5% ou = 1%

(iii) Determina-se o valor da estatstica, para o teste adequado por:


2

Fc =

S1

S2

As varincias amostrais so denominadas de tal forma que S12 S22 . Desta forma Fc ser sempre
maior ou igual a 1.

(iv) Rejeita-se a hiptese H0 se FcF/2 com (n1 - 1) e (n2 - 1) GL, respectivamente.

A.2. Teste para hiptese de igualdade entre as mdias populacionais

Rejeitando-se a hiptese apresentada em A.1, o seguinte algoritmo dever ser


usado. Para o caso de se aceitar a hiptese em questo o procedimento adequado a ser adotado
para o teste aquele do item B.

(i) Formulam-se as hipteses de nulidade e alternativa, as quais podem ser unilaterais ou bilaterais
H0: 1-2 = 0
H1: 1-2 0 (bilateral); ou
H1: 1-2 > 0 (unilateral); ou
H1: 1-2 < 0 (unilateral); ou
O teste de que a diferena entre as mdias populacionais igual a zero, equivale
ao teste de que elas so iguais.
(ii) Fixa-se o nvel crtico, ou a probabilidade de se cometer o erro tipo I, que em geral :
= 5% ou = 1%

DANIEL FURTADO FERREIRA

110

(iii) Determina-se o valor da estatstica, para o teste adequado por:

tc =

X1 X 2
2

S1
n1

S2
n2

onde, t/2 (teste bilateral) ou t (teste unilateral) possui graus de liberdade dados por:

S12 S22
+
n n2
= 12
2
S12 S22

n1 + n 2
n1 1 n 2 1

Convm salientar que este teste, quando as varincias populacionais so distintas,


apenas aproximado. Estudos de simulao feitos por Borges & Ferreira (1996) demonstra que
este teste mantm satisfatoriamente a probabilidade de se cometer o erro tipo I, mesmo, para
baixos tamanhos amostrais, mas o erro tipo II fica comprometido medida que magnitude da
razo entre as varincias populacionais aumenta.

(B) VARINCIAS POPULACIONAIS DESCONHECIDAS E IGUAIS ( 12 = 22 )

Como no caso do item A.2, o teste para hiptese de igualdade entre duas mdias
populacionais quando as varincias so iguais, segue praticamente todos os passos. O primeiro
passo verificar se realmente as varincias populacionais so iguais, conforme descrito no item
A.1. O segundo passo consiste em implementar o seguinte algoritmo, lembrando que o teste, sob a
pressuposio de igualdade de varincias, exato:

ESTATSTICA

111

(i) Formulam-se as hipteses de nulidade e alternativa, as quais podem ser unilaterais ou


bilaterais:
H0: 1-2 = 0
H1: 1-2 0 (bilateral); ou
H1: 1-2 > 0 (unilateral); ou
H1: 1-2 < 0 (unilateral); ou

O teste de que a diferena entre as mdias populacionais igual a zero equivale


ao teste de que elas so iguais.

(ii) Se fixa o nvel crtico, ou a probabilidade de se cometer o erro tipo I, que em geral :
= 5% ou = 1%

(iii) Determina-se o valor da estatstica, para o teste adequado por:

X1 X 2

tc =
Sp

1
n1

1
n2

em que, t/2 (teste bilateral) ou t (teste unilateral) possui =n1+n2-2 graus de liberdade.
Como as varincias das duas populaes so iguais, o melhor estimador da
varincia comum obtido por uma varincia mdia ponderada pelos graus de liberdade de cada
amostra. Esta varincia definida por SP2 , onde o subscrito p refere-se a palavra americana
pooled que significa, combinada. Portanto, o smbolo SP apresentado, refere-se ao estimador do
desvio padro combinado que a raiz quadrada da varincia, o qual apresentado a seguir:

SP =

( n1 1) S12 + ( n 2 1) S22
n1 + n 2 2

112

DANIEL FURTADO FERREIRA


(C) DADOS PAREADOS

Quando os dados so relacionados dois a dois, eles so denominados pareados.


comum na experimentao, tomar-se dados de uma amostra de uma populao antes e aps a
aplicao de um determinado tratamento. Como, cada elemento da amostra mensurado antes e
aps o tratamento diz-se que os dados so pareados.

Exemplo: os dados de peso de bezerros foram medidos antes e depois da aplicao de uma
rao nova, em uma amostra de tamanho n=5. Seja,
X: peso antes do tratamento (rao nova); e
Y: peso aps tratamento;
n=5 bezerros.

Bezerros

Xi

100

105

108

106

110

Yi

120

115

130

140

112

Diferena

20

10

22

34

(Di)
Tabela 6.2. Peso de cinco bezerros antes (Xi) e aps (Yi) o tratamento de uma rao nova por um
ms, alm da diferena (Di) entre o peso aps e antes do tratamento (ganho de peso do perodo).

Neste exemplo fica claro que os dados so pareados, pois so mensurados cinco
bezerros antes e aps a dieta com uma rao especfica. Antes de prosseguir, necessrio, que
se calcule algumas estatsticas bsicas, desta varivel aleatria Di. Estas estatsticas so a mdia
e o desvio padro.

Mdia:

D=

Di
i=1

ESTATSTICA

SD =

Desvio Padro:

113

D
1 n 2 i= 1 i
Di

n 1 i=
n

Se a rao, para o exemplo em questo, ou o tratamento qualquer que se deseja


testar, no possui efeito significativo, ento se espera que no haja diferena entre as medidas
antes e aps o tratamento ser aplicado. Desta forma, a diferena mdia real livre dos efeitos de
meio deve ser testada para hiptese de que ela realmente igual a zero. Esta hiptese seguida
dos testes apropriados est apresentada a seguir:

(i) Determinar as hipteses


H0: D = D0
H1: D D0 Bilateral; ou
H1: D > D0 Unilateral;
H1: D < D0 Unilateral

(ii) Se fixa o nvel crtico, ou a probabilidade de se cometer o erro tipo I, que em geral = 5% ou
= 1%.

(iii) Determina-se o valor da estatstica, para o teste adequado por:

tc =

D D0
SD
n

(iv) Rejeita-se H0 se |tc| > |ttab|.

DANIEL FURTADO FERREIRA

114

Voltando para o exemplo do ganho de peso nos bezerros, tem-se os seguintes


resultados: D = 17,6kg

e SD = 12,1984kg

As hipteses de nulidade e alternativa so:

H0: D = 0
H1: D > 0 Unilateral;

que significa que est se testando a ausncia de efeito da rao para promover o
ganho de peso, contra a alternativa que esta possui um efeito positivo no ganho de peso. O valor
de tc, utilizando as expresses anteriormente apresentadas, foi de 3,226. O valor de ttabelado (t0,05) foi
2,132 com n-1=4 GL. Ento, como |tc| > |ttab| rejeita-se H0, existe efeito positivo da rao no ganho
de peso dos bezerros.

6.4. TESTE DE 2 PARA AJUSTAMENTO DE MODELOS

Muitos modelos tericos, para os valores da varivel aleatria, fornecem as


freqncias relativas esperadas. Estes modelos tericos muitas vezes podem ser aplicados a
dados experimentais observados em um dado fenmeno. Neste caso, cada valor da varivel
aleatria (classe) possui uma freqncia observada em uma amostra de tamanho n. De acordo
com as caractersticas deste fenmeno, pode-se elaborar um modelo terico para ajust-lo. Com
base neste modelo podem-se obter as freqncias relativas esperadas nesta amostra de tamanho
n. Pela comparao das freqncias observadas e esperadas pode se avaliar a qualidade do
ajustamento. Porm, uma avaliao, visual alm de muito pobre, pode no conseguir distinguir
entre afastamentos entre as freqncias esperadas e observadas que so devidos ao acaso e os
que so estatisticamente significativos. Para um tratamento adequado de problemas desta

115

ESTATSTICA

natureza, o teste de 2 recomendado. A seguir ser apresentado, como proceder para se avaliar
o ajuste de um modelo terico a dados observados experimentalmente (curvas ou ajustes de
aderncia).

Passos para ajuste de qui-quadrado

(i) Primeiro passo determinar qual o modelo terico deve ser usado: Isto normalmente no
trivial, mesmo para pesquisadores experientes. Este primeiro passo o mais importante, pois
uma escolha errada de um modelo levar a um ajustamento muito pobre ou na maioria dos
casos a um no ajustamento;

(ii) Calcular de acordo com o modelo proposto as freqncias esperadas (FE) para cada classe da
varivel aleatria;

(iii) Comparar as freqncias esperadas com as freqncias observadas (Fo) atravs do seguinte
teste:

Fo i FE i
K

2c =
i= 1
FE i

Em que, Foi a freqncia observada da classe i; Fei a freqncia esperada da


classe i; K o nmero de classes; e gl = K - 1 o nmero de graus de liberdade.

(iv) A hiptese que se testa H0: o modelo terico se ajusta distribuio observada. O valor de
qui-quadrado calculado em (iii) deve ser comparado com o valor crtico da distribuio de

116

DANIEL FURTADO FERREIRA

qui-quadrado para um nvel de significncia de e com K-1 graus de liberdade. Rejeita-se H0


se
2

< c.
2

K 1

GL

Exemplo: Verificar se os dados abaixo esto de acordo com a 2a lei de Mendel, ou seja, lei da
segregao independente de genes. Na Tabela 6.2, esto apresentados o fentipo de dois genes,
um que controla, a altura das plantas, as quais podem ser alta ou an, e o outro que controla o tipo
de folha, que podem ser normal ou tipo batata. Se os genes forem independentes, ou seja, se
estiverem situados em cromossomos diferentes, ento esperada pelos geneticistas a seguinte
segregao fenotpica na gerao F2 de um certo cruzamento: 9 plantas altas com folha normal : 3
plantas altas com folha batata : 3 plantas ans com folha normal : 1 planta an com folha batata
(9:3:3:1).

Fentipo da planta

Tipo da folha

FO

FE

ALTA

NORMAL

925

900

ALTA

BATATA

309

300

AN

NORMAL

280

300

AN

BATATA

86

100

TOTAL

1600

1600

Tabela 6.3. Segregao fenotpica observada e esperada para gerao F2 de um cruzamento entre
uma linhagem alta de folha normal com outra an de folha batata. A freqncia esperada foi
baseada no modelo de segregao independente dos genes que controlam a altura de planta e o
tipo de folha (2a lei de Mendel), na proporo de 9:3:3:1.

(i) formulam-se as hipteses:


H0: Os dados observados esto de acordo com a 2a lei de Mendel;
H1: Os dados observados no esto de acordo com a 2a lei de
(ii) calculam-se as freqncias esperadas tomando-se por base a hiptese H0: As freqncias
esperadas esto apresentadas na Tabela 6.3.

ESTATSTICA

117

(iii) calcula-se o valor da estatstica para o teste por:

2c =(925-900)2/900 + (309-300)2/300 + (280-300)2/300 + (86-100)2/100=4,258


(iv) o valor tabelado :

20, 05 = 7,815 com 3 GL.


(v) concluso:
como c < 0, 05 aceita-se H0, ou seja, os dados seguem a 2a lei de Mendel, ou
2

seja os genes para controle da altura de planta e do tipo de folha, so independentes.

$SrQGLFH
FHVV
7DEHOD $ 3UREDELOLGDGHV D  GD GLVWULEXLomR QRUPDO SDGUmR 1    SDUD YDORUHV GR TXDQWLO =W
SDGURQL]DGRGHDFRUGRFRPRVHJXLQWHHYHQWR3 ==W D
=W





















































































































































































































































































































































































































































































































7DEHOD$3UREDELOLGDGHV D GDGLVWULEXLomRQRUPDOSDGUmR1  SDUDYDORUHVGRTXDQWLO=W


SDGURQL]DGRGHDFRUGRFRPRVHJXLQWHHYHQWR3 =!=W D
=



























































































































































































































































































































































































































































































































7DEHOD$4XDQWLVVXSHULRUHVGDGLVWULEXLomRGHTXLTXDGUDGR FD FRPQ JUDXVGHOLEHUGDGHHSDUD




GLIHUHQWHV YDORUHV GD SUREDELOLGDGH D  GH DFRUGR FRP R VHJXLQWH HYHQWR


3 F  ! F D D 


















































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGHTXLTXDGUDGR FD FRPQ JUDXVGHOLEHUGDGHH SDUD




GLIHUHQWHV YDORUHV GD SUREDELOLGDGH D  GH DFRUGR FRP R VHJXLQWH HYHQWR


3 F  ! F D D 












































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGH OLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRP
RVHJXLQWHHYHQWR3 )!) 

Q

Q






































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGR FRP
RVHJXLQWHHYHQWR3 )!) 

Q











Q















































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRPR
VHJXLQWHHYHQWR3 )!) 

Q

Q












































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRPR
VHJXLQWHHYHQWR3 )!) 

Q











Q













































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRP
RVHJXLQWHHYHQWR3 )!) 

Q

Q










































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRP
RVHJXLQWHHYHQWR3 )!) 

Q











Q






















































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRPR
VHJXLQWHHYHQWR3 )!) 
Q

Q






































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRPR
VHJXLQWHHYHQWR3 )!) 
Q











Q



















































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRP
RVHJXLQWHHYHQWR3 )!) 
Q

Q







































































































































































































































































































































































































































































































































7DEHOD$ 4XDQWLVVXSHULRUHVGDGLVWULEXLomRGH) ) FRPQ JUDXVGHOLEHUGDGHGRQXPHUDGRUH


Q JUDXVGHOLEHUGDGHGRGHQRPLQDGRUYDORUGDSUREDELOLGDGH D GHGHDFRUGRFRP
RVHJXLQWHHYHQWR3 )!) 
Q











Q




















































































































































































































































































































































































































































































































































7DEHOD $ 4XDQWLV VXSHULRUHV GD GLVWULEXLomR W GH 6WXGHQW WD  FRP Q JUDXV GH OLEHUGDGH H SDUD
GLIHUHQWHV YDORUHV GD SUREDELOLGDGH D  GH DFRUGR FRP R VHJXLQWH HYHQWR
3 W ! W D D 









































































































































































































































































































































































































































































7DEHOD $ /LPLWHV FUtWLFRV TXDQWLV VXSHULRUHV D  Z D  GR WHVWH GRV SRVWRV FRP VLQDLV GH

:LOFR[RQSDUDGLIHUHQWHVYDORUHVGDSUREDELOLGDGH D GHDFRUGRFRPRVHJXLQWHHYHQWR
SUREDELOtVWLFR 3 :  t ZD t   D 

QW






















































































































































































































































QW

























































































































































































9DORUHVFUtWLFRVVLPpWULFRV TXDQWLVVXSHULRUHVD  Z D VmRREWLGRVSRU Z D
























































































































Q W Q W  
 ZD


Você também pode gostar