Você está na página 1de 47

6 Distribuies de Probabilidade

O programa R inclui funcionalidade para operaes com distribuies de


probabilidades. Para cada distribuio h 4 operaes bsicas indicadas pelas letras:
d

calcula a densidade de probabilidade

no ponto

calcula a funo de probabilidade acumulada

no ponto

calcula o quantil correspondente a uma dada probabilidade


r

retira uma amostra da distribuio


Para usar os funes deve-se combinar uma das letras acima com uma abreviatura do
nome da distribuio, por exemplo para calcular probabilidades usamos: pnorm para
normal, pexp para exponencial, pbinom para binomial, ppois para Poisson e assim por
diante.
Vamos ver com mais detalhes algumas distribuies de probabilidades.

6.1 Distribuio Normal


A funcionalidade para distribuio normal implementada por argumentos que
combinam as letras acima com o termo norm. Vamos ver alguns exemplos com a
distribuio normal padro. Por default as funes assumem a distribuio normal
padro

> dnorm(-1)
[1] 0.2419707
> pnorm(-1)
[1] 0.1586553
> qnorm(0.975)
[1] 1.959964
> rnorm(10)
[1] -0.0442493 -0.3604689
[7] -1.0240673 -1.3205288

0.2608995 -0.8503701 -0.1255832


2.0273882 -1.7574165

O primeiro valor acima corresponde ao valor da densidade da normal

0.4337861

com parmetros
obtido substituindo

no ponto
por

. Portanto, o mesmo valor seria

na expresso da normal padro:

> (1/sqrt(2*pi)) * exp((-1/2)*(-1)^2)


[1] 0.2419707

A funo pnorm(-1) calcula a probabilidade

O comando qnorm(0.975) calcula o valor de tal que


.
Finalmente o comando rnorm(10) gera uma amostra de 10 elementos da normal
padro. Note que os valores que voce obtm rodando este comando podem ser
diferentes dos mostrados acima.
As funes acima possuem argumentos adicionais, para os quais valores padro
(default) foram assumidos, e que podem ser modificados. Usamos args para ver os
argumentos de uma funo e help para visualizar a documentao detalhada:
> args(rnorm)
function (n, mean = 0, sd = 1)

As funes relacionadas distribuio normal possuem os argumentos mean e sd para


definir mdia e desvio padro da distribuio que podem ser modificados como nos
exemplos a seguir. Note nestes exemplos que os argumentos podem ser passados de
diferentes formas.
> qnorm(0.975, mean = 100, sd = 8)
[1] 115.6797
> qnorm(0.975, m = 100, s = 8)
[1] 115.6797
> qnorm(0.975, 100, 8)
[1] 115.6797

Para informaes mais detalhadas pode-se usar a funo help. O comando


> help(rnorm)

ir exibir em uma janela a documentao da funo que pode tambm ser chamada com
?rnorm. Note que ao final da documentao so apresentados exemplos que podem ser
rodados pelo usurio e que auxiliam na compreenso da funcionalidade.
Note tambm que as 4 funes relacionadas distribuio normal so documentadas
conjuntamente, portanto help(rnorm), help(qnorm), help(dnorm) e help(pnorm)
iro exibir a mesma documentao.
Clculos de probabilidades usuais, para os quais utilizvamos tabelas estatsticas podem
ser facilmente obtidos como no exemplo a seguir.

Seja

uma v.a. com distribuio

. Calcular as probabilidades:

1.
2.
3.
Calcule estas probabilidades de forma usual, usando a tabela da normal. Depois
compare com os resultados fornecidos pelo R. Os comandos do R para obter as
probabilidades pedidas so:
> pnorm(95, 100, 10)
[1] 0.3085375
> pnorm(110, 100, 10) - pnorm(90, 100, 10)
[1] 0.6826895
> 1 - pnorm(95, 100, 10)
[1] 0.6914625
> pnorm(95, 100, 10, lower=F)
[1] 0.6914625

Note que a ltima probabilidade foi calculada de duas formas diferentes, a segunda
usando o argumento lower que implementa um algortmo de clculo de probabilidades
mais estvel numericamente.
A seguir vamos ver comandos para fazer grficos de distribuies de probabilidade.
Vamos fazer grficos de funes de densidade e de probabilidade acumulada. Estude
cuidadosamente os comandos abaixo e verifique os grficos por eles produzidos. A
Figura mostra grficos da densidade (esquerda) e probabilidade acumulada (direita)
da normal padro, produzidos com os comandos a seguir. Para fazer o grfico
consideramos valores de
entre -3 e 3 que correspondem a +/- trs desvios padres da
mdia, faixa que concentra 99,73% da massa de probabilidade da distribuio normal.
> plot(dnorm, -3, 3)
> plot(pnorm, -3, 3)

Figura : Funes de densidade e probabilidade da distribuio normal padro.

A Figura
(direita) da
de

mostra grficos da densidade (esquerda) e probabilidade acumulada


. Para fazer estes grficos tomamos uma sequncia de valors

e para cada um deles calculamos o valor da funo

pontos

e depois unimos os

em um grfico.

> x <- seq(70, 130, len=100)


> fx <- dnorm(x, 100, 8)
> plot(x, fx, type='l')

Figura : Funes de densidade de probabilidade (esquerda) e funo de distribuio


acumulada (direita) da
.
Note que, alternativamente, os mesmos grficos poderiam ser produzidos com os
comandos a seguir.
> plot(function(x) dnorm(x, 100, 8), 70, 130)
> plot(function(x) pnorm(x, 100, 8), 70, 130)

Comandos usuais do R podem ser usados para modificar a aparncia dos grficos. Por
exemplo, podemos incluir ttulos e mudar texto dos eixos conforme mostrado na grfico
da esquerda da Figura e nos dois primeiros comandos abaixo. Os demais comandos
mostram como colocar diferentes densidades em um um mesmo grfico como ilustrado
direita da mesma Figura.
> plot(dnorm, -3, 3, xlab='valores de X', ylab='densidade de
probabilidade')
> title('Distribuico Normal\nX ~ N(100, 64)')
>
>
>
>

plot(function(x) dnorm(x, 100, 8), 60, 140, ylab='f(x)')


plot(function(x) dnorm(x, 90, 8), 60, 140, add=T, col=2)
plot(function(x) dnorm(x, 100, 15), 60, 140, add=T, col=3)
legend(120, 0.05, c("N(100,64)","N(90,64)","N(100,225)"), fill=1:3)

Figura : Grfico com texto nos eixos e ttulo (esquerda) e vrias distribuies em um
mesmo grfico (direita).

1. Distribuio normal
A distribuio normal uma das mais importantes distribuies da estatstica,
conhecida tambm como Distribuio de Gauss ou Gaussiana. Foi desenvolvida pelo
matemtico francs Abraham de Moivre.
Alm de descrever uma srie de fenmenos fsicos e financeiros, possui grande uso na
estatstica inferencial. inteiramente descrita por seus parmetros de mdia e desvio
padro, ou seja, conhecendo-se estes consegue-se determinar qualquer probabilidade em
uma distribuio Normal.
Um interessante uso da Distribuio Normal que ela serve de aproximao para o
clculo de outras distribuies quando o nmero de observaes fica grande. Essa
importante propriedade provem do Teorema Central do Limite que diz que "toda soma
de variveis aleatrias independentes de mdia finita e varincia limitada
aproximadamente Normal, desde que o nmero de termos da soma seja suficientemente
grande" (ver o teorema para um enunciado mais preciso).

Funo de densidade de probabilidade


A funo densidade de probabilidade da distribuio normal com mdia e varincia
2 (de forma equivalente, desvio padro ) assim definida,

Se a varivel aleatria X segue esta distribuio escreve-se: X ~ N(,2). Se = 0 e =


1, a distribuio chamada de distribuio normal padro e a funo de densidade de
probabilidade reduz-se a,

A distribuio normal tem como caractersticas fundamentais a mdia e o desvio padro.

Mdia
H vrios tipos de mdia (aritmtica - simples ou ponderada, geomtrica, harmnica,
quadrtica, cbica, biquadrtica).
A mais usada a mdia aritmtica simples ou, simplesmente, mdia, que obtida
dividindo-se a soma das observaes pelo nmero delas. um quociente geralmente
representado pela letra M ou pelo smbolo (l-se "x barra").

Desvio Padro
O desvio padro obtido simplesmente encontrando-se a raiz quadrada do valor obtido
para a varincia. representado por s.
Utilizando os dados do exemplo anterior:
sA = raiz s2 A = raiz 10 = 3,16
sB = raiz s2 B = raiz 40 = 6,32
No caso da varincia lida-se com unidades ao quadrado, representando uma grandeza em
duas dimenses.
Para ter uma medida da variabilidade ou disperso usa-se o desvio padro que tem a mesma
unidade dos dados originais. um desvio mdio em relao mdia do conjunto de dados.
importante notar, portanto, que quando se fala de desvio padro ou de varincia, fala-se de
medidas de disperso, que diferem apenas por uma transformao matemtica, ou seja,
diferem somente em um ajuste de escala.
Pela sua prpria definio nota-se que o desvio padro uma medida que s pode assumir
valores no negativos e que, quanto maior for, indicar mais variabilidade nos dados e que
maior ser a disperso deles. (topo)

Varincia
A varincia, representada por s2, e definida como o "desvio quadrtico mdio da
mdia".

Note-se que como a varincia mede os desvios em relao mdia (ou seja, a diferena
entre cada dado e a mdia) e avalia o grau de disperso de um conjunto de dados.
Considere 3 amostras, A, B e C, com mdias iguais, em que o comprimento de um
rgo (em mm) foi anotado.
amostra
A
B
C

160 162 165 168 172 175


160 161 162 168 170 173 175
160 162 163 164 165 167 170 171 173 175

soma

mdia

1002
1169
1670

167
167
167

Exemplo agronmico
Normalmente, no estado de So Paulo a distribuio gama
incompleta utilizada para descrever sries de precipitao
pluvial; j as distribuies normal e log-normal so comumente
utilizadas para descrever sries de temperatura mdia do ar,
radiao solar e conseqentemente de evapotranspirao
potencial. A distribuio beta utilizada com freqncia para
descrever sries de relaes como a razo ETR/ETP. Devido ao
fato da evapotranspirao real, estimada pelo mtodo de
Thornthwaite e Mather (1955), ser influenciada pelos elementos
meteorolgicos
acima
citados
(precipitao
pluvial
e
evapotranspirao potencial) e ter, evidentemente, estreita
relao com a razo ETR/ETP, as quatro distribuies acima
descritas foram escolhidas por meio dos seguintes mtodos:
Segundo Morettin e Bussad (2003), a distribuio normal ou
gaussiana uma das mais importantes em investigaes
tericas, pois seu peso em anlises matemticas resulta do fato
de que muitas tcnicas estatsticas (anlises de varincia e de
regresso, por exemplo), alm de alguns testes de hipteses,
assumem a normalidade dos dados.
Uma varivel aleatria X R, tem uma distribuio normal se
sua funo de densidade de probabilidade assumir a forma de:

2. distribuiofsnedecor
A distribuio F de Fisher-Snedecor, mais conhecida como distribuio F de Fisher
(em honra a Ronald Fisher) ou distribuio F de Snedecor (em honra a George W.
Snedecor) mede a razo entre duas chi quadrado independentes.

O coeficiente Chi-Quadrado (ler qui-quadrado), ou chi quadrado, normalmente escrito


como um valor da disperso para duas variveis de escala nominal, usado em
alguns testes estatsticos. Ele nos diz em que medida que os valores observados se
desviam do valor esperado, caso as duas variveis no estivessem correlacionadas.

Distribuio F
| Topo pg | Fim pg |

Tambm denominada distribuio F de Snedecor ou distribuio FisherSnedecor, encontra aplicaes em alguns testes estatsticos como anlise de
varincia.

Figura 01

Consideram-se as variveis aleatrias U e V tais que


U e V so independentes.
U tem distribuio 2 com graus de liberdade.
V tem distribuio 2 com graus de liberdade.
Define-se uma nova varivel aleatria X tal que
X = (U / ) / (V / )

#A.1#.

Ento X dita ter distribuio F com e graus de liberdade ou


X ~F(, ).

A Figura 01 d curvas aproximadas das funes de distribuio acumulada e


de densidade de probabilidades para = 5 e = 2.
A formulao matemtica para essas funes pode ser deduzida a partir da
definio anterior. Apresenta-se aqui apenas o resultado para a funo de
densidade de probabilidades.
f(x)
=

/2 /2 x(/2) 1
para x >
B(/2, /2) ( x + 0
)( + )/2

f(x) = para x
0
0 #B.1#.

Onde e so os parmetros dos graus de liberdade da definio anterior e B


a funo beta, que definida por:
B(a, b) =

x=0...1

xa

(1 x)b

dx

#C.1#.

Mdia da distribuio F: E(X) =

Varincia da
distribuio F:

se > 2 #D.1#.
2

2 2 ( +
2)
Var(X)
se >
2
=
4
#E.1#.
( 2) (
4)

Algumas propriedades
01) Se X tem distribuio t-student com graus de liberdade, ento
X2 ~F(1, ).

02) Se X~F(, ), ento


(1 / X) ~F(, ).

03) Sejam as seguintes amostras:


X1, X2, ... , Xm de uma populao com distribuio normal de mdia 1 e
varincia 12.
Y1, Y2, ... , Yn de uma populao com distribuio normal de mdia 2 e
varincia 22.
As varincias das amostras so:

2
1

(Xi X)2
e s22 =
m 1

(Yi Y)2
n 1

Ento a varivel definida por Z = s12 / s22 tem distribuio F com m e n graus
de liberdade. Esta propriedade pode ser usada para testar a igualdade de
varincia entre as duas populaes.
Exemplo agronmico
TESTE DE HIPTESE DE DEPENDNCIA EM DADOS DE COLHEITAS DE
CH PARA ANLISE DA VARINCIA.
O Instituto Agronmico mantm, na Estao Experimental de Pariquera-Au, uma coleo de 55 clones de ch; cada clone est plantado, no campo, em
parcela nica de 56 plantas.
Nas condies do Vale do Ribeira (SP), o perodo de colheita do ch
estende-se de agosto-setembro a mao-junho, e, dependendo das condies de
temperatura e precipitao pluvial, podem ser feitas em torno de vinte colheitas
ao ano.
O presente trabalho teve como objetivo verificar a possibilidade de uso
dos dados de cada colheita do ch, como repetio, para fins de anlise da
varincia, sendo necessrio, para tal, comprovar a existncia de uma estrutura de
dependncia de grau zero, pois a anlise estatstica de dados experimentais tem,
entre suas hipteses, a de normalidade e independncia.
2. MATERIAL E MTODOS
A coleo foi plantada em 1956, com espaamento de 1,50 m entre linhas
e 1,00 m entre plantas na linha, recebendo os tratos normais cultura.
Os dados de produo, em quilogramas de folhas verdes por parcela de
84 m2, referem-se s colheitas mecanizadas.
De acordo com vrios autores, seis a dez colheitas de ch, numa
mesma safra, so suficientes para estimar de maneira bastante confivel a produo
potencial das plantas ou clones para fins de seleo (VISSER, 1969).
Nesse estudo, as colheitas foram em nmero de dez, dezesseis, onze,
treze e oito, respectivamente, para as safras 1977/78, 1978/79, 1979/80, 1980/81
e 1981/82.
Num modelo linear geral,
Y = X/3+ e,
onde:
X uma matriz n x p, de variveis matemticas; ft um vetor de P
parmetros desconhecidos, e ,um vetor de n variveis aleatrias independentes
normais [e - N (, a2!)], onde 0 um vetor de elementos nulos e l, uma matriz
identidade nxn (GRAYBILL, 1961).
Para poder aplicar esse modelo a dados de colheitas sucessivas, foi
necessrio verificar a hiptese de dependncia dos erros, isto , see~N (, 2),
onde 2 uma matriz de varncias e covarincias definida positiva. Se a matriz
for diferente da matriz a2\, a estatstica F pode no ter a distribuio F de Snedecor
(BALDESSARI & GALLO, 1984), apropriada para testar as hipteses sobre os
parmetros do modelo. A estrutura de dependncia foi verificada atravs do teste proposto por
BALDESSARI & SOCCORSI (1983). Esses autores elaboraram tabeias para o
teste, cuja regio crtica constituda por valores maiores que W 2, onde:
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111
1111111111111111111111111111111111111111111111111111111111111111111111111111111111111111
1111111111111111111111111111111111111111
eXeS2 so a mdia e varincia amostrai respectivamente. Neste trabalho, X, a
produo da colheita i (i = 1, 2, ..., n); X e S*, respectivamente, a mdia e a
varincia do tratamento (clone) sobre o qual o teste aplicado. O valor W 2/S4 foi
calculado para permitir o uso da tabela dos percentis da distribuio amostrai de
W2.
Foi desenvolvido um programa em linguagem Fortran, para uso no

computador Sisco MB 8000, do IAC, para clculo de W 2.


3. RESULTADOS E DISCUSSO
O teste empregado para verificar a estrutura da matriz das varincias e
covarincias evidenciou a possibilidade do emprego do mtodo clssico de anlise
da varincia; isso pode ser observado pelos valores de W2/S4, apresentados
no quadro 1, sempre menores quando comparados com os valores da distribuio
de W2 para (0,95; n) tabelados por BALDESSARI & SOCCORSI (1983). No caso,
n igual a dez, dezesseis, onze, treze e oito, correspondentes ao nmero de
colheitas nos anos de 1977/78 a 1981/82, apresentados nesse quadro.
Os dados de cada safra foram, portanto, analisados segundo um modelo
de classificao dupla.
Na anlise conjunta dos cinco anos, os nmeros de graus de liberdade
foram ajustados para aplicao dos testes F e de comparao mltipla de mdias
(Tukey), em razo da heterogeneidade das varincias residuais.
As produes de ch por colheita, mdias das cinco safras estudadas,
so apresentadas no quadro 2. Os clones mais produtivos, nmeros 233, 259,
222, 266, 250 e 172, estatisticamente superiores aos clones 159,156, 319, 320,
359 e 157, podero ser submetidos a outros critrios de seleo, entre os quais
qualidade da bebida, resistncia a pragas e doenas, capacidade de enraizamento
e precocidade.
O uso de colheitas, como repetio, refere-se exclusivamente ao caso
em estudo e no exclui a necessidade de planejamento de experimentos com
nmero de repeties e tamanho de parcela adequados aos objetivos da pesquisa
a ser realizada.

3. d.t
A distribuio t de Student, desenvolvida por William Sealy Gosset, uma
distribuio de probabilidade estatstica.
A distribuio t uma distribuio de probabilidade terica. simtrica, campaniforme,
e semelhante curva normal padro, porm com caudas mais largas, ou seja, uma
simulao da t de Student pode gerar valores mais extremos que uma simulao da
normal. O nico parmetro v que a define e caracteriza a sua forma o nmero de graus
de liberdade. Quanto maior for esse parmetro, mais prxima da normal ela ser.

Definio
Suponha que Z tenha a distribuio normal com mdia 0 e varincia 1, que V tenha a
distribuio Chi-quadrado com graus de liberdade, e que Z e V sejam independentes.
Ento:

tem a distribuio t de Student com graus de liberdade.

[editar] Funo densidade de probabilidade


A funo densidade de probabilidade :

em que a funo gama. Usando-se a funo beta B, a funo densidade de


probabilidade pode ser escrita como:

[editar] Aplicaes
A distribuio t de Student aparece naturalmente no problema de se determinar a mdia
de uma populao (que segue a distribuio normal) a partir de uma amostra. Neste
problema, no se sabe qual a mdia ou o desvio padro da populao, mas ela deve ser
normal.
Supondo que o tamanho da amostra n seja muito menor que o tamanho da populao,
temos que a amostra dada por n variveis aleatrias normais independentes X1, ..., Xn,
cuja mdia
populao.

o melhor estimador para a mdia da

Considerando
seguinte resultado:

como a varincia amostral, temos o

A varivel aleatria T dada por:

segue uma distribuio t de Student com = n - 1 graus de liberdade.

Definio
Se = E(X) o valor esperado (mdia) da varivel aleatria X, ento a varincia

Isto , o valor esperado do quadrado do desvio de X da sua prpria mdia. Em


linguagem comum isto pode ser expresso como "A mdia do quadrado da distncia de
cada ponto at a mdia". assim a "mdia do quadrado dos desvios". A varincia da
varivel aleatria "X" geralmente designada por

, ou simplesmente 2.

Notar que a definio acima pode ser usada quer para variveis aleatrias discretas, quer
para contnuas.
Muitas distribuies, tais como a distribuio Cauchy, no tm varincia porque o
integral relevante diverge. Em particular, se uma distribuio no tem valores esperados,
ela tambm no tem varincia.
O contrrio no verdadeiro: h distribuies para as quais existe valor esperado mas
no existe varincia, como, por exemplo, a distribuio t de Student com 2 graus de
liberdade. Um contra-exemplo mais simples uma distribuio discreta sobre
em
que a probabilidade de cada ponto n proporcional a
calculado atravs de uma srie convergente
divergente

. O valor esperado ser

, e a varincia atravs de uma srie

[editar] Propriedades
Se a varincia pode ser calculada (ou seja, a integral ou o somatrio convergem),
podemos concluir que ela nunca negativa, porque os quadrados so sempre positivos
ou nulos.
A unidade de varincia o quadrado da unidade de observao. Por exemplo, a
varincia de um conjunto de alturas medidas em centmetros ser dada em centmetros
quadrados. A varincia de um preo, medido, por exemplo, em euros por metro cbico,
ser dada em euros quadrados por metro sexta potncia, uma unidade que no faz
nenhum sentido prtico. Este facto inconveniente e levou muitos estatsticos a usar a
raiz quadrada da varincia, conhecida como o desvio padro, como um sumrio da
disperso.
Pode ser provado facilmente a partir da definio que a varincia no depende do valor
mdio . Isto , se a varivel "deslocada" por uma quantidade b ao tomarmos X+b, a
varincia da varivel aleatria resultante permanece inalterada. Por contraste, se a
varivel for multiplicada por um factor de escala a, a varincia ento multiplicada por
a2. Mais formalmente, se a e b forem constantes reais e X uma varivel aleatria cuja
varincia est definida, ento:

Outra frmula para a varincia que se deduz de forma simples a partir da definio
acima :

Na prtica usa-se muito frequentemente esta frmula para calcular mais rapidamente a
varincia.

Uma razo para o uso da varincia em preferncia a outras medidas de disperso que a
varincia da soma (ou diferena) de variveis aleatrias independentes a soma das
suas varincias. Uma condio no to estricta, chamada de incorrelao
(uncorrelatedness) tambm suficiente. Em geral,

Aqui

a covarincia, a qual zero para variveis aleatrias no correlacionadas.

[editar] Varincia da populao e varincia da amostra


Em estatstica, o conceito de varincia tambm pode ser usado para descrever um
conjunto de observaes. Quando o conjunto das observaes uma populao,
chamada de varincia da populao. Se o conjunto das observaes (apenas) uma
amostra estatstica, chamamos-lhe de varincia amostral (ou varincia da amostra).
A varincia da populao de uma populao yi onde i = 1, 2, ...., N dada por

onde a mdia da populao. Na prtica, quando lidando com grandes populaes,


quase sempre impossvel achar o valor exacto da varincia da populao, devido ao
tempo, custo e outras restries aos recursos.
Um mtodo comum de estimar a varincia da populao atravs da tomada de
amostras. Quando estimando a varincia da populao usando n amostras aleatrias xi
onde i = 1, 2, ..., n, a frmula seguinte um estimador no enviesado:

onde

a mdia da amostra.

Notar que o denominador n-1 acima contrasta com a equao para a varincia da
populao. Uma fonte de confuso comum que o termo varincia da amostra e a
notao s2 pode referir-se quer ao estimador no enviesado da varincia da populao
acima como tambm quilo que em termos estrictos, a varincia da amostra, calculada
usando n em vez de n-1.
Intuitivamente, o clculo da varincia pela diviso por n em vez de n-1 d uma
subestimativa da varincia da populao. Isto porque usamos a mdia da amostra
como uma estimativa da mdia da populao , o que no conhecemos. Na prtica,
porm, para grandes n, esta distino geralmente muito pequena.

[editar] Generalizaes

Se X uma varivel aleatria vectorial, com valores em Rn, e considerado como um


vector coluna, ento a generalizao natural da varincia E[(X )(X )T], onde =
E(X) e XT a transposta de X, e logo um vector-linha. A varincia uma matriz
quadrada no-negativa definida, referida geralmente como a matriz de covarincia.
Se X uma varivel aleatria de valores complexos, ento a sua varincia E[(X )(X
)*], onde X* o conjugado complexo de X. Esta varincia, assim como no caso real,
uma matriz quadrada no-negativa definida, cuja diagonal so nmeros reais nonegativos.
Exemplo agronomico
ESTIMATIVAS DE PARMETROS GENTICOS E PREDIO DE
VALORES GENOTPICOS NO MELHORAMENTO DO CAFEEIRO PELO
PROCEDIMENTO REML/BLUP
RESUMO
Objetivou-se aplicar o mtodo REML/BLUP em
programas de melhoramento gentico do cafeeiro,
utilizando-o na estimao de parmetros genticos e
predio de valores genotpicos para a espcie Coffea
arabica. O experimento foi instalado em julho de 1998
pela Universidade Estadual Paulista (UNESP), em
Selvria (MS). As 12 cultivares selecionadas pelo
Instituto Agronmico (IAC), Campinas (SP), foram
avaliadas no delineamento em blocos ao acaso com
quatro repeties e dez plantas por parcela. Os
resultados revelaram baixa variabilidade gentica entre
as cultivares para os caracteres altura da planta,
dimetro do caule e nmero de ramos plagiotrpicos,
avaliados aos 26 meses. Apenas as cultivares Catua
Amarelo, Icatu Vermelho e Catua Vermelho
apresentaram valores genotpicos preditos para o
dimetro do caule superiores mdia geral desse
carter. A acurcia na avaliao dos valores genotpicos
das cultivares para o carter dimetro do caule
equivaleu, em mdia, a 76%. A adoo de uma
experimentao com duas plantas por parcela e 20
repeties poder elevar a 90% a acurcia seletiva para
o carter dimetro do caule. O mtodo de modelos
mistos (REML/BLUP) mostrou-se adequado estimao
de parmetros genticos e predio de valores
genotpicos no melhoramento do cafeeiro, podendo ser
empregado rotineiramente.

1. INTRODUO

O caf uma das principais fontes de divisas para o Brasil. As


duas espcies de cafeeiro mais cultivadas no mundo so
Coffea arabica L. caf arbica e Coffea canephora Pierre
caf robusta , as quais respondem por cerca de 70% e 30%
da produo mundial. No Brasil, a principal espcie plantada
C. arabica (sobretudo nos Estados de Minas Gerais, So
Paulo e Paran), sendo C. canephora a que apresenta rea de
plantio mais restrita (Esprito Santo, Rondnia e Sul da
Bahia). Em nvel mundial, C. arabica produzida
principalmente no Brasil, Colmbia, Qunia e ndia, e C.
canephora, no Vietn, Indonsia, Brasil e Costa do Marfim
(FAZUOLI, 1986).
C. arabica uma espcie autgama alopoliplide (tetraplide)
com 2n = 4x = 44 cromossomos e C. canephora, algama
diplide com 2n = 2x = 22 cromossomos. C. arabica
apresenta distribuio geogrfica natural restrita aos pases
Etipia (regio Sudeste), Sudo (regio Sudeste) e Qunia
(regio Norte), em altitudes entre 1.000 e 2.000 metros. Por
outro lado, C. canephora tem ampla distribuio geogrfica,
ocorrendo em regies de pequena altitude no oeste e centro
do continente africano (CARVALHO et al., 1985).
Em razo da importncia da cultura do caf para o Brasil, os
programas de melhoramento do cafeeiro desenvolvidos no
Pas apresentam importncia fundamental como fator de
aumento da produo, produtividade e de desenvolvimento
scio-econmico das regies de cultivo. Tais programas tm
sido desenvolvidos com sucesso para C. arabica (FAZUOLI,
1986; CARVALHO e FAZUOLI, 1993; SERA, 1998; SAKIYAMA
et al., 1999; MENDES, 1999) e C. canephora (FAZUOLI,
1986; CARVALHO e FAZUOLI, 1993; FERRO et al., 1999).
Desenvolveram-se, tambm, estudos fundamentais de
gentica e evoluo do cafeeiro (CARVALHO et al., 1985,
1991), cujos resultados so de grande importncia cientfica
e tecnolgica.
Espcies vegetais perenes como o cafeeiro apresentam
aspectos biolgicos peculiares: ciclo reprodutivo longo;
acentuada oscilao anual de produo, resultando em ciclo
bienal de produo; sobreposio de geraes; expresso dos
caracteres ao longo de vrios anos e diferenas em
precocidade e longevidade produtiva (SERA e ALVES, 1999;
SERA, 2001). Em termos de melhoramento gentico, tais
aspectos levam s seguintes conseqncias: (a) utilizao do
material gentico selecionado para produo comercial por
vrios anos, o que demanda rigor e preciso nos mtodos de
seleo; (b) uso de avaliaes repetidas em cada indivduo ao

longo do tempo; (c) reduo na taxa de sobrevivncia dos


experimentos durante sua vida til, fato que tende a gerar
dados desbalanceados para uso na estimao de parmetros
genticos e na predio dos valores genticos aditivos e
genotpicos.
Tendo em vista as conseqncias relatadas em (a), pode-se
afirmar que uma ao de fundamental relevncia no processo
do melhoramento do cafeeiro a predio dos valores
genotpicos dos candidatos seleo. O procedimento de
predio de valores genticos depende do conhecimento do
controle gentico dos caracteres sob seleo, especialmente
dos parmetros herdabilidade e repetibilidade individuais. O
principal uso das estimativas de parmetros genticos, alm
do tradicional como subsdio para o planejamento de
eficientes estratgias de melhoramento, est na prpria
predio de valores genticos. Estimativas individuais de
parmetros genticos, como a herdabilidade individual, so
raras em caf, citando-se apenas as obtidas por WALYARO e
VAN DER VOSSEN (1979), no Qunia, e CILAS et al. (1998),
em Camares, ambos para C. arabica, LEROY et al. (1994),
na Costa do Marfim, e CILAS et al. (2000), na Costa do
Marfim e Togo, ambas para C. canephora. Estimativas de
parmetros genticos e fenotpicos, em nvel de mdias de
linhagens so comuns no Brasil, podendo-se citar SERA
(1980, 1987) e SERA e ALVES (1999).
Em funo das peculiaridades agronmicas do cafeeiro e suas
conseqncias, em particular o fator (c), tem-se a
necessidade do uso de mtodos especiais de estimao de
parmetros genticos e de predio de valores genticos.
Assim, os mtodos tradicionais de estimao com base em
anlise da varincia no so os mais recomendados para a
anlise de dados no melhoramento do cafeeiro. Atualmente, o
procedimento analtico padro recomendado para os estudos
em gentica quantitativa e tambm para a prtica da seleo
em plantas perenes o REML/BLUP, ou seja, a estimao de
componentes da varincia por mxima verossimilhana
restrita (REML) e a predio de valores genticos pela melhor
predio linear no viciada (BLUP).
Com base no exposto, o presente trabalho teve como objetivo
aplicar o mtodo REML/BLUP nos programas de
melhoramento do cafeeiro, utilizando-a na estimao de
parmetros genticos e predio de valores genotpicos em
experimento com cultivares de C. arabica.

2. MATERIAL E MTODOS
Na aplicao do procedimento REML/BLUP considerou-se um
experimento com cafeeiro instalado na Fazenda de Ensino e
Pesquisa da Universidade Estadual Paulista (UNESP), Cmpus
de Ilha Solteira, localizada no municpio de Selvria (MS).
O experimento foi instalado em julho de 1998, com mudas
provenientes de sementes de 12 cultivares de C. arabica
obtidas no Instituto Agronmico, em Campinas (SP). Adotouse o delineamento experimental em blocos ao acaso com 12
tratamentos, quatro repeties e dez plantas por parcela.
Em setembro de 2000, avaliaram-se em todas as plantas da
parcela as caractersticas: altura da planta (ALT) em
centmetros (cm), dimetro do caule a 20 cm de altura
(DIAM) em milmetros (mm) e nmero de pares de ramos
plagiotrpicos (NRP), as quais foram analisadas. Mediu-se a
altura das plantas da base at o seu ponto mais alto, o que
coincide com os ramos em incio de formao. O dimetro do
caule foi tomado na insero do primeiro par de ramos
plagiotrpicos, o qual foi marcado e as mensuraes sempre
efetuadas naquele local. O nmero de pares de ramos
plagiotrpicos foi mensurado em toda a planta, pois o
cafeeiro desenvolve-se por fluxos de pares de ramos.
As cultivares avaliadas foram: 1-IAC 4395; 2-Catua Amarelo
IAC 62; 3-Icatu Amarelo IAC 2944; 4-Tupi IAC 1669-33; 5Acai IAC 474-19; 6-Mundo Novo IAC 388-17; 7-Catua
Vermelho IAC 144; 8-Bourbon Amarelo IAC 18; 9-Obat IAC
1669-20; 10-Icatu Precoce IAC 3282; 11-IAC 4394; 12-Icatu
Vermelho IAC 4045. Os materiais 4394 e 4395 so
retrocruzamentos de Catua x Mundo Novo, sendo o Catua
obtido de um cruzamento de Caturra (porte baixo) com
Mundo Novo (porte alto).
Para um experimento no delineamento em blocos ao acaso
com vrias plantas por parcela e uma s medio por planta
o seguinte modelo linear misto se aplica na avaliao de
linhagens no aparentadas (conhecendo-se exatamente o
parentesco entre todas as linhagens avaliadas, o
procedimento de predio pode ser melhorado), trabalhandose com dados de cada indivduo.
2.1. Modelo linear misto (modelo genotpico
univariado)

em que y, b, g, c e e = vetores de dados individuais, dos


efeitos de blocos (fixos), dos efeitos genotpicos (aleatrios),
de efeitos de parcela (aleatrios) e dos erros aleatrios
respectivamente; X, Z e W = matrizes de incidncia para b, g
e c respectivamente.
2.2. Distribuies e estruturas de mdias e varincias

ou seja:

em que:

2.3. Equaes de modelo misto

em que:

= herdabilidade individual no sentido


amplo no bloco;
= correlao devida ao ambiente
comum da parcela;
= varincia genotpica;
= varincia entre parcelas;
= varincia residual (= ambiente dentro de
parcelas).
2.4. Estimadores iterativos dos componentes de
varincia por REML via algoritmo EM (ExpectationMaximization)

em que:
C22 e C33 advm de:

C = matriz dos coeficientes das equaes de modelo misto;


tr = operador trao matricial;
r(x) = posto da matriz X;
N, q, s = nmero total de dados, nmero de linhagens e
nmero de parcelas respectivamente.
Realizaram-se as anlises com o uso do software DFREML,
desenvolvido por MEYER (1998).
Em termos citogenticos, o comportamento de indivduos
alopoliplides, como em C. arabica, muito similar quele
apresentado por indivduos diplides. Assim, em gentica
quantitativa, esta espcie pode ser tratada como se tratam as
espcies diplides (WRICKE e WEBER, 1986).

A decomposio do componente de varincia pode ser


realizada segundo dois modelos, ignorando a epistasia:
Modelo 1 (COCKERHAM, 1954)

Modelo 2 (COCKERHAM, 1983)

em que:
F = coeficiente de endogamia da linhagem;
= varincia gentica aditiva;
= varincia gentica de dominncia;
D1 = covarincia entre os efeitos aditivos dos alelos e os
efeitos de dominncia dos homozigotos (este componente
assume valores negativos para freqncias dos alelos
favorveis inferiores a 0,5);
D2 = varincia dos efeitos de dominncia dos homozigotos;
H = soma de quadrados da depresso endogmica de cada
loco.
O modelo 2 mais geral e vlido para populaes com
quaisquer freqncias allicas; j o modelo 1, para
populaes com freqncias allicas intermedirias (em torno
de 0,5). No ltimo caso, D1 = D2 = 0 e = H, empregandose a expresso do modelo 2, obtm-se a expresso do
modelo 1.
No presente caso, pelo mtodo 2, o contedo de
e, pelo modelo 1, a

equivale a

. Assim, as definies da

herdabilidade individual no sentido amplo(


dois modelos equivalem a:

), segundo os

herdabilidad
e individual no sentido amplo, segundo o
modelo 1;
her

dabilidade individual no sentido amplo,


segundo o modelo 2;
Assumindo o modelo (1) ou, alternativamente, tomando-se
4D1 + D2 = 0, pode-se obter uma estimativa para a
herdabilidade individual no sentido restrito em uma
populao no endgama, pela expresso:

A partir da
herdabilidade individual e do componente
2
c , a "herdabilidade" ao nvel de mdias de cultivares para
cada cultivar dada por:

: "herdabilidade" ao nvel de
mdias para a cultivar i;
ni e bi = nmero de plantas por parcela e
de blocos associados avaliao da
cultivar i.
Com nmeros desiguais de plantas por parcela, a expresso
de

dada por:

No caso da experimentao com n = uma planta por parcela,


a expresso para

dada por:

em que
Esta expresso foi utilizada na determinao do nmero
adequado de indivduos por cultivar a ser adotado na
experimentao visando maximizar a acurcia seletiva.

No presente caso, a acurcia na predio dos valores


genotpicos das cultivares dada por
entre 0 e 1.

, com

A varincia do erro de predio dos valores genotpicos das


cultivares dada por
e o intervalo de
confiana dos valores genotpicos preditos das cultivares, por
, em que t o valor tabelado da distribuio
t de Student associado a determinado grau de confiana (t =
1,96 para um intervalo construdo com 95% de confiana).

3. RESULTADOS E DISCUSSO
Os resultados referentes s estimativas dos parmetros
genticos para os trs caracteres avaliados, aos 26 meses,
so apresentados no quadro 1.

Verifica-se, de maneira geral, baixa variabilidade


gentica entre o material gentico avaliado, conforme
depreende-se das estimativas dos coeficientes de
variao genotpica e das herdabilidades individuais
(Quadro 1). Atribui-se esse fato idade precoce de
avaliao (26 meses), considerada insuficiente para
manifestar as diferenas devido ao reduzido tamanho
das plantas ou, possivelmente, ao alto grau de
parentesco entre as cultivares avaliadas. As
estimativas dos coeficientes de herdabilidade
individual no sentido amplo relatados por WALYARO e
VAN DER VOSSEN (1979) obtidos da avaliao de 16
cultivares no Qunia, tambm apresentaram baixa
magnitude (Quadro 2). importante ressaltar que os
parmetros estimados so vlidos especificamente
para a populao estudada, envolvendo as 12
cultivares e apenas uma avaliao aos 26 meses de
campo. Outros estudos com amostragens maiores
so recomendados.

Os coeficientes de herdabilidade ou de determinao


genotpica individuais apresentaram baixas magnitudes, mas
conduziram a coeficientes de magnitudes razoveis ao nvel
de mdias de cultivares, visto que os efeitos ambientais
foram minimizados pelo nmero de repeties e de plantas
por parcela. Esse fato permite uma seleo com uma preciso
razovel, especialmente para os caracteres dimetro do caule
e altura da planta. Entretanto, deve-se ter em mente que
esses coeficientes podem ainda estar inflacionados pelas
interaes gentipos x anos, gentipos x locais e gentipos x
anos x locais.

Estimativas da herdabilidade no sentido restrito ou


herdabilidade dos efeitos aditivos so muito importantes no
contexto da seleo recorrente, enfatizada para o
melhoramento do cafeeiro por RAMALHO et al. (1999).
As estimativas de
, herdabilidade individual e c2 so
relevantes para: (a) uso no procedimento de predio de
valores genotpicos das cultivares quando houver dados
desbalanceados por exemplo, sobrevivncia diferenciada
das cultivares; (b) uso no correto delineamento (nmero de
repeties e de plantas por parcela) de experimentos visando
acurcia seletiva; (c) cmputo da acurcia associada
avaliao de cada cultivar; (d) cmputo do intervalo de
confiana associado ao valor genotpico predito de cada
cultivar.
Devido maior variabilidade (CVg) e coeficiente de
herdabilidade da varivel dimetro do caule no presente
estudo (Quadro 2), obtiveram-se os valores genotpicos (e
seus intervalos de confiana) das cultivares para tal carter
(Quadro 3). O carter dimetro do caule tem-se mostrado
correlacionado geneticamente com a produo de caf e seus
componentes (WALYARO e VAN DER VOSSEN, 1979; LEROY
et al., 1994; CILAS et al., 1998), fato que ressalta a
importncia desse carter. WALYARO e VAN DER VOSSEN
(1979) sugerem um ndice de seleo com base no dimetro
e na produo da 1.a e 2.a safras, visando ao ganho de tempo
necessrio para completar uma gerao de seleo, de 10
para duas safras.

Verifica-se que apenas trs cultivares, Catua


Amarelo, Icatu Vermelho e Catua Vermelho,
apresentaram valores genotpicos para dimetro do
caule superiores mdia geral. Constata-se tambm
que, quando se considera a sobreposio dos
intervalos de confiana dos valores genotpicos
preditos, vrias cultivares mostram-se
estatisticamente iguais, a 95% de confiana (Quadro
3).
A acurcia ou correlao entre os valores genotpicos
preditos e os verdadeiros equivaleu, em mdia, a
0,76 (Quadro 1). Entretanto, pode-se aument-la por
meio de uma experimentao mais adequada,
mantendo-se o mesmo tamanho do experimento. No
quadro 4 so apresentadas as acurcias que seriam
obtidas considerando-se diferentes tamanhos de
parcela e nmero de repeties na experimentao.

Verifica-se que, para a herdabilidade individual e c 2


considerados, prefervel adotar parcelas menores e
maior nmero de repeties ou blocos. Por exemplo,
adotando-se parcelas de duas plantas e 20
repeties, a acurcia seletiva (que varia de 0 a 1)
aumenta de 0,76 a 0,90, em relao ao uso de
quatro repeties e 10 plantas por parcela.
Adicionalmente, provvel que com a reduo do
nmero de plantas por parcela, a prpria
herdabilidade individual no bloco ( ) aumente
devido ao menor tamanho e maior homogeneidade
do bloco, fato que poder tambm contribuir para o
aumento da acurcia seletiva. importante relatar
que, atualmente, parcelas pequenas tm sido
adotadas em programas de melhoramento do
cafeeiro no mundo, destacando-se os programas
realizados na Costa do Marfim e em Camares, nos
quais empregam-se parcelas de uma planta (LEROY
et al., 1994; CILAS et al., 1998).
O principal enfoque deste trabalho referiu-se
aplicao de um procedimento generalizado de
estimao de parmetros genticos e de predio de
valores genticos no melhoramento do cafeeiro. O
modelo apresentado aplicvel anlise de um nico
experimento, desbalanceado ou no. Entretanto,
vrios modelos podem ser aplicados, sobretudo os
que visam anlise conjunta de vrios experimentos

em presena de interao gentipo x ambiente,


permitindo a seleo de material gentico para
ambientes especficos ou para um ambiente mdio
(RESENDE et al., 1999); anlise com medidas
repetidas em vrias safras em cada indivduo,
empregando um modelo de repetibilidade (RESENDE
e DIAS, 2000), dentre outros. Tambm, o prprio
modelo utilizado pode ser empregado de maneira
mais eficiente quando se conhece a genealogia
completa de todo o material utilizado. Desse modo,
os vrios parentescos existentes so considerados
matrizes de correlao gentica intraclasse entre os
indivduos em avaliao, matrizes estas que so
incorporadas aos estimadores e preditores.
A anlise de modelos lineares mistos (REML/BLUP)
pode ser aplicada tambm ao melhoramento do C.
canephora, espcie algama, visando seleo de
indivduos para propagao por semente ou para
propagao vegetativa. Nesse caso, os estimadores e
preditores apresentados por RESENDE e FERNANDES
(1999) so adequados. A propagao vegetativa pode
ser empregada com vantagem tambm para o C.
arabica, visto que parece existir heterose para os
principais caracteres nessa espcie (CILAS et al.,
1998). Assim, os indivduos heterozigticos com
manifestao de heterose, resultantes da hibridao
entre linhagens superiores, poderiam ser propagados
vegetativamente na gerao F1 ou F2, possibilitando
ganhos genticos superiores utilizao de linhas
puras (RESENDE e MEDRADO, 1994).
importante relatar as principais vantagens do uso
do mtodo de modelos mistos (REML/BLUP) na
simultnea estimao de parmetros genticos e
predio de valores genotpicos no melhoramento do
cafeeiro: (a) pode ser aplicado a dados
desbalanceados; (b) no exige dados obtidos sob
estruturas rgidas de experimentao; (c) permite
utilizar simultaneamente um grande nmero de
informaes provenientes de vrios experimentos,
gerando estimativas mais precisas; (d) corrige os
dados para os efeitos ambientais e prediz de maneira
precisa e no viciada os valores genotpicos,
conduzindo maximizao do ganho gentico com
seleo. Em funo disso, permite a utilizao de
conjuntos de dados que foram tomados,
normalmente, dentro dos programas de

melhoramento, mas que nunca foram utilizados na


estimao de parmetros genticos, por questo de
deficincia de metodologia apropriada que
contemplasse, sobretudo, o desbalanceamento.
Embora haja, atualmente, um mtodo adequado para
a anlise de dados desbalanceados, importante
observar que no se justifica a instalao de
experimentos desbalanceados. Pelo contrrio, todas
as tcnicas experimentais apregoadas
tradicionalmente devem ser seguidas. Os dados
obtidos nos programas de melhoramento e que
geram informaes desbalanceadas devem, porm,
ser analisados conjuntamente e no, simplesmente,
arquivados.

4. CONCLUSES
1. Constatou-se baixa variabilidade gentica entre as
cultivares para os caracteres altura da planta,
dimetro do caule e nmero de ramos plagiotrpicos,
avaliados aos 26 meses em Selvria (MS).
2. Apenas as cultivares Catua Amarelo, Icatu
Vermelho e Catua Vermelho apresentaram valores
genotpicos preditos para o dimetro do caule
superiores mdia geral desse carter.
3. A acurcia na avaliao dos valores genotpicos
das cultivares para o carter dimetro do caule
equivaleu, em mdia, a 76%.
4. A adoo de uma experimentao com duas
plantas por parcela e 20 repeties poder elevar a
90% a acurcia seletiva para o carter dimetro do
caule.
5. O mtodo de modelos mistos (REML/BLUP)
mostrou-se adequado estimao de parmetros
genticos e predio de valores genotpicos no
melhoramento do cafeeiro, podendo ser empregado
rotineiramente.

Dist.Qui-Quadrado(x2)
O coeficiente Chi-Quadrado (ler qui-quadrado), ou chi quadrado, normalmente escrito
como um valor da disperso para duas variveis de escala nominal, usado em
alguns testes estatsticos. Ele nos diz em que medida que os valores observados se
desviam do valor esperado, caso as duas variveis no estivessem correlacionadas.
Quanto maior o chi-quadrado, mais significante a relao entre a varivel dependente
e a varivel independente.
Este valor est relacionado com uma distribuio, chamada Distribuio ChiQuadrado.
A Distribuio Chi-quadrado com k graus de liberdade a distribuio gama com
parmetros (k/2, 1/2).
Quanto maior o nmero de casos (n) ou o nmero de linhas ou colunas da tabela de
contingncia, maior ser o Chi-quadrado. Por isso no faz sentido comparar o Chiquadrado de duas relaes entre variveis. Para o efeito existem outros coeficientes,
entre os quais o coeficiente de contingncia.
A distribuio Chi-quadrado pode ser simulada a partir da distribuio normal. Por
definio, se
forem k distribuies normais padronizadas (ou seja,
mdia 0 e desvio padro 1) independentes, ento a soma de seus quadrados uma
distribuio Chi-quadrado com k graus de liberdade:

Um corolrio imediato da definio que a soma de duas Chi-quadrado independentes


tambm uma Chi-quadrado:

Exemplo agronmico
Consideraes estatsticas relativas oito sries de precipitao
pluvial da Secretaria de Agricultura e abastecimento do Estado de
So Paulo
RESUMO
O correto entendimento das diversas sucesses dos tipos de tempo, que
podem ser observadas em uma regio, uma das etapas fundamentais
na reduo do risco climtico associado ao setor agrcola. O objetivo do
trabalho foi analisar a variabilidade temporal dos dados mensais de
precipitao pluvial de oito localidades do Estado de So Paulo.
Investigaes sobre possveis tendncias climticas tambm foram
realizadas. Por meio da anlise de ondeletas, do teste da razo da
mxima verossimilhana e do teste de Mann-Kendall, observa-se elevada
variabilidade temporal dos valores de precipitao pluvial mensal nas oito

regies analisadas. O tratamento de tais sries como sendo estritamente


estacionrias, ou a conduo de anlises apenas no domnio da freqncia
acarretar em perda de informaes sobre as forantes moduladoras
desse processo estocstico. Apesar dessa caracterstica, no houve
deteco de marcantes tendncias de ordem climtica no regime de
precipitao pluvial. Sob o ponto de vista agrometeorolgico, essa
elevada variabilidade imprime, em um zoneamento, considervel grau de
incerteza na determinao do potencial de atendimento hdrico s
culturas. Tal incerteza deve ser considerada na determinao de reas
aptas, inaptas e marginais.

1. INTRODUO
Em outubro de 1995 o Ministrio da Agricultura, Pecuria e Abastecimento
(MAPA) instituiu, como fase inicial de implantao do programa de
zoneamento agrcola, o projeto de reduo de riscos climticos na
agricultura (Filho et al., 2005). De acordo com Keller (1998) e Schubnell
(1998), entre as diversas etapas desse projeto, a quantificao dos riscos
decorrentes de elementos climticos adversos (principalmente aos
relativos precipitao pluvial), foi objeto de uma abordagem
probabilstica para determinar as chances de sucesso das diversas
culturas em cada regio e poca de plantio.
Sob esse aspecto, o conhecimento da variabilidade espao-temporal de
longas sries meteorolgicas, alm de auxiliar na indicao de perodos e
reas mais propcias ao plantio/semeadura de culturas, pode tambm
trazer informaes extremamente importantes sobre possveis
periodicidades, tendncias ou descontinuidades climticas, auxiliando o
estudo das forantes moduladoras das condies meteorolgicas em uma
regio. A unio (e natural inter-relao) entre esses dois aspectos,
oriundos do conhecimento da variabilidade espao-temporal de longas
sries, etapa fundamental na reduo do risco climtico associado ao
setor agrcola.
Sob o ponto de vista de anlises matemtico-estatsticas, Blain et al.
(2008), por meio da distribuio gama e do teste da razo da
verossimilhana (*), indicam que as sries mensais de precipitao
pluvial da regio de Campinas-SP (1890-2006), no podem ser
consideradas estritamente estacionrias. Segundo esses autores, essa
"no-estacionaridade" indica que investigaes relacionadas
periodicidade de picos de varincia, no devem ser conduzidas apenas no
domnio da freqncia. Tais anlises precisam tambm considerar o
domnio do tempo, j que diferentes perodos (amostras) podem
apresentar picos de varincia com distintas freqncias. Nesse sentido,
Kayano e Blain (2007) indicam, para a regio de Campinas-SP, que a
potncia global da ondeleta da precipitao pluvial mostra picos no
significativos em 0,6; 3,5 e 32 anos. No caso do perodo de 32 anos,
existe apenas indicao de potncias (ou varincias) temporalmente
localizadas entre os anos de 1890 a 1960. Os picos de 0,6 e 3,5 anos so
resultantes de potncias significativas localizadas em esparsos e curtos
intervalos de tempo espalhados no perodo de 1890 a 2006. Com isso, a
necessidade de considerar o domnio tempo-freqncia torna-se evidente.
Haylock et al. (2006) analisando tendncias em valores dirios de
precipitao na Amrica do Sul (1960 a 2000), afirmam que o padro de
alterao observado nos valores extremos desse elemento meteorolgico

, de modo geral, o mesmo para os totais anuais. Neste trabalho so


verificadas mudanas para condies mais midas ("changes to wetter
conditions") na parte sul do Brasil. Em estudos similares, voltados para a
temperatura do ar, Vincent et al. (2005) observou tendncias de elevao
ligadas principalmente temperatura noturna. Segundo esses autores, as
estaes em que foram detectadas tendncias significativas concentramse, especialmente, nas costas leste e oeste da Amrica do Sul. Alexander
et al. (2006) analisando dados globais extremos de temperatura e
precipitao, na escala diria, identificaram em 70% das regies
analisadas, significativa elevao nas temperaturas noturnas. Segundo
esses autores, houve tambm deteco de elevao nos dados relativos
precipitao pluvial. Entretanto, essas ltimas alteraes apresentaram
uma coerncia espacial bastante inferior a observada nos dados de
temperatura do ar.
Estudos sobre tendncias climticas adquirem grande importncia ao ser
considerado que na agricultura brasileira, o mais importante fator de risco
a precipitao pluvial, pois a seca e a chuva excessiva respondem pela
maioria dos sinistros agrcolas (Gpfert et al., 1993). Nesse sentido, Blain
et al. (2008) afirmam tambm que a grande variabilidade amostral dos
parmetros da distribuio gama (ou dos dados de precipitao pluvial
mensal) acarreta em elevado grau de incerteza na caracterizao
climtica do regime de precipitao mensal na regio de Campinas-SP.
Entretanto, segundo esses autores, apesar dessa grande variabilidade
amostral, no h indicaes conclusivas de tendncias de ordem climtica
no regime de precipitao mensal observado nos ltimos 116 anos nessa
regio. Marengo et al. (2007) observaram que, no sudeste do Brasil, o
total anual de precipitao parece no ter sofrido alterao nos ltimos 50
anos.
Dessa forma, a fim de aprofundar as observaes acima citadas para a
regio de Campinas, bem como estend-las s demais localidades do
Estado, o objetivo do trabalho foi analisar a variabilidade temporal dos
dados mensais de precipitao pluvial de oito localidades do Estado de
So Paulo. Investigaes sobre possveis tendncias climticas, tambm
foram realizadas. Espera-se que essas anlises forneam contribuies
importantes ao estado da arte do conhecimento da variabilidade temporal
desse elemento meteorolgico, minimizando o risco climtico associado
ao agronegcio paulista e brasileiro.

2. MATERIAL E MTODOS
Foram utilizados dados de precipitao pluvial mensal de oito localidades
do Estado de So Paulo (Figura 1), pertencentes Secretaria de
Agricultura e Abastecimento (SAA). Por serem destinadas pesquisa e ao
monitoramento agrometeorolgico,a coleta dos dados que compem as
sries utilizadas feita de forma padronizado, rigorosa e (devido seu
uso rotineiro) consistida. As sries no apresentam falhas.
As sries temporais mensais foram denotadas por {Xt, t= 1,2,3...., N},
em que N o nmero de meses contido em cada srie temporal (N = 118
para cada uma das 12 sries mensais de Campinas-SP, por exemplo).
Considera-se tambm que t T que , por sua vez, caracterizado como o
conjunto dos inteiros positivos Z={1,2,3....}. A fim de facilitar a

comparao entres as diferentes formas e escalas das funes densidade


de probabilidade nas diferentes localidades, o perodo homogneo de
1951 a 2007 foi escolhido para ser base inicial do ajuste das sries de
precipitao distribuio gama incompleta. Essa escolha considerou as
indicaes da Organizao Mundial de Meteorologia, quanto ao espao de
tempo mnimo exigido para conduzir uma caracterizao climtica e a
menor srie disponvel (Pindorama-SP). Blain (2005) por meio dos testes
qui-quadrado e kolmogorov-Smirnov afirma que a distribuio de
freqncias dos valores Xt, oriundos de cada srie mensal de precipitao
mensal, pode ser representada pela distribuio gama. A funo
densidade de probabilidade gama (FDPG) descrita por:

Em que T() a funo gama, e so, respectivamente, parmetros de


forma e escala da distribuio. Esses parmetros foram calculados pelo
mtodo da mxima verossimilhana como recomendado e descrito por
Wilks (2006) e Blain et al. (2006). Segundo Ben-Gai et al. (1998), a FDPG
assume diversas formas, de acordo com a variao de : valores desse
parmetro inferiores a 1 resultam em uma distribuio fortemente
assimtrica (forma exponencial) com g(X) tendendo ao infinito para X
tendendo a 0. Em = 1 a funo intercepta o eixo vertical em 1/ para X
= 0. O aumento da magnitude desse parmetro diminui o grau de
assimetria (desvio em relao moda) da distribuio (a densidade de
probabilidade desloca-se para a direita). Valores de maiores que 1
resultam na FDPG com ponto mximo (moda) em *(-1).
Para fins agrometeorolgicos, tais como o zoneamento agrcola, seria
conveniente que a estrutura de probabilidade, caracterizada na amostra
dos anos de 1951 a 2007, permanecesse constante em demais perodos
futuros. Em outras palavras, seria interessante que o processo x(t)
desenvolvesse-se no tempo, de modo que a escolha de uma origem t no
fosse importante (processo estritamente estacionrio). Nesse sentido,
Nakken (1998) afirma que anlise de ondeletas um mtodo importante
para analisar tendncias no-estacionrias em sries de precipitao e de
escorrimento superficial (runoff), revelando mudanas abruptas, pontos
de quebra e descontinuidades nos sinais desses elementos. Essa autora
afirma tambm que tais sries requerem, devido natureza temporal de
seus sinais, investigaes baseadas no espao tempo-freqncia a fim de
revelar suas caractersticas espectrais como funo do tempo. A anlise
de ondeleta foi aplicada para as sries (todo o perodo) de CordeirpolisSP, Jundia-SP, Mococa-SP, Monte Alegre do Sul-SP, Pindorama-SP,
Ribeiro Preto-SP e Ubatuba-SP. Os resultados obtidos foram comparados
aos de Kayano e Blain (2007) (realizados para o municpio de Campinas,
utilizando a ondeleta - me de Mortet).
A ondeleta - me apropriada deve ter um padro semelhante ao sinal em
estudo (Nakken, 1998). Ainda segundo Nakken (1998) esse tipo de
ondeleta - me, assim como as distribuies mensais de precipitao
pluvial, apresenta pontos de mximos (picos superiores) e de mnimos
(picos inferiores). Sob o mesmo aspecto, Torrence e Compo (1998)
afirmam que tipos de ondeletas - mes como a de Morlet, so apropriadas
para analisar a amplitude e a fase dos sinais sob avaliao sendo, com
isso, indicadas para o estudo de sries temporais com caractersticas

oscilatrias. Dessa forma, a funo ondeleta - me utilizada foi a de


Morlet. A climatologia das sete sries foi removida subtraindo-se as
medianas mensais de cada valor Xt. Optou-se por trabalhar com a
mediana devido a no-normalidade das distribuies utilizadas.
Admitindo-se a possibilidade de que as sries de precipitao do Estado
de So Paulo no possam ser consideradas estritamente estacionrias,
torna-se importante investigar a influncia que a adoo de diferentes
perodos amostrais pode ter na determinao do potencial de atendimento
hdrico s culturas em uma regio. O teste da razo da verossimilhana
(*) indicado por Schickedanz e Krause (1969) e Wilks (2006) como
sendo uma interessante alternativa para verificar se distintos perodos de
uma srie histrica de precipitao mensal podem ser considerados
oriundos da "mesma distribuio gama". Assim, o teste compara a
verossimilhana associada uma hiptese de nulidade (Ho)
verossimilhana associada a uma hiptese alternativa HA. Ho considera
que os distintos perodos sob teste pertencem "mesma distribuio
gama" e rejeitada quando as verossimilhanas associadas HA
(definida como Ho no verdadeira) so suficientemente elevadas para
que as diferenas estatsticas entre os perodos sejam consideradas
apenas variaes amostrais. Uma interpretao relacionada que a
rejeio de Ho indica que a probabilidade de ocorrncia associada a um
dado valor de precipitao pluvial difere significativamente (ao nvel
escolhido) entre as amostras. Ho rejeitado se o valor de * for superior
ao valor de um dado quantil (calda direita) da distribuio qui-quadrado.
O quantil 0,9 (90% de significncia) dessa distribuio foi adotado como
nvel de significncia do teste. Dessa forma, o valor crtico desse teste
(considerando-se duas amostras) 4,605. O teste * definido por Wilks
(2006) da seguinte forma:

Considerando-se duas amostras hipotticas pertencentes a uma srie dos


meses de janeiro entre os anos de 1900 a 1999 o teste pode ser calculado
por:

Em que:

Quanto maior a diferena entre os totais de precipitao observados nas


amostras maior ser a diferena entre os somatrios L(,;xi) de cada
amostra e, consequentemente, maior ser o valor de *. importante
ressaltar que este mtodo exige que os diferentes perodos amostrais sob
anlise possuam o mesmo nmero de dados. Dessa forma, o perodo
homogneo de 1951 a 2007 no permite a determinao de duas
amostras com o mesmo nmero de dados (anos). Esse problema seria
contornado adotando-se, para todas as localidades, o perodo de 1952 a
2007 (gerando duas amostras homogneas de 28 anos). Em contra
partida, exceo da localidade de Pindorama, essa adoo resultaria na
perda de grande nmero de dados nas demais localidades. Dessa forma,

ainda que dificulte a comparao entre as localidades, optou-se por


trabalhar com o maior nmero de dados possvel (divididos em dois
perodos amostrais) em cada regio. As amostras mensais so:
Cordeirpolis (1934/70 e 1971/07); Jundia (1942/74 e 1975/07); Mococa
(1942/74 e 1975/07); Monte Alegre do Sul (1944/75 e 1976/07);
Pindorama (1952/1979 e 1980/07); Ribeiro Preto (1938/1972 e
1973/2007); e Ubatuba (1936/71 e 1972/07). Nas amostras mensais em
que observou-se * significativo, foram realizadas inferncias sobre
elevaes ou quedas no regime de precipitao observado entre os dois
perodos.
Apesar dessas inferncias, a robustez do teste * na deteco de quedas
ou elevaes em sries temporais de precipitao limitada, pois a
distribuio temporal (seqncia) dos valores de precipitao dentro de
cada amostra mensal no considerada. Esse tipo de anlise pode ser
realizado por meio do teste de Mann-Kendall (MK). O teste MK (Kendall e
Stuart, 1967) utilizado por Goosens e Berger (1986), Moraes et al.
(1995), Back (2001) e Marengo et al. (2007), na deteco de tendncias
em sries temporais de precipitao pluvial. Moraes et al. (1995) e Back
(2001) o descrevem por meio de uma srie temporal de Xi com N termos.
O teste consiste na soma tn do nmero de termos mi da srie, relativo ao
valor Xi cujos termos anteriores (j<i) so inferiores ao mesmo (Xj < Xi),
assim:

Devido ao fato das sries utilizadas nesse estudo serem longas, na


ausncia de tendncias (hiptese de nulidade, Ho), tn apresentar
distribuio normal com mdia [E(tn)] e varincia [Var(tn)]. O teste
calculado por:

Adotando-se o nvel de significncia 5%, utilizado por Moraes et al.


(1995), Back (2001) e Marengo et al. (2007), Ho deve ser rejeitada
sempre que o valor de u(t) estiver fora do intervalo de confiana [-1,96;
+1,96]. Em outras palavras, se o valor de u(t) foi inferior -1,96 h, de
acordo com o teste MK, significativas tendncias de queda nos valores da
srie sob investigao. Quando u(t) superior a 1,96 h significativas
tendncias de elevao. O MK foi aplicado, separadamente, em cada srie
mensal de cada uma das oito localidades do estudo (8 localidades e 12
meses; totalizando 96 sries mensais; anlogo ao teste *). A fim de
facilitar o entendimento do teste MK, apresentado o exemplo hipottico
de uma srie temporal Xi com N=30 termos contendo elevao em seus
dados.

Xi =
{1;2;3;4;3;3;4;5;6;1;2;3;3;4;5;35;45;35;40;35;30;40;53;50;40;30;32
;35;35;40}.
Os respectivos valores mi so (equao 5):
mi={0;1;2;3;2;2;5;7;8;0;2;4;4;9;12;15;16;15;17;15;15;19;22;22;19;1
5;17;18;18;13}.
No exemplo, tn = 327; E(tn)=217,5; Var(tn)= 785,5 e u(t) = 3,907
(significativo 5%). importante observar que, quando h repetio de
valores em Xi, o termo mi permanece constante. Dessa forma a tendncia
(significativa ou no significativa) que estava sendo observada antes da
repetio dos valores mantida. Para as sries mensais utilizadas, a
repetio de valores ocorreu em menos de 1% dos casos.

5.d.poissan
Na teoria da probabilidade e na estatstica, a distribuio de Poisson uma distribuio
de probabilidade discreta. Ela expressa, por exemplo, a probabilidade de um certo
nmero de eventos ocorrerem num dado perodo tempo, caso estes ocorram com uma
taxa mdia conhecida e caso cada evento seja independente do tempo decorrido desde o
ltimo evento. A distribuio foi descoberta por Simon-Denis Poisson (17811840) e
publicada, conjuntamente com a sua teoria da probabilidade, em 1838 no seu trabalho
Recherches sur la probabilit des jugements en matires criminelles et matire civile
("Inqurito sobre a probabilidade em julgamentos sobre matrias criminais e civis"). O
trabalho focava-se em certas variveis aleatrias N que contavam, entre outras coisas, o
nmero de ocorrncias discretas (por vezes chamadas de "chegadas") que tinham lugar
durante um intervalo de tempo de determinado comprimento. A probabilidade de que
existam exactamente k ocorrncias (k sendo um inteiro no negativo, k = 0, 1, 2, ...)

onde

e base do logaritmo natural (e = 2.71828...),


k! o factorial de k,
um nmero real, igual ao nmero esperado de ocorrncias que ocorrem num
dado intervalo de tempo. Por exemplo, se o evento ocorre a uma mdia de 4
minutos, e estamos interessados no nmero de eventos que ocorrem num
intervalo de 10 minutos, usarimos como modelo a distribuio de Poisson com
= 10/4 = 2.5.

Como funo de k, esta a funo de probabilidade. A distribuio de Poisson pode ser


derivada como um caso limite da distribuio binomial.
A sua mdia e a sua varincia so iguais a .

[editar] Processo de Poisson


A distribuio de Poisson aparece em vrios problemas fsicos, com a seguinte
formulao: considerando uma data inicial (t = 0), seja N(t) o nmero de eventos que
ocorrem at uma certa data t. Por exemplo, N(t) pode ser um modelo para o nmero de
impactos de asterides maiores que um certo tamanho desde uma certa data de
referncia.
Uma aproximao que pode ser considerada que a chance de acontecer um evento em
qualquer intervalo no depende (no sentido de independncia estatstica) da chance de
acontecer em qualquer outro intervalo disjunto.
Neste caso, a soluo para o problema o processo estocstico chamado de processo de
Poisson, para o qual vale:

em que uma constante (de unidade inversa da unidade do tempo).


Ou seja, o nmero de eventos at uma poca qualquer t uma distribuio de Poisson
com parmetro t.
Distribuio discretade probabilidade aplicvel a ocorrnciasde um evento em um
intervalo especificadoTAXA
Exemplos
usurios de computador ligados Internet
clientes chegando ao caixa de um supermercado
acidentes com automveis em uma determinada estrada
Nmero de carros que chegam a um posto de gasolina
Nmero de avies seqestrados em um dia
Nmero de falhas em componentes por unidade de tempo
Nmero de requisies para um servidor em um intervalo de tempo t
Nmero de peas defeituosas substitudas num veculo durante o primeiro ano
de vida
Distribuio de Poisson

Portanto:
A varivel aleatria Xo node ocorrncias do
evento no intervalo
O intervalo pode ser o tempo, a distncia, a rea, o volume ou outra unidade anloga
Esta distribuio representa a probabilidade de que um evento ocorra um no
especificado de vezes em um intervalo de tempo (espao), quando a taxa de
ocorrncia fixa
P(x)=2222
x = valor da v. a. node ocorrncias do evento em um intervalo= taxa de
ocorrncia do evento x (noesperado de eventos)e 2,71828 (constante
natural)
Uma central telefnica tipo PABX recebe uma mdiade 5 chamadas por
minuto. Qual a probabilidade deste PABX no receber nenhuma chamada
durante um intervalo de 1 minuto?
3333333333333333333333333333
X = v. a. node chamadas em um intervalo de tempo
= taxa de ocorrncia de chamadas (noesperado de chamadas)

Os parmetros da Distribuio de Poisson so


4444444444444444444444444444444444444444444444444444444444
Ex,agronmico

Influncia do tempo de contagem na determinao da


densidade de nutrons
RESUMO
Com o objetivo de se estudar a influncia do tempo de
contagem na determinao da densidade de nutrons
moderados com uma sonda de nutrons, num Latossolo
localizado na rea experimental do Departamento de Engenharia
Rural, da Faculdade de Cincias Agronmicas, Universidade
Estadual Paulista, Campus de Botucatu, SP, coletaram-se dados
no interior de uma estufa de polietileno, a trs profundidades no
solo, 15, 30 e 45 cm, com tempos de contagem de 1, 4, 16, 32,
64, 128 e 256 s, com cinco repeties. Para avaliao da
variabilidade entre as leituras, utilizaram-se mtodos
estatsticos descritivos: varincia, desvio-padro, valores de
amplitude e coeficiente de variao. Para se determinar a
influncia do tempo de contagem no valor das leituras, utilizouse o teste F e comparao entre mdias atravs do teste de
Tukey. Com exceo da profundidade de 45 cm, observou-se
pequena variabilidade entre as leituras obtidas para cada tempo
de contagem e uma significante variao entre as mdias das
leituras obtidas com curtos (1 e 4 s) e longos (tempos maiores
de 16 s) tempos de contagem. O uso de longos tempos de
contagem (maiores de 32 s) no ocasiona diferena significativa
na magnitude das leituras.

Palavras-chave: sonda de nutrons, tempo de contagem,


distribuio de Poisson

ABSTRACT
To study the influence of the neutron probe counting time on
neutron density determination a study was carried out on a
Latossol, under greenhouse conditions, at the Experimental
Station of the Rural Engineering Department, UNESP in
Botucatu-SP. Neutron probe data were collected, with five
replicates, at three soil depths (15, 30 and 45 cm) with counting
times of 1, 4, 16, 32, 128 and 256 s. To evaluate the variability
among replicates, conventional statistics parameters were
determined : variance, standard deviation, amplitude and
coefficient of variation; to determine the influence of the
counting time on neutron density determination, analyses of
variance (F test) and comparisons of means (Tukey Test) were
also conducted. The results showed small variability among
readings for each counting time and significant variation among
the reading means for the short (1 and 4 s) and long (longer
than 16 s), counting times with the exception of the 45 cm soil
depth. The use of long counting times (longer than 32 s) does
not cause any significant difference on the readings magnitude.
Key words: Neutron probe, radiation counting time, Poisson
distribution

INTRODUO
A sonda de nutrons um instrumento utilizado para a
determinao do contedo de gua do solo. As principais
vantagens do mtodo so: permitir a obteno de valores de
umidade do solo no mesmo ponto e a qualquer tempo sem
deformar o solo, ser rpido e preciso, apresentando a
possibilidade de alta periodicidade de medio, de fcil manejo e
relativamente barato e poder ser conectado a registradores,
possibilitando leituras contnuas no campo. (Torres & Gonzles,
1993). Sua capacidade de trabalho estende-se a solos bem mais
secos, onde os tensimetros no podem ser utilizados.
O principio da metodologia de determinao da umidade do solo
com sonda de nutrons consiste, segundo Guerra (2000) em
colocar uma fonte radioativa a uma profundidade desejada no
solo (atravs de um tubo de acesso, de ao ou alumnio,
inserido verticalmente no solo) em que os nutrons rpidos so
emitidos, penetrando radialmente no solo, onde se encontram
vrios ncleos atmicos com os quais colidem elasticamente,
perdendo energia cintica. Esta perda mxima quando o

nutron bate com uma partcula de massa similar sua. Na


prtica, tem-se encontrado que a moderao de nutrons
rpidos no solo proporcional ao contedo de hidrognio no
solo (com ncleos de massa similar aos nutrons). Assim,
quando os nutrons rpidos colidem com os ncleos de
hidrognio da gua do solo, esses nutrons perdem sua mxima
energia formando, ao redor da fonte radioativa, uma nuvem de
nutrons moderados (ou termalizados) os quais so captados
pelo detector, geralmente constitudo de BF3 (Trifluoreto de
boro) e assim, quando um nutron moderado ou lento encontra
10
5B e absorvido, uma partcula de He emitida, criando um
pulso eltrico. Este pulso, por sua vez, enviado, atravs de um
cabo, ao medidor, onde uma leitura registrada. Quanto mais
hidrognio no solo (mais gua) mais nutrons rpidos so
moderados, maior o nmero de pulsos enviados ao medidor e
maior a leitura.
Os erros cometidos na obteno de leituras provenientes de
uma fonte emissora de nutrons so, comumente, de dois tipos:
erro devido emisso ao acaso de nutrons e erro associado
com o equipamento utilizado. Para qualquer tempo, a contagem
de nutrons segue a distribuio de Poisson com mdia igual a n
e desvio-padro n1/2 (Gardner, 1985). Se um nmero adequado
de medies feito e a informao plotada numa curva de
distribuio de desvios com respeito a mdia, se encontrar que
a contagem segue a familiar curva de distribuio normal, a
qual para a maioria das medies nucleares uma adequada
aproximao da distribuio de Poisson (Wang and Willis, 1965).
Em geral, as contagens so feitas para se obter aproximaes
equivalentes a um desvio padro de 1%.
As leituras utilizadas para determinar a umidade do solo
utilizando-se a sonda de nutrons, podem ser realizadas em
diferentes tempos de acionamento do monitor de contagem dos
nutrons moderados, a partir de um ajuste do menu de
comando do equipamento.
Apesar da sonda de nutrons j estar em uso por mais de trs
dcadas, ainda existe discusso ou controvrsia acerca do
tempo de contagem mais adequado. Chawla & Tripathi (1987);
Carneiro & De Jong (1989) e Encarnao et al. (1991)
apresentam vrias metodologias de campo e de laboratrio,
para a calibrao de sondas e determinao da umidade do
solo; no entanto, no levada em conta a influncia do tempo;
j Beltrame & Taylor (1980), Falleiros et al. (1994) e Marciano
(1995), aconselharam leituras com sonda de nutrons usando
tempos de contagem longos, no sentido de se obter valores de
umidade mais prximos do real. Horiushi et al. (2000) salientam
que o tempo de contagem , juntamente com a natureza e a
densidade do solo, o principal determinante da preciso das
determinaes do teor de gua do solo com o uso da sonda de
nutrons.
O presente trabalho teve como objetivo estudar a influncia do
tempo de contagem na magnitude das leituras e sua
variabilidade dentro de cada tempo de contagem.

MATERIAL E MTODOS
Este trabalho foi desenvolvido numa estufa de polietileno
transparente de baixa densidade, com dimenses de 7,5 m de
largura por 28 m de comprimento, instalada na rea
experimental do Departamento de Engenharia Rural, da
Faculdade de Cincias Agronmicas, Universidade Estadual
Paulista, Campus de Botucatu, SP. O solo, no interior da estufa,
sem cultivo, classificado como Terra Estruturada Latosslica.
A sonda de nutrons utilizada foi uma sonda CPN modelo 503
DR Hidroprobe (50 mCi Am-241/Be) introduzida no solo atravs
de tubos de acesso, de alumnio, com 48 mm e 50 mm de
dimetro interno e externo, respectivamente. Os tempos de
contagem estudados foram de 1, 4, 16, 32, 64, 128 e 256 s. As
leituras foram realizadas com cinco repeties nas
profundidades de 15, 30 e 45 cm, quando o contedo de gua
do solo era de 24,47; 24,13 e 24,45%, respectivamente. Para
se avaliar a variabilidade entre as leituras, utilizaram-se
mtodos estatsticos clssicos: varincia, desvio-padro, valores
de amplitude e coeficiente de variao e, para se identificar a
distribuio terica mais representativa do comportamento dos
dados observados, usaram-se os coeficientes de assimetria e
curtose. O delineamento estatstico utilizado para determinao
da influncia do tempo de contagem no valor das leituras foi
inteiramente casualizado, com 7 tratamentos (tempos de
contagem) e 5 repeties, para cada profundidade em estudo.
As mdias dos tratamentos foram comparadas utilizando-se o
teste Tukey a nvel de significncia de 5%, conforme Gomes
(1987).

RESULTADOS E DISCUSSO
A partir dos valores de leitura (taxas de contagem em cpm)
obtidos com a sonda de nutrons com os sete tempos de
contagem (1, 4, 16, 32, 64, 128 e 256 s) para as trs
profundidades do solo (15, 30 e 45 cm) foram obtidos os
momentos estatsticos apresentados na Tabela 1, os quais
resumem o comportamento geral dos dados. Os baixos
coeficientes de variao, desvios padres e amplitudes
observados para cada tempo de contagem e profundidade
indicam, em geral, pequena variabilidade entre as repeties.
Com exceo dos tempos de contagem de 1 e 4 s, os desvios
padres, indicadores da exatido de qualquer medida individual,
foram inferiores a 1%, exatido considerada aceitvel nesse tipo
de medies, segundo Gardner (1985). Igualmente, com
exceo dos tempos de contagem de 1 e 4 s, todos os
coeficientes de variao foram inferiores a 1, o que segundo
Havercamp et al. (1984) revela pequena ou insignificante
variabilidade das leituras. Para as leituras realizadas aos 1 e 4 s,
os coeficientes de variao foram superiores a l revelando,
assim, inadequada variabilidade dos dados. Observa-se,

tambm, aumento da variabilidade dos valores de leitura


somente para o tempo de contagem de 1 s, com o acrscimo da
profundidade. Esta variabilidade se deve, provavelmente,
heterogeneidade das caractersticas fsicas do solo, como
textura e densidade, que influenciam diretamente nas leituras
obtidas pela sonda. Outros erros durante a realizao dos
testes, embora em pequena escala, poderiam ser apontados
como outras possveis causas. Mishima & Hibiki (1996)
salientam que a ocorrncia de diferenas de temperatura nos
pontos de leitura com a sonda, podem afetar os resultados das
determinaes.
Coeficientes de assimetria praticamente nulos e coeficientes de
curtose menores que 3, induzem aceitao da hiptese de
normalidade, ou seja, como afirmado por Wang & Willis (1965)
possvel ajustar-se a contagem de nutrons a uma distribuio
normal (distribuio observada); confirma-se, com isto, que as
leituras mdias para cada profundidade so timos indicadores
do valor mdio das leituras que, neste caso, podero ser usados
como valores representativos das profundidades do solo
estudado. De acordo com os valores dos coeficientes de curtose
obtidos, verifica-se que todos so inferiores a 3, o que significa
que h uma disfuno dos dados em termos de mdia, maior
que uma curva gaussiana (curva normal) ou seja, que a amostra
dos dados para todas as profundidades estudadas platicrtica
em relao normal (mais pontiaguda) constatando-se, assim,
menor variabilidade das leituras ao redor da mdia.
Os valores mdios das leituras obtidas com a sonda de
nutrons, para os diferentes tempos de contagem e
profundidades, so representados na Tabela 2.

Pelos dados apresentados na Tabela 2, verifica-se que, com


exceo da profundidade de 45 cm, na qual no houve diferena

significativa entre as mdias das leituras para os diferentes


tempos de contagem, nas outras duas profundidades (15 e 30
cm) o tempo de contagem influenciou significativamente. Na
profundidade de 15 cm embora no houvesse diferena
significativa entre as leituras obtidas a 1 e 4 s, a primeira foi
significativamente diferente daquelas obtidas a tempos maiores
de 4 s; j para a profundidade de 30 cm, verifica-se diferena
significativa entre as mdias obtidas a 1 s com os demais
tempos de contagem. Por outro lado, os resultados do testes
estatsticos mostraram que o uso de tempos de contagem
superiores a 16 s no influencia na magnitude da leitura e
teoricamente na determinao do contedo de gua do solo
contradizendo, assim, resultados obtidos em trabalhos similares,
nos quais pesquisadores aconselham leituras com sonda de
nutrons, usando tempos de contagem longo no sentido de se
obter valores de umidade mais prximos do real (Beltrame &
Taylor, 1980; Falleiros et al., 1994; Marciano, 1995).
Verificada a hiptese de normalidade dos dados atravs dos
testes de assimetria e curtose, estimou-se o nmero de leituras
necessrias para cada tempo de contagem, a nvel de
significncia de 5%, para uma variao de 5 a 30% em torno da
estimativa da mdia.
A Figura 1 apresenta o nmero de leituras necessrio para os
diferentes tempos de contagem, em suas respectivas
profundidades, a nvel de 5% de probabilidade, em funo do
erro percentual admitido em torno da mdia, calculado segundo
metodologia de Costa Neto (1990). Considerando-se, por
exemplo, uma variao de 5% a nvel de significncia de 5%, os
nmeros de leituras requeridos para a profundidade de 15 cm
seriam, aproximadamente, duas leituras para os tempos de
contagem 1, 4 e 16 s, e de uma leitura para tempos maiores de
16 s. Para este mesmo nvel de significncia e uma variao de
10%, o nmero requerido de leituras seria de uma para os
tempos de contagem 1, 4 e 16 s e permaneceria inalterado
(uma leitura) para os tempos de 32 a 256 s. Este exemplo
mostra que uma reduo de 5% na preciso da mdia, usandose os tempos de contagens 1, 4 e 16 s, proporcionaria uma
reduo de aproximadamente 50%, em relao necessidade
de leituras a serem realizadas com a sonda; j para os tempos
de contagem de 32 a 256 s, nenhuma alterao seria necessria
no nmero requerido de leituras. Para variaes prximas da
media maiores de 15%, o tempo de contagem praticamente no
afeta o nmero de leituras necessrias. Considerando-se
razovel uma variao de 5% em torno da mdia, a melhor
opo parece ser o uso de uma leitura aos 32 s, tempo
normalmente utilizado na prtica.

A anlise da Figura 1 permite, ainda, observar-se que o nmero


requerido de leituras para cada tempo de contagem diminui a
medida em que aumenta a profundidade, fato este associado
menor variabilidade das leituras com o aumento da
profundidade, conforme mostrado atravs das medidas de
variabilidade, j discutidas.

CONCLUSES
1. Para tempos de contagem maiores que 4 s, no existe
variabilidade entre as leituras obtidas para cada tempo de
contagem.

2. Existe grau de variabilidade dos dados de leituras dentro de


seus respectivos tempos de contagem com o aumento de
profundidade, evidenciando que a variabilidade espacial do solo
em questo um fator que no pode ser desprezado quando se
utiliza sonda de nutrons para determinar a umidade do solo.
3. Os tempos de contagem utilizados nas medies com a sonda
de nutrons tiveram importante influncia na magnitude da
densidade de nutrons (leituras).
4. Repeties das leituras em um mesmo ponto podem ser
dispensadas quando o tempo de contagem for igual ou superior
a 32 s.
5. Para se determinar o contedo de gua do solo, recomendase fazer uma leitura em cada profundidade, aos 30 s.

6.d. bernoulli
A Distribuio de Bernoulli a distribuio discreta de espao amostral {0, 1},
com probabilidades P(0) = 1 - p e P(1) = p. O nome da distribuio se refere ao
cientista suio Jakob Bernoulli.

Distribuies de probabilidade Discretas: Benoulli e


Binomial
Modelo ou Distribuio de Bernoulli

Quando executamos um experimento (ensaio) do tipo Bernoulli,


associado a este ensaio, temos
uma varivel aleatria com o seguinte comportamento:
Suponhamos a realizao de um experimento E, cujo resultado pode
ser um sucesso (se acontecer o
evento que nos interessa) ou um fracasso ( o evento no se realiza).
Seja p a probabilidade de sucesso e q a probabilidade de fracasso,
com p + q = 1.
Definimos a seguinte v.a. discreta: X : n de sucessos em uma nica
tentativa do experimento.
X assume os valores:
55555555555555555555555555555555555555555555555555
Nessas condies a v.a. X tem distribuio de Bernoulli, e sua funo
de probabilidade dada por:
6666666666666666666666666666666666666666666666
Esperana (mdia) e Varincia
Calcularemos a mdia e a varincia da varivel com distribuio de
Bernoulli.
7777777777777777777777777777777777777777777777777
Logo: E(X) = p e Var(X) = p p2 = p(1 p) = p.q
Ex. Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola
dessa urna. Seja X: n de bolas
verdes. Calcular E(X), Var(X) e determinar P(X).
Solu88888888888888888888888888888888888888888888888888
88888888
Exemplo agronmico

Influencia da disponibilidade de recursos oferecidos pela planta invasora Sida cordifolia L. (Malvaceae) sobre a estrutura da comunidade
local de artropodes associados
Resumo: A fauna de artrpodes associada a uma populao da planta invasora Sida cordifolia foi amostrada mensalmente, durante um
ano, em Campinas, SP. As 154 espcies encontradas esto organizadas de acordo com estgio de desenvolvimento coletado, guilda,
parte da planta atacada e frequncia de ocorrncia. Trinta e quatro espcies de fitfagos alimentam-se e/ou reproduzem-se a planta.
Verificou-se como estas espcies, seus parasitides e predadore respondem s variaes da quantidade de recursos, medida em
biomassa/planta e diversidade de recursos, registrando-se a presena ou ausncia de rgos reprodutivos. As guildas foram
encontradas em frequncias semelhantes em plantas vegetativas e maduras, porm, um indivduo maduro pode sustentar um nmero
maior de espcies. A riqueza de espcies tambm maior para o conjunto de plantas maduras. A biomassa total disponvel para
colonizao pelos artrpodes varia pouco durante o ano, mas no campo sempre existe uma fenofase predominante. A biomassa explica
uma pequena proporo da variao no nmero de fitfagos encontrado por indivduo, com exceo de um perodo, o outono, quando
esta relao positiva mais acentuada. Este perodo caracterizado pela maior disponibilidade de recursos. Embora variando no
tempo, medida que aumenta a biomassa h um aumento na riqueza e densidade de fitfagos e entomfagos que utilizam a planta.
Plantas maduras, alm de tenderem a ser maiores, apresentam tambm maior diversidade de recursos e portanto nichos a serem
ocupados. Anlise comparativa de plantas com mesma diversidade de recursos mas com biomassa diferente demonstra que o tamanho
tem um efeito relativamente pequeno sobre a densidade e riqueza de artrpodes. Por outro lado, a diversidade de recursos representada
pela presena ou estgio de desenvolvimento de alguns rgos da planta limitante para a ocorrncia de algumas espcies associadas
a S. cordifolia, principalmente brocadores de ramo e de trutos. As diferenas encontradas entre plantas maduras e vegetativas
desaparecem quando no consideramos as espcies associadas aos rgos reprodutivos. Portanto, a contribuio deste ltimo fator
parece ser mais relevante para a variao na estrutura da comunidade observada entre plantas em diferentes fenofases e ao longo do
ano. As espcies fitfagas oligfagas so consideradas como possveis agentes de controle biolgico, mas para outras regies pois so
atacadas por parasitides e/ou se alimentam de espcies de plantas cultivadas na regio