Você está na página 1de 23

A) Mediana (Md)

Num conjunto de dados ordenados, a mediana é o valor


que vem seguido e precedido pelo mesmo número de
observações.
Posição da mediana = (n+1)/2

Exemplos:
1) Amostra (3,3,5,6,7,8,9)
Posição da mediana = 7+1 = 40 dado , Md = 6
2

2) (1,2,3,4,6,6,7,9)
Posição da mediana = 8+1 = 4,5o dado = 4o dado + 5o dado = 4 + 6 = 5
2 2 2

*A mediana pode ser um valor que não ocorre na amostra.

3) P ara os dados do Quadro 2


Posição da md = 50+1 = 25,5o dado = 25o dado + 26o dado
= 29,5 + 29,5 = 29,5 Kg
2 2
2

Mediana em dados agrupados

É necessário calcular antes a distribuição de freqüência


acumulada para baixo.

Ex. Distribuição de freqüência acumulada para baixo dos


pesos ao nascer, em Kg, de 50 bezerros Guzerá
Pesos (em Kg) Fc 
Menores que 23,0 -
Menores que 25,0 2
Menores que 27,0 7
Menores que 29,0 19
Menores que 31,0 35
Menores que 33,0 45
Menores que 35,0 49
Menores que 37,0 50

Para dados agrupados a posição da mediana é = n


2
Ex. 50/2 = 25
A mediana será o 25o dado Classe mediana [ 29,0; 31,0 )

A mediana é obtida pela fórmula: Md = Li + x , onde:


Li é o limite inferior da classe mediana;
x é o resultado de uma interpolação linear

Ex. Li = 29,0
Fc 

Menores que 29 19
Menores que 31 35

2 Kg 16
x 6
x = 0,75

Md = 29 + 0,75 = 29,75 Kg

B) Moda (Mo)
A moda de um conjunto de dados é o valor mais freqüente.

Ex. amostra (2,3,4,4,4,5,6) Mo = 4 conjunto unimodal


amostra (3,4,4,5,6,7,7,9) Mo = 4 e 7 conjunto bimodal

amostra (2,3,4,5,6) Mo = não existe.

Moda em dados agrupados

A moda se localiza na classe de maior freqüência.

A1
Mo = Li + c
A1 + A2
onde:
Mo = moda;
Li = é o limite inferior da classe modal;
A1 = é a diferença entre a freqüência da classe modal e a
freqüência da classe imediatamente anterior
A2 = é a diferença entre a freqüência da classe modal e a
freqüência da classe imediatamente posterior
c = é a amplitude da classe modal.
Ex. Para a distribuição de freqüência dos pesos ao nascer , em Kg, de 50
bezerros Guzerá, tem-se:

Freqüência
Classe modal [ 29,0; 31,0 ) 16
Classe imediatamente anterior [ 27,0; 29,0 ) 12
Classe imediatamente posterior [ 31,0; 33,0 ) 10

A1 = 16 – 12 = 4
A2 = 16 – 10 = 6
C=2
4
Mo = 29 2
4+6 = 29,8 Kg

Para os dados originais (Quadro 2)


Mo = 30,2 Kg
A diferença entre os valores se deve ao erro de agrupamento.

2.3 MEDIDAS DE DISPERSÃO

As medidas de posição não informam sobre a


variabilidade dos dados e são insuficientes para
sintetizar as informações amostrais. Para
exemplificar este fato, tem-se as seguintes
amostras com mesma média:
Considere as amostras referentes aos pesos, em Kg,
de novilhos representando três raças bovinas

Nelore 185 185 185 MédiaN = 185 Kg


Gir 182 184 189 MédiaG = 185 Kg
Hereford 176 180 199 MédiaH = 185 Kg

Baseando a análise apenas pela média as três raças são consideradas como
tendo o mesmo peso. As medidas de posição são de tendência central e
nada informam sobre a variabilidade dos dados. Na raça Nelore, todos os
animais da amostra apresentaram pesos iguais a média. Na raça Gir,
percebe-se uma
ligeira dispersão nos dados que é mais expressiva na raça Hereford.

Variabilidade = é a dispersão dos dados de um conjunto ao redor de um


valor central.

Para as amostras das três raças, os desvios em relação a média são:

di = xi - x

Nelore 0 0 0
Gir -3 -1 +4
Hereford -9 -5 +14

Os desvios indicam a existência da variabilidade, mas não podem ser


utilizados como medida pois somam zero. É importante salientar que na
agropecuária a variabilidade dos dados, na maioria dos casos, é muito mais
importante que a média dos mesmos.

As principais medidas de dispersão são:

A) Amplitude total (A)

É a diferença entre o maior e o menor dado de uma amostra. Para dados


agrupados, é a diferença entre o ponto médio da 1a e da última classe.
Ex. Para as amostras das três raças:
Nelore: A = 185 – 185 = 0 Kg
Gir: A = 189 – 182 = 7 Kg
Hereford: A = 199 – 176 = 23 Kg

Para expressar variabilidade de amostras não é recomendável usar


amplitude, pois ela se baseia em apenas dois dados da amostra.

B) Variância e desvio-padrão

Variância

Numa população, a variância é definida pela razão entre a soma de


quadrados dos desvios tomados em relação a média e o n o total de
obsevações.
População  X1, X2, ...., Xn
N

X i

Média  µ = M= i=1
N

N = Tamanho da população

desvio em relação a média  Xi - µ

desvio ao quadrado  (Xi - µ)2

soma de quadrados dos desvios  SQD


N
SQD =  ( X - µ)2
i =1
i

SQD
 ( X −m) i
2

var (x) =o 2= =
N N

Na prática, trabalha-se com amostras

Amostra  X1, X2, ...., Xn

X i

Média  x= i=1
n

n = Tamanho da população

desvio em relação a média  Xi - X

soma de quadrados dos desvios  SQD


n
SQD =  ( X - X)2
i =1
i
n

SQD  ( X −x )
i
2

var(x) = s2= = i =1

n −1 n −1

(^) estimativa
(n-1)  número de graus de liberdade

Para as amostras das três raças bovinas:

Nelore: s2N = SQD = 02 + 02 +02 = 0 Kg2


n-1 3-1

Gir: s2G = SQD = (-3)2 + (-1)2 +(4)2 = 13 Kg2


n-1 3-1

Hereford: s2H = SQD = (-9)2 + (-5)2 +(+14)2 = 151 Kg2


n-1 3-1

As vacas Hereford tem maior variância que as raças Gir e Nelore,


indicando que seus dados dispersam mais em torno da média. A variância é
expressa na unidade dos dados ao quadrado.
n
Desenvolvendo a fórmula SQD =  ( Xi - X)2
i =1

obtém-se
2
 n 
  xi 
n
 
SQD =  xi − i =1
2

i =1 n

Sendo s2 = SQD
n-1

Então s2:
2
 n 
  xi 
n n
 
 ( xi − x )  xi − i =1
2 2

i =1 n
A) s2 = ou B) s2 = i =1
n −1 n −1

A fórmula (B) é chamada fórmula prática (+ rápida)

Desvio-padrão
É a raiz quadrada da variância
População = +  2
Amostra s = + s 2

Ex.: O desvio-padrão nas três raças:


Nelore : sN = 02 = 0 Kg
Gir: sG = 132 = 3,6 Kg
Hereford: sH = 1512 = 12,3 Kg

Cálculo para dados agrupados em distribuição de frequência:

  n  
2

n   fi x  
1  f  i =1 i  
i i
2
s2 = x −
n − 1  i =1 n  s = s2
 
 

onde:

xi = ponto médio da classe i;


fi = frequência da classe i;

Ex.: Seja a distribuição de freqüência dos pesos ao nascer (em Kg) de 50


bezerros Guzerá:

Fi xi fixi fixi2
Classes
[ 23,0; 25,0 ) 2 24 2.24 = 48 2.(24)2 = 1152
[ 25,0; 27,0 ) 5 26 5.26 = 130 5.(26) 2 = 3380
[ 27,0; 29,0 ) 12 28 12.28 = 336 12.(28)2 = 9408
[ 29,0; 31,0 ) 16 30 16.30 = 480 16.(30)2 =14400
[ 31,0; 33,0 ) 10 32 10.32 = 320 10(32) 2 =10240
[ 33,0; 35,0 ) 4 34 4.34 = 136 4(34) 2 = 4624
[ 35,0; 37,0 ) 1 36 1.36 = 36 1(36) 2 = 1296
Total 50 Ʃ fixi =1486 Ʃ fixi2 = 44500
Portanto,
1
s2 = [44500 – (1486)2/50)] = 6,85
50 − 1

Kg2 = variância
2
s = 2,62 Kg = desvio-
padrão

C) Coeficiente de variação (C.V.)

É uma medida de dispersão relativa, que emprega o desvio


padrão em termos da média de forma percentual.
CV = S/µ

Onde:
CV = Coeficiente de variação;
s = desvio-padrão;

Basicamente, o C.V. é utilizado em duas situações:

A) O C.V. tem grande aplicação na experimentação, em


geral, servindo para avaliar a precisão dos ensaios.
Quanto menor for o valor do C.V., mais preciso será o
experimento.
Ex. Em um trabalho de avaliação de quatro rações para
cães; o experimento teve um C.V. de 10%. Isto é, 10% das
variações medidas no experimento, não foram ocasionadas
pelo efeito das rações, e sim por outros fatores. Portanto, a
precisão do experimento foi de 90%.

B) É usado também para comparar a variabilidade entre


amostras, de unidades e médias diferentes. Neste caso,
quanto maior o C.V. maior a variabilidade relativa.
Agora, se as amostras tiverem mesma unidade e mesma
média, a variabilidade é avaliada pelo desvio-padrão.
Ex. Dados referentes à temperatura e preciptação num determinado
período.
Estatísticas amostrais Temperatura Preciptação
o
Média 22 C 800 mm
o
S 5 C 100 mm
CV 22,7% 12,5%
Verifica-se que a temperatura apresentou uma maior variabilidade relativa
que a preciptação, pois o CV foi maior.

D) Erro padrão da média. ( S )


É uma medida de dispersão que dá idéia da precisão com
que a média populacional foi estimada.
É obtida pela expressão : S = s x
n
Sendo:
s = desvio – padrão da amostra;
n = tamanho da amostra.

Ex. L

avoura de milho amostra n=30 plantas


(mediu-se a variável altura)
média = 208 cm ; s = 12 cm
Qual é a verdadeira média de todas as plantas da lavoura?
Uma outra amostra n=30 daria a mesma média? Não, pois
certamente existe uma variação da média devido ao acaso.
Calculando o erro padrão da média:
s
S =
x = 12 = 2,2cm
n 30

Este resultado indica que a média populacional foi


estimada com um erro de 2,2 cm.
 + s(  ) = 208  2 ,2cm
205,8 cm 210,2 cm

Espera-se que o verdadeiro valor da média populacional esteja neste


intervalo.

1. PROBABILIDADE

3.1 NOÇÕES DE PROBABILIDADE (CONCEITOS


BÁSICOS)

A) Importância
Na experimentação agropecuária um dos principais
objetivos é a retirada de conclusões a partir de
experimentos que envolvem incertezas. Na obtenção das
conclusões é necessário o uso da teoria da probabilidade.

B) Experimento estatístico
Qualquer fenômeno ou ação que pode ser repetido cujo
resultado é casual ou aleatório.

C) Espaço amostral
Conjunto de todos os possíveis resultados de um
experimento estatístico.
Ex. O lançamento de um dado é um experimento. Neste
caso, o espaço amostral é:
S = {1,2,3,4,5,6}

D) Evento
Subconjunto do espaço amostral que representa um
resultado definido.
No lançamento de um dado, pode-interessar, por exemplo,
somente a ocorrência de um número ímpar. O subconjunto
A ={1,3,5} do espaço amostral S representa o evento A,
definido pelo resultado OCORRÊNCIA DE FACE
ÍMPAR.

E)Ponto amostral
É apenas um elemento do espaço amostral S. Um evento
pode Ter um ou mais pontos amostrais.

F) Probabilidade
Num espaço amostral S, a probabilidade de ocorrer um
evento A, representado por P(A), é dada pela medida de A
em S atendendo às seguintes condições:
1- A medida de S vale 1.
2- A medida de A é não negativa – P(A)  0
Das duas condições, obtém-se:
0  P( A)  1
No lançamento de um dado imparcial, a probabilidade de
ocorrer face ímpar é:
P(A) = 1/2 = 0,5 ou 50%
1.2 VARIÁVEIS ALEATÓRIAS

As variáveis aleatórias podem assumir qualquer


valor de um determinado conjunto de dados,
denominado de domínio da variável aleatória.

Ex. Sabe-se que um rebanho bovino apresenta 75%


dos animais infectados pelo vírus da febre aftosa.
Logo, um animal tomado neste rebanho pode ser:
Sadio: S ➔ P (S) = 25% ou 0,25 ou 1/4
Doente : D ➔ P(D) = 75% ou 0,75 ou 3/4

Para uma amostra de n=2 animais extraída do


rebanho, o espaço amostral é:
S = {SS, DS, SD, DD}

Quais são as probabilidades dos pontos amostrais?


P(SS) = 1/4 x 1/4 = 1/16
P(SD) = 1/4 x 3/4 = 3/16
P(DS) = 3/4 x 1/4= 3/16
P (DD) = 3/4 x 3/4 = 9/16

Pode-se construir uma tabela, onde:


x = número de animais sadios que podem ocorrer
numa amostra de n=2 bovinos
F(x) = a probabilidade de ocorrer um valor X

X 0 1 2
F(x) 9/16 6/16 1/16

Nesta tabela, a variável x assume os valores (0,1 e2),


sendo estes valores numéricos que descrevem os
resultados da experiência, logo x corresponde a uma
variável aleatória.
“Uma função que transforma todos os resultados de
um espaço amostral em números, chama-se variável
aleatória”
As variáveis aleatórias podem ser classificadas em:
variáveis aleatórias discretas e variáveis
aleatórias contínuas.

Varíavel qualitativa : Não são mensuradas em


números, são atributos. Ex. Profissão, cor, gênero,
sexo, etc...

1.2.1 Variável aleatória discreta

Quando assume apenas valores inteiros dentro de


seu campo de variação. Associada com o ato de
contar.
Ex. no de bovinos sadios numa amostra de n=4
animais;
no de frutos maduros numa árvore;
no de ervas daninhas num canteiro;
no de meninos numa família de três filhos;
etc...
1.2.2 Variáveis aleatórias contínuas

Quando assume qualquer valor real (infinitos


valores) dentro do seu campo de variação. Associada
com o ato de medir.
Ex. altura das plantas de milho de uma lavoura;
consumo de ração de um animal;
área foliar de uma planta de café;
produção de leite de uma vaca;
etc...

1.3 DISTRIBUIÇÕES DE PROBABILIDADES


DISCRETAS E CONTÍNUAS

1.3.1 Conceitos

1.3.1.1 Distribuições de probabilidades discretas

Se uma variável X pode assumir um conjunto de


valores X1, X2....., Xn com probabilidades P1, P2....,
PN, sendo  P = 1, diz-se que está definida uma
1

distribuição de probabilidade de X (Obs.: binomial,


poisson e uniforme)
1.3.1.2 Distribuições de probabilidades
contínuas

Neste caso, X pode assumir um conjunto contínuo


de valores. O polígono de frequência amostral torna-
se no limite de uma população de uma curva
contínua.

A área sob a curva limitada pelo eixo X é igual a 1. E a área entre a e b


fornece a probabilidade de X estar entre a e b. (Obs.: distribuição normal)

1.3.2
1.3.3
1.3.4
1.3.5
1.3.6Distribuições de probabilidades discretas e
contínuas

A) Distribuição uniforme

É a mais simples das distribuições. Todos os valores da


variável aleatória são assumidos com a mesma
probabilidade.
Exemplo: Lançamento de um dado imparcial, onde X
representa a face voltada para cima. Assim, X assume os
valores 1,2,3,4,5 e 6 com a mesma probabilidade 1/6. A
distribuição uniforme, neste caso, é definido por:
f(x) = 1/6; x = 1,2,3,4,5 e 6
Generalizando, obtém-se a função de probabilidade
F(x) = 1/K , x = x1,x2, xK.
F(x) depende de K.

B) Distribuição Binomial – estudar pelo caderno

Distribuição Normal

A distribuição de frequência na maioria dos


dados de observação (variáveis aleatórias
contínuas) mostra uma pronunciada
concentração próximos de um valor central. Ao
se afastar para os extremos deste valor central, a
concentração diminui. Esta característica
chama-se TENDÊNCIA CENTRAL DOS
DADOS.

Exemplo: Distribuição dos pesos de 50 bezerros


Guzerá. Aumentando o tamanho da amostra
(n=500, n=800) e a precisão das medidas, a
representação gráfica da distribuição tenderá a
ser uma curva simétrica de forma campanular.
Esta curva tem expressão matemática definida
por:
x− 2
1 (

)

e−1/ 2
f(x) =  2

onde:
x= qualquer valor real;

 = desvio-padrão da distribuição;
µ = média da distribuição;
 = 3,14159....

e = 2,718....

Se uma variável aleatória apresenta esta


distribuição de probabilidade ela tem
DISTRIBUIÇÃO NORMAL.

A distribuição normal é a mais importante da


Estatística, pois a maioria dos dados tem esta
distribuição, além disso, a maioria dos métodos
estatísticos se baseiam nesta distribuição.
Propriedades da distribuição normal:

i) É simétrica em relação a x = µ

ii) O ponto máximo de f(x) ocorre para x = µ. A média (µ), a mediana


(Md) e a Moda (Mo) são iguais.

iii) Para definir a equação da distribuição basta conhecer a µ e o  dos


dados

x− 2
1 (

)

e−1/ 2
f(x) =  2
Uma vez encontrado µ e  , qualquer valor de f(x) pode ser calculado.
iv) A área total sob a curva e o eixo x vale 1.

i) A área sob a curva normal entre µ -  e µ +  é de 68,27%, entre µ -


2  e µ +2  é de 95,45% e entre µ + 3  e µ - 3  é de 99,74%.
Cálculo da probabilidade na Distribuição Normal

A área compreendida entre duas ordenadas levantadas sobre dois pontos a e


b do eixo x da curva normal expressa a probabilidade da variável x assumir
valores no intervalo (a,b)

Devido a grande aplicação prática da distribuição normal na estatística,


procurou-se fazer uma tabela que fornecesse valores de integração
conforme a que está indicada para a área S. Este tabelamento encontrou
dificuldades devido à infinidade de valores que µ e  podem assumir.
Seria necessário uma tabela para cada (µ e  ).

µ - média da distribuição
 - desvio-padrão da distribuição.
Exemplo:

Num rebanho bovino, os pesos são


valores de uma variável x que tem
distribuição normal com média µ =
200Kg e variância  100 Kg2 . Qual a 2=

probabilidade de um animal deste


rebanho ter peso entre 190 e 195
K g?

x−
Estudos mais profundos mostraram que a variável Z = , chamada

variável reduzida ou padronizada, transforma todas as distribuições
normais possíveis numa única distribuição normal reduzida ou padronizada
que tem média µ = 0,0 e variância 
2=
1,0.

Para o rebanho bovino:


x−
Padronizando os valores de x Z=

Z1 = (190 – 200 / 10 ) = -1,0


Z2 = (195 – 200/ 10) = -0,5

P (190 < x < 195) = P (Z1 < Z < Z2) Entre 0,0 e –1,0 Área =
0,3413
= P (-1 < Z < 0,5) Entre 0,0 e –0,5 Área =
0,1915

“A tabela informa a área entre 0,0 e o valor de Z.” A tabela vale para a
metade da curva, mas a curva é simétrica. Para consultá-la, ignora-se o
sinal.

P (190 < x < 195) = P (Z1 < Z < Z2)


= P (-1< Z < -0,5)
= P (-1< Z < 0,0) – P (-1< Z < 0,0)
= 0,3413 – 0,1915
= 0,1498 = 14,98 %

Exemplos:

A) Qual a probabilidade um bovino pesar menos de 190 Kg?


B) Qual a probabilidade de um bovino pesar mais de 195Kg?

Caso um abatedouro de suínos se interesse por animais


com peso mínimo de 90 Kg, qual a porcentagem de
indivíduos que estará apta para o abate quando a média do
lote for 95 Kg e o desvio-padrão 15 Kg?

Você também pode gostar