Você está na página 1de 15

Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Introduo inferncia
estatstica
Cristian Villegas
clobos@usp.br

Outubro de 2013

Apostila de Estatstica (Cristian Villegas) 1


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Introduo

Agora, vamos ver como reunir a Anlise Exploratria de Dados, Modelos


Probabilsticos e Amostragem, para podermos desenvolver um estudo
importantssimo dentro da estatstica, conhecido pelo nome de Inferncia
Estatstica, isto , como tirar concluses sobre parmetros da populao (por
exemplo, sobre mdias (), propores (p), varincias ( 2 )) com base no estudo
de somente uma parte da populao, ou seja, com base em uma amostra.

Apostila de Estatstica (Cristian Villegas) 2


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Populao
Definio 1. Uma populao, em estatstica, formada por todos os valores possveis
de uma caracterstica desejvel. Esses valores no precisam ser todos diferentes, nem
um nmero finito.
Exemplo 1. Exemplos de populaes

1. todos os valores possveis da produo de milho em quilogramas por hectare


(kg/ha);

2. todos os pesos ao nascer de coelhos da raa gigante, em gramas;

3. todos os valores de dimetros de Biomphalarias do Poo do Crrego Grande;

4. todos os valores de microncleos de roedores de uma regio poluda.

Apostila de Estatstica (Cristian Villegas) 3


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Amostra
Definio 2. Uma amostra, uma parte (subconjunto) da populao
Exemplo 2. Exemplos de amostras

1. os rendimentos de milho, em kg/ha, de uma amostra de 5 unidades experimentais


(canteiros);

2. os pesos ao nascer de uma ninhada de coelhos da raa gigante;

3. os dimetros de uma amostra de 30 Biomphalarias do Poo do Crrego Grande;

4. os valores de microncleos de uma amostra de 25 roedores.

Apostila de Estatstica (Cristian Villegas) 4


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Estatstica
Definio 3. Uma estatstica uma medida usada para descrever uma caracterstica
da amostra.
Exemplo 3. Exemplos de estatsticas so

1. X a mdia da amostra;

2. S o desvio padro da amostra e

3. P a proporo da amostra.

Apostila de Estatstica (Cristian Villegas) 5


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Parmetros
Definio 4. Um parmetro uma medida usada para descrever uma caracterstica
da populao.

Geralmente so representados por letras gregas, assim, por exemplo, representa


a mdia populacional; representa a proporo populacional e representa o
desvio padro populacional.

Apostila de Estatstica (Cristian Villegas) 6


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Estimativa
Definio 5. Quando uma estatstica assume um determinado valor, temos o que
denomina-se de estimativa. Temos os dados de uma particular amostra, calculamos o
valor da estatstica de interesse, este valor a nossa estimativa.
Exemplo 4. Alguns exemplos de estimtiva so

1. a estimativa da produo mdia por planta da cultivar Gala de x = 84


kg/planta.

2. a estimativa da proporo de peixes com comprimento total menor do que 50 mm


p = 46%.
Observao 1. Os dois problemas bsicos da inferncia estatstica so:

1. Estimao e

2. Testes de Hipteses.

Vamos, atravs de um exemplo, ilustrar estas duas situaes.

Apostila de Estatstica (Cristian Villegas) 7


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Exemplo de problema de estimao


Exemplo 5. Um pesquisador est interessado em avaliar a produo mdia por
planta, , da cultivar de ma denominada Gala, para as seguintes condies: plantas
com idade de aproximadamente 5 anos, em bom estado fitossanitrio, cultivadas com
alta tecnologia e para a regio I do zoneamento agroclimtico de Santa Catarina. A
populao formada por todas as plantas da cultivar Gala nas condies citadas.
Mais especificamente, a populao constituda por todos os valores de produo por
planta. Para essa finalidade, o pesquisador vai coletar uma amostra aleatria de, por
exemplo, 10 plantas, da referida cultivar nas condies descritas. Uma amostra de
valores de produes por planta, em kg, foi:

Plantas 1 2 3 4 5 6 7 8 9 10 x s
Produo 84 82 90 86 80 91 85 79 81 82 84 4,0552

Apostila de Estatstica (Cristian Villegas) 8


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Exemplo de problema de estimao (continuao)

Com os 10 valores de produo/planta podemos calcular uma estimativa da


produo mdia verdadeira por planta, x = 84 kg. Portanto, estamos usando a
mdia da amostra, X , como estimador da mdia verdadeira, . Essa estimativa
chamada de estimativa pontual, pois origina um nico valor. Esse um raciocnio
tipicamente indutivo, onde se parte do particular (amostra) para o geral
(populao).
Observao 2. Um fato importante que se observa quando trabalhamos com
amostras, que sempre vamos ter que a mdia verdadeira, igual a mdia na
amostra X mais um erro de amostragem. A representao disso dada por:

= X + erro amostral,
em que o termo erro amostral a diferena entre a estatstica (X) e o parmetro ().

Apostila de Estatstica (Cristian Villegas) 9


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Preciso e confiana

Apesar do nome erro, isto no quer dizer que a amostragem foi feita de forma
errada e, que, portanto, deve-se coletar uma nova amostra. Esse valor pode ser
negativo ou positivo, pequeno, nulo ou grande. Em todas as pesquisas vamos estar
envolvidos com o erro amostral. Dizemos que uma estimativa precisa, se tivermos
alto grau de confiana de que o erro amostral associado a estimativa em questo,
pequeno. A preciso e a confiana so dois conceitos chaves nesse estudo. A
preciso pode ser entendida como a diferena mxima entre a estimativa e o
parmetro que o pesquisador deseja considerar no seu estudo. Voltaremos a tratar
deste assunto posteriormente.

Apostila de Estatstica (Cristian Villegas) 10


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Ideia de intervalo de confiana

Uma outra forma de estimao atravs da construo de intervalos de confiana.


Nesse caso, temos uma estimativa intervalar, isto , temos um intervalo, dentro do
qual esperamos que o valor populacional se encontre. Por exemplo, para os dados
de produo/planta da cultivar Gala ao invs de dizer que a estimativa de 84
kg/planta, podemos dizer que a mdia est no intervalo de 81, 10 a 86, 90.
Observao 3. Essa forma de estimao muito mais informativa que a estimativa
pontual. O pesquisador pode verificar se esse intervalo curto (preciso, informativo)
ou se muito amplo (pouco informativo).

Apostila de Estatstica (Cristian Villegas) 11


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Ideia sobre teste de hipteses

O segundo problema o de teste de hipteses sobre os parmetros. Por exemplo,


um pesquisador deseja saber se a produo mdia/planta da cultivar Gala a
mesma da produo mdia/planta da cultivar Golden. Para isso, foi obtida uma
outra amostra aleatria de 10 plantas da cultivar Golden sob as mesmas condies
descritas para a cultivar Gala. Os dados das duas amostras aleatrias so
apresentadas na tabela a seguir.

Tabela 1: Produo por planta, em Kg, de mas das cultivares Gala e Golden

Variedades 1 2 3 4 5 6 7 8 9 10 x s
Gala 84 82 90 86 80 91 85 79 81 82 84,0 4,06
Golden 95 102 85 93 104 89 98 99 107 106 97,8 7,32

Apostila de Estatstica (Cristian Villegas) 12


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Ideia sobre teste de hipteses

As estimativas da produo mdia das duas cultivares, calculadas com os dados


das duas amostras foram 84 Kg/planta e 97,8 kg/planta para as cultivares Gala e
Golden, respectivamente. Portanto, a diferena verificada entre as duas cultivares,
com essas duas amostras, foi de 13,8 kg/planta a favor da cultivar Golden.
Observando-se os dados individualmente, verificamos que para as plantas 3 e 6, as
produes na cultivar Gala foram superiores a da Golden. Portanto, podemos
pensar que perfeitamente possvel obtermos um par de amostras, dentre todas as
amostras possveis de serem sorteadas, no qual a produo mdia da cultivar Gala
superior a da Golden. Isso devido simplesmente a amostragem, ou seja, variaes
devido a amostragem. Assim, o problema que se apresenta, o de decidir o que
uma diferena real, isto , devido cultivar, ou uma diferena casual, isto , devido
a variao casual na amostra.

Apostila de Estatstica (Cristian Villegas) 13


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Ideia sobre teste de hipteses

Logicamente, o pesquisador pretende generalizar os resultados obtidos na anlise


estatstica, isto , ele deseja saber se h diferena significativa entre as mdias
verdadeiras Gala e Golden (desconhecidas pelo pesquisador). Como ele est
trabalhando com duas amostras aleatrias, dentre um grande nmero de possveis
amostras, ele no pode fazer afirmaes com 100% de certeza, mas ele pode
perfeitamente fazer uma afirmao probabilstica, indicando a probabilidade de
erro ao fazer uma afirmao sobre uma hiptese em teste. Para isso, utilizaremos
as distribuies de probabilidades.

Apostila de Estatstica (Cristian Villegas) 14


Escola Superior de Agricultura "Luiz de Queiroz", Departamento de Cincias Exatas

Amostra aleatria
Definio 6. Uma amostra aleatria simples de tamanho n, de uma varivel
aleatria X , aquela cujas n observaes X1 , X2 , ..., Xn so independentes e
identicamente distribudas.

Distribuies Amostrais (Tarefa)


Observao 4. Ler seo 6.3 (distribuies amostrais) do livro Estatstica para as
cincias agrrias e biolgicas com noes de experimentao do Dalton F. Andrade e
Paulo J. Ogliari.

Apostila de Estatstica (Cristian Villegas) 15