Você está na página 1de 70

ESTATSTICA

Regiane Slongo Fagundes




Cascavel - 2011

FACULDADE ASSIS GURGACZ FACULDADE ASSIS GURGACZ FACULDADE ASSIS GURGACZ FACULDADE ASSIS GURGACZ FAG FAG FAG FAG
Avenida das Torres, 500 Fone: (45) 321-3900 Fax: (045) 321-3913
CEP: 85802-640 Cascavel Paran
Email: fag@fag.edu.br

PARTE I
Introduo Estatstica

A estatstica um processo que permite a anlise e a interpretao de dados
provenientes de uma ou mais amostras, com o objetivo de inferir caractersticas de
populaes. Sendo aplicvel a qualquer ramo do conhecimento onde se manipulam
dados experimentais.

1. O Crescimento e o Desenvolvimento da Estatstica Moderna
Historicamente, o crescimento e o desenvolvimento da estatstica moderna podem
ser relacionados a trs fenmenos isolados a necessidade do governo de coletar dados
sobre os cidades, o desenvolvimento da teoria da probabilidade e o advento da
informtica.
Dados tm sido coletados atravs de toda a histria. Nas civilizaes Egpcias,
Grega e Romana, dados primrios eram coletados com propsito de taxaes e
finalidades militares. Na idade Mdia, igrejas registram dados e informaes sobre
nascimentos, mortes e casamentos. Nos Estados Unidos, a Constituio de 1790
determinava a realizao de censo a cada 10 anos. Atualmente, informaes numricas
so necessrias para cidades e organizaes de qualquer natureza, e de qualquer parte
do globo.

2. Estatstica Descritiva versus Inferncia Estatstica
A estatstica pode ser dividida em duas partes:

2.1 - Estatstica Descritiva
Ocupa-se da organizao, sumarizao e descrio de um conjunto de dados.
Esta anlise serve como um primeiro guia ao pesquisador, fornecendo informaes
sobre a qualidade de seus dados e indicando algumas tendncias (se existirem) e, em
geral, no tem um fim em si prpria, exceto o caso do censo.

2.2 - Estatstica Inferencial
uma etapa da estatstica que cuida da coleta, reduo, anlise, modelagem e
interpretao dos dados.
O objetivo da estatstica inferencial (ou indutiva) o de tirar concluses com
base nos resultados observados em amostras extradas dessas populaes.
O prprio termo indutiva decorre da existncia de um processo de induo,
isto , um processo de raciocnio e que partindo-se do conhecimento de uma parte,
procura-se tirar concluses sobre a realidade no todo.

3. Pesquisa Estatstica
Pesquisa um conjunto de atividades orientadas para a busca de um
determinado conhecimento. Para merecer qualificativo de cientfica a pesquisa deve ser
feita de modo sistematizada, utilizando para isto mtodos prprios e tcnicas especfica.
A pesquisa cientfica se distingue de outras modalidades quaisquer de pesquisa pelo
mtodo, pela tcnica, por estar voltada para a realidade emprica e pela forma de
comunicar o conhecimento.


3.1 Finalidade da Pesquisa
Descobrir respostas para questes, mediante a aplicaes de mtodos cientficos;
Tentar conhecer e explicar fenmenos que ocorrem no mundo existente.
3.2 Tipos de Pesquisas
3.2.1 Pesquisa de Reconhecimento ou Survery
estudo de opinio, mercado e diagnstico

3.2.2 Pesquisa Bibliogrfica
Procura material j elaborado

3.2.3 Pesquisa documental
Coleta de informaes a partir de documentos quantitativos tais como
arquivos pblicos e privados, imprensa, revistas, etc.

3.2.4 Pesquisa Experimental
Experincias realizadas em laboratrios, fbricas, parcelas de terras.
utilizado o Delineamento de Experimento e Controle de Qualidade.



3.3 Etapas de uma Pesquisa Estatstica

Cada uma essas passagens merece um estudo aprofundado e tem caractersticas
prprias.

3.3.1 - Populao
o conjunto de interesse final para a pesquisa. Em geral o conjunto do qual a
amostra retirada.

3.3.2 - Amostra
Chamaremos de amostra qualquer subconjunto da populao de interesse, quer
os dados tenham sido coletados de um estudo observacional, quer sejam provenientes de
um experimento realizado sob certas condies de controle.

3.3.3 - Tratamento dos Dados
Conjunto de tcnicas usadas para descrever os dados observados.

3.3.4 - Inferncia
Conjunto de mtodos que permitem inferir o comportamento de uma populao
a partir do conhecimento da amostra

3.3.5 - Clculo de Probabilidade
Teoria matemtica que deduz a partir de um modelo, as propriedades de um
fenmeno aleatrio.

Determinar
os Objetivos:
Para que?
populao
amostra
Tratamento
dos dados
inferncia


4 Terminologia Estatstica

Populao Amostra Unidade experimental

4.1 - Unidade experimental ou de Anlise
o objeto ou indivduo que ser estudado na populao, e sobre os quais obtm-
se os dados.

4.2 - Dados
o valor ou resposta que toma a varivel em cada unidade experimental.
o resultado de uma observao.
a matria prima da estatstica.

4.3 - Varivel
uma caracterstica observvel, susceptvel de adotar distintos valores ou ser
expresso em vrias categorias.
Variveis:
Idades;
Sexo;
Srie;
Horas de estudo;
Horas de treino; etc...

4.4 Informao
o resultado dos dados processados (ou organizados) de acordo com certos
objetivos.

4.5 - Estatstica
qualquer funo dos dados empricos* que usada com fins descritivos ou
analticos.
uma medida resumo dos dados.
*Dados Empricos: baseado apenas na experincia, e no no estudo.

4.6 - Parmetros
So as caractersticas mais importantes da populao.
Comumente so desconhecidas.


5 Classificao Das Variveis




Qualitativas
Quantitativa
s
Nominais Ordinais Discretas Contnua


5.1 - Variveis qualitativas
So caractersticas cujos dados no so numricos, isto , so apresentados como
uma qualidade ou atributo. Ex: Sexo, estado civil, nvel de escolaridade.

5.1.1 - Nominal
No existe nenhuma ordenao ou hierarquia nos possveis resultados. Ex: sexo,
estado civil, regio de procedncia.

5.1.2 - Ordinal
Existe uma certa ordem ou hierarquia nos possveis resultados. Ex: Nvel de
escolaridade, nvel de satisfao.

5.2 - Variveis Quantitativas
uma caracterstica em estudo cujos resultados se referem a quantidades, isto ,
so medidas numa escala numrica. Ex: idade, salrio, nmero de filhos, etc.

5.2.1 - Discretas
Cujos resultados se referem a dados que podem assumir valores inteiros (IN).
Ex: idade, nmero de pessoas, nmero de filhos por famlia, etc.

5.2.2 - Contnuas
So dados que podem assumir qualquer valor de um conjunto de nmeros reais
(IR). Ex: peso, altura, consumo mensal de energia, etc.

























MODELO DE UM QUESTIONRIO
Esperamos beneficiar voc atravs de um estudo que estamos realizando para
conhecer suas preferncias na escolha de supermercado, gostaramos que nos auxiliasse
respondendo as seguintes perguntas:

1. Sexo 1( ) Masculino 2 ( ) Feminino

2. Idade ___________ anos

3. Estado Civil:
1( ) Solteiro (a) 4 ( ) Divorciado
2 ( ) Casado (a) sem filhos 5 ( ) Outros ___________________
3 ( ) Casado (a) com filhos

4. Nvel Escolar
1 ( ) Sem instruo 5 ( ) Ensino Mdio completo
2( ) Ensino Fundamental Incompleto 6 ( ) Ensino Superior Incompleto
3 ( ) Ensino Fundamental completo 7 ( ) Ensino Superior completo
4 ( ) Ensino Mdio Incompleto 8 ( ) Outros _____________

5. Nmero de Pessoas que Moram com voc _________

6. Renda Mensal da Famlia ______________

7. Com que freqncia voc visita um supermercado
1 ( ) Diariamente 4 ( ) Mensalmente
2 ( ) Semanalmente 5 ( ) Outros ______
3 ( ) Quinzenalmente

8. Quantos mercados diferentes voc visita em suas compras? _____________

9. Quanto da sua renda voc gasta em suas comprar mensais de supermercado?
1 ( ) menos de 25% da renda 3 ( ) acima de 50% at 75% da renda
2 ( ) de 25% at 50% da renda 4( ) acima de 75% da renda

10. Ao escolher um supermercado voc observa:
10.1 ( ) A tradio da empresa
10.2 ( ) Propaganda
10.3 ( ) Higiene
10.4 ( ) Atendimento
10.5 ( ) Diversificao de produtos
10.6 ( ) Preos
10.7 ( ) Tamanho da Loja
10.8 ( ) Prazos
10.9 ( ) Distncia
10.10 ( ) Promoes

1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
1 ( ) sim 2 ( ) no
11. O atendimento no supermercado em que voc compra freqentemente :
1 ( ) Insatisfatrio 3 ( ) Muito Satisfatrio
2 ( ) Mdio Satisfatrio 4 ( ) Satisfatrio
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 7
PARTE II
Anlise Exploratria Dos Dados ou
Estatstica Descritiva

1. Introduo

A Estatstica Descritiva a fase na qual os dados de um experimento ou
pesquisa, so organizados, resumidos, descritos, apresentados e interpretados. Esta fase
de grande importncia para uma pesquisa, pois nela, podemos perceber as tendncias
do nosso conjunto de dados.
Aps a coleta dos dados experimentais, devemos organiz-los e apresent-los; esta
apresentao, pode ser feita atravs de tabelas e grficos.


2. Tabelas de distribuio de freqncias

As apresentaes atravs de tabelas devero ser realizadas em uma pesquisa,
mediante alguma conveno ou norma, dependendo de qual instituio, congresso ou
rgo, esta tabela ser apresentada. Mas alguns princpios bsicos podem ser utilizados,
segundo as normas do IBGE (Instituto Brasileiro de Geografia e Estatstica):
- Ttulo: aonde dada uma noo inicial ao leitor sobre o que a tabela;
- Cabealho: para que sejam identificados os contedos referentes a cada coluna da
tabela. O cabealho deve conter o suficiente para responder as questes: o que est
sendo representado? onde ocorreu ? Quando ocorreu?
- Coluna Indicadora: que especifica as diferentes categorias da varivel;
- Corpo: representado por colunas e subcolunas dos quais so registrados os dados
numricos e informaes.
- Rodap ou p: onde identificada a fonte original dos dados, ou alguma nota
referente a tabela.



Exemplo:
Tabela 01: Casos registrados de intoxicao humana segundo a causa
determinante. Brasil, 1993
Causa Freqncia
Acidente 29.601
Abuso 2.604
Suicdio 7.965
Profissional 3.735
Outras 1.959
Ignorada 1.103
Fonte: Mensrio Estatstico 259/260

Observao: No h linhas laterais, ponto final em cada linha e linhas horizontais no
corpo da tabela separando as linhas.


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 8
2.1 - Tabela de distribuio de freqncias
Uma tabela de distribuio de freqncias composta, alm dos itens citados acima:

- Freqncia absoluta ( f
i
): o nmero de vezes em que cada elemento aparece na
amostra ou populao. Na tabela acima, esta freqncia absoluta est sendo expressa
pela empresas fiscalizadas.

- Freqncia Absoluta Acumulada (Fi): a soma das freqncias dos dados
anteriores.

- Freqncia Relativa (hi): a razo entre o valor de cada freqncia e o nmero
total de dados existentes na observao. Ou seja:
n
f
= h
i
i


- Freqncia Relativa Acumulada (Hi): a soma das freqncias relativas dos
dados anteriores.

As tabelas de distribuio de freqncias so vlidas para variveis quantitativas e
qualitativas. Mas quando h um nmero grande de dados para a distribuio de
freqncias, ou quando a varivel de interesse quantitativa contnua, convm
utilizarmos intervalos (ou classes); estes intervalos podem ser de igual tamanho, ou de
tamanho diferentes. Ou ainda, os intervalos podem ser abertos ou fechados.

Segundo Bussab e Morettin, a escolha dos intervalos depender da familiaridade do
pesquisador com os dados. Mas, vale assinalar que, com um pequeno nmero de
intervalos pode-se perder informaes, e com um grande nmero de intervalos pode-se
prejudicar o resumo dos dados.

Entretanto, segundo Fonseca, h duas aparentes solues para a definio do nmero de
intervalos:

a) Se o nmero de elementos (n) for menor que 25 ento o nmero de classes (k)
igual a 5; se n for maior que 25, ento o nmero de classes aproximadamente a
raiz quadrada positiva de n. Ou seja:

Para n 25, k = 5
Para n > 25, K = n

b) Frmula de Sturges: k 1 + 3,33 log n.

- Amplitude total ou range (R ): a diferena entre o maior e o menor valor
observados no conjunto de dados.

- Amplitude dos intervalos ou das classes (h): o maior inteiro da diviso da
amplitude total (R) pelo nmero de intervalos (k).
Ou seja: h
k
R



AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 9
2.2 - Tabela de distribuio de freqncias bidimensional

Muitas vezes, estamos interessados em analisar o comportamento conjunto de
duas ou mais variveis. Assim, vamos estudar como organizamos e resumimos os dados
para uma distribuio conjunta de duas variveis em forma de tabelas. Essas tabelas
podem apresentar freqncias relativas as quais servem para apresentar estimativas de
riscos, ou seja, do estimativas das probabilidades de dano.
O exemplo mostrado abaixo apresenta o nmero de nascidos vivos registrados,
classificados segundo dois fatores: o ano de registro e o sexo.

Tabela 02: Nascidos vivos registrados segundo o ano de registro e o sexo.
Ano de registro sexo Total
Masculino Feminino
1984 1.307.758 1.251.280 2.559.038
1985 1.339.059 1.280.545 2.619.604
1986 1.418.050 1.361.203 2.779.253
Fonte: IBGE (1988)
Nota: Nascimentos ocorridos no ano de registro


ATIVIDADE DESENVOLVIDA EM SALA DE AULA

1. Os dados a seguir determinam a produo de sacas/ha de soja em determinada
regio.
Tabela 01-Produo de sacas/ha
67 65 68 67 67 64 69 66 66 66
68 71 67 67 70 65 65 66 70 64
67 68 66 68 64 65 67 66 69 68
65 69 68 67 68 67 67 67 66 66
Organize os dados e construa uma tabela de distribuio de freqncia e o histograma
da produo.

2. Os dados a seguir representam a idade 50 funcionrios selecionados
aleatoriamente da populao de uma agroindstria X.
3.
Tabela 02-Idades de 50 funcionrios(colocados em ordem crescente)
18 20 20 21 22 24 25 25 26 27
29 29 30 30 31 31 32 33 34 35
36 36 37 37 37 37 38 38 38 40
41 43 44 44 45 45 45 46 47 48
49 50 51 53 54 54 56 58 62 65
Organize os dados e construa uma tabela de distribuio de freqncia e o histograma
da produo.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 10

3. Representao Grfica para Variveis Qualitativas e Quantitativas
A apresentao dos dados atravs de grficos, nos fornece uma excelente idia dos
resultados obtidos e de como se relacionam os dados. Todo grfico ou diagrama deve
ser auto-explicativo e de fcil compreenso, devem ter trs requisitos bsicos:
simplicidade, clareza e veracidade. Mas algumas sugestes devem ser seguidas na sua
construo:
- O tamanho do grfico deve ser adequado sua publicao;

- Todo grfico dever ter sempre um ttulo e uma escala, sendo que, esta escala deve
ser adequada para que no desfigure os fatos.

3.1 Representao grfica de variveis qualitativas

Para a representao grfica de variveis qualitativas, os tipos de grficos mais
usados so: grficos de ordenadas, grfico em barras, grfico em colunas, pictograma,
dot plot, grfico de setores.


Grfico de Ordenadas
Para a sua construo traada uma reta horizontal (ou vertical) que servir de base;
a partir de pontos com a mesma distncia nesta reta, constroem-se traos
perpendiculares, cujo comprimento seja proporcional a freqncia.

Grfico em Barras
O grfico em barras a representao em que sobre o eixo vertical constroem-se
retngulos para as diferentes categorias da nossa varivel, com largura apropriada e
altura proporcional as respectivas freqncias de cada categoria. As barras no so
justapostas ou ligadas, pois na maioria das vezes as categorias das variveis qualitativas
no apresentam relao de continuidade.

Tabela 04: Internaes em estabelecimento de sade, por espcie de clnica - 1992
Espcie de Clnica Freqncia Freqncia relativa (%)
Mdica 6457923 32,51
Ginecologia e Obstetrcia 3918308 19,73
Cirurgia 3031075 15,26
Pediatria 2943939 14,82
Outros 3513186 17,69
Fonte: IBGE, Diretoria de Pesquisa, Pesquisa de Assistncia Mdico-Sanitria










AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 11
Figura 1: Internaes em estabelecimento de sade, por espcie de clnica - IBGE
1992.

Grfico em Colunas
A construo do grfico em colunas semelhante ao em barras, com uma nica
diferena, os retngulos sero sustentados no eixo horizontal.
Figura 2: Internaes em estabelecimento de sade, por espcie de clnica - IBGE
1992.


Pictograma
O grfico pictograma semelhante ao grfico em colunas, com a diferena que no
lugar de retngulos sero figuras que representaram as distribuies de freqncia.


Grfico de Setores Circulares
Geralmente este grfico usado para evidenciar a distribuio percentual de uma
populao ou amostra. Para a construo deste tipo de grfico, divide-se a rea total de
um crculo em subreas (setores) proporcionais s respectivas freqncias absoluta ou
relativa.
Lembrando que um crculo tem 360, ento usaremos a seguinte regra de trs para
calcularmos o ngulo de cada setor :

0
5
10
15
20
25
30
35
M

d
i
c
a
G
i
n
i
c
o
l
o
g
i
a
e
O
b
s
t
r
e
t
r

c
i
a
C
i
r
u
r
g
i
a
P
e
d
i
a
t
r
i
a

O
u
t
r
o
s
F
r
e
q
u

n
c
i
a

r
e
l
a
t
i
v
a

(
%
)
0 5 10 15 20 25 30 35
Mdica
Ginicologia e Obstretrcia
Cirurgia
Pediatria
Outros
Frequncia relativa (%)
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 12

n 360
fi x x =
n
f
i
360


Onde n o total de elementos no conjunto de dados e fi a respectiva freqncia
absoluta da categoria da varivel. Para calcularmos o ngulo para a freqncia relativa,
basta substituirmos o total de elementos pelo nmero 1.
Sabendo-se o ngulo de cada setor, traa-se uma circunferncia e assim, basta
marcarmos os valores da cada ngulo na circunferncia e traar os raios, separando os
setores.
Figura 3: Internaes em estabelecimento de sade, por espcie de clnica - IBGE
1992.


Dot Plot
o grfico onde, no eixo horizontal marca-se com espaamentos iguais cada
categorias da varivel e verticalmente a estas, desenha-se pontos, sendo que, a
quantidade de pontos em cada categoria igual ao valor da freqncia absoluta desta.
Este grfico no usual e recomendado apenas, quando as freqncias so pequenas.



















32%
20%
15%
15%
18%
Mdica
Ginicologia e
Obstretrcia
Cirurgia
Pediatria
Outros
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 13
3.2 Representao grfica de variveis quantitativas

Alguns tipos de grficos que construmos anteriormente: grfico em colunas, em
barras, dot plot, de setores circulares tambm so usados para representar a distribuio
de variveis quantitativas.

Histograma
Este um grfico usado para apresentar dados organizados em intervalos, utilizado
principalmente para representar a distribuio de variveis contnuas.
Figura 4: peso ao nascer dos nascidos vivos, em quilogramas.

- Histograma para classes com amplitudes iguais
Para a sua construo, trace o sistema de eixo cartesiano; marque os extremos das
classes no eixo horizontal (das abscissas); no eixo vertical (das ordenadas) marque as
freqncias absolutas ou freqncias relativas; e para cada classe, trace um retngulo
com base igual ao intervalo de classe e altura igual a freqncia.

- Histograma para classes com amplitude diferentes
Para a sua construo, calcule a densidade de freqncia absoluta ou relativa.

h
f
d
i
i
= ou
h
h
d
i
i
=

Trace um sistema de eixo cartesianos; marque os extremos de classes no eixo
horizontal; no eixo vertical marque a densidade e para cada classe, trace um retngulo
com base igual ao intervalo da classe e altura igual a densidade de freqncia.

Polgono de freqncias
a representao grfica de uma distribuio de freqncias por meio de um
polgono.
Para a sua construo, trace o sistema de eixo cartesianos; marque os pontos
mdios de cada classe no eixo horizontal (ponto mdio de um intervalo a soma dos
extremos do intervalo dividido por dois); no eixo vertical coloque as freqncias; faa
0
2
4
6
8
10
12
14
1,75 2,25 2,75 3,25 3,75 4,25 4,75 Mais
Peso ao nascer
F
r
e
q

n
c
i
a
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 14
pontos na interseco do ponto mdio de cada intervalo com sua respectiva freqncia;
una todos estes pontos por segmentos de reta.

Figura 5: peso ao nascer dos nascidos vivos, em quilogramas.

Ogiva
o grfico que representa a distribuio da freqncia absoluta acumulada. Sua
construo semelhante ao do polgono de freqncias, com a diferena que
consideraremos a freqncia absoluta acumulada.

0
2
4
6
8
10
12
14
1,75 2,25 2,75 3,25 3,75 4,25 4,75 Mais
Peso ao nascer
F
r
e
q

n
c
i
a
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 15
EXERCCIOS

1. A WW Indstria e Comrcio, desejando melhorar o nvel de sues funcionrios
em cargos de chefia, montou um curso experimental e indicou 25 funcionrios
para a primeira turma. Os dados referentes seo a que pertencem, sexo, idade,
notas e graus obtidos no curso esto na tabela a seguir:

Tabela 01 Informaes sobre a seo, sexo, idade e aproveitamento dos funcionrios
da indstria WW, nas disciplinas oferecidas durante o curso experimental.
Funcio
nrio
seo sexo idad
e
Adminis
trao
direit
o
reda
o
estats
tica
ingl
s
metod
ologia
poltic
a
econo
mia
1 P M 25 8 9 8,0 9 A A 9,0 8,5
2 P M 45 8 9 7,5 9 A B 8,5 8,0
3 P M 43 8 9 9,5 9 A A 9,5 8,5
4 P M 32 6 9 5,0 6 B B 7,0 7,0
5 P F 30 9 9 10,0 10 A B 7,5 8,0
6 P F 29 9 9 10,0 10 A B 9,0 9,5
7 P F 40 9 9 10,0 9 B A 9,5 7,5
8 T F 35 10 9 10,0 9 A A 1,0 9,5
9 T M 20 6 9 7,0 8 C C 6,0 6,0
10 T M 23 6 9 7,5 5 D C 4,0 5,0
11 T F 21 6 9 6,5 9 C C 5,0 5,0
12 T F 25 9 9 10,0 10 A A 9,5 9,5
13 T F 39 10 9 9,5 10 A A 9,5 9,5
14 T M 37 7 9 8,0 7 B B 9,0 8,0
15 V M 40 7 9 8,0 7 B A 9,0 8,5
16 V M 27 7 9 8,0 7 A A 8,5 9,5
17 V F 35 8 9 8,5 8 B A 9,5 9,5
18 V F 34 8 9 8,5 8 B B 7,0 7,5
19 V F 37 8 9 7,0 8 A B 8,0 8,0
20 V M 29 10 9 10,0 9 A A 9,5 8,5
21 V M 30 10 9 10,0 10 A A 9,5 9,5
22 V M 42 8 9 9,5 8 A A 8,5 8,0
23 V F 24 6 9 6,0 5 D C 5,0 5,0
24 V F 26 9 9 9,0 9 A A 9,5 9,5
25 V M 32 6 9 5,0 5 D C 5,0 5,0
Observaes:
Seo: P= Seo Pessoal, T= Seo Tcnica e V= Seo de Vendas.
Sexo: M= Masculina, F= Feminino.
Como havia dvidas quanto adoo de um nico critrio de avaliao, cada professor
adotou seu prprio sistema de aferio. Usando os dados da tabela, responda as
questes:

a) Aps observar atentamente cada varivel, e com intuito de resumi-las, como que
voc identificaria (qualitativa ordinal ou nominal e quantitativa discreta ou contnua)
cada uma das 11 variveis listadas?
b) Compare e indique as diferenas existentes entre as distribuies das variveis
Direito, Poltica e Estatsticas.
c) Construa o histograma para as notas da varivel Redao. Interprete os resultados.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 16
d) Construa a distribuio, de freqncia da varivel Metodologia e faa um grfico
(poder ser de setor, barras, colunas de sua preferncia) para indicar essa
distribuio. Interprete os resultados.
e) Construir a distribuio de freqncia conjunta para as variveis Sexo e Idade.
Interprete os resultados.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 17
PARTE III

Medidas de Posio

1. Introduo
Atravs de tabelas e grficos construdos anteriormente, vimos como resumir e
apresentar um conjunto de dados. Contudo, podemos resumir ainda mais este conjunto,
apresentando um ou alguns valores que representam todo o conjunto. Esses valores
so chamados de medidas de posio.

2. Medidas de Tendncia Central
So valores estabelecidos num ponto central em torno do qual os dados se
distribuem. As medidas de tendncia central que iremos estudar so: mdia aritmtica,
mediana e moda.

2.1 - Mdia Aritmtica
a soma de todos os elementos em nosso conjunto de dados dividido pelo total
de elementos. Isto ,

= x
n
x
n
i
i
=1

Onde n o total de elementos no conjunto de dados.

A mdia aritmtica um valor que pode substituir todos os valores da varivel, isto
, o valor que a varivel teria se em vez de varivel ela fosse constante.

2.1.1 Propriedades da Mdia Aritmtica
A soma algbrica dos desvios de um conjunto de valores em relao ao
mdia aritmtica zero;
A soma algbrica dos quadrados dos desvios de um conjunto de valores em
relao a mdia aritmtica mnima;
Somando ou subtraindo uma constante a todos os valores de uma varivel,
a mdia ficar acrescida ou subtrada a essa constante;
Multiplicando ou dividindo todos os valores de uma varivel por uma
constante, a mdia ficar multiplicada ou dividida por essa constante.

2.1.2 Vantagens do emprego da mdia
Como faz uso de todos os dados para seu clculo, pode ser determinada
com preciso matemtica;
Pode ser determinada quando somente o valor total e o nmero de
elementos forem conhecidos.

2.1.3 Desvantagens do emprego da mdia aritmtica
No pode ser empregada para dados qualitativos;
influenciada por valores extremos, podendo, em alguns casos, no
representar a srie.


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 18
2.2 - Mediana (Md)
o valor que ocupa a posio central de um conjunto de dados ordenados. Ou
seja, o valor que tiver o mesmo nmero de elementos no seu lado esquerdo e direito.

Sejam os nmeros a seguir, as cinco observaes de uma varivel qualquer:
5 6 7 8 8
A mediana para este conjunto 7, correspondente 3
a
observao que ocupa a
posio central.
Assim, se o nmero de elementos for mpar, a mediana o elemento cuja ordem
da posio central :

|

\
| +
=
2
1
) (
n
x x Md
Onde n o nmero de elementos no conjunto de dados.

Sejam as seguintes observaes: 5,0 5,5 7,0 8,0 8,5 10,0
Como o nmero de elementos par, a mediana a mdia aritmtica dos dois elementos
centrais, cuja ordem:

2
) (
2
2
2
|

\
| +
|

\
|
+
=
n n
x x
x Md

Neste exemplo: X
1
= 6/2 = 3 (3
O
termo) e X
2
= (6+2)/2 = 4 (4
O
termo), logo a mediana
:

Md = 5 7
2
8 7
, =
+


Observe que este um valor terico, pois no figura entre os dados originais.

2.2.1 Vantagens do emprego da mediana
A mediana no influenciada por valores extremos.

2.2.2 Desvantagens do emprego da mediana
A mediana uma medida que exige uma ordenao de categorias, da mais
alta a mais baixa, assim ela s pode ser obtida para variveis qualitativas
ordinais ou para as quantitativas, jamais para variveis qualitativas
nominais;
No inclui todos os valores da distribuio;



2.3 - Moda (Mo)
o valor que ocorre com maior freqncia em um conjunto de dados.

Exemplo: Conjunto de dados: 7 8 5 7 7 7 5 8 9 7

Moda = Mo = 7

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 19
Em um conjunto de dados podemos ter duas modas ou nenhuma; a distribuio
que possui duas modas chamamos de distribuio bimodal e mais de duas modas,
multimodais. Existem ainda distribuies que no apresentam nenhuma moda: so
chamadas de amodais.

2.3.1 Vantagens do emprego da moda
A moda uma medida que requer apenas o conhecimento da freqncia
absoluta e pode ser utilizada para qualquer tipo de variveis, tanto
qualitativas, quanto quantitativas;
de uso prtico. Exemplificando: os empregadores geralmente adotam a
referncia modal de salrio. Tambm carros e roupas so produzidos
tomando como referncia o tamanho modal

2.3.2 Desvantagens do emprego da moda
No inclui todos os valores da distribuio;
Mostra-se ineficiente quando a distribuio amplamente dispersa.


3. Outras Medidas de Posio, as SEPARATRIZ

3.1 - Quartis (Q1 e Q3)
So medidas de posio que dividem um conjunto de dados ordenados em
quatro partes iguais.



Mn. Q1 Md Q3 Mx.

Onde:
- O 1
O
Quartil (Q1) significa que 25% dos dados so inferiores a Q1, ou que 75% dos
dados so superiores a Q1.
- O 3
O
Quartil (Q3) significa que 75% dos dados so inferiores a Q3, ou que 25% dos
dados so superiores a Q3.

Em geral Q1 < Me < Q3.




Q1 = 1 1 1
1
4 4 4
0.75
n n n
X X X
+ + + | | | | | |
+
| | |
\ \ \
| |
+ |
|
\

Q3 = ( 1) ( 1) ( 1)
3. 3. 3. 1
4 4 4
0.25
n n n
X X X
+ + | | | | | | + | |
+
| | | |
\ \ \ \
| |
|
+
|
\

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 20

3.2 - Box plot ou desenho esquemtico

um tipo de representao grfica, em que se realam algumas caractersticas
da amostra, fornecendo uma idia da posio central, disperso, assimetria, cauda e
dados discrepantes. O conjunto dos valores da amostra compreendidos entre o 1 e o 3
QUARTIS, que vamos representar por Q
1
e Q
3
representado por um retngulo (caixa)
com a MEDIANA indicada por uma barra vertical. A largura do retngulo no d
qualquer informao. Consideram-se seguidamente duas linhas que unem os meios dos
lados do retngulo com os extremos da amostra. Para obter esta representao, comea
por se recolher da amostra, informaes sobre 5 nmeros, que so: os 2 extremos
(mnimo e mximo), a mediana e o 1 e 3 quartis. A posio central dos valores dada
pela mediana e a disperso d = Q3 - Q1. As posies relativas Q1, Me e Q3 do
uma noo da simetria da distribuio. Os comprimentos das caudas so dados pelas
linhas que vo do retngulo aos valores mais afastados que no sejam outliers e pelos
prprios outliers. A representao do diagrama de extremos e quartis tem o seguinte
aspecto:



Existem fundamentalmente 3 caractersticas, que nos do idia da simetria ou
enviesamento e da sua maior ou menor concentrao: distncia entre a linha indicadora
da mediana e os lados do retngulo; comprimento das linhas que saem dos lados dos
retngulos e o comprimento da caixa. Apresentamos a seguir 3 exemplos de boxplot,
correspondentes a tipos diferentes de distribuio de dados.




Exemplo:
Dados os nmeros:

3 4 2 1 7 5 4 2 1 7 8 5 2 1 4 3 5 5 6 7 9 8 8 8

Achar mdia, mediana, moda, Q1, Q3 e construir o Boxplot


3.3 Decis: So medidas de posio que dividem um conjunto de dados
ordenados em dez partes iguais.

3.4 Percentis: So medidas de posio que dividem um conjunto de dados
ordenados em cem partes iguais.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 21

3.5 Medida de Assimetria

H um momento em que o pesquisador far a seguinte pergunta: Qual a medida
de tendncia central que representa melhor o conjunto de dados em estudo?Assim, no
caso das variveis quantitativas, quando o valor da Mediana muito diferente da Mdia,
aconselhvel considerar sempre a Mediana como valor de referncia mais importante.
Quando a distribuio dos dados considerada "normal", ento a melhor medida
de localizao do centro, a mdia, fato que justifica a grande utilizao da mdia.
Esquematicamente podemos posicionar a mdia da forma seguinte, tendo em conta a
representao grfica na forma de histograma.



Mo Md X < <

X Md Mo < <

assimetria negativa ou a esquerda assimetria positiva ou a direita



Mo Md X = =


distribuio simtrica

Para determinar o grau de assimetria, uma regra muito utilizada :
COEFICIENTE DE ASSIMETRIA DE PEARSON

O
S
M X
A

= ou
1 3
3 1
* 2
Q Q
Md Q Q
A
s

+
=
Desse modo, pode-se concluir que:
Se A
s
> 0, a distribuio assimtrica positiva;
Se A
s
< 0, a distribuio assimtrica negativa;
Se A
s
= 0, a distribuio simtrica.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 22
PARTE IV

Medidas de Disperso ou Medidas de Variabilidade

1. Introduo
As informaes fornecidas pelas medidas de posio necessitam em geral ser
complementada pelas medidas de disperso. Estas servem para indicar o quanto os
dados se apresentam dispersos em torno da regio central. Caracterizam, portanto, o
grau de variao ou oscilaes existente no conjunto de valores.

Exemplo:
Seja os quatro conjuntos abaixo, as notas de quatro turmas:
Turma A: 4 4 5 6 6
Turma B: 5 5 5 5 5
Turma C: 2 3 6 6 8
Turma D: 0 0 5 10 10

Os conjuntos so iguais?
Em qual das turmas h maior variao ou disperso dos dados em relao mdia?

Para calcularmos esta disperso em relao mdia, utilizaremos algumas medidas:

1.1 Amplitude: a diferena entre o maior e o menor dado observado. Como utiliza
apenas dois valores, contm pouca informao sobre a disperso. utilizada em
amostra muito pequenas.
R= Xmaior - Xmenor


1.2.Varincia amostral: A varincia mede o quanto os valores em uma amostragem
variam. uma medida que avalia o grau de disperso dos valores da varivel em torno
da mdia. Quanto menor a varincia, maior o grau de concentrao dos dados em
torno da mdia. Podemos representar o clculo dos dados da seguinte forma:

2
1 2 2
1
1
1
n
i
n
i
i
i
x
S x
n n
=
=
(
| |
(
|
\ (
=
(

(
(

(para dados de uma amostra agrupados)




1.3.Desvio Padro amostral: A varincia um quadrado, e muitas vezes o resultado
torna-se artificial.Por exemplo: a altura mdia de um grupo de pessoas 1,70m e a
varincia 25cm
2
. Fica um tanto esquisito cm
2
em altura.
Para contornamos este problema definindo Desvio Padro como sendo a raiz
quadrada positiva de sua Varincia.

2
S S = (para dados amostrais)

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 23

Usando a tabela de distribuio normal, vemos que no intervalo de:
De ) S X ( a ) S X ( + o grau de concentrao de probabilidades em torno da
mdia de 68%;
De ) S X ( 2 a ) S X ( 2 + , o grau de concentrao de probabilidades em torno da
mdia de 95%;
De ) S X ( 3 a ) S X ( 3 + , o grau de concentrao de probabilidades em torno da
mdia de 99,7%.
Exemplificando, se dissermos que a altura mdia ( ) X do homem brasileiro
adulto de 1,70m e desvio Padro (S) 5cm, estaremos dizendo que entre;
1,65m e 1,75m encontramos 68% da populao masculina adulta brasileira.
1,60m e 1,80m encontramos 95% da populao masculina adulta brasileira.
1,55m e 1,85m encontramos 99,7% da populao masculina adulta brasileir.a

OBSERVAO:
O desvio Padro representa a maneira mais comum de se medir a variao
de um conjunto de observaes. Para duas amostras, a que apresentar um desvio
padro maior acusar uma maior disperso.
Quanto menor o desvio padro, mais os valores da varivel se aproximam
de sua mdia.
Quanto maior a varincia e desvio padro, maiores so os indcios de
heterogeneidade entre os elementos do conjunto.


1.4.Coeficiente de Variao de PEARSON: O coeficiente de variao mede a
homogeneidade dos dados em conjunto em relao mdia, sua frmula expressa por:
100 =
x
S
CV
O valor obtido ser dado em porcentagem.
Acima de 30% o conjunto de dados considerado heterogneo
Abaixo de 30% o conjunto considerado homogneo.
Em algumas regras empricas para interpretaes do coeficiente de variao:
Se 0 CV < 10% tem-se baixa disperso
Se 10% CV <20% tem-se mdia disperso
Se 20% CV<30% tem-se alta disperso
Se CV30% tem-se elevada (altssima) disperso


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 24

EXERCCIOS

1. Uma amostra de 50 estudantes apontou o seguinte rol de notas de Estatstica
(avaliao de 0 a 100).
30 35 35 39 41 41 42 45 47 48
50 52 53 54 55 55 57 59 60 60
61 64 65 65 65 66 66 66 67 68
69 71 73 73 74 74 76 77 77 78
80 81 84 85 85 88 89 91 94 97

a) Qual a amplitude total desta amostra? vivel construir uma distribuio por
intervalos de classe?
b) Em quantas classes poderemos agrupar esse conjunto de dados?
c) Qual ser o tamanho dos intervalos de classe?
d) Construa a tabela de distribuio de freqncia por classes. Inicie a primeira
classe com 30.
e) Construa os histogramas de freqncias absolutas e relativas.
f) Quantos alunos obtiveram notas maiores ou iguais a 70?
g) Analisando a tabela e os grficos, redija um breve relatrio sobre as notas desta
turma de estudantes.
h) Calcule a mdia amostral e interprete.
i) Calcule e interprete a moda.
j) Calcule e interprete a mediana.
k) Determine os quartis. Represente os resultado usando o BOX-PLOT.
l) Determine a Varincia, Desvio Padro e Coeficiente de Variao. Interprete.
m) A Distribuio Simtrica? Justifique calculando o grau de assimetria e
interprete o BOX-PLOT.
n) Faa um comentrio final utilizando todos as informaes obtidas nos itens
acima e faa suas consideraes finais.

2. Para se estudar o desempenho de duas companhias corretoras de aes,
selecionou-se de cada uma delas amostras aleatrias das aes negociadas. Para
cada ao selecionada, computou-se a porcentagem de lucro apresentada durante
um perodo fixado de tempo. Os dados esto a seguir:

Quadro 1. Porcentagem de lucro de aes negociadas de duas corretoras
Corretora A Corretora B
45 54 62 61 54 64 57 58 58 50 51 49
70 48 64 55 65 65 52 59 59 55 61 65
59 51 55 60 62 63 65 59 48 55 60 70
60 55 40 55 66 65 55 69 58 63 64 75
Determine:
a) A mdia, mediana, moda e quartis de cada corretora. Interprete os resultados;
b) Que corretora tem as aes menos dispersas?
c) Que corretora tem as aes mais homogneas?




AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 25
3. Um laboratrio clnico precisa decidir comprar um dentre trs aparelhos
(A,B,C) para dosagem no sangue. Para isto o responsvel pela anlise preparou
uma substncia de concentrao conhecida (10mg/ml) e extraiu vrias amostras
para serem dosadas pelos trs aparelhos. Os resultados obtidos em cada um deles
foi o seguinte:

A 10 9 10 9 11 8 9 7 8 9
B 5 10 7 15 16 12 4 8 10 13
C 10 11 9 10 9 11 12 8 10 10

Em medidas clnicas trs termos so utilizados freqentemente:
PRECISO: Refere-se disperso dos resultados;
NO VICIADO: Refere-se tendncia de um conjunto de medidas produzir um
resultado igual ao verdadeiro valor(em nosso exemplo o verdadeiro valor 10mg/ml).
EXATO: refere-se ao instrumento PRECISO e NO VICIADO.

a) Descreva os trs instrumentos em termos das definies acima.
b) Qual instrumento lhe parece recomendvel? Justifique

4. No quadro a seguir apresenta-se a produtividade de soja t/h das parcelas de
uma variedade.

81 77 103 112 123 119 110 110
82 61 110 121 119 97 102 111
82 74 97 105 112 91 103 112
88 70 103 111 122 94 99 105
89 88 94 110 116 108 93 107
77 82 86 101 109 113 99 102
74 80 85 90 97 101 96 72
75 80 83 87 94 99 95 48
77 84 74 108 121 143 91 52
87 100 47 111 104 109 80 98

a) Calcular o valor mdio, desvio padro, coeficiente de variao. A rea em
estudo homognea? Justifique sua resposta.

b) Achar os quartis e classifique cada parcela da seguinte maneira:
Vermelho, se a produtividade menor a Q1;
Amarelo, se Q1 produtividade Me;
Verde, se Me< produtividade Q3 ;
Azul, se produtividade > Q3 .
Existe alguma tendncia espacialmente nos dados? Que se pode dizer acerca do
estudo de homogeneidade obtido em (a)?






AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 26
5. Uma indstria metalrgica recentemente passou a produzir um tipo especial de
ao para atender um novo cliente. Estas peas so produzidas com um ao de
baixa-liga e aps serem usinadas so submetidas ao processo de resfriamento.
Para satisfazer s especificaes do novo cliente, o item de dureza, medida no
centro das peas de ao deve estar na faixa de 32 a 38 Rockwell C(unidade de
dureza). Os dados apresentados na Tabela 1 representa o nvel de dureza do ao
utilizando trs tratamentos (gua, leo A, leo B).

Tabela 01: Valores da Dureza, medida no centro das Peas do Tipo Especial, Aps os
tratamentos de resfriamento.
Resfriamento em
Observao gua leo A leo B
1 36,7 36,0 35,3
2 38,9 36,4 35,0
3 38,7 35,3 34,3
4 38,8 36,8 35,7
5 37,6 36,9 35,2
6 37,2 37,5 34,2
7 38,8 35,3 36,5
8 38,0 36,0 35,6
9 37,2 35,7 35,5
10 37,8 36,1 35,5
11 38,0 37,0 35,4
12 38,8
Determine:
a) A mdia, Mediana, Desvio Padro, Coeficiente de Variao, Quartis, Valor
Mnimo e Valor Mximo de cada tratamento. Interprete os resultados.
b) Construa os grficos Dot-plot e Box-plot para cada tratamento. Interprete os
resultados.
c) Que tratamento tem nvel de dureza com menos variabilidade com respeito a sua
mdia e mais homogneo?
d) Qual dos trs tratamentos de resfriamento cumpre as especificaes do cliente?


















AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 27
PARTE V
Probabilidade
1 . Introduo
Chama-se experimento aleatrio quele cujo resultado imprevisvel, porm
pertence necessariamente a um conjunto de resultados possveis denominado espao
amostral.
Qualquer subconjunto desse espao amostral denominado evento.
Se este subconjunto possuir apenas um elemento, o denominamos evento
elementar.
Por exemplo, no lanamento de um dado, o nosso espao amostral seria:
U = {1, 2, 3, 4, 5, 6}.
Exemplos de eventos no espao amostral U:
A: sair nmero maior do que 4: A = {5, 6}
B: sair um nmero primo e par: B = {2}
C: sair um nmero mpar: C = {1, 3, 5}

Nota: O espao amostral tambm denominado espao de prova.

Trataremos aqui dos espaos amostrais equiprovveis, ou seja, aqueles onde os
eventos elementares possuem a mesma chance de ocorrerem.
Por exemplo, no lanamento do dado acima, supe-se que sendo o dado
perfeito, as chances de sair qualquer nmero de 1 a 6 so iguais. Temos
ento um espao equiprovvel.
Em oposio aos fenmenos aleatrios, existem os fenmenos
determinsticos, que so aqueles cujos resultados so previsveis, ou seja, temos certeza
dos resultados a serem obtidos.
Normalmente existem diversas possibilidades possveis de ocorrncia de um
fenmeno aleatrio, sendo a medida numrica da ocorrncia de cada uma dessas
possibilidades, denominada Probabilidade.
Consideremos uma urna que contenha 49 bolas azuis e 1 bola branca. Para uma
retirada, teremos duas possibilidades: bola azul ou bola branca. Percebemos, entretanto
que ser muito mais freqente obtermos numa retirada, uma bola azul, resultando da,
podermos afirmar que o evento "sair bola azul" tem maior probabilidade de ocorrer, do
que o evento "sair bola branca".

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 28
2. Conceito de Probabilidade
Seja U um espao amostral finito e equiprovvel e A um determinado evento,
ou seja, um subconjunto de U. A probabilidade p(A) de ocorrncia do evento A ser
calculada pela frmula
) (
) (
) (
U n
A n
A P =
onde: n (A) = nmero de elementos de A e n (U) = nmero de elementos do espao de
prova U.

Vamos utilizar a frmula simples acima, para resolver os seguintes exerccios
introdutrios:
2.1 - Considere o lanamento de um dado. Calcule a probabilidade de:
a) sair o nmero 3:
Temos U = {1, 2, 3, 4, 5, 6} [n(U) = 6] e A = {3} [n(A) = 1]. Portanto, a probabilidade
procurada ser igual a
6
1
) ( = A P
b) sair um nmero par: agora o evento A = {2, 4, 6} com 3 elementos; logo a
probabilidade procurada ser
2
1
6
3
) ( = = A P
c) sair um mltiplo de 3: agora o evento A = {3, 6} com 2 elementos; logo a
probabilidade procurada ser
3
1
6
2
) ( = = A P
d) sair um nmero menor do que 3: agora, o evento A = {1, 2} com dois elementos.
Portanto:
3
1
6
2
) ( = = A P
e) sair um quadrado perfeito: agora o evento A = {1,4} com dois elementos. Portanto:
3
1
6
2
) ( = = A P

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 29
2.2 - Considere o lanamento de dois dados. Calcule a probabilidade de:
a) Sair a soma 8
Observe que neste caso, o espao amostral U constitudo pelos pares ordenados (i,
j), onde i = nmero no dado 1 e j = nmero no dado 2.
evidente que teremos 36 pares ordenados possveis do tipo (i, j) onde
i = 1, 2, 3, 4, 5, ou 6, o mesmo ocorrendo com j.
As somas iguais a 8, ocorrero nos casos: (2,6), (3,5), (4,4), (5,3) e (6,2).
Portanto, o evento "soma igual a 8" possui 5 elementos. Logo, a probabilidade
procurada ser igual a:
36
5
) ( = A P
b) Sair a soma 12
Neste caso, a nica possibilidade o par (6,6).Portanto, a probabilidade procurada
ser igual a:
36
1
) ( = A P
2.3 Uma urna possui 6 bolas azuis, 10 bolas vermelhas e 4 bolas amarelas. Tirando-
se uma bola com reposio, calcule as probabilidades seguintes:
a) sair bola azul
% 30 30 , 0
10
3
20
6
) ( = = = = A P
b) sair bola vermelha
% 50 50 , 0
2
1
20
10
) ( = = = = A P
c) sair bola amarela
% 20 20 , 0
5
1
20
4
) ( = = = = A P

Vemos no exemplo acima, que as probabilidades podem ser expressas como
porcentagem. Esta forma conveniente, pois permite a estimativa do nmero de
ocorrncias para um nmero elevado de experimentos.
Por exemplo, se o experimento acima for repetido diversas vezes, podemos
afirmar que em aproximadamente 30% dos casos, sair bola azul, 50% dos casos sair
bola vermelha e 20% dos casos sair bola amarela. Quanto maior a quantidade de
experimentos, tanto mais a distribuio do nmero de ocorrncias se aproximar dos
percentuais indicados.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 30
3. Propriedades
P
1
: A probabilidade do evento impossvel nula.
Com efeito, sendo o evento impossvel o conjunto vazio (), teremos:
P() = n ()/n (U) = 0 /n (U) = 0
Por exemplo, se numa urna s existem bolas brancas, a probabilidade de se retirar
uma bola verde (evento impossvel, neste caso) nula.
P
2
: A probabilidade do evento certo igual unidade.
Com efeito, P(A) = n(U)/n(U) = 1
Por exemplo, se numa urna s existem bolas vermelhas, a probabilidade de se retirar
uma bola vermelha (evento certo, neste caso) igual a 1.
P
3
: A probabilidade de um evento qualquer um nmero real
situado no intervalo real [0, 1].
Esta propriedade, decorre das propriedades 1 e 2 acima.
P
4
: A soma das probabilidades de um evento e do seu evento
complementar igual a unidade.
Seja o evento A e o seu complementar A'. Sabemos que A U A' = U.
n(A U A') = n(U) e, portanto, n(A) + n(A') = n(U).
Dividindo ambos os membros por n(U), vem:
n(A)/n(U) + n(A')/n(U) = n(U)/n(U), de onde se conclui:
P(A) + P(A') = 1
Nota: esta propriedade simples, muito importante pois facilita a soluo de muitos
problemas aparentemente complicados. Em muitos casos, mais fcil calcular a
probabilidade do evento complementar e, pela propriedade acima, fica fcil determinar
a probabilidade do evento.
P
5
: Sendo A e B dois eventos, podemos escrever: (Adio de
Probabilidades)
P(A U B) = P(A) + P(B) P(A B)
Observe que se AB= (ou seja, a interseo entre os conjuntos A e B o
conjunto vazio), ento P(A U B) = P(A) + P(B).
Com efeito, j sabemos da Teoria dos Conjuntos que
n(A U B) = n(A) + n(B) n(AB)
Dividindo ambos os membros por n(U) e aplicando a definio de probabilidade,
conclumos rapidamente a veracidade da frmula acima.
Exemplo:
Em uma certa comunidade existem dois jornais J e P. Sabe-se que 5000 pessoas so
assinantes do jornal J, 4000 so assinantes de P, 1200 so assinantes de ambos e 800
no lem jornal. Qual a probabilidade de que uma pessoa escolhida ao acaso seja
assinante de ambos os jornais?
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 31
SOLUO:
Precisamos calcular o nmero de pessoas do conjunto universo, ou seja, nosso espao
amostral.
Teremos:
n(U) = n(J U P) + N. de pessoas que no lem jornais.
n(U) = n(J) + n(P) n(J P) + 800
n(U) = 5000 + 4000 1200 + 800
n(U) = 8600
Portanto, a probabilidade procurada ser igual a:
P = 1200/8600 = 12/86 = 6/43.
Logo, P = 6/43 = 0,1395 = 13,95%.

A interpretao do resultado a seguinte: escolhendo-se ao acaso uma pessoa da
comunidade, a probabilidade de que ela seja assinante de ambos os jornais de
aproximadamente 14%.(contra 86% de probabilidade de no ser).
4. Probabilidade condicional
Considere que desejamos calcular a probabilidade da ocorrncia de um evento
A, sabendo-se de antemo que ocorreu um certo evento B. Pela definio de
probabilidade vista anteriormente, sabemos que a probabilidade de A dever ser
calculada, dividindo-se o nmero de elementos de elementos de A que tambm
pertencem a B, pelo nmero de elementos de B. A probabilidade de ocorrer A, sabendo-
se que j ocorreu B, denominada Probabilidade condicional e indicada por P (A / B)
probabilidade de ocorrer A sabendo-se que j ocorreu B da, o nome de
probabilidade condicional.

Teremos ento:

P(A/B) = n(AB)/n(B)
onde AB = interseo dos conjuntos A e B.

ou seja:
Se A e B so dois eventos de um espao amostral (U), com P(B) 0, ento a
probabilidade condicional do evento A, tendo ocorrido B, indicada por P(A/B)
definida pela relao
( )
( / ) , se ( ) 0
( )
P A B
P A B P B
P B

=
Esta frmula denominada Lei das Probabilidades Compostas.
Esta importante frmula, permite calcular a probabilidade da ocorrncia simultnea dos
eventos A e B, sabendo-se que j ocorreu o evento B.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 32
1) Um dado foi jogado. Qual a probabilidade de ocorrer face 5, sabendo que ocorreu
face com nmero mpar?
3
Evento B Probabilidade de ocorrer face impar = ( )
6
1
Evento A A Probabilidade de ocorrer face 5 = ( )
6
1
( ) 1
6
( / ) = = 0,3 = 33,33%
3
( ) 3
6
P B
P A B
P A B
P A B
P B
=
=

= =

5. Probabilidade Independente e a Regra do Produto
Se a ocorrncia do evento B, no mudar a probabilidade da ocorrncia do evento
A, ento p(A/B) = p(A) ou p(B/A) = p(B) e, neste caso, os eventos so ditos
independentes, e a frmula acima fica:
P(AB) = P(B) . P(A/B) ou P(AB) = P(A) . P(B/A)
Podemos ento afirmar, que a probabilidade de ocorrncia simultnea de eventos
independentes, igual ao produto das probabilidades dos eventos considerados. Da
vem a regra do produto que pode ser expressa da seguinte forma:
P(AB) = P(A) . P(B)
Ou seja, se A e B so eventos independentes, a probabilidade de ocorrer A e B
dada pela probabilidade de ocorrer A, multiplicada pela probabilidade de ocorrer B.
Exemplo:
1) Uma urna possui cinco bolas vermelhas e duas bolas brancas.Calcule as
probabilidades de:
a) em duas retiradas, sem reposio da primeira bola retirada, sair uma bola vermelha
(V) e depois uma bola branca (B).
P(V B) = P(V) . P(B/V)
P(V) = 5/7 (5 bolas vermelhas de um total de 7).
Supondo que saiu bola vermelha na primeira retirada, ficaram 6 bolas na urna. Logo:
P(B/V) = 2/6 = 1/3
Da lei das probabilidades compostas, vem finalmente que:
P(V B) = 5/7 . 1/3 = 5/21 = 0,2380 = 23,8%
b) em duas retiradas, com reposio da primeira bola retirada, sair uma bola vermelha
e depois uma bola branca.
Com a reposio da primeira bola retirada, os eventos ficam independentes. Neste caso,
a probabilidade buscada poder ser calculada como:
P(V B) = P (V) . (B) = 5/7 . 2/7 = 10/49 = 0,2041 = 20,41%

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 33
5. Teorema Bayes
um processo usado para calcular a probabilidade a posteriori.
Definio: Sejam E
1
, E
2
, E
3
, . . . , E
k
eventos mutuamente exclusivos, tais que: P(E
1
) +
P(E
2
) + P(E
3
) + . . . + P(E
k
) = 1. Seja A um evento qualquer, que se sabe ocorrer em
conjunto com, ou em conseqncia de, um dos eventos E
i
. Ento a probabilidade de
ocorrncia de um evento E
i
dada a ocorrncia de A, dada por:
) / ( ) ( .... ) / ( ) ( ) / ( ) (
) / ( ) (
) (
) (
) / (
2 2 1 1 k k
i i i
i
E A P E P E A P E P E A P E P
E A P E P
A P
A E P
A E P
+ + +

=
Esse resultado relaciona probabilidades a priori P(E
i
) com probabilidades a
posteriori P(E
i
/A)

= Probabilidade de E
i
depois da ocorrncia de A.

















AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 34

EXERCCIOS

1. Determine a probabilidade de cada evento:
a) Um nmero par aparecer no lanamento de um dado no viciado;
b) Um rei aparecer, ao extrair-se uma carta de um baralho;
c) Pelo menos uma cara aparecer no lanamento de trs moedas;
d) Pelo menos uma cara aparecer no lanamento de n moedas;
e) Duas copas aparecerem, ao retirarem-se duas cartas de um baralho;
f) Uma carta de copas e uma de ouros aparecerem ao extrarem-se duas
cartas de um baralho.
R: a) 1/2 b) 1/13 c) 7/8 d) (2
n
1)/2
n
e) 1/17
f) 13/204

2. Um nmero escolhido entre 20 inteiros ao acaso, de 1 a 20. qual a
probabilidade de o nmero escolhido:
a) ser par?
b) Ser mpar?
c) Ser primo?
d) Quadrado perfeito?
R: a) 1/2 b) 1/2 c) 2/5 d) 1/5

3. Uma urna contm 20 bolas numeradas de 1 a 20. seja o experimento retirada de
uma bola, e considere os eventos:
A = { a bola retirada possui um mltiplo de 2}
B = {a bola retirada possui um mltiplo de 5}
Determine a probabilidade do evento AB
R: 4/13

4. Dois dados, um verde e um vermelho, so lanados e observados os nmeros das
faces de cima:
a) Qual a probabilidade de ocorrerem nmeros iguais?
b) Qual a probabilidde de ocorrerem nmeros diferentes?
c) Qual a probabilidade de a soma dos nmeros ser 7?
d) Qual a probabilidade de a soma dos nmeros ser 12?
e) Qual a probabilidade de a soma dos nmeros ser menor ou igual a 12?
f) Qual a probabilidade de aparecer um nmero 3 em ao menos um dado?
R: a) 1/6 b) 5/6 c) 1/6 d) 1/36 e) 1
f) 11/36

5. Um dado lanado e o nmero da face de cima observado.
a) se o resultado obtido for par, qual a probabilidade de ele ser maior ou
igual a cinco?
b) Se o nmero obtido for maior ou igual a cinco, qual a probabilidade de
ele ser par?
c) Se o resultado obtido for mpar, qual a probabilidade de ele ser menor
que 3?
d) Se o resultado for menor que 3, qual a probabilidade de ele ser mpar?
R: a) 1/3 b) c) 1/3 d)
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 35

6. Um nmero escolhido aleatoriamente dentre os nmeros 1, 2, 3, 4, 5, . . . , 50.
Qual a probabilidade de :
a) O nmero ser divisvel por 5?
b) O nmero terminar em 3?
c) O nmero ser primo?
d) O nmero ser divisvel por 6 ou por 8?
R: a) 1/5 b) 1/10 c) 3/10 d) 6/25

7. Qual a probabilidade de sair um Rei ou uma carta de Copas, quando retiramos
uma carta de um baralho? R: 4/13

8. Dois dados so lanados simultaneamente. Qual a probabilidade de:
a) A soma ser menor que 4?
b) A soma ser 9?
c) O primeiro resultado ser maior do que o segundo?
R: a) 1/12 b) 1/9 c) 5/12

9. Numa urna, so misturadas 10 bolas numerada de 1 a 10. Duas bolas so
retiradas (a, b) sem reposio. Qual a probabilidade de a + b =10?
R: 4/45

10. Em uma indstria h 10 pessoas que ganham mais de 20 salrios mnimos(s.m.),
20 que ganham entre 10 e 20 s.m. e 70 que ganham menos de 10 s.m.. Trs
pessoas desta indstria so selecionadas. Determinar a probabilidade de que pelo
menos uma ganhe menos de 10 s.m.
R: 97,3%

11. Um lote formado por 10 peas boas, quatro com defeitos e duas com defeitos
graves. Uma pea escolhida ao acaso. Calcule a probabilidade de que:
a) Ela no tenha defeitos graves;
b) Ela no tenha defeitos;
c) Ela seja boa, ou tenha defeitos graves;
R: a) 7/8 b) 5/8 c)

12. Considere o mesmo lote anterior. Retiram-se duas peas ao acaso. Qual a
probabilidade de que;
a) Ambas sejam perfeitas?
b) Pelo menos uma seja perfeita?
c) Nenhuma tenha defeito grave?
d) Nenhuma seja perfeita?
R: 3/8 b) 7/8 c) 91/120 d) 1/8

13. Um lote de 120 peas entregue ao controle de qualidade de uma firma. O
responsvel pelo setor seleciona 5 peas. O lote aceito se forem observadas 0
ou 1 defeitos. H 20 peas defeituosas no lote.
a) Qual a probabilidade do lote ser aceito?
b) Admitindo que o lote seja aceito, qual a probabilidade de ter sido
observado s um defeito?
R: a)80,38% b) 50%
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 36
14. Um grupo de 50 moas classificado de acordo com a cor dos cabelos, e dos
olhos de cada moa, segundo a tabela
Olhos
Cabelos azuis castanhos
Loira 17 9
Morena 4 14
Ruiva 3 3
Se voc marca um encontro com uma dessas garotas, escolhida ao acaso, qual a
probabilidade de ela ser:
a) Loira?
b) Morena de olhos azuis?
c) Morena ou ter olhos azuis?
d) Est chovendo quando voc encontra a garota. Seus cabelos esto
completamente cobertos, mas voc percebe que ela tem olhos castanhos. Qual a
probabilidade de que ela seja morena?

R: a)
25
13
b)
25
2
c)
25
19
d)
13
7


15. Uma urna contm cinco bolas brancas e seis pretas. Trs bolas so retiradas.
Calcular a probabilidade de:
a) Serem todas pretas;
b) Ser exatamente uma branca;
c) Ser ao menos uma preta.
R: a)4/33 b) 5/11 c) 31/33

16. Em uma classe, existem cinco alunos do 4 ano, quatro do 2 ano e trs do 3
ano. Qual a probabilidade de serem sorteados dois alunos de 2 ano, trs do 4
e dois do 3?
R: 5/22

17. A probabilidade de trs jogadores marcarem um pnalti so respectivamente:
10
7
5
4
,
3
2
e
Se cada um cobrar uma nica vez, qual a probabilidade de:
a) Todos acertarem?
b) Apenas uma acertar?
c) Todos errarem?
R: a) 28/75 b) 1/6 c) 1/50

18. A e B jogam 120 partidas de xadrez, das quais A ganha 60, B ganha 40 e 20
terminam empatadas. A e B concordam em jogar 3 partidas. Determinar a
probabilidade de:
a) A ganhar todas as trs;
b) Duas partidas terminarem empatadas;
c) A e B ganharem alternadamente.
R: a) 1/8 b) 5/72 c) 5/36


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 37
19. Num perodo de um ms, 100 pacientes sofrendo de determinada doena foram
internados em um hospital. Informaes sobre o mtodo de tratamento aplicado
em cada paciente e o resultado obtido esto abaixo,
Tratamento
Resultado
A B Soma
Cura total 24 16 40
Cura parcial 24 16 40
Morte 12 8 20
Soma 60 40 100
a) Sorteando aleatoriamente um desses pacientes, determinar a probabilidade de o
paciente escolhido:
a1) ter sido submetido ao tratamento A;
a2) ter sido totalemente curado;
a3) ter sido submetido ao tratamento A e ter sido parcialmente curado;
a4) ter sido submetido ao tratamento A ou ter sido parcialmente curado.
b) Os eventos mortee tratamento A so independentes? Justifique.
c) Sorteando dois pacientes, qual a probabilidade de que:
c1) tenham recebido tratamentos diferentes?
c2) pelo menos um deles tenha sido curado totalmente?

R: a1) 0,6 a2) 0,4 a3) 0,24 a4) 0,76 c1) 0,48 c2) 0,64

20. Numa bolsa temos cinco moedas de R$ 1,00 e quatro de R$ 0,50. Qual a
probabilidade de, ao retirarmos duas moedas, obtermos R$ 1,50?
R: 5/9
21. A probabilidade de uma mulher estar viva daqui 30 anos de
4
3
e de seu
marido,
5
3
. Calcular a probabilidade de:
a) Apenas o homem estar vivo;
b) Somente a mulher estar viva;
c) Ambos estarem vivos.
R: a) 3/20 b) 3/10 c) 9/20

22. Uma caixa A contm oito peas, das quais trs so defeituosas, e uma caixa B
contm cinco peas, das quais duas so defeituosas. Uma pea retirada
aleatoriamente de cada caixa.
a) Qual a probabilidade p de que ambas as peas no sejam defeituosas?
b) Qual a probabilidade p de que uma pea seja defeituosa e a outra no?
c) Se uma pea defeituosa e a outra no, qual a probabilidade p de que a
pea defeituosa venha da caixa A?
R: a) 3/8 b) 19/40 c) 9/19

23. Temos duas caixas: na primeira h trs bolas brancas e sete pretas; e na segunda,
uma bola branca e cinco pretas. De uma caixa escolhida ao acaso, seleciona-se
uma bola e verifica-se que preta. Qual a probabilidade de que a caixa onde
for extrada a bola seja a primeira? E a segunda?
R: 21/46 25/46

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 38
24. A probabilidade de um indivduo de classe A comprar uma carro de
4
3
, de B
5
1
e de C
20
1
. A probabilidade de o indivduo de classe A comprar um carro
da marca D
10
1
; de B comprar da marca D
5
3
e de C
10
3
. Em certa loja
comprou-se um carro da marca D. qual a probabilidade de que o indivduo da
classe B o tenha comprado?
R: 4/7

25. Em certo colgio, 5% dos homens e 2% das mulheres tem mais do que 1,80m de
altura. Por outro lado, 60% dos estudantes so homens. Se um estudante
escolhido ao acaso e tem mais de 1,80m de altura qual a probabilidade de que
o estudante seja mulher?
R: 4/19

26. Trs mquinas, A, B e c, produzem respectivamente 40%, 50% e 10% total de
peas de uma fbrica. As porcentagens de peas defeituosas nas respectivas
mquinas so 3%, 5% e 2%. Uma pea sorteada ao acaso e verifica-se que
defeituosa. Qual a probabilidade de que a pea tenha vindo da mquina B?
R: 25/39

27. A industria Alpha Ltda., fabricante de esferas metlicas, possui trs mquinas,
M
1
, M
2
e M
3
, responsveis por 25%, 40% e 35%, respectivamente, de sua
produo diria. Por sua vez, as respectivas taxas de unidades defeituosas so de
1%, 2% e 3%. Tendo um item sido retirado, ao acaso, da produo diria de
600.000 unidades, e se verificando que apresenta defeito, pede-se a
probabilidade de ser proveniente de M
i
(i = 1, 2, 3).
R: M
1
= 11,9% M
2
= 38,10% M
3
= 50%


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 39
PARTE VI

Distribuio Tericas De Probabilidade De
Variveis Aleatrias Discretas
1. Variveis Aleatrias

Seja E um evento aleatrio e U o espao Amostral associado ao experimento.
Uma funo X que associe cada elemento uU um nmero real X
(u)
denominada
varivel aleatria.

Exemplo:
Lanam-se trs moedas. Seja X: nmero de ocorrncia de face cara. Determinar a
distribuio de probabilidade de X.

1.1 Varivel Aleatria Discreta

Seja X uma varivel aleatria. Se o nmero de valores possveis de X for finito
ou infinito numervel, denominaremos X de Varivel Aleatria Discreta.

Exemplos:
X: O nmero de Caras obtidas em um lanamento de duas moedas no viciadas.
X: O nmero de Clientes que vo ao banco no horrio das 10:00h as 12:00h.
X: Chamadas telefnicas por unidade de tempo.
X: Nmero de partculas emitidas por uma fonte de material radioativo por unidade
de tempo.

1.2 DISTRIBUIO BINOMIAL
Trata-se de um modelo que d a probabilidade do nmero de sucessos quando
so realizadas n provas do mesmo tipo.
Cada experimento admite dois resultados:
Sucesso com probabilidade p
Fracasso com probabilidade 1 p = q

Hipteses:
So realizadas n provas do mesmo tipo (Idnticas);
Cada prova admite dois resultados possveis: Sucesso ou Fracasso;
Os resultados das provas so independentes;

A varivel X tem distribuio binomial, com parmetros n e p, e indicaremos
pela notao ) p , n ( B X =

Frmula: P(X = x) =
x , n
x n x
C . q . p


Onde:
n = nmero de provas ou repeties;
x=nmero de Sucessos;
n-x = nmero de Fracassos;
p = probabilidade de sucesso em cada prova;
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 40
q = 1-p a probabilidade de Fracasso em cada prova;
x , n
C = nmero de combinaes de n elementos tomados x a x

Parmetros da distribuio Binomial
Esperana: E(x) = (x) = n . p
Varincia Var(x) =
2
(x) = n . p . q

1.3 DISTRIBUIO DE POISSON
Consideremos a probabilidade de ocorrncia de sucessos em um determinado
intervalo.

Hipteses:
H
1
: A probabilidade de uma ocorrncia em um intervalo t ( S, ou...) constante e
proporcional ao tamanho do intervalo. Isto :
t ) t , X ( P = = 1

H
2
: A probabilidade de mais de uma ocorrncia em um intervalo t ( S, ou...) igual
a zero. Isto :
0 1 = > ) t , X ( P

H
3
: O nmero de ocorrncias constituem varivel aleatrias independentes.

Seja X: nmero de sucessos no intervalo, ento:
Frmula: P(X = x) =
! x
e .
x



Onde:
= coeficiente de proporcionalidade, ou taxa de freqncia por unidade de
tempo, rea, etc.
t = tempo, rea;
e = base dos logaritmos naturais;
x = nmero de ocorrncias (sucessos)
= .t

Parmetros da distribuio de Poisson
Esperana: E(x) = (x) = .t
Varincia: Var(x) =
2
(x) = .t

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 41
EXERCCIOS

1. Uma moeda jogada 10 vezes. Calcule as seguintes probabilidades:
a) de dar pelo menos duas caras; R: 98,93%
b) de ocorrer seis caras; R: 20,51%
c) de no dar nenhuma coroa; R: 0,098%
d) de dar pelo menos uma coroa; R: 99,90%
e) de no dar 5 caras e 5 coroas R: 75,39%

2. Admitindo que o nascimento de meninos e meninas sejam iguais, calcule a
probabilidade de um casal com seis filhos ter quatro filhos homens e duas
mulheres.
R: 23,44%

3. Uma urna tem 20 bolas pretas e 30 brancas. Retira-se 25 bolas com reposio.
Qual a probabilidade de que:
a) 2 sejam pretas? R: 0,038%
b) Pelo menos 3 sejam pretas? R: 99,96%

4. Numa estrada h 2 acidentes para cada 100 km. Qual a probabilidade de que em;
a) 250Km ocorram pelo menos 3 acidentes? R: 87,53%
b) 300Km ocorram 5 acidentes? R: 16,06%

5. A probabilidade de um arqueiro acertar um alvo uma nica flecha de 0,20.
Lana 30 flechas no alvo. Qual a probabilidade de que:
a) exatamente 4 acertem o alvo? R: 13,25%
b) pelo menos 3 acertem o alvo? R: 95,58

6. O pessoal de inspeo de qualidade afirma que os rolos de fita isolante
apresentam, em mdia uma emenda a cada 50 metros. Admitindo-se que a
probabilidade do nmero de emendas dada pela Poisson, calcule as
probabilidades;
a) de nenhuma emenda em um rolo de 125 metros. R: 8,21%
b) De ocorrer no mximo duas emendas em um rolo de 125 metros.
R: 54,40%
c) De ocorrer pelo menos uma emenda em um rolo de 100 metros.
R: 86,47%

7. Admitindo que X tem distribuio de probabilidade de Poisson, encontre as
probabilidades:
a) P(X=5) quando = 3,0 R: 10,08%
b) P(X 2) quando = 5,5) R: 8,84%
c) P(X 4) quando = 7,5) R: 5,91%
d) P(X = 8) quando = 4,0 R: 2,98%

8. Sabe-se que 20% dos animais submetidos a um certo tratamento no
sobrevivem. Se esse tratamento foi aplicado em 20 animais e se X o nmero de
no sobreviventes:
a) qual a distribuio de X? Binomial = B(20 ; 0,2)
b) calcular a E[X] e Var [X] R: E[X] = 4 Var[X]
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 42
c) calcular P(2 < X 4) R : 42,36%
d) calcular P(X 2) R = 93,08%

9. O nmero de mortes por afogamento em fins de semana, numa cidade praiana
de 2 para cada 50.000 habitantes. Qual a probabilidade de que em:
a) 200.000 habitantes ocorram 5 afogamentos R: 9,16%
b) 112.500 habitantes ocorram pelo menos 3 afogamentos? R: 82,64%

10. A mdia de chamadas telefnicas numa hora trs. Qual a probabilidade de:
a) Receber exatamente trs chamada numa hora? R: 22,41%
b) Receber quatro ou mais chamadas em 90 minutos? R: 65,8%

11. Certo posto de Bombeiros recebe em mdia trs chamadas por dia. Calcular a
probabilidade de:
a) receber quatro chamadas num dia; R: 16,8%
b) receber trs ou mais chamadas num dia. R: 57,67%

12. Uma loja atende em mdia dois cliente por hora. Calcule a probabilidade de em
uma hora:
a) atender exatamente dois cliente; R: 27%
b) atender trs clientes. R: 18%

13. Suponha 400 erros de impresso distribudos aleatoriamente em um livro de 500
pginas. Encontre a probabilidade de que dada pgina contenha:
a) nenhum erro; R: 44,9%
b) exatamente dois erros. R: 14,37%

14. Se 5% das lmpadas de certa marca so defeituosas, ache a probabilidade de
que, numa amostra de 100 lmpadas, escolhidas ao acaso, tenhamos:
a) nenhuma defeituosa; R: (0,95)
100

b) trs defeituosas; R:
|
|

\
|
3
100
) 95 , 0 ( ) 05 , 0 (
97 3


15. A probabilidade de um atirador acertar uma alvo de
3
1
. Se ele atirar seis vezes,
qual a probabilidade de:
1. acertar exatamente dois tiros? R: 32,92%
2. no acertar nenhum tiro? R: 8,78%

16. Em um teste do tipo certo-errado, com 100 perguntas, qual a probabilidade de
uma aluno, respondendo s questes ao acaso, acertar 70% das perguntas?
R:
|
|

\
|
|

\
|
70
100
2
1
100

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 43
PARTE VII

Distribuio Tericas De Probabilidade De
Variveis Aleatrias Contnuas


1. Varivel Aleatria Contnua

Seja X uma varivel aleatria. Se o contradomnio de X um intervalo, ou uma
coleo de intervalos, denominamos X de Varivel Aleatria Contnua.

Exemplos:
X: Altura acima do solo que um dardo atinge o painel.
X: O intervalo de tempo de vida de uma lmpada.
X: Tempo de vida til de uma bateria de automvel.
X: Tempo de vida de uma pessoa.

2. Definio
Podemos dizer que uma varivel aleatria contnua aquela que assume valores em um
intervalo da reta real dos nmeros reais.
Por definio, uma varivel aleatria X contnua em IR se existir uma funo f(x), tal
que:
1. 0 ) ( x f (no negativa)
2.


=1 ) ( dx x f .
A funo f(x) chamada funo densidade de probabilidade (f.d.p.). Observamos que:

=
b
a
dx x f b X a P ) ( ) (
A rea sobre a curva expressa a funo densidade de probabilidade de uma f.d.p.
definida.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 44
Parmetros:
ESPERANA MATEMTICA: Pode ser entendida como um centro de distribuio
de probabilidade.


= = dx x f x x X E ) ( ) ( ) (

VARINCIA MATEMTICA:
2 2
)] ( [ ) ( ) ( X E X E X VAR =
onde:


= dx x f x X E ) ( ) (
2 2

Tambm podemos definir:


= =
x
ds s f x X P x F ) ( ) ( ) (

2.1 DISTRIBUIO NORMAL
O nome normal deve-se ao fato de que muitas distribuies de freqncias de erros de
observaes e mensuraes podem ser descritas por uma distribuio dessa natureza.
A funo f(x) chamada funo densidade de probabilidade (f.d.p.) de uma distribuio
normal definida por:
2
2
1
2
1
) (
|

\
|


x
e x f , para + < < x
O grfico de f(x) ;

As principais caractersticas dessa funo so:
a) o ponto mximo de f(x) o ponto X = ;

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 45
b) os pontos de inflexo da funao so: X = + e X = ;
c) a curva simtrica com relao a ;
d) E(X) = e VAR(X) =
2


Se quisermos calcular a probabilidade indicada na figura, devemos fazer:

\
|

=
b
a
x
dx e b x a P
2
2
1
2
1
) (



Graficamente:

Essa integral requer um trabalho computacional em sries para resolv-la, pois
de forma analtica a mesma se torna invivel. Para solucionarmos este problema usamos
uma transformao de variveis que nos conduz chamada distribuio normal
padronizada, ou distribuio normal reduzida. Usaremos a seguinte notao:
) , ( :
2
N X
Para transformao de variveis , consideraremos a seguinte transformao linear de X
para Z:


=
i
i
X
Z
Logo, para encontrarmos as reas (probabilidade) sob a curva f(x), mudam-se suas
abscissas para Z, determinando-se a probabilidade com auxilio de uma tabela normal
padronizada. Assim:
) ( ) (
2 1
z Z z P b x a P < < = < <
Onde:


=
a
Z
1


=
b
Z
2





AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 46
2.2 DISTRIBUIO EXPONENCIAL

Uma varivel aleatria X tem distribuio exponencial de probabilidade se a sua f.d.p.
dada por:

<

0 se 0
0 se
) (
x
x e
x f
x


A funo de distribuio de X, f.d.p., :

>
=

0 se 0
0 se 1
) (
x
x e
x F
x
se
O grfico da f.d.p. de X :

Parmetros:
ESPERANA MATEMTICA: A Esperana de X o ponto mdio do intervalo
[a, b]:

1
) ( = X E

VARINCIA MATEMTICA: A varincia de X dada por:
2
1
) (

= X VAR
P(Tt
0
)=1
0
t
e


P(T>t
0
) =
0
t
e

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 47
EXERCCIOS

1. Foi feito um estudo sobre a altura de uma faculdade, observando-se que ela se
distribua normalmente com mdia de 1,72m e desvio Padro de 5cm. Qual a
porcentagem dos alunos com altura:
a) entre 1,67m e 1,77m?
b) entre 1,62m e 1,82m?
c) entre 1,57m e 1,87m?
d) acima de 1,90m?
R: a) 68,27% b) 95,45% c) 99,73% d) 0,02%

2. Um estudo das modificaes percentuais dos preos, no atacado, de produtos
industrializados, mostrou que h distribuio normal com mdia de 50% e
desvio padro de 10%. Qual a porcentagem dos artigos que:
a) sofreram aumentos superiores a 75%?
b) sofreram aumentos entre 30% e 80%?
R: a) 0,626 b) 97,59%

3. O volume de correspondncia recebido por uma firma quinzenalmente, tem
distribuio normal com mdia de 4000 cartas e desvio padro de 200 cartas.
Qual a porcentagem de quinzenas em que a firma recebe:
a) entre 36000 e 4250 cartas?
b) menos de 3400 cartas?
c) mais de 4636 cartas?
R: a) 87,16% b) 0,14% c) 0,07%

4. Numa fbrica foram instaladas 1000 lmpadas novas. Sabe-se que a durao
mdia das lmpadas de 800 horas e desvio padro de 100 horas, com
distribuio normal. Determinar a quantidade de lmpadas que duraro:
a) Menos de 500 horas.
b) Mais de 700 horas.
c) Entre 516 e 814 horas.
R: a) 1,4 b) 841,3 c) 120,8

5. A durao de certo componente eletrnico pode ser considerada normalmente
distribuda com mdia de 850 dias e desvio padro de 45 dias. Calcular a
probabilidade de um componente durar:
a) entre 700 e 1000 dias;
b) mais de 800 dias;
c) menos de 750 dias;
d) exatamente 1000 dias.
R: a) 1 b) 0,8665 c) 0,0132 d) 0

6. Uma fbrica de pneumticos fez um teste para medir o desgaste de sues pneus e
verificou que ele obedecia a uma distribuio normal de mdia 48.000 km e
desvio Padro de 2.000km. Calcule a probabilidade de um pneu escolhido ao
acaso:
a) Durar mais de 46.000km;
b) Durar menos de 52.000km
c) Durar entre 45.000 e 50.000km.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 48

7. Suponha que o dimetro mdio de vida dos parafusos produzidos por uma
fbrica seja de 0,25 polegadas, e o desvio padro de 0,02 polegadas. Um
parafuso considerado defeituoso se seu dimetro maior que 0,28 polegadas
ou menor que 0,20 polegadas.
a) Encontre a porcentagem de parafusos defeituosos.
b) Qual deve ser a medida mnima para que tenhamos no mximo 12% de
parafusos defeituosos?
R: a) 7,3% b) 0,2266 polegadas

8. Se as interrupes no suprimento de energia eltrica ocorrem segundo uma
distribuio de Poisson com mdia de uma interrupo por mes (quatro
semanas), qual a probabilidade de que entre duas interrupes consecutivas haja
um intervalo de:
a) Menos de uma semana?
b) Entre 10 e 12 semanas?
c) Exatamente um ms?
d) Mais de trs semanas?
R: a) 0,2212 b) 0,0323 c) 0 d) 0,4724

9. O tempo de atendimento numa oficina aproximadamente exponencial com
media de quatro minutos. Qual a probabilidade de:
a) espera superior a quatro minutos?
b) Espera inferior a cinco minutos?
c) Espera de exatamente quatro minutos?
R: a) 0,3679 b) 0,7135 c) 0

10. Sabemos que o intervalo de ocorrncias sucessivas de uma doena contagiosa
uma varivel aleatria que tem distribuio exponencial com mdia de 100 dias.
Qual a probabilidade de no se ter registro de incidncia da doena por pelo
menos 200 dias a partir da data em que o ltimo caso for registrado?
R: 0,1353


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 49

PARTE VIII
Regresso e Correlao Amostral

1. CONCEITO DE MODELO

De modo geral, a palavra modelo pode ser entendida como uma representao abstrata
da realidade, estruturada de forma tal que permita compreender o funcionamento total
ou parcial dessa realidade ou fenmeno. Refere-se a um conjunto de hipteses
estabelecias a priori sobre o comportamento de um fenmeno, com base numa teoria j
existente ou a partir de novas proposies tericas.

1.1 CLASSIFICAO DE MODELOS

Os modelos, no sentido aqui referido, podem ser puramente tericos ou
estatsticos que chamaremos de modelos de regresso.
Modelos tericos so aqueles que expressam leis sem necessariamente conter a
especificao efetiva da forma matemtica nem a enumerao exaustiva das variveis
que o compem.
J os modelos de regresso so aqueles que necessariamente contm as
especificaes (forma matemtica, definio das variveis e nmero de equaes) para
aplicao emprica, alm de incorporar um termo residual (ou erro) com a finalidade de
levar em conta variveis ou outros elementos, que por alguma razo, no puderam ser
considerados explicitamente.
Contrastando com os modelos determinsticos que supem a existncia de
variveis que satisfazem exatamente as equaes matemticas, os modelos de regresso
ou probabilsticos no admitem relaes exatas em virtude da no-incluso de todas as
variveis que determinam o comportamento do fenmeno e de erros de medidas das
variveis.

1.2 MODELOS DE REGRESSO

Trs aspectos dos modelos de regresso destacam-se: a estrutura, a classificao
quanto s caractersticas dos fenmenos a serem modelados e as qualidades desejveis.
1.2.1 Estruturas do modelo de regresso

A formulao de um modelo de regresso envolve quatro elementos bsicos, a
saber:
i) variveis;
ii) relaes ou equaes;
iii) parmetros ou coeficientes;
iv) termo aleatrio ou permutao aleatria ou erro aleatrio.

Variveis so caractersticas observveis de alguma entidade, que podem
apresentar diferentes valores. So, portanto, magnitudes sujeitas a alteraes.
As variveis podem ser classificadas em dependentes ou explicadas e
independentes ou explicativas.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 50
Variveis dependentes ou explicadas so aquelas que recebem influncia de
outras variveis. So, tambm, chamadas de variveis endgenas ou variveis efeito.
Variveis independentes ou explicativas, tambm denominadas de causa ou exgenas,
so aquelas que afetam as variveis dependentes, cujo comportamento se deseja
explicar.
O conjunto de variveis explicativas mais o termo constante so denominados
costumeiramente de regressores.
As relaes ou equaes descrevem ou expressam o mecanismo que aciona os
elementos singulares de um fenmeno.
Parmetros ou equaes descrevem ou expressam o mecanismo que aciona os
elementos singulares de um fenmeno.
Parmetros so magnitudes que permanecem constantes no mbito de um
fenmeno concreto.
O termo constante, especificamente, indica a ausncia de alterao significativa
da varivel dependente ao longo do tempo ou entre unidades de observao no
temporais, no mbito da amostra utiliza, aps ter sido descontadas a influncia das
variveis explicativas sobre a explicada.
O termo aleatrio ou erro aleatrio a expresso de um grande nmero de
pequenas causas, que produzem um desvio em relao ao que a varivel dependente
deveria ser, se a relao fosse determinstica.
Por conseguinte, o tal indica:
variveis omitidas
imprevisibilidade do comportamento humano;
variao do comportamento
erros de medidas da varivel dependente;
especificaes imperfeita das relaes.

1.2.2 Classificaes teis dos modelos de regresso
til classificar os modelos de regresso em funo das caractersticas dos
fenmenos que se desejam modelar.
Os modelos podem ser classificados quanto forma funcional, ao nmero de
equaes, s associao das variveis com o tempo e a finalidade. Dessa forma, ter-se-
o os seguintes modelos:
a) quanto a forma funcional
Lineares aqueles que so expressos por funes lineares nos parmetros.
i i
y a bx e = + +
No-lineares aqueles expressos por funes no lineares nos parmetros.
Exemplos:
2
.exp( )
t
i i i
y a bt e
y a bx cx e
= +
= + + +


b) quanto ao nmero de equaes
Uni-equacionais contem apenas uma equao
i i
y a bx e = + +

Multi-equacionais contem pelo menos, duas equaes.
t t t t
M a bY cP u = + + +


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 51
c) quanto a associao das variveis com o tempo
Estticos - quando o ajustamento da varivel dependente em funo do efeito
da varivel explicativa ocorre simultaneamente no mesmo perodo de tempo.

Dinmico quando as variveis se referem a perodos de tempo diferentes.

d) quanto a finalidade
Modelos de deciso so aqueles orientados para o processo de tomada de
decises.
Modelos de previso que visam previso de valores de uma varivel.
Tais classificaes no so exclusivas. Portanto, um modelo pode ser, por exemplo
linear, uni-equacional, dinmico e de deciso ao mesmo tempo.

1.2.3 Qualidades desejveis dos modelos de regresso
A qualidade de um modelo de regresso normalmente avaliado em funo das
seguintes propriedades.
a) Plausibilidade terica segundo tal propriedade, o modelo deve descrever e
explicar adequadamente o fenmeno sob anlise.
b) Capacidade explanatrio nesse caso, o modelo deve ser capaz de explicar os
dados observados, cuja relao ele determina.
c) Exatido das estimativas dos parmetros os parmetros estimados devero ser
exatos no sentido de aproximar-se tanto quanto possvel do verdadeiro parmetro
estrutural.
d) capacidade de previso o modelo deve ser capaz de gerar previses satisfatrias
de valores futuros da varivel dependente.
e) Simplicidade o modelo deve representar as relaes entre as variveis com o
mximo de simplicidade em termo de nmero de equaes e da forma matemtica.

1.3 - ESPECIFICAO DO MODELO DE REGRESSO

A especificao de um modelo uma das etapas mais importantes da pesquisa
estatstica, pois requer conhecimentos tanto da teoria quanto da matemtica,
sobre tudo de funes e derivadas.
Nas especificaes de um modelo, dever-se-o considerar, inicialmente, aos
seguintes requisistos:
i) delimitao do fenmeno ou grupo de fenmenos a serem estudados;
ii) identificao das variveis;
iii) estabelecimentos de relaes entre variveis;
iv) definio da finalidade do modelo, a fim de orientar a especificao da
forma matemtica, a seleo de variveis e o nmero de equaes.

Em conseqncia, a especificao a etapa do trabalho estatstico que envolve:
i) a determinao das variveis dependentes e explicativas a serem includas no
modelo;
ii) a expectativa a priori dos sinais e magnitude dos parmetros;
iii) a formulao (linear, ou no linear);
iv) o nmero de equaes;
v) a forma de medio das variveis, como unidades adotadas, defasagens ou
avanos de efeitos de variveis temporais, etc.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 52
As fontes de informaes para a especificao de modelos que se costuma
recorrer para defini-las so:
i) teoria;
ii) estudo de casos anteriores;
iii) conhecimentos sobre as condies especificas do fenmeno;
iv) termo aleatrio.

A construo de um modelo de regresso, sem a existncia de uma teoria ou
outro raciocnio a priori subjacente, tem as seguintes implicaes negativas:
i) descrio, mais no explicao do fenmeno;
ii) esterilidade do modelo medida que no permite atuar sobre o curso do
fenmeno estudado;
iii) o modelo descrito fica excessivamente dependente das condies ou fatores
envolvidos.

1.4 - CORRELAO
O coeficiente de correlao determina, em proporo, quanto da variao na
resposta explicado pela regresso em questo.
Usamos r () para indicarmos o grau de correlao e
R
2
= Para indicarmos o grau de determinao, que nada mais que o quadrado
do coeficiente de correlao.
Quando maior o coeficiente de correlao entre duas variveis, maior o R
2
. O
valor de r pode variar de -1 a + 1. Os valores indicam o mximo de correlao; o sinal
(+ ou -) indica o sentido da correlao; o valor 0 significa a independncia das
variveis, isto , no existe correlao.
Observamos que quando 0 > e 0 < , as nuvensde pontos dos diagramas
de disperso (a) e (b) apresentam uma tendncialinear. Quanto mais prximo for
de +1 e de -1, maior o grau de dependncia entre as variveis e maior a confiabilidade
de se escrever uma varivel em funo da outra.

1 1 1 +

a) Quando . 0 ) , cov( , 0 > > Y X O diagrama de disperso : ( ) 1 +
x
y

b) Quando . 0 ) , cov( , 0 < < Y X O diagrama de disperso : ( ) 1
x
y

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 53
c) Quando . 0 ) , cov( , 0 = = Y X O diagrama de disperso : ( ) 0
x
y


importante destacar o fato de que, apesar do forte relacionamento existente
entre a anlise de regresso e de correlao, na maioria dos casos a anlise de regresso
uma ferramenta mais poderosa Isso acontece porque a correlao fornece apenas uma
medida da associao entre as variveis e nem sempre pode ser utilizada para a
realizao de predies. J a anlise de regresso muito til para desenvolver modelos
que representam, de forma quantitativa, o tipo de relacionamento existente entre as
variveis. Estes modelos podem ser empregados para as realizaes de predies.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 54
EXERCCIOS

1. Num experimento foi estudado a relao entre a altura da muda e o Dimetro
(D) dos tubetes de papel, utilizados na formao de mudas de eucalipto. Os dados se
encontram no quadro a seguir.
Quadro 1: Altura das mudas de eucalipto (cm) em funo do dimetro do tubete
Dimetro (cm) 3,5 5 6,5
Altura da muda (cm) 4,98 17,91 22,13

Com bases nas informaes anteriores, determine:
a) O grfico que representa o estudo, sua equao de estimao (linha de
tendncia) e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.
c) Qual seria a altura esperada para um dimetro de 4cm? E 6 cm?
d) Qual a taxa de variao de crescimento das mudas em funo do dimetro?

2. Os dados da tabela abaixo representam a velocidade de um mvel em relao ao
tempo.
t(segundos) 0 10 20 30 40
v(m/s) 0 30 75 90 110
a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia)
e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.
c) Qual seria a velocidade esperada aps se passarem 15segundos? e 35segundos?
e 1 minuto?
d) Qual a taxa de variao da velocidade em funo do tempo?

3. No trabalho Efeito de doses de gesso na cultura do feijoeiro (Phaseolus
vulgaris L.), Ragazzi (1979) utilizou um experimento inteiramente casualizado com 4
repeties, para estudar os efeitos de 7 doses de gesso (Tratamentos): 0, 50, 100, 150,
200, 250, e 300 kg/ha sobre diversas caractersticas do feijoeiro. Os dados do quadro a
seguir indica o peso de 1.000 sementes (g).

Quadro 3: Produo de colmos de cana-de-acar em funo da adio de Nitrognio
Doses (kg/ha)
0 50 100 150 200 250 300
Peso de 1000 sem.
138,60 153,60 164,53 164,93 163,20 159,98 154,43

a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia)
e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.
c) Estime o peso mximo de 1000 sementes em funo da dosagem de gesso.

4. Em um experimento realizado por MELO et al.(1993) sobre Fertilidade do
Solo, obteve-se os dados apresentados no Quadro 4, que mostra a produo de colmos
da cana-de-acar (kg/ha), dada como funo da adio de Nitrognio (kg/ha).

Quadro 4: Produo de colmos de cana-de-acar em funo da adio de Nitrognio
x - kg/ha 10 20 30 40 50 60 70 80 90 100
f(x)-kg/ha 380,43 394,6 412,8 423,96 432,4 441,6 444,45 446,16 445,31 441,9

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 55
Com bases nas informaes anteriores, determine:
a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia)
e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.
c) Estime a produo mxima em funo da dosagem de nitrognio.


5. Em um estudo realizado por DAO (1996), publicado em um artigo do Agronomy
Journal, obteve-se dados da densidade volumtrica do solo f(mg/m
3
) em diferentes
alturas do solo x(m), para dado tipo de manejo do solo. Os dados obtidos esto
apresentados no Quadro 5.
Quadro 5: Densidade volumtrica em diferentes alturas dos solo.
x - m 0 0,05 0,1 0,15 0,2 0,25 0,3 0,35 0,4 0,45 0,5
f(x)-mg/m
3
1,14 1,25 1,2999 1,3198 1,2998 1,2 1,2557 1,272 1,337 1,4588 1,6913

Com bases nas informaes anteriores, determine:
a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia)
e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.

6. Em um experimento realizado por PATERNIANI.(1978) sobre Melhoramento
da Produo de milho no Brasil, obteve-se os dados apresentados no Quadro
6, que descrevem a produo de matria seca f(x)(g/planta) do milho em funo
da idade da planta x (dias).

Quadro 6: Produo de matria seca do milho em funo da idade da planta
x - dias 20 30 40 50 60 70 80 90 100
f(x)-g/planta 0,58 33,58 80,58 135,58 192,58 245,58 288,58 315,58 320,58

Com bases nas informaes anteriores, determine:
a) O grfico que representa o estudo, sua equao de estimao (linha de tendncia)
e determine seu grau de correlao.
b) Faa um estudo matemtico do comportamento do grfico.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 56
PARTE IX
Tcnicas De Amostragem


POPULAO
Erro!












1. Amostra Aleatria

N o nmero de indivduos da populao (N conhecido ou desconhecido)

Os problemas de amostragem so:
1) Como coletar a amostra?
2) Quanto vale n?
3) Tcnica de amostragem a ser utilizada?

O elemento fundamental em Estatstica a estimativa. Isto , em uma
pesquisa muitas vezes h a necessidade de se fazer previses: Luis Incio Lula da Silva,
vai ganhar a eleio com uma margem de 2,5% de erro; a inflao do ms que vem deve
chegar aos 17%. Em quase todos os casos, a estimativa est associada a uma pesquisa
ou a uma verificao de caractersticas, que devido custos acessveis com resultados
satisfatrios, no realizada sobre todos os elementos da populao, mas sim sobre uma
parte dela, chamada de amostra. Assim, um dos objetivos da estatstica tirar
concluses sobre o todo (populao) a partir das informaes fornecidas por parte
representativa do todo (amostra). Assim, realizadas as fases de descrio dos dados.
(estatstica descritiva), feita uma anlise dos resultados, obtidos atravs dos mtodos
da Estatstica Inferencial ou Indutiva, que tem por base a induo, inferncia de dados
com induo da preciso, obtida por meio da teoria da probabilidade.
Quanto mais se conhecer sobre a populao, melhores sero as informaes
colhidas pela observao de uma amostra. Por exemplo, uma cozinheira para verificar
se o ensopado que ela est preparando tem ou no uma quantidade de sal desejada,
experimenta apenas uma colher de ensopado, pois se sabe que a distribuio do sal em
todo o ensopado homognea, e de qualquer lugar que se tivesse retirado a amostra do
ensopado, ela seria representativa. Mas nem sempre a escolha de uma amostra
representativa imediata. A maneira de se escolher os elementos para compor uma
amostra denominada Amostragem.

Como as concluses relativas populao vo estar baseadas nos resultados
obtidos nas amostras dessa populao, vemos o quo importante a fase de coleta dos
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 57
dados (amostragem), pois se erros forem cometidos no momento de selecionarmos os
elementos da amostra o trabalho fica comprometido e os resultados finais sero
provavelmente incorretos. Devemos, portanto, tomar cuidados especiais quanto aos
critrios que sero utilizados na seleo da amostra.
O que necessrio garantir, em suma que a amostra seja representativa
da populao. Isto significa que, a menos de certas discrepncias inerentes
aleatoriedade sempre presente, em maior ou menor grau, no processo de amostragem, a
amostra deve possuir as mesmas caractersticas bsicas da populao no que diz respeito
(s) varivel(eis) que desejamos pesquisar.


2. Vantagens De Um Levantamento Por Amostragem

2) Menor custo;
3) Menor tempo;
4) Maior amplitude do universo;
5) Menor erro da medida.


3. Tipo De Amostragem Probabilstica

3.1 - Amostragem simples aleatria (m.s.a.)

a amostragem em que se pressupe que todo o elemento da populao tem a
mesma probabilidade de ser includo na amostra extrada. Uma das formas pelas quais
se pode executar este tipo de amostragem atribuindo a cada elemento da populao um
nmero distinto e efetuando sucessivos sorteios ate completar o tamanho da amostra.
Esta seleo dos elementos ainda pode ser feita atravs de tabelas de nmeros
aleatrios, programas computacionais ou de calculadoras cientficas que possuam a
funo RANDOM (ALEATORIZAO).

RESUMO:
equivalente a um sorteio de loteria;
Considera a populao homognea;
Cada elemento da populao (umidade experimental), tem a mesma
oportunidade de ser escolhida;
Utilizam-se nmeros aleatrios, programas, computacionais, calculadoras,
bolinhas numeradas, etc.

MTODOS DE ESCOLHA
1) Enumeramos a populao 1, 2, ...., N;
2) Determinamos o tamanho da amostra N;
3) Escolhemos a amostra.






ELEMENTO ESCOLHIDO = N * (Ran) + 1

UTILIZANDO A CALCULADORA

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 58
Exerccio:

N = 20 alunos de uma turma da FAG
n = 7 alunos escolhidos aleatoriamente (amostra)

1 -
2 -
3 -
4 -
5 -
6 -
7 -
Amostra 1 Amostra 2

3.2 - Amostragem Estratificada

Muitas vezes a populao se divide, em sub-populaes ou estratos, sendo
razovel supor que, de estrato para estrato, a varivel de interesse apresente um
comportamento substancialmente diverso, tendo, entretanto, comportamento
razoavelmente homogneo dentro de cada estrato. Em tais casos, se o sorteio dos
elementos da amostra for realizado sem se levar em considerao a existncia dos
estratos, pode acontecer que os diversos estratos no sejam convenientemente
representados na amostra, a qual seria mais influenciada pelas caractersticas da varivel
nos estratos mais favorecidos pelo sorteio. Evidentemente a tendncia ocorrncia de
tal fato ser tanto maior quanto menor o tamanho da amostra. Para evitar isso, pode-se
adotar uma amostragem estratificada.
A amostragem estratificada consiste em especificar quantos elementos da
amostra sero retirados em cada estrato. costume considerar trs tipos de amostragem
estratificada: uniforme, proporcional e tima. Na amostragem estratificada uniforme:
sorteia-se igualmente o nmero de elementos em cada estrato. Na proporcional o
nmero de elementos sorteados em cada estrato proporcional ao nmero de elementos
existentes no estrato. Evidentemente a amostragem estratificada uniforme ser em geral,
recomendvel se os estratos da populao forem pelo menos aproximadamente do
mesmo tamanho, caso contrario, ser em geral prefervel a estratificao proporcional
por fornecer uma amostra mais representativa da populao. A Amostragem
estratificada tima por sua vez toma em cada estrato, um nmero de elementos
proporcional ao nmero de elementos do estrato e tambm a variao da varivel de
interesse no estrato, medida pelo seu desvio padro. Pretende-se assim otimizar a
obteno de informaes sobre a populao, com base no principio de que, onde a
variao menor, menos elementos so necessrios para bem caracterizar o
comportamento da varivel. Dessa forma, com um menor nmero total de elementos na
amostra, conseguir-se-ia uma quantidade de informao equivalente a obtidos nos
demais casos. As principais dificuldades para a utilizao desse tipo de amostragem
residem nas complicaes tericas relacionadas com a anlise dos dados e em que,
muitas vezes no podemos avaliar de antemo o desvio padro da varivel nos
diversos estratos.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 59
CASADOS
210

RESUMO:
utilizada quando existir diferenas (populao heterognea) entre diversas partes
da populao.
Essas diferenas denominaro os estratos.

MTODOS DE ESCOLHA

1) Determinamos o tamanho da populao N;
2) Definimos:

We = Ne
N
Onde:
N o tamanho da populao;
Ne tamanho do estrato;
We a proporo de cada estrato.

Para e = 1, 2, .. e

1
Tal que Ne = N


E =1
Onde:
n o tamanho da amostra;
ne tamanho da amostra por estrato;
We a proporo da populao por estrato.

Exemplo:










N
1
= 50 solteiros;
N
2
= 210 casados;
N
3
= 40 outros
N = 300

W
1
= N
1
= 50 proporo de solteiros
N 300

W
2
= N
2
= 210 proporo de casados
N 300

W
3
= N
3
= 40 proporo de outros
ne = n*We
SOLTEIROS
50
OUTROS
40
N = 300 pessoas
n = 60 pessoas amostra total
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 60
N 300
Logo a amostra por estrato ser:

n
1
= nW
1
= 60 (50/300) = 10

n
2
= nW
2
= 60 (210/300) = 42

n
3
= nW
3
= 60 (40/300) = 8

n = 60 total












Solteiros (10)

Elementos = 50 (Ram) +1 =
Escolhido =

Casados (42)

Elementos = 210 (Ram) +1 =
Escolhido =

Outros (8)

Elementos = 40 (Ram) +1 =
Escolhido =




3.3 - Amostragem sistemtica

Quando os elementos da populao se apresentam ordenados e a retirada dos
elementos da amostra feita periodicamente, temos uma amostragem sistemtica.
Assim por exemplo em uma linha de produo, podemos a cada dez itens produzidos,
retirar um para pertencer a uma amostra da produo diria.
A principal vantagem da amostragem sistemtica est na grande facilidade na
determinao dos elementos da amostra. O perigo em adot-la est na possibilidade da
existncia de ciclos de variao da varivel de interesse, especialmente se o perodo
desses ciclos coincidir com o perodo de retirada dos elementos da amostra.
10 Solteiros
escolhidos por
m.s.a.
42 casados
escolhidos
por m.s.a.
8 Outros
escolhido
por m .s.a.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 61
Por outro lado, se a ordem dos elementos na populao no tiver qualquer
relacionamento com a varivel de interesse, ento a amostragem sistemtica ter efeitos
equivalentes a casual simples, podendo ser utilizada sem restries.

RESUMO:
utilizada quando a populao encontra-se cadastrado ou enumerado.
Vantagens: Fcil escolha da amostra;
Mais preciso que o m.s.a;
to preciso quanto amostragem estratificado.

MTODO DE ESCOLHA DA AMOSTRA

1) Define-se o tamanho da populao e o tamanho da amostra
N tamanho da populao
n tamanho da amostra
2) Determina-se a proporo entre populao e amostra:
K = N
n

3) Escolhe-se um nmero aleatoriamente menor ou igual a K, suponhamos a > 0.

Logo a amostra sistemtica ser:

a, a+k, a+2k, ....., a+(n-1)k
Exemplo:
Suponhamos que desejamos estudar o estado de conservao da rodovia
BR277 com 190 Km.
Para o qual estudaremos uma amostra aleatria de 30 Km (isto n = 30).


N = 190
n = 30 (foi determinado)

R = 190 = 6,33 6
30

a = 4 escolhido aleatoriamente

As amostras so: a, a+2k

4, 10, 16, 22, 28, 34, 40 46, 52, 58, 64, 70, 76, 82,......,178





0km 1km . . . 190km
Cascavel Foz
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 62
3.4 - Amostragem por Conglomerados

Quando a populao apresenta uma subdiviso em pequenos grupos, chamado
de conglomerados possvel e muitas vezes conveniente fazer-se a amostragem por
meio de conglomerado, a qual consiste em sortear um nmero suficiente de
conglomerados, cujos elementos constituiro a amostra. Ou seja, as unidades de
amostragem, sobre as quais feito o sorteio, passam a ser os conglomerados e no mais
os elementos individuais da populao. Esse tipo de amostragem s vezes adotado por
motivos de ordem prtica e econmica.



RESUMO:
utilizada quando a populao pode ser dividida em pequenos grupos, chamados de
conglomerados.
Fcil escolha da amostra;



4. Tipo De Amostragem No - Probabilstica

4.1 - Amostragem Intencional

uma amostragem no probabilstica e consiste em selecionar um subgrupo de
populao que, com base nas informaes disponveis, possa ser considerado
representativo, de toda a populao. A principal vantagem da amostragem intencional
esta nos baixos custos de sua seleo. A amostragem intencional no considerada um
bom mtodo, pois os dados podem ser facilmente manipulados, direcionados aos
interesses do pesquisador ou de quem encomendou a pesquisa.

4.6 - Amostragem a Esmo

a amostragem em que o amostrador, para simplificar o processo, procura ser
aleatrio sem, no entanto realizar propriamente o sorteio usando algum dispositivo
aleatrio confivel. Por exemplo, se desejarmos retirar uma amostra de 100 parafusos de
uma caixa contendo 1000 evidentemente no faremos uma amostragem casual simples,
pois seria extremamente trabalhosa, mas procederemos a retirada simplesmente a esmo.
Os resultados da amostragem a esmo so em geral equivalentes aos de uma
amostragem probabilstica se a populao homognea e se no existe a possibilidade
de o amostrador ser inconscientemente influenciado por alguma caracterstica dos
elementos da populao.








AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 63
EXERCCIOS


1. Os associados de uma cooperativa esto organizados em um arquivo, por ordem
alfabtica. Qual a maneira mais rpida de amostra 1/3 do total de fichas de
associados?

2. Um pesquisador tem dez gaiolas que contm, cada uma, seis ratos. Como o
pesquisador pode selecionar dez ratos para uma amostra?

3. Para levantar dados sobre o nmero de filhos por casal, em uma comunidade, um
pesquisador organizou um questionrio que enviou, pelo correio, a todas as
residncias. A resposta ao questionrio era facultativa, pois o pesquisador no tinha
condies de exigir a resposta. Nesse questionrio perguntava-se o nmero de filhos
por casal morador na residncia. Voc acha que os dados assim obtidos tm algum tipo
de tendenciosidade? Justifique.

4. Um pesquisador pretende levantar dados sobre o nmero de moradores por
domiclio, usando a tcnica de amostragem simples sistemtica. Para isso, o
pesquisador visitar cada domiclio selecionado. Se nenhuma pessoa estiver presente
na ocasio da visita, o pesquisador exclura o domiclio da amostra. Esta ltima
determinao introduz tendenciosidade. Por qu?

5. Dada uma populao de 40 alunos, descreva uma forma de obter uma amostra
casual simples de 6 alunos.

6. Organize uma lista com 10 nomes de pessoas em ordem alfabtica. Depois
descreva uma forma de obter uma amostra sistemtica de 5 indivduos.

7. Em uma pesquisa de mercado para servios odontolgicos tomou-se a lista
telefnica, onde os nomes dos assinantes esto organizados em ordem alfabtica do
ltimo sobrenome, e se amostrou o dcimo de cada 10 assinantes. Critique esse
procedimento.

8. Por que os estatsticos estudam amostra e no populaes?

9. Como podemos dizer que uma determinada amostra representa adequadamente a
populao?

10. Para as questes a seguir imagine um experimento em que se dividam os elementos
em dois grupos: Um grupo experimental e um grupo de controle.
a) Por que os grupos devem ser to semelhante quanto possvel?
b) As pessoas devem saber em que grupo esto?
c) Qual o melhor sistema de dividir os indivduos pelos dois grupos

11. Diferencie Estatstica Descritiva de Estatstica Inferencial.

12. Defina e diferencie com suas palavras Variveis Quantitativas de Variveis
Qualitativas com suas respectivas subdivises.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 64
13. Fale sobre as etapas de uma pesquisa.

14. Fale sobre os tipos de amostragem Probabilstica, suas caractersticas, suas
aplicaes e restries. Cite exemplos de seu cotidiano para cada caso.

15. Fale amostragem no Probabilstica, suas caractersticas, suas aplicaes e
restries. Cite exemplos.

AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 65
PARTE X

Inferncia Estatstica: Estimativa por Ponto e
Intervalos De Confiana

1. - INTRODUO
O objetivo da Estatstica o de conhecer populaes por meio das informaes
amostrais. Como as populaes so caracterizadas por medidas numricas descritivas,
denominadas parmetros, a estatstica diz respeito realizao de inferncias sobre
esses parmetros populacionais desconhecidos. Parmetros populacionais tpicos so a
mdia ( X ou ), o desvio padro ( S ou ) e a proporo (p)de determinado
evento populacional.
Os nmtodos para realizar inferncias a respeito dos parmetros pertencem a
duas categorias:
Estimao : determinao de estimativas dos parmetros populacionais;
Teses de hipteses: tomada de deciso relativa ao valor de um parmetro
populacional.

1.1 Estimativa por Ponto
Quando com base em dados amostrais calculamos um valor da estimativa do
parmtro populacional, temos uma estimativa por ponto do parmetro considerado.
Assim, o valor da mdia amostral ( x ) uma estimativa por ponto da mdia
populacional ( ). De maneira anloga, o valor do desvio padro amostral (S) constitui
uma estimativa do parmetro ( ).

EXEMPLO:
Uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes
revelou nota mdia amostral de 5,2. logo: x = 5,2 uma estimativa pontual da
verdadeira mdia dos 20.000 alunos.


AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 66
1.2 Estimativa por Intervalo
uma estimativa por intervalo para um parmetro populacional um intervalo
determinado por dois nmeros, obtidos a partir de elementos amostrais, que se espera
contenham o valor do parmetro com dado nvel de confiana que se espera contenham
o valo do parmetro com dado nvel de confiana ou probabilidade de (1-)%.
Geralmente (1-)% = 90%, 95%, 97,5%, . . .
Se o comprimento do intervalo pequeno, temos um elevado grau de preciso
da inferncia realizada. As estimativas dessa natureza so denominadas de intervalos de
confiana.

EXEMPLOS:
O intervalo [1,60m; 1,64m] contm a altura mdia dos moradores do municpio X,
com um nvel de confiana de 95%;

Com 97,5% de confiana, o intervalo [8%; 10%] contm a proporo de analfabetos
da cidade Y;

O intervalo [37mm; 39mm] contm o desvio padro do comprimento de uma pea,
com 90% de confiana.

importante atentar para o risco do erro, quando se constri um intervalo de
confiana. Se o nvel de confiana de 95%, o risco do erro da inferncia estatstica
ser de 5%. Assim: se construssemos 100 intervalos, baseados em 100 amostra de
tamanhos iguais, poderamos esperar que 95 desses intervalos (5% deles) no iriam
conter o parmetro.


1.3 Intervalo de Confiana para a Mdia Populacional quando a varincia
desconhecida
Quando temos amostras e no conhecemos o valor do desvio padro
populacional, podemos construir intervalos de confiana para a mdia a partir da
frmula expressa a seguir. Para tanto, necessria que a populao de onde a amostra
foi extrada tenha distribuio normal.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 67
Geometricamente



Equao

IC (, (1-)%) =
|
|
|

\
|
+
|

\
|

|

\
|
n
S
. t x
n
S
. t x
, n , n
2
1
2
1


Onde:
t = distribuio t de Student
(n 1) = grau de liberdade
S = desvio padro
x = mdia
n = tamanho da amostra
= probabilidade de erro na estimao do intervalo.

1.4 Intervalo de Confiana para o Desvio Padro Populacional
Considerando que a distribuio de probabilidade populacional de onde se
extraiu a amostra seja normal, ser dado pela distribuio Qui-quadrado (
i
X
2
)
Geometricamente

1-
2

t
= n-1
0
2


= n-1
f(
i
X
2
)
1-
X
2
inferior
X
2
superior
X
2
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 68

Equao
IC (, (1-)%) =
|
|
|

\
|

inf X
) n (
2
S

sup X
) n (
2
S
2
1
2
1

Onde:
2
X = distribuio normal da tabela X
2
(n 1) = grau de liberdade
S
2
= Varincia n = tamanho da amostra
Exerccios:
1. Considerando uma amostra de 4 elementos extrada de uma populao com
distribuio normal forneceu mdia de 8,2 e desvio padro de 0,4. Construir um
intervalo de confiana para a mdia dessa populao com 95% e 99% de
confiana. Interprete os resultados.

2. A amostra 9, 8, 12, 7, 6, 11, 6, 10,9, foi extrada de uma populao normal.
Construa um intervalo de confiana para a mdia ao nvel de 95% e 99% e
interprete os resultados.

3. A distribuio dos dimetros de parafusos por uma mquina normal, com
desvio padro igual a 0,17mm. Uma amostra de seis parafusos retirada ao acaso
da produo apresentou os seguintes dimetros (mm):
25,4 25,2 25,6 25,3 25,0 25,4
Construa um intervalo com 95% e 99% de confiana para o dimetro mdio da
produo dessa mquina.

4. A cronometragem de certa operao forneceu os seguintes valores para diversas
determinaes em segundos:
14 16 13 13 15 15 17 14 15 14 16 14
Construa um intervalo de 95% e 99% de confiana para o tempo mdio dessa operao.
Suponha que a distribuio seja normal.



AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 69
5. Uma amostra de onze elementos extradas de uma populao com distribuio
normal, forneceu varincia S
2
= 7,08. Construir um intervalo de 95% de
confiana para o desvio padro populacional. Interprete os resultados.

6. Sabe-se que a variao das dimenses fornecidas por uma mquina independem
dos ajustes do valores mdios. Duas amostras de dimenses das peas
produzidas forneceram:
Amostra 01: 12,2 12,4 12,1 12 12,7 12,4
Amostra 02: 14,0 13,7 13,9 14,1 13,9
Estabelea um intervalo de 90% e 95% de confiana para a mdia e para o desvio
padro com que a mquina opera. Interprete os resultados.
AGRONOMIA-FAG Estatstica
Regiane Slongo Fagundes 70
BIBLIOGRAFIA

BUSSAB, W. O.;MORETTIN, P.A. Estatstica Aplicada. Editora Saraiva, 5
edio, 2002.

DOWNING, D.; CLARK, J. Estatstica Aplicada. Editora Saraiva, 2 edio,
2002.

LEVINE, D.D. M.; BERENSON, M.L.; STEPHAN, D. Estatstica, Teoria e
aplicaes. Editora ABPDEA, 2000.

MORETTIN, L.G. Estatstica Bsica-Probabilidade. Editora McGraw-Hill, 4
edio, 1992. V. 1

MORETTIN, L.G. Estatstica Bsica-Inferncia . Editora McGraw-Hill, 4 edio,
1992. V. 2

MARTINS, G.A. Estatstica Geral e Aplicada. Editora Atlas, 2 edio, 2002.

MEYER, P. L. Probabilidade Aplicaes Estatstica. Livros Tcnicos e
Cientficos Editora, 2 edio, 1983.

NETO, P. L. O. Estatstica. Editora Edgard Blucher, 2 edio, 2002.

Você também pode gostar